VIETNAM CORPUS LINGUISTICS (VCL)

NGÔN NGỮ HỌC KHỐI LIỆU

Ngôn ngữ học khối liệu và những vấn đề liên quan (Quyển I) – TS. Đào Hồng Thu

Posted by corling on December 27, 2009

MỞ ĐẦU

Trong những năm nửa cuối thế kỉ XX và đầu thế kỉ XXI, cùng với sự phát triển của khoa học thông tin, khoa học ngôn ngữ liên tục phát triển và hình thành các xu hướng phát triển mới nhằm đáp ứng nhu cầu hoạt động của xã hội. Song song với sự phát triển không ngừng của các thế hệ công nghệ máy tính và dịch tự động, trong ngôn ngữ học ứng dụng hình thành xu hướng phát triển mới – Corpus Linguistics (ngôn ngữ học khối liệu).

Ngôn ngữ học khối liệu là ngành khoa học trẻ, là giao điểm giữa khoa học ngôn ngữ và khoa học máy tính, được hình thành vào cuối thế kỉ XX trên cơ sở kĩ thuật điện tử số, là khoa học nghiên cứu xây dựng các khối liệu ngôn ngữ, nghiên cứu các phương pháp xử lí dữ liệu và sử dụng khối liệu.

Có thể dẫn chứng một ví dụ đơn giản về vai trò và sức sống của ngành khoa học này. Bất kì nhà ngôn ngữ nào khi nghiên cứu cũng gặp phải vấn đề về việc lựa chọn ngữ liệu cho đề tài nghiên cứu của mình, nghĩa là cần tham khảo rất nhiều loại văn bản để tìm ra các ví dụ cần thiết, và phải hài lòng với việc ngẫu nhiên lựa chọn được các ví dụ đó. May mắn là hiện nay đã có nhiều văn bản bằng các ngôn ngữ khác nhau có thể tìm kiếm được ở dạng văn bản điện tử (file của máy tính). Khả năng sử dụng các nguồn ngữ liệu trên làm dễ dàng rất nhiều quá trình tìm kiếm thô sơ, đồng thời đòi hỏi nâng cao hơn chất lượng nghiên cứu, nghĩa là số lượng ví dụ tìm kiếm được cần đầy đủ hơn nhiều cho mỗi ngôn ngữ được nghiên cứu. Tuy nhiên, làm việc với các văn bản trên file máy tính cũng không kém nhọc nhằn. Để có thể khắc phục sự mệt nhọc không cần thiết trong công việc của nhà nghiên cứu, khắp nơi trên thế giới đã thành lập các chương trình khối liệu. Các chương trình đặc thù này có thể đáp ứng rất nhiều yêu cầu của người sử dụng. Ví dụ, một chương trình về văn hóa các dân tộc Việt Nam có thể đưa ra toàn bộ các câu, tập hợp câu hoặc văn bản có chứa tập hợp từ “văn hóa dân tộc Việt Nam” được đăng trên các báo, tạp chí với đầy đủ dẫn nguồn, v.v. Nghiên cứu và tạo lập các chương trình khối liệu như trên là nhiệm vụ của ngôn ngữ học khối liệu.

Từ “khối liệu” lần đầu tiên được sử dụng như một thuật ngữ khoa học vào năm 1961 trong khối liệu Brown có chứa khoảng một triệu đơn vị từ và cụm từ sử dụng để chỉ khái niệm cơ bản của ngôn ngữ học khối liệu.

Cuốn sách “Ngôn ngữ học khối liệu và những vấn đề liên quan” (quyển I) là tập hợp các bài báo, các công trình khoa học về ngôn ngữ học khối liệu, dịch tự động, dịch văn bản khoa học kĩ thuật – công nghệ và những vấn đề liên quan đến môi trường đào tạo sinh viên thuộc khối khoa học và công nghệ trong vòng hơn thập kỉ qua.

Nội dung cuốn sách được chia thành 5 phần chính bao gồm:

Phần I – Ngôn ngữ học khối liệu

Phần II – Dịch thuật và dịch tự động

Phần III – Ngôn ngữ khoa học chuyên ngành

Phần IV – Công nghệ dạy học

Phần V – Các vấn đề liên quan

Phần I gồm các bài báo giới thiệu sơ lược quá trình hình thành và phát triển của ngôn ngữ học khối liệu (tiếng Việt), bài báo về đặc điểm của khối liệu văn bản song song Nga – Việt hiện nay (tiếng Nga).

Phần II bao gồm các bài báo (tiếng Nga) trên cơ sở các nghiên cứu khoa học về dịch tự động đã được thực hiện tại Trường Đại học Sư phạm Hersen A.I., Saint Peterburg (Liên bang Nga), Trường Đại học Tổng hợp Saint Peterburg và Viện Ngôn ngữ Liên bang Nga; các bài báo (tiếng Việt) về vấn đề dịch văn bản và mở nghĩa văn bản khoa học kĩ thuật – công nghệ trong dịch thuật.

Phần III đề cập đến các vấn đề liên quan trực tiếp đến ngôn ngữ học khối liệu mang tính lí luận và thực hành hiện nay về ngôn ngữ khoa học chuyên ngành (tiếng Việt, tiếng Anh, tiếng Nga) đang được sử dụng để giảng dạy cho sinh viên khối khoa học và công nghệ, cũng như các giải pháp khắc phục hoặc phương pháp thực hiện như các vấn đề về phát triển ngôn ngữ (tiếng Việt và tiếng nước ngoài) khoa học – công nghệ trong thời kì hội nhập quốc tế của Việt Nam, đối chiếu ngôn ngữ văn bản khoa học và công nghệ, phong cách ngôn ngữ văn bản khoa học và công nghệ, ngôn ngữ chuyên ngành khoa học trong giao tiếp, thuật ngữ khoa học – công nghệ v.v.

Phần IV nêu vấn đề về giảng dạy ngôn ngữ (bản ngữ và ngoại ngữ) theo phương pháp giao tiếp, dạy ngoại ngữ trong môi trường không chuyên và các vấn đề liên quan đến giảng dạy ngôn ngữ trong trường đại học.

Phần V đề cập các vấn đề ngôn ngữ và văn hóa trong môi trường giáo dục, khoa học và công nghệ.

Cuốn sách có thể sử dụng làm tài liệu tham khảo dành cho sinh viên, học viên cao học, nghiên cứu sinh, nghiên cứu viên và độc giả quan tâm đến ngôn ngữ học ứng dụng, dịch thuật và các vấn đề liên quan.

Tác giả trân trọng cảm tạ GS.VS. Belaeva L.H. cùng tập thể giáo sư, phó giáo sư Bộ môn Ngôn ngữ học ứng dụng, Khoa Ngôn ngữ, Trường Đại học Sư phạm Hersen A.I., Saint Peterburg; PGS.TS. Zakharov B.P., PGS.TS. Mitrophanova O.A. cùng các đồng nghiệp Bộ môn Ngôn ngữ toán học, Khoa Ngôn ngữ và nghệ thuật, Trường Đại học Tổng hợp Saint Peterburg; các giáo sư, viện sĩ Viện Ngôn ngữ Liên bang Nga tại Saint Peterburg; Thư viện Viện Hàn lâm khoa học Liên bang Nga tại Saint Peterburg đã cố vấn, hướng dẫn cho tác giả trong quá trình hoạt động khoa học tại Saint Peterburg, Liên bang Nga.

Tác giả trân trọng cảm tạ GS.TS. Lê Quang Thiêm, Tổng biên tập Tạp chí Ngôn ngữ và Đời sống và Ban biên tập Tạp chí; Ban lãnh đạo Viện Ngôn ngữ học và Hội Ngôn ngữ học Việt Nam; GS.TS. Đinh Văn Đức và Ban Chủ nhiệm Khoa Ngôn ngữ, Trường Đại học Khoa học xã hội và Nhân văn, Đại học Quốc gia Hà Nội đã nhiệt tình giúp đỡ tác giả thực hiện công trình nghiên cứu về ngôn ngữ học khối liệu và dịch tự động (dịch máy) tại Việt Nam.

Tác giả trân trọng cảm ơn TS. Nguyễn Xuân Dũng, Giám đốc – Tổng biên tập và các phòng chức năng Nhà xuất bản Khoa học xã hội, PGS.TS. Phạm Văn Tình đã tận tình giúp đỡ tác giả biên tập và cho ra mắt bạn đọc cuốn sách “Ngôn ngữ học khối liệu và những vấn đề liên quan” (quyển I).

Tác giả xin chân thành cảm ơn bạn bè, đồng nghiệp và các con đã tạo điều kiện tốt nhất cho việc hoàn thành cuốn sách này. 

Tác giả

 TS. ĐÀO HỒNG THU

4 Responses to “Ngôn ngữ học khối liệu và những vấn đề liên quan (Quyển I) – TS. Đào Hồng Thu”

  1. Ngoc Diem said

    I found the book at National Library of VN and wish to have one copy. I searched for it at some bookshops round Hanoi National University but failed. Do you know exactly where it is sold?

  2. CorLing said

    You could have the copy Of this book at Vietnam National Library, we think.

  3. Loc said

    Em dang lam NCS tai New Zealand va em dang rat quan tam den mang corpus linguistics nay. Rat tiec em o ben nay nen ko the tham khao cuon sach duoc. Tai lieu tren trang nay toan bang tieng Nga nua.. Em xin thay Thu co the cho em tham khao qua cuon sach cua thay ko a? Cam on thay!

  4. Thu Hien said

    Co Thu chu khong phai Thay Thu dau ban ah.

Leave a comment