Vietnam Corpus Linguistics (VCL)

Researching and Developing Corpus Linguistics (Vietnam)

20 năm vẫn tranh cãi chuyện đặt dấu

Posted by corling on October 12, 2011

Đầu những năm 1990, hai ngành ngôn ngữ học và máy tính đã họp bàn về vấn đ dấu đặt đâu trong các cặp nguyên âm oa, oe, uy, nhưng đến nay vẫn chưa có văn bản quy định rõ chuyện này.

Chuyện lớncủa giới CNTT

Đối với nhiều người Việt Nam, chuyện đặt dấu rất đơn giản, nhưng đối với giới CNTT lại là một “chuyện lớn”, không thể “để đâu cũng được”, bởi khi tìm kiếm trong cơ sở dữ liệu, việc đặt dấu sẽ cho ra các kết quả khác nhau về số lượng tìm kiếm. Chẳng hạn cùng là chữ hoà nhưng nếu đặt dấu huyền trên chữ o (òa) thì sẽ có số lượng khác với đặt dấu huyền trên chữ a (oà).

TS. Quách Tuấn Ngọc, Cục trưởng Cục CNTT, Bộ Giáo dục & Đào tạo nhắc lại đầu những năm 1990, Uỷ ban Khoa học Kỹ thuật Nhà nước đã tổ chức gặp gỡ giữa các nhà ngôn ngữ học và các nhà CNTT để trao đổi vấn đề chính tả, đặt dấu. Tất cả đều đã thống nhất một phương án chung, nhưng để ra văn bản quy phạm chính thức quy định về việc đặt dấu thì đến nay vẫn chưa làm được.

Cách đây 2 năm, Bộ TT&TT đã “xới” lại vấn đề nêu trên. Rất nhiều ý kiến đã kêu gọi Bộ TT&TT phải chuẩn hoá. Bởi khi cơ sở dữ liệu ngày càng lớn mà không có sự thống nhất thì sẽ rất phức tạp và giảm hiệu quả công việc. Song đến giờ mong muốn vẫn chưa trở thành hiện thực.

Theo quan điểm của một người vốn từng là “dân” xử lý âm thanh tiếng nói, ông Ngọc chia sẻ: Nếu để “òa” cho vào máy tính để phát âm thì không thể ra chữ “òa”. Nhưng nếu để “oà” thì chắc chắn sẽ phát âm ra chữ “òa”. Dân xử lý tín hiệu thì có thể soi được dấu huyền nằm ở chữ “a”. Vì vậy, đối với các cặp nguyên âm như oa, oe, uy, thì dấu phải để trên phụ âm thứ 2.

Tuy nhiên, nhiều nhà ngôn ngữ học vẫn phản đối với lý do để dấu như vậy không đảm bảo tính mỹ học của tiếng Việt. Thực tế hầu hết từ điển Tiếng Việt vẫn để dấu ở nguyên âm thứ nhất – dấu huyền để trên chữ “o” (òa).

Không ít ý kiến cho rằng CNTT chỉ là công cụ, và hoàn toàn có thể “sinh” ra các phần mềm đáp ứng các yêu cầu của tiếng Việt, hay nói cách khác là không thể chỉ vì CNTT mà thay đổi tiếng Việt.

Đang có mộtkhoảng vênh

Cùng với câu chuyện về đề xuất thêm 4 ký tự F, J, W, Z vào bảng chữ cái đã và vẫn đang gây ra nhiều tranh cãi, câu chuyện đặt dấu lần này tiếp tục cho thấy giữa 2 giới CNTT và ngôn ngữ đang có một “khoảng vênh” không có lợi cho sự phát triển của cộng đồng xã hội.

TS. Dương Kỳ Đức, Tổng Thư ký Hội Ngôn ngữ học Việt Nam chia sẻ: CNTT và Ngôn ngữ học giống như hai mặt của một tờ giấy. Tuy nhiên, do hoàn cảnh khách quan và chủ quan, hiểu biết về CNTT của các nhà ngôn ngữ học còn hạn chế. Ngôn ngữ học vẫn chỉ quanh quẩn ở những câu chuyện truyền thống, tách rời khỏi hơi thở hiện đại, minh chứng điển hình là các nhà ngôn ngữ học vẫn đang “bỏ quên” không đặt ra vấn đề nghiên cứu ngôn ngữ của CNTT. Những người “trùm sò” về ngôn ngữ học không hiểu chắc về CNTT thì giới nghiên cứu ngôn ngữ học trẻ tuổi sẽ không làm, hoặc không dám làm, dẫn đến khoảng cách về CNTT và ngôn ngữ học sẽ ngày càng xa.

Thực tế đang rất cần có những nhà ngôn ngữ học có hiểu biết về CNTT cũng như các nhà CNTT hiểu biết về ngôn ngữ học. Và cần sớm có một hội đồng liên ngành ngôn ngữ học và CNTT.

(Theo ICTNews)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: