ДАО Хонг Тху (Ханой Технологический Университет, Вьетнам)
Сб. »Прикладная лингвистика в науке и образовании». Четвертая международная научная конференция, 27-28 марта 2008, С-Петербург, с.58-61, (2008)
В создании тезаурусов (вьетнамско – русского и вьетнамско – английского) возникает проблема семантического поиска и выборки параллельных конструкций. Отличие в грамматическом использовании слов и словосочетаний вьетнамского, английского и русского языков нередко приводит к затруднению семантического подбора параллельных конструкций в процессе составления тезаурусов. Исследование показывает, что использование контекстов, написанных на вьетнамском языке, явно недостаточно для снятия омонимии при переводе на русский язык или на английский язык. Обращение к данной тематике вызвано нуждами проекта по разработке системы перевода вьетнамского текста в изображения параллельных конструкций.
Нужно заметить, что в ряде случаев под многозначностью маскируются разные слова, обозначающие разные понятия и имеющие разные, но частично совпадающие парадигмы. Например, форма chuột имеет разные значения. Слово chuột может встречаться в технических текстах, где это слово обозначает одно из указательных устройств ввода (англ. pointing device), обеспечивающих интерфейс пользователя с компьютером. В другом случае слово chuột встречается в текстах, где упоминаются грызуны с хвостами, вредные для жизни человека и домашних животных. Это явно выражается в следующих примерах:
1. Hãng Logitech vừa tiến thêm một bước nữa khi tung ra thế hệ chuột quang G5. Với đặc tính phân giải 2000 điểm ảnh/ inch (dpi), khả năng chuyển mạch dpi trong lúc di chuyển, chuột dây này chính là thiết bị mà “cạ cứng” của game PC cần để “săn mồi”.
2. Chuột lại là loài gặm nhấm, nhưng còn sanh sản rất nhanh và nhiều, cho nên chúng nó cắn phá khủng khiếp, không chừa nơi nào. Vì thế họ hàng nhà сhuột đi đến đâu, thì mọi người điều sợ sự phá hoại của сhuột, nếu ghe tàu nào bị сhuột đến ở, thì cũng khốn khổ không ích.
Указанные два типа текстов относятся к различным предметным областям, и рассмотренные слова являются не разными формами одного и того же слова. Одно и тоже слово в разных контекстах приобретает разный смысл.
В приведенных примерах видно, что во вьетнамском языке второе соединяющее слово всегда носит дополнительное значение для первого главного слова:
Chuột quang | Optical mouse | Оптическая мышь |
Họ hàng nhà chuột | Mouses | Мыши |
Исследование показывает, что во вьетнамском языке одно слово в большинстве своего количества носит многосемантический характер. Поэтому для семантического подбора параллельных конструкций вьетнамско – английско – русского тезауруса рекомендуется выбор не слова одного, а словосочетаний. Характерно, что значимым оказалось лишь взаимодействие этих факторов. Это свидетельствует, что при семантическом подборе параллельных конструкций необходимо одновременно учитывать как морфологию слов в конструкциях, так и его синтаксис. Очевидно, что для этого необходимо проводить анализ текстов полученных в результате подбора документов, что играет существенную роль при синтаксическом анализе текстов. Здесь большое значение имеют знаки препинания, так как учет знаков препинания в ряде случаев облегчает семантический анализ текста. Естественно, необходимо иметь в виду, что во вьетнамском языке шесть тоновых (мелодических) ударений играют чрезвычайно важную роль в синтаксическом анализе текстов. В последние годы появляются тексты разного типа не в виде тоновых (мелодических) ударений, семантически равноправны текстам с тоновыми (мелодическими) ударениями. Например:
Текст с тоновыми ударениями (официально) | Текст без тоновых ударений (неофициально) |
Xu hướng chung hiện nay là từng bước đưa thiết bị số vào mạng điện thoại. Vì chúng ta mới ở giai đoạn đầu của quá trình này nên mọi việc khó có thể đoán trước được, nhưng một dự báo có lí là toàn bộ mạng viễn thông ở phần lớn các nước có nhiều thiết bị số hơn là tương tự ở những năm còn lại của thế kỉ XX. Trong tương lai gần, một số nước sẽ lắp đặt thiết bị số là chủ yếu. | Xu huong chung hien nay la tung buoc dua thiet bi so vao mang dien thoai. Vi chung ta moi o giai doan dau cua qua trinh nay nen moi viec kho co the doan truoc duoc, nhung mot du bao co li la toan bo mang vien thong o phan lon cac nuoc co nhieu thiet bi so hon la tuong tu o nhung nam con lai cua the ki XX. Trong tuong lai gan, mot so nuoc se lap dat thiet bi so la chu yeu. |
Способ семантического подбора параллельных конструкций в общем случае несложен, так как в сочетании с другими вспомогательными словами многозначимое слово переходит в однозначимое «состояние». Например:
Слово вьетнамского языка до сочетания | Значения на русском языке | Значения на английском языке |
Đèn | Лампа
Свет Фонарь Освещение Огонь |
Lamp
Light Lantern |
Слово вьетнамского языка после сочетания | Значения на русском языке | Значения на английском языке |
Đèn huỳnh quang | Лампа дневного света | Fluorescent lamp |
Bật đèn | Включать свет | Turn on the light |
Đèn pha của xe ôtô | Лобовой фонарь | Headlight |
Ánh sáng đèn nến | Искусственное освещение | Candlelight |
Đèn tín hiệu | Сигнальный огонь | Signal light |
Результаты экспериментов показывают, что способ семантического подбора параллельных конструкций оказывается достаточно эффективным при анализе научно – технических текстов для поиска необходимой информации по заданной тематике. Параллельные конструкции семантически могут подбираться путем выделения наиболее часто встречающихся предложений и часто встречающихся словосочетаний в контекстах по определенному стилю речи. Для полуавтоматического создания тезаурусов узкой научной/предметной области, исходными данными должны быть относительно небольшие тематические коллекции документов.
Практика показывает, что семантически эффективно выбранные параллельные конструкции всегда обеспечивают достоверность перевода научно – технических текстов, требующих его максимальной точности, а не только отхода от буквализма и пословного перевода. Вместе с тем, анализ контекстов и семантический подбор параллельных конструкций позволяют продемонстрировать небезынтересные закономерности в передаче конкретного языкового материала средствами другого языка, вполне убедительно показать возможность и насущную необходимость использования параллельных конструкций в переводческой практике.
Таким образом, наиболее адекватным в отношения задач практического исследования по семантике вьетнамского языка с целью создания тераурусов (вьетнамско – русского и вьетнамско – английского), а именно в работе по семантическому подбору параллельных конструкций, следует признать внимание на особенности вьетнамского языка как изолирующего (ср. русский и английский языки – флективные).
ЛИТЕРАТУРА
Berners-Lee T., Hendler J., Lassila O. The Semantic Web // Scientific American, May 17, 2001.
Lin D. Using syntactic dependency as local context to resolve word sense ambiguity // Proceedings of the 35th annual meeting on Association for Computational Linguistics. Madrid, Spain, 1997. P. 64-71.
Smaja F. Retrieving Collocations from Text: Xtract // Computational Linguistics, 1993. № 19(1). P. 143-177.
Васильева Н.Э. Шаблоны употреблений терминов и их использование при автоматической обработке научно-технических текстов// Компьютерная лингвистика и интеллектуальные технологии: Тр. междунар. конференции Диалог’2004. («Верхневолжский», 2-7 июня 2004 г.). М., 2004. С. 96-101.
Зацман И.М. Семантический поиск научной информации: неоднородные коммуникативные компоненты и цветовая палитра объектов поиска // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. семинара Диалог’2002. М.: Наука, 2002. Т.2, С. 214-227.
Лукашевич Н.В., Добров Б.В. Тезаурус русского языка для автоматической обработки больших текстовых коллекций // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. семинара Диалог’2002. М.: Наука, 2002. Т.2, С. 338-346.
Шелов С.Д. Терминоведение: семь вопросов и семь ответов по семантике термина // НТИ. Сер. 2. Информационные процессы и системы, 2001. №2. С. 1-11.
ДАО Хонг Тху. Корпус параллельных текстов в аспекте корпусной лингвистики. Проблемы современной филологии и лингводидактики. Сб. научных трудов, СПб, изд.РГПУ им. А.И.Герцена, 2006, с.23-28