Состав и структура автоматических переводных словарей

Автор работы: Пользователь скрыл имя, 16 Ноября 2015 в 01:37, курсовая работа

Описание работы

Цель исследования: изучить состав и структуру автоматических переводных словарей.
Задачи исследования:
1) проанализировать существующие определения словаря
2) дать определение переводному словарю, привести его характеристику
3) проанализировать лексический состав и объём автоматического переводного словаря
4) изучить динамичность автоматического переводного словаря
5) проанализировать состав и структуру словарных статей автоматического переводного словаря

Файлы: 1 файл

Курсовая333.docx

— 65.18 Кб (Скачать файл)

Перевод дается из первого по списку словаря (приоритеты можно менять). Полнотекстовый поиск есть, причем он весьма удачно реализован в интерфейсе: кнопки словарей помечаются специальными цветными точками, показывающими, в каких словарях найден перевод и какая именно информация по переводу (перевод словосочетания, слова или только слова в составе фраз) была найдена в данном словаре. Желтая точка - найден перевод всей введенной фразы, красная точка - найден перевод слова, на котором стоит курсор, синяя точка - найден перевод фразы, содержащей слово на котором стоит курсор[4].

В основной набор включен словарь «Трудности английского». В его словарных статьях значительно расширена зона грамматических комментариев, подробно описываются правила употребления различных частей речи.

По умолчанию «Контекст» дает максимально полный грамматический комментарий, включая синонимы и примеры. На отдельной закладке «Фразы» можно увидеть все предложения, в которых встречается выбранное слово. Если точное написание его вы не знаете или подзабыли, воспользуйтесь опцией «Подсказка». На соответствующей странице будет приведен список близких по набору букв слов. Есть смысл также зайти на соседнюю закладку «Словник». Там вы сможете увидеть все слова, в которые входит введенное в строке запроса сочетание символов.

Но «Контекст» перевод одним кликом мыши не поддерживает. Чтобы воспользоваться его услугами, нужно выделить интересующее слово и нажать сочетание горячих клавиш (по умолчанию <Ctrl> + <С> + <С>).

 

Polyglossum

Интерфейс программы очень прост. Главное окно включает в себя минимум элементов. Кому-то подобное исполнение может показаться признаком «профессиональности» в противовес популярной красочности интерфейсов некоторых других продуктов, кому-то кажется, что скромность внешнего вида Polyglossum – скорее результат экономии на труде дизайнеров, чем обусловленное требованиями профессиональной работы решение. Размер окна словаря не поддается изменению, что в некоторых случаях весьма неудобно. Кроме того, программа не позволяет изменять шрифт и размер текста – это существенный минус, так как люди с плохим зрением обычно увеличивают размер шрифта[4].

Второй явный недостаток программы – возможность одновременной работы только с одним словарем[4]. Если потребуется работать с несколькими специализированными словарями в рамках одного языка, придется вручную переключаться между ними, чтобы узнать, находится ли искомое слово в каком-либо из них.

Зато довольно удобно реализована система копирования словарной статьи в буфер[2]: при нажатии правой кнопкой мыши по окну со статьей появляется мини-редактор с текстом статьи, где можно удалить ненужные элементы перед копированием текста в буфер.

Словарная база англо-русско-английского словаря достаточно обширна – фактически это электронная версия Большого англо-русского общелексического словаря. Поиск в обратную сторону (с русского на английский) производится путем преобразования переводов английских слов во входы русского словаря.

Лингвистическая информация минимальна: для неправильных глаголов приводятся формы, для существительных - род (не во всех словах). Транскрипция отсутствует, не указаны ни стилистические пометы, ни принадлежность к отдельным терминологиям[2].

 

Заключение

Резюмируя проведенное исследование, следует акцентировать внимание на следующих выводах:

  1. Наиболее полное определение словарю дано в новом энциклопедическом словаре: Словарь – справочная книга, содержащая собрание слов (или морфем, словосочетаний, идиом и т. д.), расположенных по определенному принципу, и дающая сведения об их значениях, употреблении, происхождении, переводе на другой язык и т.п. (лингвистические словари) или информацию о понятиях и предметах, ими обозначаемых, о деятелях в каких-либо областях науки, культуры и другое
  2. Переводной словарь — словарь, содержащий в сопоставлении слова одного языка и их переводные эквиваленты на другом языке

Характеристика переводных словарей осуществляется по следующим основным параметрам:

- количество языков и способ их описания

- обратимость / необратимость словаря

- адресация словаря

- состав словника

- типы эквивалентов, включенные в микроструктуру словаря

  1. Лексический состав и объём автоматического переводного словаря характеризуются следующим:
  • Основную часть состава автоматического переводного словаря занимает терминологическая лексика, которая специально тематически классифицируется и постоянно обновляется. Однако общая лексика так же включается, так как она необходима.
  • Словосочетание – единица  словника автоматического переводного словаря, 80—90 % словарного лексического массива представлено словосочетаниями. Это происходит потому, что крупные автоматические словари в большинстве своем фактически являются терминологическими банками и их основная функция направлена на решение тех же задач, что и у традиционных терминологических словарей: граница терминов очень часто размыта, поэтому используя словосочетание, составитель словаря не должен строго решать вопрос о границах многокомпонентных терминов и о переводимости их составляющих; в словосочетаниях заложено заметно больше структурно-стилистических связей текста, чем в отдельных словах, что весьма существенно при работе со связным текстом.
  • Одним из самых продуктивных способов словообразования в современную эпоху является аббревиация. Порой она стихийна и неуправляема. Автоматические переводные словари также не устраняются от решения этой проблемы. Как правило, промышленные автоматические словари включают аббревиатуру с отсылкой к основной несокращенной форме данной лексической единицы.
  • Объем является существенной характеристикой, принципиально различающей традиционные и автоматические переводные словари. Автоматические словари объемом в несколько миллионов словарных статей стали в настоящий момент реальностью, они значительно экономят время и оптимизируют процесс понимания иноязычной информации. Практика показывает, что создание словарей объемом 300 — 500 тыс. слов в книжной форме нерационально. Первичной для словарей должна стать компьютерная форма.
  1. В отличие от традиционных словарей автоматические переводные словари обладают высокой динамичностью. Отбор лексики продолжается в течение всего времени функционирования словаря; постоянно происходит исключение оказавшихся ненужными слов и включение новой лексики, коррекция и пополнение информации в любой зоне словарной статьи. Переменность состава и способность воспринимать изменения в ходе функционирования являются принципиальными характеристиками, отличающими компьютерные словари от обычных.
  1. Структура, состав и объем словарной статьи переводных автоматических словарей довольно четко отражают то промежуточное положение, которое они занимают между системами машинного перевода и традиционными словарями в книжной форме. В разных автоматических переводных словарях эти параметры весьма различны. Общими компонентами фактически являются только само заглавное слово, его тематическая принадлежность и иноязычный переводной эквивалент.
  2. Примерно за десять последних лет компьютерный словарь научился сам находить нужное слово, заговорил, уместился между делом на недорогой и удобный компакт-диск и начал активно помогать пользователю учиться. Сегодня на прилавках российских магазинов имеется неплохой ассортимент компьютерных словарей иностранных языков.

Может быть, немного на фоне других выделяется Abbyy Lingvo. По числу примеров перевода в статьях, новизне словарной базы, а также количеству дополнительных словарей он превосходит остальные. Словари «Мультилекс» стремятся быть лишь усовершенствованными копиями своих печатных оригиналов. Однако объём основного глоссария довольно велик,  систематизирован, что удовлетворяет пользователя.

Базы данных «Polyglossum» формируются из единого источника с выпускаемыми издательством бумажными словарями и снабжены системой индексации данных, позволяющей вести полнотекстовый поиск в любом направлении.

Словари «Контекста» двусторонние, причём статьи симметричны в плане поисковых возможностей. Статья может содержать примеры переводов фраз. Часть статей может быть снабжена толкованием. При подготовке электронного словаря на основе бумажного аналога такая переработка оказывается довольно трудоемкой, но позволяет структурировать информацию, выдаваемую по запросу так, чтобы уменьшить объём не относящихся к делу сведений.

Результаты проведенного исследования могут быть использованы, во-первых,  специалистами-лингвистами при изучении или при создании автоматического переводного словаря, во-вторых, в качестве лекционного материала при изучении таких дисциплин как информационные технологии в лингвистике или информатика в высших учебных заведениях. 
Список использованных источников и литературы

  1. Грязнухина Т. Структура и функции автоматического многоязычного переводного словаря [Электронный ресурс]. – Режим доступа: http://www.dialog-21.ru/Archive/2004/Gryaznukhina.htm
  2. Диконов В. Словарный запас [Электронный ресурс]. – Режим доступа: http://www.ets.ru/arc15-r.htm
  3. Зубов А.В., Зубова И.И. Информационные технологии в лингвистике, М.: Академия, 2004 – 208с.
  4. Евдокимов А. От А до Я и до XYZ. Обзор переводных компьютерных словарей-глоссариев [Электронный ресурс]. – Режим доступа: http://www.langust.ru/etc/compdic2.shtml
  5. Общедоступная мультиязычная универсальная интернет-энциклопедия Википедия [Электронный ресурс]. – Режим доступа http://www.wikipedia.org/
  6. Селегей В. Электронные словари и компьютерная лексикография [Электронный ресурс]. – Режим доступа: http://www.lingvoda.ru/transforum/articles/selegey_a1.asp
  7. Семенов А. Современный информационные технологии и перевод, М: «Академия», 2008. – 224 с.

 


Информация о работе Состав и структура автоматических переводных словарей