Состав и структура автоматических переводных словарей

Автор работы: Пользователь скрыл имя, 16 Ноября 2015 в 01:37, курсовая работа

Описание работы

Цель исследования: изучить состав и структуру автоматических переводных словарей.
Задачи исследования:
1) проанализировать существующие определения словаря
2) дать определение переводному словарю, привести его характеристику
3) проанализировать лексический состав и объём автоматического переводного словаря
4) изучить динамичность автоматического переводного словаря
5) проанализировать состав и структуру словарных статей автоматического переводного словаря

Файлы: 1 файл

Курсовая333.docx

— 65.18 Кб (Скачать файл)

Дополнительным доводом в пользу включения общей лексики в автоматический переводной словарь может служить тот факт, что такие словари иногда используются для выдачи переводных эквивалентов всех слов текста в форме традиционных алфавитных или текстоориентированных переводных словарей [7].

Существенное значение приобретает выбор основной единицы словника. Для крупных переводных словарей общей лексики такой единицей является слово; словосочетания обычно даются в составе словарных статей отдельных слов в качестве иллюстрации значений этих слов либо как пример сочетаемости заглавной единицы. В лексикографической практике основным критерием включения слова в словарь служит его употребительность. Одновременно с этим составитель переводного словаря должен учитывать частотность не только слов входного языка, но и их переводных эквивалентов в выходном языке.

В научно-технических словарях такой единицей является словосочетание. Доля словосочетаний составляет 75 — 80% всего словарного состава.

Так происходит потому, что составители терминологических словарей по-разному толкуют понятие «термин», по-разному определяют и его границы, а также «нижний» и «верхний» пределы этого понятия.

Не оправдывая в целом такой способ комплектования словника терминологического словаря, следует отметить, что в основе этого довольно распространенного явления лежат субъективные и объективные причины. К субъективным относится простота лексикографических решений данного подхода, при котором составитель словаря не должен строго решать вопрос о границах многокомпонентных терминов и о переводимости их составляющих. К объективным причинам можно отнести, во-первых, то, что в словосочетаниях заложено заметно больше структурно-стилистических связей текста, чем в отдельных словах, что весьма существенно при работе со связным текстом. Во-вторых, включая в состав словаря большое количество словосочетаний, разработчик стремится точнее отразить запросы своего читателя: приблизительно 80 % обращений к терминологическому словарю составляют словосочетания [6].

С точки зрения основной единицы словника автоматические переводные словари близки к традиционным терминологическим: 80 —90 % их лексического массива представлено словосочетаниями [1]. Происходит это потому, что крупные автоматические словари в большинстве своем фактически являются терминологическими банками и их основная функция направлена на решение тех же задач, что и у традиционных терминологических словарей. Интересная особенность автоматических словарей состоит в том, что верхняя граница словосочетаний в них еще более размыта, чем даже у традиционных. В крупные автоматические словари нередко включаются в качестве самостоятельных статей отдельные предложения и даже фрагменты текстов. Подобный подход к комплектованию словника в традиционной лексикографии не используется. Однако здесь такое решение в определенных условиях оказывается весьма удобным. Дело в том, что переводные словари показали себя эффективным инструментом полуавтоматического перевода стандартизованных текстов, например товаросопроводительной документации или юридических документов, в которых отдельные части регулярно повторяются без существенных изменений.

Количество свободных словосочетаний и единиц текста в автоматическом переводном словаре в первую очередь определяется его типом и задачами. Чем более ограничены цели словаря, чем он уже тематически, тем в большей степени такой словарь оказывается текстоориентированным, тем больше в нем может и должно быть свободных словосочетаний и единиц текста. Чем шире диапазон задач автоматического переводного словаря, чем шире спектр тематик и различных слов, которые он охватывает, тем более он должен быть системоориентированным, тем меньше в нем должно содержаться свободных словосочетаний и единиц текста[1] [7].

Одним из самых продуктивных способов словообразования в современную эпоху является аббревиация. В терминологической лексике четко прослеживается тенденция к свертыванию многокомпонентных терминологических единств и замена их в сфере функционирования различными сокращениями: инициальными аббревиатурами, акронимами, сращениями и другими вариантами. Образование всех видов сокращений в терминологической лексике — процесс в основном стихийный, никем не управляемый. Появление среди них все новых приводит к возникновению синонимии и омонимии как между терминосистемами разных наук, так и в пределах одной и той же терминосистемы, что, безусловно, осложняет межъязыковое и внутриязыковое общение ученых и специалистов разных направлений [7].

Автоматические переводные словари также не устраняются от решения этой проблемы [7]. Как правило, промышленные автоматические словари включают аббревиатуру с отсылкой к основной несокращенной форме данной лексической единицы. Индекс надежности, который служит в таких словарях критерием степени рекомендованное термина или его переводного эквивалента, может присваиваться также и сокращениям. Динамичность автоматических переводных словарей позволяет изменять индекс надежности любой единицы, в том числе и сокращения, либо совсем исключить ее из своего состава в зависимости от частотности или рекомендаций специальных терминологических органов. Включение всех действующих в определенной тематической сфере сокращений и последующее прослеживание их употребительности и статуса осложняет задачи составителей автоматических переводных словарей и увеличивает их объем. Этим значительно облегчается задача пользователя и возрастает ценность такого словаря как источника лексикографической информации.

Сопоставляя перечень характеристик, на основании которых строят свои типологии разные исследователи, можно сделать вывод, что наибольшее значение все отводят принципам отбора лексики, организации и интерпретации лексического материала. Объем является как бы вторичной характеристикой, производной от времени разработки словаря и возможностей составителя, и существенно не влияет на тип словаря [7][6]. Это косвенно подтверждается большим разнообразием объемов словарей одного и того же типа. Например, регулярно издаются различные переводные словари общей лексики для одной и той же пары языков объемом от 2 тыс. до 100 тыс. слов — карманные, краткие, средние, большие. В этом разнообразии объемов существует одна четкая закономерность: с увеличением объема количество словарей резко уменьшается. Если количество переводных словарей объемом до 20 тыс. слов для развитых лексикографий исчисляется сотнями, то словарей с объемом от 20 до 50 тыс. слов десятки, а от 50 до 100 тыс. — уже единицы[7]. Переводные словари объемом 150 тыс. слов и более явление исключительное практически для всех развитых лексикографий[7]. Это объясняется объективными недостатками традиционных «бумажных» словарей. Словари подобных объемов в книжной форме содержат тысячи страниц, в большинстве своем являются многотомными и, как следствие, неудобными в работе и дорогостоящими.

Вместе с тем развитие общества в целом, науки и техники в первую очередь, требует формирования лексикографических фондов для языка во всех его проявлениях, создания новых типов словарей, органично включающих в себя толкования, переводные эквиваленты, контексты, лексическую сочетаемость и многие другие виды лингвистической и экстралингвистической информации.

Основываясь на сопоставлении объемов традиционных переводных словарей, с одной стороны, и многоязычных автоматических словарей и терминологических банков — с другой, а также учитывая современные тенденции развития вычислительной лексикографии, можно сделать вывод, что объем является существенной характеристикой, принципиально различающей традиционные и автоматические переводные словари. Автоматические словари объемом в несколько миллионов словарных статей стали в настоящий момент реальностью, в то время как максимальные объемы традиционных переводных словарей достигают 150 — 200 тыс. словарных статей [3]. Практика показывает, что создание словарей объемом 300 — 500 тыс. слов в книжной форме нерационально. Первичной для словарей должна стать компьютерная форма, а книжная может быть производной, проекцией автоматизированных лексикографических баз данных по составляющим, структуре и номенклатуре словарных статей[7].

2.2 Динамичность автоматических переводных словарей.

Одним из существенных свойств словарей в традиционной книжной форме является их статичность, что обнаруживается на уровне состава словника и на уровне содержания словарных статей. Сложность лексикографических работ, редакционно-издательские, типографские, а также экономические факторы не позволяют переиздавать большие словари с необходимой периодичностью.

Сопоставление данных о периодичности переиздания переводных и одноязычных словарей убедительно свидетельствует о том, что традиционная лексикография в среднем на 7 — 10 лет отстает от процесса фактического обогащения или изменения терминологических систем современных активно развивающихся направлений науки и техники[6]. В качестве решения проблемы пополнения словарей используется выпуск различных дополнений к ним, которые выходят либо самостоятельно, либо в составе того же словаря при его стереотипном переиздании. Запаздывание с включением новой лексики отмечается переводчиками как один из основных недостатков традиционных словарей.

Словарная статья «бумажного» издания статична и по своей структуре, и по содержанию. Это означает, что любые неточности или ошибки могут быть исправлены, а дополнительная информация, даже самая актуальная, может быть внесена только при очередном переиздании.

Разные задачи и различные уровни языковой подготовки читателя словаря предъявляют заметно различающиеся требования к составу и объему информации в словарных статьях, что, в свою очередь, вызывает необходимость создания словарей разных типов. Так, в переводных словарях интенсивного типа словарная статья содержит помимо переводных эквивалентов разнообразные сведения семантического и стилистического характера о заглавном слове и его эквивалентах в выходном языке, примеры употребления, типовые и идиоматические словосочетания, синонимы, антонимы и т.п.[1] Как правило, значительная часть этой информации для читателя с хорошим знанием языка оригинала, каковым, например, является профессиональный переводчик, избыточна. В то же время в переводных технических словарях, большинство которых представляет собой словари экстенсивного типа, словарные статьи значительно беднее и чаще всего не содержат практически никакой информации, кроме переводных эквивалентов, что для читателя со слабым или средним уровнем знания языка оригинала явно недостаточно [6]. В условиях традиционной лексикографии противоречие между уровнем языковой подготовки читателя, ожидаемым разнообразием задач и целей словаря, с одной стороны, и объемом и характером информации в его словарных статьях — с другой, в рамках одного «бумажного» словаря не разрешимо из-за его статичности.

В отличие от традиционных словарей автоматические переводные словари обладают высокой динамичностью[7]. Отбор лексики продолжается в течение всего времени функционирования словаря; постоянно происходит исключение оказавшихся ненужными слов и включение новой лексики, коррекция и пополнение информации в любой зоне словарной статьи. Переменность состава и способность воспринимать изменения в ходе функционирования являются принципиальными характеристиками, отличающими компьютерные словари от обычных. Динамичность состава осуществляется в основном за счет гибкости программного обеспечения. На лингвистическом уровне достижение динамичности зависит от четкой структуры словарной статьи и возможности записи однотипной информации строго в одной и той же зоне всех словарных статей, от единообразия интерпретации больших массивов лингвистических объектов, на основе всей суммы накопленных знаний. На организационном уровне резко возрастает роль слежения за динамикой изменения состава словаря, а также состава и объема информации внутри словарных статей.

Следовательно, автоматические переводные словари обладают принципиальной возможностью преодоления противоречий между словарями интенсивного и экстенсивного типов, предоставляя пользователю право самому определять состав и объем необходимой ему информации.

2.3 Состав и структура  словарных статей.

Словарная статья — основная коммуникативная и композиционная единица словаря как особого вида справочной литературы. Ее состав и структура определяются многими факторами, главные из которых целевая направленность словаря, доминирующие лексикографические традиции и реальные технические возможности.

Состав словарной статьи - первоочередная проблема при разработке словаря, обладающего достаточно богатой информацией.

Статья должна включать в себя такие компоненты, как[7]: 

  1. заглавное слово;
  2. его формальные характеристики (грамматические, орфоэпические, орфографические и т.д.);
  3. его семантизацию;
  4. извлечения из текстов, иллюстрирующие ту или иную формальную или семантическую его особенность;
  5. указания на «соседей» заглавного слова в лексической системе языка по разным осям ее семантического пространства;
  6. отсылки и справки разного характера и назначения.

Такая модель предлагается для словарной статьи одноязычного филологического словаря. Для переводного словаря к этому перечню следует добавить переводные эквиваленты - слова или словосочетания выходного языка, которые составитель приписывает заглавному слову и которые в идеале должны передавать максимум информации, содержащейся в заглавном слове.

В терминологической лексикографии идеальную словарную статью можно представить как объединение требований собственно энциклопедического и филологического описаний. Согласно требованиям энциклопедического описания, она должна включать[7]:

  1. заглавное слово (термин);
  2. научный раздел;
  3. этимологию;
  4. первое определение (с цитатой на языке оригинала);
  5. современное определение;
  6. дополнительные разъяснения и замечания относительно различных определений или трактовок значения термина;
  7. синонимы;
  8. аббревиатуры;
  9. литературу;
  10. автора словарной статьи и год ее написания.

Информация о работе Состав и структура автоматических переводных словарей