Сравнительный анализ программ машинного перевода

Автор работы: Пользователь скрыл имя, 02 Июня 2013 в 10:15, курсовая работа

Описание работы

Современный мир предъявляет повышенные требования к человечеству в связи с образованием единого информационного пространства. Отсутствие знания иностранного языка больше не является препятствием для международной коммуникации. Благодаря повсеместному распространению доступа к сети интернет роль перевода в жизни человечества неуклонно возрастает, в связи с тем, что в настоящее время почти все сферы человеческой деятельности сталкиваются с необходимостью перевода. Переводу с одного языка на другой подвергаются деловая и личная корреспонденция, художественные произведения, стихи, проза, тексты песен, научные книги, дипломатические документы, газетные материалы, интервью и т.д.

Содержание работы

1.Введение....................................................................................................3
2.История развития машинного перевода ................................................5
3.Механизм машинного перевода ...........................................................12
4.Машинный перевод: миф или реальность ...........................................16
5. Сравнительный анализ программ машинного перевода.……….......25
6.Заключение ..............................................................................................33
7.Список используемой литературы ........................................................35

Файлы: 1 файл

машинный перевод.doc

— 196.50 Кб (Скачать файл)

Таким образом, в данной главе обозначены  основные проблемы, возникающие при использовании машинного перевода. На сегодняшний день разработано огромное количество систем автоматизированного перевода, которые были упомянуты в главе по Истории развития машинного перевода и все они обладают своими достоинствами и недостатками. Преимуществом одних является использование и возможность подключения огромного количества различных профессиональных словарей, других - отличное распознание грамматических правил, однако все системы машинного перевода не достигли уровня знаний и умений квалифицированного переводчика, а значит, есть куда и к чему стремиться ученым-лингвистам и специалистам по новейшим технологиям23.

Однако при огромном количестве минусов машинного перевода стоит  упомянуть и о достоинствах  рассматриваемого объекта.

Прежде всего, это высокая скорость машинного перевода. Всего несколько секунд и Вы получаете подстрочный перевод многостраничного текста. Хотя данный перевод нуждается в редактировании, но основной смысл документа будет более или менее понятен, особенно если переводимый документ технического характера24. В данном аспекте квалифицированный переводчик значительно уступает машине, поскольку даже при многолетнем опыте, переводчику потребуются время на осуществление даже чернового перевода, поскольку никто не совершенен и в рамках постоянного развития и обилия все новой и новой информации кому угодно потребуются профильные словари и время на осуществление нормального перевода.

Вторым преимуществом электронных  переводчиков является низкая стоимость. В случае необходимости перевода многие обращаются в переводческие бюро, к профессиональным переводчикам, или нанимают штатного переводчика. В данном случае приходится платить за страницу перевода, содержащую определенное количество знаков, и стоимость за выполненный перевод зависит от региона  проживания. Ни каждая организация может себе позволить содержать профессионального переводчика. В любом случае, стоимость профессионального, но не всегда качественного перевода может обойтись «в копеечку». При наличии интернета электронным переводчиком Вы можете воспользоваться в режиме он-лайн не производя дополнительных затрат. Также можно купить компьютерную программу, производящую автоматизированный перевод и выполнять неограниченное количество переводов. Данный вариант также вполне экономичен.

Еще одним преимуществом автоматизированного  перевода, тесно связанным с предыдущим является доступ к услуге. Программа-переводчик всегда под рукой, необходимы только ресурсы, такие как интернет и  компьютер, а обращение в переводческое  бюро или к квалифицированному переводчику во многих случаях связано с дополнительными затратами времени и сил.

Еще одним достоинством машинного перевода является универсальность. Любой переводчик всегда обладает определенной специализацией, и переводит тексты по той теме или темам, которыми он хорошо владеет. Данное обстоятельство связанно с тем, что в каждой отрасли существуют свои специальные термины и понятия, мало того наука не стоит на месте и с каждым днем появляются все новые слова, термины, понятия, и овладеть всеми за гранью человеческих возможностей. Когда переводчик художественной литературы берется за перевод, например, технических текстов, ляпсусов не избежать. Такой же результат, скорее всего, следует ожидать при переводе технических текстов переводчиком художественных произведений. Система машинного перевода выгодно отличается тем, что она абсолютно универсальна. Нужно только грамотно подключить специализированный словарь по соответствующей тематике. Следует учесть и еще одно преимущество - пополнение специализированных словарей новейшими терминами значительно опережает аналогичные словари полиграфического исполнения. В ряде случаев также рекомендуется вести свой собственный словарь новых терминов или новых значений. Вы естественно не получите качественный перевод, но во всяком случае сможете понять, о чем говорится в тексте.

Конфиденциальность также  можно отнести к достоинствам машинного перевода. Не всегда можно  доверить  важную информацию, нуждающуюся в переводе работникам переводческого бюро или незнакомому Вам специалисту-переводчику.  Многие люди пользуются системами машинного перевода для перевода личной корреспонденции, финансовых документов и т.д. И не каждый рискнет «поделиться» данной информацией с другими людьми. В данном случае безразличный электронный переводчик сохранит все доверенные ему тайны.

Одним из немаловажных преимуществ  машинного перевода является возможность  перевода информации в сети Интернет. Благодаря он-лайновым системам машинного перевода появилась возможность для широких слоев населения просматривать иностранные сайты, не затрудняясь с их переводом, общаться и вести личную переписку и т.д.  Кроме того, здесь действуют все вышеперечисленные достоинства машинного перевода, а именно перевод текстов по любой тематике производится быстро и конфиденциально.

Естественно в данной работе отмечены лишь основные как  достоинства, так и недостатки машинного  перевода, и при наиболее тщательном рассмотрении можно обозначить какие-либо еще положительные и  отрицательные стороны.

 Также необходимо отметить, что в случае использования машинного перевода текст должен быть подвергнут определенной обработке, т.е. проверке текста на наличие ошибок и сокращений, неправильной пунктуации и в случае их наличия произведения  исправлений. В переводимом тексте должны отсутствовать переносы, что, впрочем, легко обеспечивается при подготовке текста в редакторе Word. Особенно внимательно надо просматривать тексты, получаемые в результате распознавания отсканированного изображения, так как содержащиеся в них ошибки нередко приводят к тому, что отдельные слова остаются непереведенными всего-то из-за одной неправильной буквы.  Также необходимо постараться использовать простые предложения с прямым порядком слов

Резюмируя вышесказанное  можно сделать вывод, что существование машинного перевода является реальностью, однако результат будет прежде всего зависеть от стиля переводимого текста и его предварительной подготовки. Поэтому, несмотря на наличие достоинств, машинный перевод нуждается в значительном дальнейшем совершенствовании и не может заменить квалифицированного переводчика.

 

5. Сравнительный анализ программ

машинного перевода

 

Наше  исследование не было бы полным без  проведения сравнительного анализа программ машинного перевода таких как Google Translate и PROMT 8.0. Выбор указанных программ обосновывается не только их популярностью в среде переводчиков и простых пользователей персональных компьютеров, но и использованием кардинально различных технологических подходов к процессу перевода. Несмотря на многообразие программ - переводчиков в современном мире существуют две технологии машинного перевода, которые упоминались в предыдущих главах: традиционная - на основе правил (rule-based machine translation), и статистическая (statistical- based machine translation).

Проведем  анализ программы машинного перевода PROMT, принцип работы которой основан на применении технологии rule-based machine translation.

PROMT (от PROject MT — проект машинного  перевода) — российская компания, разработчик систем машинного перевода. В настоящий момент переводчики PROMT существуют для английского, немецкого, французского, испанского, итальянского, португальского и русского языков. Офисы компании открыты в России, США и Германии. Среди пользователей электронный переводчик известен как система самого неправильного перевода, посеявшая огромное количество шуток. В последние годы PROMT поставляет наряду с различными вариантами своей системы автоматического перевода и сопутствующими специализированными словарями ещё и собственные решения на основе технологии Translation memory.25

Как уже упоминалось ранее, в основе перевода PROMT лежит технология машинного  перевода, основанная на правилах rule-based machine translation. Рассмотрим подробнее принципы работы подобной системы. В настоящее время существует два типа rule - based систем:

Один  из них - системы по типу Transfer (трансфер), которые предполагают морфологический, синтаксический и семантический анализ текста на языке входа; преобразование в структуру выходного языка (TRANSFER); синтез текста на выходном языке26. Если присмотреться  более внимательно, то к входному тексту применяются правила, которые ставят в соответствие структуры исходного и переводного языков. Начальный этап работы включает в себя морфологический, синтаксический, а иногда и семантический анализ текста для создания внутреннего представления. Перевод генерируется из этого представления с использованием двуязычных словарей и грамматических правил. Иногда на основе первичного представления, которое было получено из исходного текста, строят более «абстрактное» внутренне представление. Это делается для того, чтобы акцентировать места важные для перевода, и отбросить несущественные части текста. При построении текста перевода преобразование уровней внутренних представлений происходит в обратном порядке.27

При использовании этой стратегии получается достаточно высокое качество переводов, с точностью в районе 90% (хотя это  сильно зависит от языковой пары). Работа любой системы трансфертного перевода состоит как минимум из пяти частей:

  1. Морфологический анализ. Слова исходного текста классифицируются по частям речи. Выявляются их морфологические признаки. Определяются леммы слов.
  2. Лексические категоризации. В любом тексте некоторые слова могут иметь более чем одно значение, вызывая неоднозначность в анализе. При лексической категоризации выявляется контекст слова. Возможны различного рода пометки и уточнения.
  3. Лексический трансфер. На основе двуязычного словаря происходит перевод лемм слов. Действие очень похоже на пословный перевод.
  4. Структурный трансфер. Слова согласуются в предложении.
  5. Морфологическая генерация. На основе выходных данных структурного трансфера создаются словоформы переводного текста.28

Одной из основных особенностей трансферных систем машинного перевода является этап, во время которого промежуточное представление текста на языке оригинала «передается» в промежуточное представление текста в целевом языке.

Второй  тип rule-based системы носит название Interlingua (интерлингва) - один из классических подходов к машинному переводу, который предполагает анализ входного текста в терминах метаязыка и синтез метаструктуры текста на выходном языке29, другими словами исходный текст трансформируется в абстрактное представление, которое не зависит от языка (в отличие от трансфертного перевода). Переводной текст создается на основе этого представления. В рамках этого подхода, создание каждого нового интерпретатора языка для такой системы будет удешевлять ее, по сравнению, например, с системой трансфертного перевода.30 Кроме того, в рамках такого подхода можно реализовать «пересказ текста», перефразирование исходного текста в рамках одного языка, также возможна относительно простая реализация перевода сильно отличающихся языков, таких как, например русский и арабский.

Однако, до сих пор не существует реализаций такого подхода, которые бы корректно работали бы хотя бы для двух языков. Многие эксперты высказывают сомнения в возможности такой реализации. Самая большая сложность для создания подобных систем заключается в проектировании межъязыкового представления, которое должно быть одновременно абстрактным и независящим от конкретных языков, но в тоже время отражать особенности любого существующего языка. С другой стороны, в рамках искусственного интеллекта, задача выделения смысла текста на данный момент до сих пор не решена.

В этом методе перевода, межъязыковое представление  можно рассматривать как способ описания анализа текста, на языке  оригинала. При этом, в представлении  сохраняются морфологические, синтаксические характеристики текста. Предполагается, что таким образом можно передать «смысл» при создании переводного текста. При этом иногда используется два межъязыковых представления. Одно из них более отражает характеристики исходного языка. В некоторых случаях используются два и более представления одного уровня (одинаково близкие к обоим языкам), но разнящиеся по тематике. Это необходимо для повышения качества перевода специфических текстов.31

Вышеописанный подход не является новым для лингвистики. Он основан на идеи близости языков. Для улучшения качества перевода, естественный язык используется в качестве моста между двумя другими языками. Например, при переводе с украинского на английский, иногда используется русский язык.

Для использования системы интерлингвистического машинного перевода необходимы следующие составляющие:

  • словари для анализа и генерации текстов;
  • описание грамматик языков;
  • база знаний понятий (для создания межъязыкового представления);
  • правила проекции понятий для языков и представления.

Самым сложным моментом при создании такого типа является невозможность построить  базу для широких областей знаний. А те базы, которые создаются для  очень специфичной тематики, обладают высокой вычислительной сложностью.32

Преимущества переводчика ПРОМТ являются:

  • Синтаксическая и морфологическая точность,
  • Стабильность и предсказуемость результата,
  • Возможность настройки на предметную область.

Недостатки  ПРОМТ:

  • Трудоемкость и длительность разработки,
  • Необходимость поддерживать и актуализировать лингвистические базы данных.

 

Проведем анализ программы машинного перевода Google, принцип работы которой основан на применении технологии Statistical Machine Translation ( Статистический машинный перевод).

Google Переводчик (англ. Google Translate) — веб-сервис компании Google, предназначенный для перевода части текста или веб-страницы на другой язык.33 Для некоторых языков пользователям предлагаются различные варианты переводов, например, для технических терминов, которые должны быть в будущем включены в обновления системы перевода.

Информация о работе Сравнительный анализ программ машинного перевода