Сравнительный анализ программ машинного перевода

Автор работы: Пользователь скрыл имя, 02 Июня 2013 в 10:15, курсовая работа

Описание работы

Современный мир предъявляет повышенные требования к человечеству в связи с образованием единого информационного пространства. Отсутствие знания иностранного языка больше не является препятствием для международной коммуникации. Благодаря повсеместному распространению доступа к сети интернет роль перевода в жизни человечества неуклонно возрастает, в связи с тем, что в настоящее время почти все сферы человеческой деятельности сталкиваются с необходимостью перевода. Переводу с одного языка на другой подвергаются деловая и личная корреспонденция, художественные произведения, стихи, проза, тексты песен, научные книги, дипломатические документы, газетные материалы, интервью и т.д.

Содержание работы

1.Введение....................................................................................................3
2.История развития машинного перевода ................................................5
3.Механизм машинного перевода ...........................................................12
4.Машинный перевод: миф или реальность ...........................................16
5. Сравнительный анализ программ машинного перевода.……….......25
6.Заключение ..............................................................................................33
7.Список используемой литературы ........................................................35

Файлы: 1 файл

машинный перевод.doc

— 196.50 Кб (Скачать файл)

Оглавление

 

1.Введение....................................................................................................3

2.История развития машинного перевода ................................................5

3.Механизм машинного перевода ...........................................................12

4.Машинный перевод: миф или реальность ...........................................16

5. Сравнительный анализ программ машинного перевода.……….......25

6.Заключение ..............................................................................................33

7.Список используемой  литературы ........................................................35

 

Введение

 

Современный мир предъявляет  повышенные требования к человечеству в связи с образованием единого  информационного пространства. Отсутствие знания иностранного языка больше не является препятствием для международной коммуникации. Благодаря повсеместному распространению доступа к сети интернет роль перевода в жизни человечества неуклонно возрастает, в связи с тем, что в настоящее время почти все сферы человеческой деятельности сталкиваются с необходимостью перевода. Переводу с одного языка на другой подвергаются деловая и личная корреспонденция, художественные произведения, стихи, проза, тексты песен, научные книги, дипломатические документы, газетные материалы, интервью и т.д. Привлечение профессионального переводчика не во всех сферах повседневной жизни является целесообразной мерой. Поэтому появление машинного перевода на фоне развития компьютерных технологий было закономерным процессом.

Также следует отметить, что сфера машинного (автоматизированного) перевода привлекала внимание многих ученых-лингвистов таких как Ревзин И.И., Розенцвейг В.Ю1., Панов Д.Ю., а также специалистов в сфере компьютерных технологий. Несмотря на то, что по теории машинного перевода написано большое  количество книг и сборников статей, по сей день в данной теме остается множество белых пятен.

Стремление автоматизировать процесс перевода вполне естественно, а проблемы машинного перевода являются очень актуальными и не потеряют этой актуальности в будущем.

Целью данной курсовой работы является выявить необходимость  развития машинного перевода, оценить  эффективность использования машинного  перевода на данном этапе развития, а также выявить проблемные аспекты, связанные с автоматизацией перенесения смысловой нагрузки оригинального текста в текст перевода.

В соответствии с целью  были поставлены следующие задачи:

  1. Проследить динамику и направление развития машинного перевода в историческом контексте.
  2. Выявить особенности механизма реализации машинного перевода.
  3. Оценить эффективность использования современных программ машинного перевода.

В курсовой работе приведены  материалы научных статей и монографий, также широко использовались материалы Internet.

 

1. История развития машинного перевода

 

Сегодня ни у кого не возникает  проблемы с переводом текста с  одного языка на другой, даже без  углубленных знаний переводящего языка  или специального образования. Каждый человек может воспользоваться  плодами долгих исследований и разработок в области машинного перевода, во всяком случае, понять смысл незнакомого документа или инструкции обладая определенными техническими возможностями, такими как интернет и персональный компьютер. Но еще полвека назад об этом не было и речи.

Автоматический или «машинный» перевод текстов исторически  был одной из первых задач, решение  которых люди попытались переложить на вычислительные устройства. История  машинного перевода началась в конце 40-х годов прошлого столетия. По-видимому, первым, кто попытался получить правительственные субсидии на развитие вычислительной техники, был выдающийся математик XIX века Чарльз Бэббидж2. В числе благ, которые он сулил британскому правительству в случае поддержки его проекта вычислительной машины, было обещание, что когда-нибудь эта машина сможет автоматически переводить разговорную речь3.

Другие изобретатели тоже пытались создать механические переводящие  устройства еще до наступления компьютерной эры. Например, Петр Троянский в середине 1930-х годов получил в СССР патент, предложив не только автоматический двуязычный словарь, но и схему кодирования межъязыковых грамматических ролей, основанную на языке эсперанто. Тем не менее, сейчас принято считать, что основные принципы современного машинного перевода были изложены только в марте 1947 году в письме директора естественнонаучного отделения Рокфеллеровского фонда Уоррена Уивера к Норберту Винеру, в котором Уивер впервые обозначил принципиальную возможность существования машинного перевода, и теоретически обосновал и развил данную концепцию в своем меморандуме, адресованном Фонду в 1949 году4.

У.Уивер писал: "I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text." ("У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно - это взломать код, чтобы извлечь информацию, заключенную в тексте"). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны5.

В соответствии с идеями Уивера стадия передачи информации в  машинном переводе разделена на два  этапа; на первом этапе исходное предложение  переводится на язык-посредник (созданный  на базе упрощенного английского языка), а затем результат этого перевода представляется средствами выходного языка.

Развитие компьютерных  технологий, а также меморандум Уивера  вызвали множество дискуссий  о проблемах машинного перевода, после чего были выделены денежные средства на исследования.

В связи с громоздкостью  и дороговизной в обслуживании первых вычислительных машин, компьютеры использовались только для осуществления математических расчетов для нужд военных учреждений, а также математических и физических факультетов университетов (последние также были тесно связаны с военной сферой).

На ранних этапах, разработка машинного перевода активно поддерживалась военными, при этом в США основное внимание уделялось русско-английскому  направлению, а в СССР - англо-русскому.

Под руководством известного математика Массачусетского технологического университета Й.Бар-Хиллела в 1952г. состоялась первая конференция по вопросу машинного перевода, а в 1954 г в Нью-Йорке была представлена первая публичная демонстрация машинного перевода, вошедшая в историю под названием Джоржтаунского эксперимента. Несмотря на то, что представленная система IBM Mark II оперировала все лишь словарем в 250 слов, 6 грамматическими правилами и переводом нескольких простых фраз с русского языка на английский, этот эксперимент вызвал широкий резонанс, повлекший проведение исследований по всему миру.

В том же 1954 первый эксперимент  по машинному переводу был осуществлен  в СССР профессором И.К.Бельской, отвечающей за лингвистическую часть  и доктором Д.Ю.Пановым, обеспечивающим  программную часть в Институте точной механики и вычислительной техники Академии наук СССР6. В тот же промежуток времени под руководством Ю.А.Моторина. был разработан первый промышленно пригодный алгоритм машинного перевода и система машинного перевода с английского языка на русский на универсальной вычислительной машине. После этого работы начались во многих информационных институтах, научных и учебных организациях страны7.

Исследователи-разработчики рассчитывали  создать качественную автоматизированную систему машинного перевода без участия человека на этапе постредактирования в течение нескольких лет. С развитием исследований профессиональные переводчики в серьез призадумались о своей дальнейшей судьбе и смене профессии.

В эти исследования были вложены значительные средства, однако результаты очень скоро разочаровали инвесторов. Одной из главных причин невысокого качества машинного перевода в те годы были ограниченные возможности аппаратных средств: малый объем памяти, медленный доступ к содержащейся информации, невозможность полноценного использования языков программирования высокого уровня. Другой причиной было отсутствие теоретической базы, необходимой для решения лингвистических проблем, в результате чего первые системы машинного перевода сводились к пословному переводу текстов без какой-либо синтаксической и смысловой целостности.

В 1959 г. философ Й. Бар-Хиллел выступил с утверждением, что высококачественный полностью автоматический машинный перевод не возможен, в связи с  отсутствием у аппаратных средств знаний языковой действительности и возможности выбрать правильный вариант перевода слов. Но, несмотря на высказанное утверждение, Бар-Хиллел не отрицал идею машинного перевода как таковую, считая перспективным направлением разработку машинных систем, ориентированных на использование их человеком-переводчиком8.

Это выступление самым  неблагоприятным образом отразилось на исследования, проводимых в США, несмотря на то, что для практического  использования были предоставлены  две системы русско-английского перевода, а именно MARK (в Департаменте иностранной техники ВВС США, и GAT (в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

В 1966 г. специально созданная  Национальной Академией наук комиссия ALPAC, основываясь, на выводах Бар-Хиллела, а также в силу низкого качества машинно-переведённых текстов и огромных вложений, пришла к выводу, что машинный перевод нерентабелен.

За докладом ALPAC последовало  сокращение финансирования исследований в области машинного перевода со стороны правительства США, а также ряда других государств.

Тем не менее, в ряде стран  исследования продолжались, чему способствовал  постоянный прогресс вычислительной техники. Особенно существенным фактором стало  появление мини- и персональных компьютеров, а с ними всё более сложных словарных и поисковых систем, ориентированных на работу с естественно-языковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. При этом несколько сместились акценты: исследователи теперь ставили целью развитие «реалистических» систем машинного перевода, предполагавших участие человека на различных стадиях процесса перевода. Системы машинного перевода из «конкурента» профессионального переводчика превращаются в незаменимого помощника, способствующего экономии времени и человеческих ресурсов. Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х9.

И только с начала 80-х  годов, когда персональные компьютеры уверенно и мощно начали завоевывать мир, а время их работы, естественно, подешевело и доступ к ним можно было получить в любую минуту, машинный перевод наконец-то стал экономически выгодным. К тому же в эти и последующие годы совершенствование программ позволило достаточно точно переводить многие виды текстов. Таким образом, 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Следующие десять лет  разработка систем машинного перевода осуществлялась в США университетом Бригхам в Прово, штат Юта и финансировалась Мормонской церковью, заинтересованной в переводе Библии; группами исследователей в Канаде, в числе которых Таум в Монреале с ее системой METEO; в Европе  и т.д. Особого упоминания заслуживают работа в этой области отечественных лингвистов, таких, как И.А.Мельчук и Ю.Д.Апресян (Москва), результатом которой стал лингвистический процессор ЭТАП. В 1960 г. в составе Научно-исследовательского института математики и механики в Ленинграде была организована экспериментальная лаборатория машинного перевода, преобразованная затем в лабораторию математической лингвистики Ленинградского государственного университета10.

90-е годы можно считать  подлинной эпохой возрождения  в развитии машинного перевода, что связано не только с высоким уровнем возможностей персональных компьютеров, появлением сканеров и различных программ, но и с широким  распространением сети Интернет, обусловивших реальный спрос на машинный перевод. Он вновь стал привлекательной областью вложения капиталов, как для частных инвесторов, так и для государственных структур. За период 1978-1997гг в США на исследования в области автоматического перевода истрачено 20 миллионов долларов, в Европе - 70 миллионов, в Японии - 200 миллионов11.

В июле 1990 года на выставке персональных компьютеров Форум в Москве была представлена первая в России коммерческая система машинного перевода под названием Промт, которая  всего через пару лет выиграла конкурс НАСА на поставку систем машинного перевода.

В настоящее время  несколько десятков компаний занимаются разработкой коммерческих систем машинного перевода, в их числе: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvistica b.v. и др

Появилась возможность  воспользоваться услугами автоматических переводчиков непосредственно в  сети интернет: alphaWorks; PROMT's Online Translator; LogoMedia.net; Yahoo! Babel Fish; InfiniT.com.

Несмотря на достигнутый  результат в рамках исследований, развитие компьютерных технологий, повсеместное распространение и использование машинного перевода, не только учащимися, студентами, а также профессионалами-переводчиками, мечты, с которыми человечество полвека назад взялось за задачу машинного перевода, в значительной мере остаются мечтами: высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако по статистическим данным преимуществом является ускорение работы переводчика при использовании систем машинного перевода до пяти раз. К тому же, современные технологии не стоят на месте, каждый день, радуя пользователей новыми ноу-хау, и кто знает, может еще через пятьдесят лет мечты воплотятся в реальность.

Информация о работе Сравнительный анализ программ машинного перевода