Базы данных и лингвистические информационные ресурсы
Курсовая работа, 16 Июня 2014, автор: пользователь скрыл имя
Описание работы
Цель настоящей работы – провести обзор исследований в области баз данных и информационных ресурсов рассмотреть возможности их использования.
Задачи:
Рассмотреть лингвистику как объект информационного отражения, определив те ее черты, которые обуславливают особенности и состав информационных ресурсов в этой области.
Изучить историю развития БД выделить и охарактеризовать основные возможности, функции и преимущества.
Файлы: 1 файл
Базы данных и лингвистические информационные ресурсы.docx
— 23.98 Кб (Скачать файл)- В грамматике (для определения частоты употребления грамматических морфем в текстах различного типа, выявления наиболее употребляемых типов словосочетаний и предложений, определения значений синонимичных морфологических единиц, частоты употребления классов слов и т.д.).
- В лингвистике текста (для дифференциации типов текста, создания конкордансов, выявления связи между предложениями в абзацах и между абзацами «т.д.).
- При автоматическом переводе текстов (для поиска контекстов слов, имеющих несколько переводных эквивалентов, поиска переводных эквивалентов терминологических и фразеологических словосочетаний в параллельных текстах и т.д.).
- В учебных целях (для выбора цитат, отдельных фрагментов произведений, примеров, используемых в процессе создания учебников и учебных пособий. б) таггированные корпусы текстов (от англ, tag — ‘индекс, помета’). Все слова такого корпуса получают некоторые буквенные или цифровые индексы, которые обозначают их грамматические, лексические, семантические или структурные признаки. Таких индексов может быть несколько.
3) Фонетические
В настоящее время общепринято, что для создания машиночитаемых фонетических корпусов используется транскрипция на основе орфографического представления звуков речи с дополнительными знаками, передающими (при необходимости) просодические, паралингвистические и другие особенности произношения. а) Фонетические корпусы текстов широко используются для решения следующих задач:
- сопоставительного изучения устной и письменной форм языка;
- изучения грамматических и лексических особенностей устной речи;
- исследования фонетических особенностей диалектов;
- построения частотных списков фонем и их сочетаний;
- изучения акустических свойств речевых единиц и их использования в психолингвистических и лингвистических экспериментах;
- создания компьютерных систем, распознавания и синтеза устной речи.[ Михайлов: 1976,7]
ЗАКЛЮЧЕНИЕ
База данных не является понятием собственно лингвистики. Это понятие общее для всех информационных технологий. База данных – это структурированная совокупность взаимосвязанных данных в рамках некоторой предметной области, предназначенная для длительного хранения во внешней (не оперативной) памяти компьютера и постоянного применения. Тем не менее создание базы данных – ключевая технология компьютерной лексикографии. Современные словари создаются на основе хранимых в памяти компьютера контекстов, для их создания используют программы, позволяющие формальным образом представить морфологические, словообразовательные, синтаксические и даже семантические характеристики слова.
Знания, которые необходимо усвоить в филологических вузах, в большом количестве содержаться на магнитных носителях и в сети интернет.
Преимущества использования БД :
Рассмотрим, какие преимущества получает пользователь при использовании БД как безбумажной технологии:
· Компактность (Информация хранится в БД, нет необходимости хранить многотомные бумажные картотеки)
·Скорость (Скорость обработки информации (поиск, внесение изменений) компьютером намного выше ручной обработки)
· Низкие трудозатраты (Нет необходимости в утомительной ручной работе над данными)
· применимость (Всегда доступна свежая информация)
Дополнительные преимущества появляются
при использовании БД в многопользовательской
среде, поскольку становится возможным
осуществлять централизованное управление
данными. Современные системы управления
базами данных обеспечивают как физическую
(независимость от способа хранения и
метода доступа), так и логическую независимость
данных (возможность изменения одного
приложения без изменения остальных приложений,
работающих с этими же данными). Современные
СУБД дают возможность включать в них не
только текстовую и графическую информацию,
но и звуковые фрагменты и даже видеоклипы.
Простота использования СУБД позволяет
создавать новые базы данных, не прибегая
к программированию, а пользуясь только
встроенными функциями. СУБД обеспечивают
правильность, полноту и непротиворечивость
данных, а также удобный доступ к ним.
Популярные СУБД - FoxPro, Access for Windows, Paradox. Для
менее сложных применений вместо СУБД
используются информационно-
· хранение большого объема информации;
· быстрый поиск требуемой информации;
· добавление, удаление и изменение хранимой информации;
· вывод ее в удобном для человека виде.
В работе показано соотношение между общепринятыми понятиями «база данных», «система управления базами данных» и современными «лингвистическими информационными ресурсами». Достаточно подробно представлены пути поиска и извлечения таких знаний.
Выполнены все поставленные задачи, такие как:
- Рассмотреть лингвистику как объект информационного отражения, определив те ее черты, которые обуславливают особенности и состав информационных ресурсов в этой области.
- Изучить историю развития БД выделить и охарактеризовать основные возможности, функции и преимущества.
СПИСОК ЛИТЕРАТУРЫ
- Гендина Н.И. Лингвистические средства автоматизации документального потока. СПб.: изд. отд. б - ки РАН, 1992. - 188с.
- Диахроническая лингвистика и история лингвистических учений. М.: изд-воМГУ, 1988. -235 с.
- Кондрашов H.A. История лингвистических учений: Учеб. М.: Просвещение, 1979. - 224 с.
- Лингвистические исследования 1995г. Лексикология, лексикография, грамматика.: Сб. научн. тр./ Отв. ред. А.П. Сытов. СПб.: ИЛИРАН, 1996. - 156с
- Мамудян М. Лингвистика. М. : Прогресс, 1985. - 200с.
- Марчук Ю.Н., Убин И.И. Действующие системы машинного перевода и автоматические словари// Обзор, информ. Сер.2. ( Машин, перевод и автоматизация информ. процессов). - 1979. - Вып. 3. - 70с.
- Мдивани P.P., Глинский В.А. Лингвистическое обеспечение автоматизированной системы по общественным наукам: состав и структура// Вопр. информ. теории и практики. 1985. - №52. - С. 37 -55.
- Мелихова Л. Английский on line / / Мир Internet. - 1997. - № 11. - С. 16- 19.
- Мельников Г.П., Преображенсикй С.Ю. Методология лингвистики. : Учеб. пособие. М. : изд - во Ун - та дружбы народов, 1989. - 88с.
- Мелюхин И.С. Об управлении информационными ресурсами//НТИ. -Сер. 1.-1992.-N10-11. С.56 -59.
- Методические вопросы анализа потоков информации на исследовательском этапе подготовки прогнозов// Науковедение и информатика: Межд.сб. науч.тр. Киев: Наук, думка, 1988. - Вып.32. -С.ЗЗ - 38.
- Методические рекомендации по анализу отраслевых потоков информации/НИИ информ. по машиностроению. М.,1978. - 72с.
- Михайлов А.И. О будущем научной информации//НТИ. Сер.1. -1985. -N1. -С.1 -3.
- Михайлов А.И. Проблемы лингвистического обеспечения АСНТИ// Вопр. информ. теории и практики. 1984. - №51. - С. 5 -11.
- Михайлов А.И., Черный А.И. Научная коммуникация и информатика. -М.: Наука,- 1976.-98с.