Разработка экспертной системы-Выбор спортивной секции
Курсовая работа, 23 Января 2012, автор: пользователь скрыл имя
Описание работы
Представлению знаний в базе знаний предшествуют процессы извлечения знаний, их структуризация и формализация.
Данная работа посвящена одному из методов извлечения знаний
Содержание работы
Первая часть: реферат на тему «Текстологические методы извлечения знаний» 3
Введение 3
1. Классификация методов извлечения знаний 4
2. Схема извлечения знаний из специальных текстов 5
3. Алгоритм извлечения знаний из текстов 11
Заключение 13
Список литературы 14
Вторая часть: разработка экспертной системы «Выбор спортивной секции для ребенка» 15
1. Постановка задачи 15
2. Разработка дерева решений 15
3. Таблица имен переменных 17
4. База знаний 17
5. Таблицы структур данных 18
6. Блок схема алгоритма программной реализации 21
7. Программа 22
Приложение: программная реализация экспертной системы 23
Файлы: 1 файл
Разработка экспертной системы-Выбор спортивной секции.docx
— 655.88 Кб (Скачать файл) Теперь
несколько подробнее о
«...Люди понимают друг друга не потому, что передают собеседнику знаки предметов, и даже не потому, что взаимно настраивают друг друга на точное и полное воспроизведение идентичного понятия, а потому, что взаимно затрагивают друг в друге одно и то же звено цепи чувственных представлений и зачатков внутренних понятий, прикасаются к одним и тем же клавишам инструмента своего духа, благодаря чему у каждого вспыхивает в сознании соответствующие, но не тождественные смыслы».
Говоря на языке современного языкознания, понимание - это формирование «второго текста», т.е. семантической структуры (понятийной структуры). В нашей терминологии - это попытка воссоздания семантической структуры M1 в процессе формирования модели М2, т. е. это первый шаг структурирования знаний.
Как происходит процесс понимания? Изложим одну из возможных схем. Эта схема согласуется со стратегией изучения всего нового. Основными моментами понимания текста являются:
- Выдвижение предварительной гипотезы о смысле всего текста (предугадывание).
- Определение значений непонятных слов (т. е. специальной терминологии).
- Возникновение общей гипотезы о содержании текста (о знаниях).
- Уточнение значения терминов и интерпретация отдельных фрагментов текста под влиянием общей гипотезы (от целого к частям).
- Формирование некоторой смысловой структуры текста за счет установления внутренних связей между отдельными важными (ключевыми) словами и фрагментами, а также за счет образования абстрактных понятий, обобщающих конкретные фрагменты знаний.
- корректировка общей гипотезы относительно содержащихся в тексте фрагментов знаний (от частей к целому).
- Принятие основной гипотезы, т. е. формирование М2. Следует отметить наличие как дедуктивной (от целого к частям), так и индуктивной (от частей к целому) составляющей процесса понимания. Такой двуединый подход позволяет охватывать текст как смысловое единство особого рада, с его основными признаками, такими, как связность, цельность, законченность и др.
Центральными моментами процесса I являются шаги 5 и 7, т. е. формирование смысловой структуры или выделение «опорных», ключевых, слов или «смысловых вех», а также заключительное схватывание «смысловых вех» в единую семантическую структуру.
При анализе текста важно выявление внутренних связей между отдельными элементами текста и понятиями. Традиционно выделяют два вида связей в тексте - эксплицитные (или явные связи), которые выражаются во внешнем дроблении текста, и имплицитные (скрытые связи - внутренние). Эксплицитные связи делят текст на параграфы с помощью перечисления компонентов вводных слов (или коннекторов) типа «во-первых ... , во-вторых ... , однако и т. д.». Имплицитные, или внутренние, связи между отдельными «смысловыми вехами» вызывают основное затруднение при понимании.
Итак, семантическая структура текста образуется в сознании познающего субъекта с помощью знаний о языке, знаний о мире, а также общих знаний (фоновых), в той предметной области, которой посвящен текст. «Тексты пишут для посвященных». Другими словами, если текст не является научно-популярными то для его адекватного прочтения требуется некоторая подготовка.
Таким
образом, путь к знаниям удлиняется
еще на одно звено. Если мы раньше говорили,
что сами текстологические методы редко
употребляются как
Подготовкой
к прочтению специальных
Компоненты формирования смысла текста М2;
- личный опыт a на ли тика - j
- общенаучная эрудиция аналитика - e
- предварительные знания аналитика о по –w
- экстракт текста Т -(a, b, g, q )
Таким образом, на процесс понимания 1 и модель М2 влияют следующие компоненты:
- экстракт компонентов (a, b, g, q ) почерпнутый из текста Т;
- предварительные знания аналитика о предметной области w;
- общенаучная эрудиция аналитика e;
- его личный опыт j.
М2=[(a, b, g, q )’ w, e, j].
Процесс I - это очень сложный, не поддающийся формализации процесс, на который существенным образом влияют такие чисто индивидуальные компоненты, как когнитивный стиль познания, интеллектуальные характеристики и др.
Но
процедура разбивки текста на части
(«смысловые группы»), а затем сгущение,
сжатие содержимого каждого смыслового
куска в «смысловую веху» является,
видимо, основой для любого индивидуального
процесса понимания. Такая компрессия
текста в виде набора ключевых слов,
передающих основное содержание текста,
может служить удобной
В качестве ключевого слова может служить любая часть речи (существительное, прилагательное, глагол и т. д.) или их сочетание. Набор ключевых слов (НКС) - это набор опорных точек, по которым развертывается текст при кодировании в память и осознается при декодировании, это семантическое ядро цельности.
В качестве примера приведем результаты эксперимента по формированию НКС. Знания извлекались из следующего текста.
«Теория
фреймов относится к
Для осознания того факта, что заданная информация в этих областях имеет единственный смысл, человеческая память прежде всего должна быть способна увязывать эту информацию со специальными концептуальными объекта. МП. В противном случае не удается систематизировать информацию, которая выглядит разрозненной. В основе теории фреймов лежит восприятие фактов посредством сопоставления полученной извне информации с конкретными элементами и значениями, а также с рамками, определенными для каждого концептуального объекта в нашей памяти. Структура, представляющая эти рамки, называется фреймом. Поскольку между различными концептуальными объектами имеются некоторые аналогии, то образуется иерархическая структура с классификационными и обобщающими свойствами. Собственно она представляет собой иерархическую структуру отношений типа «абстрактное - конкретное». Сложные объекты представлены комбинацией нескольких фреймов, другими словами, они соответствуют фреймовой сети. Кроме того, каждый фрейм дополняется связанными с ним фактами и процедурой, обеспечивающей выполнение запросов к другим фреймам.
Причиной,
по которой представление знаний
фреймами выглядит достаточно точным,
является возможность более полного
описания процесса мышления человека
посредством определения
В
группе из 34 испытуемых не было получено
ни одного совпадающего НКС и, соответственно,
все структуры существенно
Рис.3. Примеры смысловых структур, извлеченных из текста
Интересно, что одна из гипотез лингвостатистики о том, что наиболее употребляемые слова являются наиболее важными с точки зрения содержания текста, т. е. отражают его тематическую структуру, частично подтвердилась.
Выделим три вида текстологических методов:
- анализ специальной литературы,
- анализ учебников,
- анализ методик.
Обозначенные
три метода существенно отличаются,
во-вторых, по степени концентрированности
специальных знаний, и, во-вторых, по
соотношению специальных и
3. Алгоритм извлечения знаний из текстов
Рассмотрим простейший алгоритм извлечения знаний из текстов рис.4.
Особую сложность представляет извлечение знаний из специальной литературы и методик, поскольку в них очень высока степень концентрации специальных знаний.
Рис.4. Алгоритм извлечения знаний из текстов
Заключение
Текстологический метод является одним из важнейших методов извлечения знаний. Он состоит из следующих методов анализ учебников, анализ документов, анализ специальной литературы. Основной сложностью при извлечении знаний из любой литературы является несовпадение смысла который вкладывал в нее автор и того что понял читатель. поэтому для извлечения знаний необходимо привлекать экспертов (инженеров по знаниям). Основными этапами извлечения знаний из текстов являются:
- Составление "базового" списка литературы для ознакомления с предметной областью и чтения по списку.
- Выбор текста для извлечения знаний.
- Первое знакомство с текстом (беглое прочтение). Для определения значения незнакомых слов - консультации со специалистами или привлечение справочной литературы.
- Формирование первой гипотезы о структуре текста.
- Внимательное прочтение текста с выписыванием ключевых слов и выражений, т.е. выделение "смысловых вех" (компрессия текста).
- Определение связей между ключевыми словами, разработка макроструктуры текста в форме графа или "сжатого" текста (реферата).
- Формирование поля знаний на основании структуры текста.