Распознавание изображений с помощью нейронных сетей

Автор работы: Пользователь скрыл имя, 09 Сентября 2013 в 21:53, реферат

Описание работы

Нейронные сети представляют собой математическую модель функционирования биологических нейронных сетей –сетей нервных клеток живого организма. Как и в биологической нейронной сети, основным элементом искусственной нейронной сети является нейрон. Соединенные между собой нейроны образуют слои, количество которых может варьироваться в зависимости от сложности нейронной сети и решаемых ею задач. Способность нейронных сетей к генерализации, то есть к принятию верного решения для входных данных, которые не предъявлялись нейронной сети ранее, большое количество эвристических алгоритмов обучения нейронных сетей и устойчивость к различным флюктуациям входных данных –все это делает нейронные сети самым предпочтительным направлением для решения подобных задач.

Файлы: 1 файл

РЕФЕРАТ.docx

— 1.38 Мб (Скачать файл)

ВВЕДЕНИЕ

 

Многие направления науки, техники и производства в значительной степени ориентируются на развитие систем, в которых информация носит  характер поля (изображения). При обработке  такой информации возникает ряд  сложных научных, технических и  технологических проблем. Одной  из самых сложных задач является обработка и распознавание изображений. О важности этой проблемы говорит  тот факт, что исследования по распознаванию  образов, анализу изображений и речи включены в перечень приоритетных направлений развития науки и техники и критических технологий федерального уровня.

Распознавание изображений  находит широкое применение в  различных приложениях – это  может быть контроль топологии печатных плат, текстуры ткани, контроль доступа  к информации по идентификации личности (биометрическая идентификация), доступ к объектам ограниченного доступа, оперативный поиск в картотеке  изображений, дактилоскопия и др.

Для решения задачи распознавания  изображений используются различные методики, среди которых можно выделить подходы, основанные на нейронных сетях. Анализ методов показал, что для решения данной задачи эффективно использовать искусственные нейронные сети, в связи с тем, что они обеспечивают возможность получения классификатора, хорошо моделирующего сложную функцию распределения изображений, тем самым, увеличивая точность решения по сравнению с остальными методами.

   Сеть  нейронов,  образующая  человеческий  мозг,  представляет  собой высокоэффективную комплексную,  существенно-параллельную  систему обработки информации.  Она способна  организовать  свои  нейроны таким образом,  чтобы реализовать восприятие образа, его распознание во много раз быстрее, чем эти задачи будут решены самыми современными компьютерами. Так распознание знакомого лица происходит в мозге человека за 100-120 мс, в то время как компьютеру на это требуются минуты или даже часы. Сегодня, как и 40 лет назад, несомненно то, что мозг работает гораздо более эффективно и принципиально другим образом, чем любая вычислительная машина, созданная человеком. Именно этот факт в течении стольких лет побуждает и направляет работы ученых по воссозданию и исследованию нейронных сетей (НС).

Актуальность темы распознавания образа предмета с помощью нейронных сетей обусловлена  необходимостью  разработки программ  для  управления  автоматическими  системами,  участие  человека  в управлении  которыми  либо  невозможно,  либо  нецелесообразно.  К  таким системам  относятся  различные  системы  компьютерного  зрения,  системы теленаведения,  управления  летательными  аппаратами  и  тому  подобные.

Эффективность систем такого рода зависит от знаний, которыми они  обладают. Эти знания не только чисто  эмпирические (полученные опытным путем), но и эвристические – набор  правил и рекомендаций, которыми следует  пользоваться в  той  или  иной  ситуации,  возникающей  в  данной  предметной  области. Основным  критерием  при  разработке  подобных  систем  является  их автономность при принятии решений. То есть, для принятия решений  система может использовать лишь данные, полученные из окружающей среды, а также определенные правила  и алгоритмы, запрограммированные  заранее.

Создание таких программных  систем приводит к необходимости  решения класса задач, ранее  решаемых  при  непосредственном  участии  человека-эксперта.  К подобным задачам  относится задача по распознаванию  образов предметов. Под образом  предмета понимается отражение свойств  реального объекта, в общем случае неполное. Это отражение дает исходные данные для  задачи. Решение задачи  распознавания  есть  отнесение  исходных  данных  к  определенному  классу, то есть установление предмета, образом которого являются исходные данные. Задачи распознавания образов  обладают следующими свойствами: 

  • невозможность  алгоритмического  решения  (в  силу  плохой формализуемости самих задач или огромных затрат машинного времени);
  • противоречивость,  неполнота,  возможная  ошибочность  исходных данных; 
  • огромная размерность  данных, плохо представимых  в  какой-либо наглядной форме;
  • динамически меняющийся  состав  данных  (в  силу постоянного их пополнения, изменения и развития); 
  • необходимость  широкого  использования  в  процессе  решений эвристических  и  эмпирических  процедур,  сформулированных экспертами; 
  • необходимость  участия  в  процессе  решения  человека (пользователя),  который  путем  ответа  на  дополнительно  задаваемые вопросы  привносит  дополнительную  информацию  и  выбирает альтернативные пути принятия решения. 

Поэтому  для  решения  задач  распознавания  невозможно  применять  обычные методы  с  жесткими  алгоритмами и ограничениями. Автоматическая  система, решающая такие задачи должна не программироваться, а обучаться.

В задачах обнаружения  сигналов на фоне помех значительное развитие получили статистические методы, которые успешно используются при  анализе и синтезе радиотехнических, радиолокационных и гидроакустических  систем. Эти методы стали применяться  и в оптических и оптико-электронных  системах для распознавания образов. Однако теория приема оптических сигналов на фоне сильных помех и принятие решения по ним еще не достаточно полно разработана и не всегда дает ответ. Поэтому для решения  задач распознавания образов  в последнее время наиболее часто  применяются методы на основе нейронных  сетей.

Нейронные сети представляют собой математическую модель функционирования биологических нейронных сетей  –сетей нервных клеток живого организма. Как и в биологической нейронной сети, основным элементом искусственной нейронной сети является нейрон. Соединенные между собой нейроны образуют слои, количество которых может варьироваться в зависимости от сложности нейронной сети и решаемых ею задач. Способность нейронных сетей к генерализации, то есть к принятию верного решения для входных данных, которые не предъявлялись нейронной сети ранее, большое количество эвристических алгоритмов обучения нейронных сетей и устойчивость к различным флюктуациям входных данных –все это делает нейронные сети самым предпочтительным направлением для решения подобных задач.

Нейронные сети в каком-то смысле являются имитациями мозга, поэтому с их помощью  успешно решаются разнообразные "нечеткие" задачи - распознавание образов, речи, рукописного текста, выявление закономерностей, классификация, прогнозирование. С помощью нейронных сетей можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту.

В таких задачах, где традиционные технологии бессильны, нейронные сети часто выступают как единственная эффективная методика решения.

 

 

 

 

 

 

 

 

 

 

 

 

 

1 ИСТОРИЯ ВОПРОСА

 

Объект в распознавании  образов описывается совокупностью  основных характеристик (признаков, свойств). Основные характеристики могут иметь  различную природу: они могут  браться из упорядоченного множества  типа вещественной прямой, либо из дискретного  множества (которое, впрочем, так же может быть наделено структурой). Такое  понимание объекта согласуется  как потребностью практических приложений распознавания образов, так и  с нашим пониманием механизма  восприятия объекта человеком. Действительно, мы полагаем, что при наблюдении (измерении) объекта человеком, сведения о нем поступают по конечному  числу сенсоров (анализируемых каналов) в мозг, и каждому сенсору можно  сопоставить соответствующую характеристику объекта. Помимо признаков, соответствующих  нашим измерениям объекта, существует так же выделенный признак, либо группа признаков, которые мы называем классифицирующими  признаками, и в выяснении их значений при заданном векторе Х и состоит  задача, которую выполняют естественные и искусственные распознающие системы.

Понятно, что для того, чтобы установить значения этих признаков, необходимо иметь информацию о том, как связаны известные признаки с классифицирующими. Информация об этой связи задается в форме прецедентов, то есть множества описаний объектов с известными значениями классифицирующих признаков. И по этой прецедентной информации и требуется построить решающее правило, которое будет ставить произвольному описанию объекта значения его классифицирующих признаков.

Такое понимание задачи распознавания  образов утвердилось в науке начиная с 50-х годов прошлого века. И тогда же было замечено, что такая постановка вовсе не является новой. С подобной формулировкой сталкивались и уже существовали вполне не плохо зарекомендовавшие себя методы статистического анализа данных, которые активно использовались для многих практических задач, таких как, например, техническая диагностика. Поэтому первые шаги распознавания образов прошли под знаком статистического подхода, который и диктовал основную проблематику.

Статистический подход основывается на идее, что исходное пространство объектов представляет собой вероятностное  пространство, а признаки (характеристики) объектов являют собой случайные  величины, заданные на нем. Тогда задача исследователя данных состояла в том, чтобы из некоторых соображений выдвинуть статистическую гипотезу о распределении признаков, а точнее о зависимости классифицирующих признаков от остальных. Статистическая гипотеза, как правило, представляла собой параметрически заданное множество функций распределения признаков.

Тем не менее, существует серьезная аргументация в пользу того, что задачи распознавания образов не сводятся к статистике. Любую такую задачу, в принципе, можно рассматривать со статистической точки зрения и результаты ее решения могут интерпретироваться статистически. Для этого необходимо лишь предположить, что пространство объектов задачи является вероятностным. Но с точки зрения инструментализма, критерием удачности статистической интерпретации некоторого метода распознавания может служить лишь наличие обоснования этого метода на языке статистики как раздела математики. Под обоснованием здесь понимается выработка основных требований к задаче, которые обеспечивают успех в применении этого метода. Однако на данный момент для большей части методов распознавания, в том числе и для тех, которые напрямую возникли в рамках статистического подхода, подобных удовлетворительных обоснований не найдено.

Итого, вопреки стремлениям  статистиков рассматривать распознавание  образов как раздел статистики, в  практику и идеологию распознавания  входили совершенно другие идеи. Одна из них была вызвана исследованиями в области распознавания зрительных образов.

Как уже отмечалось, в  повседневной жизни люди постоянно  решают (зачастую бессознательно) проблемы распознавания различных ситуаций, слуховых и зрительных образов. Подобная способность для ЭВМ представляет собой в лучшем случае дело будущего. Отсюда некоторыми пионерами распознавания образов был сделан вывод, что решение этих проблем на ЭВМ должно в общих чертах моделировать процессы человеческого мышления. Наиболее известной попыткой подойти к проблеме с этой стороны было знаменитое исследование Ф. Розенблатта по перцептронам [8, c. 183].

К середине 50-х годов казалось, что нейрофизиологами были поняты физические принципы работы мозга. Отталкиваясь от этих открытий, Ф.Розенблатт разработал модель обучения распознаванию зрительных образов, названную им персептроном.

 

Рис 1. Схема Персептрона

 

На входе персептрон получает вектор объекта, который в работах  Розенблатта представлял собой бинарный вектор, показывавший, какой из пикселей экрана зачернен изображением, а какой нет. Далее каждый из признаков подается на вход нейрона, действие которого представляет собой простое умножение на некоторый вес нейрона. Результаты подаются на последний нейрон, который их складывает и общую сумму сравнивает с некоторым порогом. В зависимости от результатов сравнения входной объект Х признается нужным образом либо нет. Тогда задача обучения распознаванию образов состояла в таком подборе весов нейронов и значения порога, чтобы персептрон давал на прецедентных зрительных образах правильные ответы. Розенблатт полагал, что получившаяся функция будет неплохо распознавать нужный зрительный образ даже если входного объекта и не было среди прецедентов. Из бионических соображений им так же был придуман и метод подбора весов и порога. Его подход оказался успешным в ряде задач распознавания и породил собой целое направление исследований алгоритмов обучения, основанных на нейронных сетях, частным случаем которых и является персептрон.

Далее были придуманы различные  обобщения персептрона, функция  нейронов была усложнена: нейроны теперь могли не только умножать входные  числа или складывать их и сравнивать результат с порогами, но применять  по отношению к ним более сложные  функции. На рисунке 2 изображено одно из подобных усложнений нейрона:

Рис. 2 Схема нейронной  сети.

Усложнения приводили  к увеличению числа настраиваемых  параметров при обучении, но при  этом увеличивали возможность настраиваться  на очень сложные закономерности. Исследования в этой области сейчас идут по двум тесно связанным направлениям - изучаются и различные топологии сетей, и различные методы настроек.

Информация о работе Распознавание изображений с помощью нейронных сетей