Количество информации. Методы оценки

Автор работы: Пользователь скрыл имя, 20 Марта 2015 в 19:30, реферат

Описание работы

Понимая информацию как один из основных стратегических ресурсов, без которого невозможна деловая, управленческая, вообще любая социально значимая деятельность, необходимо уметь оценивать ее как с качественной, так и с количественной стороны. На этом пути существуют большие проблемы из-за нематериальной природы этого ресурса и субъективности восприятия конкретной информации различными индивидуумами человеческого общества

Содержание работы

Введение 3
Количество информации. Методы оценки 4
Заключение 19
Список использованной литературы 20

Файлы: 1 файл

Poisk_i_obrabotka_ehkon._informacii_sredstvami_interneta.docx

— 111.95 Кб (Скачать файл)

Министерство сельского хозяйства Российской Федерации

ФГБОУ ВПО Новосибирский государственный аграрный университет

Институт заочного образования и повышения квалификации

Кафедра дистанционных и комбинированных образовательных технологий

 

 

 

 

 

РЕФЕРАТ

 

по дисциплине

Поиск и обработка экономической информации средствами интернета

 

На тему: Количество информации. Методы оценки.

 

 

 

 

 

 

 

 

 

 

Выполнила: студентка 1 курса 4241 гр.

Чернова (Кондрашова) А.И.

Шифр УБ - 13014

 

Проверил:

 


 

 

 

 

 

 

 

 

Новосибирск. 2014

 

Содержание

Введение 3

Количество информации. Методы оценки 4

Заключение 19

Список использованной литературы 20

 

Введение

Существование современного общества немыслимо без его основного ресурса – информации. Информация - это отражение внешнего мира с помощью знаков или сигналов. Информационная ценность сообщения заключается в новых сведениях, которые в нем содержатся (в уменьшении незнания).

Понимая информацию как один из основных стратегических ресурсов, без которого невозможна деловая, управленческая, вообще любая социально значимая деятельность, необходимо уметь оценивать ее как с качественной, так и с количественной стороны. На этом пути существуют большие проблемы из-за нематериальной природы этого ресурса и субъективности восприятия конкретной информации различными индивидуумами человеческого общества. С этой точки зрения классификация информации является важнейшим средством создания систем хранения и поиска информации, без которых сегодня невозможно эффективное функционирование информационного обеспечения управления.

Главной целью настоящей работы является рассмотрение классификации информации и методов ее количественной оценки. Для этого нужно рассмотреть следующие задачи и вопросы. Первой задачей является изучение общих понятий по данной теме. Рассмотрение конкретных классификационных методов и методов количественной оценки информации – вторая задача.

 

Количество информации. Методы оценки

1. Информация. Классификация информации

Термин информация происходит от латинского «informatio», что означает разъяснение, осведомление, изложение. С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). В широком смысле информация - это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.

Согласно федеральному закону «Об информации, информатизации и защите информации» сегодня под информацией понимается «сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления»[1]. Вся информация объединяется в информационные системы – «организационно упорядоченные совокупности документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы».

Классификация – это «разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами»[2]. Классификация фиксирует закономерные связи между классами объектов с целью определения места объекта в системе, которое указывает на его свойства. Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов – та процедура группировки на качественном уровне, направленная на выделение однородных свойств.

Применительно к информации как к объекту классификации выделенные классы называют информационными объектами. С этой точки зрения классификация информации является важнейшим средством создания систем хранения и поиска информации, без которых сегодня невозможно эффективное функционирование информационного обеспечения управления. Классификация носит всеобщий характер вследствие той роли, которую она играет как инструмент научного познания, прогнозирования и управления. Одновременно классификация выполняет функцию объективного отражения фиксации результатов этого познания. При этом характер классификационной схемы, состав признаков классификации и глубина классификации определяется теми практическими целями, для реализации которых используется классификация, типом объектов классификации, а также условиями, в которых классификация будет использоваться.

Создание в России единого информационного пространства и объединение его с европейским и мировым информационным пространством давно уже стало одной из важнейших задач, от решения которых во многом зависит дальнейшее развитие страны. Решение же этой задачи возможно только при условии гармонизации российских и зарубежных информационных систем и обеспечении информационной совместимости всех взаимодействующих информационных систем. Под информационной совместимостью понимается взаимное соответствие различных частей на стыках, позволяющее объединять их друг с другом, что обеспечивает функционирование системы как единого целого. Достижении информационной совместимости обеспечивается унификацией и стандартизацией средств информационной техники, носителей информации, языка формализованного описания данных, структуры информационных систем и технологических процессов в них. И для осуществления всех этих задач необходима классификация информации, которая осуществляется при помощи методов классификации.[9]

 

2. Методы  классификации

Рис. 1. Иерархический метод информации.

Используются два метода классификации информации: иерархический и фасетный. Первый из этих методов – иерархический, является более традиционным, при использовании иерархического метода происходит «последовательное разделение множества объектов на подчиненные, зависимые классификационные группировки». Получаемая на основе этого классификационная схема имеет иерархическую структуру. В ней первоначальный объём классифицируемых объектов детализируется на каждой следующей ступени классификации. В общем виде иерархическую классификационную схему можно представить в следующем виде:

Классификационные схемы, построенные на основе иерархического принципа, имеют неограниченную ёмкость, величина которой зависит от глубины классификации, числа ступеней деления и количества объектов классификации, которое можно расположить на каждой ступени. Количество же объектов на каждой ступени классификации определяется основанием кода, то есть числом знаков в алфавите кода. Выбор необходимой глубины классификации и структуры кода зависит от характера объектов классификации и характера задач, для решения которых предназначен классификатор.[3]

Серьёзным недостатком иерархического метода классификации является жесткость классификационной схемы. Она обусловлена заранее установленным выбором признаков классификации и порядком их использования по ступеням классификации. Это ведёт к тому, что при изменении состава объектов классификации, их характеристик или характера решаемых при помощи классификатора задач требуется коренная переработка классификационной схем, поэтому при разработке классификаторов следует учитывать, что иерархический метод классификации более предпочтителен для объектов с относительно стабильными признаками и для решения стабильного комплекса задач.

К классификационным схемам, построенным на основе иерархического метода классификации, предъявляются определенные требования, соблюдение которых повышает их качество и эффективность применения. Первым таким требованием является непересекаемость классификационных группировок, расположенных на одной ступени классификации. Это означает, что классификационные группировки, расположенные на одной и той же ступени классификации, не должны включать аналогичных понятий.

Второе общее правило заключается в том, что для разделения любой классификационной группировки на подчиненные группировки должен использоваться только один признак. Но это требование соблюдается только при использовании последовательного метода кодирования, при использовании же параллельного метода кодирования на определенной ступени классификации при иерархическом методе классификации могут одновременно использоваться несколько признаков, выбор которых определяется характером решаемых задач.

Третьим требованием к иерархическому методу классификации является логичность и последовательность деления группировок на нижестоящие и полнота этого деления. В соответствии с этим требованием на верхних ступенях классификации должны использоваться признаки, к которым в дальнейшем будет обращено наибольшее число запросов. Полнота деления означает, что сумма подмножества всегда должна давать делимое множество объектов, не должна оставаться какая-то часть объектов, не вошедшая в состав классификационных группировок.

Вместе с этим у иерархического метода классификации есть достоинства, которые обеспечили ему широкое использование в различных классификационных схемах.

В современных классификационных схемах широко используется и второй метод классификации – фасетный метод. Под этим методом понимается «параллельное разделение множества объектов на независимые классификационные группировки»[4]. При этом методе классификации заранее жесткой классификационной схемы и конечных группировок не создается. Разрабатывается лишь система таблиц признаков объектов классификации, называемых фасетами, при необходимости создания классификационной группировки для решения конкретной задачи осуществляется выборка необходимых признаков из фасетов и их объединение в определенной последовательности. В общем виде фасетную классификационную схему можно представить в следующем виде:

Рис.2. Фасетный метод информации.

Такой принцип построения классификационных группировок делает классификатор на основе фасетного метода классификации очень гибким, хорошо приспособленным для использования в условиях большой динамичности характера решаемых задач. При изменении характера задач или характеристик объектов классификации разрабатываются новые фасеты или дополняются новыми признаками уже существующие фасеты без коренной перестройки структуры всего классификатора.

При разработке классификаторов на основе фасетного метода классификации также должны соблюдаться определенные правила, основным из которых является соблюдение принципа непересекаемости фасетов. В соответствии с этим правилом состав признаков одного фасета не должен повторяться в других фасетах этого же классификатора. Вторым правилом является включение в состав классификатора только таких фасетов и признаков в них, которые необходимы для решения конкретных задач.

В современных классификационных схемах часто одновременно используются оба метода классификации, это обеспечивает возможность снизить влияние недостатков методов классификации и расширить возможность использования классификатора как конкретной формы реализации классификации информации в информационном обеспечении управления.[7,8]

 

3. Методы оценки количества информации

Комбинаторный подход

Пусть переменное x способно принимать значения, принадлежащие конечному множеству X, которое состоит из N элементов. Говорят, что энтропия переменного равна

Указывая определенное значение x=a переменного x, мы «снимаем» эту энтропию, сообщая информацию

Если переменные x1,x2,...,xk  способны независимо пробегать множества, которые состоят соответственно из N1,N2,...,Nk элементов, то

Для передачи количества информации I приходится употреблять

двоичных знаков. Например, число различных «слов», состоящих из k нулей и единиц и одной двойки, равно 2k (k + 1), поэтому количество информации в такого рода сообщении равно

т.е. для «кодирования» такого рода слов в чистой двоичной системе требуется (всюду далее f≈g обозначает, что разность f-g ограничена, а f~g, что отношение f:g стремится к единице)

нулей и единиц.

Посмотрим теперь, в какой мере чисто комбинаторный подход позволяет оценить «количество информации», содержащееся в переменном x относительно связанного с ним переменного y. Связь между переменными x и y, пробегающими соответственно множества X и Y , заключается в том, что не все пары x, y, принадлежащие прямому произведению X.Y , являются «возможными». По множеству возможных пар U определяются при любом a X множества Ya тех y, для которых (a; y) U.

 
x

 
y

 
1

 
2

 
3

 
4

 
1

 
+

 
+

 
+

 
+

 
2

 
+

 

 
+

 

 
3

 

 
+

 

 


Рис. 3. Комбинаторный подход. Статистическая разноска.

Естественно определить условную энтропию равенством

а информацию в x относительно y−формулой

Например, в случае, изображенном в таблице имеем

Понятно, что H(y|x) и I(x:y) являются функциями от x (в то время как y входит в их обозначение в виде «связанного переменного»). Без труда вводится в чисто комбинаторной концепции представление о «количестве информации, необходимом для указания объекта x при заданных требованиях к точности указания». Очевидно,

Информация о работе Количество информации. Методы оценки