Сравнение современных зарубежных информационных систем управления базами данных (DBMS)
Реферат, 18 Декабря 2013, автор: пользователь скрыл имя
Описание работы
Цель работы – сравнительный анализ отечественных систем DM.
Для достижения поставленной цели были выполнены следующие задачи:
Рассмотрены теоретические аспекты технологий интеллектуального анализа данных;
Подробно рассмотрены семь самых известных российских программ data mining
Сравнительная оценка рассмотренных систем.
Содержание работы
Введение 3
Глава 1. Общие сведения о системах Data Mining 4
1.1. Что такое Data Mining 4
1.2. Классы систем Data Mining 6
Глава 2. Российские пакеты интеллектуального анализа данных 11
2.1. Система PolyAnalyst 11
2.2. Аналитическая платформа Deductor 13
2.3. Excel Neural Package 16
2.4. Модульный анализ и конструирование социума (МАКС) 17
2.5. Контент - Анализ Про 18
2.6. STADIA 19
2.7. NeuroShell 21
Заключение 23
Список литературы 24
Файлы: 1 файл
СУБД.doc
— 281.50 Кб (Скачать файл)Санкт-Петербургский
им. Ульянова (Ленина)
кафедра ПЭ
Реферат
на тему
«Сравнение современных зарубежных информационных систем управления базами данных (DBMS)»
Санкт-Петербург
2012
Оглавление
Введение
В эру информационных и компьютерных технологий, в которой мы живем, создается все больше и больше эмпирических баз данных. Все мы чаще сталкиваемся с проблемой анализа больших массивов информации. Ранее для исследования больших массивов данных использовался пакетный режим статистического анализа, который предполагает специализированную математическую подготовку, включающую как знание статистического анализа, так и знания по конкретным дисциплинам. Отсутствие соответствующей подготовки может привести к тому, что собранные данные будут проанализированы поверхностно, в то время как многие полезные, но не очевидные закономерности будут не замечены.
Компьютерные системы Data Mining (DM) используются для обнаружения в базах данных ранее неизвестных, нетривиальных и практически полезных интерпретаций знаний, упрощающих процесс принятия решений в различных сферах человеческой деятельности. Целью систем DM является автоматический интеллектуальный анализ и извлечение неочевидных знаний из больших объемов информации за минимальное время.
Основными методами интеллектуального анализа данных считаются классификация, моделирование и прогнозирование, основанные на применении следующих принципов: эволюционного программирования; деревьев решений; ассоциативной памяти и нечёткой логики; искусственных нейронных сетей; генетических алгоритмов. В данной работе особое внимание уделено статистическим методам интеллектуального анализа данных.
Актуальность данной работы заключается в составлении обзора отечественного программного обеспечения, реализующего методы DM, в связи со стремительным развитием разработок в сфере интеллектуального анализа данных.
Цель работы – сравнительный анализ отечественных систем DM.
Для достижения поставленной цели были выполнены следующие задачи:
- Рассмотрены теоретические аспекты технологий интеллектуального анализа данных;
- Подробно рассмотрены семь самых известных российских программ data mining
- Сравнительная оценка рассмотренных систем.
Работа состоит из двух основных глав, первая из которых содержит в себе обзор основных теоретических аспектов, касающихся понятия интеллектуального анализа данных, а так же методы применения такого анализа, а вторая – подробно описывает принципы и методы работы семи отечественных программ. Результатом данного анализа является итоговая таблица, представленная в Приложении 1.
Глава 1. Общие сведения о системах Data Mining
Что такое СУБД (DBMS)
Система
управления базой данных (СУБД, DBMS
- Database Management System) – это программное
обеспечение, с помощью которого
пользователи могут определять,
создавать и поддерживать базу
данных, а также осуществлять
к ней контролируемый доступ. Можно сказать, что СУБД обеспечивает
определение физической и логической
структуры базы данных, ввод информации
и доступ к ней.
Можно выделить 2 класса СУБД:
1) системы общего назначения;
2) специализированные системы.
Системы СУБД общего назначения не ориентированы на какую-либо конкретную предметную область или на информационные потребности конкретной группы пользователей. Реализуются как программный продукт, способный функционировать на некоторой модели ЭВМ в определенной операционной системе. Использование СУБД общего назначения в качестве инструментального средства для создания информационных систем, основанных на технологии баз данных, позволяет существенно сокращать сроки разработки и экономить трудовые ресурсы.
В процессе реализации своих функций СУБД постоянно взаимодействует с базой данных и с другими прикладными программными продуктами пользователя.
Система управления базами данных предоставляет возможность контролировать задание структуры и описание данных, работу с ними и организацию коллективного пользования информацией. СУБД также существенно увеличивает возможности и облегчает каталогизацию и ведение больших объемов хранящейся в многочисленных таблицах информации. СУБД включает в себя три основных типа функций: определение (задание структуры и описание) данных, обработки данных и управление данными.
Определение данных. Определяется, какая именно информация будет храниться в базе данных, задается структура данных и их тип (например, количество цифр или символов), а также указывается то, как данные будут связаны между собой. Задаются форматы и критерии проверки данных.
Обработка данных. Данные можно обрабатывать самыми различными способами. Можно выбирать любые поля, фильтровать и сортировать данные. Можно объединять данные с другой связанной информацией и вычислять итоговые значения.
Управление данными. Указываются правила доступа к данным, их корректировки и добавления новой информации. Можно также определить правила коллективного пользования данными.
Современные СУБД имеют следующие возможности:
1) включают
язык определения данных, с помощью
которого можно определить базу
данных, ее структуру, типы данных,
а также средства задания ограничения
для хранимой информации;
2) позволяют вставлять, удалять, обновлять и извлекать информацию из базы данных посредством языка запросов (SQL);
3) большинство
СУБД могут работать на компьютерах
с разной архитектурой и под
разными операционными системами;
4) многопользовательские СУБД имеют развитые средства администрирования баз данных.
В работе с СУБД возможны следующие режимы: создание, редактирование, поиск, манипулирование. Под манипулированием понимаются такие действия с БД, как с целым: просмотр; копирование файлов, например на бумажный носитель; сортировка данных по заданному признаку и т. д.
Для работы с базой данных СУБД должна обеспечивать:
• возможность внесения и чтения информации;
• работу с большим объемом данных;
• быстроту поиска данных;
• целостность данных (их непротиворечивость);
• защиту от разрушения, уничтожения (не только при случайных ошибках пользователя), от несанкционированного доступа;
• систему дружественных подсказок (в расчете на пользователя без специальной подготовки).
СУБД могут использоваться как в однопользовательском, так и в многопользовательском режиме.
На рынке программного обеспечения можно выделить такие наиболее востребованные СУБД, как Microsoft Access, Visual FoxPro, Borland dBase, Borland Paradox, Oracle, MySQL. Также хотелось бы отдельно выделить Российскую СУБД Линтер - единственную систему управления базами данных, которая была полностью разработана в России и широко используется.
Глава 2. Российские пакеты интеллектуального анализа данных
Главной и отличительной чертой российских пакетов интеллектуального анализа данных от западных является их ориентация на отечественных пользователей. Следствием этого является их простота освоения для русского пользователя, продуманный интерфейс, более содержательная и понятная контекстная подсказка о сути предоставленных в программах статистических методов. Одна из причин такого различия – ориентация создателей зарубежных пакетов на западную культурно-информационную среду, отличающуюся от российской в следующих аспектах:
• более высокая статистическая подготовка у пользователей, закладываемая обязательным изучением прикладной статистики и методов анализа данных практически во всех университетах, школах бизнеса и технических колледжах;
• многочисленная специальная и популярная литература по анализу данных, которую можно найти в любом книжном магазине;
• наличие многочисленных консультационных фирм, где по телефону можно получить исчерпывающую консультацию по применению вычислительных методов, а при необходимости — заказать решение более сложных проблем.
И хотя есть определённый набор программ, уже популярных в России, периодически на выставках и семинарах можно встретить и новые программы анализа данных.