Сравнение современных зарубежных информационных систем управления базами данных (DBMS)

Автор работы: Пользователь скрыл имя, 18 Декабря 2013 в 22:42, реферат

Описание работы

Цель работы – сравнительный анализ отечественных систем DM.
Для достижения поставленной цели были выполнены следующие задачи:
Рассмотрены теоретические аспекты технологий интеллектуального анализа данных;
Подробно рассмотрены семь самых известных российских программ data mining
Сравнительная оценка рассмотренных систем.

Содержание работы

Введение 3
Глава 1. Общие сведения о системах Data Mining 4
1.1. Что такое Data Mining 4
1.2. Классы систем Data Mining 6
Глава 2. Российские пакеты интеллектуального анализа данных 11
2.1. Система PolyAnalyst 11
2.2. Аналитическая платформа Deductor 13
2.3. Excel Neural Package 16
2.4. Модульный анализ и конструирование социума (МАКС) 17
2.5. Контент - Анализ Про 18
2.6. STADIA 19
2.7. NeuroShell 21
Заключение 23
Список литературы 24

Файлы: 1 файл

СУБД.doc

— 281.50 Кб (Скачать файл)

Санкт-Петербургский государственный  электротехнический университет «ЛЭТИ»

им. Ульянова (Ленина)

 

кафедра ПЭ

 

 

 

 

 

Реферат

 

на тему

«Сравнение современных зарубежных информационных систем управления базами данных (DBMS)»

 

 

 

 

 

                                                                                                                                            Выполнил:

 

                                                                                                                                            Проверил:

 

 

 

 

 

Санкт-Петербург

2012

 

Оглавление

 

Введение

В эру информационных и компьютерных технологий, в которой мы живем, создается  все больше и больше эмпирических баз данных. Все мы чаще сталкиваемся с проблемой анализа больших массивов информации. Ранее для исследования больших массивов данных использовался пакетный режим статистического анализа, который предполагает специализированную математическую подготовку, включающую как знание статистического анализа, так и знания по конкретным дисциплинам. Отсутствие соответствующей подготовки может привести к тому, что собранные данные будут проанализированы поверхностно, в то время как многие полезные, но не очевидные закономерности будут не замечены.

Компьютерные системы Data Mining (DM) используются для обнаружения в базах данных ранее неизвестных, нетривиальных  и практически полезных интерпретаций  знаний, упрощающих процесс принятия решений в различных сферах человеческой деятельности. Целью систем DM является автоматический интеллектуальный анализ и извлечение неочевидных знаний из больших объемов информации за минимальное время.

Основными методами интеллектуального  анализа данных считаются классификация, моделирование и прогнозирование, основанные на применении следующих принципов: эволюционного программирования; деревьев решений; ассоциативной памяти и нечёткой логики; искусственных нейронных сетей; генетических алгоритмов. В данной работе особое внимание уделено статистическим методам интеллектуального анализа данных.

Актуальность данной работы заключается в составлении обзора отечественного программного обеспечения, реализующего методы DM, в связи со стремительным развитием разработок в сфере интеллектуального анализа данных.

Цель работы – сравнительный анализ отечественных систем DM.

Для достижения поставленной цели были выполнены следующие задачи:

    • Рассмотрены теоретические аспекты технологий интеллектуального анализа данных;
    • Подробно рассмотрены семь самых известных российских программ data mining
    • Сравнительная оценка рассмотренных систем.

Работа состоит из двух основных глав, первая из которых содержит в  себе обзор основных теоретических  аспектов, касающихся понятия интеллектуального  анализа данных, а так же методы применения такого анализа, а вторая – подробно описывает принципы и методы работы семи отечественных программ. Результатом данного анализа является итоговая таблица, представленная в Приложении 1.

 

Глава 1. Общие сведения о  системах Data Mining

    1. Что такое СУБД (DBMS)

 Система  управления базой данных (СУБД, DBMS - Database Management System) – это программное  обеспечение, с помощью которого  пользователи могут определять, создавать и поддерживать базу  данных, а также осуществлять  к ней контролируемый доступ. Можно сказать, что СУБД обеспечивает определение физической и логической структуры базы данных, ввод информации и доступ к ней.

Можно выделить 2 класса СУБД:

1) системы  общего назначения;

2) специализированные  системы.

Системы СУБД общего назначения не ориентированы на какую-либо конкретную предметную область или на информационные потребности конкретной группы пользователей. Реализуются как программный продукт, способный функционировать на некоторой модели ЭВМ в определенной операционной системе. Использование СУБД общего назначения в качестве инструментального средства для создания информационных систем, основанных на технологии баз данных, позволяет существенно сокращать сроки разработки и экономить трудовые ресурсы.

В процессе реализации своих функций СУБД постоянно взаимодействует с базой данных и с другими прикладными программными продуктами пользователя.

Система управления базами данных предоставляет возможность  контролировать задание структуры  и описание данных, работу с ними и организацию коллективного пользования информацией. СУБД также существенно увеличивает возможности и облегчает каталогизацию и ведение больших объемов хранящейся в многочисленных таблицах информации. СУБД включает в себя три основных типа функций: определение (задание структуры и описание) данных, обработки данных и управление данными.

Определение данных. Определяется, какая именно информация будет храниться в  базе данных, задается структура данных  и их тип (например, количество цифр или символов), а также указывается  то, как данные будут связаны между собой. Задаются форматы и критерии проверки данных.

Обработка данных. Данные можно обрабатывать самыми различными способами. Можно выбирать любые  поля, фильтровать и сортировать  данные. Можно объединять данные с  другой связанной информацией и вычислять итоговые значения.

Управление  данными. Указываются правила доступа  к данным, их корректировки и добавления новой информации. Можно также  определить правила коллективного  пользования данными.

Современные СУБД имеют следующие возможности:

1) включают  язык определения данных, с помощью  которого можно определить базу  данных, ее структуру, типы данных, а также средства задания ограничения  для хранимой информации;

2) позволяют  вставлять, удалять, обновлять  и извлекать информацию из  базы данных посредством языка запросов (SQL);

3) большинство  СУБД могут работать на компьютерах  с разной архитектурой и под  разными операционными системами;

4) многопользовательские  СУБД имеют развитые средства  администрирования баз данных.

В работе с  СУБД возможны следующие режимы: создание, редактирование, поиск, манипулирование. Под манипулированием понимаются такие действия с БД, как с целым: просмотр; копирование файлов, например на бумажный носитель; сортировка данных по заданному признаку и т. д.

Для работы с базой данных СУБД должна обеспечивать:

• возможность  внесения и чтения информации;

• работу с  большим объемом данных;

• быстроту поиска данных;

• целостность  данных (их непротиворечивость);

• защиту от разрушения, уничтожения (не только при  случайных ошибках пользователя), от несанкционированного доступа;

• систему  дружественных подсказок (в расчете  на пользователя без специальной  подготовки).

СУБД могут  использоваться как в однопользовательском, так и в многопользовательском  режиме.

На рынке  программного обеспечения можно выделить такие наиболее востребованные СУБД, как Microsoft Access, Visual FoxPro, Borland dBase, Borland Paradox, Oracle, MySQL. Также хотелось бы отдельно выделить Российскую СУБД Линтер -  единственную систему управления базами данных, которая была полностью разработана в России и широко используется.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 2. Российские пакеты интеллектуального анализа данных

Главной и отличительной чертой российских пакетов интеллектуального анализа данных от западных является их ориентация на отечественных пользователей. Следствием этого является их простота освоения для русского пользователя, продуманный интерфейс, более содержательная и понятная контекстная подсказка о сути предоставленных в программах статистических методов. Одна из причин такого различия – ориентация создателей зарубежных пакетов на западную культурно-информационную среду, отличающуюся от российской в следующих аспектах:

• более высокая статистическая подготовка у пользователей, закладываемая обязательным изучением прикладной статистики и методов анализа данных практически во всех университетах, школах бизнеса и технических колледжах;

• многочисленная специальная и популярная литература по анализу данных, которую можно найти в любом книжном магазине;

• наличие многочисленных консультационных фирм, где по телефону можно получить исчерпывающую консультацию по применению вычислительных методов, а при необходимости — заказать решение более сложных проблем.

И хотя есть определённый набор программ, уже популярных в России, периодически на выставках и семинарах можно встретить и новые программы анализа данных.

2.1. Система MICROSOFT ACCESS

Access— мощное  приложение Windows; впервые производительность  СУБД органично сочетается с  теми удобствами, которые имеются  в распоряжении пользователей Microsoft Windows. Поскольку оба эти продукта— детища компании Microsoft, они прекрасно взаимодействуют между собой. При всем этом Access — не просто СУБД. Как реляционная СУБД Access обеспечивает доступ ко всем типам данных и позволяет использовать одновременно несколько таблиц базы данных. При этом можно существенно упростить структуру данных, облегчая тем самым выполнение поставленных задач. Таблицу Access можно связать с данными, хранящимися на большой ЭВМ или на сервере. Первая версия СУБД Access появилась в начале 90-х годов. Это была первая настольная реляционная СУБД для 16-разрядной версии Windows. Популярность Access значительно возросла после включения этой СУБД в состав Microsoft Office.

Access ориентирован  в первую очередь на пользователей Microsoft Office, в том числе и не знакомых с программированием. Это, в частности, проявилось в том, что вся информация, относящаяся к конкретной базе данных, а именно таблицы, индексы (естественно, поддерживаемые), правила ссылочной целостности, бизнес-правила, список пользователей, а также формы и отчеты хранятся в одном файле, что в целом удобно для начинающих пользователей.

Последняя версия этой СУБД - Access 2010 входит в состав Microsoft Office 2010 Professional и Premium, а также доступна как самостоятельный продукт. В состав Access 2010 входят:

-средства  манипуляции данными Access и данными,  доступными через ODBC (последние  могут быть <присоединены> к базе  данных Access);

-средства  создания форм, отчетов и приложений; при этом отчеты могут быть экспортированы в формат Microsoft Word или Microsoft Excel, а для создания приложений используется Visual Basic for Applications, общий для всех составных частей Microsoft Office;

-средства  публикации отчетов в Internet;

-средства  создания интерактивных Web-приложений для работы с данными (Data Access Pages);

-средства  доступа к данным серверных  СУБД через OLE DB;

-средства  создания клиентских приложений  для Microsoft SQL Server;

-средства  администрирования Microsoft SQL Server.

Поддержка COM в Access выражается в возможности использовать элементы управления ActiveX в формах и Web-страницах, созданных с помощью Access. Иными словами, Microsoft Access может быть использован, с одной стороны, в качестве настольной СУБД и составной части офисного пакета, а с другой стороны, в качестве клиента Microsoft SQL Server, позволяющего осуществлять его администрирование, манипуляцию его данными и создание приложений для этого сервера.

Помимо манипуляции  данными Microsoft SQL Server, Access 2010 позволяет также в качестве хранилища данных использовать Microsoft Data Engine (MSDE), представляющий собой по существу настольный сервер баз данных, совместимый с Microsoft SQL Server.

2.2. VISUAL FOXPRO

FoxPro ведет  свое происхождение от настольной  СУБД FoxBase фирмы Fox Software. Разрабатывая FoxBase в конце 80-х годов, эта компания преследовала цель создать СУБД, функционально совместимую с dBase с точки зрения организации файлов и языка программирования, но существенно превышающую ее по производительности. Одним из способов повышения производительности являлась более эффективная организация индексных файлов, нежели в dBase, - по формату индексных файлов эти две СУБД несовместимы между собой.

Информация о работе Сравнение современных зарубежных информационных систем управления базами данных (DBMS)