Сравнение современных зарубежных информационных систем управления базами данных (DBMS)
Реферат, 18 Декабря 2013, автор: пользователь скрыл имя
Описание работы
Цель работы – сравнительный анализ отечественных систем DM.
Для достижения поставленной цели были выполнены следующие задачи:
Рассмотрены теоретические аспекты технологий интеллектуального анализа данных;
Подробно рассмотрены семь самых известных российских программ data mining
Сравнительная оценка рассмотренных систем.
Содержание работы
Введение 3
Глава 1. Общие сведения о системах Data Mining 4
1.1. Что такое Data Mining 4
1.2. Классы систем Data Mining 6
Глава 2. Российские пакеты интеллектуального анализа данных 11
2.1. Система PolyAnalyst 11
2.2. Аналитическая платформа Deductor 13
2.3. Excel Neural Package 16
2.4. Модульный анализ и конструирование социума (МАКС) 17
2.5. Контент - Анализ Про 18
2.6. STADIA 19
2.7. NeuroShell 21
Заключение 23
Список литературы 24
Файлы: 1 файл
СУБД.doc
— 281.50 Кб (Скачать файл)По сравнению с аналогичными версиями dBase, FoxBase и более поздняя версия этого продукта, получившая название FoxPro, предоставляли своим пользователям несколько более широкие возможности, такие как использование деловой графики, генерация кода приложений, автоматическая генерация документации к приложениям и т.д.
Visual FoxPro является
системой управления реляционными
базами данных, которые в настоящее
время являются наиболее распространенными.
В данной версии реализованы
все атрибуты реляционных СУБД.
В Visual FoxPro существует понятие
базы данных, которая содержит совокупность таблиц.
В базе данных можно определить условия
целостности данных с помощью первичных
и внешних ключей таблиц. В Visual FoxPro реализованы
триггеры и хранимые процедуры, которые
позволяют централизованно обрабатывать
события, возникающие при любых изменениях
в базе данных.
Последняя версия этого продукта - Visual FoxPro 9.0, доступна и отдельно, и как составная часть Microsoft Visual Studio 9.0. Отличительной особенностью этой настольной СУБД от двух рассмотренных выше является интеграция этого продукта с технологиями Microsoft, в частности поддержка COM (Component Object Model - компонентная объектная модель, являющаяся основой функционирования 32-разрядных версий Windows и организации распределенных вычислений в этой операционной системе), интеграция с Microsoft SQL Server, возможности создания распределенных приложений, основанных на концепции Windows DNA (Distributed interNet Applications).
Visual Fox Pro 9.0 предоставляет следующие возможности:
• средства публикации данных в Internet и создания Web-клиентов;
• средства создания ASP-компонентов и Web-приложений;
• средства создания
COM-объектов и объектов для Microsoft Transaction
Server, позволяющих создавать масштабируемые
многозвенные приложения для обработки
данных;
• средства доступа к данным серверных СУБД, базирующиеся на использовании OLE DB (набор COM-интерфейсов, позволяющий осуществить унифицированный доступ к данным из разнообразных источников, в том числе из нереляционных баз данных и иных источников, например Microsoft Exchange);
• средства доступа к данным Microsoft SQL Server и Oracle, включая возможность создания и редактирования таблиц, триггеров, хранимых процедур;
• средства отладки хранимых процедур Microsoft SQL Server;
• средство визуального моделирования компонентов и объектов, являющиеся составными частями приложения - Visual Modeller;
• средство для управления компонентами приложений, позволяющее осуществлять их повторное использование.
Итак, тенденции развития этого продукта очевидны: из настольной СУБД Visual FoxPro постепенно превращается в средство разработки приложений в архитектуре <клиент/сервер> и распределенных приложений в архитектуре Windows DNA. Впрочем, эти тенденции в определенной степени характерны для всех наиболее популярных настольных СУБД - мы уже убедились, что и dBase, и Paradox также позволяют осуществлять доступ к наиболее популярным серверным СУБД.
2.3. Borland dBASE
dBASE для Windows представляет собой систему управления базами данных, доступную для пользователей любого уровня. Эта система обладает ориентированным на пользователя развитым диалоговым интерфейсом. В версии 5.0 этого продукта появилась возможность выполнение запроса по образцу. Запрос предоставляет пользователю возможность быстро и эффективно осуществить выборку требуемых данных и обработать их.
dBASE для Windows содержит как интерактивные средства так и интегрированную среду программирования на объектно-ориентированном языке dBASE. Многочисленные интерактивные средства отличает простота использования, которая достигается за счет интуитивного интерфейса. Эти средства предоставляют вам широчайшие возможности по обработке информации, не прибегая к программированию. Язык dBase является объектно-ориентированным, управляемым по событиям, визуально-программируеммым языком, с помощью которого вы сможете добавить программные коды к отдельным объектам форм и сами формам, а также создать отдельные библиотеки и законченные предложения (как сетевые, так и автономные).
Среди СУБД для ПК наиболее распространенным в мире является семейство dBASE фирмы "Ashton-Tate". Такая популярность объясняется отчасти исторически, так как эта СУБД появилась одной из первых на рынке программных продуктов данного профиля; не в меньшей степени этому способствовала удачность заложенных основ конструкции СУБД и командного языка. Одна из наиболее широко используемых (в настоящее время устаревших) версий этого семейства - dBASE III+.
В новой версии dBASE IV концепция СУБД и командный язык получили значительное развитие, позволившее устранить недостатки предыдущей версии, а также существенно обогатить палитру средств обработки данных и улучшить интерфейс пользователя.
В языке dBASE IV используются также функции, которые (наряду с командами) позволяют обрабатывать данные (в том числе, выполнять вычисления), а также определять состояния, например, находится ли указатель записей в конце файла: 7EOF0 - После имени функции обычно стоят круглые скобки, в которых могут помещаться аргументы. Функции нельзя использовать самостоятельно, а только вместе с какой-либо командой.
Кроме системных функций в dBASE IV можно использовать функции, созданные самим пользователем. В языке dBASE используются переменные, тип которых автоматически определяется первым в данной программе присвоением им значения. Возможные типы: символьный, логический, числовой, дата.
2.4. Модульный анализ и конструирование социума (МАКС)
В 1998 г. А.А. Давыдов и А.Н. Чураков разработали МАКС-3.0 – экспертно-диагностическую систему для анализа, диагностики, моделирования и прогнозирования строения и динамики социальных систем (данные опросов общественного мнения, электоральное поведение избирателей, поведение потребителей, города, страны мира, тексты и т.д.), созданная на основе Модульной Теории Социума (МТС). [8]
В данном программном продукте есть два режима модульного анализа и моделирования: ручной и автоматический. Для автоматического поиска закономерностей в данных в систему МАКС встроен блок ALEX.
Методология МАКС основана на идеях Пифагора, структурно-функционального анализа Т. Парсонса, теории самоорганизации Хакена.[9]
В МАКС так же есть возможность моделирования, предназначенная для проектирования социальных модулей и систем с заданными свойствами. Конструирование осуществляется с помощью уменьшения или увеличения числа элементов и/или частей в каком-либо модуле или во многих модулях одновременно. Различают два вида конструирования: а) теоретическое, б) эмпирическое.
Теоретическое конструирование применяется в том случае, если по каким-либо модулям нет эмпирической информации. Полученные модели выступают как количественные гипотезы для последующей эмпирической верификации.
Эмпирическое – используется для построения моделей различных социальных систем, по которым имеются эмпирические данные.
На основании дополнительных аналитических средств, содержащихся в пакете, можно анализировать вторичные данные и вводить дополнительные коэффициенты проверки.
Таблица 2. Проблемы, исследуемые с помощью МАКС
Криминология
|
Политика
|
Право
|
Экономика
|
Бизнес
|
Безопасность
|
Рисунок 11 – Моделирование в программе МАКС
2.5. Контент - Анализ Про
Контент-Aнализ Про предназначен для анализа различных текстов: рекламы, прессы, листовок, речей, интервью, материалов групповой дискуссии и т.д. В систему Контент-анализ Про встроен блок ALEX для автоматического поиска закономерностей в данных.
Некоторые решаемые задачи с помощью Контент-анализа Про:
- изучение социально-психологических портретов аудиторий СМИ;
- выявление глубинных установок респондентов;
- выявление болевых точек при анализе писем;
- выявление политической ориентации СМИ;
- изучение логических противоречий в законах и постановлениях;
- установление авторства текста;
- автоматическое реферирование текстов;
- выявление рекламной стратегии фирм.
В данном продукте реализованы два вида контент-анализа: смысловой и частотный. Смысловой контент-анализ позволяет анализировать смысловое содержание текста; подтекст, включенный автором текста и неосознаваемый автором подтекст. Частотный контент-анализ позволяет анализировать частоту встречаемости различных фрагментов текста (слова, группы слов, предложения, абзацы, тексты в целом), что также необходимо для исследования структуры текста и выявления его смыслов.[10]
Основные возможности Контент-анализа:
- частотный анализ текста, построение смысловых групп;
- смысловой анализ текста, нахождение синонимичных выражений;
- создание пользовательских тематических и грамматических словарей;
- поиск связей в тексте для заданных слов;
- создание и ведение баз текстовых данных;
- построение карт текстов и сравнение их между собой;
- вычисление стандартных коэффициентов (число слов, предложений, средняя длина предложения и т.п.);
- вычисление интегральных характеристик текста (лексическое разнообразие, структурная и грамматическая сложность);
- сравнение текстов между собой различными методами и вычисление интегральных индексов сходства текстов по результатам сравнения;
- нахождение функциональных зависимостей между характеристиками текста и проверка этих зависимостей на других текстах.
2.6. STADIA
Пакет STADIA разработан и поддерживается НПО «Информатика и компьютеры». Содержит в себе широкий набор методов анализа данных из всех областей статистики и доступен широкому кругу прикладных специалистов, менеджеров и студентов. Позволяет провести анализ выборочных распределений, временных рядов, парной корреляции и регрессии, получить прогноз развития объекта, построить и вывести на печать соответствующие графики и диаграммы. Кроме этого имеет средства и для углубленного анализа данных: регрессионный, кластерный, факторный, дискриминантный, параметрический и непараметрический дисперсионный анализ.
Система STADIA имеет достаточно полную документацию, а встроенный справочник содержит краткое описание основных теоретических положений, примеры расчета, формулы. Последние версии программы STADIA имеют увеличенный объем матрицы данных – до 12800 и 20000 чисел, расширенные возможности статистических процедур для их обработки по сравнению с базовыми версиями.
Пакет может появляться в трех вариантах: study, basе и рrоf, различающихся лишь объемами обрабатываемых массивов и ценой.
Универсальный российский статистический пакет STADIA - за 12 лет существования и развития стал аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русскоязычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами. Отличается простотой использования применительно к отечественной аудитории.[11]
Возможности:
- набор самых современных и эффективных методов анализа: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений;
- полный комплект деловой и научной, 2-х, 3-х и многомерной графики: функции, зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, и проч.;
- развитая экранная помощь, понятная интерпретация результатов.
Demo-версия программы обладает всеми возможностями пакета и позволяет обрабатывать данные небольшого объема (до 400 чисел). Тем самым она позволяет самостоятельно овладеть всеми современными методами прикладной статистики, а в некоторых областях исследования ещё и получить научные и практически значимые результаты.