Географические информационные системы

Автор работы: Пользователь скрыл имя, 22 Марта 2013 в 20:07, курсовая работа

Описание работы

Современные геоинформационные системы (ГИС) представляют собой новый тип интегрированных информационных систем, которые, с одной стороны, включают методы обработки данных многих ранее существовавших автоматизированных систем (АС), с другой - обладают спецификой в организации и обработке данных. Практически это определяет ГИС как многоцелевые, многоаспектные системы.

Файлы: 1 файл

Геоинф (1).doc

— 2.13 Мб (Скачать файл)

Целостность, непротиворечивость и  оптимальность этой общей модели ГИС обусловливается обоснованным выбором составляющих частей модели.

Модели объектов ГИС, хранящихся в  базах данных, состоят из более простых частей, которые принято называть моделями данных. В свою очередь, модели данных в ГИС имеют сложную многоуровневую структуру, в которой нижние уровни состоят из элементарных (атомарных) моделей данных. Из элементарных моделей конструируются более сложные. Конструирование, или проектирование сложных моделей на основе более простых, зависит от выбора структуры сложной модели, от типа связей в сложной модели и от качественных характеристик элементарных моделей.

Проблема организации базы данных п ГИС сводится к решению ряда задач, первой из которых является организация моделей объектов. Это определяет необходимость предварительного анализа свойств элементарных моделей данных, составляющих более сложные модели в БД, и выбора базовых теоретических моделей с учетом конкретной предметной области задач ГИС. Такой подход позволяет оптимизировать создание информационной основы и процессы обработки данных в БД.

Оптимизация информационной основы и  функционирования ГИС начинается с  анализа базовых моделей данных, определяющих структуру связей в моделях и образующих более сложные модели для описания реальных объектов.

3.1. Основные понятия моделей данных

Вопросы и терминология моделирования  данными недостаточно широко освещены в технической литературе. Поэтому необходимо дать основные понятия, используемые при построении и описании моделей данных.

Как правило, реальная ГИС используется для решения заданного круга  задач в конкретной области применения.

Предметной областью называется подмножество (часть реального мира), на котором определяется набор данных и методов манипулирования с ними для решения конкретных задач или исследований.

Рассмотрим информационные единицы, которые составляют основу организации моделей и структур данных:

• знак - элементарная единица информации, являющаяся реализацией свойств объекта в заранее заданной, структурно организованной знаковой системе. Примеры знаков:

1. В знаковой системе целых чисел знаками будут целые числа типа 1,2, 10, 101 и т.д. Но в этой системе знаком не будут являться дробные числа, например 0.5,0.25.

2. В знаковой системе вещественных чисел в качестве знаков будут выступать числа типа 0.5, 1, 1.3, 5.356 и т.д.

3. В системе русского алфавита знаками будут буквы а, б , Т и др.

4. В системе латинского алфавита знаками будут латинские буквы X, Y, Z и т.д., но не русские (П, Б и др.);

• тип - совокупность моделей или объектов, объединенная общим набором признаков, или класс подобных знаков. В приведенном выше примере для первой знаковой системы будет тип "целый", для второй группы знаков - тип "вещественный", для третьей и четвертой групп - "символьный" или "текстовый". Понятие типа данных широко используется в программировании при описании данных. Это понятие является частным случаем понятия "типа" в общем . В зависимости от выбора признаков может меняться организация типов данных, т.е. разбиение на типы. Для выделения типов применяют процедуры типизации;

• типизация - объединение данных по набору заданных признаков или выделение из множества данных тех, которые удовлетворяют заданным критериям (или признакам).

Знак можно рассматривать как реализацию типа, тип - как обобщение совокупности знаков. Следовательно, знак представляет индивидуальные свойства модели, а тип - ее общие свойства;

• сущность - элемент модели (совокупность атрибутов и знаков), описывающая законченный объект или понятие;

• атрибут - элементарное данное, описывающее свойства сущностей;

• атрибут данных - свойство данных;

• запись данных - формализованное представление сложной информационной модели без описания ее структуры. Запись может быть логической и физической;

• запись логическая - информационная единица, соответствующая одному шагу обработки информации;

• запись физическая - порция информации, которая является единицей обмена данными между внутренней и внешней памятью ЭВМ;

• даталогическая модель ГИС - модель логического уровня описания геоинформационной системы, состоящая из логических записей и отображения связей между ними безотносительно к виду реализации. Описание даталогической модели называют схемой,

• даталогическое проектирование - этап создания даталогической модели;

• физическая модель ГИС (БД) - модель среды хранения данных физического уровня. Строится с учетом реальных СУБД и на их основе, может рассматриваться как реализация даталогической модели.

Для построения модели объекта в  виде составляющих частей и определения связей между этими частями применяют методы (процедуры) абстракции, которые тоже образуют целый набор понятий:

• абстракция - процедура структуризации (типизации) данных. Различают два вида абстракции: обобщение и агрегация;

• обобщение также подразделяется на две категории: собственно обобщение и классификация;

• собственно обобщение- процедура соотнесения множества типов одному типу соотносится с понятием: "есть часть...",

• классификация - процедура соотнесения множества знаков одному типу;

• экземпляция - процедура (обратная классификации) порождения реализации на основе известной классификации;

• специализация - процедура (обратная обобщению) порождения типов на основе общего класса типов;

• агрегация - процедура конструирования объекта из других базовых объектов; соотносится с понятием "есть некоторые..",

• интенсионал - агрегация на уровне свойств-типов;

• экстенсионал - агрегация на уровне свойств-знаков. Например, общая схема взаимосвязи данных, выраженных типами (общими понятиями), в любой базе данных представляет собой интенсионал, а схема взаимосвязи данных, выраженных конкретным набором значений (набором знаков), - экстенсионал.

Под агрегативными данными будем понимать набор данных для формирования объекта из его частей на основе процедур агрегации.

Процедура, обратная агрегации, называется пошаговой детализацией. Она применяется для разбиения агрегативной модели на составляющие части.

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Личность

Ф.И.О.

Возраст

Адрес

Социальное положение

Стаж

Зарплата

Налоги

Специальность



 

 

 

Личность

Социальное положение

Административная принадлежность

Занимаемая должность

Тарифный разряд



 

 

 

На рис. 3.1 приведена схема проектирования (структурирования ) данных с применением прямых и обратных процедур абстракции.

Для пояснения различия между обобщением и арегацией приведены модели одного и того же объекта "личность", но построенные на основе различных подходов (процедур): с применением метода обобщений (рис. 3.2) и метода агрегации (рис. 3.3). Каждая структурно определенная модель позволяет создавать логическую запись На рис. 3.4 и 3.5 соответственно приведены логические записи, построенные для моделей, спроектированных с использованием агрегации (см. рис. 3.3) и обобщения (см. рис. 3.2).

Записи различаются не только по виду, но и контекстно, так как  в одном случае (см. рис. 3.5) параметры (атрибуты) записи подчеркивают отношение полного объекта (записи) к другом группам объектов, а в другом (см рис. 3.4) - являются атомарными объектами, тугими словами, модель, построенная на основе обобщений, отражает свойства по отношению к другим классам моделей или объектов.

Модель, построенная на основе агрегации, может являться разложением сложного объекта на более простые вплоть до атомарных.

3.2. Классификационные задачи

При создании информационной основы и анализе данных используются методы классификационного анализа. Поскольку  при сборе информации для БД приходится иметь дело с результатами измерений, первые три типа задач классификации определим по этому показателю. Воспользуемся определением, данным Кендаллом [5]. К задачам классификации первого типа относятся те, в которых исходные измерения требуется разделить на устойчивые группы. Их называют задачами классификации без учителя, кластеризации, таксономии, типизации. Этот тип классификации основан преимущественно на опытных данных. Задачи классификации второго типа характеризуются тем, что исходные данные уже сгруппированы и требуется оценить их информативность (значимость) относительно совокупности известных эталонов. Такого рода задачи встречаются при распознавании образов, дешифрировании снимков и т.д. Задачи классификации третьего типа - задачи разбиения. В них исходные измерения или их функции требуется разбить на устойчивые группы в зависимости от их величины.

Задачи  классификации четвертого типа назовем процедурными. В них выполняются анализ и классификация процедур преобразования, а не данных.

Задачи  классификации пятого типа - структурно-аналитические. С их помощью производятся анализ и классификация аналитически-логических связей в системах, алгоритмах и программах. Основу такой классификации составляют методы структурного и системного анализа.

В ГИС задачи классификации первого типа возникают  и решаются при разработке классификаторов, т.е. при организации информационной основы, задачи второго типа - при сборе первичных данных и при использовании ГИС для экспертных решений или оценок. Задачи классификации третьего типа возникают в приложениях ГИС для решения проблем в области экологии, землепользования, статистики и т.п. Задачи четвертого типа классификации требуют решения при организации и выборе основных технологических процессов ГИС, пятого типа - при организации информационной системы, представлении (формализации) и оптимизации ее технологических процессов. Строго говоря, классификационные задачи пятого типа должны предшествовать классификационным задачам четвертого и других типов.

3.3. Аспекты рассмотрения моделей  данных

Модель, как правило, отражает наиболее общие свойства объекта или исследуемого процесса. Использование различных аспектов рассмотрения и критериев оценки моделей данных позволяет на основе объективного сравнительного анализа выбирать оптимальную модель для решения возникающих проблем.

Семиотика. Модель как знаковая система должна содержать три основные характеристики: синтаксис, семантику и прагматику. Этот подход определяет содержание элементарной (атомарной) модели как элементарной единицы данных, включающей в себя правила построения, имя объекта, свойства объекта, значения свойств. Разнообразие атомарных моделей создает условия для построения множества моделей данных. Типизация. Одно из противоречий описания моделей заключается в стремлении отразить, с одной стороны, общие свойства класса объектов, с другой - индивидуальные признаки более узкого подкласса и индивидуальные признаки конкретного объекта. Это обусловливает разделение моделей данных на два класса: сильно типизированные и слабо типизированные.

Сильно типизированные- это модели, в которых большинство данных удовлетворяет неким условиям и ограничениям и может быть отнесено к узкому подклассу (типу). Если исходные данные нельзя отнести к одному типу, то их можно с помощью искусственных приемов (введением дополнительных условий или ограничений) отнести к набору типов с помощью процедур типизации. Сильно типизированные модели эффективны при обработке однотипных потоков данных. Примером сильно типизированных данных в ГИС служат координатные (метрические) данные и все табличные данные.

Слабо типизированные— это модели, в которых данные разнородны по формату, структуре. Они, в общем, слабо связаны условиями относительно известных типов. Слабо типизированные модели обеспечивают интеграцию категорий данных. Предельная возможность использования таких моделей обеспечивается исчислением предикатов. Примером слабо типизированных моделей в ГИС могут быть описательные характеристики (временные наборы данных).

Изменчивость. Можно выделить два класса моделей: статические и динамические.

К статическим относят модели, инвариантные относительно времени. Динамические модели не только допускают изменение параметров и структур во времени, но и служат для описания изменения процессов и моделей именно во времени. Примерами таких моделей в ГИС могут служить два вида электронных карт: электронные карты в режиме разделения времени (электронные атласы) - статическая модель, электронные карты в реальном масштабе времени (навигационные системы) - динамическая модель.

Следует подчеркнуть, что понятие изменчивости моделей данных в ГИС относительно, так как вся информация носит пространственно-временной характер и через какое - то время требует обновления. Поэтому, применяя понятия статические и динамические модели, необходимо указывать период времени, который используется при анализе геоинформационных данных, или определять альтернативную модель при сравнении с исходной.

Любая модель данных должна в разной степени обладать двумя этими свойствами. Динамика моделей определяет их возможный переход Друг в друга. Она позволяет связывать модель со множеством правил порождения и множеством операций.

Агрегация (взаимосвязь). Отдельные  части модели образуют ее структуру. Одним из основных способов структуризации данных является абстракция, используемая как для образования категорий данных, так и для построения одних категорий на основе других.

Представление моделей. Выделяют табличные и графовые формы представления моделей.

Табличная форма дает представление модели или ее характеристик в виде одной или совокупности взаимосвязанных таблиц. При этом данные в ячейках таблицы не могут заноситься произвольно, они подчиняются определенным правилам, в частности, по столбцам располагают типизированные данные. Примером табличного представления модели кроме таблицы может служить логическая запись (см. рис 3.4, 3.5), которая представляет собой верхнюю строку таблицы.

Графовая форма основана на построении модели в виде графической схемы, называемой графом. Эта схема включает элементы графа, называемые вершинами (узлами) и ребрами (дугами). В отличие от произвольно нарисованной схемы графовая модель, как и табличная, строится по определенным правилам. В частности, каждое ребро может быть ориентировано, если определен путь от одной вершины к другой, и не ориентировано, что соответствует возможному пути от одной вершины к другой в обоих направлениях. Простейший пример ориентированного графа - вектор в трехмерном пространстве, а неориентированного графа - кривая пути из одной точки в другую. Кроме вершин и ребер существуют другие элементы, значение которых не столь существенно.

Информация о работе Географические информационные системы