1.6. Типология моделей

 

Основные отличия любых методов представления информации заключаются в том, каким способом фиксируется семантика предметной области. Но, следует особо отметить, что для всех уровней и для любого метода представления предметной области (но для нас важно, что в контексте создания и использования машинных баз данных) в основе отображения (т.е., собственно формирования представления) лежит кодирование понятий и отношений между понятиями. Многоуровневая система моделей представления информации иллюстрируется рис. 1.7. Рассмотрим далее основные из них.

Ключевым этапом при разработке любой информационной системы является проведение системного анализа: формализация предметной области и представление системы как совокупности компонент. Системный анализ позволяет, с одной стороны лучше понять «что надо делать» и «кому надо делать» (аналитику, разработчику, руководителю, пользователю), а с другой - отслеживать во времени изменения рассматриваемой модели и обновлять проект.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 


Рис. 1.7. Система моделей представления информации

Декомпозиция, как основа системного анализа, может быть функциональной (построение иерархий функций) или объектной.

Однако в большинстве систем, если говорить, например, о базах данных, типы данных являются более статичным элементом, чем способы их обработки. Поэтому получили интенсивное развитие такие методы системного анализа, как диаграммы потоков данных (Data Flow Diagram). Развитие реляционных баз данных в свою очередь стимулировало развитие методик построения моделей данных, и в частности, ER-диаграмм (EntityRelationshipDiagram). Однако и функциональная декомпозиция и диаграммы потоков данных дают только некоторый срез исследуемой предметной области, но не позволяют получить представление системы в целом.

Различаются и методы отображения, используемые на этапе построения даталогических моделей, отражающих способ идентификации элементов и связей, но, что особенно важно, в контексте их будущего представления в одномерном пространстве памяти вычислительной машины. Модели подразделяются на фактографические - ориентированные на представление хорошо структурированной информации, и документальные - представляющие наиболее распространенный способ отражения слабоструктурированной информации. Если в первом случае говорят о реляционной, иерархической или сетевой моделях данных, то во втором — о семантических сетях и документальных моделях.

При проектировании информационных систем свойства объ­ектов (их характеристики) называются атрибутами. Именно значения атрибутов позволяют выделить в предметной области как различные объекты (типы объектов), так и среди объектов одного типа — их различные экземпляры. Представление атрибутов удобнее всего моделируется  теоретико-множественными отношениями. Отношение наглядно представляется как таблица, где каждая строка — кортеж от­ношения, а каждый столбец (домен) представляет множество значений атрибута. Список имен атрибутов отношения образует схему отношения, а совокупность схем отношений, ис­пользуемых для представления БД, в свою очередь образует схему базы данных.

Представление схем БД в виде схем отношений упрощает процедуру проектирования БД. Этим объясняется создание си­стем, в которых проектирование БД ведется в терминах реля­ционной модели данных, а работа с БД поддерживается СУБД одного из описанных в данном пособии типов.

Основное отличие методов представления информации заключается в том, каким способом фиксируется семантика предметной области. Первые, фактографические БД, задают четкую 'схему соответствия, в рамках которой и отображается предметная область. Подобное построение по сути своей является довольно статич­ным, требует априорного знания типов отношений. В нем достаточно сложно вводить информацию о новых типах отношений между объектами, но, с другой стороны, зафиксированная схема базы данных позволяет довольно эффек­тивно организовать поиск информации.

Во втором случае предметная среда отображается (по крайней мере, на уровне модели) в виде однородной сети, любые изменения ко­торой, как по вводу новых классов объектов, так и новых типов отношений, не связаны с какими-либо структурными преобразо­ваниями сети. В силу большого количества типов отношений манипулирование подобной "элементарной" информацией доста­точно затруднено, поэтому для данного случая характерно введе­ние большого количества более общих понятий (и соответству­ющих им отношений), что упрощает работу с сетью.

 

Модель данных должна, так или иначе, дать основу для опи­сания данных и манипулирования данными, а также дать средст­ва анализа и синтеза структур данных. Любая модель, построенная более или менее аккуратно с точки зрения математи­ки, сама создает объекты для исследования и начинает жить как бы параллельно с практикой.

Реляционная модель дан­ных в качестве основы отображения непосредственно использует понятие отно­шения. Она ближе всего находится' к так называемой концепту­альной модели предметной среды и часто лежит в основе послед­ней.

В отличие от теоретико-графовых моделей в реляционной модели связи между отношениями реализуются неявным образом, для чего используются ключи отношений. Например, отношения иерархического типа реализуется механизмом первичных / внешних ключей, когда в подчиненном отношении должен присутствовать набор атрибутов, связывающих это отношение с основным. Такой набор атрибутов в основном отношении будет называться первичным ключом, а в подчиненном – вторичным.

Прогресс в области разработки языков программирования, связанный, в первую очередь с типизацией данных и появлением объектно-ориентированных языков, позволил подойти к анализу сложных систем с точки зрения иерархических представлений - классам объектов со свойствами инкапсуляции, наследования и полиморфизма, схемы которых отображают не только данные и их взаимосвязи, но и методы обработки данных.

В этом смысле объектно-ориентированный подход является гибридным методом и позволяет получить более естественную формализацию системы в целом. В итоге это позволяет снизить существующий барьер между аналитиками и разработчиками (проектировщиками и программистами), повысить надежность системы и упростить сопровождение, в частности, интеграцию с другими системами. Модель будет структурно объектно-ориентированной, если она поддерживает сложные объекты; модель будет поведенчески объектно-ориентированной, если она обеспечивает процедурную расширяемость; для того чтобы модель была полностью объектно-ориентированной, она должна обладать обоими свойствами.

Разделение на фактографические и документальные в этой группе моделей является достаточно условным. Документ, как последовательность полей может быть представлен, в том числе, и реляционной моделью. И в этом случае выбор специализированного решения чаще всего обуславливается требованием общей эффективности.

 

Представленная здесь типология моделей не претендует на полноту, и она не является классификацией в точном смысле этого слова. Она скорее иллюстрирует эклектичность преобладающих в разное время взглядов, методов и решений, используемых при проектировании и реализации баз данных.

 

Контрольные вопросы

 

1.     Дайте определение понятиям «База данных» и «банк банных».

2.     Каковы предпосылки создания баз и банков данных.

3.     Перечислите преимущества и недостатки использования БнД.

4.     Определите соотношение понятий «информация» и «данные».

5.     Перечислите и определите назначение основных компонентов БнД.

6.     Определите основные функции и назначение СУБД

7.     Назовите отличительные особенности БнД.

8.     Перечислите основные требования, предъявляемые к БнД.

9.     Какие технические средства используются для создания баз данных.

10.Перечислите основные признаки классификации БнД.

11.Определите понятие и назначение лингвистических средств БнД.

12.Перечислите основные категории пользователей БД.

13.Перечислите основные функции администратора БД.

14.Укажите взаимосвязь этапов создания БД и используемых моделей предметной области.

15.В чем различие между структурированной и слабоструктурированной информацией.

16.Приведите классификационную схему моделей БД.

Глава 2. Базовые технологии и основные этапы развития машинной обработки данных

 

 

К оглавлению

Назад к разделу "1.5. Семантика баз данных[1]"

Вперед к разделу "2.1. Введение в технологии машинной обработки данных и основные определения"