Московская
финансово-промышленная академия
Кафедра
Информационных систем
Сапожкова Т.Е.
Интернет-курс по дисциплине
«Теория экономических информационных систем»
Москва
2010
Содержание
Вопрос 1. Понятие информация,
данные, знания.
Вопрос 2. Синтаксический,
семантический, прагматический уровни отражения проблемной области.
Вопрос 3. Классификация
информации.
Тема 2. Экономическая
информация, её составные единицы
Вопрос 1. Природа
экономической информации, области и формы её отражения, особенности обработки.
Вопрос 2. Составные единицы
экономической информации.
Тема 3. Основы организации
структур данных ЭИС
Вопрос 1. Классификация
структур экономических данных.
Вопрос 3. Основы организации
структур хранения данных.
Тема 4. Основы формирования
логических структур экономических данных
Вопрос 1. Иерархические,
сетевые, реляционные, многомерные модели представления данных.
Вопрос 2. Связи между данными
в реляционной модели.
Вопрос 3. Операции,
выполняемые над отношениями.
Вопрос 4. Виды функциональных
зависимостей, нормализация отношений в реляционных базах данных.
Вопрос 5. Модели
представления знаний в корпоративных системах.
Тема 5. Основы разработки и
функционирования ЭИС
Вопрос 1. Модели спецификации
предметной области, систем обработки экономической информации.
Тема 6. Основы спецификации
электронного документооборота в организации
Вопрос 2. Составляющие
структуры электронного документа: профиль, тело.
Вопрос 3. Стиль документа,
стили макета и представлений. Разметка.
Дополнительная литература по
дисциплине
Дисциплина «Теория экономических
информационных систем» посвящена изучению базовых понятий и представлений
современных экономических информационных систем, формирует общую систему
теоретических знаний, необходимых для изучения ряда других специальных дисциплин.
Цели и
задачи дисциплины.
Целью дисциплины «Теория
экономических информационных систем» является изучение теоретических основ
строения информации, ее разновидностей, структурной организации данных,
классов, видов, методов, средств формализованного описания экономических
информационных систем (ЭИС), их компонентов, а также средств представления и
разработки ЭИС.
Задачи изучения дисциплины.
В
результате изучения дисциплины обучаемый должен
иметь представление:
- о перспективах развития
аппаратного и программного обеспечения;
- о проблемах создания
корпоративных, распределенных информационных систем;
- о методах и современных
средствах моделирования информационных систем;
знать:
- составные единицы экономической
информации, их формы, структуры;
- основные принципы организации
хранения данных;
- основные принципы организации
реляционных структур данных;
- подходы, методы и средства
моделирования информационных систем;
- основные этапы разработки и
принципы функционирования ЭИС;
- основы строения и организации сетевых,
корпоративных информационных систем;
уметь:
- формировать различные структуры
экономических данных;
- осуществлять формализованное
описание предметной области (спецификацию существующей и создаваемой
экономической информационной системы);
- формировать оптимальную
структуру базы данных (требуемой нормальной формы).
Содержание
темы:
1.
Понятие
информация, данные, знания.
2.
Синтаксический,
семантический, прагматический уровни отражения проблемной области.
3.
Классификация
информации.
4.
Описание
парадигматических зависимостей: классификационных, агрегативных, ассоциативных.
Характеристика динамических зависимостей.
Сегодня
обработка экономической информации стала самостоятельным научно-техническим
направлением с большим разнообразием идей и методов. Отдельные компоненты
процесса обработки данных достигли высокой степени организации и взаимосвязи,
что позволяет объединить все средства обработки информации на конкретном
экономическом объекте понятием "экономическая информационная система"
(ЭИС). Детальное изучение ЭИС опирается на понятия "информация" и
"система" Информация - новые
сведения, позволяющие улучшить процессы, связанные с преобразованием вещества,
энергии и самой информации.
Информация
не отделима от процесса информирования, поэтому необходимо рассматривать
источник информации и потребителей информации. Роль потребителей информации
очерчивается в таком определении.
Информация -
новые сведения, принятые, понятые и
оцененные конечным потребителем как полезные [1].
Информацией являются сведения, расширяющие запас знаний конечного
потребителя.
Выделяются
три фазы существования информации.
1. Ассимилированная информация -
представление сообщений в сознании человека, наложенное на систему его понятий
и оценок.
2. Документированная информация -
сведения, зафиксированные в знаковой форме на каком-то физическом носителе.
3. Передаваемая информация -
сведения, рассматриваемые в момент передачи информации от источника к
приемнику.
Данные представляют
собой набор утверждений, фактов и/или цифр, лексически и синтаксически
взаимосвязанных между собой [1].
Знания –
осмысленная, понятая информация или система взаимосвязанных фактов [1].
Системой называется любой объект, который, с одной стороны, рассматривается как
единое целое, а с другой - как множество
связанных между собой или взаимодействующих составных частей [1].
Информационная
система - система, функционирование
которой связано с регистрацией, сбором, обработкой, хранением и отображением
информации, отражающей состояние исследуемых объектов в процессе их развития
В настоящее время в составе информационной системы принято выделять
подсистемы технического, информационного, математического, программного,
организационно-правового обеспечения [1, 4, 6].
Техническое обеспечение системы — это комплекс технических средств
(компьютер, оборудование локальной вычислительной сети, оргтехника,
периферийная техника, средства связи).
Программное обеспечение – совокупность программ, реализующих функции и
задачи информационных технологий и обеспечивающих устойчивую работу комплексов
технических средств.
Организационное обеспечение – комплекс документов, регламентирующих
деятельность персонала в условиях функционирования информационной системы.
Информационное обеспечение представляет собой совокупность
общесистемного обеспечения (системы классификации и кодирования,
нормативно-справочные документы, оперативные документы, методические материалы,
инструкции) и структур данных. Подробнее структуры данных будут рассмотрены в
Теме 3.
Информационное обеспечение включает в себя всю экономическую информацию
предприятия, описание способов ее представления, хранения и преобразования.
Информационное обеспечение организуется на основе технического и программного
обеспечения и является по отношению к ним обеспечением более высокого уровня.
Понятия информация, знание, данные тесно связаны
и соответствуют трем аспектам отображения некоторой проблемной области в
сознании субъекта, а именно [3]:
· Синтаксический (формальный). Абстрагируются от содержания и степени полезности,
рассматриваются данные. Данные
– набор утверждений, фактов, цифр, взаимосвязанных между собой.
· Семантический
– отражаются знания,
анализируются характеристики, устанавливаются противоречия. Происходит осмысление
полученных данных, построение их в систему.
· Прагматический
– определяется новизна, полезность знаний. Здесь отражается информация.
Существуют различные подходы и принципы классификации информации [3].
Согласно общему подходу различают информацию:
1) по принципу "областей отображаемых отношений между
объектами":
· экономическую;
· естественно-научную;
· технико-технологическую;
· социально-политическую;
2) по принципу "наличия платежеспособного спроса":
· конъюнктурную (деловую и коммерческую);
· специальную (производственную, научно-техническую);
3) по принципу "устойчивости":
· оперативную (сохраняемую в течении цикла оперативного управления);
· тактическую (с сроком обновления 2-3 года);
· стратегическую (сохраняющую актуальность в течении длительного
периода времени);
4) по степени "полезности":
· полезную (деловая, познавательная) и бесполезную;
5) по степени "полноты":
· избыточную;
· достаточную;
· недостаточную;
6) по степени "надежности" данных:
· истинную;
· сомнительную;
· ложную;
7) по "содержанию" отражаемых событий:
· событийную (в форме отчета произвольной формы или анонса о каком
либо событии);
· статистическую (в форме показателей за период);
· аналитическую (в форме комментариев события или факта);
· прогнозную;
· рекламную;
· частную.
Согласно профессиональному подходу
информация дифференцируется на.
1) по принципу "отношение к данной системе":
· внешнюю;
· внутреннюю (создаваемую и используемую в рамках конкретного
объекта);
2) по принципу "отношение к системе управления":
· входную (входящую);
· выходную (исходящую);
3) по принципу "отношение к функциям управления":
· плановую;
· нормативную;
· прогнозную;
· учетную;
· контрольную;
· аналитическую;
4) по принципу "назначение":
· осведомляющую;
· управляющую;
5) по принципу "степень участия в обработке":
· обрабатываемую (подвергаемую арифметическим и логическим
преобразованиям);
· необрабатываемую (хранимую);
6) по принципу "степень изменчивости":
· постоянную;
· условно-постоянную;
· переменную;
В повседневной жизни знания используются
человеком для восприятия новых данных, в результате которого формируется
система – новое знание.
Приращение знания у субъекта (новые
сведения) есть ничто иное, как информация. Часто в практике нет необходимости
подчеркивать различие между данными и информацией, в таких случаях эти понятия
употребляются как синонимы.
Информация может возникать не только в
результате поступления новых данных, но и на основе уже накопленных знаний
путем дедукции и вывода.
Для правильного осмысления поступающих
данных, а также дедукции нового знания необходимо организовать знания в
систему, в которой определены взаимосвязи (зависимости) между известными
фактами. Эти зависимости могут иметь стабильный, безусловный
(парадигматический), либо динамический характер [3].
Парадигматические зависимости описываются
достаточно просто в виде различных отношений фактов:
· классификационных (род-вид);
· агрегативных (целое-часть);
· ассоциативных (образ).
Динамические зависимости, в свою очередь,
могут иметь вычислительный или вероятностный (синтагматический) характер и
реализуют модель предметной области, или предметное знание. Обычно предметное
знание в системе обработки данных представляется в виде некоторой структуры
данных или в декларативной форме.
Отображение вероятностных зависимостей
фактов составляет модель проблемной области, или проблемное знание.
Для построения информационных систем
необходимо, прежде всего, знать структурную организацию данных, информации;
основы ее строения.
Задание 1.1. Рассмотрите следующий перечень понятий и
укажите, какие из них относятся к семантике, а какие - к синтаксису: алфавит
значений реквизита, банковские реквизиты, длина поля, почтовые реквизиты,
реквизит-основание, реквизит-признак, соответствие между почтовым кодом города
и кодом Субъекта Федерации, структура документа, структура записи, юридический
адрес.
1.
Дайте определение
информации, данным и знаниям.
2.
Сформулирует, в чем состоит различие между информацией и данными.
3.
Дайте определение информационной системе.
4.
Что входит в состав информационной системы.
5.
Что включает в себя информационное обеспечение?
6.
Что отражается на
синтаксическом уровне отражения информации?
7.
По каким принципам классифицируют информацию согласно общему
подходу?
8.
По каким принципам классифицируют информацию согласно
профессиональному подходу?
9.
Что представляют из себя парадигматические зависимости?
10. Что представляют
из себя динамические зависимости?
1.
Мишенин А. И.
Теория экономических информационных систем: учебник. – 4-е изд., доп. И
перераб. – М.: Финансы и статистика, 2007. – Глава 1, с.5-19.
2.
Мишенин А. И.
Теория экономических информационных систем. Практикум: учеб. пособие. – М.:
Финансы и статистика, 2007, Глава 1, с.5-16.
3.
Информационные
системы и технологии в экономике. Учебник. – Из 2-е, перераб. и доп./
Т. П. Барановская, В. И. Лойко, М. И. Семенов,
А.И. Трубилин. Под ред. В. И. Лойко. - М.: Финансы и статистика,
2006, Глава 1.
Содержание темы:
1. Природа экономической информации, области и формы
её отражения, особенности обработки.
2. Составные единицы экономической информации.
Экономическая
информация - информация об экономических процессах (производстве,
распределении, обмене и потреблении материальных благ) [3].
Экономическая
информационная система представляет собой систему, функционирование которой во
времени заключается в сборе, хранении, обработке и распространении информации о
деятельности какого-то экономического объекта реального мира [1].
Информационная
система создается для конкретного экономического объекта и должна в
определенной мере копировать взаимосвязи элементов объекта.
Особенности экономической
информации [1, 3]:
· Сфера отражения (отражается информация об
экономических объектах: участок, рабочее место, цех, предприятие, отрасль);
· Отражение экономических объектов осуществляется через
систему экономических показателей (прибыль, расходы, количество выпущенной
продукции и т.д.);
· Природа экономической информации: для экономической
информаций характерна цифровая, алфавитно-цифровая природа;
· Форма отражения (документы);
· Операции: экономическую информацию отличают несложные
математические операции, но сложные логические процедуры преобразования;
· Объем: характерен большой объем данных, требуемых для
анализа и оценки.
Экономическую информацию можно
классифицировать по следующим признакам:
· По отношению к системе: входная, выходная, внутренняя;
· По признаку времени: перспективная (прогнозная) и
ретроспективная (учетная), периодическая и непериодическая;
· По функциональным признакам: о трудовых ресурсах, о
производстве, о планирование, об учете.
Структуры входных и выходных данных
содержат информацию различных видов и отличаются правилами построения, объемом
и собственно формой. Выделяют следующие единицы экономической информации:
· реквизиты;
· сообщения;
· показатели;
Реквизит – минимальная логически неделимая единица
экономической информации [3].
Пример: цена, табельный номер,
фамилия и т.д.
Реквизит имеет форму, которая включает в себя:
- Наименование;
- Структура (длина, тип, формат);
- Значение;
- Другие свойства.
Различают следующие виды реквизитов:
· признаки (текстовый, числовой, текстово-числовой);
· основания (числовой тип);
· реквизиты логического типа.
Реквизитом-признаком называют реквизит,
значение которого определяет некий объект, его свойство, некое обстоятельство
действия (место, предмет, время, результат и т.д.). Иными словами,
реквизиты-признаки отражают качественные свойства явлений или процессов, давая
характеристику объекту. Реквизиты признаки могут быть представлены (иметь
значения) не только буквами различных алфавитов, но и цифрами, а также
специальными символами.
Например: Табельный номер, Адрес.
Реквизит-основание представляет
минимальную логическую единицу, значение которой определяет некую меру
действия. Или, другими словами, реквизиты-основания характеризуют
количественные свойства исследуемых явлений и процессов.
Над реквизитами основаниями выполняются,
как правило, арифметические операции(+,-,*,/,%), над реквизитами признаками –
логические процедуры преобразования (поиск, упорядочение, выборка, группировка
и т.д.).
Реквизиты логического типа принимают два
значения («истина» и «ложь») и используются только в логических выражениях для
отображения таких свойств объектов и процессов, которые по своей характеристике
можно разделить на две противоположные группы. Например, присутствует какой-то
признак или отсутствует; наступил или нет некоторый момент; выдержано
определенное условие или нет; положительная величина или отрицательная.
Пример переменных логического типа:
· знак (+, -) в отчетах;
· различные признаки: избыточности, переполнения, завершения,
годности и т.п.
Над логическими реквизитами осуществляются
операции математической логики (конъюнкция, дизъюнкция, импликация).
При анализе
экономических документов ставится задача разделения документа на элементарные
осмысленные фрагменты, называемые показателями. Это позволяет установить
смысловые взаимосвязи между различными документами, обеспечить одинаковое
понимание всеми пользователями применяемых единиц информации и их единое
обозначение, использовать полученные результаты для определения структуры базы
данных.
Показатель представляет собой полное описание количественного
параметра, характеризующего некоторый объект или процесс [1].
В состав
показателя должны входить один реквизит-основание и несколько
реквизитов-признаков, однозначно характеризующих условия существования основания.
Если
представить себе показатель с двумя, например, реквизитами-основаниями, то его
можно разделить на две части, в каждой из которых будет один реквизит-основание
и характеризующие его признаки. Полученные части содержат меньше реквизитов и
поэтому соответствуют определению показателя.
Таким
образом, в показателях отображаются количественные свойства объектов и
процессов. Вместе с тем существуют документы, не содержащие
реквизитов-оснований, например анкеты кадрового учета, сведения о структуре подразделений
предприятия и т. д. Следовательно, не вся экономическая информация может быть
представлена в форме показателей.
Минимальный
набор реквизитов показателя должен содержать:
·
реквизиты, отображающие идентификаторы объектов;
·
реквизиты, отображающие признак времени;
·
реквизит, отображающий некоторое количественное свойство
объекта или взаимодействия.
Показатели
классифицируются:
·
по признаку отражения состояния объекта: статические (занимаемая площадь,
производственная мощность и т.д.) и динамические
(прибыль, доход, объем продаж);
·
по характеристике единиц измерения: абсолютные (прибыль, доход и т.д.) и относительные (рентабельность)
Одна из
причин выделения показателей в особую разновидность единиц информации
заключается в том, что показатель является минимальной группой реквизитов,
сохраняющей информативность (осмысленность) и поэтому достаточной для
образования самостоятельного документа.
Все, что
происходит в процессе функционирования материальных систем, может быть описано
в форме сообщений. Появление сообщений о событиях, происходящих в материальной
системе, представляет собой информационное отображение материальных процессов.
Так, выпуск продукции рабочими порождает сообщения о том, кто из рабочих
изготовил определенные изделия, когда и на каком оборудовании, в каком
количестве и т. д.
Сообщение – информационная
совокупность, состоящая из нескольких реквизитов-признаков и нескольких
реквизитов-оснований [1, 3].
Сообщение
может быть выражено на естественном языке, однако часто применяют
форматированные сообщения, когда выделяются опорные свойства (параметры)
происходящего события и в сообщении приводятся названия свойств и их значения.
Пример сообщения: На склад №2 01/08/07 поступили генераторы от
завода «Динамо» в количестве 50 шт. по цене 200 руб.
Форматированный вариант данного сообщения
представлен в Таблица 2.1.
Таблица 2.1.
Форматированный
вариант сообщения
Название параметра |
Значение параметра |
Получатель |
Склад №2 |
Отправитель |
Завод «Динамо» |
Изделие |
Генератор |
Дата |
01/08/2007 |
Цена |
200 руб |
Количество |
50 шт. |
Для ввода в информационную
систему используют форматированный вариант сообщения.
Задание 2.1. В следующих сообщениях, представленных в Таблица 2.2 (выбрать один вариант):
а) задайте имена реквизитов, укажите их значения;
б) укажите реквизиты-признаки и
реквизиты-основания;
в) охарактеризуйте области значений реквизитов
словесно и средствами описания данных в СУБД Access;
Таблица 2.2.
Варианты
сообщений
№ варианта |
Сообщение |
1 |
Наименование
детали: болт. Код
детали: 0107386. Дата:
12.03.2002. Цех:
15. Плановый
выпуск в штуках: 1500. Фактический
выпуск: 1517. |
2 |
Наименование
населенного пункта: Сергач. Субъект
Федерации: Нижегородская область. Статус:
районный центр. Вид
населенного пункта: город. Население:
93 тыс. чел. |
3 |
Наименование
ценной бумаги: вексель. Номинал:
1000 руб. Процент:
9,5%. Срок
погашения: 31 марта Должник:
АО «Северстальинвест». |
4 |
Предприятие:
АО «AVON». Годовая
прибыль: 8055 тыс. руб. Уставный
капитал: 78500 тыс. руб. Год:
2000. |
5 |
Название
завода: «Ока». Расположение:
г. Навашино. Специализация:
Судостроение. Количество
работающих: 5140 чел. |
6 |
Поезд
№ 34 Москва-Кемерово прибывает на ст.
Нижний Новгород 10 окт. |
7 |
Изделие:
принтер для ПК. Марка:
EPSON. Тип:
матричный. Модель:
LQ-1500. Скорость
печати: до 20 стр./ч. |
8 |
Тип
квартиры: 3-комнатная. Площадь:
Этаж:
3-й. Район:
Приокский. Начальная
цена: 62 000 долл. |
9 |
Сообщение
Гидрометеослужбы: «Температура + 19°, ветер южный,
скорость ветра 5 м/с, атмосферное давление - |
Задание 2.2. В Таблица 2.3. даны реквизиты документов (выбрать один вариант). Укажите
реквизиты-признаки и реквизиты-основания. Запишите структуру экономических
показателей. Обозначения реквизитов выбрать самостоятельно.
Таблица 2.3.
Реквизитный
состав документов
№ варианта |
Название
документа |
Реквизиты |
1 |
Реквизиты
документа «Оборотная ведомость движения материалов» |
Склад Дата Код
материала Цена Начальный
остаток Приход Расход Конечный
остаток |
2 |
Реквизиты
документа «Ведомость отгруженных изделий» |
Дата
отгрузки Цена
Сумма
всего Код
изделия Общая
стоимость изделий Количество
отгружено Стоимость
комплекта тары |
3 |
Реквизиты
документа «Производственная программа участка» |
Месяц Участок Код
детали План
запуска Остаток
прошлого месяца План
выпуска Остаток
деталей |
4 |
Реквизиты
документа «Рапорт о выработке» |
Дата Участок Табельный
номер рабочего Код
детали и операции Разряд
работы Принято
деталей Расценка Сумма |
5 |
Реквизиты
документа «Счет за электроэнергию» |
ФИО
Дата
Сумма Номер
счета Показание
счетчика на дату Адрес
Расход
электроэнергии |
6 |
Реквизиты
документа «Обеспеченность материалами по цеху» |
Цех
Приход
материала Отклонение Месяц
Потребность
на месяц Код
материала Остаток
прошлого месяца |
7 |
Реквизиты
документа «Акт о браке» |
Дата
Операция
Себестоимость
единицы брака Участок
Табельный
номер Сумма
потерь от брака по участку виновника Деталь
Количество
брака |
8 |
Реквизиты
документа «Листок учета простоев» |
Дата
Табельный
номер рабочего Сумма
оплаты Цех
Код
причины простоя Продолжительность простоя Процент
оплаты простоя |
9 |
Реквизиты
документа «План поставок на год» |
План
поставок в руб. Год Изделие Потребитель Адрес Цена
изделия План
поставок в шт. |
1.
Что такое
экономическая информация?
2.
Назовите
особенности экономической информации.
3.
Дайте определение
реквизита.
4.
Назовите виды
реквизитов.
5.
Какова структура
показателя?
6.
Перечислите минимальный
набор реквизитов показателя.
7.
Какие бывают
показателя по признаку отражения состояния объекта? Приведите примеры.
8.
Какие бывают
показателя по характеристике единиц измерения? Приведите примеры.
9.
Что такое
сообщение?
10. Что такое форматированное сообщение?
1.
Мишенин А. И. Теория экономических информационных систем:
учебник. – 4-е изд., доп. И перераб. – М.: Финансы и статистика, 2007. – Глава
1, с.19-23, 33-34, 43-48.
2.
Мишенин А. И. Теория экономических информационных систем.
Практикум: учеб. пособие. – М.: Финансы и статистика, 2007, Глава 1, с.31-39.
Содержание
темы:
1. Классификация структур экономических данных.
2. Характеристика документа, его структура. Виды, формы,
типы и правила построения документов.
3. Основы организации структур хранения данных.
Структура данных - множество некоторых компонент вместе со связями между ними и
порядком следования компонент в пределах отношений [3].
Структуры данных
относятся к информационному обеспечению ЭИС.
Различают следующие
структуры данных:
1.
Структуры входных
данных – документ.
2.
Структуры
выходных данных – документ.
3. Логические структуры - схемы логической взаимосвязи элементов данных. Более подробно
логические структуры данных будут рассмотрены в Теме 4.
4. Структуры хранения -
физическое отображение логических структур в запоминающем устройстве.
Структуры входных и выходных данных относят также к внешним структурам.
Документ - Информационный объект автоматизированных
систем обработки данных, построенный по определенным правилам, имеющий свою
структуру [3].
Документ может быть
представлен в графической, линейной, табличной формах.
Также различают
следующие типы документов:
·
Зональный;
·
Табличный;
·
Анкетный.
Структура документа
имеет вид, представленный на рис.
3.1:
·
Общая область,
где отражаются наименование и коды реквизитов, дающие общую характеристику
информационному объекту.
·
Предметная
область, где содержится набор строк одинаковой структуры, отражающий состояние
исследуемого объекта во времени.
·
Оформительная
область служит для подписи ответственных за сведения, содержащиеся в документе,
лиц.
Рис. 3.1. Структура документа
При формировании
документа рекомендуется придерживаться следующих правил:
·
в первую очередь
указываются справочно-группировочные признаки, постоянные для группы
документов;
·
затем следуют
переменные справочно-группировочные признаки и количественно-суммовые
показатели (реквизиты-основания);
·
в завершении
указываются редко встречающиеся символы.
Документы можно
классифицировать по следующим признакам:
· по степени официальности (утвержденная и
неутвержденная форма документов);
· по отражаемой стадии воспроизводства (производство,
торговля и т.д.);
· по уровню управления (государственный, уровень
министерства, объединений, предприятий и организаций);
· по принадлежности к определенной функции управления
(прогнозирование, планирование, учет, контроль, анализ, нормирование,
оперативное управление и др.);
· по отношению к экономической системе (внешние и
внутренние);
Под структурами хранения данных понимают физическое отображение логических структур в
запоминающем устройстве. Структуры хранения характеризуют способы размещения
данных на магнитном носителе [1].
Способы хранения данных в памяти ЭВМ обычно
предполагают раздельное хранение значений каждой составной единицы информации
(СЕИ). Отдельное значение СЕИ, находящееся в памяти ЭВМ, называется записью.
Запись состоит из значений атрибутов, входящих в структуру СЕИ. Множество
записей образует массив, или файл. Термин массив обычно используется при
рассмотрении данных в оперативной памяти ЭВМ, а термин файл применяется
для данных, хранимых на внешних запоминающих устройствах. Как правило, файл
содержит записи, принадлежащие одной и той же СЕИ, хотя в общем случае это не
является обязательным. Возможные структуры хранения данных представлены на рис. 3.2.
Рис. 3.2. Виды структур хранения данных
При последовательной
организации файла на магнитном диске возможен доступ от только что обработанной
записи к последующей записи (по направлению к концу файла). Переход в обратном
направлении невозможен, единственный путь состоит в закрытии файла, повторном
его открытии и движении к нужной записи в прямом направлении.
Достоинством
физически-последовательной структуры хранения является минимальный объем
дискового пространства, используемый для хранения данных. Недостатком же
является сложность реорганизации такой структуры. Из чего можно сделать вывод,
что данных вид структуры хранения лучше использовать для архивных
информационных систем.
Существует также
логически-последовательная структура хранения, которая предполагает
использование указателя, обеспечивающего связь между хранимыми экземплярами
структур данных. Основное преимущество такой организации – это отсутствие
необходимости сортировки записей при добавлении новой, а недостатком является
избыточность хранимых данных.
Индексно-последовательный
файл представляет
собой последовательный файл, снабженный индексами. На магнитном диске выделяются
три области - первичная, индексная и область переполнения. В первичной области
помещаются упорядоченные по значениям ключевого атрибута записи, когда файл
впервые создается. В зависимости от размера первичной области могут создаваться
один, два или три уровня индексов:
· индекс
первого уровня отмечает последнюю запись каждой дорожки магнитного диска;
· индекс
второго уровня отмечает последнюю запись каждого цилиндра магнитного диска.
Если файл
индекса второго уровня достаточно велик по размеру, то для него допускается
создание индекса третьего уровня. Область переполнения предназначена для
размещения записей, включаемых в индексно-последовательный файл. Новые записи
связываются в цепочку и размещаются на том цилиндре, при котором ключи новых
записей соответствуют интервалу значений ключей в первичной области этого
цилиндра. Перечислим итоговые характеристики индексно-последовательного
доступа:
·
значения ключей записей должны быть отсортированы;
·
в индекс заносится наибольший ключ для всех записей блока
(дорожки);
·
наличие повторяющихся значений ключа недопустимо;
·
эффективность доступа зависит от числа уровней индексации,
распределения памяти для размещения индекса, числа записей в файле и размера
области переполнения.
Для прямого доступа характерны следующие особенности:
·
не требуется упорядоченность записей файла;
·
наличие повторяющихся значений ключа недопустимо;
·
значениям нескольких ключей может соответствовать один и тот
же адрес (блок).
При прямом
доступе идет установление соответствия между адресом хранения записи и
значением его ключевого элемента. Доступ к записи осуществляется через
переходные таблицы и соответствующие алгоритмов хеширования, которые
представляют собой процедуру вычисления адреса записи на основании некоторого
поля записи (ключа).
На выбор
между названными выше методами организации файлов существенное влияние
оказывает количество записей, которое должно быть обработано в процессе
реализации запроса. Этот параметр называется долей выборки и равен отношению
числа требуемых при выборке записей файла к общему числу записей в файле.
При последовательной организации
данных записи располагаются в памяти строго одна за другой, без промежутков, в
той последовательности, в которой они обрабатываются. Последовательная
организация данных соответствует понятию «массив» (файл).
Ключевые реквизиты в записях
обозначаются через p(i), где i - номер
записи, общее число записей в массиве обозначается через М.
Записи массива могут быть упорядоченными
или неупорядоченными по значениям ключевого реквизита (ключа), имя которого
одинаково во всех записях. Ключевой реквизит обычно является
реквизитом-признаком. Часто требуется поддерживать упорядоченность записей по
нескольким именам ключевых признаков. В этом случае среди признаков
устанавливается старшинство.
Условие упорядоченности записей в
массиве (и вообще для линейной организации данных) выглядит следующим образом:
p(i) <= р (i + 1) -упорядоченность по возрастанию;
р(i) => p (i+l) - упорядоченность по убыванию.
Поиском называется процедура
выделения из некоторого множества записей определенного подмножества, записи
которого удовлетворяют некоторому заранее поставленному условию. Условие поиска
часто называют запросом на поиск. Простейшим условием поиска является поиск по
совпадению, т.е. равенство значения ключевого атрибута i-й записи p(i) и некоторого заранее заданного значения
q [1].
Задание 3.1. Напишите программу последовательного поиска в
последовательном неотсортированном массиве реквизитов единственного значения q.
Используйте любой доступный вам язык программирования.
Задание
3.2. Индексируйте приведенный ниже
файл (Таблица
3.1) по реквизиту В.
Необходимые дополнительные параметры выберите самостоятельно.
Таблица 3.1.
Состав
реквизитов файла
А |
В |
Физический адрес |
020 |
10 |
5110 |
030 |
15 |
5120 |
130 |
19 |
5220 |
070 |
25 |
5160 |
080 |
29 |
5170 |
150 |
34 |
5240 |
050 |
36 |
5140 |
090 |
45 |
5180 |
160 |
55 |
5250 |
100 |
59 |
5190 |
110 |
65 |
5200 |
140 |
72 |
5230 |
060 |
75 |
5150 |
010 |
80 |
5100 |
040 |
89 |
5130 |
120 |
98 |
5210 |
1.
Что такое
структуры данных?
2.
Какие бывают
структуры данных?
3.
Что такое
документ?
4.
Какие бывают
документы?
5.
Опишите структуру
документа.
6.
Назовите основные
правила построения документов.
7.
Что такое
структуры хранение?
8.
Какие бывают
структуры хранения?
9.
Назовите достоинства
и недостатки физически-последовательной и логически-последовательной
организаций файла.
10. Что такое индексно-последовательный файл?
11. Перечислите особенности прямого доступа.
1.
Мишенин А. И.
Теория экономических информационных систем: учебник. – 4-е изд., доп. и
перераб. – М.: Финансы и статистика, 2007, Глава 3, с.141-167.
2.
Мишенин А. И.
Теория экономических информационных систем. Практикум: учеб. пособие. – М.:
Финансы и статистика, 2007, Глава 3, с.130-138.
Содержание
темы:
1. Иерархические, сетевые, реляционные, многомерные
модели представления данных.
2. Связи между данными в реляционной модели.
3. Операции, выполняемые над отношениями.
4. Виды функциональных зависимостей, нормализация
отношений в реляционных базах данных.
5. Модели представления знаний в корпоративных
системах.
Понятие логическая структура тесно
взаимосвязана с понятием модель данных,
которая в свою очередь и является основополагающим
принципом построения логических структур данных.
К числу
классических относятся следующие модели данных:
· иерархическая;
· сетевая;
· реляционная.
Кроме того, в
последние годы появились и стали более активно внедряться на практике следующие
модели данных:
· постреляционная;
· многомерная;
· объектно-ориентированная.
В иерархической модели связи
между данными можно описать с помощью упорядоченного
графа (или дерева) [4, 9]. Упрощенно представление связей между данными в
иерархической модели показано на рис.
4.1.
Рис. 4.1. Иерархическая модель данных
К достоинствам
иерархической модели данных относятся эффективное использование памяти ЭВМ
и неплохие показатели времени выполнения основных операций над данными.
Иерархическая модель данных удобна для работы с иерархически упорядоченной
информацией.
Недостатком иерархической модели является ее громоздкость для
обработки информации с достаточно сложными логическими связями, а также
сложность понимания для обычного пользователя.
Сетевая модель данных позволяет отображать
разнообразные взаимосвязи элементов данных в виде произвольного графа, обобщая
тем самым иерархическую
модель данных (рис. 4.2) [9]. Наиболее полно
концепция сетевых БД впервые была изложена в Предложениях группы КОДАСИЛ
(KODASYL).
Рис. 4.2. Сетевая модель данных
Сетевая БД состоит из набора записей и набора соответствующих связей. На
формирование связи
особых ограничений не накладывается. Если в иерархических структурах запись-потомок
могла иметь только одну запись-предка, то в сетевой модели данных запись-потомок может иметь
произвольное число записей-предков
(сводных родителей).
Достоинством сетевой модели данных является возможность эффективной
реализации по показателям затрат памяти и оперативности. В сравнении с
иерархической моделью сетевая модель предоставляет большие возможности в смысле
допустимости образования произвольных связей.
Недостатком сетевой модели данных является высокая сложность и
жесткость схемы БД, построенной на ее основе, а также сложность для понимания и
выполнения обработки информации в БД обычным пользователем. Кроме того, в
сетевой модели данных ослаблен контроль целостности связей вследствие
допустимости установления произвольных связей между записями.
Реляционная модель данных предложена сотрудником фирмы lBM Эдгаром Коддом и основывается на понятии отношение (relation).
Реляционная
модель данных – модель данных, представленная в виде совокупности
взаимосвязанных таблиц.
Отношение представляет собой множество элементов, называемых
кортежами. Наглядной формой представления отношения
является привычная для человеческого восприятия двумерная таблица.
Таблица имеет строки
(записи) и столбцы (колонки). Каждая строка таблицы имеет одинаковую структуру
и состоит из полей. Строкам таблицы соответствуют кортежи, а столбцам —
атрибуты отношения.
Достоинство реляционной модели данных заключается в простоте, понятности и удобстве
физической реализации на ЭВМ. Именно простота и понятность для пользователя
явились основной причиной их широкого использования. Проблемы же эффективности обработки данных этого типа оказались
технически вполне разрешимыми.
Основными недостатками реляционной модели являются следующие: отсутствие стандартных средств идентификации отдельных
записей и сложность описания иерархических и сетевых связей.
В остальных
разделах данной темы речь будет идти о реляционных моделях данных.
Многомерный подход к представлению данных в базе появился практически одновременно с
реляционным, но реально работающих многомерных СУБД (МСУБД) до настоящего
времени было очень мало [9]. С середины 90-х годов интерес к ним стал
приобретать массовый характер.
Толчком
послужила в 1993 году программная статья одного из основоположников
реляционного подхода Э. Кодда. В ней сформулированы 12 основных требований к
системам класса OLAP (OnLine Analytical Processing — оперативная аналитическая обработка), важнейшие из
которых связаны с возможностями концептуального представления и обработки
многомерных данных. Многомерные системы позволяют оперативно обрабатывать
информацию для проведения анализа и принятия решения. Многомерные СУБД являются
узкоспециализированными СУБД, предназначенными для интерактивной аналитической
обработки информации.
Отношение является важнейшим понятием и представляет собой двумерную таблицу, содержащую некоторые данные.
Сущность есть объект любой природы, данные о котором хранятся в базе данных. Данные о сущности хранятся в отношении.
Атрибуты представляют собой свойства, характеризующие сущность.
В структуре таблицы каждый атрибут
именуется и ему соответствует заголовок некоторого столбца таблицы.
Первичным ключом
(ключом отношения, ключевым атрибутом) называется атрибут отношения,
однозначно идентифицирующий каждый из его кортежей.
Каждое отношение
обязательно имеет комбинацию атрибутов, которая может служить ключом.
Поскольку не
всякой таблице можно поставить в соответствие отношение, приведем условия,
выполнение которых позволяет таблицу считать отношением.
1.
Все строки
таблицы должны быть уникальны, то есть не может быть строк с одинаковыми
первичными ключами.
2.
Имена столбцов таблицы должны быть различны, а значения их простыми, то есть недопустима группа
значений в одном столбце одной строки.
3.
Все строки одной
таблицы должны иметь одну структуру, соответствующую именам и типам столбцов.
4.
Порядок
размещения строк в таблице может быть произвольным.
Наиболее
часто таблица с отношением размещается в отдельном файле.
Между таблицами могут
устанавливаться бинарные (между двумя таблицами), тернарные (между тремя
таблицами) и, в общем случае, n-арные связи.
Рассмотрим наиболее часто встречающиеся бинарные связи.
В зависимости от
того, как определены поля связи основной и дополнительной таблиц (как соотносятся ключевые поля с полями связи), между
двумя таблицами в общем случае могут устанавливаться следующие четыре
основных вида связи:
· один-ко-одному (1:1) - однозначное соответствие
элементов, т.е. одному значению элемента соответствует только одно значение
другого (например, каждому значению Табельного номера соответствует однозначно
только одна Фамилия сотрудника);
· один-ко-многим (l:M) -
многозначное соответствие, в которой одному значению элемента соответствует
несколько значений другого (например, одной учебной группе соответствует
несколько студентов);
· многие-к-одному (M:1) - обратный случай
один-ко-многим (например, нескольким студентам соответствует только одна
учебная группа);
· многие-ко-многим (M:M или M:N) -
множеству значений одного элемента соответствует множество значений другого
элемента (например, нескольким преподавателям соответствует несколько учебных
групп).
Операции,
выполняемые над отношениями, можно разделить на две группы. Первую группу
составляют операции над множествами, к которым относятся операции: объединения,
пересечения, разности, деления и декартова произведения. Вторую группу
составляют специальные операции над отношениями, к которым, в частности, относятся
операции: проекции, соединения, выбора. Классификация операций, выполняемых над
отношениями, представлена на рис.
4.3 [9].
Рис. 4.3. Классификация операций, выполняемых над
отношениями
В реляционных
СУБД для выполнения операций над отношениями используются две группы языков,
имеющие в качестве своей математической основы теоретические языки
запросов, предложенные Э.Коддом:
· реляционная алгебра;
· реляционное исчисление.
Эти языки
представляют минимальные возможности реальных языков манипулирования данными в
соответствии с реляционной моделью и эквивалентны друг другу по своим
выразительным возможностям. Существуют не очень сложные правила преобразования
запросов между ними.
Реляционная
алгебра как теоретический язык
запросов по сравнению с реляционным
исчислением более наглядно описывает выполняемые над отношениями
действия.
Языки исчислений,
в отличие от реляционной алгебры, являются непроцедурными (описательными,
или декларативными) и позволяют выражать запросы с помощью предиката первого
порядка (высказывания в виде функции), которому должны удовлетворять кортежи
или домены отношений. Запрос к БД, выполненный с использованием подобного
языка, содержит лишь информацию о желаемом результате. Для этих языков
характерно наличие наборов правил для
записи запросов. В частности, к языкам этой группы относится SQL.
Операции
реляционной алгебры Кодда можно
разделить на две группы: базовые
теоретико-множественные и специальные
реляционные. Первая группа
операций включает в себя классические операции теории множеств: объединение,
разность, пересечение и произведение. Вторая группа представляет собой
развитие обычных теоретико-множественных операций в направлении к реальным
задачам манипулирования данными, в ее состав входят следующие операции:
проекция, селекция, деление и соединение.
Базовые теоретико-множественные операции.
Объединением двух совместимых[1]
отношений R1 и R2 одинаковой размерности
(R1 UNION R2)
является отношение R, содержащее все элементы
исходных отношений (с исключением повторений).
Пример приведен
на рис.
4.4.
Рис. 4.4. Пример операции объединения
Вычитанием совместимых отношений R1 и R2 одинаковой размерности (R1 MINUS R2) является отношение, тело которого состоит из
множества кортежей, принадлежащих R1, но не
принадлежащих отношению R2.
Пример приведен
на рис.
4.5.
Рис. 4.5. Пример операции вычитания
Пересечение
двух совместимых отношений R1 и R2 одинаковой
размерности (R1 INTERSECT R2) порождает отношение R с телом, включающим в себя кортежи, одновременно
принадлежащие обоим исходным отношениям.
Пример приведен
на рис.
4.6.
Рис. 4.6. Пример операции пересечения
Произведением отношения R1 и
отношения R2 (R1 TIMES R2),
которые не имеют одинаковых имен атрибутов, является такое отношение R, представляющие собой все возможные комбинации
кортежей исходных отношений. Если одно отношение содержит m атрибутов, а второе
– n атрибутов, то их произведение будет содержать m+n атрибутов.
Пример произведения
приведен на рис.
4.7.
Рис. 4.7. Пример операции произведения
Операции объединения,
пересечения и умножения являются коммутативными,
т.е. порядок их операндов не имеет значения.
Например, выражение A UNION B
эквивалентно выражению B UNION A.
Операция вычитание не является коммутативным
Специальные реляционные операции.
Проекция – выборка
необходимых атрибутов (столбцов) из отношения (Project R1 [имя, город]). Пример проекции приведен на рис. 4.8.
Рис. 4.8. Пример операции проекция
Селекция – выборка кортежей
по заданному условию (Select R1 where П=1). Пример приведен на рис. 4.9.
Рис. 4.9. Пример операции селекция
Деление (R1 DEVIDE R2).
Результатом операции деления, т.е. частным двух отношений, является набор
кортежей делимого, не содержащий атрибутов, общих для делимого и делителя.
Каждому кортежу частного должны соответствовать все кортежи делителя. Пример
приведен на рис.
4.10.
Рис. 4.10. Пример операции деления
Соединение - выполняется над
двумя отношениями, у которых должен быть хотя бы один общий атрибут.
Различают следующие виды
соединения:
· Эквисоединение (соединение по условию равенства);
·
Тетасоединение (с
использованием операций <, >, <>);
· Внутреннее соединение;
· Правое внешнее соединение;
· Левое внешнее соединение.
Далее на примерах рассмотрим
внутреннее соединение, правое внешнее соединение, левое внешнее соединение. Все
три перечисленных соединения относятся к эквисоединению. На рис. 4.11 приведены исходные отношения R1 и R2, имеющие один
общий атрибут Код клиента.
Рис. 4.11. Исходные отношения
Внутренне соединение (INNER
JOIN) - соединение с удалением
тех кортежей, для которых не нашлось пары.
Записывается следующим образом:
R1 INNER
JOIN R2 WHERE
R1.Код_Клиента=R2.Код_Клиента
Результат внутреннего соединения
(отношение R) приведен в Таблица 4.1.
Таблица 4.1.
Результат
операции внутреннего соединения
Номер Заказа |
Код Клиента |
Товар |
Количество |
ФИО |
Адрес |
001 |
К1 |
Болт |
10 |
Иванов |
Москва |
002 |
К2 |
Гайка |
20 |
Петров |
Киев |
003 |
К1 |
Шуруп |
15 |
Иванов |
Москва |
004 |
К3 |
Винт |
35 |
Сидоров |
СПб |
При левом внешнем соединении (LEFT
OUTER JOIN или LEFT JOIN) в новое отношение включаются все кортежи из левого
относительно оператора JOIN отношения и
только те кортежи правого отношения, для которых нашлись пары.
Записывается следующим образом:
R1 LEFT
JOIN R2 WHERE
R1.Код_Клиента=R2.Код_Клиента
Результат левого внешнего
соединения приведен в Таблица
4.2.
Таблица 4.2.
Результат
операции левого внешнего соединения
Номер Заказа |
Код Клиента |
Товар |
Количество |
ФИО |
Адрес |
001 |
К1 |
Болт |
10 |
Иванов |
Москва |
002 |
К2 |
Гайка |
20 |
Петров |
Киев |
003 |
К1 |
Шуруп |
15 |
Иванов |
Москва |
004 |
К3 |
Винт |
35 |
Сидоров |
СПб |
005 |
0 |
Деталь |
0 |
|
|
При правом внешнем соединении (RIGHT
OUTER JOIN или RIGHT JOIN) в новое отношение включаются все кортежи из правого
относительно оператора JOIN отношения и
только те кортежи левого отношения, для которых нашлись пары.
Записывается следующим образом:
R1 RIGHT
JOIN R2 WHERE
R1.Код_Клиента=R2.Код_Клиента
Результат правого внешнего соединения приведен в Таблица 4.3
Таблица 4.3.
Результат
операции правого внешнего соединения
Номер Заказа |
Код Клиента |
Товар |
Количество |
ФИО |
Адрес |
001 |
К1 |
Болт |
10 |
Иванов |
Москва |
002 |
К2 |
Гайка |
20 |
Петров |
Киев |
003 |
К1 |
Шуруп |
15 |
Иванов |
Москва |
004 |
К3 |
Винт |
35 |
Сидоров |
СПб |
|
К4 |
|
|
Козлов |
Ростов |
|
К5 |
|
|
Егоров |
Минск |
Функциональная зависимость (ФЗ)- один из
возможных типов зависимостей между атрибутами отношения. Для каждого отношения
существует вполне определенное множество функциональных зависимостей между его
атрибутами [1, 9].
Введем понятие функциональной зависимости.
Атрибут В функционально
зависит от атрибута А, если каждому значению А соответствует в точности
одно значение В. Математически функциональная зависимость В от А обозначается
записью A
à B. Это означает, что во всех кортежах с одинаковым
значением атрибута А атрибут В будет иметь также одно и то же значение.
Отметим, что А и В могут быть составными, т.е. состоять из двух и более
атрибутов.
Различают четыре
вида ФЗ.
Полная ФЗ – имеется в отношении, в котором
каждый непервичный атрибут зависит от первичного.
Частичная ФЗ
– неключевой атрибут функционально полно зависит от части ключа (составного
ключа).
Атрибут С
зависит от атрибута А транзитивно (существует транзитивная
ФЗ), если для атрибутов А, В, С выполняются условия A à B и B à C, но обратная зависимость отсутствует.
В отношении R атрибут В многозначно зависит (существует
многозначная ФЗ) от атрибута А, если каждому значению А соответствует
множество значений В, не связанных с другими атрибутами из R.
Например,
предположим, что для учебной части факультета создается БД о преподавателях (Таблица 4.4) [9]. На первом этапе
проектирования БД в результате общения с заказчиком (заведующим учебной частью)
должны быть определены содержащиеся в базе сведения о том, как она должна
использоваться и какую информацию заказчик хочет получать в процессе ее
эксплуатации. В результате устанавливаются атрибуты, которые должны содержаться
в отношениях БД, и связи между ними. На данном этапе в качестве первичного
ключа был выбран набор атрибутов ФИО,
Предм, Группа.
Таблица 4.4.
Исходное
отношение для БД о преподавателях
ФИО |
Должн |
Оклад |
Стаж |
Д-Стаж |
Каф |
Предм |
Группа |
ВидЗан |
Иванов И.М. |
Преп |
500 |
5 |
100 |
25 |
СУБД |
256 |
Практ |
Иванов И.М. |
Преп |
500 |
5 |
100 |
25 |
ИСиТ |
123 |
Практ |
Петров М.И. |
Ст.преп |
800 |
7 |
100 |
25 |
СУБД |
256 |
Лекция |
Петров М.И. |
Ст.преп |
800 |
7 |
100 |
25 |
ОС |
256 |
Практ |
Сидоров Н.Г. |
Преп |
500 |
10 |
150 |
25 |
ИСиТ |
123 |
Лекция |
Сидоров Н.Г. |
Преп |
500 |
10 |
150 |
25 |
ОС |
256 |
Лекция |
Егоров В.В. |
Преп |
500 |
5 |
100 |
24 |
ЭВМ |
244 |
Лекция |
В данном примере иллюстрацией полной ФЗ
является зависимость атрибута ВидЗан от всего составного первичного ключа (вид
занятия зависит и от преподавателя (ФИО), предмета и группы). Примером
частичной зависимости является зависимость атрибута Должн от части первичного
ключа, а именно от атрибута ФИО. Примером транзитивной зависимости является
зависимость ФИО à Должн à Оклад (оклад зависит от должности, должность зависит от ФИО,
таким образом, между атрибутами Оклад и ФИО имеет место быть транзитивная
зависимость).
Задача группировки атрибутов в отношения
при условии, что набор возможных отношений заранее не фиксирован, допускает большое
количество различных вариантов и приводит к проблеме выбора рационального
варианта из множества альтернативных вариантов схем отношения.
Рациональные варианты группировки
атрибутов в отношения должны отвечать следующим требованиям:
· выбранные для отношения первичные ключи должны быть минимальными;
· выбранный состав отношений базы должен быть минимальным
(отличаться минимальной избыточностью атрибутов);
· при выполнении операций включения, удаления и модификации данных в
базе не должно быть трудностей;
· перестройка набора отношений при введении новых типов данных
должна быть минимальной;
· разброс времени ответа на различные запросы к БД должен быть
небольшим.
Трудности (аномалии) выполнения операций
включения, удаления и модификации данных при неправильном проекте базы
заключается в следующем.
Аномалии
модификации (корректировки) проявляются
в том, что изменение значения одного данного может повлечь за собой просмотр
всей таблицы и соответствующее изменение некоторых других записей таблицы.
Например, Иванов И.М. стал старшим преподавателем, в связи с чем необходимо
произвести коррективу в нескольких ячейках.
Аномалии
удаления состоят в том, что при
удалении какого-либо данного из таблицы может пропасть и другая информация,
которая не связана напрямую с удаляемыми данными. Например, при увольнении
сотрудника Петрова М.И., удаляются из базы соответствующие записи, но при этом
теряется и информация по старшим преподавателям.
Аномалии
добавления возникают в случаях, когда
информацию в таблицу нельзя поместить до тех пор, пока она неполная, либо
вставка новой записи требует дополнительного просмотра таблицы. Например,
необходимо добавить справочную информацию по должности Профессор, на такой
возможности нет из-за отсутствия данных по преподавателю, предмету и группе
(данные столбцы являются ключевыми, т.е. обязательными для заполнения).
Чтобы решить все перечисленные проблемы,
выполняется нормализация исходных схем отношений проекта базы данных, их
композиция, декомпозиция, назначение ключей для каждого отношения по
определенным правилам нормализации.
Введено пять уровней нормализации схем
отношений и соответственно шесть нормальных форм отношений: 1НФ, 2НФ, 3НФ,
НФБК, 4НФ, 5НФ.
Каждая нормальная форма ограничивает
определенный тип функциональной зависимости и устраняет соответствующие
аномалии при выполнении операций над отношениями БД.
Исходное
отношение ПРЕПОДАВАТЕЛЬ, используемое для иллюстрации метода, имеет составной
ключ ФИО. Предм. Группа и
находится в 1НФ, поскольку все его атрибуты простые.
Отношение находится в первой нормальной форме в
том случае, если непервичные элементы отношения функционально зависят от
первичных (ключевых) элементов или схема отношения находится в первой
нормальной форме тогда и только тогда, когда все входящие в нее атрибуты
являются атомарными (т.е. значения соответствующих доменов рассматриваются как
неделимые, а не как множества или кортежи из более элементарных доменов).
Вторая
нормальная форма. Отношение
находится в 2НФ, если оно находится в 1НФ
и каждый неключевой атрибут функционально полно зависит от
первичного ключа (составного).
Для устранения
частичной зависимости и перевода отношения в 2НФ необходимо, используя операцию
проекции, разложить его на несколько отношений следующим образом: Определить
атрибуты, которые функционально зависят от части ключа (сделать на них
проекцию), и вынести их в отдельную таблицу. В результате получим два отношения
R1 и R2 в 2НФ,
представленные соответственно в Таблица
4.5. и Таблица
4.6
Таблица 4.5.
Отношение R1 во 2 НФ
ФИО |
Предм |
Группа |
ВидЗан |
Иванов И.М. |
СУБД |
256 |
Практ |
Иванов И.М. |
ИСиТ |
123 |
Практ |
Петров М.И. |
СУБД |
256 |
Лекция |
Петров М.И. |
ОС |
256 |
Практ |
Сидоров Н.Г. |
ИСиТ |
123 |
Лекция |
Сидоров Н.Г. |
ОС |
256 |
Лекция |
Егоров В.В. |
ЭВМ |
244 |
Лекция |
Таблица 4.6.
Отношение R2 во 2НФ
ФИО |
Должн |
Оклад |
Стаж |
Д-Стаж |
Каф |
Иванов И.М. |
Преп |
500 |
5 |
100 |
25 |
Петров М.И. |
Ст.преп |
800 |
7 |
100 |
25 |
Сидоров Н.Г. |
Преп |
500 |
10 |
150 |
25 |
Егоров В.В. |
Преп |
500 |
5 |
100 |
24 |
Отношение
находится в третьей нормальной форме, если оно находится в 2НФ, и каждый
неключевой атрибут нетранзитивно зависит от первичного ключа. В отношение R2 имеют место быть две транзитивные зависимости: ФИО à Должн à Оклад и ФИО à Стаж à Д-стаж. Транзитивные зависимости также порождают избыточное
дублирование информации в отношении. Устраним их. Для этого преобразуем
отношение R2 следующим образом и получим
отношения R3, R4 и R5,
представленные соответственно в Таблица
4.7., Таблица
4.8., Таблица
4.9.
Таблица 4.7.
Отношение R3 в 3НФ
ФИО |
Должн |
Стаж |
Каф |
Иванов И.М. |
Преп |
5 |
25 |
Петров М.И. |
Ст.преп |
7 |
25 |
Сидоров Н.Г. |
Преп |
10 |
25 |
Егоров В.В. |
Преп |
5 |
24 |
Таблица 4.8.
Отношение R4 в 3НФ
Должн |
Оклад |
Преп |
500 |
Ст.преп |
800 |
Таблица 4.9.
Отношение R5 в 3НФ
Стаж |
Д-Стаж |
5 |
100 |
7 |
100 |
10 |
150 |
На практике
построение ЗНФ схем отношений в большинстве случаев является достаточным и
приведением к ним процесс проектирования реляционной БД заканчивается.
Действительно, приведение отношений к ЗНФ в нашем примере, привело к устранению
избыточного дублирования.
Усиленная ЗНФ или
нормальная
форма Бойса - Кодда (БКНФ). Отношение находится в БКНФ, если оно
находится в ЗНФ и в нем отсутствуют зависимости ключей (атрибутов составного
ключа) от неключевых атрибутов.
Отношение R находится в четвертой нормальной форме (4НФ) в
том и только в том случае, когда существует многозначная зависимость A à B, а все
остальные атрибуты R функционально зависят от А.
В заключении следует отметить, что процесс
нормализации отношений позволяет исключить дублирование данных и аномалии при
выполнении операций включения, удаления, обновления и сводится к
последовательному устранению следующих типов функциональных зависимостей:
- частичные (неполные) зависимости неключевых атрибутов от ключа;
- транзитивные зависимости неключевых атрибутов от ключа;
- зависимости ключей от неключевых атрибутов;
- независимые многозначные зависимости.
Система
понятий для представления знаний существенно отличается от понятий для
представления данных, поэтому отображение знаний производится в базу знаний.
Вместе с тем, база знаний способна хранить данные как простую разновидность
знаний.
Запросы, которые формулируются пользователями информационной системы,
реализуются одним из двух возможных способов:
·
сообщения, являющиеся ответом на запрос, хранятся в явном
виде в БД, и процесс получения ответа представляет собой выделение подмножества
значений из файлов БД, удовлетворяющих запросу;
·
ответ не существует в явном виде в БД и формируется в
процессе логического вывода на основании имеющихся данных [1].
Последний
случай принципиально отличается от рассмотренной ранее технологии использования
баз данных и рассматривается в рамках представления знаний, т. е. информации, необходимой
в процессе вывода новых фактов.
База знаний содержит:
·
сведения, которые отражают существующие в предметной области
закономерности и позволяют выводить новые факты, справедливые в данном
состоянии предметной области, но отсутствующие в БД, а также прогнозировать
потенциально возможные состояния предметной области;
·
сведения о структуре ИС и БД (метаинформация);
·
сведения, обеспечивающие понимание входного языка, т. е.
перевод входных запросов во внутренний язык.
Принято
говорить не о "знаниях вообще", а о знаниях, зафиксированных с
помощью той или иной модели знаний.
Принципиальными
различиями обладают три модели представления знаний: продукционная модель,
модель фреймов и модель семантических сетей.
Продукционная модель знаний.
Продукционная
модель состоит из трех основных компонентов:
·
набора правил, представляющего собой в продукционной системе
базу знаний;
·
рабочей памяти, в которой хранятся исходные факты и
результаты выводов, полученных из этих фактов;
·
механизма логического вывода, использующего правила в
соответствии с содержимым рабочей памяти и формирующего новые факты.
Каждое
правило содержит условную и заключительную части. В условной части правила находится
одиночный факт либо несколько фактов (условий), соединенных логической
операцией "И". В заключительной части правило находятся факты,
которые необходимо дополнительно сформировать в рабочей памяти, если условная
часть правила является истинной.
Модель
предусматривает разработку системы продукционных правил (правил продукций),
имеющих вид:
ЕСЛИ А1 И А2 И ... И Аn, ТО B1 ИЛИ
В2 ИЛИ ... ИЛИ ВN,
где Аi и Bj
— некоторые высказывания, к которым применены логические операции И и ИЛИ. Если
высказывания в левой части правила (ее часто называют антецедент — условие,
причина) истинно, истинно и высказывание в правой части (консеквент —
следствие) [8].
Полнота базы
знаний (базы правил) определяет возможности системы по удовлетворению
потребностей пользователей. Логический вывод в продукционных системах основан
на построении прямой и обратной цепочек заключений, образуемых в результате
последовательного просмотра левых и правых частей соответствующих правил,
вплоть до получения окончательного заключения.
Пусть в
некоторой области памяти (базе знаний) хранятся следующие правила (суждения):
· правило 1:
ЕСЛИ в стране происходит падение курса национальной валюты, ТО материальное
положение населения ухудшается;
· правило 2:
ЕСЛИ объемы производства в стране падают, ТО курс национальной валюты
снижается;
· правило 3:
ЕСЛИ материальное положение населения ухудшается, ТО уровень смертности в
стране возрастает.
Если на вход
системы поступит новый факт (факт 1) «В стране высокий уровень падения объемов
производства», то из правил можно построить цепочку рассуждений и
сформулировать два заключения: где заключение 1 (промежуточный вывод) —
«Материальное положение населения ухудшается»; заключение 2 (окончательный
вывод) — «В стране возрастает уровень смертности».
Отметим, что
в современных экспертных системах в базе знаний могут храниться тысячи правил,
а коммерческая стоимость одного невыводимого (нового, дополнительного) правила
весьма высока.
Представление
знаний в виде набора правил имеет следующие преимущества:
· простота
создания и понимания отдельных правил;
· простота
механизма логического вывода.
К
недостаткам этого способа организации базы знаний относятся неясность взаимных
отношений правил и отличие от человеческой структуры знаний.
Фреймы.
В основе теории фреймов лежит фиксация знаний путем сопоставления новых
фактов с рамками, определенными для каждого объекта в сознании человека. Структура в
памяти ЭВМ, представляющая эти рамки, называется фреймом. С помощью
фреймов мы пытаемся представить процесс систематизации знаний в форме,
максимально близкой к принципам систематизации знаний человеком.
Фрейм
представляет собой таблицу, структура и принципы организации которой являются
развитием понятия отношения в реляционной модели данных [1]. Новизна фреймов определяется двумя условиями:
·
имя атрибута может в ряде случаев занимать в фрейме позицию
значения,
·
значением атрибута может служить имя другого фрейма или имя
программно реализованной процедуры.
Фреймовые системы обеспечивают ряд
преимуществ по сравнению с продукционной моделью представления
знаний:
·
знания организованы на основе концептуальных объектов;
·
допускается комбинация представления декларативных (как
устроен объект) и процедурных (как взаимодействует объект) знаний;
·
иерархия фреймов вполне соответствует классификации понятий,
привычной для восприятия человеком;
·
система фреймов легко расширяется и модифицируется.
Трудности
применения фреймовой модели знаний в основном связаны с программированием
присоединенных процедур.
Семантические сети.
Особенность
семантической сети как модели знаний состоит в единстве базы знаний и механизма
вывода новых фактов [1]. На основании вопроса к базе знаний строится
семантическая сеть, отображающая структуру вопроса, и ответ получается в
результате сопоставления общей сети для базы знаний в целом и сети для вопроса.
Рис. 4.12.Пример семантической сети
Рис. 4.13. Пример сети вопроса
Рассмотрим
пример семантической сети, отображающий подчиненность сотрудников в отделе
учреждения, приведенный на рис. 4.12. Приводятся связи, показывающие подчиненность первого
сотрудника. Остальные сотрудники отдела связываются через вершины сети связями
типа "руководит 2", "руководит 3" и т. д. Вопрос "Кто
руководит Серовым?" представляется в виде подсети, показанной на рис. 4.13. Сопоставление общей сети с сетью запроса начинается
с фиксации вершины "руководит", имеющей ветвь "объект",
направленную к вершине "Серов". Затем производится переход по ветви
"руководит", что и приводит к ответу "Петров".
Преимущества
семантических сетей состоят в том, что это достаточно понятный способ
представления знаний на основе отношений между вершинами и дугами сети. Однако
с увеличением размеров сети ухудшается ее обозримость и увеличивается время
вывода новых фактов с помощью механизма сопоставления.
Вывод: Модели знаний - продукционная, фреймовая и модель
семантических сетей - обладают практически равными возможностями представления
знаний, использующих отношения "есть-нек" и "есть-часть".
Дополнительно каждая модель знаний содержит средства усиления этой
"базовой" конфигурации:
· продукционная
модель позволяет легко расширять и усложнять множество правил вывода;
· фреймовая
модель позволяет усилить вычислительные аспекты обработки знаний за счет
расширения множества присоединенных процедур;
· модель
семантических сетей позволяет расширять список отношений между вершинами и
дугами сети, приближая выразительные возможности сети к уровню естественного
языка.
Задание 4.1. Пусть задана составная единица информации из
реквизитов: наименование вуза, наименование факультета, наименование кафедры.
Укажите не менее трех возможных связей между указанными реквизитами, определите
тип связей (1:1, М: 1, 1:М, М:М).
Задание 4.2. Пусть заданы следующие информационные
сущности:
1. Изделие (Код_изделия, Наименование,
Производитель, Цена_Производителя).
2. Поставщик (Наименование_Поставщика,
Код_Поставщика, Адрес_Поставщика).
3. Поставка (Код_Поставки, Код_Поставщика,
Код_Изделия, Дата, Количество, Цена).
Постройте соответствующие
таблицы, определите ключи, связи, типы всех реквизитов. Выполните реквизитный
анализ для указанных таблиц.
Задание 4.3. Укажите функциональные зависимости в
следующих отношениях. Найдите вероятные ключи.
1. Т0(ФИО, отдел, руководитель
отдела);
2. Т1(ФИО, отдел, должность);
3. Т2(отдел, проект, число
исполнителей);
4. ТЗ(электродвигатель,
мощность, покупатель, купленное количество);
5. Т4(преподаватель, кафедра,
факультет);
6. Т5(автор, статья, журнал);
7. Т6(преподаватель, кафедра,
дисциплина);
8. Т7(автомобиль,
грузоподъемность, расход топлива);
9. Т8(отрасль, предприятие,
бригада);
10. Т9(изделие, деталь, вес
изделия).
Задание 4.4. В Таблица 4.10 даны списки реквизитов и их функциональные зависимости (выбрать один
вариант). Примените алгоритм получения отношений в ЗНФ, если ЗНФ не
соблюдается. Постройте реализацию полученных отношений средствами СУБД.
Таблица 4.10.
Реквизитный
состав предметной области
№ варианта |
Реквизиты |
Функциональные зависимости |
1 |
ФИО
вкладчика Номер
сберкнижки (номер) Дата
, Приход,
Расход,
Остаток |
номер
à фио номер,
дата à расход номер,
дата à остаток номер,
дата à приход, расход, остаток. Номер,
дата à приход |
2 |
Цех Год Код_станка количество
станков (кол-во) код_детали план
производства деталей |
цех,
код_станка à кол-во цех,
код_станка, код_детали à кол-во цех,
год, код_детали à план цех,
код_станка, год à кол-во |
3 |
фио
служащего (фио) должность Дата Зарплата Имя_ребенка Возраст
ребенка |
фио,
дата à должность фио
à должность фио,
дата à зарплата фио,
имя_ребенка à возраст |
4 |
Табельный
номер (таб. №) Фамилия
рабочего (фио) Цех Участок Дата Сумма
зарплаты (сумма) |
участок
à цех таб.
№ à цех таб.
№ à участок таб.
К», дата à сумма таб.
№ à фио таб.
№ à фио, участок |
5 |
Магазин Книга Цена Издательство Дата Количество
продано (кол-во) |
книга,
магазин à издательство магазин,
книга, дата à кол-во книга
à цена книга
à цена, издательство книга
à издательство |
6 |
Отправитель Получатель Адрес
получателя (адрес) Изделие Цена Кол-во
на месяц (кол-во) |
получатель,
изделие à адрес отправитель,
получатель, изделие à кол-во получатель
à адрес отправитель,
изделие à цена изделие
à цена |
7 |
Аэропорт
отправления номер
рейса (№ рейса) Количество
мест (кол-во) Бортовой
№ самолета Пункт
назначения Дата
вылета (дата) |
No рейса,
дата à № самолета №
самолета à кол-во №
рейса à пункт назначения №
рейса à пункт назначения,
аэропорт №
рейса à аэропорт |
8 |
фио
студента дата
поступления в вуз факультет группа место
работы Зарплата |
фио
à группа фио
à факультет фио
à дата группа
à факультет место
работы à зарплата фио
à группа, дата |
9 |
№
больницы №
палаты Пациент
Домашний
адрес Лечащий
врач (врач) Диагноз |
№
больницы, пациент à № палаты № больницы, пациент à врач пациент à домашний адрес № больницы, пациент à № палаты, врач |
10 |
дата
матча (дата) Команда-хозяин Команда-гость счет
матча число
очков в чемпионате |
дата,
команда-хозяин à счет дата,
команда-хозяин à число очков дата,
команда-хозяин à счет, число очков дата,
команда-хозяин, команда-гость à счет |
1.
Как между собой
взаимосвязаны понятия модель данных и логическая структура?
2.
Какие существую
модели данных?
3.
Назовите
достоинства и недостатки иерархической модели.
4.
Назовите
достоинства и недостатки сетевой модели.
5.
Что такое реляционная
модель данных?
6.
Что такое
отношение?
7.
Что из себя
представляют многомерные СУБД?
8.
Что такое
первичный ключ?
9.
Назовите основные
виды связей между таблицами.
10. Перечислите базовые теоретико-множественные операции
реляционной алгебры.
11. Перечислите специальные реляционные операции.
12. Что является результатом объединения двух отношений?
13. Что является результатом произведения двух отношений?
14. Что такое проекция?
15. Что такое селекция?
16. Что является результатом операции внутреннего
соединения?
17. Что является результатом левого внешнего соединения?
18. Что такое функциональная зависимость?
19. Какие бывают функциональные зависимости?
20. Какие могут возникнуть аномалии при модификации
данных? Приведите примеры.
21. При каких условиях отношение находится во 2 нормальной
форме?
22. При каких условиях отношение находится в 3 нормальной
форме?
23. Что такое база знаний?
24. Какие бывают модели знаний?
1.
Мишенин А. И.
Теория экономических информационных систем: учебник. – 4-е изд., доп. И
перераб. – М.: Финансы и статистика, 2007, Глава 2, стр.75-98.
2.
Хомоненко А. Д.,
Цыганков В. М., Мальцев М. Г. Базы данных: Учебник для
высших учебных заведений / под. Ред. Проф. А. Д. Хомоненко. – 5-е
изд., доп. – М.: Бином-Пресс; СПб.: КОРОНА принт, 2006, Глава 3, стр.57-65.
3.
Мишенин А. И.
Теория экономических информационных систем. Практикум: учеб. пособие. – М.:
Финансы и статистика, 2007, Глава 2, с.66-72, 79-82.
4.
Информационные
системы и технологии в экономике. Учебник. – Из 2-е, перераб. и доп./
Т. П. Барановская, В. И. Лойко, М. И. Семенов,
А .И. Трубилин. Под ред. В. И. Лойко. - М.: Финансы и
статистика, 2006, Глава 5, с.167-180.
5.
Уткин В. Б.
Информационные системы в экономике: Учебник для студ. высш. учеб, заведений /
В.Б. Уткин, К.В. Балдин. — М.: Издательский центр «Академия», 2004, Глава 13.
Содержание
темы:
1. Модели спецификации предметной области, систем
обработки экономической информации.
2. Правила построения информационной, функциональной и
динамической моделей в методологии IDEF.
Понятие
модели является ключевым в общей теории систем. Моделирование как мощный, а
часто и единственный метод исследования подразумевает замещение реального
объекта другим — материальным или идеальным. Важнейшими требованиями к любой
модели являются ее адекватность изучаемому объекту в рамках конкретной задачи и
реализуемость имеющимися средствами [8].
В теории
эффективности и информатике моделью объекта (системы, операции)
называется материальная или идеальная (мысленно представимая) система,
создаваемая и/или используемая при решении конкретной задачи с целью получения
новых знаний об объекте-оригинале, адекватная ему с точки зрения изучаемых
свойств и более простая, чем оригинал, в остальных аспектах.
Классификация основных методов моделирования (и
соответствующих им моделей) представлена на рис. 5.1 [8].
Рис. 5.1. Классификация основных методов
моделирования
При исследовании экономических информационных систем
находят применение все методы моделирования, однако основное внимание будет
уделено графическому методу моделирования.
В настоящий момент к
семейству IDEF можно отнести следующие стандарты:
IDEF0 — Function
Modeling — методология функционального моделирования. С помощью наглядного
графического языка IDEF0 изучаемая система предстает перед разработчиками и
аналитиками в виде набора взаимосвязанных функций (функциональных блоков — в
терминах IDEF0). Как правило, моделирование средствами IDEF0 является первым
этапом изучения любой системы. Методологию IDEF0 можно считать следующим этапом
развития хорошо известного графического языка описания функциональных систем SADT
(Structured Analysis and Design Technique);
IDEF1 — Information
Modeling — методология моделирования информационных потоков внутри системы,
позволяющая отображать и анализировать их структуру и взаимосвязи;
IDEF1X (IDEF1 Extended)
— Data Modeling — методология построения реляционных структур (баз данных),
относится к типу методологий «Сущность-взаимосвязь» (ER — Entity-Relationship)
и, как правило, используется для моделирования реляционных баз данных, имеющих
отношение к рассматриваемой системе.
IDEF2 — Simulation
Model Design — методология динамического моделирования развития систем. В связи
с весьма серьезными сложностями анализа динамических систем от этого стандарта
практически отказались, и его развитие приостановилось на самом начальном этапе.
IDEF3 — методология
документирования процессов, происходящих в системе (например, на предприятии),
описываются сценарий и последовательность операций для каждого процесса. IDEF3
имеет прямую взаимосвязь с методологией IDEF0 — каждая функция (функциональный
блок) может быть представлена в виде отдельного процесса средствами IDEF3;
IDEF4 — Object-Oriented
Design — методология построения объектно-ориентированных систем, позволяют
отображать структуру объектов и заложенные принципы их взаимодействия, тем самым
позволяя анализировать и оптимизировать сложные объектно-ориентированные
системы;
IDEF5 — Ontology
Description Capture — Стандарт онтологического исследования сложных систем.
IDEF6 — Design
Rationale Capture — Обоснование проектных действий. Назначение IDEF6 состоит в
облегчении получения «знаний о способе» моделирования, их представления и
использования при разработке систем управления предприятиями.
IDEF7 — Information System Auditing — Аудит информационных систем. Этот метод определён как востребованный, однако так и
не был полностью разработан;
IDEF8 — User Interface
Modeling — Метод разработки интерфейсов взаимодействия оператора и системы
(пользовательских интерфейсов).
IDEF9 — Scenario-Driven
IS Design (Business Constraint Discovery method) — Метод исследования бизнес
ограничений был разработан для облегчения обнаружения и анализа ограничений в
условиях которых действует предприятие.
IDEF10 — Implementation Architecture Modeling — Моделирование архитектуры выполнения. Этот
метод определён как востребованный, однако так и не был полностью разработан;
IDEF11 — Information
Artifact Modeling. Этот метод определён как востребованный, однако так и не был
полностью разработан;
IDEF12 — Organization
Modeling — Организационное моделирование. Этот метод определён как
востребованный, однако так и не был полностью разработан;
IDEF13 — Three Schema
Mapping Design — Трёхсхемное проектирование преобразования данных. Этот метод
определён как востребованный, однако так и не был полностью разработан;
IDEF14 — Network Design
— Метод проектирования компьютерных сетей, основанный на анализе требований,
специфических сетевых компонентов, существующих конфигураций сетей.
Рассмотрим наиболее
широко применяющиеся стандарты IDEF: IDEF0, IDEF1X.
В IDEF0 система
представляется как совокупность взаимодействующих работ или функций. Такая
чисто функциональная ориентация является принципиальной - функции системы
анализируются независимо от объектов, которыми они оперируют. Это позволяет
более четко смоделировать логику и взаимодействие процессов организации. Под
моделью в IDEF0 понимают описание системы
(текстовое и графическое), которое должно дать ответ на некоторые заранее
определенные вопросы. Основу методологии IDEF0 составляет графический язык описания
бизнес-процессов. Модель в нотации IDEF0
представляет собой совокупность иерархически упорядоченных и взаимосвязанных
диаграмм [7]. Модель, построенная по методологии IDEF0, называет функциональной
моделью.
Моделируемая система
рассматривается как произвольное подмножество Вселенной. Система имеет границу,
которая отделяет ее от остальной Вселенной. Взаимодействие системы с окружающим
миром описывается как вход (нечто, что перерабатывается
системой), выход (результат деятельности системы), управление (стратегии и
процедуры, под управлением которых производится работа) и механизм (ресурсы,
необходимые для проведения работы). Находясь под управлением, система
преобразует входы в выходы, используя механизмы.
Контекстная
диаграмма является вершиной
древовидной структуры диаграмм и представляет собой самое общее описание
системы и ее взаимодействия с внешней средой (рис.
5.2) [7]. После описания системы в целом проводится разбиение
ее на крупные фрагменты. Этот процесс называется функциональной декомпозицией,
а диаграммы, которые описывают каждый фрагмент и взаимодействие фрагментов, называются диаграммами декомпозиции (рис. 5.3) [7]. После декомпозиции контекстной диаграммы проводится
декомпозиция каждого большого фрагмента системы на более мелкие и т. д., до
достижения нужного уровня подробности описания. После каждого сеанса
декомпозиции проводятся сеансы экспертизы-эксперты предметной области указывают
на соответствие реальных бизнес-процессов созданным диаграммам. Найденные
несоответствия исправляются, и только после прохождения экспертизы без
замечаний можно приступать к следующему сеансу декомпозиции. Так достигается
соответствие модели реальным бизнес-процессам на любом уровне модели. Синтаксис
описания системы в целом и каждого ее фрагмента одинаков во всей модели.
Рис. 5.2. Контекстная диаграмма IDEF0
Рис. 5.3. Диаграмма
декомпозиции IDEF0
Одной из основных
частей информационного обеспечения является информационная база. Разработка базы
данных выполняется с помощью моделирования данных. Цель моделирования данных
состоит в обеспечении разработчика ИС концептуальной схемой базы данных в форме
одной модели или нескольких локальных моделей, которые относительно легко могут
быть отображены в любую систему баз данных. Наиболее распространенным средством
моделирования данных являются диаграммы "сущность-связь" (ERD). Наиболее
распространенными методами для построения ERD-диаграмм являются метод Баркера и
метод IDEF1. Метод IDEF1 основан на подходе Чена и позволяет построить модель данных, эквивалентную реляционной модели в третьей нормальной форме. На
основе совершенствования метода IDEF1 создана его новая версия — метод IDEF1X,
разработанный с учетом таких требований, как простота для изучения и
возможность автоматизации. IDEF1X-диаграммы используются в ряде
распространенных CASE-средств (в частности AllFusion Data Modeler). Модель, построенная по методологии IDEF1, называет информационной
моделью, по методологии IDEF1X – модель базы данных.
IDEF1X
является методом для разработки реляционных баз данных и использует условный
синтаксис, специально разработанный для удобного построения концептуальной
схемы. Основные элементы диаграммы IDEF1X – это отношение и связь.
Пример диаграммы, построенной в нотации IDEF1X, приведен на рис. 5.4. Отношения изображаются в виде прямоугольников, связи
– в виде линий.
Рис. 5.4. Пример диаграммы в IDEF1X
На
представленной выше диаграмме (рис. 5.4) отношениями являются КЛИЕНТ и ЗАКАЗ. В
прямоугольниках перечисляется атрибутный состав отношения и выделяется
первичный ключ. Так, отношение КЛИЕНТ состоит из атрибутов Номер
заказа, Код клиента, Дата заказа, Товар, Количество где Номер заказа
является первичным ключом. Связи «один-ко-многим» отображаются линией, которая
на стороне «многие» заканчивается кружком (один клиент размещает много
заказов).
В настоящее
время построение функциональной, информационной моделей, анализ
бизнес-процессов осуществляется с помощью современных компьютерных средств – CASE-средств. Под
термином CASE-средство понимаются средства, поддерживающие
процессы создания и сопровождения ИС, включая анализ и формулировку требований,
проектирование прикладного ПО (приложений) и БД, генерацию кода, тестирование,
документирование, обеспечение качества, конфигурационное управление и
управление проектом, а также другие процессы [8]. Для проведения анализа и реорганизации
бизнес-процессов предназначено CASE-средство AllFusion Process Modeler (BPwin),
поддерживающее методологии IDEF0 (функциональная модель), IDEF3 (WorkFlow
Diagram) и DFD (DataFlow Diagram), а для построения ER-диаграмм -
CASE-средство AllFusion Erwin Data Modeler,
поддерживающее методологию IDEF1X.
Задание 5.1. На основании приведенной ниже информации постройте
контекстную диаграмму IDEF0:
предприятие занимается производством мебели, для обеспечения производства
компания получает необходимое сырье, процесс изготовления мебели
регламентируется стандартами отрасли и условиями договора с заказчиком,
бизнес-процессы компании осуществляются с помощью Автоматизированной системы
управления производством.
Задание 5.2. На основании приведенной ниже информации постройте
контекстную диаграмму IDEF0 и
декомпозируете ее.
Технический отдел компании занимается модернизацией
технической базы предприятия. Данный процесс состоит из следующих этапов: 1)
анализ существующей технической базы, который заключается в составлении заказа
на закупку нового оборудования и приказа по переводу на новую базу 2) закупка
нового оборудования на основании составленного заказа, 3) подготовка объекта к
переводу на новую техническую базу согласно приказу и составление акта
готовности к внедрению, 4) ввод в действие новой технической базы на основании соответствующего
акта.
1.
Что такое
моделирование?
2.
Какие бывают
методы моделирования?
3.
Какие методы
используются наиболее часто?
4.
Что включает в
себя стандарт IDEF0?
5.
Основные правила
построения модели в нотации IDEF0.
6.
Что описывает контекстная
диаграмма?
7.
Что такое
диаграмма декомпозиции?
8.
Что включает в
себя стандарт IDEF2?
9.
Для чего
предназначена нотация IDEF1X?
10. Назовите основные элементы диаграммы в IDEF1X.
1. Мишенин А. И. Теория экономических информационных
систем: учебник. – 4-е изд., доп. и перераб. – М.: Финансы и статистика, 2007.
– 240 с.
2. Маклаков С. В. Создание информационных
систем с AllFusion Modeling Suite. –
2-е изд., доп. – М.: Издательство Диалог-МИФИ, 2007, Глава 1, стр.16-35.
3. Уткин В. Б. Информационные системы в
экономике: Учебник для студ. высш. учеб, заведений / В.Б. Уткин, К.В. Балдин. —
М.: Издательский центр «Академия», 2004, Глава 8.
Содержание
темы:
1.
Стандарты сетевых
информационных систем. ISO 8613,
архитектура, модели, логическая и макетная структуры электронного документа.
2.
Составляющие
структуры электронного документа: профиль, тело.
3.
Стиль документа,
стили макета и представлений. Разметка.
Электронный документооборот (ЭДО) — единый механизм по работе с документами,
представленными в электронном виде, с реализацией концепции «безбумажного
делопроизводства».
Основные принципы электронного документооборота:
· Однократная регистрация документа, позволяющая
однозначно идентифицировать документ в любой инсталляции данной системы.
· Возможность параллельного выполнения операций,
позволяющая сократить время движения документов и повышения оперативности их
исполнения.
· Непрерывность движения документа, позволяющая
идентифицировать ответственного за исполнение документа (задачи) в каждый момент
времени жизни документа (процесса).
· Единая (или согласованная распределённая) база
документной информации, позволяющая исключить возможность дублирования
документов.
· Эффективно организованная система поиска документа,
позволяющая находить документ, обладая минимальной информацией о нём.
· Развитая система отчётности по различным статусам и
атрибутам документов, позволяющая контролировать движение документов по
процессам документооборота и принимать управленческие решения, основываясь на
данных из отчётов.
Электронный документ (ЭД) — документ, созданный с помощью средств
компьютерной обработки информации, который может быть подписан электронной
цифровой подписью (ЭЦП) и сохранён на машинном носителе в виде файла
соответствующего формата.
Понятие модель документа охватывает аспекты создания, преобразования,
хранения, поиска передачи и отображения документов. Принято рассматривать
структуру документа в двух аспектах: логическом (содержание) и физическом
(макет) [5].
Логическая структура документа определяет составные компоненты и их
соотношения в понятиях, отвечающих взгляду на документы как смысловые
структуры. Например, к основным смысловым компонентам относятся: авторские
данные, аннотация, оглавление, главы, разделы, параграфы, рисунки, сноски.
Пример логической структуры документа Диплом приведен на рис. 6.1.
Рис. 6.1. Пример логической структуры документа
Макетная структура содержит описание документа в терминах и понятиях
физических единиц – страниц, полос, колонок, колонтитулов, рамок для рисунков,
шрифтов, стилей.
Подходы к моделированию документов опираются на два стандарта – ISO
8613 (ODA – Office
Document Architecture
– архитектура управленческой документации) и ISO 8879 (SGML - SGML – Standard
Generalized Markup Language – стандартный обобщенный язык разметки) [5].
Документ в ODA представлен в виде профиля и собственно документа (тело
документа), организованных в форме древовидной структуры. Профиль содержит
информацию о документе в целом и его происхождении; формальные признаки – дата
составления, вид, регистрационные номер и т.д.
Собственно документ содержит текст и сведения о его структуре и стиле,
а именно:
· Структуру документа – заглавие, параграфы, оглавление
и т.п. (логическая структура), а также абзацы, расположение текста, шрифты
(физическая структура);
· Архитектуру содержания – набор графических элементов,
выделение определенных слов, строк и т.п.
· Коммуникативный формат – способы кодирования объектов,
признаков и содержания документов [5].
В системах обработки текстов в документ включается дополнительная
информация, называемая разметкой и
выполняющая следующие функции:
· Выделение логических элементов данного документа;
· Задание функций обработки выделенных элементов [5].
В обычных текстовых процессорах существуют встроенные команды
включения/выключения шрифтов и др., аналогичные командам управления размещением
информации на экране или при печати. Такой подход называется командной или процедурной разметкой.
Командная разметка применялась в таких системах обработки текста, как Lexicon.
Альтернативные способ разметки заключается в выделении части текста без
указания способа обработки выделения. Затем другие команды назначают фрагментам
способ обработки. Такая разметка называется описательной (дескриптивной). Она
включает метки (tags, теги) начала и окончания элемента текста и указывает как
интерпретировать данный фрагмент.
Основным достоинством описательной разметки является ее гибкость,
поскольку фрагменты текста отмечены как «чем они являются».
Термин «разметка» происходит от традиционной практики разметки
рукописей перед публикацией (т.е. добавления символических команд на полях и
между строк в бумажной рукописи). В течение многих лет это делали работники
издательства (редакторы и корректоры) которые отмечали, каким шрифтом, стилем
должны быть набраны фрагменты текста. В настоящее время существует множество
языков разметки, среди наиболее широко известных - HTML (язык разметки гипертекста),
одна из основ WWW (всемирной паутины).
HTML (от англ. HyperText Markup Language — «язык разметки гипертекста») —
стандартный язык разметки документов во Всемирной паутине.
HTML — это теговый язык
разметки документов. Любой документ на языке HTML представляет собой набор
элементов, причём начало и конец каждого элемента обозначается специальными
пометками — тегами.
Документ
состоит из двух основных блоков – "заголовка" и "тела
документа". Заголовок заключается между тегами HEAD и </HEAD>, а тело – между тегами BODY и </BODY>.
Заголовок
содержит "техническую" информацию о документе, хотя чаще всего
используется только для обозначения его названия (тег TITLE).
В
теле документа находится все то, что отображается на странице: текст, картинки,
таблицы. Тело заключено тегами <BODY> и </BODY>.
Структура
html-документа представлена на рис. 6.2.
Рис. 6.2. Структура html-документа
Как уже было сказано, тело документа (его содержание) заключено тегами <BODY> и </BODY>. Между этими тегами располагается сам
текст, который пользователь через свой браузер видит на экране. Очень часто
текст необходимо выделять (форматировать), когда вы хотите обратить особое
внимание пользователя на тот или иной фрагмент. Для того чтобы воспользоваться
стандартными средствами форматирования, например, выделить текст полужирным
шрифтом или курсивом, в HTML предусмотрено несколько специальных тегов. Все эти
теги являются парными (имеются открывающий и закрывающий теги). Фрагмент
текста, формат которого необходимо соответствующим образом изменить, должен
находиться внутри такой пары. В Таблица 6.1 представлены основные теги форматирования.
Таблица 6.1.
Примеры
тегов форматирования текста
Тег |
Результат
использования тега |
<b></b> |
Выделяет текст полужирным шрифтом |
<i></i> |
Выделяет текст курсивом |
<u></u> |
Выделяет текст подчеркиванием. |
<sub></sub> |
Создание нижнего индекса |
<sup></sup> |
Создание верхнего индекса |
Изменить цвет, размер и
гарнитуру шрифта можно с помощью парного дескриптора <font>
(шрифт). Текст, который вы хотите отформатировать, заключается в пару
дескрипторов <font></font>. Однако, это никак не повлияет на вывод текста.
Для этого в дескриптор font нужно добавить атрибуты, управляющие размером,
цветом и гарнитурой шрифта: size – размер шрифта; color – цвет шрифта; face –
гарнитура шрифта.
Задание 6.1. С помощью языка разметки HTML создайте собственную web-страницу. Для этого выполните следующую
последовательность действий:
1.
Создайте три
текстовых файла в любой папке и сохраните их на жестком диске. Первый файл
назовите main.txt (главный файл), второй – page1.txt (первая
страница) и третий – page2.txt (вторая страница).
2.
Измените
расширение файлов на .html.
3.
В каждом файле
введите основную разметку HTML-документа:
<html>
<head> <title></title> </head> <body>
</body> </html>
4.
В пределах тега
<title> в файле main.txt введите: Мой первый Web-узел, и
сохраните изменения.
5.
Во втором и
третьем файле в пределах тега <title> введите: Первая страница
Web-узла и Вторая страница Web-узла соответственно, и сохраните
изменения.
6.
В каждом файле, в
пределах тега <body> поставьте пару тег <h1></h1>. Между этими
дескрипторами ставится заголовок.
7.
В файле main.html
в пределах тег <h1></h1> вставьте текст Мой первый Web-узел.
8.
В файлах page1.html
и page2.html в пределах тег <h1></h1> введите Первая
страница Web-узла и Вторая страница Web-узла соответственно. Сохраните
сделанные изменения и обновите отображение документов в окне браузера.
9.
Во все файлы
вставьте в начало вашей разметки объявление типа документа как Transitional
DTD.
1.
Дайте определение
электронного документооборота и электронного документа.
2.
Что входит в
понятие модель документа?
3.
Что определяет
логическая структура документа? Приведите пример.
4.
Что определяет
макетная структура документа?
5.
Как представлен
документ согласно стандарту ODA?
6.
Дайте определение
разметки документа.
7.
Дайте
характеристику командной разметки.
8.
Дайте
характеристику описательной разметки.
9.
Назовите теги
языка HTML, определяющие заголовочную часть документа.
10.Приведите
примеры тегов, отвечающих за форматирование текста.
1. Информационные технологии: учебник/
О. Л. Голицына, Н. В. Максимов, Т. Л. Партыка,
И. И. Попов. – 2-е изд., перераб. И доп. – М.: ФОРУМ: ИНФРА-М, 2008.
– 608 с., Глава 2.
2. Карминский А. М., Черников Б. В.
Информационные системы в экономике: В 2-х ч. Ч. 1. Методология создания. Учеб. пособие
- М.: Финансы и статистика, 2006, c.169-190.
2. Мишенин А. И. Теория экономических
информационных систем. Практикум: учеб. пособие. – М.: Финансы и статистика,
2007. – 192 с
1. Бубнова Г. В. Информационные
системы. Учебное
пособие – М.: МИИТ, 1996 - 100 с.
[1] Отношения называются совместимыми, если они имеют одинаковую структуру (одинаковый набор атрибутов).