Автоматизированная информационно-поисковая система (АИПС) - совокупное название как для программных оболочек, ориентированных на ввод, хранение, поиск и выходное представление документов (структур данных сложного или неопределенного формата), так и для конкретных систем определенного наполнения и предметной ориентации, реализованных на основе таких оболочек (или иными программными методами). Примерами программных оболочек АИПС являются STAIRS, DPS, ISIS, IRBIS.
Агрегат данных – именованная совокупность элементов данных, представленных простой (векторной) или иерархической (группы или повторяющиеся группы) структурой. Примеры - массивы, записи, комплексные числа и пр.
Администратор базы данных (АБД) - лицо или группа лиц, уполномоченных для ведения БД (модификация структуры и содержания БД, активизация доступа пользователей, выполнение других административных функций, которые затрагивают всех пользователей).
Адрес данных – идентификация места расположения данных.
Адресация – способ размещения и выборки данных в памяти.
Атрибут – поле данных содержащее информацию об объекте.
База данных (БД)- именованная совокупность взаимосвязанных данных, отображающая состояние объектов и их отношений в некоторой предметной области, используемых несколькими пользователями и хранящимися с минимальной избыточностью.
Банк данных (БнД)- система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных.
Внешняя схема – Представление данных с точки зрения пользователя или прикладной программы
Внутренняя схема – физическая структура данных.
Документ - агрегат данных в документальных системах (АИПС), имеющий иерархическую структуру и, кроме форматных полей (элементы или агрегаты данных фиксированной длины), обычно содержащий текстовые поля, или символьные последовательности неопределенной длины, логически подразделяющиеся на параграфы (PAR, SEGM), предложения (SENT), слова (WORD).
Запись логическая - идентифицируемая (именованная) совокупность элементов или агрегатов данных воспринимаемая прикладной программой как единое целое при обмене информацией с внешней памятью. Запись – это упорядоченная в соответствии с характером взаимосвязей совокупность полей (элементов) данных, размещаемых в памяти в соответствии с их типом.
Запись физическая - совокупность данных, которая может быть считана или записана как единое целое одной командой ввода-вывода.
Иерархическая модель данных - использует представление предметной области БД в форме иерархического дерева, узлы которого связаны по вертикали отношением "предок-потомок". Навигация в БД представляет собой перемещение по вертикали и горизонтали в данной структуре. Одной из наиболее популярных иерархических СУБД была Information Management System (IMS) компании IBM, появившаяся в 1968 году. Преимущества IMS и реализованной в ней иерархической модели: (1) Простота модели. Принцип построения IMS легок для понимания. Иерархия базы данных напоминает структуру компании или генеалогическое дерево; (2) Использование отношений предок/потомок. СУБД IMS позволяла легко представлять отношения предок/потомок, например: "А является частью В" или "А владеет В"; (3) Быстродействие. В СУБД IMS отношения предок/потомок были реализованы в виде физических указателей из одной записи на другую, вследствие чего перемещение по базе данных происходило быстро. Поскольку структура данных в этой СУБД отличалась простотой, IMS могла размещать записи предков и потомков на диске рядом друг с другом, что позволяло свести к минимуму количество операций записи-чтения.
Импорт (загрузка, download) - утилита (функция, команда) СУБД, служащая для чтения файлов операционной системы, которые содержат данные из базы данных, представленные в некотором коммуникативном формате.
Инвертированный файл (список) – файл предназначенный для быстрого произвольного поиска записей по значениям ключей, организованный в виде независимых упорядоченных списков (индексов) ключей – значений определенных полей записей основного файла.
Индекс – таблица, используемая для определения адреса записи.
Информационная база - данные, отражающие состояние определенной предметной области и используемые информационной системой. Информационная база состоит из двух компонент: 1) коллекций записей собственно данных и 2) описаний этих данных — метаданных. Данные отделены от описаний, но в то же время данные не могут использоваться без обращения к соответствующим описаниям.
Клиент– программа, написанная как пользователем, так и поставщиком СУБД, внешняя или «встроенная» по отношению к СУБД. Программа-клиент организована в виде приложения, работающего «поверх» СУБД, и обращающегося для выполнения операций с данными к компонентам СУБД через интерфейс внешнего уровня.
Ключ – значение (элемент данных) используемый для идентификации или определения адреса записи.
Ключ первичный (главный)– ключ, значение которого идентифицирует запись единственным образом.
Ключ вторичный (альтернативный) – ключ, который идентифицирует некоторую группу записей, имеющих определенное общее свойство. Набор данных может иметь несколько вторичных ключей, необходимость введения которых определяется практической необходимостью – оптимизацией процессов нахождения записей по соответствующему ключу.
Ключ сцепленный (составной) – несколько элементов данных, которые в совокупности обеспечивают уникальность идентификации каждой записи набора данных.
Кольцевая структура– Списковая структура данных, в которой последний элемент указывает на первый, образуя тем самым кольцо.
Контрольная точка – Операция согласования состояния базы данных в физических файлах с текущим состоянием кэша – системного буфера в операциях обновления БД.
Концепция баз данных - информационная технология интегрированного хранения и обработки данных, в основе которой лежит механизм выделения обрабатывающей программе из всех хранимых данных только тех, которые ей необходимы, и в форме, требуемой именно этой программе.
Коммуникативный формат - способ представления данных в файле операционной системы, обеспечивающий безошибочное распознавание единиц информации (записей, агрегатов, полей) при импорте (загрузке) информации файла ОС в базу данных (обычно в одну из таблиц БД). Файлы в коммуникативных форматах (КФ) предназначены для архивного хранения и транспортировки содержимого БД. Примерами КФ могут служить основные методы, используемые в системах семейства FoxPro: (1) SDF (системный формат данных), когда каждая строка таблицы БД выводится в виде записи текстового файла, где каждый элемент данных (поле) имеет длину и тип, соответствующие описанию в БД; (2) Метод с разделителями, где каждый элемент данных отделяется от соседнего символом-разделителем ("терминатором"). В системах, ориентированных на обработку документов (АИПС) используются более сложные форматы, например представленные в стандарте ISO 2709, использующим рекурсивное описание агрегатов и элементов данных.
Логическая структура БД – определение БД на физически независимом уровне.
Логический файл – файл в представлении прикладной задачи, состоящий из логических записей, структура которых может отличаться от структуры физических записей, представляющих информацию в памяти.
Метод доступа – метод (способ) организации обмена данными обычно между оперативной и внешней памятью, поддерживаемый ОС например прямой, последовательный, индексный метод доступа.
Модель базы данных – это комплекс средств, позволяющих определить границу между логическим и физическим аспектами управления базой данных (независимость данных); обеспечить конечным пользователям и программистам возможность и средства общего понимания смысла данных (коммуникабельность); определить языковые понятия высокого уровня, обеспечивающие возможность выполнения однотипных операций над большими совокупностями записей (в общем случае разнотипных данных) как единую операцию (обработка множеств).
Модель данных – базовый инструментарий, обеспечивающий на формальном абстрактном уровне конкретные способы представления объектов и связей.
Модель даталогическая – описание, создаваемое по инфологической модели данных, и представленное на языке описания данных конкретной СУБД.
Модель инфологическая (концептуальная) – описание предметной области, выполненное с использованием естественного языка, математических выражений, таблиц, графов и других средств, понятных всем людям, работающих над проектированием базы данных.
Модель физическая – определяющаяразмещение и способы поиска данных на внешних запоминающих устройствах СУБД.
Моделирования парадигма– условности, определяющие способ представления взаимосвязи объектов на уровне структур данных. С этой точки зрения различаются реляционные, сетевые, иерархические, объектные, объектно-реляционные, документальные и другие виды моделей.
Независимость данных логическая (физическая)– свойство системы, обеспечивающее возможность изменять логическую (физическую) структуры данных без изменения физической (логической).
Нормализация – представление сложных структур данных (документов) в виде двумерных таблиц (отношений).
Отношение (relation) - агрегат данных, хранящийся в одной из таблиц (строка таблицы) табличной, реляционной БД, или создаваемый виртуально в процессе выполнения операция над базой данных при выполнении запросов к данным.
Пользователь БД – программа или человек, обращающийся к базе данных с помощью средств управления данными СУБД.
Предметная область (ПрО)– набор объектов, представляющих интерес для актуальных или предполагаемых пользователей, когда реальный мир отображается совокупностью конкретных и абстрактных понятий, между которыми фиксируются определенные связи.
Представление (View) – это средство создания виртуальной таблицы, содержащей результаты выполнения запроса (оператора SELECT) к одной или нескольким таблицам. Для конечного пользователя представление выглядит как обычная таблица в базе данных, над которой можно выполнять операторы SELECT, INSERT, UPDATE и DELETE. Представления используются для фильтрования и предварительной обработки данных.
Проектирование базы данных - упорядоченный формализованный процесс создания системы взаимосвязанных описаний – таких моделей предметной области, которые связывают (фиксируют) хранимые в базе данные с объектами предметной области, описываемые этими данными.
Распределенная база данных. Совокупность баз данных, которые обрабатываются и управляются по отдельности, а также могут разделять информацию.
Реляционная алгебра – алгебра (язык), включающая набор операций для манипулирования отношениями.
Реляционная база данных – база данных, состоящая из отношений. Здесь вся информация, доступная пользователю, организована в виде таблиц, обычно имеющих уникальные имена, состоящих из строк и столбцов, на пересечении которых содержатся значения данных, а операции над данными сводятся к операциям над этими таблицами.
Сервер– программа, реализующая функции СУБД: определение данных, запись-чтение-удаление данных, поддержку схем внешнего-концептуального-внутреннего уровней, диспетчирование и оптимизацию выполнения запросов, защиту данных.
Сетевая модель данных (модель CODASYL). Предложенная CODASYL модификация иерархической модели, в которой одна запись могла участвовать в нескольких отношениях предок/потомок. В сетевой модели такие отношения называются множествами. В 70-е годы независимые производители программного обеспечения реализовали сетевую модель в таких продуктах, как IDMS компании Cullinet, Total компании Cincom, которые приобрели большую популярность. Сетевые базы данных обладали рядом преимуществ: (1) Гибкость. Множественные отношения предок/потомок позволяют сетевой базе данных хранить данные, структура которых сложнее обычной иерархии. (2) Стандартизация. Появление стандарта CODASYL; (3) Быстродействие. Вопреки своей сложности, сетевые базы данных достигали быстродействия, сравнимого с быстродействием иерархических баз данных. Множества были представлены указателями на физические записи данных, и в некоторых системах администратор мог задать кластеризацию данных на основе множества отношений. Недостатки - жесткость БД, наборы отношений и структуру записей приходилось задавать наперёд. Изменение структуры данных означало перестройку всей базы данных.
Система управления базами данных (СУБД)- совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.
Словарь данных – исчерпывающий набор таблиц или файлов, представляющий собой каталог всех описаний данных (имен, типов). Может содержать также информацию о пользователях, привилегиях и т.д., доступную только администратору базы данных. Является центральным источником информации для СУБД, АБД и всех пользователей.
Структура данных - атрибутивная форма представления свойств и связей предметной области, ориентированная на выражение описания данных средствами формальных языков, и таким образом учитывающая возможности и ограничения конкретных средств, с целью сведения описаний к стандартным типам и регулярным связям. Структура данных с точки зрения программирования - это способ отображения значений в памяти – размер области и порядок ее выделения (который и определит характер процедуры адресации-выборки).
Структура данных линейная- порядок следования элементов данных которых имеет линейный характер и соответствует порядку расположения элементов в памяти.
Структура записей данных – целесообразная (учитывающая особенности физической среды) реализация способов хранения данных и организации доступа к ним как на уровне отдельных записей, так и их элементов.
Структура информации - схематичная форма представления сложных композиционных объектов и связей реальной предметной области, выделяемых как актуально необходимые для решения прикладных задач.
Таблица - основная единица информации в системе управления реляционной базой данных. Состоит из одной или более единиц информации (строк), каждая из которых содержит значения некоторого вида (столбцы).
Тип данных- характер данных, определяющий способ представления значения в памяти и, соответственно, множество стандартных операций (примитивов) преобразования этого значения.
Топология БД – схема распределения компонент базы данных по физическим носителям, в том числе, различным узлам вычислительной сети.
Точка сохранения - момент времени, когда в БД записывается вся работа в транзакции. В транзакции могут применяться ряд точек сохранения, выступающих в роли промежуточных точек для работы.
Транзакция – последовательность операций над данными базы, переводящая БД из одного непротиворечивого состояния в другое, которое может быть представлено как одно «событие».
Триггер (trigger) - Особый тип хранимой процедуры, которая автоматически выполняется при изменении таблицы с помощью операторов UPDATE, INSERT или DELETE.
Уровни представления данных — концептуальный, внутренний и внешний. Внутренний уровень - глобальное представление БД, определяет необходимые условия в первую очередь для организации хранения данных на внешних запоминающих устройствах. Представление на концептуальном уровне представляет собой обобщенный взгляд на данные с позиций предметной области. Внешний уровень – представляет потребности пользователей и прикладных программ.
Утилита СУБД - программа, которая запускается в работу командой операционной системы главного компьютера и выполняет какую-то функцию над базой данных (обычно на физическом уровне данных), либо команда (функция ядра СУБД, доступная только АБД), реализующая аналогичную операцию.
Файл - именуемая единица информации, поддерживаемая операционной системой. Доступ к данным реализуется либо в рамках ОС, либо пользовательскими программами, либо в рамках СУБД, либо комбинированно. Обычно ОС может предоставить пользовательским программам не более 2-х типов файлов: (1) запись-ориентированные, когда при обращении к файлу из пользовательской программы считывается или выводится в файл запись (агрегат или элемент данных - логическая единица информации); и (2) поток-ориентированные, когда пользовательской программе предоставляется для записи или чтения физический элемент файла (очередной бит или байт данных).
Файл ASCII , ( ASCII-File ), Файл, содержащий символьную информацию, представленную только ASCII-кодами "левой части" (первые 128 символов кодовой таблицы, или код Latin-1) и символьную разметку
Файл базы данных - физический файл ОС, используемый для размещения БД. Управление данными в таком файле производится совместно ОС и СУБД. Крайние варианты размещения БД по файлам - (1) все данные БД - в одном файле (файл DATA, СУБД ADABAS); (2) каждая таблица БД - в отдельном файле ОС (DBF-файлы, системы FoxPro). Промежуточный вариант размещения, например - ORACLE - база данных состоит из одного или более табличных пространств, которые в свою очередь состоят из одного или более файлов базы данных.
Файл бинарный, ( Binary File ), Файл, содержащий произвольную двоичную информацию (текст с бинарной разметкой, программа, графика, архивный файл)
Файл графический, ( Image file ), Бинарный файл, содержащий данные, обычно полученные с помощью растрового сканера и соответствующие двумерному изображению объекта
Файл текстовый ( Text file ), Файл, содержащий символьную информацию в одном из соответствующих кодов и коды, управляющие режимом отображения символов на печать и экранные устройства.
Хранимая процедура (storedprocedure) – это набор операторов SQL, которые сервер компилирует в единый план выполнения. Этот план сохраняется в кэше процедур при первом выполнении хранимой процедуры и затем может быть повторно использован уже без рекомпиляции при каждом вызове.
Цепочка данных – организация данных, в которой записи связываются друг с другом посредством указателей.
Экспорт (выгрузка, upload) - утилита (функция, команда) СУБД, служащая для вывода информации из БД (обычно одной из таблиц) в файл(ы) операционной системы, организованные в некотором, обычно, коммуникативном формате.
Элемент данных (элементарное данное) - неделимое именованное данное, характеризующееся типом (например, символьный, числовой, логический, и пр.), длиной (в байтах) и, обычно, рассчитанное на размещение в одном машинном слове соответствующей разрядности. Это минимальная адресуемая (идентифицируемая) часть памяти - единица данных на которую можно ссылаться при обращении к данным. Ранние языки программирования (Алгол, Фортран) были рассчитаны на обработку элементарных данных или их простейших агрегатов - массивов (матрицы, векторы). С появлением ЯП Кобол появляется возможность представления и обработки агрегатов разнотипных данных (записей). В реляционных БД элементарное данное есть элемент таблицы. Иногда используется термин поле записи в качестве синонима.
Язык манипулирования данными (ЯМД). ЯМД обычно включает в себя средства запросов к базе данных и поддержания базы данных (добавление, удаление, обновление данных, создание и уничтожение БД, изменение определений БД, обеспечение запросов к справочнику БД).
Язык описания данных (ЯОД)средство внутрисистемного определения данных, представляющего обобщение внешних взглядов. Описание представляет собой модель данных и их отношений, т. е. структур, из которых образуется БД.
Язык структурированных запросов (SQL). Основной интерфейс пользователя и АБД для сохранения, обновления и поиска информации в базе данных для ряда СУБД. Включает в себя в качестве подмножеств следующие группы операторов: (1) Язык описания данных (ЯОД). Эти операторы определяют или удаляют объекты базы данных. (2) Язык управления данными(ЯУД). Эти операторы управляют доступом к данным и к базе данных. (3) Язык манипулирования данными (ЯМД). Эти операторы позволяют искать и обновлять данные.