Московская финансово-промышленная академия















 

Информационные системы


























Москва, 2009

 

 


Содержание

 

 

Введение

 

1. Введение в теорию информационных систем. Информационная деятельность

Контрольные вопросы

 

2. Информационный обмен

Контрольные вопросы

 

3. Задачи и функции, состав и структура информационных систем

Контрольные вопросы

 

4. Классификация информационных систем

Контрольные вопросы

 

5. Фактографические информационные системы

Контрольные вопросы

 

6. Документальные информационные системы

Контрольные вопросы

 

7. Автоматизированные информационные системы

Контрольные вопросы

 

8. Классификация автоматизированных информационных систем

Контрольные вопросы

 

9. Области применения информационных систем

Контрольные вопросы

 

10. Информационный поиск

Контрольные вопросы

 

11. Поисковые Интернет системы

Контрольные вопросы

 

12. Электронный документооборот. Электронный офис

Контрольные вопросы

 

Глоссарий

 

Используемые сокращения

 

Литература

 


Введение

 

Информационные системы являются важной составляющей современного (постиндустриального, информационного) общества.

Те из них, которые ныне принято называть традиционными, существуют многие тысячелетия, и сейчас довольно активно используются в различных областях, например, рукописные или печатные табличные формы, справочники, ведомости и т.п. История машиночитаемых, а затем и электронных информационных систем молода. В основном они создаются и формируются с середины прошлого столетия, что обусловлено появлением и широким распространением средств вычислительной техники.

Потребность постоянно повышать производительность и эффективность труда работников, выпускать много качественной продукции, а также необходимость оперативно получать актуальную информацию привела к созданию сначала автоматизированных систем управления производственными технологическими процессами (АСУ ТП) и автоматизированных систем управления предприятиями (АСУП), а затем и появлению автоматизированных информационных и информационно-поисковых систем (АИС и АИПС). К концу XX века сформировались основные методы разработки и использования автоматизированных информационных систем, что позволило их классифицировать, а также применить полученный опыт для формирования существующих и развития новых видов автоматизированных информационных систем.

Особенностью современных организаций, предприятий, офисов и т.п. (в дальнейшем – организаций) является наличие разноуровневых информационных систем, используемых в различных предметных областях[1]. При этом структура современных организаций такова, что практически в независимости от видов бизнеса (малый, средний и крупный), она в большей степени представляет собой территориально распределённые сетевые информационные системы, к которым предъявляются высокие требования надёжности, отказоустройчивости, безопасности и др.

Несколько слов о предметной области. Она бесконечна и содержит существенно важные понятия и данные, а также малозначащие или вообще не значащие данные. Например, предметной областью организации могут быть бухгалтерия, отдел кадров, магазин и т. д. Если предметной областью является учёт товаров на складе, то понятия «накладная» и «счёт-фактура» существенно важны, а сведения о том, что сотрудница, принимающая накладные, не замужем или имеет двоих детей неважны для учёта товаров. При этом для отдела кадров такие данные являются существенно важными. Таким образом, важность данных зависит от выбора предметной области.

Информационные системы (ИС) позволяют не только хранить электронные данные (в том числе информацию) и обмениваться ей, но главным образом объективно оценивать достигнутый уровень развития общества (социума), создавать и сохранять огромные массивы информационных ресурсов, выявлять имеющиеся резервы и подготавливать варианты, обеспечивающие принятие правильных, в первую очередь управленческих, решений. Важными проблемами в данной области являются выбор, администрирование и эксплуатация информационных систем.

Современная индивиды практически в любых предметных областях, особенно непосредственно связанных с применением информационных технологий, не могут обойтись без использования различных, особенно электронных (машиночитаемых) ИС. Среди них родился и постоянно увеличивается штат профессионалов-специалистов, способных устанавливать и оптимизировать ИС, эффективно использовать их и современные информационные технологии для администрирования и сопровождения баз и банков данных. Таких специалистов принято называть ИТ-специалистами.

Их традиционно готовят в высшей школе и на различных курсах повышения квалификации. Система высшего образования должна адекватно реагировать на требования рынка и стремиться с «опережением» готовить специалистов высокой квалификации в области разработки, администрирования и использования информационных систем.

Целью дисциплины «Информационные системы» является ознакомление студентов с: основными информационными процессами и системами, ориентированными на своевременное и качественное обеспечение потребителей необходимой им информацией; их свойствами и возможностями, способами применения в различных предметных областях; основными методами создания, обработки и хранения информации в базах и банках данных; способами эффективной работы с ними.

Основные задачи данной дисциплины нацелены на: выработку у обучаемых единого понятийного аппарата в области современных информационных систем; ознакомление их с основными видами ИС и вариантами их применения в различных прикладных областях; формирование практических навыков использования компьютерных информационных систем, освоение обучаемыми приёмов и методов работы с различными программными средствами, обеспечивающими функционирование информационных систем в любых предметных областях.

Рассматриваемые в данном учебном пособии вопросы представляют интерес для студентов других специальностей, изучающих информационные системы и их применение в различных предметных областях.

 

 

1. Введение в теорию информационных систем. Информационная деятельность

 

Основные понятия информатики.

Понятие «информатика» является относительно новым, поэтому встречается много её определений. Очевидно, что это наука, которая включает изучение свойств информации и способов её использования, ориентированных главным образом на применение компьютеров.

Что же можно делать с информацией, то есть какими свойствами она обладает? Свойства информации представлены Таблице 1.

 

Таблица 1

 

Информацию можно:

 

создавать

принимать

комбинировать

хранить

передавать

копировать

обрабатывать

искать

воспринимать

формализовать

делить на части

измерять

использовать

распространять

упрощать

разрушать

запоминать

преобразовывать

собирать

и т. д.

 

Эти свойства являются и процессами. Данные процессы связаны с определёнными операциями над информацией и называются информационными процессами.

Определений информационных процессов (ИП) примерно столько же, сколько и определений информации. Обилие таких определений служит убедительным свидетельством их недостатков, показывая их частный характер, ориентацию каждого из них на узкий круг задач.

Информационные процессы различным образом (отдельно и в совокупности) отражают основные свойства информации, к которым относят процессы: создания, обработки, передачи и распространения, хранения и сохранения информации и др.

Согласно Закону РФ «Об участии в международном информационном обмене» (№85-ФЗ, принят Государственной Думой 5 июня 1996 года). Информационные процессы – это процессы создания, сбора, обработки, накопления, хранения, поиска, распространения и потребления информации.

Значимую роль в информационных процессах играют информационные ресурсы (ИР). С другой стороны, информационные процессы нацелены на предоставление различных информационных услуг. Организация любого процесса должна обеспечить его экономичность, комплексность, надёжность функционирования, высокое качество выполнения работ. Итак, информационным процессом будем называть ненулевую последовательность информационных операций.

Основные виды информационных процессов можно представить как внутренние и внешние. Внутренние процессы подразумевают хранение, обработку и поиск информации внутри информационной системы. Внешние обеспечивают связь информационной системы с объектами предметной области, т. е. источниками информации и внешней средой (потребителями информации).

В отличие от информационных операций, определяемых как изменение содержания областей смыслового пространства субъекта, ИП определяются как изменение содержания зон смыслового пространства субъекта (при этом не берется во внимание характер (локальный или глобальный) соответствующих информационных операций). Это изменение рассматривается в отношении определённого смыслового участка, то есть рассматривается каким образом определённое смысловое образование попадает из одной зоны смыслового пространства субъекта в другую, как оно при этом трансформируется и как изменяется сам субъект.

Кратко рассмотрим их.

Сбор подразумевает получение тем или иным путём данных, сведений, информации и знаний. Сведения являются разновидностью информации.

Сбор данных и информации можно представить как процесс идентификации и получения данных от различных источников, группирования полученных данных и представления их в форме, необходимой для ввода в электронно-вычислительную машину (ЭВМ).

Для получения информации животные и человек имеются органы чувств (особые нервные клетки – рецепторы): зрение, слух, обоняние, осязание. Для повышения возможностей органов чувств человечество создало различные измерительные и усилительные приборы (например, усилители звуковых сигналов), микроскопы и т. д.

Сбор знаний означает получение информации о предметной области от специалистов (экспертов) и предоставление её в форме, необходимой для записи в базу знаний.

Различают механизированный; автоматизированный и автоматический способы сбора и регистрации информации и данных. Вариантом технологии автоматического сбора информации является RFID (англ. «Radio Frequency Identification» – радиочастотная идентификация). Встроенные в RFID антенна и микрочип размером в несколько сантиметров производят обмен информацией с внешними устройствами (компьютером и др.). RFID бывают пассивные (например, используются в картах, применяемых для входа в метро) и активные. Они позволяет проводить учёт и диагностику оборудования и документов, выявлять нуждающиеся в замене комплектующие, осуществлять сервисное обслуживание различных изделий (книг и др.) и объектов.

 

Обработка данных, информации, знаний.

В операциях обработки, также как и в операциях сбора выделяют «обработку данных», «обработку информации» и «обработку знаний».

Широкое распространение получили процессы обработки информации и данных. Эффективность электронной обработки связана в первую очередь с автоматизацией этих процессов и операций без участия человека. При этом за пользователями сохраняются функции анализа, контроля, регулирования и др.

Обработка информации подразумевает переработку информации определённого типа (текстовой, звуковой, графической и др.) и преобразования её в информацию другого определённого типа.

Принято различать обработку текстовой и графической информации, изображений (графики, фото, рисунки, чертежи), мультимедийной, в том числе звуковой (речь, музыка, другие звуковые сигналы) и визуальной (видео, мультипликация и т.п.) а также любой иной, воспринимаемой человеком, информации.

Обработка текстов является одним из средств электронного офиса. Наиболее трудоёмким процессом работы с электронным текстом обычно считается его ввод в ЭВМ. За ним следуют этапы подготовки (в т.ч. редактирования) текста, его оформления, сохранения и вывода. Пользователи получаю различный инструментарий, повышающий эффективность и производительность их деятельности, в том числе, например, распознающий отсканированный текст.

Широко применяется технология обработки изображений. При этом требуются высокие скорости, большие объёмы электронной памяти, специализированное техническое и программное обеспечение. Существенно облегчают их ввод и обработку в ЭВМ средства сканирования изображений.

Обработка таблиц осуществляется специальными прикладными программами, дополненными макросами, диаграммами, аналитическими и иными возможностями. Работа с электронной таблицей позволяет вводить и обновлять данные, команды, формулы, определять взаимосвязь и взаимозависимость между клетками (ячейками), таблицами, страницами, файлами с таблицами и базами данных (БД).

Обработка данных (англ. «Data processing») означает процесс последовательного управления числами и символами, и преобразования их в информацию. Эта технология может осуществляться в интерактивном и фоновом режимах и обычно используется в системах управления базами данных.

Общеизвестны централизованный, децентрализованный, распределённый и интегрированный способы обработки данных.

Централизованная обработка данных в ЭВМ первоначально представляла собой пакетную обработку информации. Пользователь доставлял в вычислительный центр (ВЦ) исходную информацию, а затем получал результаты её обработки в виде печатных документов и (или) в электронной форме. Это сложный и трудоёмкий способ работы с точки зрения обеспечения безопасности системы от возможного несанкционированного доступа и её бесперебойности, большой загруженности ВЦ информацией, регламентации времени выполнения операций. Поскольку сложность решаемых задач обычно обратно пропорциональна их количеству, то централизованная обработка данных требовала значительных материальных затрат на создание и эксплуатацию систем обработки данных, приводила к неэффективному использованию вычислительных ресурсов центральной ЭВМ, ограничивала доступ пользователей к её ресурсам.

Такой принцип централизованной обработки данных не отвечал высоким требованиям надёжности процесса обработки, затруднял развитие систем, не мог обеспечить необходимые временные параметры при диалоговой обработке данных в многопользовательском режиме. Причём кратковременный выход из строя центральной ЭВМ мог привести к серьёзным негативным последствиям. С созданием высоконадёжных и эффективных центров обработки данных (ЦОД) эта технология получила новое развитие.

Децентрализованная обработка данных связана с появлением ПЭВМ, позволивших автоматизировать конкретные рабочие места и повлекших за собой возникновение распределённой обработки данных.

Распределённая обработка данных выполняется на независимых компьютерах, связанных между собой в распределённую систему (компьютерная информационная сеть). Она реализуется двумя путями. Первый предполагает установку ЭВМ, например, в каждом узле сети. При этом обработка данных осуществляется одной или несколькими ЭВМ в зависимости от реальных возможностей системы и её потребностей на текущий момент времени. Второй путь предполагает размещение большого числа различных процессоров внутри одной системы.

Распределённый способ основывается на комплексе специализированных процессоров – каждая ЭВМ используется для решения определённых задач, или задач своего уровня. Он применяется там, где необходима сеть обработки данных (филиалы, отделения и т.д.), например, в системах обработки банковской и финансовой информации. Преимущества этого способа заключаются в возможности:

1) обрабатывать в заданные сроки любой объём данных с высокой степень надёжности (при отказе одного технического средства можно моментально заменить его на другой);

2) сократить время и затраты на передачу данных;

3) повысить гибкость систем;

4) упростить разработку и эксплуатацию программного обеспечения и др.

 

Обработка знаний.

В наиболее широкой трактовке когнитивным (знаниевым) информационным процессом считают процесс переработки информации системой, при котором она получает новую информацию, например, процессы восприятия, памяти, мышления, изучаемые когнитивной психологией. С другой стороны, когнитивными могут быть и ИП, приводящие к снижению потенциала. Например, опровержение представления, мнения или теории является актом познания, хотя и снижает потенциал соответствующих смыслов.

Интегрированный способ обработки информации предусматривает создание информационной модели управляемого объекта – распределённой базы данных. Он обеспечивает максимальное удобство для пользователя. С одной стороны, БД предусматривают коллективное пользование и централизованное управление. С другой стороны, – объём информации, разнообразие решаемых задач требуют распределения БД. Технология интегрированной обработки информации, реализуемая на основе однократно введённого в ЭВМ единого информационного массива, позволяет улучшить качество, достоверность и скорость обработки. Особенность этого способа заключается в отделение технологически и по времени процедуры обработки от процедур сбора, подготовки и ввода данных.

В информационных сетях обработка информации осуществляется различным образом в: пакетном и регламентном режимах; режимах реального масштаба времени, разделения времени и телеобработки, а также запросном, диалоговом, интерактивном; однопрограммном и многопрограммном (мультиобработка) режимах.

Преобразование информации является важным и наиболее часто используемым информационным процессом, представляющим целенаправленную обработку информации.

 

Передача и хранение информации.

В общем случае человек хранит получаемую им информацию в собственной памяти, то есть в мозгу. Можно говорить, что мозг представляет собой ёмкое хранилище разнообразной информации, например, даже образов. Развитие человечества привело его к созданию различных природных и рукотворных хранилищ и носителей информации. Они общеизвестны. Появление различных машин (например, пишущих), а затем и электронных машин привело к появлению машинных, а в последствии электронных носителей данных и информации, а также к созданию технических средств их передачи.

Так, например, человечество научилось использовать для передачи и сохранения графической информации рисунки, чертежи, схемы, а затем фотографии, телевизионные изображения и компьютерные файлы.

Человеческая речь является как средством обмена информацией между людьми, так и носителем человеческих знаний и опыта. Применение множества национальных и специальных языков, приспособленных для передачи информации конкретного содержания, зачастую усложняет не только обмен оной, но и решение определённых задач. Информатику интересует язык как средство представления и передачи информации.

Контроль данных (мониторинг) позволяет выявлять ошибки проектирования и непредвиденные ситуации, например, ошибки ввода и записи данных.

Вопросы, связанные с преобразованием и информационным обменом рассматриваются в отдельных параграфах.

Информатика – область человеческой деятельности, связанная с всевозможными информационными процессами, реализуемыми с помощью различных средств компьютерной техники.

Термин «информатика» (франц. «Informatique» – информация и автоматика) появился во Франции в середине 1960-х годов. Его аналогом считается английский термин «Computer Science», используемый обозначения науки о преобразовании информации, на основе применения вычислительной техники. Зачастую считается, что эти термины являются синонимами.

Появление информатики обусловлено возникновением и распространением новой технологии сбора, обработки и передачи информации, связанной с фиксацией данных на машинных носителях. При этом информатику обычно относят к фундаментальной науке, прикладной учебной дисциплине или производству.

Как фундаментальная наука информатика занимается разработкой связанных с применением информации математических теорий, методов, моделей и алгоритмов. На базе естественных (математики, физики, биологии и др.) и иных наук (управления, техники, связи, лингвистики, военной науки и др.) информатика изучает объекты и явления окружающего мира с точки зрения процессов генерации и сбора, обработки, передачи и выдачи информации о них, а также определённого сходства этих процессов при их реализации в искусственных и естественных (в том числе биологических и социальных) системах, и с точки зрения эффективного использования различных видов информации.

Считается, что основная задача информатики как науки заключается в систематизации методов работы с аппаратными и программными средствами вычислительной техники, позволяющей разрабатывать новые и совершенствовать (модернизировать) существующие способы применения информации, создавать, внедрять и развивать эффективные информационные технологии в различных сферах жизнедеятельности людей.

Как прикладная дисциплина информатика нацелена на подготовку научных работников и специалистов в различных предметных областях, так или иначе связанных с использованием информации. В этом случае основное её назначение заключается в том, чтобы изучать закономерности и особенности информационных процессов в конкретных областях, создавать методики разработки и использования информационных технологий и систем, а также обучения им различных категорий обучаемых.

Как отрасль производства информатика ориентирована на практическое использование результатов исследований информации, информационных технологий, процессов и систем в соответствующих предметных областях. Например, в сфере создания программных продуктов известны такие фирмы, как Microsoft, Lotus, Borland и другие, а в области производства технических средств – IBM, Apple, Intel, Hewlett Packard и другие.

Подводя итог, можно сказать, что информатика решает следующие задачи:

·  исследует информационные процессы в социальных и иных системах;

·  изучает вопросы, связанные с информацией, её свойствами, компонентами информационных процессов, способами измерения её характеристик, кодированием, использованием в различных предметных и иных областях, а также проектированием технического и программного обеспечения;

·  на основе результатов, полученных в ходе исследования информационных процессов, создаёт новейшие информационные технологии и системы, разрабатывает информационную технику;

·  решает научные и инженерные проблемы эффективного использования компьютерных технологий, программных и технических средств в различных предметных областях и сферах человеческой деятельности.

 

В исследуемой нами прикладной области можно говорить, что информатика устанавливает законы создания (разработки) и использования (эксплуатации) различных автоматизированных информационных систем, разрабатывает методы алгоритмизации, формирования и использования языковых и иных средств организации человеко-машинного диалога и др.

Информатика способствовала массовому переходу от «бумажных» к «безбумажным» (электронным) информационным технологиям и системам.

Появление вычислительной техники привело к появлению возможности хранить, актуализировать и многогранно использовать информацию, автоматизировать многие рутинные процессы, создавать электронные базы и банки данных, базы знаний и другие информационные системы.

Таким образом, информатика включает технические средства (англ. «hardware»), программные продукты (англ. «software»), математические методы, модели и типовые алгоритмы (англ. «brainware»).

К техническим средствам относят компьютеры и связанные с ними периферийные устройства (мониторы, клавиатуры, принтеры, сканеры, модемы и др.), телекоммуникации (линии связи), средства оргтехники и др.

Выбор варианта использования компьютера связан с возможностью использования необходимых для этого программных средств. К ним относят: операционные системы и их оболочки; языки и системы программирования, проектирования программных продуктов; диагностические (тестовые), а также различные инструментальные и прикладные программы, например, текстовые и графические редакторы, презентационные, бухгалтерские, справочные, производственные, издательские и иные системы.

Структура предметной области информатики можно представить следующим образом (Таблица 2).

Самым важным вопросом информатики считается эффективность. При этом для технических средств эффективность означает соотношение производительности к их стоимости, а для программного обеспечения – комфортность и производительность работы с ним пользователей. В программировании эффективность понимается как объём программного кода, созданного программистами за единицу времени.

 

Таблица 2

 

Структура предметной области информатики

 

 

 

 

 

 

Теоретическая информатика

·   Философские основы информатики.

·   Теория информации. Методы измерения информации.

·   Математические основы информатики.

·   Информационное моделирование.

·   Теория алгоритмов.

·   Представление знаний и интеллектуально-информационные системы.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средства информатизации

Технические

Хранения и обработки данных

·   Персональные компьютеры.

·   Рабочие станции.

·   Вычислительные системы.

·   Устройства ввода/вывода информации.

·   Накопители (магнитные, оптические, смешанные).

Передачи данных

·   Сети ЭВМ.

·   Комплексы.

·   Цифровые технические средства связи.

·   Телекоммуникационные системы передачи аудио, видео и мультимедийной информации.

Программные

Системное ПО и системы программирования

·   Операционные системы и среды.

·   Сервисные оболочки.

·   Утилиты.

·   Системы и языки программирования.

Реализации технологий

Универсальных

·   Текстовые и графические редакторы.

·   Системы управления базами данных.

·   Табличные процессоры.

·   Средства моделирования объектов, процессов и систем.

Профессио-нально-ориентиро-ванных

·   Издательские системы.

·   Профессионально-ориентированные системы автоматизации расчетов.

·   Системы автоматизации проектирования, научных исследований и пр.

 

 

 

 

Информационные технологии

·   Ввода/вывода, сбора, хранения, передачи данных.

·   Подготовки текстовых и графических документов, технической документации.

·   ГИС-технологии.

·   Программирования, проектирования, моделирования, обучения, диагностики, управления.

 

 

 

Социальная информатика

·   Информационные ресурсы общества.

·   Информационное общество – закономерности и проблемы.

·   Информационная культура, развитие личности.

·   Информационная безопасность.

 

Эффективная работа сложных экономических систем требует переработки значительных объемов различной информации.

Система (от греческого «systema» – целое, составленное из частей соединение) – это совокупность элементов, взаимодействующих друг с другом, образующих определённую целостность, единство.

Под системой понимают любой объект, который одновременно рассматривается как единое целое, и как объединённая в интересах достижения поставленных целей совокупность разнородных элементов.

Элемент системы – часть системы, имеющая определённое функциональное назначение. Сложные элементы систем, в свою очередь состоящие из более простых взаимосвязанных элементов, часто называют подсистемами.

 

Информационная деятельность как атрибут основной деятельности.

Жизнедеятельность любого живого организма связана с получением, обработкой и сохранением информации для её дальнейшего применения, в том числе обмена с другими живыми существами.

Человек воспринимает информацию с помощью органов чувств, при этом для обмена информацией люди используют национальные языки, способствующие не только общению, но формированию и развитию обществ и сообществ. Таким образом, деятельность человека связана с получением, преобразованием, накоплением и передачей различных видов информации. Такая деятельность называется информационной.

Информационная деятельность – это деятельность, обеспечивающая сбор, обработку, хранение, поиск и распространение информации, а также формирование организационного ресурса и организацию доступа к нему.

Информационная деятельность обеспечивает сбор, обработку, хранение, поиск и распространение информации, а также формирование информационного ресурса и организацию доступа к нему.

Кратко выше рассмотрены эти процессы. Таким образом, информационная деятельность базируется на выполнении отдельно и совокупно различных информационных процессов. Автоматизация выполнения таких процессов в любых предметных областях и сферах жизнедеятельности отдельных людей, обществ и государств связана с использованием информационных систем.

В Российской Федерации объявлена федеральная целевая программа «Электронная Россия на 2002–2010 годы». В соответствии с ней в России появится электронное правительство и будет завершен переход на электронный документооборот федеральными органами власти, органами власти субъектов Федерации и муниципальных образований.

В социальной сфере специалисты выделяют две группы воздействий информационной деятельности на социум.

Первая группа связана с непосредственным воздействием новых информационных технологий на сознание человека, значительно расширяющим его когнитивные и коммуникативные возможности.

Вторая обусловлена воздействием информационных технологий на социальную организацию путём использования средств коммуникации, позволяющих снижать время передачи информации, ускоряя, таким образом, процессы создания распределённых в пространстве социальных групп, расширяя возможности общения «всех со всеми».

Наряду с положительными воздействиями на человека и общество, информационная деятельность несёт и негативные последствия, порой отрицательно влияя на социальную сферу.

 

 

Основные процессы преобразования информации.

Преобразование одного вида данных в другой обычно связано с переходом сигналов к другому алфавиту. Такая процедура называется перекодировкой или шифрованием, а правило, описывающее однозначное соответствие букв алфавитов при таком преобразовании, называют кодом. Простейшей современной системой кодирования является уличный светофор.

Для расчётов используются различные числовые кодовые системы, а для преобразования букв и слов (текстов) – свои, например, позволяющие переводить русские слова в английские и т.п.

После применения пальцев рук, верёвок с узелками, деревянных палочек с зарубками и т. п., в первых механических вычислительных устройствах (Абак) использовали камешки. В результате появились системы счисления, наиболее известными из которых ныне являются десятеричные римская и арабская. Несмотря на попытки создания механических вычислительных устройств (механизировать счёт с использованием таких систем), результат оказался неудовлетворительным. Особенно это стало ясно с появлением электронных вычислительных машин, базирующихся на применении двоичной системы счисления. В них широко применяются различные системы кодирования и шифрования.

Для кодирования текстовой информации существует созданный в 1963 году международный стандарт ASCII (англ. «American Standard Code for Information Interchange»). Первоначально это была система семибитного кодирования. В такой кодовой таблице зарезервировано 128 семи разрядных кодов для кодирования: символов латинского алфавита, цифр, знаков препинания, математических символов. Добавление восьмого разряда позволяет увеличить количество кодов таблицы ASCII до 255. Коды от 128 до 255 представляют собой расширение таблицы ASCII. В таблице ASCII они использованы для кодирования некоторых символов, отличающихся от латинского алфавита (греческие буквы), а также встречающихся в европейских языках с письменностью, основанной на латинском алфавите: немецком, французском, испанском и др. Кроме этого, часть кодов использована для кодирования символов псевдографики, которые можно использовать, например, для оформления в тексте различных рамок и текстовых таблиц.

Для кодирования символов национальных алфавитов используется расширение кодовой таблицы ASCII, то есть восьми разрядные коды от 128 до 255. В языках использующих кириллический алфавит, в том числе русском, пришлось почти полностью менять вторую половину таблицы ASCII, приспосабливая её под кириллический алфавит.

Для представления в ASCII букв русского языка (кириллицы) появилось несколько версий. Первоначально был разработан ГОСТ под названием КОИ-7, оказавшийся неудачным и ныне он практически не используется. Отсутствие согласованных стандартов привело к появлению нескольких различающихся кодовых таблиц для кодирования русскоязычных текстов, среди которых: альтернативная кодовая таблица CP-866, международный стандарт ISO 8859, кодовая таблица фирмы Microsoft CP-1251 (кодировка Windows), кодовая таблица, применяемая в ОС Unix KOI-8r. Альтернативная кодовая таблица, учитывающая кириллицу (русский алфавит) KOI-8r, представлена на Рис. 1.

Ныне повсеместно внедряется 16-битный код Unicode (Юникод) – стандарт кодирования символов, допускающий 65536 кодовых комбинаций. Он включает знаки практически всех письменных языков: китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы. При этом становятся ненужными кодовые страницы.

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. «Unicode Consortium, Unicode Inc). Он состоит из двух основных разделов: универсальный набор символов – UCS (англ. «Universal Character Set») и семейство кодировок – UTF (англ. «Unicode Transformation Format»).


 

Рис. 1. Альтернативная кодовая таблица (KOI·8r)

 

Коды в этом стандарте представлены в нескольких областях. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. За ней расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF и от U+A640 до U+A69F.

Юникод имеет несколько форм представления: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) и UTF-32 (UTF-32BE, UTF-32LE).

Большинство современных операционных систем в той или иной степени обеспечивают поддержку Юникода. Причём в Microsoft Windows NT, 2000, XP и т.д. в основном используется форма UTF-16LE. В UNIX-подобных ОС GNU/Linux, BSD и Mac OS X принята форма UTF-8 для файлов и UTF-32 или UTF-8 для обработки символов в оперативной памяти.

UTF-8 (изобретён 2 сентября 1992 года) обеспечивает наилучшую совместимость со старыми системами, использовавшими 8-битные символы. При записи в UTF-8 текст, состоящий только из символов с номером меньше 128, превращается в обычный текст ASCII, а в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байтов (на деле, только до 4 байт, поскольку использование кодов больше 221 не планируется), в которых первый байт всегда имеет вид 11xxxxxx, а остальные – 10xxxxxx.

Есть у Юникода и недостатки, которые в основном связаны не с принципом кодирования, а с возможностями обработчиков текста. Так, пока не реализовано изображение «длинных» надстрочных символов, простирающихся над несколькими буквами (например, в церковнославянском языке). Русские буквы «Ё» (U+0401) и «Й» (U+0419) существуют в виде монолитных символов, а могут быть представлены и набором базового символа с последующим диакритическим знаком, то есть в составной форме (англ. «Decomposed»): «Е»+ «¨» (U+0415 и U+0308), «И»+ «˘» (U+0418 и U+0306). При этом много символов из языков с алфавитами на основе кириллицы не имеют монолитных форм.

Не всё прикладное программное обеспечение поддерживает корректную работу с ним. Юникод предусматривает возможность разных начертаний одного и того же символа в зависимости от языка. Так, русский и сербский языки используют разное начертание курсивных букв «п» и «т». В сербском они выглядят как «и» и «ш».

Файлы с текстом в Юникоде занимают больше места в памяти, так как один символ кодируется не одним байтом, как в различных национальных кодировках, а последовательностью байтов. Исключение составляет UTF-8 для языков, алфавит которых укладывается в ASCII. Кодовая таблица для кириллицы, взятая из Фрагмента спецификации UNICODE 4.0 (Unicode Standard, Version 4.0), приведён на Рис. 2.

 

 

Рис. 2. Кодовая таблица для кириллицы в UNICODE

 

В компьютерных системах используются электрические сигналы. Электрические сигналы могут быть непрерывными (например, синусоидальными и иными) и дискретными. Преобразование сообщения может осуществляться в момент поступления сообщения от источника в канал связи (кодирование) и в момент приёма сообщения получателем (декодирование).

Примеры преобразования аналоговых сигналов в электрические:

а) звук через микрофон;

б) изображение и звук через видеокамеру.

 

С математической точки зрения переход от аналоговой формы сигнала к дискретной означает замену описывающей его непрерывной функции Z(t) на некотором временном интервале [t1,t2] конечным множеством {zi,ti}, i=0,..n, где n – количество точек разбиения временного интервала.

Это преобразование называется дискретизацией непрерывного сигнала и осуществляется оно путём развёртки по времени и квантования по величине.

Развертка по времени осуществляется путём наблюдения за Z(t) не непрерывно, а лишь в определённые моменты времени с установленным интервалом.

Квантование по величине заключается в отображении значения Z(t) в конечное множество чисел, кратных так называемому «шагу квантования».

Шаг квантования определяется чувствительностью приёмного устройства. Например, если глаз человека способен воспринимать 16 миллионов цветов, то при квантовании просто нет смысла делать большее число градаций.

 

Кодирование звуковой информации.

Принцип оцифровки (кодирования) звука заключается в преобразовании непрерывного разного по величине амплитудно-частотного звукового сигналов в закодированную последовательность чисел, представляющих дискретные значения амплитуд этого сигнала, взятые через определённый промежуток времени. При этом на каждом временнóм отрезке определяют среднюю амплитуду сигнала. Вариант преобразования аналогового сигнала в цифровой представлен на Рис. 3.

 

 

Рис. 3.

 

Полученное в результате дискретизации множество значений называется дискретным представлением исходной непрерывной функции «n» и является конечной величиной. Очевидно, что чем меньше «n», тем меньше узлов, и, как следствие, меньше точность, которая может привести к потере информации, а чем реже (меньше) промежутки времени, тем качество закодированного сигнала выше. К потерям преобразуемой информации способны привести и помехи от используемых технических устройств.

Согласно Теореме отсчётов Котельникова (1933 год, аналогичные теоремы представил и американский учёный Шенон) непрерывный сигнал можно полностью отобразить и точно воссоздать по последовательности измерений или отсчётов величины этого сигнала через одинаковые интервалы времени, меньшие или равные половине периода максимальной частоты, имеющейся в сигнале.

То есть минимальная частота дискретизации должна быть в два раза больше максимальной частоты передаваемого непрерывного сигнала (например, для дискретизации воспринимаемого человеком звукового сигнала потребуется частота квантования не менее 40 КГц). В этом случае преобразования будет выполнено без потерь информации.

Согласно Шеннону (первая теорема) можно создать систему эффективного кодирования дискретных сообщений, у которой среднее число двоичных символов на один символ сообщения асимптотически стремится к энтропии источника сообщений (в отсутствии помех).

Вторая теорема Шеннона гласит, что при наличии помех в канале всегда можно найти такую систему кодирования, при которой сообщения будут переданы с заданной достоверностью.

Преобразование аналогового сигнала в цифровой (двоичную форму) осуществляется с помощью аналогово-цифровых преобразователей (АЦП; англ. «analog-to-digital conversion»). После дискретизации (преобразования непрерывного сигнала в многоуровневый ступенчатый сигнал) осуществляется квантование отсчётов – второй этап алфавитно-цифрового преобразования. При этом производятся измерения мгновенных значений уровней сигнала, полученных в каждом отсчёте.

Количество выборок в секунду, т. е. частота дискретизации аналогового звукового сигнала, может принимать различные значения. Минимально для кодирования амплитуды звукового сигнала отводят один байт (8 бит), что позволяет описать 256 уровней громкости. В этом случае частота дискретизации составляет 5,5 КГц, и в результате получается не слишком высокое качество звука. Такую кодировку в монофоническом канале используют при записи звука на диктофон, так как человеческий голос самый неприхотливый к компрессии, а также музыки с преобладанием низких частот.

Поскольку максимальная частота речевого сигнала в телефонных системах составляет 4 КГц, то частота его дискретизации равна 8 КГц, а одна минута звучания – менее 480 Кб. Если для кодирования звука взять два байта, то можно задавать более 65 тысяч значений амплитуды сигнала. В этом случае получается высококачественная запись звука, соответствующая кодированию звука с частотой дискретизации 44,1 КГц или 48 КГц. Таким образом, качество звука в дискретной форме может быть очень плохим (качество радиотрансляции) при 8 битах и 5,5 КГц и очень высоким (качество aудиo CD) при 16 битах и 44 кГц. Основные виды звуковых сигналов и соответствующие им частоты аналоговых и цифровых сигналов приведены в таблице 3.

 

Таблица 3

 

Основные виды звуковых сигналов и соответствующие им частоты аналоговых и цифровых сигналов

 

Частотный диапазон

Вид сигнала

Частота квантования

400–3500 Гц

Речь (едва разборчива)

5,5 кГц

250–5500 Гц

Речь (среднее качество)

11025 Гц

40–10000 Гц

Качество звучания УКВ-приемника

22040 Гц

20–20000 Гц

Звук высокого качества

44100 Гц

 

Минимумом для любых стереозаписей считается скорость 128 Кбит/с, при этом «Рэп» можно кодировать на скорости до 96 Кбит/с. Для большинства записей оптимальна скорость кодирования 192 Кбит/с. Её увеличение ведёт лишь к увеличению объёма файла. Для насыщенной, особенно симфонической, музыки используют постоянную степень сжатия 192÷224 Кбит/с.

Компьютерные технологии обеспечивают кодирование звука с большой скоростью потока данных (англ. «bitrate») и одновременно с достаточно хорошим качеством звучания. В них термин «битрейт» обозначает общую ширину потока.

Для записи оцифрованных звуков и музыки невысокого качества используют формат WAV, а для высококачественных музыкальных произведений – MIDI (англ. «Musical Instrument Digital Interface») и др. Формат MIDI появился в начале 1980-х годов и предназначался для обеспечения стандартного интерфейса между пультами управления музыкой типа клавиатур и звуковыми генераторами подобными синтезаторам. Синтезатор, хранящий образцы звучания («семплы») называется семплер.

Преобразование оцифрованного звукового сигнала в аналоговый осуществляется с помощью устройств дискретно-аналогового (цифро-аналогового преобразования, ЦАП).

Наиболее популярным стандартом аудиоданных с потерями является формат MP3 (MPEG Layer3). В нём ширина потока варьируется от наибольшего, равного 320 кбит/с, до 96 кбит/с и ниже. В Интернете многие записи сжаты до 112 Кбит/с, поэтому у некоторых пользователей бывает отрицательное впечатление от фонограмм, записанных в формате МР3. Высокая степень компактности MP3 при сохранении качества звучания достигается с помощью дополнительного квантования, позволяющего минимизировать потери качества.

 

Кодирование графической информации.

Под графической информацией понимают рисунок или картинку, например, в книге, чертёж, фотографию, изображения на экране (телевизора, в кинозале) и др. Для рассмотрения общих принципов кодирования графической информации выберем изображения на экране монитора компьютера. Оно состоит из некоторого количества горизонтальных линий – строк. Причём каждая строка содержит элементарные мельчайшие единицы изображения – точки (пиксели от англ. аббревиатуры «picsel» означающей словосочетание PICtureS ELement – элемент картинки). Массив элементарных единиц изображения называют растром (лат. «rastrum» – грабли). Степень чёткости изображения зависит от количества строк и точек в строке на всём экране, называемых разрешающей способностью экрана или просто разрешением. Чем больше строк и точек, тем чётче и лучше изображение. Обычным и уже устаревшим являлось разрешение 640x480, то есть 640 точек на строку и 480 строчек на экран. Современные экраны компьютеров поддерживают расширение 1280х1024 точек и выше.

Каждая строка представляет собой последовательность пикселов, а всё вытянутое в линию изображение можно считать линейной последовательностью элементарных точек. В рассматриваемом случае последовательность из 640x480 точек составит 307200 пикселов, а из 1280х1024 точек – 1310720 пикселов (1,3 мегапиксела).

Простейшим случаем кодирования изображения является кодирование монохромного изображения, состоящего из двух цветов: чёрного и белого. При этом таким же образом можно кодировать два контрастных цвета, например, зелёного и белого, жёлтого и синего и др. В данном случае каждый пиксел изображения может иметь либо чёрный, либо белый цвет. Если чёрному цвету присвоить, например, двоичный код «0», а белому – код «1», то можно закодировать в одном бите состояние одного пикселя монохромного изображения. Так как байт состоит из 8 бит, то на строчку, состоящую из 640 точек, потребуется 80 байтов памяти, а на всё изображение – 38 400 байтов. Определите тоже самое для расширения 1280х1024 (160х1024= 163840).

Такое изображение будет очень контрастным. Реальное чёрно-белое изображение включает в себя промежуточные оттенки (серый, светло-серый, тёмно-серый и др.). Если дополнительно к чёрному и белому цвету использовать две промежуточные градации, например, светло-серый и тёмно-серый, то для кодирования такого набора цветов потребуется два бита, например, чёрный цвет – 002, тёмно-серый – 012, светло-серый – 102 и белый – 112.

Для кодирования реалистичных монохромных изображений используется один байт, позволяющий передавать 256 различных оттенков серого цвета (от полностью белого до полностью чёрного). При этом для передачи всего растра из 640x480 пикселов потребуется не 38400, а 307200 байтов.

Цветное изображение можно формировать различным образом. Общеизвестен метод RGB (от англ. слов «Red», «Green» и «Blue» – красный, зелёный и синий). Он опирается на свойстве человеческого глаза воспринимать все цвета как сумму трёх данных цветов, например, сиреневый цвет представляет сумму красного и синего, а жёлтый цвет – сумму красного и зелёного и т. д. Следовательно, для получения цветного пикселя нужен не один, а сразу три цветных луча. Упрощая ситуацию, будем считать, что для кодирования каждого из цветов достаточно одного бита. Значит для кодирования одного цветного пиксела потребуется 3 бита.

При таком кодировании каждый пиксел может иметь один из восьми возможных цветов. Если каждый из цветов кодировать с помощью одного байта, как в реалистическом монохромном изображении, то можно передавать по 256 оттенков каждого из основных цветов, то есть 256x256x256=16 777 216 различных цветов, что достаточно близко к реальной чувствительности человеческого глаза. Таким образом, при данной схеме кодирования цвета на изображение одного пикселя потребуется 3 байта или 24 бита памяти. Данный способ представления цветной графики называют режимом True Color (англ. «true color» означает истинный цвет) или полноцветным режимом. Этот режим требуют много памяти, например, для растра 640x480 точек с использованием RGB потребуется 921600 байтов памяти.

Для экономии памяти используют различные режимы и графические форматы, которые немного хуже передают цвет, но требуют гораздо меньше памяти. Например, в режиме High Color (англ. «high color» переводится как богатый цвет) для передачи цвета одного пикселя используется 16 битов и можно передать до 65 535 цветовых оттенков. Другой пример – индексный режим, базирующийся на специальной таблице цветовых оттенков. Нужный цвет в этой таблице выбирается с помощью номера – индекса, занимающего один байт памяти.

При записи изображения в память компьютера кроме цвета отдельных точек требуется использовать дополнительную информацию (размеры рисунка, яркость точек и др.). Конкретный способ кодирования всей информации об изображении называют графическим форматом. Для кодирования графической информации, основанной на передаче цвета каждого отдельного пикселя, из которого состоит изображение, используются растровые «BitMap» форматы (англ. «bit map» означает битовая карта), например, BMP, GIF и JPEG форматы. Формат BMP (от «BitMaP») требует много памяти. В нём задаётся цветность всех пикселов изображения, при этом можно выбрать монохромный режим с 256 градациями или цветной с 16 256 или 16 777 216 цветами. В формате GIF (англ. «Graphics Interchange Format» – графический формат обмена) используются специальные методы сжатия кода с поддержкой только 256 цветов. Качество изображения немного хуже, чем в формате BMP, но код занимает в десятки раз меньше памяти. Формат JPEG (англ. «Joint Photographic Experts Group» – объединенная группа экспертов по фотографии) использует методы сжатия, приводящие к потерям некоторых деталей. Он поддерживает 16 777 216 цветов, обеспечивающих высокое качество изображения и занимает промежуточное положение между форматами BMP и GIF по их требованиям к памяти.

Растровая графика обладает существенным недостатком – изображение, закодированное в одном из растровых форматов, очень плохо переносит увеличение или уменьшение его размеров – масштабирование. Для решения задач, в которых приходится часто выполнять эту операцию, были разработаны методы, так называемой векторной графики.

Векторное изображение представляет совокупность графических примитивов (точек, отрезков, эллипсов и др.). Каждый примитив описывается математическими формулами. Кодирование зависти от прикладной среды.

В векторной графике базовым объектом является линия. Изображение формируется из описываемых математическим способом отдельных отрезков прямых или кривых линий, а также геометрических фигур – прямоугольников, окружностей и т. д. Для её реализации в компьютерных технологиях фирмой Adobe разработан специальный язык PostScript (от англ. «poster script» – сценарий плакатов, объявлений, афиш).

Кроме растровой и векторной графики существует фрактальная графика, в которой формирование изображений основано на математических формулах, уравнениях, описывающих те или иные фигуры, поверхности, тела. При этом само изображение в памяти компьютера фактически не хранится, а получается в результате обработки некоторых данных. Таким способом моно получать довольно реалистичные изображения, например, природных ландшафтов.

 

Кодирование видеоизображений.

Для хранения оцифрованных сжатых и несжатых видеоизображений используют формат AVI (англ. «Audio Video Interleave»). Один час видео с хорошим качеством занимает на машиночитаемом носителе примерно 20 Гб информации. Для уменьшения этого объёма используют сжатие видеоданных.

Видеоизображение сложнее закодировать, чем звук, так как у него объём информации, передаваемой в единицу времени, несоизмеримо больше. Кодируемый кадр разбивается на множество маленьких одноцветных частей, называемых пикселами. Используемые в изображении цвета нумеруются и для каждой части записывают номер её цвета. Для кодирования каждого пиксела используют 3 байта, так как любое цветное изображение формируется с помощью трёх основных цветов – красного, синего и зелёного.

Наибольшее распространение получил разработанный экспертной группа кинематографии метод сжатия MPEG (англ. «Moving Picture Experts Group»). Системы сжатия данных при записи движущегося изображения получили названия MPEG-1,2 и 4.

Стандарт MPEG-1 (1992 г.) предназначен для записи CD-ROM и Video CD. Использует кодирование преобразованием и скорость передачи 1,15 Мбит/сек, обеспечивающую воспроизведение движущегося изображения с качеством формата VHS.

Стандарт MPEG-2 (1994 г.) составляет основу стандарта DVB. Он создан с учётом особенностей телевизионных норм (чересстрочной развертки и др.).

Стандарт MPEG-3 не используется, так как выяснилось, что требования для организации телевидения с высоким разрешением выполняются стандартом MPEG-2.

Стандарт MPEG-4 предназначен для передачи данных с низкой скоростью (<1,15 Мбит/сек), например, по телефонным линиям.

Использовавшаяся для цифрового ТВ-вещания система MPEG-2 позволила без заметной потери качества снизить первоначальную скорость передачи 216 Мбит/сек приблизительно в 20 раз. Компрессия информации была впервые применена в видеосистеме Digital Betacam (1993 г.). Стандарт цифрового ТВ-вещания получил название DVB (англ. «Digital Video Broadcasting»). В конце XXI века появилось интернет-телевидение, позволяющее смотреть передачи с помощью специальных приставок, используя телевизоры в качестве терминалов.

Специально для использования методов и достижений интеллектуальных информационных систем в мультимедийных приложениях разработан формат MPEG-7, называемый «Мультимедиа-интерфейс для описания содержимого» (англ. «Multimedia Content Description Interface»). Он предназначен стандартизовать описание мультимедийного материала, поддерживающего некоторый уровень интерпретации смысла информации, которая может быть передана для обработки ЭВМ.

Кодирование используется и в других областях и сферах применения, например, в штрих-кодах, в шифровании традиционных и электронных данных и информации (зашифрованные файлы, электронная цифровая подпись и др.).

 

Контрольные вопросы

 

1.      Какими свойствами обладает информация?

2.      Дайте определение термина «Информационный процесс».

3.      Назовите и кратко охарактеризуйте основные информационные процессы.

4.      Назовите два вида информационных процессов.

5.      Что должна обеспечивать организация любого процесса?

6.      Что обеспечивают внутренние информационные процессы?

7.      Что представляют собой сбор данных, информации и знаний?

8.      Дайте определение термина «Обработка информации».

9.      Назовите основные типы обработки информации.

10. Чем отличаются друг от друга обработка данных, информации и знаний?

11. Охарактеризуйте способы обработки данных: централизованный, децентрализованный, распределённый и интегрированный.

12. Дайте определение термину «Информатика».

13. Что является самым важным вопросом информатики?

14. Дайте характеристику информационной деятельности.

15. Для чего используется ASCII?

16. Сколько кодов поддерживает ASCII?

17. Какие таблицы используются для представления в ASCII букв русского языка (кириллицы)?

18. Что представляет собой Unicode?

19. Что означает «дискретизация непрерывного сигнала»?

20. Как осуществляется кодирование звуковой информации?

21. Для чего используются АЦП и ЦАП?

22. Какие форматы используются для записи оцифрованных звуков и музыки?

23. Назовите особенности растровой, векторной и фрактальной графики.

24. Назовите форматы, используемые в различных видах компьютерной графики.

25. Как осуществляется кодирование видеодинамической информации?

26. Какие форматы используются для записи оцифрованных подвижных видеоизображений?

 


2. Информационный обмен

 

Обмен информацией – принципиальная особенность функционирования живых организмов. Он является важной составляющей жизнедеятельности человечества. Общение людей друг с другом (межличностное общение), их взаимоотношения с внешним миром, их производственная, научная и общественная деятельность тесно связаны с информационными процессами – процессами восприятия, передачи, обработки, поиска, хранения и отображения информации.

Информационные системы представляют собой системы организации информации и её обмена. В простейшем случае информационный обмен связан с передачей информации от одного абонента к другому, например, при их разговоре или при проведении лекции преподавателем и др. В этом случае средством обмена информации (коммуникации) будет речь.

Обмен информацией в организации обычно представляет собой процесс личного или в группах общения, при этом работники организации читают и составляют записки, письма, отчёты и т. п., беседуют между собой, разговаривают по телефону и др. Обмен информацией охватывает разные аспекты деятельности организации. Считается, что он прямо пропорционален её эффективности, однако люди общаются между собой менее эффективно, чем это им кажется. Более того, передаваемое сообщение может быть неправильно понятым и вы этом случае обмен информацией как минимум окажется неэффективным.

Очевидно, что обмен информацией состоит из нескольких компонентов, включающих: источник передачи информации (отправитель информации), передатчик, среду распространения информации (например, канал связи), приёмник и потребителя (получатель) информации (Рис. 4.). В случае обратной связи получатель информации становится её источником, и схема обмена повторяется, но в другом направлении.

 

 

Рис. 4.

 

Передача информации осуществляется с использованием какой-либо знаковой системы, например, вербальной, где используются звуки и речь, или невербальной, использующей различные неречевые знаковые системы. Основу невербальной системы составляет посланная отправителем без использования слов информация – любые символы.

Информационный обмен представляет сложный процесс, допускающий приём и передачу сообщений, понятных пользователям и представляемых в требуемых им форматах. Он подразумевает создание и распространение сообщений, поиск и интерпретацию информации для решения поставленных задач. Без обмена информацией невозможно общение и обучение, управление различными объектами, организация производственной, научной и общественной жизни человека. Обмен информацией между людьми посредством системы знаков и звуков характеризуется тем, что партнеры могут влиять друг на друга. Специалисты отмечают, что эффективность коммуникации измеряется результатами такого воздействия. Так, руководитель, передавая и получая информацию (обмениваясь ей), организует процессы управления подчиненными. Один из вариантов межличностного обмена информацией приведён на Рис. 5.

 

 

Рис. 5.

 

Первоначально информация из поколения в поколение передавалась в виде наскальных и иных изображений, а затем – устно. Первые наскальные рисунки, изображающие животных, растения, людей, появились примерно 20–30 тыс. лет назад. К подобной информации относятся сведения о профессиональных навыках, например, о приёмах охоты, способах земледелия и др.

Затем для фиксирования информации стала использоваться письменность, сначала появилась числовая информация (например, различные расчёты), а потом буквенная в виде слов.

Появление рукописных, а за ними и печатных книг произвело революционный переворот в различных сферах жизнедеятельности людей, в большей степени в области хранения и распространения информацией. Стало возможным сохранять информацию и знания, передавая их из поколения в поколение или распространяя с помощью пересылки по почте. Однако незначительное количество копий и длительный период создания печатной продукции не позволяли широко распространять информацию. К тому же, далеко не все люди в средние века, а порой и ныне умеют читать. Другим средством обмена информацией можно считать фотографию.

Следующим подобным этапом считается появление с конца двадцатого века технических механических и электромеханических средств копирования и передачи информации (пишущие машинки, полиграфическое оборудование, телеграф, телефон, телевидение). Они способствовали расширению сферы национального и даже международного обмена информацией.

Наконец, с середины прошлого столетия появляются и широко распространяются компьютерные программно-технические средства, а за ними и компьютерные информационные сети, ещё более расширившие возможности обмена информацией, сделав электронный обмен данными доступным широким слоям населения нашей планеты.

Электронный обмен данными (англ. «Electronic Data Interchange», EDI) предоставляет пользователям эффективное средство передачи различных, в том числе коммерческих, данных непосредственно из одной компьютерной системы в другую.

EDI начинает использоваться с конца 1960-х годов. С помощью стандартных сообщений EDI можно быстро и точно передавать данные независимо от особенностей программного и аппаратного обеспечения пользователей. Большие объёмы данных можно в считанные минуты передавать от одного компьютера в другой, что зачастую позволяет немедленно удовлетворять запросы клиентов. EDI позволяет организациям улучшать процессы управления и контроля в сферах производства, оказания услуг, закупок и материально-технического снабжения. EDI является ключевым компонентом стратегии «точно в срок» (англ. «just-in-time»), обеспечивающей оперативное удовлетворение запросов заказчика на участке «поставщик-клиент» и значительное снижение расходов складского хранения.

C середины 1970-х разрабатываются отраслевые стандарты EDI, которые становятся национальными. К середине 1980-х годов в разработке стандарта EDI приняла участие Европейская экономическая комиссия ООН (UN/ECE), а в 1987 году синтаксические правила нового языка утверждаются в виде международного стандарта ISO 9735, известного под аббревиатурой UN/EDIFACT.

UN/EDIFACT или ЭДИФАКТ ООН (Правила ООН Электронного обмена данными в управлении, торговле и на транспорте) представляет собой набор международных стандартов, справочников и руководств для электронного обмена данными. Для текущей работы учреждены несколько региональных комитетов (EDIFACT Board) от Пан-Американского до комитетов по Азии и Африке, возглавляемых региональными представителями – «раппортерами». Организационная структура UN/EDIFACT представлена на Рис. 6.

 

 

Рис. 6. Организационная структура UN/EDIFACT

 

В результате при участии Международной организации по стандартизации (ISO) появились международные стандарты EDI. В 1987 году Генеральная Ассамблея EAN International принимает решение о начале реализации проекта электронного обмена данными EANCOM.

EANCOM представляет собой компактное подмножество объёмного перечня сообщений UN/EDIFACT. Он обеспечивает чёткое толкование и подробное разъяснение порядка использования сообщений, что позволяет партнерам обмениваться электронными документами в простой, короткой и ясной форме. В России в национальной ассоциации автоматической идентификации ЮНИСКАН/EAN РОССИЯ (http://uniscan.ru) в рамках технического комитета ТК 355 «Автоматическая идентификация» действует подкомитет ПК 3 «Электронный обмен данными EANCOM».

Можно выделить несколько областей информационного обмена.

Первой и общедоступной является многоязычная и многообразная визуально-аудиальная информация. Например, её разновидности используются для глухонемых и слабовидящих. Она может осуществляться контактно (тактильно) без каких-либо технических средств, а также с помощью их разновидностей. То есть, в таком процессе люди должны находиться недалеко друг от друга или могут использовать полученные каким-либо образом носители информации (книги для слепых, аудиокассеты и т. п.).

Вторая область в большей степени связана с контактным или бесконтактным копированием и передачей информации. В первом случае индивид сам или с помощью других индивидов, как правило, на бумажном носителе делает одну или несколько копий оригинала (переписывает от руки, использует пишущую машинку, копир, принтер) и передаёт кому-нибудь самостоятельно. Во втором случае он может эти копии заказать и передать с помощью курьера, переслать по почте или посыльным с каким-либо транспортом.

Третья область связана с использованием компьютеров и телекоммуникаций, обеспечивающих передачу и обмен разнообразной электронной и (или оцифрованной электронной) информацией.

Не рекомендуется использовать только один канал для передачи сообщений и данных. В том случае отправителю приходится использовать несколько средств, определяя время и последовательность передачи информации. Хотя исследования показывают, что эффективнее одновременно использовать нескольких средств обмена информацией (например, устной и письменной или устной и электронной), чем любой одной информацией, в данном пособии предметом нашего исследования является именно третья область, связанная с использованием компьютеров и телекоммуникаций.

Главным элементом любого компьютера является процессор. С момента появления микропроцессоров выработаны определённые правила обмена. Программный обмен информацией является основным в любой микропроцессорной системе. Без него невозможны другие режимы обмена. При этом все операции обмена информацией инициируются процессором и выполняются строго в предписанном исполняемой программой порядке. Путь процессора по программе непрерывен; он может быть линейным, циклическим и может содержать переходы.

Установлено, что принципы организации обмена по шинам важнее особенностей конкретных микропроцессоров, поскольку стандартные системные магистрали живут гораздо дольше, чем процессоры. Кроме того, некоторые системы с разными процессорами используют одну и ту же системную магистраль (шину).

Обмен информацией в микропроцессорных системах происходит в циклах обмена информацией – временных интервалах, в течение каждого из которых по шине происходит выполнение одной элементарной операции обмена. Например, пересылка кода данных из процессора в память или пересылка кода данных из устройства ввода/вывода в процессор. В пределах одного цикла можно передать несколько кодов данных, и даже целый массив данных. Циклы обмена информацией делятся на два основных типа: 1) записи (вывода) – процессор записывает (выводит) информацию; 2) чтения (ввода) – процессор читает (вводит) информацию. Особое место занимают циклы прямого доступа к памяти, а также циклы запроса и предоставления прерывания (если в системе есть прерывания).

Во время каждого цикла участвующие в обмене информацией устройства передают друг другу информационные и управляющие сигналы в соответствии с принятым протоколом обмена информацией (в строго установленном порядке). Длительность цикла обмена может быть постоянной или переменной, но она всегда включает в себя несколько периодов сигнала тактовой частоты системы. Причём даже в идеальном случае частота чтения информации процессором и частота записи информации в несколько раз меньше тактовой частоты системы. Большое значение имеет то, как процессор заканчивает обмен в пределах цикла. Возможны два пути решения:

1. Синхронный обмен. При этом процессор заканчивает обмен данными самостоятельно через установленный временной интервал выдержки, то есть без учёта интересов устройства-исполнителя;

2. Асинхронный обмен. При этом процессор заканчивает обмен только когда устройство-исполнитель подтверждает выполнение операции специальным сигналом (режим «handshake» – рукопожатие).

 

Важным в информационном обмене является организация обмена отдельными документами. В традиционных системах документооборота он осуществляется нарочными, с помощью курьеров, посыльных, а также пересылки документов по почте.

В компьютерных системах информационный обмен осуществляется в различных компьютерных сетях. При этом документы являются файлами. В этих системах широко используется обмен файлами. Любое приложение MS Office 2000 содержит коллекцию документов и позволяет открывать в одном приложении несколько документов и обеспечивает совместную работу с ними. В простейшем случае этот процесс означает копирование информации на какой-либо сменный носитель, с которого в дальнейшем эти файлы перенесутся на другой компьютер.

Наиболее часто подобный, как правило, отложенный обмен осуществляется в телекоммуникациях (компьютерных сетях). С этой целью широко используются различные сервисы Интернета (электронная почта, BBS, блоги и др.). При этом применяют разные технологии и протоколы, например, FTP, протоколы обмена маршрутной информацией TCP/IP и др.

Для электронного обмена коммерческими документами между информационными системами применяются разработанные в 2000 году стандарты CommerceML. Эти стандарты позволяют существенно снизить затраты на организацию информационного взаимодействия за счёт унификации обмена коммерческой информацией между различными организациями. В них учтены различные особенности работы Интернет-компаний и торгующих организаций.

В сетях используются и интерактивные (он-лайновые) технологии обмена информацией, например, чаты, телеконференции и др. Информация может размещаться на сайтах и порталах в Интернете и быть доступной широким слоям населения различных стран. Она может быть закрытой и в зашифрованном виде передаваться абоненту, например, по его запросу. Существуют и другие варианты.

В качестве телекоммуникаций выступают проводные и беспроводные средства и устройства связи. В данном пособии они не рассматриваются. Тем не менее, их выбор для организации информационного обмена не всегда является тривиальным. Зачастую передаваемая информация не должна ограничиваться единственным каналом. Более того, порой необходимо устанавливать последовательность использования этих средств и определять временные интервалы передачи информации.

Компьютерные коммуникации для обмена информацией могут использовать общеизвестные технологии, связанные с передачей голоса, музыки и другой звуковой информации, графических, статических и динамических изображений. Подобная информация может просто копироваться на носитель её получателя, а может использоваться для обмена сведениями, например, в режиме текстового или голосового обмена. В любом случае изначально чаще всего на средствах адресата, особенно организации, она хранится в автоматизированной информационной системе.

Внедрение различных средств автоматизации и автоматизированных информационных систем привело к появлению множества разнородных систем, зачастую не имеющих возможности интегрироваться друг с другом. Поэтому внедрение новых ИС в большей степени связано с решением проблем их взаимодействия с имеющимися, а также внедрением единой системы информационного обмена в организации (особенно крупной с филиалами). При этом системы, разработанные без учёта интеграции с другими системами, могут использоваться для совместной обработки данных в рамках сквозных бизнес-процессов этой организации. Например, компания IBS рекомендует с этой целью применять одну из наиболее мощных платформ информационного обмена – SAP Exchange Infrastructure.

Технологии обмена сообщениями в компьютерных сетях между мэйн-фреймовыми приложениями используются с 1970-х годов. Современный обмен электронными сообщениями подразумевает использование различных сетевых компьютерных технологий и информационных систем (СУБД[2], распределённых СУБД – РСУБД). В таком случае обмен сообщениями означает применение технологии обмена информацией, как минимум, между двумя разнесенными объектами. Простейший случай отложенного обмена сообщениями – это E-Mail. Почтовые системы позволяют обмениваться информацией между двумя или более людьми.

Информацией между собой обмениваются не только различные СУБД, но также приложения и пользователи. Такой обмен включает в себя не только информацию об изменении данных в одной из систем, но и информацию о выполненных транзакциях, произошедших событиях, обмен сообщениями и др. При этом важно, чтобы передавалась только нужная информация в установленные время и место неперегружая сеть и исходную БД.

Специальные компьютерные программы помогают наладить информационный обмен внутри организации и между ними. Например, система «1С: Предприятие» предоставляет различные возможности обмена данными между разнофункциональными решениями, удалёнными подразделениями и партнерами-контрагентами. Входящий в неё «Менеджер обмена данными» беспрепятственно обменивается данными между удалёнными офисами, соединяет разнофункциональные конфигурации на разных компонентах программы, переносит данные из старых версий конфигураций в новые.

Системы обмена сообщениями практически не влияют на работу приложений, а обеспечивают надёжное взаимодействие между любым видами приложений на различных платформах. Такие системы могут располагаться независимо на различных аппаратных платформах и позволяют организовать коммуникацию между двумя и более приложениями без участия в этом процессе людей. Обмен сообщениями широко используется через Интернет в таких технологиях, как бизнес-бизнес (B2B) и бизнес-покупатель (B2C).

Например, рассмотрим вариант B2C в компании, продающей какие-либо товары или услуги. Такая компания в своей системе обычно организует покупателям возможность формирования онлайнового заказа. После ввода покупателем своей заявки, она в виде соответствующего сообщения посылается в систему управления компании, где определяется возможность выполнения данного заказа. Параллельно желательно автоматически определять заканчивающиеся товары с тем, чтобы заказать и своевременно пополнить их запасы на складе.

Важным аспектом процесса обмена сообщениями является его асинхронность, означающая, что посылающий сообщение не должен ждать немедленного получения информации адресатом (аналогично работе E-Mail). При наличии возможности удовлетворить заказ покупателя, ему посылается соответствующее сообщение, согласовываются сроки и место доставки.

Обмен информацией между бизнес-партнерами (B2B) требует налаженного взаимодействия со стороны поставок и закупок. Требуется обеспечивать высокую надёжность такого обмена, поскольку: высылаемые с помощью факсов коммерческие предложения могут быть утеряны; невозможно по телефону своевременно и оперативно получать необходимые сведения, например, узнать о состоянии счёта; по электронной почте могут быть получены неверные данные, например, номер товара и др. Решению данных проблем в значительной степени способствует применение ИС, а также сайтов и порталов организаций.

Глобализации экономики, вызывает потребность работать и на мировом рынке. Современные электронные системы управления сообщениями позволяют решать и проблемы, связанные с работой территориально разнесённых организаций. Обычно такие географически разнесённые системы работают локально, то есть независимо друг от друга, поэтому им требуется обеспечивать регулярный высокоскоростной обмен информацией. Приведём варианты реализаций систем обмена сообщениями.

Новый способ делового общения – видеоконференции, всё более завоёвывает мировой рынок в бизнесе как В2В, так и В2С, в правительственных кругах и других областях, например, в обучении и медицине.

Эта технология позволяет значительно снизить затраты на передачу информации, в том числе обмен данными, мнениями и т.п., обеспечивает совместную работу с электронными документами, демонстрацию фото- и видеоматериалов, является мощным средством повышения эффективности работы персонала, экономии времени и финансов, дающим дополнительные удобства в работе.

Поскольку видеоконференции и вебсеминары позволяют естественным образом общаться с людьми, находящимися на значительных расстояниях друг от друга, поэтому всё чаще высказывается мнение, что данные технологии и системы являются важным средством делового общения.

В архитектуре hub-and-spoke (звезда), все приложения соединяются с центральным процессом, называемым сервером сообщений. Этот сервер обслуживает все коммуникации с подсоединенными приложениями и вызывает клиента приложения. Сервер сообщений отвечает за корректную пересылку сообщений, аутентификацию и авторизацию пользовательского доступа, а также за гарантию доставки сообщений. Каждый клиент приложений может быть приёмником сообщений, их передатчиком или тем и другим.

В этом случае уменьшается число необходимых сетевых подключений, поскольку при посылке сообщения любому клиенту требуется подключение только к серверу сообщений. Сервер сообщений обслуживает весь обмен данными, поэтому напрямую друг с другом сервера и клиенты не связаны. Их можно легко перемещать и переконфигурировать, минимально влияя на систему обмена сообщениями. Так как большая часть логики управления сообщениями работает на сервере сообщений, то клиентам приложений для обеспечения коммуникации требуется меньше программного обеспечения.

На практике сервер сообщений обычно состоит из нескольких процессов, выполняемых на разнесенных машинах, формирующих единый логический сервер сообщений. Такая мультипроцессная конфигурация называется кластерной. В ней поддерживается высокий уровень устойчивости к сбоям. Если один сервер отключится, то клиенты приложений переключатся на другой сервер кластерной архитектуры.

В магистральной архитектуре (англ. «bus architecture»), нет единого, координирующего доставку, центрального сервера сообщений. Каждый клиент приложения обладает такой функциональностью сервера сообщений, как гарантия доставки, поддержка транзакций и безопасности. Все клиенты приложений подключены к единой магистрали сообщений, например, к особому уровню сетевого IP протокола, обеспечивающему прохождение сообщений между клиентами. Однако клиенты самим отвечают за надёжную, с соблюдением мер безопасности, доставку сообщений.

В магистрали поддерживается вся маршрутизация. Причём ни один клиент не имеет данных о местонахождении других клиентов. Главный недостаток использования группы (англ. «multicast») в магистральной архитектуре заключается в том, что администраторы могут запретить передачу сообщений через их модуль безопасности (англ. «firewall»). Поэтому, если система разворачивается в Интернете, то лучше не использовать multicast и магистральную архитектуру.

Универсальный и гибкий механизм обмена информацией предлагает Oracle – это Oracle Streams, позволяющий одновременно реализовать репликацию, обмен сообщениями, загрузку хранилищ данных, работу с событиями, поддержку резервной БД. Данный механизм включает три основных элемента: захват изменений (Capture); складирование, хранение и распространение изменений (Staging); применение изменений (Consumption или Apply).

Вся необходимая для различных механизмов обмена информация в системе автоматически захватывается, упорядочивается, преобразуется в универсальный формат и помещается в область хранения. Затем она автоматически перемещается между областями хранения в тех целевых узлах, где она нужна. Эта информация используется Apply процессами, выполняющими репликацию, загружающими хранилище данных, обновляющими резервную БД и т д. Приложениям-потребителям достаточно подписаться на необходимую им информацию и они будут автоматически её получать, а Apply процессы будут её автоматически применять.

Для защиты системы от сбоев, приводящих к выходу системы из строя, используют резервные БД, располагаемые вдали от основной БД. Резервная БД принимает и применяет все изменения основной БД. В случае сбоя, она быстро и без потерь заменяет основную. Обновление резервной БД является частным случаем репликации. При этом реплицируются все изменения в БД и эти изменения передаются от основной БД к резервной.

В среде Интернета широко используются различные корпоративные системы. Приведём основные функции информационного обмена в таких системах:

1.      Настройка соответствия атрибутного состава данных между объектами различных систем;

2.      Поддержка различных кодировок и форматов данных, возможность перекодировки данных в процессе их передачи между системами;

3.      Преобразование данных по заданным правилам;

4.      Поддержка интерфейсов (on-line, off-line) с подсистемами единой корпоративной информационной системы (ЕКИС);

5.      Возможность подключения географически удалённых систем стандартными способами (модемное соединение);

6.      Оперативная и отложенная передача данных между удалёнными системами;

7.      Управление цепочками передачи данных между системами (WorkFlow);

8.      Синхронный и асинхронный обмен данными;

9.      Унификация и стандартизация информационного обмена между подсистемами корпоративной системы;

10. Единый интерфейс для настройки и управления всеми информационными потоками;

11. Централизованное управление и администрирование процессов информационного обмена.

 

При построении современных информационных систем всё чаще приходится использовать многосерверные архитектуры. Например, типичная архитектура корпоративной ИС крупного предприятия содержит центральную и, как правило, резервную БД, а также БД филиалов или регионов. Другой пример – интеграция работающих в организации ИС с вновь создаваемыми на других компьютерах или создание хранилищ данных, включающих информацию нескольких ИС и др.

Следует отметить, что сложность интеграции разнородных систем с различной архитектурой, языками, средствами доступа и т. д. обычно столь велика, что большинство подобных проектов оканчивается неудачей.

В случае интеграции любых информационных систем с распределёнными базами данных создаются многоуровневые и многоузловые системы обмена информации. Для организации обмена большими массивами информации всё чаще используются центры обработки информации. Кроме межличностного, общественного и производственного используют также межведомственный и международный информационный обмен.

Межведомственный информационный обмен в РФ предполагает использование ведомственных информационных систем, автоматически обменивающихся полученными данными посредством системы межведомственного информационного обмена и Межведомственного информационного центра. Система межведомственного информационного обмена обеспечивает унифицированные, надёжные и безопасные механизмы обмена данными между ведомственными информационными системами.

Например, сеть обмена научно-техническими и инженерными данными (СОД ННС) или NanoNet является ресурсным и сервисным информационно-коммуникационным базисом информационно-аналитической инфраструктуры наноиндустрии. NanoNet обеспечивает её участникам возможность доступа к информационно-технологическим ресурсам инфраструктуры, таким как:

·    электронные распределённые хранилища информации и электронные библиотеки;

·    распределённые вычислительные ГРИД-ресурсы и сервисы (наноГРИД).

 

Международный информационный обмен (англ. «International information exchange»), согласно законодательству РФ, означает передачу и получение информационных продуктов, а также оказание информационных услуг через Государственную границу РФ.

Объектами международного информационного обмена являются: документированная информация, информационные ресурсы, информационные продукты, информационные услуги, средства международного информационного обмена.

Субъектами международного информационного обмена в Российской Федерации могут быть: Российская Федерация, субъекты Российской Федерации, Органы государственной власти и Органы местного самоуправления, физические и юридические лица Российской Федерации, физические и юридические лица иностранных государств, лица без гражданства.

В заключение отметим, что процессы обмена информацией (например, обмен почтовыми сообщениями и записями из БД, доступ к веб-ресурсам и записям БД) могут быть подвергнуты различным несанкционированным воздействиям, в том числе собственных сотрудников организации, например, отправка конфиденциальной информации лицам, не имеющей доступ к ней, искажением сообщений путём изменения смысла и содержания сообщения и др.

Создавать проблемы при обмене информацией может и сама информационная система (обычно, если она плохо разработана), а также конфликты между работниками организации.

Защита от возможных несанкционированных действий достигается использованием различных программно-технических средств и политик, например путём внедрения системы контроля трафика, обеспечивающей защиту от утечки защищаемой информации посредством анализа пересылаемых сообщений, вложенных файлов по ключевым словам; сохранения пересылаемых данных для дальнейшего их анализа администратором ИС, блокировки определённых веб-ресурсов и др.

Некоторые компании представляют инновационные решения для защиты информации во время её передачи в Интернете. Компания Egress Software Technologies в начале 2009 года предложила систему Switch, позволяющую отправителю в любой момент отозвать право расшифровки для получателя информации. Решение компании на первый взгляд предлагает стандартную систему с шифрованием на стороне отправителя и расшифровкой на стороне получателей с помощью специальных клиентских программ. Новизну программе Switch придает использование внешней системы подтверждения. При создании зашифрованного файла сервер Switch получает сигнал с указанием названия файла и списка получателей. Отправитель может расшифровать полученный файл только с разрешения сервера Switch. При первой же необходимости отправитель может сообщить серверу об отзыве своего разрешения для одного или нескольких получателей – тогда указанные получатели просто не смогут расшифровать полученный файл.

Компания SafeMashups представила протокол MashSSL для защищённой передачи данных между веб-сервисами в составе композитного веб-приложения (mashup). Данная технология представляет собой протокол защищённого обмена данными между веб-приложениями – подлинность взаимодействующих сторон удостоверяется специальным сертификатом, выдаваемым специальными независимыми органами. Один из крупнейших центров сертификации Verisign подтвердил наличие поддержки технологии MashSSL.

 

Контрольные вопросы

 

1.      Что представляет собой обмен информацией в организации.

2.      Из каких общеизвестных компонентов состоит обмен информацией?

3.      Какие средства передачи информации появились с конца двадцатого до 40-х годов двадцать первого века?

4.      Какие средства передачи информации появились начиная с середины прошлого столетия и до его окончания?

5.      Дайте определение понятия «Электронный обмен данными».

6.      Назовите несколько областей информационного обмена.

7.      Влияют ли системы обмена сообщениями на работу приложений?

8.      В чем суть межведомственного и международного информационного обмена?

9.      Назовите объекты и субъекты международного информационного обмена.

 


3. Задачи и функции, состав и структура информационных систем

 

В информатике понятие «система» широко распространено и имеет множество смысловых значений. Чаще всего оно используется для обозначения набора технических средств и программ. Кроме внешних изменений, влияющих на систему, существует и множество внутренних трансформаций, наиболее существенными (и, как правило, болезненными) из которых являются перемены в организационной структуре и методах управления. При этом могут меняться как сами процессы, так и состав системы.

Поскольку информация фиксируется и передаётся на материальных носителях, необходимы действия человека и работа технических средств по восприятию, сбору информации, её записи, передаче, преобразованию, обработке, хранению, поиску и выдаче. Эти действия обеспечивают нормальное протекание информационных процессов и входят в технологию управления. Они реализуются технологическими процессами обработки данных с использованием различных технических средств.

Система, в названии которой присутствует слово «информационная» отражает цель её создания и функционирования. Существует множество определений информационных систем. Рассмотрим некоторые из них.

Информационная система (ИС, англ. «Information system») – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.

В Федеральном законе «Об информации, информатизации и защите информации» даётся следующее определение: «Информационная система – организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы».

Под информационной системой, использующей компьютеры, понимают: совокупность программно-технических и других средств сбора, представления и накопления, передачи и поиска, обработки и хранения необходимой для удовлетворения информационных потребностей пользователей информации, а также персонал, выполняющий подобные действия; организационно-упорядоченную совокупность документов (ИР) и информационных технологий, реализующих информационные процессы; организационно-функциональную структуру, реализующую обработку информации.

Информационная система – это прикладная компьютерная программная подсистема, ориентированная на сбор, хранение, поиск и обработку текстовой и (или) фактографической информации.


К определяющим свойствам любой информационной системы относят:

·    технический уровень системы;

·    характер обрабатываемой информации;

·    круг задач, для решения которых данная система предназначена (целевая функция).

 

Эти факторы определяют форму представления информации в системе для пользователя, характер процессов обработки информации и взаимодействия ИС с внешней средой, состав программного обеспечения проектируемой или функционирующей системы.

ИС должна обладать следующими свойствами:

1) функциональностью – любой объект ИС должен содержать функционально законченную и максимально независимую совокупность операций по обработке данных;

2) связанностью, когда в объекте реализуется совокупность взаимосвязанных функций – методов, работающих с одними и теми же данными, некоторые из которых скрыты для системы в целом;

3) маскировкой – доступностью для системы лишь параметров объекта, составляющих наборы входного и выходного интерфейсов объекта.

 

Важным свойством ИС является минимизация числа её информационных связей, от которых зависят затраты на модификацию системы при её функционировании в изменившихся условиях и решении изменившихся функциональных задач.

Информационных системы представляют собой инструментарий, предназначенный для оперативного и эффективного информационного обеспечения различных категорий пользователей. Отметим, что основными представителями информационных систем являются архивы, библиотеки, музеи, различные информационные подразделения и организации.

Создание информационной системы и эксплуатация её в какой-либо организации или предметной области позволяет лицам, занимающимся этим, взаимодействовать не с реальными объектами предметной области системы, а с самой информационной системой.

ИС могут быть «традиционными» (ручными), автоматизированными и комбинированными. В дальнейшем речь пойдёт об автоматизированных ИС.

В работе информационной системы выделяют этапы, связанные с основными свойствами информации:

1.      Зарождение данных – формирование первичных сообщений, фиксирующих результаты выполненных операций, свойства объектов и субъектов управления, параметры процессов, содержание нормативных и юридических актов и т.п.

2.      Накопление и систематизация данных – организация их размещения, обеспечивающего быстрый поиск и отбор нужных сведений, обновление данных, защиту их от искажений, потери и др.

3.      Обработка данных – на основании накопленных данных выполнение процессов, позволяющих изменять, в том числе расширять (дополнять) существующие, а также формировать новые виды данных (обобщающие, аналитические, рекомендательные, прогнозные и др.).

4.      Отображение данных – представление их в форме, пригодной для восприятия человеком: вывод на экран (как правило, диалоговый режим) и печать (создание документов на «твёрдых» (бумажных) носителях), а также построение статических графических иллюстративных материалов (графиков, диаграмм), формирование звуковой и видео динамической информации.

 

Этапы развития ИС.

Этапы развития информационных систем и цели их использования представлены в Таблице 4.

 

Таблица 4

 

Этапы развития информационных систем и цели их использования

 

 

Первое поколение ИС. Первые коммерческие информационные системы появились в 1950-е годы. Они предназначались для обработки счетов и расчёта зарплаты, а реализовывались на электромеханических бухгалтерских счётных машинах, что позволило сократить различные затраты, в том числе время, на подготовку бумажных документов.

В 1960-е годы средства вычислительной техники получили дальнейшее развитие. До этого функции информационных систем в основном сводились к диалоговой и другой обработке данных (англ. «Electronic Data Processing», EDP) и запросов, хранению записей, бухгалтерскому учёту. В данный период появляются операционные системы, дисковая технология, улучшаются языки программирования, изменяются отношения к информационным системам. Хранящаяся в них информация стала применяться для периодической отчётности по многим параметрам. Для этого потребовалось компьютерное оборудование широкого назначения, способное обслуживать множество функций, а не только обрабатывать счета и считать зарплату.

Второе поколение ИС. В 1960÷1970 годы ИС строились на базе центральных ЭВМ по принципу «одна организация – один центр обработки», а в качестве стандартной среды выполнения приложений (функциональных задач) служила операционная система. В 1970-е ÷ начале 1980-х годов информационные системы начинают широко использоваться в качестве средства управленческого контроля, поддерживающего и ускоряющего процесс принятия решений. Появление управленческих информационных систем (англ. «Management Information Systems», MIS) привнесло дополнительные функции, ориентированные, например, на формирование необходимых выходных форм и отчётов. В это время появляются первые микропроцессоры, интерактивные дисплейные устройства, технология БД и дружественное по отношению к пользователю программного обеспечения (ПО) – средства, позволяющие работать с программой, не изучая её описания. В 1970-е годы появляются первые системы поддержки принятия решений (СППР; англ. «Decision Support Systems», DDS). В отличие от систем управленческих отчётов, обеспечивающих информацией по заранее установленным формам отчётности, СППР предоставляют её по мере необходимости[3].

Третье поколение ИС. В 1970÷1980-х годы появляются разнообразные компьютерные и телекоммуникационные технологии, расширяющие область применения информационных систем (IS); осуществляются первые шаги к децентрализации ИС, в процессе которой мини-компьютеры (персональные ЭВМ, ПЭВМ, компьютеры) начинают использоваться в организациях, отделениях компаний, офисах и т. п. Данное положение привело к появлению «конечного пользователя» (англ. «End User Computing»), способного самостоятельно использовать вычислительные ресурсы для решения задач, связанных с его профессиональной деятельностью. К таким технологиям относят: текстовую обработку, настольное издательство, электронную почту и др. Параллельно началось активное внедрение высокопроизводительных СУБД типа DB2 и пакетов коммерческих прикладных программ. Таким образом, кардинальным новшеством ИС этого поколения стала двух- и трёхуровневая модель организации системы обработки данных (центральная ЭВМ – мини-компьютеры отделений и офисов) с информационным фундаментом на основе децентрализованной БД и прикладных пакетов.

В соответствии с ГОСТом СУБД определяется как «совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами».

Четвертое поколение ИС. 1980-е ÷ начало 1990-х годов отмечаются бумом распределённой сетевой обработки, обусловленной главным образом массовым переходом на персональные компьютеры. Логика корпоративного бизнеса потребовала объединения разрозненных рабочих мест в единую ИС. В результате в вычислительных сетях появилась распределённая обработка информации. В одноранговых сетях обнаружились признаки иерархичности – сначала в виде выделенных файл-серверов, серверов печати и телекоммуникационных серверов, а затем – серверов приложений. Возрастающую потребность в концентрации ресурсов ИС, ответственных за администрирование системы (организацию вычислительного процесса), поддержку корпоративной БД и выполнение связанных с ней централизованных приложений, удалось удовлетворить за счёт использования UNIX-серверов. Рынок серверов становится динамичным сектором компьютерной индустрии.

К концу 1980-х годов вновь меняется концепция использования ИС. Они становятся стратегическим источником информации и используются на всех уровнях организации любого профиля. ИС этого периода, предоставляя вовремя нужную информацию, помогают организациям достигать успеха в своей деятельности, создавать новые товары и услуги, находить новые рынки сбыта, обеспечивать достойных партнеров, организовывать выпуск продукции по низкой цене и др. Развитие ИС привело к появлению иерархической модели клиент-сервер, приведшей затем к появлению модели, в которой централизованная обработка и единое управление ресурсами ИС на верхнем уровне сочетаются с распределённой обработкой на нижнем.

В 1990-е годы широкое распространение получают телекоммуникации, организованные с помощью локальных, корпоративных и глобальных компьютерных сетей. Они привлекают пользователей сокращением времени обслуживания или предоставления им комфорта, повышают качество и оперативность работы специалистов в процессе принятия решений за счёт быстрого сбора данных из различных территориально удалённых подразделений и оперативного анализа их.

Пятое поколение ИС начинается с 2000-го года. Оно обусловлено с дальнейшим развитием информационных систем четвёртого поколения, а также появлением и развитием интеллектуальных и нейро систем и сетей. Причём развитие ИС четвёртого поколения связано, главным образом, с формированием одного или нескольких «информационных узлов концентрации», каждый из которых объединяет аппаратные и программные средства, предназначенные для эффективной поддержки работы конечных пользователей. Это привело к появлению методов и средств, обеспечивающих интегрированные решения реализации различных информационных процессов, позволяющих автоматизировать ручные операции и поиск документов, автоматически передавать и отслеживать перемещение документов и контролировать выполнение поручений, связанных с документами и др. С этой же целью в подобных узлах системы сосредоточивается специализированный персонал, выполняющий функции системного администрирования, управления сетевыми ресурсами и технической поддержки. Примером подобных систем являются датацентры и центры обработки данных.

Данное поколение характеризуется объектно-ориентированным подходом к проектированию ИС, автоматизацией проектирования, использованием функционально-распределённых информационных (как правило, корпоративных), а также геоинформационных и когнитивных (интеллектуальных) информационных систем.

Функциональные возможности информационных систем кратко обозначены при рассмотрении этапов развития ИС. Они обусловлены назначением ИС, используемых при их эксплуатации базового технического и программного обеспечения (операционных систем, инструментальных средств разработки и др.). Важной компонентой информационных систем являются используемые в них данные и информация, определяющие выбор типа системы, её структуру, типы данных и элементы управления ими.

Функции ИС определяют её структуру, включающую такие процедуры, как: сбор и регистрация данных; подготовка информационных массивов; обработка, накопление и хранение данных; формирование результатной информации; передача данных от источников к месту их обработки, а результатов (расчётов) – к потребителям информации, например, для принятия управленческих решений. Последовательность их выполнения может различаться, причём некоторые процедуры могут повторяться. Рассмотрим их.

Сбор и регистрация информации в разных информационных системах производятся различным образом. Наибольшую сложность представляют эти процедуры при реализации управленческих процессов, особенно в крупных промышленных организациях, например, при выполнении финансово-кредитных операций; при получении и отпуске материалов, приёме готовой продукции и др. Данные процессы должны обеспечивать достоверность, полноту и своевременность получения первичной информации.

В процессе сбора фактической информации могут осуществляться различные измерения и расчёты, например, денежных купюр, или иных количественных характеристик работы организации в целом, отдельных её участков и работников. Обычно сбор информации сопровождается её регистрацией, а в компьютерных системах – вводом в ПК и фиксацией на каких-либо электронных носителях.

Передача информации осуществляется различными способами. Традиционно – с помощью курьера, пересылкой её по почте или доставкой транспортными средствами. В компьютерных системах эта процедура выполняется с помощью различных средств телекоммуникации по проводным и беспроводным системам связи. В этом случае не только сокращается время передачи электронных данных, но и, как правило, обеспечивается полнота, точность и достоверность получаемой информации. При этом применение технических средств сбора и регистрации (датчиков и иных устройств) не только сокращает трудоёмкость выполнения данных процессов, но и повышает их достоверность.

Хранение и накопление электронной информации связано как с потребностью, как правило длительно, сохранять нужные данные, так и с многократного их использования.

Наиболее часто эти процедуры выполняются в информационных системах (базах данных), в которых данные специальным образом структурированы, то есть располагаются в определённых местах и в определённом порядке. С этими процедурами связана и процедура поиска данных, заключающаяся в организации выбора в хранимой информации необходимых пользователям данных и информации. Такая процедура в СУБД выполняется автоматически после составления пользователем соответствующего запроса.

Обработка электронной информации обычно децентрализовано и автономно выполняется на компьютерах как в местах возникновения первичной информации, так и в местах её получения. Такие места принято называть автоматизированными рабочими местами (АРМ) специалистов, например, бухгалтера, библиотекаря или библиографа, различных операторов и менеджеров, программиста, технолога, инженера и многих других.

Кроме автономной, на соответствующих АРМах, обработка выполняется в вычислительных системах и сетях, как правило, в пакетном режиме.

 

Структура и состав информационной системы.

Структура системы это состав, порядок и принципы взаимодействия элементов системы, определяющие основные её свойства.

Если отдельные элементы системы разнесены по разным уровням и внутренние связи между элементами организованы только от вышестоящих к нижестоящим уровням и наоборот, то говорят об иерархической структуре системы. Чисто иерархические структуры на практике встречаются редко, поэтому, под иерархической структурой обычно понимают и такие структуры, где среди прочих связей иерархические связи имеют главенствующее значение. Практически все разновидности информационных систем независимо от сферы их применения включают один и тот же набор компонентов (Рис. 7.):

·    функциональные компоненты;

·    компоненты системы обработки данных;

·    организационные компоненты.

 

 

Рис. 7.

 

При этом под функцией управления понимается специальная постоянная обязанность одного или нескольких лиц, выполнение которой приводит к достижению определённого делового результата.

Под функциональными компонентами понимается система функций управления, то есть полный набор (комплекс) взаимоувязанных во времени и пространстве работ по управлению, необходимых для достижения поставленных перед организацией целей. Действительно, любая сложная управленческая функция расчленяется на более мелкие задачи и, в конце концов, доводится до непосредственного исполнителя.

В общем случае информационная система содержит три подсистемы:

1. Организационно-технологическая подсистема сбора информации обеспечивает информационную систему и включает совокупность источников информации, организационно-технологической цепочки отбора информации для накопления в системе. Без правильного организованной подсистемы сбора информации невозможна эффективная организация функционирования всей информационной системы в целом.

2. Подсистема предоставления и обработки информации составляет ядро информационной системы и является отражением представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Эта подсистема является одним из наиболее сложных компонентов при разработке ИС.

3. Нормативно-функциональная подсистема выдачи информации определяет пользователей (абонентов системы), реализует целевой аспект назначения и выполнения задач информационной системы.

 

Причём в состав информационной системы входят такие типовые программные компоненты, как:

·    диалоговый ввод-вывод;

·    логика диалога;

·    прикладная логика обработки данных;

·    логика управления данными;

·    операции манипулирования файлами и базами данных.

 

Основными элементами системы, представляющими совокупность отдельных её частей, являются подсистемы. Обычно укрупнено выделяют две основные подсистемы: функциональную и обеспечивающую.

Функциональная часть ИС, в свою очередь, содержит подсистемы, предназначенные для решения конкретных задач, например, контроля, учёта, анализа, планирования и регулирования деятельности различных объектов. В процессе аналитического обследования происходит выявление необходимых подсистем. Их функции зависят как от вида и специфики работы организации, так и от иных факторов.

Функциональные подсистемы реализуют и поддерживают модели, методы и алгоритмы получения управляющей информации. Состав функциональных подсистем весьма разнообразен и зависит от предметной области использования информационной системы, специфики хозяйственной деятельности объекта, управления.

Общую структуру информационной системы можно рассматривать как совокупность подсистем независимо от сферы применения. В этом случае говорят о структурном признаке классификации, а подсистемы называют обеспечивающими.

Нормальное функционирование ИС обеспечивается включением в неё обеспечивающей подсистемы. Структура любой информационной системы может быть представлена совокупностью обеспечивающих подсистем. Практически все системы обработки данных информационных систем независимо от сферы их применения включают один и тот же набор составных частей (компонентов), называемых видами обеспечения. Среди них выделяют технологическое, информационное, лингвистическое, техническое, программное и математическое, организационное и правовое, а также эргономическое обеспечение (Рис. 8.).

 

 

Рис. 8.

 

Рассмотрим их подробнее.

Технологическое обеспечение ИС состоит из подсистем, автоматизирующих информационное обслуживание пользователей, решение задач с применением ЭВМ и других технических средств управления в установленных режимах работы.

Технологическое обеспечение ИС, как правило, по составу однородно для различных систем, что позволяет реализовать принцип совместимости систем в процессе их функционирования.

 

Информационное обеспечение.

Рассмотрим варианты термина «информационное обеспечение».

Информационное обеспечение – это совокупность единой системы классификации и кодирования информации, унифицированных систем документации, схем информационных потоков, циркулирующих в организации, а также методология построения баз данных.

Информационное обеспечение (ИО) – это совокупность методов и средств по размещению и организации информации, включающих в себя системы классификации и кодирования, унифицированные системы документации, рационализации документооборота и форм документов, методов создания внутри машинной информационной базы информационной системы.

Информационное обеспечение представляет собой совокупность проектных решений по объёмам, размещению, формам организации информации, циркулирующей в ИС. Оно включает в себя совокупность показателей, справочных данных, классификаторов и кодификаторов информации, унифицированные системы документации, специально организованные для автоматического обслуживания, массивы информации на соответствующих носителях, а также персонал, обеспечивающий надёжность хранения, своевременность и качество технологии обработки информации.

Назначение подсистемы информационного обеспечения состоит в своевременном формировании и выдаче достоверной информации для принятия управленческих решений. От качества разработанного информационного обеспечения во многом зависит достоверность и качество принимаемых управленческих решений.

Схемы информационных потоков отражают маршруты движения информации и её объемы, места возникновения первичной информации и использования результатной информации (пример – Рис. 9.).

 

 

Рис. 9. Схемы информационных потоков

 

За счёт анализа структуры подобных схем можно выработать меры по совершенствованию всей системы управления. Построение схем информационных потоков позволяет выявлять объёмы информации, проводить её детальный анализ и обеспечивает: исключение дублирующей и неиспользуемой информации, классификацию и рациональное представление информации. При этом к каждому исполнителю должна поступать необходимая для него информация.

Для создания информационного обеспечения необходимо:

·        ясное понимание целей, задач, функций всей системы управления организацией;

·        выявление движения информации от момента возникновения и до её использования на различных уровнях управления, представленной для анализа в виде схем информационных потоков;

·        наличие и использование системы классификации и кодирования;

·        владение методологией создания концептуальных информационно-логических моделей, отражающих взаимосвязь информации;

·        создание массивов информации на машинных носителях, что требует наличия современного технического обеспечения.

 

Лингвистическое обеспечение (ЛО) – это совокупность языковых средств, используемых в системе для формализации естественного языка, построения и сочетания информационных единиц в ходе общения персонала с вычислительной техникой (ВТ) с целью повышения качества разработки и эксплуатации, а также облегчения общения человека с ЭВМ.

Оно используется для повышения эффективности разработки и обеспечения общения человека с ЭВМ на различных стадиях создания и эксплуатации ИС. ЛО включает информационные языки описания структурных единиц информационной базы (документов, показателей, реквизитов и т.п.); языки управления и манипулирования данными информационной базы; языковые средства информационно-поисковых систем; диалоговые языки специального назначения; систему терминов и определений, используемых в процессе разработки и функционирования информационных систем.

Математическое и программное обеспечение представляют собой совокупность математических методов, моделей, алгоритмов и программ для реализации целей и задач информационной системы, а также нормального функционирования комплекса технических средств.

Математическое обеспечениеэто совокупность математических методов, моделей и алгоритмов обработки информации, используемых при решении функциональных задач и в процессе автоматизации проектирования ИС. Оно включает методы многокритериальной оптимизации, математического программирования, математической статистики, теории массового обслуживания и т.д. К средствам математического обеспечения относятся:

·         средства моделирования процессов управления;

·         типовые задачи управления;

·         методы математического программирования, математической статистики, теории массового обслуживания и др.

 

Программное обеспечение включает совокупность программ, необходимых для решения функциональных задач, позволяющих наиболее эффективно использовать вычислительную технику, обеспечивая пользователям наибольшие удобства в работе, реализующих функции и задачи ИС и обеспечивающих устойчивую работу комплексов технических средств.

Оно представляет собой совокупность программных средств для создания и эксплуатации ИС средствами ВТ (Рис. 10.).

 

 

Рис. 10. Программное обеспечение ИС

 

В состав программного обеспечения входят базовые (общесистемные) и прикладные (специальные) программные продукты, а также инструктивно-методические материалы по применению средств ПО (техническая документация) и персонал, занимающийся его разработкой и сопровождением в течение всего периода жизненного цикла ИС.

Базовые программные средства обычно служат для автоматизации взаимодействия человека с компьютером, а также организации типовых процедур обработки данных, контроля и диагностики функционирования используемых при этом технических средств.

К общесистемному программному обеспечению относятся комплексы программ и программы, рассчитанные на широкий круг пользователей и предназначенные для организации вычислительного процесса и решений часто встречающихся (типовых) задач обработки информации. Они служат для расширения функциональных возможностей компьютеров, автоматизации планирования очерёдности вычислительных работ, контроля и управления процессом обработки данных, для автоматизации работы программистов.

Прикладное программное обеспечение представляет собой совокупность программных продуктов, предназначенных для автоматизации решения функциональных задач информационной системы. Это могут быть универсальные (текстовые редакторы, электронные таблицы, системы управления базами данных) и специализированные средства, реализующие функциональные подсистемы (бизнес-процессы) объектов различной природы (экономические, инженерные, технические и т. п.).

Специальное программное обеспечение позиционируется как совокупность программ, разработанных при создании конкретной ИС. В его состав входят пакеты прикладных программ (ППП), реализующие организацию данных и их обработку при решении функциональных задач.

Техническая документация на разработку программных средств должна содержать описание задач, задание на алгоритмизацию, экономико-математическую модель задачи, контрольные примеры.

Техническое обеспечение представляет собой комплекс технических средств сбора, регистрации, передачи, обработки, отображения, размножения информации, оргтехники и других, обеспечивающих работу ИС.

Оно применяется для работы ИС, и включает в себя устройства, реализующие типовые операции обработки данных как вне компьютера (периферийные технические средства сбора, регистрации, первичной обработки информации, оргтехника различного назначения, средства телекоммуникации и связи), так и на ЭВМ различных классов. При этом центральное место среди всех технических средств занимают компьютеры. Структурными элементами технического обеспечения наряду с техническими средствами являются также методические и руководящие материалы, техническая документация и обслуживающий эти технические средства персонал.

Комплекс технических средств составляют:

·    компьютеры любых моделей;

·    устройства сбора, накопления, обработки, передачи и вывода информации;

·    устройства передачи данных и линий связи;

·    оргтехника и устройства автоматического съема информации;

·    эксплуатационные материалы и др.

 

Документацией оформляются предварительный выбор технических средств, организация их эксплуатации, технологический процесс обработки данных, технологическое оснащение. Документацию можно условно разделить на три группы:

·   общесистемную, включающую государственные и отраслевые стандарты по техническому обеспечению;

·   специализированную, содержащую комплекс методик по всем этапам разработки технического обеспечения;

·   нормативно-справочную, используемую при выполнении расчётов по техническому обеспечению.

 

К настоящему времени сложились две основные формы организации технического обеспечения (формы использования технических средств): централизованная и частично или полностью децентрализованная.

Централизованное техническое обеспечение базируется на использовании в информационной системе больших ЭВМ и вычислительных центров.

Децентрализация технических средств предполагает реализацию функциональных подсистем на персональных компьютерах непосредственно на рабочих местах.

Перспективным подходом следует считать, по-видимому, частично децентрализованный подход – организацию технического обеспечения на базе распределённых сетей, состоящих из персональных компьютеров и большой ЭВМ для хранения БД, общих для любых функциональных подсистем.

Организационное обеспечение представляет собой комплекс документов, регламентирующих деятельность персонала в условиях функционирования ИС.

Оно включает методы и средства, регламентирующие взаимодействие работников с техническими средствами и между собой в процессе разработки и эксплуатации информационной системы. Организационное обеспечение реализует следующие функции:

·   анализ существующей системы управления организацией, где будет использоваться ИС, и выявление задач, подлежащих автоматизации;

·   подготовку задач к решению на компьютере, включая техническое задание на проектирование ИС и технико-экономическое обоснование её эффективности;

·   разработку управленческих решений по составу и структуре организации, методологии решения задач, направленных на повышение эффективности системы управления.

 

В процессе выполнения данных функций организационное обеспечение определяет взаимодействие работников с техническими средствами и между собой. Организационное обеспечение реализуется в различных методических и руководящих материалах по стадиям разработки, внедрения и эксплуатации ИС, в частности, при проведении предпроектного обследования, формировании технического задания на проектирование и технико-экономического обоснования, разработке проектных решений в процессе проектирования, выборе автоматизируемых задач, типовых проектных решений и прикладных программ, внедрении системы в эксплуатацию.

Организационное обеспечение создаётся по результатам предпроектного обследования на первом этапе построения баз данных.

Правовое обеспечение представляет собой совокупность правовых норм, регламентирующих правоотношения при создании, внедрении и функционировании информационной системы, а так же её юридический статус.

Оно определяет порядок получения, преобразования и использования информации. Правовое обеспечение на этапе разработки ИС включает нормативные акты договорных взаимоотношений между заказчиком и разработчиком ИС, правовое регулирование отклонений (в том числе возникающих в ходе этого процесса), обусловленные необходимостью обеспечения процесса разработки ИС различными видами ресурсов. Правовое обеспечение на этапе функционирования ИС содержи определение её статуса в конкретных отраслях и предметных областях, правовое положение о компетенции звеньев ИС и организации их деятельности, права, обязанности и ответственность персонала, порядок создания и использования информации в ИС, процедуры её регистрации, сбора, хранения, передачи и обработки, порядок приобретения и использования ЭВМ и других технических средств, порядок создания и использования математического и программного обеспечения.

Главной целью правового обеспечения является укрепление законности. В состав правового обеспечения входят законы, указы, постановления государственных органов власти, приказы, инструкции и другие нормативные документы министерств, ведомств, организаций, местных органов власти. Правовое обеспечение этапов разработки информационной системы включает нормативные акты, связанные с договорными отношениями разработчика и заказчика и правовым регулированием отклонений от договора.

Правовое обеспечение этапов функционирования информационной системы содержит:

·   статус информационной системы;

·   права, обязанности и ответственность персонала;

·   правовые положения отдельных видов процесса управления;

·   порядок создания и использования информации и др.

 

Эргономическое обеспечение как совокупность методов и средств, используемых на разных этапах разработки и функционирования ИС, предназначено для создания оптимальных условий высокоэффективной и безошибочной деятельности человека, для быстрейшего освоения ИС.

В состав эргономического обеспечения ИС входят: комплекс различной документации, содержащей эргономические требования к рабочим местам, информационным моделям, условиям деятельности персонала, а также набор наиболее целесообразных способов реализации этих требований и осуществления эргономической экспертизы уровня их реализации; комплекс методов, учебно-методической документации и технических средств, обеспечивающих обоснование формулирования требований к уровню подготовки персонала, а также формирование системы отбора и подготовки персонала; комплекс методов и методик, обеспечивающих высокую эффективность деятельности человека.

Информационная система характеризуется инфраструктурой, обеспечивающей её бесперебойное функционирование. К инфраструктуре относят: системное и сетевое программное обеспечение, компьютеры, сетевое оборудование, другие необходимые для функционирования ИС периферийные устройства, средства связи, электро-, тепло- и водоснабжение, кондиционеры, помещения, обслуживающий персонал, а также необходимое для его работы дополнительное оборудование.

В заключение рассмотрим основной показатель информационных систем – их качество.

Качество информационной системы – это совокупность свойств системы, обусловливающих возможность её использования для удовлетворения информационных потребностей пользователей, определённых в соответствии с её назначением.

Показателями качества информационных систем являются надёжность, достоверность функционирования, безопасность и др.

Надёжность представляет собой свойство системы сохранять в течение определённого времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения.

Надёжность информационных систем характеризует способность обеспечения своевременной и достоверной информации на её выходе. Поэтому показатель достоверности функционирования имеет для информационных систем главенствующее значение. Причём показатель своевременности информации в общем случае охватывается показателем достоверности.

Достоверность функционирования – это свойство системы, обусловливающее безошибочность производимых ею преобразований информации.

Безопасность информационной системы заключается в способности системы обеспечить конфиденциальность и целостность информации, то есть защиту информации от несанкционированного доступа с целью её раскрытия, изменения или разрушения (уничтожения).

Информационная безопасность является одной из основных информационных проблем XXI века, поскольку хищение информации, её несанкционированное изменение и уничтожение зачастую ведёт к трагическим последствиям, например, к банкротству организаций, человеческим жертвам и др.

 

Контрольные вопросы

 

1.      Дайте определение понятию «Информационная система».

2.      Какими свойствами обладает информационная система?

3.      Для чего обычно предназначаются ИС?

4.      Какие, связанные с основными свойствами информации, этапы выделяют в работе информационной системы?

5.      Назовите этапы (поколения) развития информационных систем и цели их использования.

6.      Дайте определение понятию «Структура системы».

7.      Назовите набор компонентов, который включают практически все разновидности информационных систем независимо от сферы их применения?

8.      Какие три подсистемы в общем случае содержит практически любая информационная система?

9.      Назовите виды обеспечения, которые включают практически все системы обработки данных информационных систем?

10. Дайте определение понятию «Информационное обеспечение ИС».

11. Что входит в состав Лингвистического обеспечения ИС?

12. Назовите естественные и формализованные языки.

13. Что входит в состав Программного обеспечения ИС?

14. Назовите две основные формы организации технического обеспечения и охарактеризуйте их.

15. Что представляет собой эргономическое обеспечение ИС?

16. Дайте определение понятию «Качество информационной системы».

 

 

4. Классификация информационных систем

 

Классификация (от лат. «Classis» – группа и «Facere» – делать) представляет собой систему распределения объектов по классам в соответствии с определённым признаком (основанием классификации).

Основанием классификации называют признак сходства или различия, положенный в основу классификации множества элементов.

Под классификацией информации понимают условное расчленение множества её элементов на подмножества с учётом сходства или различия по какому-то признаку.

Классифицировать информационные системы можно по следующим основаниям:

·        по типу решаемых задач;

·        по назначению;

·        по реализуемому режиму распространения информации;

·        по функциям обеспечения управленческой деятельности;

·        по видам обрабатываемой информации, по назначению функционирующей информации;

·        в зависимости от особенностей применения;

·        по отраслям применения;

·        по уровню управления;

·        по характеру использования информации;

·        по характеру хранимой информации.

 

По типу решаемых задач, для которых создаются информационные системы, различают:

·        структурированные (формализуемые);

·        неструктурированные (не формализуемые);

·        частично структурированные.

 

Структурированная (формализуемая) задача – это задача, где известны все её элементы и взаимосвязи между ними.

В структурированной задаче удаётся выразить её содержание в форме математической модели, имеющей точный алгоритм решения. Подобные задачи обычно приходится решать многократно, и они носят рутинный характер. Целью использования информационной системы для решения структурированных задач является максимально полная автоматизация их решения, т. е. попытка сведения роли человека к нулю.

Примером структурированной задачи является расчёт заработной платы. В ней полностью известен алгоритм решения. Рутинный её характер определяется простотой расчётов всех начислений и отчислений, но объём таких расчётов велик, так как они многократно (как правило, ежемесячно) повторяются для всех категорий работников организации.

Неструктурированная (не формализуемая) задача – это задача, в которой невозможно выделить элементы и установить между ними связи.

Решение неструктурированных задач из-за невозможности создания математического описания и разработки алгоритма связано с большими трудностями. Причём невелики возможности использования информационной системы.

Решение принимает человек исходя из эвристических соображений, сформированных на основе своего опыта, а также информации из разных источников. Например, решение неструктурированной задачи можно проиллюстрировать попыткой формализовать взаимоотношения в студенческой группе. Сложность решения такой задачи связана с тем, что для её реализации существенны психологический и социальный факторы, трудно поддающиеся их алгоритмическому описанию.

В практике работы любой организации существует сравнительно немного полностью структурированных или совершенно неструктурированных задач. О большинстве задач можно сказать, что известна лишь часть их элементов и связей между ними. Такие задачи называются частично структурированными.

Они решаемы и позволяют создать информационную систему. Получаемая в ней информация анализируется человеком, который будет играть определяющую роль. Такие информационные системы являются автоматизированными, так как в их функционировании принимает участие человек. Например, необходимо принять решение по устранению ситуации, когда для выполнения в срок одной из комплексных работ требуются дополнительные трудовые ресурсы. Можно представить несколько вариантов решения этой задачи, например:

·        выделить дополнительное финансирование на увеличение численности работников;

·        перенести срок окончания работы на более позднюю дату и др.

 

В решении таких задач информационная система помогает человеку принимать решение, предоставляя ему необходимую информацию, например, о ходе выполнения работ.

Информационные системы, используемые для решения частично структурированных задач, подразделяются на два вида:

·        создающие управленческие отчёты и ориентированные главным образом на обработку данных (поиск, сортировку, агрегирование, фильтрацию).

Информационные системы, создающие управленческие отчёты, обеспечивают информационную поддержку пользователя, то есть предоставляют доступ к информации в базе данных и её частичную обработку.

·        разрабатывающие возможные альтернативы решения.

Информационные системы, разрабатывающие альтернативные решения, могут быть модельными или экспертными.

·    принятие решения при этом сводится к выбору одной из предложенных альтернатив.

 

Тип информационной системы зависит от её назначения и от того, чьи интересы она обслуживает. Информационные системы специалистов помогают в работе с данными, повышают продуктивность и производительность работы. Задачей подобных ИС является интеграция новых сведений и помощь в обработке документов.

При классификации информационных систем можно использовать функциональный признак. Он определяет назначение подсистемы, её основные цели, задачи и функции. При этом структуру ИС можно представить как совокупность её функциональных подсистем, например, для предприятия ими могут быть производственная, маркетинговая, финансовая и кадровая подсистемы. Следует отметить, что в крупных организациях производственная ИС может включать подсистемы управления запасами, управления производственным процессом, компьютерного инжиниринга и др.

По назначению ИС связанные с человеческой деятельностью можно разделить на:

1.      Государственные, военные, общественные и личностные ИС.

2.      Экономические ИС, используемые в различных предметных областях.

3.      Инструментальные для создания ИС.

4.      Медицинские, экологические и иные отраслевые ИС.

5.      Обслуживающие, например, системы телефонной связи и др.

6.      Справочные, информационно-поисковые системы и др.

 

По назначению функционирующей информации ИС делятся на: государственные, юридические (законодательные), деловые, финансовые, научно-технические, учебные, социальные, развлекательные и другие.

При этом, например, финансовая информация подразделяется на: бухгалтерскую, банковскую, налоговую и иную, а медицинская (как и другие) может содержать все вышеперечисленные функции.

По отраслям применения выделяют деловую, профессиональную, потребительскую информацию и электронную коммерцию.

По реализуемому режиму распространения информации различают:

·    системы с избирательным распространением информации (ИРИ), обеспечивающие организацию периодического (раз в неделю, раз в месяц, раз в квартал и т. п.) поиска информации в соответствии с заданным поисковым образом документа (ПОД) в массиве новых поступлений в информационный фонд ИС и предоставление пользователю сообщений о появлении таких документов;

·    системы с режимом ретроспективного поиска, реализующие поиск информации по заданным ПОД во всём информационном фонде ИС;

·    интегральные системы, в которых реализованы как ИРИ, так и ретроспективный поиск.

 

По уровню управления выделяют стратегические, тактические и оперативные информационные системы.

Информационная система оперативного уровня поддерживает исполнителей, обрабатывая данные о событиях (например, выплата зарплата, оформления накладных, обработка заказов, регистрация билетов, материалов, документов и др.). Такая система обычно является связующим звеном между организацией и её внешней средой.

Информационные системы тактического уровня (среднее звено) подразумевают мониторинг, администрирование, контроль и принятие решений. Основные функции этих информационных систем – сравнение текущих показателей с прошлыми показателями, составление периодических отчётов за определённое время (а не выдача отчётов по текущим событиям, как на оперативном уровне), обеспечение доступа к архивной информации и т.д.

Стратегическая информационная система обеспечивает формулирование целей, поддержку принятия решений по реализации стратегических перспективных целей развития организации, стратегическое планирование. Такие информационные системы помогают высшему звену управления решать неструктурированные задачи, осуществлять долгосрочное планирование. Они обычно предназначены для выполнения сравнительного анализа изменений во внешнем окружении с существующим потенциалом организации с целью поддержки решений в неожиданно возникающих ситуациях. Некоторые из них обладают ограниченными аналитическими возможностями.

По функциям обеспечения управленческой деятельности используют информационные системы:

·    подготовки текстовых документов с помощью текстовых процессоров;

·    подготовки иллюстраций и презентаций с использованием графических процессоров;

·    подготовки табличных документов с помощью табличных процессоров;

·    разработки программ на основе алгоритмических, объектно-ориентированных и логических языков программирования;

·    управления базами данных;

·    поддержки управленческих решений с использованием систем искусственного интеллекта;

·    гипертекстовые технологии и технологии мультимедиа.

 

Аналогичным образом ИС можно классифицировать по видам обрабатываемой информации на:

·    Текстовые процессоры и редакторы (текст).

·    Табличные процессоры.

·    Графические процессоры и редакторы (графика).

·    Системы управления базами данных.

·    Алгоритмические языки программирования (данные).

·    Экспертные системы и системы искусственного интеллекта.

·    Мультимедийные системы (объекты реального мира, включающие любые виды информации) и др.

 

Легко заметить, что две предыдущих классификации имеют много общего. Конечно, такая классификация достаточно условна, так как, например, современный текстовый процессор может обеспечивать присутствие и взаимодействие практически любых видов информации, гипертекста и возможности коммуникаций. Другое дело, насколько он будет удовлетворять соответствующих пользователей.

В зависимости от особенностей применения информационные системы делят на две основные группы:

·    системы информационного обеспечения;

·    системы, имеющие самостоятельное целевое назначение и область применения.

 

В связи с этим они могут размещаться и использоваться на персональных компьютерах и в небольших локальных сетях, а также в крупных информационных и иных инфраструктурах корпоративного, регионального, федерального и глобального уровня.

По характеру использования информации различают:

·    справочные и поисково-справочные,

·    информационно-поисковые,

·    информационно-справочные,

·    информационно-решающие системы.

 

Справочные системы являются наиболее распространённым типом функций информационных систем. Они предоставляют абонентам, а часто и незарегистрированным пользователям, возможность получать зафиксированные в системе и доступные им данные, то есть они просто сообщают информацию («экспресс-информация», «09», реклама и др.)

Поисково-справочные системы предназначены для сбора, хранения и поиска информации справочного характера. Такие системы не заменимы в конкретных областях знаний: медицине, юриспруденции, программированию и др.

Наиболее распространённым классом информационных систем являются информационно-поисковые системы.

Информационно-поисковые системы вводят, систематизируют, хранят, выдают информацию по запросам пользователя без сложных преобразований данных. Более подробно они рассматриваются в следующих параграфах.

Информационно-решающие системы осуществляют все операции переработки информации по определённому алгоритму. Среди них проводят классификацию по степени воздействия выработанной информации на процесс принятия решений и выделяют два класса: управляющие и советующие.

Управляющие ИС вырабатывают информацию, на основании которой человек принимает решение, то есть выходной результат в них является не советом, а управляющим воздействием на объект. Для этих систем характерны задачи расчётного характера и обработка больших объёмов данных.

Советующие ИС вырабатывают информацию, принимаемую человеком к сведению и не требующую немедленных конкретных действий, то есть они представляют варианты и оценки по различным критериям этих вариантов. Эти системы обладают более высокой степенью интеллекта, для них характерна обработка знаний, а не данных.

По характеру хранимой информации ИС делятся на:

·    фактографические,

·    документальные,

·    комбинированные – документально-фактографические.

 

Традиционно фактографические ИС можно представить как картотеки, а документальные ИС – как архивы. Более подробно они рассматриваются в следующих параграфах.

В фактографических ИС обычно в строго определённом формате хранится краткая информация, а в документальных ИС – различные документы, причём не только текстовые, но графика, видео и звук (мультимедиа). Комбинированные ИС включают фактографические и документальные базы данных.

Соответственно выделяют документальное, фактографическое и концептуальное информационное обслуживание.

В случае документального и фактографического обслуживания потребителю информации предоставляют извлечённые из информационного потока документы или сведения в «натуральном» виде, а при концептографическом обслуживании документы и сведения подвергаются интерпретации, оценке, обобщению со стороны информационного работника. В результате такой интерпретации формулируется ситуативная информация, содержащая оценку рассматриваемых сведений, тенденций и перспективы развития отдельных научных и технических направлений, рекомендаций и пр. Поэтому под концептографическим обслуживанием можно понимать формулирование и доведение до потребителей ситуативной информации, в явном виде не содержащейся в анализируемых источниках, а полученной в результате информационно-логического и концептографического анализа некоторой совокупности сообщений. То есть, в случае концептографического обслуживания потребителю представляются не только сведения о документе или сами сведения из документа, а и некоторая дополнительная информация, полученная информационным работником в процессе их интерпретации.

Все виды информационного обслуживания функционируют на основе своих специфичных рядов вторичных документов. По сути дела каждая из разновидностей обслуживания сводиться к созданию своего ряда вторичных документов и доведению их до потребителя различными средствами и в различных режимах информационного обслуживания.

Существенное повышение эффективности информационных систем в настоящих условиях, когда открыты возможности внедрения в информационный процесс высокопроизводительных технических средств, может быть достигнуто за счёт их автоматизации. Эти системы, интегрируя информацию, обеспечивают комплексное решение задач управления.

Развитие информационных технологий и систем не может обойти стороной стремление индустриально развитых стран к глобализации, что, несомненно, ведёт к созданию и использованию открытых информационных систем.

Открытая система (англ. «Open System») – это система, реализующая открытые спецификации (стандарты) на интерфейсы, службы и форматы данных для того, чтобы обеспечивать:

·    возможность с минимальными изменениями переноса (переносимость) прикладных систем на различные платформы;

·    совместную работу (масштабируемость) с другими прикладными системами на локальных и удалённых платформах для расширения её функциональных возможностей и (или) придания системе новых качеств;

·    взаимодействие с пользователями, облегчающее им переход от одной системы к другой (мобильность пользователей).

 

Контрольные вопросы

 

1.      Дайте определение термина «Классификация».

2.      По каким основаниям можно классифицировать информационные системы?

3.      На какие три вид делятся информационные системы по типу решаемых задач?

4.      Дайте классификацию информационных систем по их назначению.

5.      На какие виды делят информационные системы по реализуемому режиму распространения информации?

6.      Дайте классификацию информационных систем по функциям обеспечения управленческой деятельности.

7.      На какие три вид делятся информационные системы по уровню управления?

8.      Дайте классификацию информационных систем по характеру использования информации.

9.      На какие три вид делятся информационные системы по характеру хранимой информации?

10. Дайте определение понятия «Открытая система» и назовите для чего она используется.

 

 

5. Фактографические информационные системы

 

В общем случае тип информационной системы зависит от того, чьи интересы она обслуживает и на каком уровне управления.

По характеру представления и логической организации хранимой информации информационные системы подразделяются на фактографические, документальные и иные. В данном параграфе рассматриваются фактографические информационные системы.

Под фактографическим типом данных принято понимать данные представляющие собой описание некоторых фактов предметной области. Например, фактом являются данные о конкретном человеке (ФИО, адрес, паспортные данные и т.п.), на книгу (автор, название, год издания и т.п.), машину (марка, год выпуска, производитель и т. п.) и т.д.

Уточним само понятие «фактографическая информация».

Фактографическая информация – это сведения не только фактического характера, но и теоретического, предположительного, оценочного характера, т.е. включающие и факты, и концепции, всё то, что может быть объектом извлечения из текста, описания на определённом информационном языке, хранения и поиска в той или иной информационной системе.

В развитии программного обеспечения для БД в 1970-е ÷1980-е годы превалировало направление, связанное с фактографическими информационными системами, т.е. с системами, ориентированными на работу с изначально структурированными данными, такими, например, как отчёты датчиков в АСУ ТП, финансовые массивы бухгалтерских автоматизированных информационных системах (АИС) и т. д.; или предварительной структуризации данных, как, например, в информационной системе кадрового подразделения, где все данные о сотрудниках структурируются по ряду формализованных позиций.

В результате разработки основ и моделей организации фактографических данных, отработки программно-технических решений по накоплению и физическому хранению таких данных, реализации специальных языков запросов к базам данных и решения ряда других задач, связанных с эффективным управлением большими объёмами структурированной информации, к началу 1990-х годов основу информационного обеспечения деятельности организаций составили фактографические информационные системы.

Фактографические информационные системы оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных.

В информационной системе факт предстает набор некоторых свойств (атрибутов), количественное значение которых, как правило, выражается простым типом данных. В БД систем фактографического типа хранится информация об интересующих пользователя объектах предметной области в виде «фактов» (например, биографические данные о сотрудниках, данные о выпуске продукции производителями и п. т.). В ответ на запрос пользователя выдаётся требуемая ему информация об интересующем его объекте/объектах или сообщение о том, что искомая информация отсутствует в БД.

Фактографические АИС накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения по некоторому факту, событию и т. д., отделённому от всех прочих сведений и фактов. Отсюда и название – «фактографические системы».

Центральное функциональное звено фактографической информационной системы – система управления базами данных. Характерным представителем фактографических информационных систем является широко известная в бухгалтерских кругах программа «1С: Бухгалтерия», а в библиотеках – Электронный каталог.

Фактографические информационные системы предполагают удовлетворение информационных потребностей непосредственно, т.е. путём представления потребителям самих сведений (данных, фактов, концепций) и делятся на две категории:

1) системы обработки данных (СОД);

2) автоматизированные информационные системы и автоматизированные системы управления (АСУ).

 

Фактографические информационные системы накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров или некоторая их совокупность отражают сведения по какому-либо факту, событию отдельно от всех прочих сведений и фактов.

Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики объектов данной предметной области. Комплектование информационной базы в фактографических информационных системах включает, как правило, обязательный процесс структуризации входной информации.

Информационный массив фактографической системы содержит элементы, каждый из которых относится к какому-то определённому объекту независимо от того, описан этот объект в одном документе или в нескольких. Например, системе неважно, содержатся ли сведения о золоте в одном описании или разбросаны по многочисленным источникам. Для системы важно, чтобы она знала о золоте всё, что об этом химическом элементе известно.

Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру и хранятся в нём заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Т.е. информация, с которой работает фактографическая ИС имеет чёткую структуру, позволяющую машине отличать одно данное от другого, например, фамилию от должности человека, дату рождения от роста и т. п. Благодаря этому фактографическая ИС способна давать однозначные ответы на поставленные вопросы, например, ответить на вопрос о том, какие культурно-исторические памятники Москвы, страны или мира включены в список ЮНЕСКО, выдать фамилии студентов, имеющих академическую задолженность, сколько компьютеров продал магазин «ИОН» в мае 2009 года и т. д.

Фактографические ИС предназначены для поиска однозначного ответа на запрос и для однозначного решения поставленных задач. Условно они в свою очередь делятся на информационно-справочные, информационно-поисковые системы и системы оперативной обработки данных. Системы оперативной обработки данных решают такие задачи, как управление производством, бухгалтерский учёт и т.п.

Фактографические ИС можно классифицировать по признаку: универсальные и специализированные.

ИС общего назначения (универсальные) не ориентированы на какую-либо конкретную предметную область или на информационные потребности конкурентной группы пользователей. Каждая система такого рода реализуется как программный продукт, способный функционировать на некоторой модели ЭВМ в определённой операционной обстановке. Например, некоторой информационной учебной системе безразлично предметное содержание информации, и она с равным успехом может работать с телефонным справочником, с видеотекой, с медицинскими данными, заказами фирмы и т. д. Кроме того, она может сортировать тексты, составлять словари, выполнять ряд других операций по формальной обработке данных. Для такой системы нет понятия «Болезнь» («Диагноз»), а есть некий код экземпляра, сопровождаемый набором произвольных символов определённой длины (названием), который в равной степени может быть и кодом болезни, и кодом завода, и табельным номером человека. В какой-то степени универсальная система аналогична компьютеру, которому всё равно с какими данными и информацией работать. Область применения таких систем широка – от личных (персональных) баз данных всевозможного назначения до профессиональных систем (гуманитарные БД, медицина, небольшие офисы).

Однако во многих сферах человеческой деятельности универсальные системы применять нельзя, особенно там, где их достоинства (независимость от характера информации и возможного набора запросов) становятся недостатками. Например, в системе резервирования мест на самолеты, обслуживающей сотни тысяч пользователей, нельзя полагаться на универсальные методы.

Специализированные ИС предназначены для конкретных областей применения. Их разработка весьма трудоёмкое дело даже в самых простых случаях. Для таких систем проектируют специальные алгоритмы ввода, поиска, обработки и выдачи информации, учитывающие специфику данных и характер запросов. Кроме того, следует учитывать и динамическую природу многих профессиональных систем, выражающуюся в том, что база данных непрерывно обновляется, и не одним, а десятками и даже тысячами пользователей одновременно. При создании таких систем разработчикам приходится решать множество сложных проблем, например, если в авиакассе продан билет, то это событие должно быть в ту же секунду обработан в базе данных, иначе билет на то же место могут продать другому пассажиру и возможно, даже в другом городе.

Специализированные ИС широко применяются в материальном производстве, банковском деле, криминалистике, научных исследованиях и др.

Фактографическая информационно-поисковая система (англ. «Factographic information retrieval system») – информационно-поисковая система (ИПС), обеспечивающая выдачу непосредственно фактических сведений, затребованных потребителем в информационном запросе.

Поисковый массив фактографической ИПС состоит из описаний фактов, извлечённых из документов и представленных на некотором формальном языке. Фактографические информационно-поисковые системы реализуют поиск и выдачу фактов, текстов, документов, содержащих сведения, которые могут удовлетворить поступивший запрос пользователя. В этом случае осуществляются поиск не какого-то конкретного документа, а всей совокупности сведений по данному запросу, хранящихся в информационном фонде ИПС или информационно-справочных систем (ИСС).

Фактографические информационно-поисковые системы используются не только для реализации справочных функций, но и для решения задач обработки данных. Под обработкой данных понимается специальный класс решаемых на ЭВМ задач, связанных с вводом, хранением, сортировкой, отбором и группировкой записей данных однородной структуры. Эти задачи предусматривают представление пользователям итоговых результатов обработки в виде отчётов в табличной форме.

В парадигме создания информационных систем очевидным является использование реляционных моделей данных. Эти модели впервые в 1970 году предложены Е. Коддом в качестве наиболее независимых от аппаратных средств компьютера. Широкое использование персональных компьютеров, мощные ресурсы которых поступают в полное распоряжение одного пользователя в отличие от больших ЭВМ, открыли дорогу реляционным СУБД. За счёт некоторой избыточности, сетевая и иерархическая модель могут быть сведены к табличной (реляционной) модели данных. Формируемая исключительно в форме множества таблиц, реляционная модель обеспечивает единообразное представление данных.

Это единообразие может быть реализовано хотя бы на формально-логическом уровне, если база данных создана как приложение в интегрированной операционной среде типа MS Windows.

 

Модели данных. Модель сущность-связь.

В своей жизнедеятельности человек часто использует модели, то есть создаёт образы объектов (процессов или явлений), с которыми имеет дело.

Модель – это объект-заместитель объекта-оригинала, обеспечивающий изучение некоторых свойств последнего; это также упрощенное представление системы, формируемое для её анализа и предсказания, получения качественных и количественных результатов, необходимых для принятия правильного управленческого решения.

Объект – это совокупность свойств элемента, которые могут быть исследованы и описаны.

Объект может быть материальным (служащий, изделие или населённый пункт) и нематериальным (имя, понятие, абстрактная идея), отражающим реальный мир, например, правовые нормы, философские теории и др.

Объект имеет различные свойства (например, цвет, вес, имя), которые важны для пользователя, обращающегося к объекту (например, выбор среди множества других) с какой-либо целью его использования. Причём свойства объекта можно задавать как отдельными однозначно интерпретируемыми количественными показателями, так и словесными нечёткими описаниями, допускающими разную трактовку, зависящую, например, от точки зрения и наличных знаний воспринимающего субъекта.

Базовая модель ИС – основная модель ИС – содержит описание функций, процессов, объектов, правил, организационной структуры, которые поддерживаются программными модулями типовой ИС.

Типовые модели описывают конфигурации информационной системы для определённых отраслей или типов производства.

Модель конкретной организации строится путём выбора фрагментов основной или типовой модели в соответствии со специфическими особенностями организации, или путём автоматизированной адаптации этих моделей в результате экспертного опроса. Для формирования моделей используют различные методы моделирования.

 

Модели данных.

Создание системы начинается с формирования её структуры и описания используемых в ней данных. Состояние системы в любой момент времени характеризуется её структурой.

Структура системы – это совокупность связей между элементами, отражающими их взаимодействие.

Для создания структурированных и слабоструктурированных представлений предметной области (ИС) служат разнообразные программные средства – инструменты моделирования, называемые моделями данных.

Модель данных – это не результат, а инструмент моделирования, то есть совокупность правил структурирования данных, допустимых операций над ними и видов ограничений целостности, которым они должны удовлетворять.

Информационная модель – это модель объекта, процесса или явления, в которой представлены информационные аспекты моделируемого объекта, процесса или явления.

Информационные модели, представляющие объекты и процессы в форме рисунков, схем, чертежей, таблиц, формул, текстов и т.п., используют при проектировании АИС и являются основой разработки моделей АИС.

Для создания описательных текстовых информационных моделей обычно используют естественные языки. Наряду с естественными языками (русский, английский и т.д.) используются формальные языки: системы счисления, алгебра высказываний, языки программирования и др. С помощью формальных языков строят информационные модели определённого типа – формально-логические модели. Процесс построения информационных моделей с помощью формальных языков называют формализацией.

Основное отличие формальных языков от естественных состоит в наличие у формальных языков не только жёстко зафиксированного алфавита, но и строгих правил грамматики и синтаксиса.

 

Концептуальные средства описания.

Моделирование данных заключается в обеспечении разработчика АИС концептуальной схемой БД в форме одной или нескольких локальных моделей, относительно легко отображаемых в любую систему баз данных.

Концептуальная модель данных представляет собой схему базы данных в виде ER-модели. При этом сформированная концептуальная модель данных впоследствии преобразуется в физическую модель данных.

В 1976 году Чен (Chen) предложил для проектирования ИС (баз данных) использовать ER-модели (Entity Relationship model), представляющие концептуальные модели данных. Метод создания ER-модели (модели «сущность-связь») или метод «ER-диаграмм» называют так от аббревиатур двух слов «Essence» – сущность и «Relation» – связь. ER-модель наглядно изображает структурные блоки информации и логические взаимосвязи между ними. Основными понятиями являются сущность, связь и атрибут.

Сущность (англ. «Entity») представляет собой реальный или воображаемый объект, имеющий существенное значение для рассматриваемой предметной области, информация о котором подлежит хранению (Рис. 11.).

 

 

Рис. 11. Графическое изображение сущности

 

Обычно сущность изображают прямоугольником с наименованием, например, сущность – «Сотрудник» (Рис. 12.).

 

 

Рис. 12. Пример графического изображения сущности «Сотрудник»

 

При построении модели сложной ИС, её можно представить на контекстной диаграмме в виде одной системы как единого целого, или декомпозиции, содержащей ряд подсистем.

Каждая сущность обладает уникальным идентификатором, однозначно идентифицируемым и отличающимся от всех других экземпляров данного типа сущности. Внутри сущности (прямоугольник на Рис. 12.) располагаются атрибуты. Любая сущность содержит не менее одного атрибута.

Атрибут – это показатель, характеризующий некоторый объект и принимающий для конкретного экземпляра объекта конкретное числовое, текстовое или иное значение. Он характеризует конкретную сущность (свойство сущности) – квалифицирует, идентифицирует, классифицирует, отражает количественную характеристику или состояние этой сущности.

Атрибут представляет тип характеристик или свойств, ассоциированных с множеством реальных или абстрактных объектов (людей, мест, событий, состояний, идей, пар предметов и т.д.). Например, атрибутами сущности «Сотрудник» могут быть Ф.И.О., дата рождения, пол, стаж и др. Каждый атрибут идентифицируется уникальным именем, выражаемым грамматическим оборотом существительного, описывающим представляемую атрибутом характеристику. Атрибуты изображаются в виде списка имён внутри блока ассоциированной сущности, причём каждый атрибут занимает отдельную строку. Вариант атрибутов сущности «Сотрудник» может содержать следующие атрибуты: «Табельный номер», «Фамилия», «Имя», «Отчество», «Должность», «Зарплата» сотрудника (Рис. 13.).

 

 

Рис. 13.

 

Списки возможных значений атрибутов называют классификаторами (справочниками, словарями).

Каждая сущность имеет хотя бы один ключ, представляющий один или несколько атрибутов, значения которых однозначно определяют каждый экземпляр сущности. При существовании нескольких возможных ключей один из них обозначается в качестве первичного ключа, а остальные – как альтернативные ключи. Атрибуты, определяющие первичный ключ, размещаются наверху списка и в ER-диаграмме выделяются подчёркиванием (Рис. 14.).

 

 

Рис. 14.

 

В БД атрибуты сущности называют данными и полями данных. Причём набор объектов сущности образует таблицу. Простым набором однородных объектов, включающих структурированные данные, является телефонный справочник, представляющий список номеров телефонов с указанием для каждого номера абонента его адреса и категории, например, друзья, родственники, должности, звания, магазины и др.

Связь (англ. «Relationship») – это поименованная ассоциация между двумя сущностями, значимая для рассматриваемой предметной области.

Связь сущностей, как правило, означает, что каждый экземпляр одной сущности, называемой родительской, ассоциируется с произвольным (в том числе нулевым) количеством экземпляров второй сущности, называемой сущностью-потомком. В свою очередь, каждый экземпляр сущности-потомка ассоциируется с одним экземпляром сущности-родителя. Таким образом, экземпляр сущности-потомка может существовать только при существовании сущности родителя.

Связи может даваться имя, выражаемое грамматическим оборотом глагола и помещаемое возле линии связи. Имя каждой связи между двумя данными сущностями должно быть уникальным, но имена связей в модели не обязаны быть уникальными. Связи позволяют по одной сущности находить другие сущности, связанные с нею. В нашем примере, связи между сущностями могут выражаться следующими фразами – «Сотрудник может иметь несколько детей», «Каждый сотрудник обязан числиться ровно в одном отделе». Графически связь изображается линией, соединяющей две сущности. На Рис. 15. представлена диаграмма ER-типа.

 

 

Рис. 15. Диаграмма ER-типа

 

В зависимости от того, как определены поля связи основной и дополнительной таблиц между двумя таблицами могут устанавливаться следующие четыре основных вида связи:

·    один к одному (1:1);

·    один ко многим (l:M);

·    многие к одному (M:1);

·    многие ко многим (M:M или M:N).

 

Связь типа один-к-одному означает, что один экземпляр первой сущности связан с одним экземпляром второй сущности. Чаще всего такая связь свидетельствует о том, что имеется одна сущность, неверно разделенная на две.

Связь типа один-ко-многим означает, что один экземпляр первой сущности связан с несколькими экземплярами второй сущности. Это наиболее часто используемый тип связи. Сущность со стороны «один» называется родительской, а со стороны «много» – дочерней. Представленный на Рис. 16. пример с определением связи, показывает, что один преподаватель может вести несколько дисциплин (1:М).

 

 

Рис. 16.

 

Связь типа много-ко-многим означает, что каждый экземпляр первой сущности может быть связан с несколькими экземплярами второй сущности, и каждый экземпляр второй сущности может быть связан с несколькими экземплярами первой сущности. Тип связи много-ко-многим является временным типом связи, допустимым на ранних этапах разработки модели. В дальнейшем этот тип связи должен быть заменен двумя связями типа один-ко-многим путём создания промежуточной сущности.

Более полно сведения о преподавателе можно изобразить с помощью диаграмм ER-типа следующим образом (Рис. 17.).

 

 

Рис. 17.

 

Вариант ER-диаграммы конкретного процесса (подпроцесса), позволяющий спроектировать некоторую АИС, представлен на Рис. 18.

 

 

Рис. 18.

 

Одной из программ концептуального моделирования баз данных является ERwin. Она реализует проектирование схемы БД, генерацию её описания на языке целевой СУБД (Oracle, Sybase, MS SQL Server и др.) и др.

 

Представление данных в памяти ЭВМ.

Представление данных в памяти ЭВМ связано с созданием физической модели данных – конкретных таблиц, связей между ними и описанием структур в определённых базах данных. Физическая модель описывает данные средствами конкретной СУБД. Таким образом, построение физической модели данных проводится на основе сформированной ранее концептуальной модели. При генерации физической модели данных каждой сущности ставится в соответствие таблица, идентификаторы сущностей становятся ключами, а атрибуты сущностей преобразуются в колонки таблиц. В таблице 5 приведён пример сущности (физической таблицы) «Преподаватели».

 

Таблица 5

 

Пример сущности «Преподаватели»

 

 

Таблицы между собой связываются посредством общих полей, т.е. полей, одинаковых по форматам и, как правило, по названию. Такая организация данных позволяет уменьшить избыточность хранимых данных, упрощает их ввод, организацию запросов и отчётов. Каждая таблица включает в свой состав поле кода, используемого обычно как счётчик (идентификатор) главного её параметра и, как правило, являющегося ключевым полем. В поля этих таблиц и вводятся необходимые данные. Записи таблицы всегда располагаются в файле БД в том порядке, в котором они были включены в таблицу.

 

Программные средства реализации фактографических ИС.

Программные средства фактографических, равно как и иных, БД представляют собой сложный комплекс управления ими, обеспечивающий взаимодействие всех частей ИС при её функционировании. Основой ПО любых БД является СУБД. Ядро СУБД обеспечивает создание БД, организацию ввода, обработки и хранения данных – управлением данными. К компонентам СУБД относят обеспечение настройки системы и выполнение вспомогательных функций (например, восстановление БД, сбор статистики о её функционировании, средства тестирования, утилиты) и др.

Очевидно, что практически для создания любых АИС используются различные СУБД. Выбор подходящей СУБД в наибольшей степени связан с предъявляемыми к проектируемой БД требованиями. Практически решить эту задачу непросто, поскольку предъявляемые к СУБД требования со временем изменяются. СУБД имеют много параметров, что затрудняет их сравнение, информация о СУБД может носить рекламный характер и др.

Создание автоматизированных баз данных широко ведётся со второй половины прошлого века. В файл-серверных СУБД файлы данных располагаются централизованно на файл-сервере. Разновидностью таких СУБД являются Borland Paradox и MS Access. Преимущество этой архитектуры в низкой нагрузке на сервер, а недостаток – в высокой загрузке локальной сети.

В 1979 году фирма Oracle выпустила первую коммерческую реляционную клиент-серверные СУБД. Кроме неё ряд фирм начал выпускать собственные подобные СУБД: MS SQL Server, Interbase, Sybase, PostgreSQL, MySQL и др. Клиент-серверные СУБД, в отличие от файл-серверных, обеспечивают разграничение доступа между пользователями, мало загружают сеть и клиентские машины. Недостатком таких СУБД в потреблении сервером больших вычислительных ресурсов.

Ещё одной разновидностью являются встраиваемая СУБД, позволяющие унифицированным образом хранить большие объёмы данных на локальной машине. Доступ к данным может происходить через SQL или через особые функции СУБД. Подобные СУБД (OpenEdge, SQLite, один из вариантов MySQL, Microsoft SQL Server Compact и др.) быстрее обычных клиент-серверных и не требуют установки сервера, поэтому востребованы в локальном ПО с большими объёмами данных, например, в геоинформационных системах.

Некоторые современные фактографические системы могут работать с неструктурированными блоками информации (текстами, графикой, звуком, видео), снабжёнными структурированными описателями.

В отличие от документального обслуживания фактографическое предполагает удовлетворение информационных потребностей непосредственно. Эти сведения, также релевантные[4] запросам потребителей, предварительно извлекаются информационными работниками из первичных документов и после определённой их обработки представляются потребителям.

 

Контрольные вопросы

 

1.      Какие данные являются фактографическими?

2.      Дайте определение понятия «Фактографическая информация».

3.      Что является центральным функциональным звеном фактографической информационной системы?

4.      На какие две категории делятся фактографической информационной системы?

5.      В чем заключается основная идея фактографической системы?

6.      По какому признаку можно классифицировать фактографические ИС?

7.      Дайте определение понятия «Фактографическая информационно-поисковая система».

8.      Дайте определение терминам «Модель» и «Объект».

9.      Что представляют собой модель данных, информационная модель и концептуальная модель данных?

10. Дайте определение терминам «Сущность», «Атрибут» и «Связь».

11. Назовите четыре основных вида связей сущностей.

12. Назовите программные средства реализации фактографических ИС.

 

 

6. Документальные информационные системы

 

Входные информационные потоки в целом ряде организационно-технологических и управленческих сфер представлены неструктурированными данными в виде служебных документов и иных текстовых источников. Извлечение из текстов данных по формализованным позициям для ввода в фактографические системы может приводить к ошибкам и потере части информации, которая в исходных источниках имеется, но в силу отсутствия в схеме базы данных адекватных элементов не может быть отражена в банке данных фактографических АИС.

Под документом будем понимать хранящийся в информационной базе, объект произвольной структуры, содержащий информацию произвольного характера, доступ, к которому можно получить по его реквизитам.

В качестве примеров документов можно привести книги, статьи, рефераты и тезисы докладов, тексты приказов и распоряжений, технический отчёты, и патенты, бухгалтерские документы, карты местности, рисунки и иные графические изображения, звуковые и видеозаписи и т. д. Очевидно, что документ, в отличие от факта, не может быть выражен простой структурой. Причём извлечение данных из текстов по формализованным позициям для ввода в фактографические системы может приводить к ошибкам и потере части информации, которая имеется в исходных источниках.

Реквизитами документа является совокупность его свойств, позволяющих однозначно его идентифицировать, например, название документа, его номер, дата создания, имена создателей и т.д. Кроме того, электронные документы характеризуются электронной подписью и форматами, например, для текстовых документов это могут быть: «txt», «doc», «rtf», «pdf», «html» и другие. Причём «pdf» используется для графических и текстово-графических документов.

Для организации эффективной работы с электронными документами обычно используются специальные ИС – документные, документальные или документографические.

БД документального типа могут быть организованы по-разному – без хранения (библиографические и реферативные БД, БД-указатели) и с хранением исходного документа на электронных носителях. Системы, в которых предусмотрено хранение полного текста документа, называют полнотекстовыми.

Документные библиотечные ИПС часто делят на системы с библиотечным или библиографическим поиском. В первом случае речь идёт о содержании первичных документов, а во втором об их описании (вторичные документы) – документографические ИС.

Поскольку в документных БД единицей хранения является документ, то пользователь в ответ на запрос получает сам документ или ссылку на него.

В документных системах пользователь может получить не только конкретные документы и ссылки на них, но и некоторые статистические сведения, формируя запросы типа «сколько документов было создано за определённый период времени», «сколько изданий вышло у конкретного автора, в том числе за конкретный период времени» и т. п. В критерий поиска в таких системах могут включаться: дата создания или принятия документа, другие входные и выходные его данные.

Текстовые документы в БД могут храниться в виде графических образов или электронных текстов.

В первом случае в базе данных таких документов образуется совокупность неструктурированных текстовых документов, и СУБД оснащается формализованным аппаратом поиска по специальным дополнительным полям. В этих системах единичным элементом информации является неразделённый на мелкие элементы документ и информация при вводе, как правило, не структурируются, или структурируются в ограниченном виде – для вводимого документа устанавливаются такие формализованные позиции, как дата изготовления, исполнитель, название, тематика и др.

Как правило, целью такой системы является выдать на запрос пользователя список документов, удовлетворяющих сформулированным в запросе условиям. Например, выдать список всех статей, в которых встречается слово «экология». Принципиальной особенностью подобной системы является её способность выдавать ненужные пользователю документы, например, где слово «экология» употребляется в ином смысле, чем он предполагал, а так же выдавать нужные документы, например, если пользователь в запросе употребил неоднозначный синоним или ошибся в написании. Хорошая документальная система должна по контексту определять смысл того или иного термина, например, различать термины «Рак – животное, от «Рак» – созвездие и от «Рак» – болезнь или, например, различать нос живого существа от носа корабля и т. п.

Разновидностью документальных систем являются поисковые Интернет системы. Фактически они не предоставляют пользователю конкретные документы, а выдают ему полученный в результате запроса перечень ссылок на документы (и не только). Типичным примером подобных документальных информационных систем являются справочно-правовые (юридические) системы. В отличие от Интернет систем, они выдают набор документов.

Документальная информационно-поисковая система (англ. «Document information retrieval system») – информационно-поисковая система, предназначенная для отыскания документов, содержащих необходимую пользователю информацию.

В документальных информационно-поисковых системах, включающих полные электронные тексты (второй случай), поиск в соответствии с запросом реализуется непосредственно в текстах документов, а также в специальных дополнительных полях с последующим предоставлением пользователю этих документов или их копий. Причём вся обработка полученной информации в таких ИПС осуществляется пользователем.

Документальная и фактографическая информационные системы выдают пользователю разную по виду информацию. Обычно документальная ИС на запрос выдаёт сведения о множестве документов, где содержится нужная информация или указывает адрес хранения документов. Фактографическая система на запрос выдаёт необходимую пользователю информацию.

Поскольку многие информационные системы оперируют как фактографической, так и документальной информацией, предоставляя инструментальные средства манипулирования информацией того и другого типа, реально существуют комбинированные информационно-поисковые системы, совмещающие в себе свойства документальной и фактографической систем.

Некоторые программы дают возможность пользователю спроектировать своеобразный гибрид фактографической и документальной системы, то есть работать с неструктурированными блоками информации, снабжёнными структурированными описателями.

При этом следует отметить, что принципиальных различий между документальными и фактографическими ИПС нет. Более того, их можно объединить в один общий класс, поскольку и те, и другие по запросам могут выдавать только ту информацию, которая была введена в них ранее.

Любая документальная ИПС (от ручной до автоматизированной) включает: информационно-поисковый язык (ИПЯ), правила перевода текстов документов и запросов с естественного языка на ИПЯ, формальные правила (алгоритмы) поиска, реализующие алгоритмы поиска технические устройства, фонд документов (или их адресов), записанных на электронных носителях информации.

Информационное и лингвистическое обеспечение АИС в первую очередь определяют:

·    внутрисистемные и коммуникативные форматы представления и хранения библиографической информации;

·    системы классификации и индексирования, используемые для автоматизированной обработки документных потоков;

·    комплекс словарно-тезаурусной поддержки и лингвистических процессоров.

 

Информационное обеспечение АИС представляет собой:

·    файлы системы;

·    базы данных (взаимосвязанная совокупность физических файлов, поддерживающих информационную модель предметной области).

 

К лингвистическому обеспечению обычно относят:

·   типы, форматы, структуру информации (данных, записей, документов);

·   языковые средства описания (ЯОД, словари данных) и манипулирования данными (ЯМД);

·   классификаторы, кодификаторы, словари и тезаурусы и т.п.

 

Важное место в лингвистическом обеспечении АИС занимают информационно-поисковые языки – это искусственные языки, представляющие совокупность средств описания формальной и содержательной структур информации, предназначенные для выражения содержания документов или запросов, описания фактов с целью проведения поиска.

 

Информационно-поисковый язык, система индексирования.

Совокупность языковых средств ИС образует лингвистическое обеспечение. Обычно оно включает комплекс языков: информационно-поисковый язык (ИПЯ), в том числе: язык запросов и отчётов, обеспечивающий удобство работы конечного пользователя; специальные языки определения и управления данными, обеспечивающие адекватность внутреннего представления и согласование внутреннего и внешнего представлений, а также тематические рубрикаторы, тезаурусы, частотные словари, словари неинформативных лексических единиц, словари синонимов (они, как и тезаурусы, позволяют осуществлять поиск по запрошенному слову и по его синонимам), словари словосочетаний.

ИПЯ – это искусственные языки, сконструированные для выражения (формулировки) основного смыслового содержания документов и запросов с целью последующего их сопоставления.

ИПЯ включает в себя:

·    алфавит – набор определённых знаков и символов, используемый для записи слов и выражений;

·    лексические единицы – отдельные фразы и выражения, сконструированные из алфавита с помощью синтаксических и морфологических правил, а также индексы.

 

Перевод с естественного на машинный поисковый язык называют индексированием. Системы индексирования различаются. При свободном индексировании используется способ выписывания слов (словосочетаний), отражающих содержание индексируемого документа (запроса) и упорядочение их в алфавитном порядке. Такой упорядоченный набор слов представляет поисковый образ документа (ПОД), формируемый на основе поискового образа запроса (ПОЗ).

Поисковый образ документа представляет собой множество терминов, приписываемых конкретному документу и используемых при составлении запросов на информационно-поисковом языке.

В качестве ПОД выступают массивы библиографических описаний, индексов, ключевых слов, тематических рубрик, дескрипторов, тезаурусов и др.

ПОЗ представляют типовые или наиболее часто употребляемые запросы пользователей, которые могут продолжительно храниться в памяти ЭВМ и использоваться при необходимости.

При автоматизированном поиске наилучшие результаты достигаются, когда он осуществляется по ПОД и (или) по их рефератам.

Использование дескрипторов и ключевых слов при поиске в полнотекстовых БД даёт низкую точность выдачи, так как в результате производится отбор слишком большого количества формально релевантных документов, из которых пользователю трудно выбрать действительно необходимые ему документы. Существуют и другие способы индексирования.

ИПЯ используется для формирования информационно-поисковых запросов пользователей, нацеленных на получение искомых данных. Особенность применения ИПЯ заключается в том, что преобразование текста в поисковый образ путём выделения существенных аспектов обеспечивает переход от смысла в тексте к комплексу понятий. С точки зрения документальной ИПС поисковый запрос представляет совокупность отдельных предложений запроса, в общем случае синтаксически и семантически не связанных между собой. Рассмотрим основные компоненты лингвистического обеспечения.

Частотный словарь – это перечень дескрипторов и ключевых слов. Термины располагаются в алфавитном порядке, или в порядке убывания (возрастания) частоты использования их в информационном массиве.

Ключевое слово – это предметное слово, выбираемое из некоторого текста (документа) и используемое для координатного индексирования этого текста (документа).

Словарь словосочетаний используется для определения наиболее часто встречающихся устойчивых комбинаций слов. Он повышает эффективность анализа содержания, выделяя для идентификации содержания однозначные словосочетания вместо множества в общем случае неоднозначных слов (например, пара отдельных терминов «программа» и «язык» является менее определённой, чем словосочетание «язык программирования»).

Тезаурус представляет сбой семантическую сеть, в которой понятия связаны регулярными и устойчивыми семантическими отношениями – иерархическими (например, род – вид, целое – часть), ассоциативными и отношениями эквивалентности. Термин тезауруса – это слово или словосочетание, соотносящееся с понятием определённой области знаний, вступающее в системные отношения с другими терминами и образующее вместе с ними замкнутую систему, отличающуюся высокой информативностью, однозначностью и точностью.

Словарь синонимов широко используется при индексировании, а также позволяют искать не только по запрошенному слову, но и по его синонимам.

Для документального поиска используют различные математические модели: теоретико-множественные (булевская, нечеткие множества, расширенная булевская), вероятностные (сети вывода, энтропийная и др.), алгебраические (векторная, матричная и др.).

 

Технология обработки данных.

Обработка данных включает взаимосвязанные операции поиска, выборки, сортировки, слияния, проведения расчётов и т.д. Обычно она предполагает управление данными, как правило, без учёта заложенного в них смысла. К способам обработки данных относят: централизованный, децентрализованный, распределённый и интегрированный.

Централизованная обработка данных по существу представляет собой их пакетную обработку в установленные регламентом сроки в специализированном вычислительном центре.

Децентрализованная обработка стала возможной с появлением ПЭВМ. Она позволяет выполнять соответствующие действия на конкретных ПЭВМ, являющихся автоматизированными рабочими местами пользователей.

Распределённый способ предполагает обработку данных одной или несколькими ЭВМ, расположенными в некоторой компьютерной сети. Решение об использовании компьютеров сети для осуществления на них обработки необходимых данных зависит от потребностей их обработки и возможностей системы в текущий момент времени. Другим вариантом использования распределённой обработки данных является использование большого числа различных процессоров, размещённых внутри одной системы.

Интегрированная обработка данных подразумевает создание распределённой базы данных, позволяющей также осуществлять коллективное использование и централизованное управление данными. Его особенность заключается в установление времени осуществления обработки отличного от времени выполнения процедур сбора, подготовки и ввода данных.

Обработка информации подразумевает преобразование данных с учётом их содержания. В результате обработки информации обычно создаются различные виды отчётов (регулярные, специальные, сравнительные, чрезвычайные и др.) и документов.

 

Для выполнения необходимой пользователям обработки данных используются прикладные процессы (англ. «Application process»). С одной стороны, такой процесс взаимодействует с пользователями, получает от них задания и предоставляет им результаты обработки данных. При этом используется интерфейс пользователя. С другой стороны, прикладной процесс связан прикладным интерфейсом с областью взаимодействия. Различают:

·    программные и человеко-машинные прикладные процессы;
·    прикладные процессы пользователей и прикладные процессы управления.

 

Поисковый аппарат.

Человеко-машинный поиск информации обычно заключается в отыскании человеком неизвестных ему или искомых сведений и отборе документов, формально соответствующих его потребности. В этом случае задача поиска заключается в получении существующих документов или сведений.

Особенности и методы информационного поиска рассматриваются в соответствующем параграфе. Здесь упомянем лишь о средствах поиска.

Средства поиска – это взаимозависимый комплекс информационно-поискового языка и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а также объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора объектов конкретной ИПС.

О ИПЯ и его возможностях сказано выше.

 

Критерии оценки документальных систем.

В международном стандарт ISO 9241-11: 1998[5] «Руководство по юзабилити», приводится понятие «юзабилити» (англ. «Usability»), означающее эффект от использования технологии определёнными пользователями в определённых условиях при достижении ими определённых целей.

Этот эффект измеряется эффективностью (качеством результата), продуктивностью (затратами на достижение результата) и удовлетворённостью (субъективным отношением к процессу работы и продукту), а проблемами «юзабилити» занимается эргономика.

Эффективность системы отражает свойство системы с определённым качеством выполнять поставленную в заданных условиях использования цель.

Показатели эффективности ИС характеризуют степень выполнения ей поставленных задач и зависят от таких показателей, как надёжность, достоверность, безопасность ИС. В простейшем случае показатель эффективности может определяться одним, наиболее важным, параметром ИС.

Наиболее общим критерием оценки документальных (как впрочем и иных) ИС является их эффективность, особенно экономическая эффективность.

Экономическая эффективность информационной системы характеризует целесообразность затрат, произведённых на создание и функционирование системы, то есть отношение результатов: величины прибыли к величине суммарных затрат на создание и эксплуатацию системы.

Зачастую степень эффективности определяют исходя из того, насколько выгодны решения, принимаемые с точки зрения функционирования систем и устройств, государства, права и бизнеса, образования, культуры и т.д. При этом принято сопоставлять произведённые затраты на разработку, создание и внедрение ИС, а также текущие затраты на её эксплуатацию с полученными результатами (прибыль, полученная в результате использования ИС, социальный эффект, обусловленный функционированием ИС и др.).

Может оказаться, что расчёт финансовых вложений является не самым главным критерием. Так, например, если информационные службы высокоэффективны, то не только бизнес, но культура и образование выигрывают от их деятельности. В этом случае весьма затруднительно обосновать необходимые капиталовложения в соответствующую информационную систему. Здесь не работают расчёты, сделанные только с учётом экономической эффективности, а обычно учитывается каких результатов можно достигнуть при создании новой системы или модернизации существующей. Для этого предлагается осуществлять анализ экономической эффективности с учётом качественных выгод, определяемых методом финансового прогноза. Эти результаты могут учитывать краткосрочную и долгосрочную перспективы. Кроме того, следует учитывать прагматическую, техническую, эксплуатационную и технологическую эффективности, которые можно рассматривать в качестве локальных показателей эффективности ИС.

 

Программные средства реализации документальных ИС.

Документальные информационные системы используются в различных предметных областях (государственных, коммерческих, общественных, личностных и иных). Наибольшее распространение в различных областях и сферах деятельности находят ИС документационного обеспечения управления. Системы, связанные с делопроизводством, являются учётно-аналитическими автоматизированными информационными системами. Электронный документооборот позволяет существенно сократить количество бумажных документов и сроки выполнения заданий. Эффективное применение информационных технологий и систем электронного документооборота способствует повышению качества управления персоналом.

К широко популярным документным информационно-поисковым системам относятся справочно-правовые (законодательные) информационные системы типа Гарант, Консультант+ и т.п. Не менее известны и популярны документные ИС, связанные с созданием архивов и огромных хранилищ различных электронных документов.

В социокультурной сфере находят широкое применение документные ИС, связанные со средствами массовой информации (СМИ): радио, телевидением и средствами коммуникации. Отдельным видом документных систем являются гипертекстовые и мультимедийные ИС.

Всё большую популярность в среде разработчиков ПО получают системы интеллектуального и автоматизированного проектирования (например, CASE).

 

Контрольные вопросы

 

1.      Дайте определение термина «Документ».

2.      Назовите реквизиты документа.

3.      Как называются системы, в которых предусмотрено хранение полного текста документа?

4.      Что получает пользователь в ответ на запрос в документальной ИС?

5.      Дайте определение понятия «Документальная информационно-поисковая система».

6.      В чем отличия документальной информационной системы от фактографической?

7.      Что входит в состав практически любой документальной ИПС?

8.      Что входит в состав информационного и лингвистического обеспечения АИС?

9.      Дайте определение понятия «Информационно-поисковые языки».

10. Что представляют собой ПОД и ПОЗ и для чего они используются?

11. Назовите основные компоненты лингвистического обеспечения.

12. Назовите способы обработки данных.

13. Что представляют собой средства поиска информации в ИПС?

14. В чем заключается эффективность ИС?

15. Назовите программные средства реализации документальных ИС.

 

 

7. Автоматизированные информационные системы

 

Автоматизация позволяет существенно сократить время создания новых образцов техники, продуктов и т.д., а также обслуживания пользователей, значительно повышая уровень их обслуживания. Она обеспечивает преобразование и видоизменение отдельных технологических процессов, а порой – всех основных традиционно используемых технологий.

По утверждению Г.А. Титоренко «Автоматизация в общем виде представляет собой комплекс действий и мероприятий технического, организационного и экономического характера, который позволяет снизить степень участия или полностью исключить непосредственное участие человека в осуществлении той или иной функции производственного процесса, процесса управления».

Внедрение автоматизации связано с созданием и эксплуатацией автоматизированных систем.

Автоматизированная система (АС) состоит из взаимосвязанной совокупности подразделений организации и комплекса средств автоматизации деятельности, реализующих автоматизированные функции по отдельным видам деятельности.

Функционирования АС обусловлено наличием совокупности средств автоматизации, организационно-методических и технических документов и специалистов, использующих такие системы в процессе своей профессиональной деятельности. В зависимости от сферы автоматизированной деятельности АС делятся на:

·    АС управления (ОАСУ, АСУП, АСУТП, АСУ ГПС и др.);

·    системы автоматизированного проектирования (САПР);

·    АС научных исследований (АСНИ);

·    АС обработки и передачи информации (АСОИ);

·    АС технологической подготовки производства (АСТПП);

·    АС контроля и испытаний (АСК);

·    системы, автоматизирующие отдельные или сочетания различных видов деятельности.

 

Первые автоматизированные системы использовались для управления устройствами (роботами), а затем и производственными процессами. Они получили название АСУ (автоматизированные системы управления).

Автоматизированная система управления – это комплекс технических и программных средств, совместно с организационными структурами (отдельными людьми пли коллективом), обеспечивающий управление объектом в производственной, научной или общественной среде.

 

Появление АСУ обусловлено необходимостью совершенствования организационной структуры управления предприятием, организацией, учреждением и т.п. Оно было направлено в основном на облегчение рутинных операций. В России понятие «Автоматизированная система управления» стало использоваться в 1950-е годы, а интенсивное применение таких систем начинается в 1970÷1980 годы.

Основное назначение АСУ заключается в получении высокой эффективности разработки, внедрения и эксплуатации различных по назначению производственных систем. В первую очередь такие системы создавались в промышленности и были ориентированны на совершенствование методов управления производственными процессами (автоматизированные системы управления технологическими процессами).

В качестве технических средств АСУ получили использование многомашинные, многопроцессорные комплексы, образующие с помощью ЭВМ и информационных сетей распределённые системы обработки информации. При реализации АСУ обычно применяются автоматизированные рабочие места и участки.

Решаемые в АСУ задачи делят на задачи, требующие немедленного ответа и допускающие определённую его задержку по времени выполнения.

В основном выделяют следующие режимы работы АСУ: параллельной обработки, квантования временем для пакетной обработки, оперативной обработки, реального времени и телеобработки информации и данных.

В режиме квантования временем каждой прикладной программе выделяется квант времени, по окончании которого управление передаётся следующей программе. Увеличение скорости ответа системы достигается путём оперативной (онлайновой, непосредственной) обработки данных.

Сочетание многопрограммного режима работы ЭВМ с квантованием времени и режимом непосредственного доступа образует режим разделения времени.

Режим реального времени обслуживает задачи, требующие немедленного ответа. Он характеризуется дистанционной обработкой информации (телеобработкой).

Режим телеобработки может использоваться и в других случаях, например, для пакетной обработки данных.

Управление связано с выполнением функций управления не только производственными процессами и агрегатами, но и работниками, участвующими в выполнении различных производственных процессов, то есть с взаимодействием людей в процессе выполнения каких-либо работ. В этом случае активизируется деятельность административно-управленческого аппарата и совершенствуется документооборот. Важное место в подобных процессах отводится циркулирующей в организации информации. Поэтому в различных организациях активно используются информационные системы, основной целью которых является хранение, обеспечение эффективного поиска и передачи информации по соответствующим запросам.

Традиционные информационные системы создаются и используются без применения технических средств и, тем более, автоматизированных систем, комплексов и устройств (например, рукописные или печатные на пишущей машинке табличные данные самого различного назначения). Однако подобные технологии в современном обществе применяются крайне редко.

Информационная система является системой информационного обслуживания пользователей, одновременно выполняющей технологические функции по накоплению, хранению, передаче и обработке информации. Она формируется и функционирует в регламенте, определённом методами и структурой, принятыми в конкретной предметной области и даже на конкретном объекте, реализуя цели и задачи, стоящие перед ним.

Появление ЭВМ позволило не только осуществлять различные вычисления, но и автоматизировать разные процессы. Совершенно очевидно, что абсолютное большинство различных действий с информационными системами осуществляется с помощью автоматизированных средств и технологий. Так появились автоматизированные информационные системы, основной целью которых является обработка, хранение, обеспечение эффективного поиска и передачи информации по соответствующим запросам. АИС являются разновидностью АС. АИС представляя область информатизации, механизм и технологию, отражают уровень формирования высоких технологий на каждой ступени развития общества.

Автоматизированная информационная система – это совокупность программных и аппаратных средств, предназначенных для хранения и (или) управления данными и информацией, а также для производства вычислений.

Г.А. Титоренко предлагает рассматривать АИС «как человеко-машинную систему с автоматизированной технологией получения результатной информации, необходимой для информационного обслуживания специалистов и оптимизации процесса управления в различных сферах человеческой деятельности».

Такие человеко-машинные системы обеспечивают автоматизированную подготовку, поиск и обработку информации в рамках интегрированных сетевых, компьютерных и коммуникационных технологий для оптимизации деятельности в различных предметных областях и сферах управления. При этом АИС представляют совокупность функциональных подсистем сбора, ввода, обработки, хранения, поиска и распространения информации. АИС позволяют автоматизировать ту или иную сферу профессиональной деятельности людей за счёт использования компьютерных средств и технологий.

Современная АИС представляет собой совокупности информации, экономико-математических методов и моделей, технических, программных, технологических средств и специалистов, предназначенных для обработки информации и принятия управленческих решений. Основное назначение АИС не просто собирать и сохранять электронные информационные ресурсы, но обеспечить к ним доступ пользователей. То есть важной особенностью АИС является организация поиска данных в их информационных массивах.

Следовательно, такая система является организационно упорядоченной совокупностью массивов документов и информационных технологий, базирующихся на использовании средств вычислительной техники и связи, реализующих информационные процессы. Так, например, при автоматизации предприятия осуществляют не просто приобретение компьютеров и формирование корпоративной сети, а создание информационной системы, включающей компьютеры, сети, ПО, а главное – организацию информационных потоков.

Таким образом, использование автоматизированных информационных систем связано с автоматизацией информационных процессов, базирующихся на применении средств вычислительной техники (СВТ) и необходимого программного обеспечения.

Целью автоматизации информационных процессов является повышение производительности и эффективности труда работников, улучшение качества информационной продукции и услуг, повышение сервиса и оперативности обслуживания пользователей. Основные задачи автоматизации информационных процессов заключаются в:

1) сокращении трудозатрат при выполнении традиционных информационных процессов и операций;

2) устранении рутинных операций;

3) ускорении процессов обработки и преобразования информации;

4) расширении возможностей осуществления статистического анализа и повышении точности учётно-отчетной информации;

5) повышении оперативности и качественного уровня обслуживания пользователей;

6) модернизации или полной замене элементов традиционных технологий;

7) расширении возможностей организации и эффективного использования информационных ресурсов за счёт применения новых информационных технологий (НИТ): автоматическая идентификация изданий, настольные издательские системы, сканирование текстов, устройства СD и DVD, системы теледоступа и телекоммуникаций, электронная почта, другие сервисы Интернета, гипертекстовые, полнотекстовые и графические электронные данные и др.;

8) облегчении возможностей широкого обмена информацией, участия в корпоративных и других проектах, способствующих интеграции и т. п.

 

Автоматизация информационных процессов наряду с перечисленными достоинствами, повышая комфортность и одновременно эффективность работы, создаёт и новые проблемы, решение которых связано с использованием общенаучных методов и перспективных информационных технологий.

Совокупность информации по какому-либо объекту называется информационной базой. Информационная база присуща любому объекту независимо от уровня управленческой техники. Информационная база, записанная на машинные (электронные) носители информации и используемая для решения задач на ЭВМ, называется базой данных.

Информационная база – это основа внутримашинного информационного обеспечения; это совокупность всех данных, подлежащих накоплению, хранению, поиску, преобразованию, выдаче в установленном порядке, а также использованию для организации общения человека с ЭВМ.

Ныне не вызывает сомнений потребность создания и разнообразного использования баз данных для информационного обслуживания различных категорий пользователей. БД формируются с помощью универсальных и (или) специализированных компьютерных аппаратно-программных средств.

К средствам сбора информации в АИС относятся автоматические датчики, исполнительные механизмы, автоматизированные рабочие места (АРМ), распределённые базы и банки данных.

Автоматические датчики позволяют вводить в ЭВМ информацию о производственных процессах и различных ситуациях. Они могут выдавать информацию как в аналоговой, так и в цифровой форме.

Исполнительные механизмы приводятся в действие сигналами, поступающими из управляющих ЭВМ, выполняя механические перемещения, включение и выключение тока и т.д. Для этого используются специальные сервомоторы (непрерывные, шаговые и др.).

Для работы с АИС создают специальные рабочие места пользователей (в том числе работников), получившие название «автоматизированное рабочее место» – комплекс средств, разных устройств и мебели, предназначенных для решения различных информационных задач. С другой стороны, АРМ – это совокупность методов, средств и процедур информационного, технического, программно-математического и организационно-правового характера по взаимодействию пользователя с ресурсами АИС.

За рубежом в первой половине 1970-х годов появился термин «work station», смысл которого во многом совпадает с понятием АРМ. На Рис. 19. представлена структурно-функциональная схема, включающая основные компьютерные средства, входящие в состав АРМ.

 

 

Рис. 19. Основные компьютерные средства, входящие в состав АРМ

 

В ряде случаев под АРМом понимают набор инструкций для конкретного специалиста при работе с программой и его пользовательский интерфейс.

К АРМ предъявляются следующие требования: удобство и простота общения с ними, в том числе настройка АРМ под конкретного пользователя и эргономичность конструкции; оперативность ввода, обработки, размножения и поиска документов; возможность оперативного обмена информацией между персоналом организации, с различными лицами и организациями за её пределами; безопасность для здоровья пользователя.

Основные требования к аппаратным и программным средствам, используемым в АРМ, заключаются в обеспечении: технологичности выполняемых процедур, «дружественного» интерфейса и эргономичности (удобное расположение технических средств и мебели, высокое качество визуальной информации, простота осуществления диалога с подсказками при неправильных действиях пользователя, наличие средств печати и тиражирования документов, возможность ведения архива и др.). При этом в АРМ используются различные операционные системы и прикладные программные средства, зависящие, главным образом, от решаемых функциональных задач и видов работ (административно-организационных, управленческих и технологических, персонально-творческих и технических).

Наиболее простая и распространённая, присуща любому АРМ функция, – это информационно-справочное обслуживание. Особенности её реализации существенно зависят от категории пользователя. Выделяют АРМы для подготовки текстовых и графических документов; обработки данных, в том числе в табличной форме; создания и использования БД, проектирования и программирования; руководителя, секретаря, специалиста, технического и вспомогательного персонала и другие. Наметилась тенденция создания унифицированных АРМ, обслуживающих несколько предметных областей. Например, АРМ-аналитика, созданное на базе АРМ-статистика, значительно расширяет возможности последнего, позволяя решать обширный комплекс функциональных задач.

Следует иметь в виду, что для АИС процессы сбора и ввода данных необязательны, поскольку вся необходимая и достаточная для их функционирования информация может уже находиться в электронном виде. В этом случае АИС представляет наибольший интерес как некоторая справочная система или автоматизированная информационно-поисковая система.

АИС могут быть достаточно простыми (элементарные справочные) и сложными системами (экспертные и другие, предоставляющие прогностические решения). Даже простые АИС имеют многозначные структурные отношения между своими модулями, элементами и другими составляющими. Это обстоятельство позволяет отнести их к классу сложных систем, состоящих из взаимосвязанных частей (подсистем, элементов), работающих в составе целостной сложной структуры.

В целом современная АИС обычно представляет собой некоторое информационное пространство. Это пространство, как правило, неоднородно, поскольку содержит информационные объекты, различающиеся по методам формирования, организации и пополнения информации. Поскольку АИС предназначены для одновременного обслуживания большого количества людей, они используются в разного рода сетях. Современная сетевая информационно-поисковая система представляет собой специализированный информационный портал с развитыми средствами удалённого оперативного доступа, диалоговым языком запросов, ведения перекрестных ссылок между словарными статьями различного уровня, средствами информационно-справочного обслуживания пользователей и автоматического формирования выходных отчётов.

 

История создания и развития АИС.

Различают шесть этапов развития АИС, характеризуемых такими признаками, как: поколение используемых ЭВМ, класс решаемых задач и тип используемой информационной технологии.

Появление АИС связывают с 1950÷1960-е годами, когда осознаётся роль информации как важнейшего ресурса предприятия, организации, региона, общества в целом и начинают разрабатываться различные автоматизированные информационные системы. Вначале, с появлением возможности обработки информации с помощью ВТ, создаются системы обработки данных (СОД), для радиоуправления ракетами и спутниками, при создании систем сбора и обработки статистической информации о состоянии атмосферы, учётно-отчетной информации предприятий и т. п.

I этап: конец 1950÷начало 1960-х годов. Характерные особенности:

·     использование ЭВМ первого-второго поколений для решения отдельных наиболее трудоёмких задач (например, начисление зарплаты, материальный учёт и т.д.);

·     АИС обеспечивают частичную электронную обработку данных. Они создаются как фактографические системы с представлением информации пользователям в виде регламентированных форм.

 

II этап: 1960÷начало 1970-х годов. Характерные особенности:

·     использование ЭВМ второго-третьего поколений;

·     электронная обработка плановой и текущей информации, хранение в ЭВМ нормативно-справочных данных, выдача машинограмм на бумажные носители;

·     АИС представляют электронные системы обработки данных (ЭСОД).

 

III этап: 1970-е годы. Характерные особенности:

·     использование ЭВМ третьего поколения;

·     комплексная обработка данных на всех этапах управленческого процесса деятельностью предприятия, организации, переход к разработке подсистем АСУ;

·     АИС обеспечивают централизованную автоматизированную обработку информации в условиях ВЦ и ВЦКП (вычислительного центра коллективного пользования).

 

IV этап: 1980-е годы. Характерные особенности:

·     использование ЭВМ четвёртого поколения;

·     развитие АСУ технологическими процессами, систем автоматизированного проектирования, АСУ предприятия, отраслевых и общегосударственных АСУ и др.;

·     АИС обеспечивают технологические решения на базе мини-ЭВМ, ПЭВМ и путём удалённого доступа к массивам данных. Централизация управления уступает место распределённым вычислительным ресурсам (децентрализация управления), появляются системы поддержки принятия решений. В ВЦ решаются крупные долгосрочные стратегические задачи.

 

V этап: с конца 1980-х годов. Характерные особенности:

·     использование ЭВМ пятого поколения;

·     кооперация, комплексное решение экономических задач; объектно-ориентированный подход; широкий спектр приложений; сетевая организация информационных структур; преобладание интерактивного взаимодействия пользователя с ЭВМ;

·     АИС используют новые (перспективные) информационные технологии, сочетающие средства вычислительной техники, средства связи (телекоммуникации) и оргтехники.


VI этап: с начала 2000 года. Характерные особенности:

·    использование ЭВМ пятого-шестого поколения;

·    глобализация информационных технологий, ориентация на комплексное удовлетворение услуг пользователей; интеграция информационных ресурсов, развитие геоинформационных технологий и систем, использование интеллектуальных и нано информационных технологий и систем;

·    АИС ориентируются на новейшие информационные технологии, позволяющие объединять (конвергенция) проводные и беспроводные системы связи.

 

Различают три типа задач, для которых создаются автоматизированные информационные системы:

·    структурированные (формализуемые);

·    неструктурированные (не формализуемые);

·    частично структурированные.

 

Структурированная (формализуемая) задача – это задача, где известны все её элементы и взаимосвязи между ними.

В структурированной задаче удаётся выразить её содержание в форме математической модели, имеющей точный алгоритм решения. Подобные задачи обычно приходится решать многократно, и они носят рутинный характер. Целью использования АИС для решения структурированных задач является полная автоматизация их решения, т. е. сведение роли человека к нулю.

Неструктурированная (не формализуемая) задача – это задача, в которой невозможно выделить элементы и установить между ними связи.

Решение неструктурированных задач из-за невозможности создания математического описания и разработки их алгоритма связано с большими трудностями. В этом случае возможности использования АИС невелики. Решение принимается человеком на основе его опыта и, возможно косвенной информации, полученной им из разных источников.

На практике существует сравнительно немного полностью структурированных или совершенно неструктурированных задач. В большинстве случаем можно сказать, что известна лишь часть элементов задач и связей между ними. Такие задачи называются частично структурированными. В этих условиях можно создать автоматизированную информационную систему. Получаемая в ней информация анализируется человеком. Более того, человек принимает участие и в функционировании АИС.

Процедуры манипулирования данными в информационной системе должны обеспечивать следующие возможности:

·  составление комбинаций данных, получаемых из различных источников;

·  быстрое добавление или исключение того или иного источника данных и автоматическое переключение источников при поиске данных;

·  управление данными с использованием возможностей систем управления базами данных;

·  логическую независимость данных этого типа от других баз данных, входящих в подсистему информационного обеспечения;

·  автоматическое отслеживание потока информации для наполнения баз данных.

 

Выделяют четыре типа АИС:

1) Охватывающий один процесс (операцию) в одной организации.

2) Объединяющий несколько процессов в одной организации.

3) Обеспечивающий функционирование одного процесса в масштабе нескольких взаимодействующих организаций.

4) Реализующий работу нескольких процессов или систем в масштабе нескольких организаций.

 

Потребность структурировать информацию, придавая ей форму сведений (систематизированной совокупности фактов) привела к интеллектуализации современных информационных систем. Правильный выбор информационной модели и её творческое наполнение составляют основу информационно-аналитической деятельности. Он и привёл к появлению компьютерных аналитических систем.

Аналитическими системами принято называть ИС или компоненты ИС, ориентированные на анализ данных, находящихся в этих системах.

Зачастую их называют системами поддержки принятия решений, поскольку в большинстве случаев они ориентированы на оказание помощи управляющему персоналу организации в принятии правильных и своевременных решений. В России их часто называют «информационно-аналитическими системами» (ИАС).

Анализ данных осуществляется при помощи современных инструментов делового анализа данных. Например, ИАС мониторинга предприятий может осуществлять: сбор первичной информации о состоянии предприятий и организаций; финансово-экономический анализ и мониторинг их текущего состояния и др. В мировой практике используются термины «Business Intelligence» (BI), переведённый на русский язык как «деловой интеллект» и «Business Analytics» (BA − бизнес-аналитика). При этом BI по сути является базовым сегментом BA. Понятия объединяют различные средства и технологии анализа и обработки данных масштаба предприятия, и являются разновидностями интеллектуального анализа данных (ИАД).

Интеллектуальный анализ данных (англ. «Data Mining») представляет собой процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации).

Инструменты интеллектуального анализа данных используются конечными пользователями (не программистами) для доступа к информации, её визуализации, выборки, многомерного анализа и формирования предопределённых по форме и составу, а так же произвольных отчётов, создаваемых управленцами, аналитиками и др.

Создание реально отвечающих целям и задачам организаций ИАС является сложной задачей, включающей этапы формирования концепции, проектирования, разработки, внедрения и сопровождения. Одним из вариантов, используемым для решения подобных задач может быть отечественная программа TextAnalyst – инструментарий семантического анализа, навигации и поиска неструктурированных текстов.

 

Принципы построения и функционирования АИС.

При создании АИС целесообразно максимально унифицировать организуемые системы (подсистемы) для удобства их распространения, модификации, эксплуатации, а также обучения персонала работе с соответствующим ПО, разработка которого для АИС связана с тремя основными факторами:

1) существующей программной средой, состоянием системных, прикладных программных средств, в том числе СУБД;

2) необходимостью проведения новых разработок (нецелесообразность модернизации старых или адаптации заимствованных систем);

3) наличием квалифицированных разработчиков.

 

Разработка (проектирование) систем автоматизации информационных процессов состоит из двух системных аспектов: анализа и синтеза. Первый предполагает выделение процессов, подлежащих автоматизации, их изучение, выявление определенных закономерностей, особенностей и др. Он необходим также для определения целей и задач создаваемой системы. Второй аспект подразумевает организацию внедрения НИТ для осуществления, полученных в результате анализа, технических, технологических и программных решений.

Для успешного проведения проектных работ рекомендуется выявить один или несколько прототипов проектируемого объекта, на их основе разработать некоторое количество возможных вариантов (их количество, как правило, в несколько раз больше числа выявленных прототипов). Например, для определения организационно-управленческой структуры автоматизируемой организации в качестве прототипа можно использовать её структуру. Затем из полученных вариантов следует отобрать альтернативные разновидности. С учётом местных условий и локальных ограничений сократить оставшиеся варианты, из которых выбрать наилучшие решения.

Важной особенностью АИС является их интеграция – возможность обслуживания локальных и удалённых пользователей. Построение таких систем связано с необходимостью использования единой или совместимой технологии обмена информационными ресурсами с учётом применения различных форматов хранения данных в отдельных системах.

Существенный экономический эффект, высокое качество, сокращение сроков разработки, возможность активного участия управленческого персонала организации в создании АИС достигается применением интегрированного программно-математического обеспечения. Проектирование АИС на базе интегрированных программных систем значительно упрощает процессы связывания и встраивания электронных документов, их передачи как внутри предприятия, так и другим информационным системам. Прикладные программы, созданные на основе интегрированных программных средств, отличаются максимально-возможной открытостью и достаточно просто могут улучшаться непосредственно инженерно-техническими работниками предприятия. Такие системы максимально упрощают и эксплуатацию АИС, поскольку все задачи решаются с применением единообразного пользовательского интерфейса.

Способами обеспечения автоматизированных информационных систем и их технологий являются программные, технические, лингвистические, организационные и правовые средства, используемые или создаваемые при проектировании информационных систем и обеспечивающие их эксплуатацию.

Внедрение систем автоматизации любых процессов обычно сопровождается пересмотром всех ранее выполнявшихся процедур и операций, а использование АИС зачастую требует значительного изменения ранее выполняемых операций.

Поскольку НИТ могут кардинально изменить прежние представления и технологии, то попытки подстроить автоматизированные системы и технологии под традиционно выполняемые процессы могут иметь отрицательный эффект внедрения. А «лоскутная» автоматизация приводит к интеграции большого количества локальных программ, влекущих за собой негативные последствия, например: увеличиваются сроки и стоимость выполнения; уменьшается быстродействие системы; существенно увеличиваются затраты на поддержание системы в работоспособном состоянии и др. Поэтому важно формировать единую стратегию с единой программно-аппаратной платформой, позволяющую превратить фрагментарную (лоскутную) автоматизацию в комплексную. Кроме того, комплексный подход позволяет осуществлять поэтапную модернизацию ИС. А для этого надо использовать типовые и стандартные инструменты автоматизации.

 

Контрольные вопросы

 

1.      Дайте определение понятия «Автоматизированные системы».

2.      На какие виды делятся АС в зависимости от сферы автоматизированной деятельности?

3.      Дайте определение понятия «Автоматизированная система управления».

4.      Назовите основные режимы работы АСУ.

5.      Чем для пользователей является информационная система?

6.      Дайте определение понятия «Автоматизированная информационная система».

7.      Цель автоматизации информационных процессов.

8.      Дайте определение понятия «Информационная база».

9.      Что относят к средствам сбора информации в АИС?

10. Поясните что такое АРМ, а также где и как они используются.

11. Какие требования предъявляются к АРМ?

12. Назовите и охарактеризуйте основные этапы создания и развития АИС.

13. Назовите три типа задач, для которых создаются автоматизированные информационные системы.

14. Назовите четыре типа АИС.

15. Как осуществляется анализ данных в современных АИС?

16. Что входит в понятие «Data mining»?

17. Что представляет собой интеллектуальный анализ данных?

18. Назовите основные принципы построения и функционирования АИС.

 


8. Классификация автоматизированных информационных систем


В АИС размещают различные виды информации: библиографические данные (записи); фактографические данные (записи); полнотекстовые документы (записи); справочные данные (в том числе указатели); математические или численные (цифровые, табличные) данные; графические и мультимедийные данные. Поэтому АИС классифицируются по различным основаниям. Причём с точки зрения выполняемых задач и представляемых пользователям возможностей, АИС могут быть как достаточно простыми (элементарные справочные), так и сложными системами (экспертные и другие, предоставляющие прогностические решения).

По степени автоматизации информационных процессов в АИС можно выделить автоматические и автоматизированные.

В автоматических АИС все операции по переработке информации выполняются без участия человека.

Автоматизированные АИС предполагают участие в процессе обработки информации и человека, и технических средств, причём главная роль в выполнении рутинных операций обработки данных отводится техническим средствам, например, компьютеру. Именно этот класс информационных систем соответствует понятию «автоматизированная информационная система».

При этом автоматизированные подразумевают автоматизацию от отдельных процессов и задач до уровня автоматизации предприятий, учреждений и их совокупности в масштабах территории (региона), то есть представляют класс систем, ориентированных на автоматизацию отдельных функций или процессов и класс интегрированных систем и комплексов, подразумевающий электронную обработку и доставку данных, автоматизацию функций и процессов управления, поддержку принятия решений и др.

С другой стороны АИС можно делить на автономные и сетевые.

Автономные АИС обычно работают на одном ПК и располагаются на его жёстком диске или вставляемом в системный блок компакт диске.

Сетевые АИС работают по каналам связи и, как правило, периодически синхронизируют свои информационные хранилища с другими хранилищами. В простых локальных компьютерных сетях с выделенным сервером обычно используются файловые системы, реализуемые файловыми серверами, на которых размещается информационное хранилище. Для выполнения операций с данными необходимо получить копию этих данных на сетевой компьютер, что приводит к увеличению сетевого трафика. При обработке данных задействуются сетевые компьютеры, локальная сеть и файловый сервер. Для увеличения производительность такой АИС используют терминальное подключение к серверу. Тогда программа выполняется на сервере, а компьютер пользователя получает результирующие окна с информацией и возможность управлять этими окнами. Информационные системы файл-серверного типа называют одноуровневыми или монолитными.

Для построения информационных систем с большим количеством пользователей применяют архитектуру серверов баз данных. Особенность сервера баз данных заключается в способности выполнять специальные запросы, включающие множество элементарных операций над данными. В результате значительно снижается сетевой трафик, а увеличение производительности АИС связано лишь с увеличением производительности сервера баз данных. Кроме того, на стороне сервера могут храниться программные модули, запускаемые на выполнение по команде пользователя. В результате на стороне сервера можно осуществлять обработку данных и другие действия.

На стороне пользователя может располагаться ПО, отвечающее только за интерфейс пользователя. Тогда архитектура АИС делится на две части, а используемые технология и архитектура называются «клиент-серверной». Причём клиент, у которого размещён только пользовательский интерфейс, называется тонким, в противном случае он называется толстым клиентом. Информационную систему, построенную по технологии клиент-сервер, называют двухуровневой информационной системой.

Количество уровней (слоёв) АИС может быть и больше. В Интернете АИС обычно строятся в виде трёхуровневой системы. Причём клиентом является браузер, а ПО на стороне веб-сервера служит посредником между клиентом и сервером баз данных. Можно построить систему с более чем тремя уровнями. Например, можно отделить код обработки данных от самих данных. Такой код помещается на сервер приложений, что хотя и увеличивает сетевой трафик, но позволяет более эффективно управлять системой.

Современная архитектура АИС основывается на использовании «хранилищ данных» (англ. «Data Warehouse»), позволяющих формировать интегрированную информационную среду, включающую разнородные информационные ресурсы, а также на использовании глобальных распределённых информационных приложений на основе объектно-ориентированного подхода.

По масштабу автоматизированные информационные системы делятся на:

·    одиночные;

·    групповые;

·    корпоративные, а также на:

·    настольные;

·    сетевые;

·    масштаба предприятия.

 

Одиночные АИС реализуются, как правило, на автономном персональном компьютере (сеть не используется). Такая система может содержать несколько простых приложений, связанных общим информационным фондом, и рассчитана на работу одного пользователя или группы пользователей, разделяющих по времени одно рабочее место. Подобные приложения создаются с помощью так называемых настольных или локальных систем управления базами данных. Среди локальных СУБД наиболее известны Clarion, Clipper, FoxPro, Paradox, dBase и Microsoft Access.

Групповые АИС ориентированы на коллективное использование информации членами рабочей группы и чаще всего строятся на базе локальной вычислительной сети. Однотипные или специализированные рабочие места обеспечивают вызов одного или нескольких конкретных приложений. Общий информационный фонд представляет собой базу данных или совокупность файлов документов.

При разработке таких приложений для рабочих групп используются серверы баз данных называемые также SQL-серверами. Существует довольно большое количество различных коммерческих и свободно распространяемых. SQL-серверов. Среди них наиболее известны такие серверы баз данных, как Oracle, DB2, Microsoft SQL Server, InterBase, Sybase, Informix.

Корпоративные АИС являются развитием систем для рабочих групп, они ориентированы на крупные компании и могут поддерживать территориально разнесенные узлы или сети.

Корпоративная АИС является системой, участниками которой может быть только ограниченный круг лиц, определённый её владельцем или соглашением участников этой системы. Главная особенность таких АИС заключается в обеспечение доступа из подразделения к центральной или распределённой базе данных организации помимо доступа к информационному фонду рабочей группы.

В основном они имеют иерархическую структуру из нескольких уровней. Для таких систем характерна архитектура клиент-сервер со специализацией серверов или многоуровневая архитектура. В крупных информационных системах наибольшее распространение получили серверы Oracle, DB2 и Microsoft SQL Server.

Информационные ресурсы корпорации могут распределяться на различных её компьютерах, что особенно характерно для территориально удалённых подразделений корпорации. В этом случае поверх Интернета организуется так называемая VPN (англ. «Virtual Private Network» – виртуальная локальная сеть) корпорации, а внутренние подсети связывают с помощью серверов доступа. Такой метод работы называется технологией Интернет/Интранет. Для групповых и корпоративных систем существенно повышаются требования к надёжности функционирования и сохранности данных. Эти свойства обеспечиваются поддержкой целостности данных, ссылок и транзакций в серверах баз.

Близкой к предыдущей является классификация АИС по способу организации, в которой групповые и корпоративные информационные системы подразделяются на системы, созданные на основе:

·     архитектуры файл-сервер;

·     архитектуры клиент-сервер;

·     многоуровневой архитектуры;

·     Интернет/Интранет-технологий.

 

В дополнение к сказанному отметим следующее.

Архитектура файл-сервер только извлекает данные из файлов так, что дополнительные пользователи и приложения добавляют лишь незначительную нагрузку на центральный процессор. Каждый новый клиент добавляет вычислительную мощность к сети.

Архитектура клиент-сервер предназначена для решения проблем файл-серверных приложений путём разделения компонентов приложения и размещения их там, где они будут функционировать наиболее эффективно. Особенностью архитектуры клиент-сервер является использование выделенных серверов баз данных, понимающих запросы на языке структурированных запросов SQL (англ. «Structured Query Language»), выполняющих поиск, сортировку и агрегирование информации.

Подобная организация работы повышает эффективность выполнения приложений за счет использования возможностей сервера БД, разгрузки сети и обеспечения контроля целостности данных.

Многоуровневая архитектура стала развитием архитектуры клиент-сервер и в своей классической форме состоит из трех уровней:

·        нижний уровень – представляет приложения клиентов, имеющие программный интерфейс для вызова приложения на среднем уровне;

·        средний уровень – представляет сервер приложений;

·        верхний уровень – представляет удалённый специализированный сервер базы данных.

 

Масштаб применения АИС определяется уровнем организации и решаемых ей задач, территориальным расположением организации и её филиалов, спектром информационного обслуживания, объёмом информационных потоков и массивов. В этом случае АИС делятся на системы для:

·        организации или её подразделения;

·        локальных (региональных или отраслевых) структур;

·        глобальных (межотраслевых, межрегиональных) служб.

 

Последние служат для предоставления удалённым пользователям доступа к информации по телекоммуникационным сетям.

 

По направлению деятельности различают:

·        производственные системы;

·        административные системы (человеческих ресурсов);

·        финансовые и учётные системы;

·        системы маркетинга.

 

Производственные системы подразделяются на:

·        автоматизированные системы управления производством;

·        автоматизированные системы управления технологическими процессами;

·        автоматизированные системы управления техническими средствами.

 

По сфере применения автоматизированные информационные системы обычно подразделяются на:

·        системы обработки транзакций;

·        системы принятия решений;

·        организации управления;

·        управления технологическими процессами;

·        автоматизированного проектирования;

·        интегрированные (корпоративные);

·        информационно-справочные системы;

·        офисные информационные системы.

 

Рассмотрим их.

Системы обработки транзакций (англ. «On-Line Transaction Processing», OLTP) преобладают в информационных системах организационного управления для отражения актуального состояния предметной области в любой момент времени. Для них характерен регулярный интенсивный поток довольно простых транзакций, играющих роль заказов, платежей, запросов и т.д. Важнейшими требованиями для OLTP систем являются:

·        высокая производительность обработки транзакций;

·        гарантированная доставка информации при удалённом доступе к БД по телекоммуникациям.

 

По оперативности обработки данных системы обработки транзакций делятся на пакетные информационные системы и оперативные информационные системы. В АИС организационного управлений преобладает режим оперативной обработки транзакций, для отражения актуального состояния предметной области в любой момент времени, а пакетная обработка занимает весьма ограниченную часть.

Системы принятия решений – это почти всегда интерактивные компьютерные системы, разработанные для оказания помощи специалисту или руководителю в принятии решений. Они представляют собой другой тип АИС, в которых с помощью довольно сложных запросов производится отбор и анализ данных в различных разрезах (временных, географических и по другим показателям). Обычно выделяют три типа таких систем: генерации отчётoв, поддержки принятия решений и поддержки принятия стратегическиx решений.

Системы генерации отчётов (англ. «Information Reporting Systems», IRS) наиболее распространенны среди управленческих информационных систем и обычно предназначены для удовлетворения ежедневных потребностей конечных пользователей с целью принятия ими необходимых решений. С их помощью по заранее сформированным формам производят различные виды отчётов. Системы генерации отчётов выбирают необходимую информацию о процессах внутри фирмы из баз данных, подготовленных производственными информационными системами, и информацию об окружении из внешних источников.

Системы поддержки принятия решений (англ. «Decision Support System», DSS) являются развитием систем генерации отчётов и систем обработки транзакций. Они обслуживают частично структурированные задачи, результаты которых трудно спрогнозировать заранее.

Если системы обработки транзакций, предназначены для сбора исходных, как правило специфических, данных, то системы поддержки принятия решений представляют интерактивные АИС, использующие модели решений и специализированные базы данных для принятия управленческих решений. Они в интерактивном режиме обеспечивают информацией конечных пользователей по их требованию.

Системой поддержки принятия решений (СППР) называется АИС, предназначенная для автоматизации деятельности конкретных должностных лиц при выполнении ими своих должностных (функциональных) обязанностей в процессе управления персоналом и (или) техническими средствами.

Различают четыре вида СППР:

1) руководителя (СППР Р);

2) должностного лица аппарата управления (СППР 0);

3) оперативного дежурного (СППР Д);

4) оператора (СППР Оп).

 

СППР позволяют осуществлять аналитическое моделирование, предоставляют пользователю гибкие инструменты поиска и разнообразного представления необходимых ему данных. В них можно задавать вопрос, например, «что если?» и интерактивно получать ответ на него.

Вариантом DSS являются системы поддержки работы группы (англ. «Group Support Systems», GSS), предназначенные для поддержки работы группы, а не индивидуума. GSS, иногда называемые системами поддержки принятия решений группы или системами электронных встреч, ориентированы на использование преимуществ возможностей группы находить лучшие решения. Это специализированный тип группового ПО, предназначенный для поддержки встреч.

Разновидностью АСУ и СППР, используемых для обеспечения научных исследований и разработок, а также в случаях, когда выработка управленческих решений должна опираться на сложные вычисления, являются автоматизированные информационно-вычислительные системы. Они позволяют производить сложные математические расчёты, требующие больших объёмов разнообразной информации.

АИС организационного управления предназначены для автоматизации функций управленческого персонала как промышленных предприятий, так и непромышленных объектов (гостиниц, банков, магазинов и др.). Учитывая наиболее широкое применение и разнообразие этого класса систем, часто любые информационные системы понимают именно в данном толковании.

Автоматизированная система управления представляет собой АИС, предназначенную для автоматизации всех или большинства задач управления, решаемых коллективным органом управления (министерством, дирекцией, правлением, службой, группой управления и т.д.). В зависимости от объекта управления различают АСУ персоналом, технологическими процессами (АСУ ТП) и АСУ техническими средствами (АСУТС).

АСУТП обеспечивает автоматизированную переработку информации необходимой для управления организацией в повседневной деятельности, а также при подготовке и реализации программ развития.

АИС управления технологическими процессами служат для автоматизации функций производственного персонала по контролю и управлению производственными операциями. Они широко используются при организации поточных линий, изготовлении микросхем, на сборке, для поддержания технологического процесса в металлургической и машиностроительной промышленности. В таких системах обычно предусматривается наличие развитых средств измерения параметров технологических процессов (температуры, давления, химического состава и т.п.), процедур контроля допустимости значений параметров и регулирования технологических процессов.

АСУТС предназначены для реализации соответствующих технологических процессов. Они являются перёдаточным звеном между должностными лицами, осуществляющими управление техническими системами, и самими техническими системами. АСУТС нашли широкое распространение во всех развитых государствах, поскольку управление существующими новейшими технологическими процессами без их применения становится практически невозможным. Это же касается АСУТП и АСУ персоналом.

Основными функциями подобных систем являются: оперативный контроль и регулирование, оперативный учёт и анализ, перспективное и оперативное планирование, бухгалтерский учёт, управление сбытом, снабжением и другие экономические и организационные задачи.

ИС автоматизированного проектирования (САПР) предназначены для автоматизации деятельности подразделений проектной организации или коллектива специалистов в процессе разработки проектов изделий на основе применения единой информационной базы, математических и графических моделей, автоматизированных проектных и конструкторских процедур.

САПР является одной из систем интегральной автоматизации производства, обеспечивающих реализацию автоматизированного цикла создания нового изделия от предпроектных научных исследований до выпуска серийного образца. Основными функциями подобных систем являются: инженерные расчёты, создание графической документации (чертежей, схем, планов), создание проектной документации, моделирование проектируемых объектов. Для создания программного обеспечения применяются CASE-системы.

 

Интегрированные АИС.

Интеграция информационных систем обусловлена двумя основными факторами:

1) потребностью сокращения дублетной информации и эффективного применения связанных между собой отдельных АИС организации;

2) сетевым, и, как правило, распределённым, использованием АИС.

 

Интегрированные АИС в основном предназначены для эффективного управления производственными и информационными процессами, как правило, крупных, а порой и средних предприятий. В общем случае в состав интегрированных АИС могут входить подсистемы:

1.      управления ресурсами предприятия (например, ERP-система);

2.      управления распределённой логистикой (например, SCM-система);

3.      управления данными об изделиях на производственных предприятиях (например, PDM);

4.      документооборота (например, «docflow»);

5.      организации рабочего пространства (например, «workflow»);

6.      Интернет/Интранет сред;

7.      электронной коммерции (e-commerce);

8.      управления информационными ресурсами;

9.      data warehouse;

10. извлечения данных («data mining»);

11. анализа данных OLAP;

12. представления данных для анализа руководством (например, MIS), а также иные подсистемы предназначенные для решения частных задач.

 

Для управления интегрированной информационной системой, включающей в себя несколько баз данных, используют различные СУБД, например, Oracle.

Интегрированные (корпоративные) АИС используются для автоматизации всех функций организации и охватывают весь цикл работ от планирования деятельности до сбыта продукции или предоставления услуг. Они включают в себя ряд модулей (подсистем), работающих в едином информационном пространстве и выполняющих функции поддержки соответствующих направлений деятельности.

Создание таких систем весьма затруднительно, поскольку требует системного подхода с позиций главной цели, например получения прибыли, завоевания рынка сбыта и т.д. Такой подход может привести к существенным изменениям в самой структуре организации, на что может решиться не каждый управляющий. Подобные системы относят к системам управления корпорациями, или к системам планирования ресурсов предприятия ERP (англ. «Enterprise Resources Planning Systems»).

 

Автоматизированные информационно-справочные системы.

Автоматизированные информационно-справочные системы (АИСС) предназначены для сбора, хранения, поиска и выдачи в требуемом виде потребителям информации справочного характера. В зависимости от характера работы с информацией различают следующие виды АИСС:

·   автоматизированные архивы (АА);

·   автоматизированные системы делопроизводства (АСД);

·   автоматизированные справочники (АС) и картотеки (AK);

·   автоматизированные системы ведения электронных карт местности и др.

 

АИСС формируются с использованием технологий баз данных и для их создания как правило, не требуется высокопроизводительная вычислительная техника,

Существует множество разновидностей АИСС. Простота создания и высокий положительный эффект применения определили их активное использование во всех сферах профессиональной (в том числе и управленческой) деятельности.

Обширный класс информационно-справочных систем нашедших развитие в Интернете основан на гипертекстовых документах и мультимедиа.

Гипертекстовые информационно-справочные системы относятся к классу гипертекстовых систем, позволяющих пользователям по гиперссылкам легко и непринужденно находить нужные им тексты, документы, фрагменты документов, термины, графические и иные объекты.

 Мультимедийные информационно-справочные системы представляют собой совокупность логически связанных текстовых, графических, аудио- и видеоматериалов. Они широко применяются в Интернет/Интранет структурах и обеспечивают доступ к базам данных на Веб сайтах и Веб-серверах.

Класс офисных информационных систем достаточно широк. В основном он включает ПО автоматизации делопроизводства и управления документооборотом, а также различные пакеты прикладных программ.

В зависимости от характера обработки данных АИС делятся на информационно-поисковые и информационно-решающие, управляющие и советующие.

Информационно-поисковые системы позволяют осуществлять ввод, систематизацию, хранение, выдачу информации по запросу пользователя без сложных преобразований данных. Например, АИС библиотечного обслуживания, резервирования и продажи билетов на транспорте, бронирования мест в гостиницах и др.

Информационно-решающие системы осуществляют, кроме того, операции переработки информации по определённому алгоритму.

По характеру использования выходной информации такие системы принято делить на управляющие и советующие.

Результирующая информация управляющих АИС непосредственно трансформируется в принимаемые человеком решения. Для этих систем характерны задачи расчётного характера и обработка больших объёмов данных, например, АИС планирования производства или заказов, бухгалтерского учёта.

Управляющие информационные системы вырабатывают информацию, на основании которой человек принимает решение. Для этих систем характерен тип задач расчётного характера и обработка больших объёмов данных. Примером могут служить системы оперативного планирования выпуска продукции, бухгалтерского учёта и т. п.

Советующие АИС вырабатывают информацию, которая принимается человеком к сведению и учитывается при формировании управленческих решений, а не инициирует конкретные действия. Эти системы имитируют интеллектуальные процессы обработки знаний, а не данных, например, экспертные системы медицинские информационные системы для постановки диагноза больному и определения предполагаемой процедуры лечения. При этом врач может принять к сведению полученную информацию и предложить иное решение.

По характеру хранимой информации ИС делятся на фактографические и документальные. О них рассказывалось в предыдущих параграфах. Кроме того, выделяют мультимедийные, геоинформационные и иные ИС. О мультимедийных АИС сказано выше.

Геоинформационная система (географическая информационная система, ГИС) – это автоматизированная информационная система, предназначенная для обработки пространственно-временных картографических данных, основой которых служит географическая информация; это также автоматизированная информационная система, предназначенная для картографирования и анализа существующих объектов (естественных и искусственных) и событий (явлений), которые происходят на Земле.

 

Автоматизированные системы информационного обслуживания.

В процессе развития автоматизированных информационных и информационно-поисковых систем сформировались три вида информационного обслуживания документальное, фактографическоя и концептографическое. Каждому из этих видов соответствует своя информационная система.

Документальная система в течение многих веков обеспечивает информационное обслуживание общества, в том числе науки, образования и техники. Такие системы отличаются неопределённостью или переменной структурой данных (документов: книги, статьи и другие информационные материалы). Для их разработки обычно применяют оболочки АИС.

При документальном обслуживании информационные потребности удовлетворяются путём предоставления потребителям первичных документов, необходимые сведения из которых потребители извлекают сами. Обычно такое обслуживание осуществляется в два этапа. Сначала потребителю предоставляется некоторая совокупность релевантных его запросу вторичных документов (библиографический этап), а затем, после отбора потребителем из этой совокупности определённого числа уже пертинентных[6] документов, ему предоставляют сами документы (этап библиотечного обслуживания). Таким образом, потребность в информации при документальном обслуживании удовлетворяется опосредовано, через первичный документ.

Фактографические АИС обычно используют табличные реляционные БД с фиксированной структурой данных (записей). Хранимая и обрабатываемая в них информация представляет собой сведения фактического характера (справочные, статистические, социальные данные и т.п.). Часто эта информация требует оперативного обновления.

В отличие от документального фактографическое обслуживание предполагает удовлетворение информационных потребностей непосредственно, то есть путём представления потребителям самих сведений (отдельных данных, фактов, концепций). Эти сведения, также релевантные запросам потребителей, предварительно извлекаются информационными работниками из первичных документов и после определённой их обработки (оформления) представляются потребителям.

Если в случае документального и фактографического обслуживания потребителю информации предоставляются документы или сведения, извлечённые из информационного потока, то при концептографическом обслуживании эти документы и сведения подвергаются интерпретации, оценке, обобщению со стороны информационного работника. В результате такой интерпретации формулируется так называемая ситуативная информация, содержащая в себе оценку рассматриваемых сведений, тенденций и перспективы развития отдельных научных и технических направлений, рекомендаций и пр.

По этой причине под концептографическим обслуживанием можно также понимать формулирование и доведения до потребителей ситуативной информации, в явном виде не содержащейся в анализируемых источниках, а полученной в результате информационно-логического и концептографического анализа некоторой совокупности сообщений. Другими словами, в случае концептографического обслуживания потребителю представляются не только сведения о документе или сами сведения из документа, но и некоторая дополнительная информация, привнесенная информационным работником в процессе их интерпретации.

По сути дела каждая из разновидностей обслуживания сводиться к созданию своего ряда вторичных документов и доведению их до потребителя различными средствами и в различных режимах информационного обслуживания.

Существуют и иные классификации АИС. Так, АИС в зависимости от уровня обслуживания производственных процессов на предприятии можно отнести к трём классам:

Класс A системы (подсистемы) управления технологическими объектами и (или) процессами.

Класс B системы (подсистемы) подготовки и учёта производственной деятельности предприятия.

Класс C системы (подсистемы) планирования и анализа производственной деятельности предприятия.

Системы (подсистемы) класса A, предназначенны для контроля и управления технологическими объектами и (или) процессами и, как правило, характеризуются следующими свойствами:

·    высоким уровнем автоматизации выполняемых функций;

·    наличием явно выраженной функции контроля за текущим состоянием объекта управления;

·    наличием контура обратной связи;

·    малым интервалом времени для обработки данных;

·    слабой временной зависимостью (корреляцией) между динамически изменяющимися состояниями объектов управления и системы (подсистемы) управления.

 

Объектами контроля и управления такой системы выступают:

·    технологическое оборудование;

·    датчики;

·    исполнительные устройства и механизмы.

 

Примерами систем класса A являются: SCADA (англ. «Supervisory Control And Data Acquisition» – диспетчерский контроль и накопление данных), DCS (англ. «Distributed Control Systems» – распределённая система управления), Batch Control (система последовательного управления), АСУ ТП – автоматизированная система управления технологическими процессами и др.

Системы (подсистемы) класса B используются для подготовки и учёта производственной деятельности предприятия. С их помощью выполняют задачи, требующие непосредственного участия человека для принятия оперативных решений, влияющих на ограниченный круг видов деятельности или небольшой период работы предприятия. Такие системы могут быть напрямую не связанными с технологией. Они включают задачи, связанные:

·   с выполнением возникающих в деятельности предприятия учётных задач;

·   со сбором, предварительной подготовкой поступающих в АИС данных из систем класса A, и их передачей в системы класса C;

·   с подготовкой данных и заданий для автоматического исполнения задач системами класса A.

 

С учётом прикладных функций системы класса В могут осуществлять:

·   управление производственными и человеческими ресурсами в рамках принятого технологического процесса;

·   планирование и контроль последовательности операций единого технологического процесса;

·   управление качеством продукции;

·   управление хранением исходных материалов и произведенной продукции по технологическим подразделениям;

·   управление техническим обслуживанием и ремонтом.

 

Примерами таких систем являются: MES (англ. «Manufacturing Execution Systems» – система управления производством), MRP (англ. «Material Requirements Planning» – система планирования потребностей в материалах), MRP II (англ. «Manufacturing Resource Planning» – система планирования ресурсов производства), CRP (англ. «Computing Resource Planning – система планирования производственных мощностей), CAD (англ. «Computing Aided Design» – автоматизированная система проектирования, САПР), CAM (англ. «Computing Aided Manufacturing» – автоматизированная система поддержки производства), CAE (англ. «Computing Aided Engineering» – автоматизированная система инженерного проектирования, САПР), PDM (англ. «Product Data Management» – автоматизированная система управления данными), SRM (англ. «Customer Relationship Management» – система управления взаимоотношениями с клиентами), различные учётные системы и т. п.

Системы (подсистемы) класса C ориентированы на планирование и анализ производственной деятельности предприятия. Они предназначены для выполнения задач, требующих непосредственного участия человека для принятия стратегических решений, оказывающих влияние на деятельность предприятия в целом.

Эти системы решают следующие задачи:

·    анализа деятельности предприятия на основе данных и информации, поступающей из систем класса B;

·    планирования деятельности предприятия;

·    регулирования глобальных параметров работы предприятия;

·    планирования и распределения ресурсов предприятия;

·    подготовки производственных заданий и контроль их исполнения;

·    взаимодействия с управляющим субъектом (персоналом), при выполнении стоящих перед ними задач;

·    интерактивной обработки информации;

·    связанные с повышенной длительностью обработки данных (от нескольких минут до несколько часов или суток);

·    связанные с длительным периодом принятия управляющего решения;

·    связанные с наличием существенных временной и параметрической зависимостей (корреляций) между обрабатываемыми данными;

·    связанные с влиянием на деятельность предприятия в целом;

·    оказывающие влияние на значительный период работы предприятия (от полугода до нескольких лет);

·    непосредственного сопряжения с системами класса B.

 

К ним относятся: ERP (англ. «Enterprise Resource Planning» – планирование ресурсов предприятия), IRP (англ. «Intelligent Resource Planning» – системы интеллектуального планирования), АСУП и др.

Интеллектуальная информационная система (ИИС) является информационной системой, основанной на концепции использования базы знаний для генерации алгоритмов решения задач различных классов в зависимости от конкретных информационных потребностей пользователей.

Для поддержки управления в основном ныне применяют два последних направления: экспертные системы, использующие логику принятия решения человеческого эксперта и нейронные сети, устроенные по аналогии с характером работы человеческой нервной системы и использующие статистический анализ для распознавания искомой модели из большого количества информации посредством адаптивного изучения.

Экспертные системы (ЭС, англ. «Expert Systems») – это компьютерные программы, созданные для выполнения тех видов деятельности, которые под силу человеку-эксперту. Они работают таким образом, что имитируют образ действий человека-эксперта, существенно отличаются от точных, хорошо аргументированных алгоритмов и не похожи на математические процедуры большинства традиционных разработок.

Такие системы способны дать оценку ситуации и спрогнозировать её развитие на основе заложенных в такую систему фактических данных и связывающих их общих закономерностей. Например, медицинская экспертная система на основе данных анализов и клинических проявлений может поставить диагноз, дать прогноз и рекомендовать схему лечения.

Классическим примером экспертной системы стала MYCIN, созданная в Стенфордском университете (Stanford University, США) в середине 1970-х годов для диагностики обращений по болезням крови и менингита. Существуют экспертные системы по военному делу, геологии, инженерному делу, информатике, космической технике, математике, метеорологии, промышленности, сельскому хозяйству, управлению, физике, химии, электронике, юриспруденции и т.д. Только то, что экспертные системы весьма сложны, дороги и узкоспециализированы, сдерживает их распространение. Организация Объединенных Наций (ООН) использует экспертную систему Entitlements System для объяснения комплексных норм жалованья всех служащих Секретариата ООН во всем мире. Плата служащих ООН определяется на основе жалованья плюс прибавки, а прибавки включают выгоды, формируемые на месте работы, плюс другие договорные соглашения.

В экспертных системах опыт людей включается в соответствующую компьютерную программу, а нейронные сети создаются для формирования значимых моделей из большого количества данных.

 

Автоматизированные системы обучения.

Традиционные методы обучения обладают рядом недостатков, например, пассивный характер устного изложения, трудность организации активной работы студентов, невозможность учёта в полной мере индивидуальных особенностей отдельных обучаемых и др. Одним из путей преодоления этих трудностей является использование АИС, предназначенных для автоматизации подготовки специалистов с участием или без участия преподавателя и обеспечивающих обучение, подготовку учебных курсов, управление процессом обучения и оценку его результатов.

Обучающие АИС используют при подготовке специалистов в системе образования, при переподготовке и повышении квалификации работников разных отраслей. Среди многообразия таких АИС выделяют автоматизированные системы управления образованием, программированного обучения (АСПО), обеспечения деловых игр (АСОДИ), а также тренажеры, тесты и др.

Информационные системы управления образованием включают подсистемы управленческого и учётно-расчётного характера, связанные с кадровыми, финансовыми, правовыми, учебными (абитуриенты, студенты, деканаты и кафедры), библиотечными и иными программами.

АСПО ориентированы, в основном, на теоретическое обучение по разделам курсов и дисциплин, заранее подготовленных квалифицированными преподавателями. Учебный материал делится на порции (дидактические единицы), для каждой из которых указывается возможная реакция обучаемого. В зависимости от ответов обучаемого на поставленные вопросы (тестирование и выполнение практических работ) АСПО может формировать очередную дозу представляемой информации. Наибольшая сложность создания таких систем заключается в разработке материалов компьютерного курса для конкретной дисциплины.

АСОДИ предназначены для подготовки и проведения деловых игр, заключающихся в имитации принятия индивидуальных и групповых решений в различных проблемных ситуациях путём игры по заданным правилам.

Тренажёры предназначены для обучения практическим навыкам работы на конкретных рабочих местах. Они являются средствами индивидуального и группового обучения. Создание таких систем требует больших затрат времени и средств. Однако такие системы высокоэффективны при обучении специалистов, например, летчиков, водителей, операторов систем управления и др.

 

Контрольные вопросы

 

1.        По каким основаниям можно классифицировать автоматизированные информационные системы?

2.        Что представляют собой автономные АИС?

3.        Сколько может быть уровней (слоёв) у сетевой АИС?

4.        На какие виды делят АИС по масштабу?

5.        Что представляют собой корпоративные АИС?

6.        На какие виды делят АИС по способу организации?

7.        Как определяется масштаб применения АИС?

8.        На какие виды делят АИС по направлению деятельности?

9.        На какие виды делят АИС по сфере применения?

10.    Что представляют собой автоматизированная система управления?

11.    Что представляют собой интегрированные АИС и какие подсистемы могут входить в их состав?

12.    Какие выделяют виды автоматизированных информационно-справочных систем в зависимости от характера работы с информацией?

13.    На какие виды делятся АИС в зависимости от характера обработки данных?

14.    Виды и особенности автоматизированных систем информационного обслуживания?

15.    Назовите и охарактеризуйте три класса АИС в зависимости от уровня обслуживания производственных процессов на предприятии.

16.    Дайте определение понятия «Интеллектуальная информационная система».

17.    В чем заключается понятие «Автоматизированная система обучения»?

 

 

9. Области применения информационных систем

 

Современные автоматизированные информационные системы применяются практически в любых сферах, средах и областях жизнедеятельности людей и обеспечивают эффективное их обслуживание. Обобщенно эти сферы и среды называют предметными областями.

Особенность предметной области оказывает влияние на функциональность используемых в ней систем. Так, предметная область любой науки определяется (как это принято в философии и науковедении) не только областью действительности, изучаемой этой наукой, но и методологией, методами исследования этой области.

Локальные задачи отдельных пользователей, объединений и организаций обычно решаются с помощью широко представленного на рынке стандартного программного обеспечения. Оно может быть ориентировано на автоматизацию офисов, их делопроизводства и бухгалтерского учёта, складской деятельности, обучение, управления персоналом, на решение кадровых и многих иных задач.

В большинстве случаев АИС связаны с обеспечением управления и принятием управленческих решений в различных предметных областях и базируются на компьютерных программно-технических средствах и технологиях.

В экономике их используют при решении профессиональных задач, в том числе связанных с моделированием и прогнозированием производственных процессов.

В научной среде взаимодействие учёных и специалистов (научные коммуникации) осуществляется с помощью «интеллектуальных порталов», общих баз данных, знаний экспертов (экспертные системы), форумов, теле- и видеоконференций и т.п.

В социокультурной сфере информационные системы способствуют положительному воздействию на пользователей, вызывая у них чувства причастности к современным, в том числе внутригосударственным и общемировым, процессам. В этой сфере находят широкое применение компьютерные системы, связанные со средствами массовой информации: радио, телевидением и средствами коммуникации. Сюда же приходится причислить и несанкционированные, неправовые и иные негативно воздействующие на различные стороны жизнедеятельности людей, которые всё чаще причисляют к элементам информационных войн.

Одной из основных проблем управления крупным предприятием с распределённой структурой является организация обмена информацией между удалёнными подразделениями. Решить данную проблему предприятия чаще всего пытаются путём сбора регулярной отчётности от удалённых подразделений в центральный офис. Однако такой способ имеет ряд недостатков:

·    отсутствие возможности разностороннего анализа, так как информация предоставляется в виде сводных отчётов установленной формы и детализировать её произвольным образом невозможно;

·    низкая оперативность предоставления информации, поскольку на подготовку, сбор и сведение данных требуется много времени;

·    риск получения недостоверной информации, так как иногда подразделения стремятся показать состояние лучше, чем есть на самом деле, особенно если от этого зависит их финансирование;

·    несогласованность информации и сложность получения консолидированной отчётности из-за отсутствия общей методики учёта в подразделениях (например, отсутствует единый классификатор номенклатуры, план счетов или схема проводок).

 

Наличие во всех подразделениях одинаковой программы для автоматизации учёта не исключает указанных недостатков, поскольку информация в этом случае хранится в несвязанных базах данных, хотя и в одинаковом формате.

Другим вариантом, может быть вынесение всех учётных функций в центральный офис, например, создание централизованной бухгалтерии. В этом случае достигается полнота информации (до первичных документов), но не достигается оперативность её получения (необходимо доставлять бумажные документы в центральный офис) и её достоверность (вносят данные люди, не отвечающие за выполнение операции; кроме того, документы в процессе доставки могут теряться). Также при этом варианте возрастает штат управления.

Таким образом, именно в условиях распределённого предприятия очень важным построение целостной информационной системы управления с единой базой данных. В процессе внедрения такой системы создаётся единая методология учёта, появляется возможность гибкого распределения функций между центральным офисом и удалёнными подразделениями, повышается достоверность и оперативность информации. Остается решить проблему организации передачи данных.

Самым современным и популярным вариантом связи уделённых рабочих мест является Интернет. Кроме удобства, такой вариант имеет и недостатки. Интернет предназначен в основном для поиска и анализа информации, а не для ввода большого количества данных со сложной структурой (например, накладных, путевых листов и других документов). Кроме того, если долгое ожидание или обрыв соединения в процессе поиска информации не критичны, то необходимость повторного ввода большого документа или задержка заказчика при выписке счёта не повысят эффективность деятельности организации.

Репликация обеспечивает целостную работу удалённых частей информационной системы (серверов подразделений) в режиме сеансов связи (off-line) с минимальными требованиями к качеству и типам связи (для худшего случая поддерживается передача данных на магнитных носителях). Между сеансами связи каждое подразделение работает независимо, а частота сеансов определяется потребностями конкретной организации в актуализации данных (от одного раза в сутки до одного раза в час). Единство распределённой системы обеспечивается контролем за логической целостностью и согласованностью оперативных данных и нормативно-справочной информации. Причём целостность отслеживается в понятиях системы (документ, справочник), а не просто в элементах базы данных (запись, таблица).

Поскольку структура распределенного предприятия может быть многоуровневой, в АИС может потребоваться поддерживать многосерверную распределённую работу с иерархической структурой удалённых серверов, например, так работает АИС «Бизнес Люкс». В этом случае центральный сервер содержит согласованные данные всей системы. Распределение данных по вторичным серверам и права доступа к ним гибко настраиваются администратором в соответствии с распределением бизнес-процесов между территориально удалёнными подразделениями и центральным офисом. В таком случае для территориально-распределённых организаций можно создавать масштабируемые АИС, делать бизнес-процессы этих организаций прозрачными, то есть легко контролируемыми и эффективно управляемыми.

Рассмотрим основные сферы применения АИС.

 

Стратегические АИС.

Развитие и успех любой организации во многом определяются принятой в ней стратегией. Под стратегией понимается набор методов и средств решения перспективных долгосрочных задач. В этом контексте можно воспринимать и понятия стратегический метод, стратегическое средство, стратегическая система.

Переход к рыночным отношениям способствовал коренному изменению во взглядах на АИС. Они стали расцениваться как стратегически важные, влияющие на изменение выбора целей организации, её задач, методов, продуктов, услуг, позволяющие налаживать тесное взаимодействие потребителей с поставщиками и др.

Стратегическая информационная система обеспечивает поддержку принятия решений для реализации перспективных стратегических целей развития организации. Известны ситуации, когда новое качество АИС заставляло изменять не только структуру, но и профиль организаций, содействуя их процветанию. Однако такое решение может вызывать нежелательную психологическую обстановку, связанную с тем, что автоматизация некоторых функций и видов работ может негативно повлиять на часть работающих.

 
Информационные системы управления.

АИС обеспечения управления и принятия управленческих решений в различных предметных областях ориентированы на удовлетворение информационных потребностей сотрудников организации, имеющих дело с выполнением работ и принятием решений. Данные системы могут использоваться на любом уровне управления, и ориентированы на работу в среде управления, в том числе при плохой структурированности решаемых задач.

АИС управления позволяют создавать различные календарные виды разрабатываемым в организации отчётов. Они обычно включают экспертные системы, системы представления знаний, телекоммуникационные системы, системы автоматизации офисной деятельности и др.

При управлении различными видами ресурсов используются и системы управления проектами, включающие системы интеллектуального и автоматизированного проектирования (например, CASE-технологии) и совершенствования управления.

В АИС управления применяют технологии баз и банков данных. Используемые при этом базы данных включают:

1) данные, накапливаемые на основе оценки проводимых операций;

2) планы, стандарты, бюджеты и другие нормативные документы, определяющие планируемое состояние объекта управления.

 

Отдельное место в системах управления и принятия решений отводится системам управления объектами.

АИС поддержки принятия решений базируются на информационных технологиях управления, включающих распределённые базы и банки данных. Эффективность и гибкость таких систем во многом зависит от характеристик интерфейса системы поддержки принятия решений. С этой же целью используют и экспертные системы.

 

Экспертные АИС.

Решение специальных задач требует специальных знаний. Информационные экспертные АИС, позволяют специалистам оперативно получать консультации экспертов по соответствующим проблемам. То есть технологию экспертных систем удобно использовать как систему информационных консультантов (советников). В результате использования таких систем, в них формируются и накапливаются новые знания, то есть развивается заложенная в них система знаний.

Экспертной системой называют систему искусственного интеллекта, построенную на основе высококачественных специальных знании о некоторой предметной области (полученных от экспертов – специалистов этой области).

Экспертные системы, как и системы поддержки принятия решений, используются для формирования высокого уровня поддержки принятия решений. И те и другие предназначены для информационного обеспечения процессов принятия управленческих решений на основе применения экономико-математического моделирования и принципов искусственного интеллекта. Поэтому экспертные системы порой называют системами представления знаний или интеллектуальными информационными системами.

В стандартных системах управления предприятием, экспертные, а также аналитические системы позволяют динамично решать возникающие задачи и помогать в принятии решений и в прогнозировании ситуации. Использование информационно-аналитических систем стало особенно актуальным для организаций, в которых важную роль играет процесс анализа и принятия стратегических решений. ИАС обеспечивает выполнение различных функций при работе с информационными массивами: ввода и накопления информации, её рубрикации и индексирования, выделения семантических структур, полнотекстового и атрибутивного поиска, аналитической обработки данных, формирования справок, отчётов и др. В отличие от обычных баз данных хранилища ИАС содержат обработанное, упорядоченное и понятное руководителям представление данных.

Использование в организациях информационно-аналитических систем связано, в первую очередь, их стремлением повысить качество деловой информации, реорганизовать бизнес-процессы, необходимостью поддержки стратегического планирования и достижения высокоэффективных решений. Специалисты выделяю три типа основных систем, используемых для решения подобных задач:

1. МIS-системы (англ. «Management Information Systems»), позволяющие в соответствии с возникшей ситуацией получать в удобной форме и к нужному моменту времени необходимую информацию с учётом её прошлого, настоящего и будущего.

2. DSS-системах (англ. «Decision Support Systems»), предназначенные для интеллектуального обеспечения процессов принятия решений, то есть ориентированые на поддержку принимаемых решений.

3. OLAP (англ. «On-Line Analytical Processing») – системы аналитической обработки данных в режиме реального времени.

 

Семантические или интеллектуальные системы обычно предназначаются для поиска, анализа, отображения и обобщения информации с использованием всевозможных связей между объектами. Они обладают богатыми возможностями облегчения интеллектуального труда, например, при составлении энциклопедий, справочников.

Идея искусственного интеллекта (AI) связана с изучением возможностей использования компьютеров в этой сфере. AI-исследования развились в пять отдельных, но связанных областей: естественные языки, робототехника, системы ощущения (системы зрения и слуха), экспертные системы и нейронные сети. Существуют интеллектуальные информационно-поисковые системы (ИИПС). От ИПС они отличаются не только более обширным справочно-информационным фондом, но, главное, способностью формировать адекватные ответы на запросы пользователя и тогда, когда запросы не носят прямого характера. Таким образом, ИИПС понимают недостаточно чётко сформулированные вопросы.

Разновидностью интеллектуальной информационной системы являются нейронные сети.

Нейронные сети (англ. «Neural Networks») могут обучаться, распознавать неясные для людей модели и адаптировать их при получении новой информации. Сначала программе нейронных сетей даётся набор много переменных данных, связанных с большим количеством случаев, или исходов, результаты которых известны. Программа анализирует данные и обрабатывает все корреляции, выбирает набор переменных, строго соотнесённых с частными известными результатами, в качестве начальной модели. Эта начальная модель используется для попытки предсказания результатов различных случаев. При этом предсказанные результаты сравниваются с известными. На основе полученных результатов программа изменяет модель, регулируя параметры переменных, а порой и заменяя их. С целью улучшения прогнозирующей способность при наладке модели этот процесс повторяется многократно. Когда при таком итерационном подходе дальнейшее усовершенствование исчерпывается, программа предсказывает будущие случаи. Если в систему поступает новое большое количество случаев, эти данные вводятся в нейронную сеть, и модель корректируется. Нейронная сеть обучается в основном относительно причинно-следственных моделей из этих дополнительных данных, и прогнозирующая способность улучшается.

Подобные системы применяются в банках и других предметных областях. Так, Bank of America использует нейронную сеть для оценки коммерческих заявок на получение ссуды, а American Express – чтобы читать почерк на кредитной карте. Журнал Spiegel, создающий каталоги для продажи по почте, использует нейронную сеть как способ сокращения списка рассылки для исключения тех, кто, маловероятно, закажет журнал снова.

Офисные АИС нацелены на перевод бумажных документов в электронный вид, автоматизацию бухгалтерии, кадров, делопроизводства и т. п. К нему также примыкают различные пакеты прикладных программ. Информационные системы офисной автоматизации вследствие своей простоты и многопрофильности активно применяются работниками любого организационного уровня. Основная цель использования данных АИС – обработка данных, повышение эффективности работы и упрощение канцелярского труда. Эти АИС связывают работников в разных регионах, помогают поддерживать отношения с покупателями, заказчиками и другими организациями. Их деятельность в основном охватывает управление документацией, коммуникации, составление расписаний и т.д. Такие системы выполняют следующие функции:

·    обработка текстов на компьютерах с помощью различных текстовых процессоров;

·    производство высококачественной печатной продукции;

·    архивация документов;

·    электронные календари и записные книжки для ведения деловой информации;

·    электронная и аудиопочта;

·    видео- и телеконференции и др.

 

Автоматизированные информационно-справочные системы.

С точки зрения пользователей, обычно обращение их к любым информационным системам обусловлено желанием или потребностью получения оперативных данных, как правило, справочного характера, а также постоянного или временного пользования документами. Подобные системы предназначены для удовлетворения запросов пользователей. Найденная в соответствии с запросом информация выдаётся пользователю, который и использует её в своих целях вне самой АИС. Это, например, справочно-библиографические системы, а также различные автоматические информаторы. Основной операцией в подобных системах является поиск, поэтому они относятся к классу исключительно информационно-поисковых систем.

 

Информационные системы мультимедиа.

В информационных системах мультимедиа широко используются, главным образом, аудиовидеотехнические средства и компьютерные программы, обеспечивающие все основные свойства (сбор, запись, обработку, отображение, воспроизведение и передачу) статической и динамической информации. Они реализуются как на отдельных компьютерах, так и в различных компьютерных сетях.

Гипертекстовые информационные системы можно определить как гипертекстовые системы, использующие обработку семантической информации (слов, предложений). Так, например, в учебных заведениях с помощью таких систем обучаемым предоставляется возможность иерархической организации и использования учебных материалов с помощью метода перехода по ссылкам к соответствующим местам и понятиям. Эти системы находят различное применение, например, в учебных целях для организации и проведения дистанционного обучения.


Информационные системы дистанционного обучения.

Информационные системы дистанционного обучения включают, как правило, специально разработанное программное обеспечение и широкодоступные телекоммуникации. Их применение способствует формированию качественного образовательного процесса в отдалённых районах, позволяет учиться без отрыва от основной работы, обучать людей с физическими недостатками (например, с ограниченной подвижностью или ослабленным зрением), а также значительно снизить транспортные расходы обучаемых и др.

Телекоммуникационные системы формируются на основе использования информационных компьютерных сетей. Выделяют локальные, корпоративные, региональные и глобальные сети, в которых применяются Интранет, Интернет и Веб-системы. Каждый вид сетей имеет свои особенности и возможности применения в различных предметных областях. Наибольший интерес представляют Веб-системы, использующие особенности гипертекста.

Массовое применение находят такие интернет-системы, как: интернет поисковые машины, электронные библиотеки и др.

Современные АИС используются для электронного обслуживания клиентов, позволяя автоматизировать многие процессы, связанные с торговлей и оказанием пользователям различных видов услуг (например, интернет-магазины, -банки, -биржи, -аукционы и др.). Используемые при этом ИПС автоматизируют процессы поиска нужных позиций в прайс-листах, оплаты товаров, позволяют вести архив документов, составлять бухгалтерскую отчётность, анализировать спрос и предложения, выбирать оптимальные пути доставки товаров, способы их оплаты, страховки и т.д.

Применение информационных систем корпоративной электронной торговли ведёт к снижению издержек на закупку, организацию, оформление, учёт и доставку товаров; позволяет предприятиям иметь меньшие материально-технические запасы и с большей эффективностью реагировать на информацию об изменениях спроса, уменьшая риск затоваривания.

Интернет-магазины или потребительские аукционы способствуют осуществлению розничной торговли с отдельными потребителями. В них отсутствуют затраты на аренду и заработную плату большого штата продавцов. В результате в них устанавливают цены на товары в Интернете ниже, чем в традиционных «реальных» магазинах. При этом предлагается большой ассортимент товаров, который не может предложить «реальный» магазин. Интернет-магазин становится и важным дополнением к обычным магазинам.

На биржах и аукционах используют электронные системы закупок (электронные биржи), проведения тендеров (конкурсов), аукционов и др. С их помощью появляется возможность автоматизировать процессы поиска необходимых партнеров и согласования с ними условий сделки.

Интеграция предприятий в электронный бизнес сочетает в себе систему электронного заказа, автоматизацию процесса закупок и продвижение товара к конечному потребителю через собственные электронные магазины. Повышение их эффективности осуществляется с помощью различных электронных способов оплаты товаров и услуг (электронные кошельки, электронные деньги).

Подобные системы позволяют всем участникам организуемых с их помощью процессов значительно сократить накладные расходы и получить выигрыш во времени. Дополнительная прибыль формируется за счёт экономии, возникающей при: полной автоматизации документооборота и учёта; оптимизации управленческой деятельности, товарных, сырьевых и финансовых потоков; повышения качества коммуникативных процессов и качества проведения маркетинговых мероприятий.

В разных предметных областях широко применяется электронный документооборот. Он позволяет существенно сократить количество бумажных документов и сроки выполнения заданий, дисциплинирует исполнителей и способствует эффективному выполнению производственных и иных заданий. Системы, связанные с делопроизводством, являются учётно-аналитическими автоматизированными информационными системами. Эффективное применение информационных систем электронного документооборота способствует повышению качества управления персоналом.

Электронный документооборот используется в небольших ЛВС в малом и среднем бизнесе, а также в различных территориальных информационных сетях (в том числе Интернете) в основном представителям среднего и крупного бизнеса.

Различное применение находят системы документационного обеспечения управления (ДОУ), подготовки текстовых документов, обработки финансово-экономической информации. При этом выполняются работы с организованными массивами информации (базами данных), включающие и распределённую обработку данных в локальных и глобальных информационно-вычислительных сетях.

Для обеспечения доступа широких масс пользователей к открытым электронным информационным массивам осуществляется кооперация и интеграция этих ресурсов. Автоматизированные интегрированные информационные системы обеспечивают доступ к удалённым информационным и техническим ресурсам, а также возможность работы различных категорий пользователей с разнородной по формам представления информацией. К ним относят локальные, корпоративные и глобальные сети, объектно-ориентированные, экспертные, телекоммуникационные и гипертекстовые системы, а также дистанционного обучения и др.

Вопросы информатизации производственной сферы менее проработаны, чем связанные с экономикой и финансовой деятельностью. При этом именно в этой предметной области сосредоточены основные резервы эффективности производства, требующие создания комплексных баз данных и знаний. Решающее значение здесь имеют системы управления, а также поддержки принятия решений, выполненные, как правило, по технологии экспертных систем. Характерной особенностью таких систем является ориентация на решение задач не столько программирования, сколько анализа и проектирования.

Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеется географический компонент.

В таких системах данные организованы в виде отдельных информационных объектов привязанных к общей электронной топографической основе.

Основная задача этих систем – обеспечить наглядное представление различных параметров земной поверхности в форме структурированных карт, которые можно использовать и для научных исследований, государственной (границы) и хозяйственной деятельности, для оптимизации транспортных потоков и военных операций. С их помощью можно, например, обрабатывать получаемые со спутников результаты измерений физико-химических параметров земной поверхности и атмосферы.

ГИС является расширением концепции баз данных, дополняя их наглядностью представления и возможностью решения задач пространственного анализа. Их основу составляют автоматизированные картографические системы, источниками информации в которых служат различные геоизображения (таблицы, паспорта, иллюстрации, расписания и т.п.).

ГИС применяют в землеустройстве, экономике и экологии, на транспорте, для контроля ресурсов и муниципального управления, при решении социальных и иных задач.

 

Тенденции внедрения информационных систем.

Зарубежные специалисты выделяют пять основных тенденций развития (и как следствие, внедрения) автоматизированных информационных систем.

Первая тенденция связана с изменением характеристик информационного продукта, всё более превращающегося в гибрид между результатом расчётно-аналитической работы и специфической услугой, предоставляемой индивидуальному пользователю.

Вторая тенденция обусловлена способностью к параллельному взаимодействию логических элементов автоматизированной информационной системы, совмещением всех типов информации (текста, образов, цифр, звуков) и ориентацией на одновременное их восприятие человеком посредством органов чувств.

Третья тенденция предполагает ликвидацию всех промежуточных звеньев на пути от источника информации к её потребителю. Например, становится возможным непосредственное общение автора и читателя, продавца и покупателя, певца и слушателя, учёных между собой, преподавателя и обучающегося, специалистов на предприятии через систему видеоконференций, электронный киоск, электронную почту.

Четвертая тенденция определяется глобализацией информационных систем в результате использования спутниковой связи и всемирной сети Интернет. В итоге люди, находясь в любой точке планеты, получают возможность общаться между собой и с общей базой данных.

Конвергенция рассматривается как пятая тенденция современного процесса развития АИС. Она заключается в стирании различий между сферами материального производства и информационного бизнеса, в максимальной диверсификации видов деятельности фирм и корпораций, взаимопроникновении различных отраслей промышленности, финансового сектора и сферы услуг, в объединении нескольких технических устройств в одном, например, городского и сотового телефонов.

Существенный интерес представляет определение эффективности ИТ.

 

Оценка эффективности информационных систем.

Основным критерием оценки информационных систем является их эффективность, особенно экономическая эффективность. Традиционный расчёт прибыли производится с учётом исчисляемых расходов и доходов.

Зачастую степень эффективности определяют исходя из того, насколько выгодны решения, принимаемые с точки зрения функционирования систем и устройств, государства, права и бизнеса, образования, культуры и т.д. При этом не самым главным критерием является расчёт финансовых вложений. Так, например, если информационные службы высокоэффективны, то не только бизнес, но культура и образование выигрывают от их деятельности. В этом случае весьма затруднительно обосновать необходимые капиталовложения в информационные системы. Здесь не работают расчёты, сделанные только с учётом экономической эффективности, а обычно учитывается каких результатов можно достигнуть при создании новой системы или модернизации существующей. Для этого предлагается осуществлять анализ экономической эффективности с учётом качественных выгод, определяемых методом финансового прогноза. Эти результаты могут учитывать краткосрочную и долгосрочную перспективы.

Успех применения информационной системы может определяться эффективностью решения основных задач. Некоторые специалисты считают, что обоснование полезности – это искусство маркетинга. Для этого предлагается использовать разработанный Робертом Бенсоном метод «информационной экономики». Такой метод рассматривается как надёжный способ анализа экономической эффективности, позволяющий учитывать качественные выгоды, величина которых определяется методом финансового прогноза с учётом возможных рисков.

 

Контрольные вопросы

 

1.       Назовите варианты использования АИС в различных предметных областях.

2.       Назовите недостатки организации обмена информацией между удалёнными подразделениями.

3.       Что входит в понятие «Стратегические АИС»?

4.       Назовите особенности использования автоматизированных информационных систем управления.

5.       В чем заключаются принципы работы и особенности использования экспертных систем?

6.       Дайте определение понятия и охарактеризуйте «Нейронные сети».

7.       Охарактеризуйте офисные АИС и особенности их использования.

8.       Приведите варианты применения АИС в Интернете для электронного обслуживания клиентов.

9.       В чем заключается использование электронного документооборота?

10.   Где и как применяются геоинформационные системы?

 


10. Информационный поиск

 

Ежегодно мировой объём производимой информации увеличивается, а по отношению к предыдущим годам – экспоненциально. Причём доля информации на цифровых носителях по сравнению с аналоговыми носителями с каждым годом растёт. Однако суммарное, например годовое, потребление пользователями информации практически является величиной постоянной. В результате увеличивается разрыв между объёмом производимой информации и её потреблением конечными пользователями. Следовательно, возрастает роль эффективного поиска необходимой пользователям информации.

Поиск информации это извлечение хранимой информации.

Информационным поиском называют некоторую последовательность операций, выполняемых с целью отыскания документов, содержащих определённую информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих ответы на данные вопросы.

Термин «Information Retrieval» (информационный поиск) в 1952 году ввёл американский математик Кельвин Муерс (Calvin Mooers).

Объектами ИП могут быть документы, сведения об их наличии и (или) местонахождении, а также фактографическая информация. Информационный поиск обусловлен информационной потребностью и выражается в форме информационного запроса.

Считается, что первые средства навигации в текстовой информации появились в Библии. В 1247 году (Hugo de St. Caro) было задействовано 500 монахов для составления конкорданса ключевых слов к Библии. Затем, в средние века индексирование стало применяться в журналах (журнальные индексы – Королевское научное общество, 1600 годы)

Различают следующие зависимости информационного поиска:

·    от цели – адресный (формально-механический) и семантический (тематический);

·    от объекта поиска – документный и фактографический;

·    от степени использования технических средств – ручной или автоматизированный.

·    от функциональной роли – доминирующие/второстепенные, центральные/периферические, устойчивые/ситуативные потребности.

 

Легко заметить, что виды информационного поиска пересекаются, а их цели и объекты часто взаимосвязаны. Например, документный и фактографический виды поиска могут быть как адресными, так и семантическими.

Обобщённо выделяют следующие методы поиска информации:

·     непосредственное наблюдение;

·     общение со специалистами по интересующему вопросу;

·     чтение соответствующей литературы;

·     просмотр видео, телепрограмм;

·     прослушивание радиопередач, аудиокассет;

·     работа в библиотеках и архивах;

·     запрос к информационным системам, базам и банкам компьютерных данных;

·     другие методы.

 

Широкое распространение в естественных языках получили явления синонимии, омонимии и полисемии. Пользователи формируют текстовые запросы на естественном языке. Сложное психологическое явление информационной потребности не всегда удаётся точно, однозначно и исчерпывающе сформулировать в виде информационного запроса. Тем не менее, все запросы пользователя при поиске в Интернете можно разбить на три основных класса:

1. Навигационные – поиск определённого сайта.

2. Информационные – поиск конкретной информации, которая может размещаться в одном или нескольких документах.

3. Транзакционные – с целью выполнения определённых действий в сети, например, загрузка файла или сервиса.

 

Целью информационного запроса является поиск в сети информации в статической форме, то есть не создаваемой динамически по запросу. По оценке специалистов примерно в 15% запросов предпочтение отдаётся документам, содержащим коллекцию ссылок по тематике.

Целью транзакционного запроса является нахождение определённого сайта, с которым пользователь предполагает дальше работать.

Естественно, что актуальной проблемой нахождения для пользователей необходимой им информации является организация эффективного автоматизированного поиска. Упоминавшееся выше индексирование наибольшее распространение получило в библиотеках для организации информационного поиска. Первоначально оно отражалось в традиционных карточных каталогах, позволяя находить необходимые читателям материалы по автору, названию и тематике. Автоматизация в библиотеках, в первую очередь, привела к созданию электронных каталогов (ЭК), в которых для организации более точного поиска запрашиваемых читателями документов появились поля тематических и иных рубрик, а также ключевых слов.

После поиска документов по их автору и названию, наибольшее распространение получил тематический поиск. Данное обстоятельство в большей степени связано с тем, что в начале поиска пользователь, как правило, имеет общее представление о своей информационной потребности. Поэтому он формулирует запрос общего характера. Однако тематический поиск применяется и по прямому назначению, когда необходимо отобрать документы по определённой тематике, как правило, за определённый период, а порой и конкретного автора. Дальнейшее развитие этого направления обычно связывают с включением в ЭК полей для организации электронного тезауруса.

Обычно поисковые процессы включают четыре стадии:

1) формулировка (осуществляется до начала поиска);

2) начало поиска;

3) обзор полученных результатов;

4) модификация поиска (после обзора полученных результатов может потребоваться уточняющий поиск).

 

Более удобная нелинейная схема поиска информации состоит из следующих этапов:

1) фиксация информационной потребности на естественном языке;

2) выбор поисковых сервисов сети и формализация записи информационной потребности на конкретных информационно-поисковых языках;

3) выполнение созданных запросов;

4) предварительная обработка полученных списков ссылок на документы;

5) обращение по выбранным адресам за искомыми документами;

6) предварительный просмотр содержимого найденных документов;

7) сохранение релевантных документов для последующего изучения;

8) извлечение из релевантных документов ссылок для расширения запроса;

9) изучение всего массива сохраненных документов;

10) возврат к первому этапу, если информационная потребность не полностью удовлетворена.

 

В современных компьютерных системах информация хранится в файлах, которые могут быть некоторым образом систематизированы, например, располагаться в соответствующих папках или в базе данных на каком-либо электронном носителе информации. Причём базы данных могут располагаться на одном носителе установленном в одном компьютере, а также в различных компьютерных сетях. Последний вариант используется наиболее часто, а средой расположения всё более интересующей пользователей информации является Интернет.

Элементарной единицей информационного поиска, как правило, является документ. Очевидно, что хранящаяся в различных документах текстовая информация в общем случае является слабо структурированной.

Чтобы можно было находить нужный пользователю документ, последний должен включать некоторые специальные компоненты, позволяющие его идентифицировать. С этой целью формирую поисковый образ документа.

ИП проводится с помощью информационно-поисковых систем. Структура процесса информационного поиска представлена на Рис. 20.

 

 

Рис. 20. Структура процесса информационного поиска

 

Стратегия ИП зависит от типа поисковой задачи, критериев выдачи и характера диалога между потребителями информации и ИПС.

 

Методы поиска.

Обычно ИП производится не по текстам документов, а по кратким характеристикам содержания или определённым внешним признакам документов. Для этого каждый документ снабжается поисковым образом документа (ПОД) – характеристикой, кратко выражающей основное смысловое содержание документа. Следовательно, для получения необходимых пользователям документов им необходимо сформулировать информационный запрос – поисковый образ запроса (ПОЗ), являющийся такой же краткой характеристикой, поисковым предписанием. Таким образом, процедура ИП сводится к сопоставлению ПОД с заданным ПОЗ. Отметим, что простейшими ПОД являются заглавие документа и фамилия его автора.

Методы поиска – это совокупность моделей и алгоритмов реализации отдельных технологических этапов, таких, как построение поискового образа запроса, отбор документов (сопоставление поисковых образов запросов и документов), расширение и реформулирование запроса, локализация и оценка выдачи. ПОЗ является формально описанной моделью информационной потребности пользователя, поэтому ПОЗ и ПОД должны соответствовать друг другу.

В ПОД основное смысловое содержание документа выражается в краткой форме. Такой метод не может обеспечить нахождение всех документов, содержащих требуемую информацию. При этом среди найденных документов попадаются фактически не отвечающие на данный информационный запрос. Эти документы образуют так называемый «поисковый шум».

Определяющими для понимания методов автоматизации поиска являются два следующих фактора:

1) сравниваются не сами объекты, а описания – так называемые «поисковые образы»;

2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций.

 

Всё более важным становится организация «свободного» поиска по содержанию документов. Наиболее часто он реализуется с помощью контекстных операторов с «маскированием» задаваемых терминов (усечением слов слева, в середине или справа). При автоматизированном поиске наилучшие результаты достигаются, когда он осуществляется по ПОД и (или) по их рефератам. В другом случае выписанные словосочетания и слова сравниваются с фиксированным словарем. При этом слова, ненайденные в словаре устраняются, а оставшиеся сортируются по алфавиту. Типология видов поиска приведена в Таблице 6.

Предметному поиску соответствует ситуация формирования (выбора) знака, устраняющего неопределённость знаковой системы в контексте полноты и точности представления объекта, то есть такого знака, который позволит эффективно выделить (отличить) объект из множества других при фиксированном (единственном) концепте.

 

Таблица 6

 

Типология видов поиска

 

Вид поиска

Логическая модель механизма поиска

Состав ПОЗ

Предметный

(атрибутивный) поиск

Поиск по логическому выражению над именами понятий, задаваемыми терминами или их комбинацией.

Термины документов, отнесенные к семантически заданным полям.

Тематический поиск

Поиск по части известного понятия, частично задаваемым комбинацией характеристических признаков, с использованием накопленных ранее результатов.

Термины документов и дополнительных поисковых структур – тематических рубрик, тезаурусов и т.п., отнесенные к семантически заданным полям.

Проблемный поиск

Поиск похожих документов, а также с использованием технологии «обратной связи».

Документы, входящие в итеративно формируемое пользователем информационное пространство.

 

Для случая тематического поиска ситуация отличается тем, что имеется упорядоченное ограниченное множество концептов, позволяющих представлять объект в различных аспектах, а для случая проблемного поиска имеется неупорядоченное и не жёстко определённое множество концептов.

Большинство ИПС поддерживают механизм поиска по фразе, операторы включения и исключения, а также булевы операторы. Кратко рассмотрим их.

Поиск по фразе организуется заключением её в кавычки. В результате формируется команда выведения списка документов, содержащих только данную фразу, а не отдельные слова или все слова фразы. Многие современные ИПС включают такую возможность по умолчанию.

ИПС поддерживают использование специального символа усечения («*»), обозначающего неопределённость, усечение термина для поиска всех терминов или фраз, начинающихся с определённого набора букв, например, с другим окончанием. Обычно этот символ означает любое количество букв в конце слова (правостороннее усечение).

Использование операторов включения (запись слов и всех их вхождений в запросе) и исключения, а также организация поиска по фразе позволяют повысить результативность поиска, например,

искусственный + интеллект (оператор включения);

искусственный + интеллект – игра (операторы включения и исключения).

 

Для поиска информации в Интернете разработаны специальные информационно-поисковые системы, содержащие средства организации поиска (строку для поиска, тематический каталог, ссылки). Для вызова такой системы пользователю достаточно ввести её адрес в адресную строку Браузера. В Интернете используется несколько типов ИПЯ, например, координатные и булевы.

При координатном поиске запрос содержит список терминов, называемых ключевыми словами. Этот список сравнивается со списками терминов документов. Причём для каждого документа вычисляется степень его соответствия запросу (формальная релевантность[7]), в соответствии с которой все ссылки на документы ранжируются. В качестве ключевого термина можно использовать устойчивое словосочетание, например, «Информационно-поисковая система», являющееся ключевой фразой или ключевым словосочетанием. Для системы поиска оно не отличается от обычного ключевого слова, поэтому, как правило, такой поиск считается простым.

Булевы (логические) операторы «AND» («И»), «OR» («ИЛИ») и «NOT» («НЕТ») являются эквивалентом операторов включения, пересечения и исключения. В таблице 7 приведены возможные варианты формирования запросов.

Кроме того, существует оператор близости «NEAR» или символ «~», определяющий нахождение в тексте двух слов близко друг от друга (от смежных до разделённых некоторым количеством слов, чаще в пределах 10 слов). Обычно он используется для координирования поиска при уточнении поискового предписания запроса.

 

Таблица 7

 

Операторы для формирования запросов

 

Оператор

Синонимы

Комментарий

И

AND или &

Определяет поиск документов, содержащих оба слова, соединённых оператором. Его можно и не писать. Например, запрос «информатика и учебник» эквивалентен запросу «информатика учебник». Можно формировать запрос более чем из двух слов, используя между ними оператор «AND».

ИЛИ

OR или |

Позволяет вести поиск документов, содержащих одновременно оба или одно из двух слов. Используется по умолчанию.

НЕ

NOT или !

Используется для исключения нежелательных документов. Пренебрегает документами, содержащими слово после этого оператора.

" "

'' или ‘

Двойные или одинарные кавычки используются для поиска словосочетаний.

Дата=

дата:

date=

Поиск ограничивается документами, попадающими в заданный интервал дат.

Пример 1. валюта дата=01/07/2008–01/07/2009 – поиск док ументов, содержащих слово «валюта» и имеющих дату от 1 июля 2008 года до 1 июля 2009 года. Аналогично можно составить запрос «date=01/07/2002 валюта».

 

Операторы обладают разным приоритетом. В любом выражении сначала выполняются оператор «NEAR», затем «NOT», потом «AND» и, наконец, «OR». Чтобы изменить порядок операторов, используются выражения с круглыми скобками подобно выполнению арифметических операций. ИПС оценивает такое выражение слева направо, кроме тех слов, которые заключены в скобки и будут восприняты первыми – то есть сначала выполняется операция внутри скобок, затем – между ними. Например, выражение:

 

(дисплей OR монитор) AND (Philips OR Samsung)

 

Согласно данным условиям поиска сначала запрашиваются документы, содержащие слова «дисплей» или «монитор» и документы о фирмах, а затем выполняется операция AND. В результате будут выданы документы, содержащие информацию о дисплеях или мониторах, выпущенных фирмами Philips или Samsung.

При булевом поиске слова и фразы соединяются операторами булевой алгебры («логическими коннекторами»). Например, в запросе использованы следующие слова и словосочетания «World Wide Web», «Web», «технология». Для осуществления их поиска можно построить запросы, содержащие два слова (например, «Web and технология»), или «технология not Web», или «Web or технология» и даже «not (Web & технология)». В последнем случае речь идёт о поиске документов, не содержащих ни одного из указанных в запросе терминов. Кроме логических коннекторов в некоторых ИПС можно использовать позиционные коннекторы, учитывающие взаимное расположение слов в тексте относительно друг друга.

В любой поисковой системе можно получить сведения о том, как в ней составлять строку запроса.

При простом запросе достаточно ввести одно или несколько слов, определяющих тему поиска. При этом, как правило, регистр букв игнорируется.

В запросе можно использовать символы «*» или «?». Знак «?» в ключевом слове заменяет один символ, на место которого может быть подставлена любая буква, а знак «*» – последовательность символов. Например, запрос «информат*» позволит найти документы, включающие слова «информатика, информационный, информативный и др.

При формировании запроса для получения более определённой информации часто возникает необходимость комбинирования ключевых слов. Для этого используют сложный запрос, включающий дополнительные слова-связки, функции, операторы, символы, разделенные скобками комбинации операторов. Например, запрос музыка & (beatles OR битлз) будет означать, что пользователь ищет документы, содержащие слова музыка и beatles или музыка и битлз. Особенностью размещённой в Интернете информации является её распределённость и изменчивость, избыточность и разнородность, неструктурированность или слабая структурированность данных.

В расширенной булевской модели взамен бинарных величин термины в документах и запросах описываются весовыми коэффициентами (значимость или статистическая оценка). Кроме того, используется аппарат нечётких множеств, т.е. степень принадлежности элемента к множеству задаётся величиной из интервала [0,1]. Причём степень принадлежности элементов может использоваться для ранжирования результатов запроса.

Достоинство этих моделей в простоте, легко понимаемой структуре запроса и простоте реализации.

К недостаткам относят: неэффективность описания сложных запросов (результатов запроса слишком много или слишком мало), проблематичность ранжирования результатов. Кроме того, следует отметить, что около 80% запросов не содержат операторов.

Современные поисковые модели включают характеристики документов (например, можно поводить расчёт частоты встречаемости терминов – весовая характеристика) и запроса. Можно предположить, что лингвистическое подобие документа и запроса подразумевает тематическое подобие, т.е. выражает фактически релевантность документа.

Существует способ, при котором выбор лексических единиц и исходного текста производится на основе статистической обработки текста, слова которого рассматриваются как знаки, не имеющие семантических значений.

Используется и способ контроля индексирования заданным словарем, при этом каждое слово исходного текста сравнивается со словарем. Совпадающие слова или их дескрипторы записываются в поисковый образ. Выделяют одноаспектное (по одному признаку) и многоаспектное (параллельно по нескольким признакам) индексирование. В таблице 6 приведена типология видов поиска, соответствующих им моделей и состава поискового образа запроса.

Для проведения документального поиска используют различные алгоритмы: полнотекстовое сканирование, файлы сигнатур, инверсия, кластеризация, обработка естественного языка (англ. «Natural Language Processing», NLP), латентно-семантическое индексирование (LSI). Кратко рассмотрим их.

Полнотекстовое сканирование заключается в поиске всех документов, содержащих искомую строку, представляющую собой последовательность символов.

Простейший вариант алгоритма включается в себя: посимвольное сравнение искомой строки с соответствующими символами документа. В случае несовпадения выполняется сдвиг искомой строки относительно документа вправо на одну позицию. Цикл повторяется до тех пор, пока в любой позиции документа не будет найдена искомая строка, или не будет достигнут конец документа. Данный вариант алгоритма является очень медленным, однако имеются и более быстрые его алгоритмы.

Файлы сигнатур. В этом алгоритме все термины документа представляются в виде битовых последовательностей, полученных в результате применения хэш-функции к исходным строкам-терминам. Сигнатуры документов размещаются последовательно в отдельном файле – файле сигнатур.

Данный подход позволяет уменьшить исходный размер файла и ускорить поиск.

Инверсия подразумевает, что каждый документ представляется списком терминов, которые хранятся упорядоченными в алфавитном порядке в индексном файле. Для каждого термина в данном файле имеется указатель на список содержащих его документов.

Для ускорения поиска при организации индексного файла используются B-деревья, хэширование и другие подходы.

Кластеризация. Основой этого метода является кластерная гипотеза, согласно которой «тесно связанные между собой документы оказываются релевантными по отношению к тем же запросам». Кластеризацию можно применять для распределения документов в коллекции по классам (автоматической классификации), что позволяет повысить скорость поиска документов и точность ответа. Также её можно использоваться для улучшения представления результатов поиска на основе приведённых ранее алгоритмов. Она включает две процедуры: генерацию кластеров и поиск кластеров по запросу пользователя. Причём инвертированный список можно рассматривать как одну из форм кластеризации документов.

Использование семантической информации включает методы, основанные на применении грамматического анализа, семантической информации и NLP в общем; а также латентно-семантическое индексирование и методы, использующие нейронные сети.

Обработка естественного языка (NLP) заключается в повышении эффективности путём сопоставления семантического содержания запросов семантическому содержанию документов. Вместо терминов могут использоваться целые фразы, расширяется поиск за счёт привлечения близких терминов/понятий и можно использовать контролируемый словарь.

Латентно-семантическое индексирование (LSI) является реализацией двухмодового факторного анализа, позволяющего выявлять значения/модели, лежащие в основе больших массивов наблюдаемых данных. Содержащиеся в запросе термины часто не совпадают с используемыми авторами документов по интересующей тематике. В данном алгоритме термины и документы представляются в виде векторов в пространстве «выбираемой» размерности.

Программное обеспечение, использующее элементы вычислительной лингвистики, появилось на ряде сайтов в Интернете, например, «Анализатор текста». Оно предназначено для анализа и составления из введённого пользователем текста списка ключевых слов, ранжируемых по весовому коэффициенту. Если из этого списка выбрать несколько словоформ, то по ним программа выполнит автоматическое реферирование и тематическую фиксацию анализируемого текста. В результате пользователь получает список наиболее значимых предложений исходного текста.

При этом возникает прецедент, когда, во-первых, отпадает потребность вводить ключевые слова и создавать специальные электронные рубрикаторы.

Во-вторых, автоматическое реферирование машиночитаемого текста способствует созданию рефератов документов, что само по себе весьма значимо особенно для научных, учебных, технических и иных профессиональных материалов.

В-третьих, такие рефераты можно включать в соответствующие поля библиографических записей в электронных базах и банках данных (в т.ч. Электронных каталогов), что будет способствовать максимальному раскрытию фондов библиотек и не перегрузит аппаратные средства большими объёмами машиночитаемых данных. Более того, поиск будет естественно проходить быстрее, чем при извлечении необходимых сведений из полных текстов.

В-четвертых, при этом не возникают проблемы с авторским правом, так как на серверах в открытом доступе будут не полные тексты документов, а их рефераты.

В-пятых, поиск по ключевым словам, образующим такие рефераты в сочетании с включенными в тексты метаданными может значительно улучшить ситуацию с релевантностью.

В-шестых, можно, используя эти рефераты, отказаться от описания определённого количества полей (тэгов) метаданных в гипертекстовых документах.

И, наконец, в-седьмых, такое решение снимает значительный груз забот и работ систематизаторов и библиографов при описании документов и создании соответствующих библиографических записей в Электронных каталогах их библиотек.

Наиболее важными формальными показателями функциональной эффективности поиска являются полнота, точность и избирательность.

В реальных системах невозможно достичь одновременно высокой полноты и точности. Для решения данной проблемы можно, например, фиксировать нужное количество релевантных документов: первые 10, 20, 30, 50, 100 найденных ссылок или документов. Затем измерить точность на каждом из этих уровней и вычислить среднее (взвешенное) значение по всем полученным результатам.

Оценкой методов информационного поиска с русскоязычной информацией в России занимаются различные организации и специалисты, например, РОМИП (http://romip.narod.ru/).

Важной также является оценка стоимости (себестоимости) проведённого поиска.

Себестоимость запроса рассчитывается как отношение общего объёма затрат на создание и поддержку работоспособности ИПС в единицу времени (например, за год) к количеству запросов, обрабатываемых ИПС за то же время.

 

Обработка результатов поиска.

С точки зрения ИПС результат поиска в ней есть совокупность (подмножество) найденных документов или ссылок на них, обычно представляемых пользователю в виде списка. После получения пользователем в результате поиска подмножества документов, он выявляет среди них наиболее релевантные, а затем и пертинентные. При этом наиболее часто встречаются следующие ситуации.

1. Отсутствие в исследуемом сегменте искомой информации. В этом случае переходят к другому сегменту, т. е., например, исследуют информационные ресурсы, созданные на других языках.

2. Найденные ссылки содержат информацию по иной тематике, может быть даже близкой к искомой.

3. Обнаружено слишком большое количество информационных ресурсов.

 

Полученный в результате поиска список ссылок в виде полных или частичных библиографических описаний (БО), найденных ИР можно тут же распечатать или послать на какой-либо адрес электронной почты, если такая возможность предоставляется ИПС и пользователь подключён к Интернету.

Обычно оказывается, что полученных документов или ссылок на них больше чем надо, а также, что некоторые из них не отвечают требованиям пользователя, сформировавшего данный запрос. Хотя около 80% пользователей не пытаются изменить запрос, в полученной выборке можно провести уточняющий запрос или осуществить его модификацию.

Модификация запросов подразумевает переформулировку запроса с целью его расширения, добавления терминов в запрос для уточнения информационной потребности.

Используемые для реализации информационных потребностей поисковые средства и технологии, с одной стороны, определяются типом и состоянием решаемой пользователем задачи – соотношением его знания и незнания об исследуемом объекте. С другой стороны, процесс взаимодействия пользователя с ИС обусловлен уровнем знания (профессионализмом) пользователем функциональных возможностей данной и подобных систем.

В последних двух случаях обычно осуществляют перебор найденных документов с целью определения степени близости их к исходному запросу. Для сокращения объёма рассматриваемых материалов обычно проводят фильтрацию результатов поиска по различным основаниям. Например, можно осуществить фильтрацию по типу источников, заранее предполагая, что искомые документы располагаются на коммерческих сайтах или на серверах.

 

Критерии оценки результатов поиска.

Критерием результата поиска является получение пользователем списка документов, одного документа или их частей, максимально удовлетворяющего его потребностям, сформулированным в поисковом запросе. В ИПС принято формировать список полученных в результате поиска документов по их релевантности. Различают критерии смыслового и формального соответствия между поисковым предписанием и выдаваемым документом.

Полнота и точность поиска являются взаимосвязанными показателями. Увеличение одного из них ведёт к снижению другого. Следует учитывать ситуацию, при которой список выданных поисковой системой ссылок содержит несколько, а порой и десятки разных адресов с одним и тем же текстом. Подобные ссылки характеризуются как дубликаты.

Причём важной компонентой найденных искомых документов является их достоверность, точнее достоверность хранящейся в них информации.

 

Контрольные вопросы

 

1.      Дайте определение понятия «Информационный поиск».

2.      Когда и где появились первые средства навигации в текстовой информации?

3.      От чего в основном зависит ИП?

4.      Назовите основные методы поиска информации.

5.      Назовите три основных класса запросов пользователей при поиске в Интернете.

6.      Назовите четыре стадии поисковых процессов.

7.      Охарактеризуйте методы поиска информации с помощью АИС.

8.      Назовите три основных видов поиска и охарактеризуйте их.

9.      Какие операторы используют при организации поиска в АИС?

10. Что включает в себя сложный запрос пользователя к АИС?

11. Какие алгоритмы используют для проведения документального поиска?

12. Назовите наиболее важные формальные показатели функциональной эффективности поиска.

13. Назовите ситуации обработки результатов поиска.

14. В чем смысл модификации запроса и как она осуществляется?

15. Назовите критерии оценки результатов поиска.

 


11. Поисковые Интернет системы

 

Основной целью создания ИС изначально естественно было предоставление определённым категориям пользователей необходимых им информационных ресурсов. Очевидно, что для реализации данной цели потребовалось создавать компьютерные информационные сети. Такие сети предоставили возможность их пользователям обмениваться электронной информацией между собой. Затем возникла потребность совместного использования распределённых между различными компьютерными системами информационных ресурсов. Так создавались и расширялись компьютерные информационные сети, а также используемые в них информационно-поисковые системы. Рассмотрим некоторые исторические аспекты данного процесса.

Первые программные приложения в компьютерных сетях, обобщённо ныне именуемых Интернетом, разрабатывались для обмена данными и включали электронную почту и FTP. А такое приложение, как Telnet предназначалось для предоставления пользователям возможности удалённого доступа к информации, и даже к рабочим ресурсам системы.

Для поиска в Интернете информационных ресурсов и доступа к ним, причём независимо от их формата и расположения, стали создаваться специализированные поисковые системы.

 

Эволюция поисковых систем в Интернете.

Предлагается выделить три этапа (поколения) эволюции поисковых Веб-систем:

Первое поколение (примерно 1995÷1997 гг.). Поддержка исключительно информационных запросов. Работа с текстовыми данными. Применение частоты терминов и векторных моделей.

Второе поколение (начало с 1998 г.). Использование гиперссылочного анализа. Поддержка информационных и навигационных запросов.

Третье поколение (с начала XXI века). Стремление использовать всевозможные источники данных для ответа на вопрос «какая потребность скрыта в запросе пользователя?». Возможность поддержки всех трёх типов запросов. Семантический анализ. Большее внимание к потребности пользователя, чем к содержанию его запроса. Привлечение различных контекстов. Развитая система помощи пользователю (подсказки, обратная связь и др.). Интеграция поиска и анализа текста.

Рассмотрим эти этапы подробнее.

Сначала появились поисковая система Archie, решавшая задачу локализации ресурсов на FTP-сервере, и система Gopher, упрощающая доступ к различным сетевым ресурсам.

Система Archie представляет собой комплекс программных средств, работающих со специальными базами данных. В этих базах содержится постоянно пополняющаяся информация о файлах, к которым можно получить доступ через сервис FTP. Пользуясь услугами системы Archie, можно осуществлять поиск файла по шаблону его имени. При этом пользователь получает список файлов с точным указанием места их хранения в сети, а также с информацией о типе, времени создания и размере файлов. Доступ к информационно-поисковой системе Archie осуществляется различными путями, начиная от запросов по электронной почте или с помощью сервиса Telnet и заканчивая использованием графических Archie-клиентов.

Система Gopher разрабатывалась для упрощения процесса локализации FTP-ресурсов Интернета и для более удобного представления сведений о содержании хранящихся на FTP-серверах файлов. Система Gopher даёт возможность в удобной форме (в виде меню) представлять пользователям информацию об имеющихся файлах и их содержании. Меню Gopher-серверов могут содержать ссылки на другие Gopher- и FTP-сервера. Таким образом, пользователь получает возможность путешествовать по Интернету не обращая внимания на местонахождение интересующих его ресурсов, и получать доступ к этим ресурсам.

Система Veronica используется для поиска информации в Gopher-пространстве по заголовкам пунктов меню. После ввода ключевого слова, система Veronica выясняет, встречается ли оно в меню на каком-либо Gopher-сервере, и в качестве результатов поиска выдаёт список заголовков пунктов меню, содержащих ключевое слово. Поскольку система Veronica не является автономной поисковой программой, а тесно связана с системой Gopher, она обладает тем же, что и система Gopher, недостатком: далеко не всегда по заголовку можно сказать, что собой представляет тот или иной информационный ресурс. Достоинства системы заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.

В апреле 1994 года появилась поисковая система Yahoo! (David Filo, Jerry Yang), представлявшая каталог с возможностями поиска, автоматизация процесса сбора и классификации. Эта система может подключаться к другим поисковым машинам. Например, если поиск в не привёл к положительному результату, то он автоматически переходит на поисковую машину Alta Vista. В случае положительных результатов найденные ссылки автоматически возвращаются в Yahoo!. Основная директория содержит адреса (URL) для интернет-ресурсов и краткое описание для этих связей. Поиск может ограничиваться указанием определённого промежутка времени. Средством, облегчающим поиск в Yahoo! является наличие TS (англ. «tip search» – поиск с помощью «намёка»), представляющего подчинённый справочник.

В июле 1994 года начинает функционировать поисковая система Lycos (Michael MauldinCarnegie Mellon Univ.), осуществляющая ранжирование по релевантности, частичное соответствие, учёт пространственной близости слов. Эта поисковая машина удобна для одновременного просмотра сайтов. При выводе информации она выдаёт краткий обзор и найденные адреса.

С декабря 1995 года стала активно работать первая ИПС промышленного масштаба – AltaVista (DEC), обрабатывающая миллионы запросов в день. В ней используется естественный язык запросов и методы искусственного интеллекта, поддерживаются логические операторы, поиск по названиям изображений, Java-апплеты и ActiveX объекты, поиск сайтов, ссылающихся на конкретный URL и контекстную помощь. Система индексирует весь текст, что позволяет осуществлять полный поиск.

В 1996 году началась демонстрация поисковой машины Апорт.

С октября 1999 года «Апорт 2000» интегрирована с каталогом «Каталог-Апорт». Первая российская поисковая машина, реализовавшая учёт «ранга страницы» и обработку запроса с ориентацией на HTML-код страницы.

Ранжирование веб-страниц осуществляется поисковыми машинами с помощью специальных программных роботов – пауков (червяков, гусениц, краулеров, спайдеров и др.).

Они обычно копируют веб-страницу на сервер поискового указателя, просматривают её и находят необходимые гиперссылки. Кроме того, они периодически возвращаются к ранее посещённым ресурсам, чтобы контролировать возможные изменения, выявлять «мёртвые» (потерявшие актуальность) ссылки и др. Затем выполнятся индексация, в ходе которой создаются специальные базы данных, с помощью которых можно установить, где и когда в Интернете встречалось, то или иное слово. Индексированную базу данных можно назвать словарём. В процессе поиска происходит обработка запроса клиента и выдача ему результатов поиска в виде списка гиперссылок.

Поисковые Веб-системы решают следующие задачи: сбор документов из сети, их индексирование, поиск по индексу, работу с документами и запросами пользователей. Они содержат такие компоненты, как: сетевой робот-«паук», хранилище документов, индексатор, обработчик запрос с поддержкой ранжирования. Типовая структура «Паука» представлена на Рис. 21.

«Паук» формирует в секунду десятки запросов на разрешение имен. Во избежание перегрузки веб-серверов, он стремится распределить обращение сразу между несколькими серверами. Большинство поисковых систем придерживаются политики, регламентирующей работу сетевого робота на веб-сайте. Например, в мета тэге HTML страницы можно указать необходимость исключения страницы при индексировании. Такая политика допускает возможность исключения доступа робота к определённым ресурсам веб-сайта, но не гарантирует этого.

 

 

Рис. 21. Типовая структура «Паука»

 

По способу организации такие ИПС делятся на классификационные (рубрикаторы) и словарные.

Рубрикаторами (классификаторами) называют поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска (например, если необходимо найти значение какого-то слова, то сначала в классификаторе нужно найти словарь, а затем в нём найти нужное слово).

Словарные поисковые системы представляют собой мощные автоматические программно-аппаратные комплексы. С их помощью просматривается (сканируется) информация в Интернете. В специальные справочники-индексы заносятся данные о местонахождении той или иной информации. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса (URL), на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу.

Большинство современных поисковых систем являются смешанными. Список ИПС можно найти на сайте http://www.monk.newmail.ru.

Обычно на простые поисковые запросы поисковые системы выдают десятки, а порой и сотни тысяч ссылок. Пользователи не в состоянии просматривать их. Как правило, просматриваются до 30÷50 первых ссылок. Поэтому поисковые системы должны сортировать найденные ссылки минимум по их релевантности и количеству обращений к данным ресурсам. Этого может оказаться недостаточно.

Операция сортировки полученных результатов называется ранжированием. Каждой найденной веб-странице присваивается рейтинг, отражающий по мнению создателей поисковой системы, качество найденного материала.

Высокие рейтинги получают веб-страницы, у которых поисковое слово из поискового запроса размещается в заголовке. Уровень рейтинга повышается, когда это слово несколько раз (но не более) встречается на веб-странице, особенно в первых пяти÷шести абзацах текста на ней. Эти абзацы считаются самыми важными для индексации. Положительно поисковой системой оценивается наличие запрашиваемых слов в тексте, сопровождающем иллюстрации и когда на неё есть ссылки с других веб-страниц. Это означает, что данная веб-страница популярна и обладает высоким показателем цитирования.

Такой особенностью формирования рейтингов порой пользуются недобросовестные создатели сайтов и порталов, придавая веб-страницам значимость и смысл, которых в них нет. Они пытаются обмануть поисковые системы, многократно повторяя на веб-странице скрытые слова или словосочетания, например, совпадающие с цветом фона. Выявив такие страницы, поисковая система может присвоить им штрафной отрицательный рейтинг.

В 1996 году произошёл запуск в эксплуатацию поискового механизма Rambler, а в феврале 1997 года – рейтинговой системы Ramblers Top100.

«Рамблер» является популярным порталом, одной из лучших в России классификационно-рейтинговых систем и рекламной площадкой. В развитие её средств поиска особые средства не вкладываются.

Летом 1996 года в Интернете появилась поисковая информационная система Яndex (языковой индекс, «Yet Another Index». «I» = «Я»). Осенью 1997 года открыт Yandex.ru и реализован естественно-языковой интерфейс.

С мая 2001 года функционирует новая версия ИПС «Яндекс». На Рис. 22. представлено устройство Яндекса.

 

 

Рис. 22. Устройство Яндекса

 

По уровню актуальности «Яндекс» является лидером, хотя его конкурент – Google.

С 1998 года в Интернете работает информационно-поисковая система Google (Sergey Brin, Larry PageStanford Univ.). В ней используются алгоритм ранжирования PageRank, оптимизация архитектуры системы, масштабирование и распараллеливание (Linux-кластеры), восстановление текста документа без обращения к его оригиналу в Интернете. Для достижения высокой степени эффективности большая часть системы реализована на С/С++ и работает под управлением Solaris или Linux. Общая структура созданной в 1998 году ИПС Google представлена на Рис. 23.

 


 

Рис. 23. Общая структура ИПС Google

 

Загрузкой веб-страниц из сети WWW в Google занимаются несколько распределённых сетевых роботов («пауков»). Задания роботам на загрузку документов поступают в виде списка URL от URL-сервера. Скачанные из сети документы передаются серверу хранилища, размещающему их в хранилище после предварительного сжатия.

Индексатор извлекает документы из хранилища и анализирует их структуру. В результате каждый документ преобразуется в множество вхождений слов (англ. «hits»). Записи о вхождениях слов включают информацию о самом слове, его положении в документе, регистре и размере шрифта. Индексатор размещает эти записи во множестве «ёмкостей», образующих частично отсортированный прямой индекс. Кроме того, индексатор извлекает гиперссылки из документов и размещает информацию о них (откуда, куда, текст ссылки) в файле анкеров.

URL-резолвер преобразует URL файла анкеров из относительной в абсолютную форму, и отображает их в идентификаторы docID. Затем помещает текст гиперссылки в прямой индекс, связанный с docID, на который указывает ссылка и генерирует базу данных гиперссылок в виде пары docID, используемой в дальнейшем для вычисления показателя PageRank.

Сортировщик на основе данных из «ёмкостей», отсортированных по docID, сортирует их заново по wordID и генерирует обратный индекс. Затем он создаёт список wordID и их смещений в обратном индексе. На основе списка wordID и словаря строится новый словарь для поискового агента. Поисковый агент использует словарь, обратный индекс и PageRank для ответа на запросы.

Документальный индекс docID представляет собой упорядоченный индекс. Информация, в каждой записи содержит текущий статус документа, указатель на запись в хранилище, контрольную сумму документа и другие данные.

Словарь включает более 14 миллионов слов (некоторые редкие слова исключены), содержит список слов и хеш-таблицу указателей.

Обработка запроса в Google осуществляется следующим образом. Сначала выполняется анализ запроса и преобразование слов в wordID, затем – поиск начала списка документов в коротких ёмкостях для каждого слова. Далее список документов сканируется до тех пор, пока не будет найден документ, соответствующий всем искомым терминам. После чего вычисляется ранг найденного документа. Если достигнут конец списка документов в коротких ёмкостях, то поиск продолжается с начала списка документов в больших ёмкостях для каждого слова и возвращается к сканированию. Если не достигнут конец списка документов, то также выполняется переход к сканированию. В заключение производится сортировка найденных документов по рангу и выдача первых документов из списка.

Для эффективного обслуживания трафика запросов система Google объединяет множество размещённых по всему миру кластеров. Каждый из них размещается в датацентре и содержит несколько тысяч компьютеров, географически распределённых для защиты от катастрофических сбоев датацентров. Управление тысячами ПК вместо нескольких мощных многопроцессорных серверов вызывает существенное увеличение затрат на администрирование и ремонт. Однако однородность небольшого числа работающих на ПК приложений и их одинаковая конфигурация позволяет значительно снизить затраты.

Многообразие отечественных и зарубежных Интернет поисковых систем затрудняет работу в них пользователей. Решение данной проблемы было найдено в расширении количества одновременно используемых первичных информационно-поисковых интернет-систем, то есть путём применения метапоисковых систем.

 

Метапоисковые системы.

Метапоисковые системы дают возможность пользователю одновременно в едином пользовательском интерфейсе, используя индексы обычных поисковых систем, работать с несколькими БД. Зачастую эти системы не позволяют реализовать все возможности отдельных поисковых систем, но в большинстве своем они обладают существенными быстродействием и степенью охвата Веб-пространства, что определяет их всё более возрастающие значение и популярность.

Метапоиск позволяет посылать запросы одновременно нескольким поисковым системам, каталогам и др. Полученные результаты собираются и объединяются в общем списке. К достоинствам такого поиска относят больший охват индексируемой части Интернета и увеличение эффективности поиска. Структура метапоисковой системы приведена на Рис. 24.

 

 

Рис. 24. Структура метапоисковой системы

 

Специалисты предлагают относительно объективную оценку работы информационно-поисковых систем, полученную на основе анкетирования в Интернете шести ИПС: Rambler, Yandex, Aport, AltaVista, Google, Yahoo, проведённого с 2003 по 2005 годы (таблица 8).

 

Таблица 8

 

Результаты опроса респондентов

 

 

По популярности первое место занял Yandex (Яндекс). Его выбрали все респонденты, на втором месте Google – 75% на третьем – Rambler 50%, на четвёртом Aport – 45%, на 5 и 6 – AltaVista и Yahoo с 20% каждый, на 7 и 8 местах AllTheWeb и Opentext с 5% каждый. По средней оценке качества поиска места распределились следующим образом Google – 8.6, Яндекс – 8.05, Rambler – 7.2, Yahoo – 7, AltaVista – 6.75, Aport – 6.66, AllTheWeb – 5,и OpenТext – 4.

Отмечается, что данные результаты в основном соответствуют результатам других подобных исследований аудитории, а также, что в последнее время на первые позиции выходит Google.

 

Контрольные вопросы

 

1.       Назовите три этапа эволюции поисковых Веб-систем.

2.       Когда появилась поисковая система Yahoo!? Охарактеризуйте ее.

3.       Когда появились отечественные поисковые системы? Кратко охарактеризуйте их.

4.       На какие классы по способу организации делятся интернет ИПС?

5.       Как работают в Интернете ИПС для отбора и ранжирования веб-страниц?

6.       Что представляют собой словарные поисковые системы?

7.       Каким образом веб-страницы получают высокие рейтинги?

8.       Что представляет собой общая структура ИПС Google?

9.       Как в Google осуществляется обработка запроса?

10.   В чем смысл метапоисковых систем и как они работают?

 


12. Электронный документооборот. Электронный офис

 

Отсутствие в организации грамотной работы с документами влечёт за собой пропажу документов и несвоевременность принятия решений по ним, низкокачественное их оформление, и как следствие, увеличение сроков их обработки, а также снижение полноты и ценности содержащейся в них информации.

Документ обычно понимается как материальный объект с зафиксированной на нём информацией, оформленный по определённым правилам, заверенный в установленном порядке и предназначенный для передачи во времени и пространстве в целях хранения и общественного использования.

Основное свойство документов – наличие реквизитов.

В организации должен существовать один канал поступления входящих документов, даже если приём документов построен по распределённой схеме. Кроме входящих существуют и другие виды документов. Укрупнёно выделяют три основных вида документов: входящие, исходящие и внутренние. Все циркулирующие в организации документы обладают уникальным регистрационным номером. Любая бумага, не имеющая регистрационного номера, не является документом. Кроме него документ обязан иметь дату его создания и подписи создавшего его лица или нескольких лиц. Документы содержат следующие основные атрибуты:

1.   Регистрационный номер документа (структура регистрационного номера может различаться для исходящих, входящих и внутренних документов).

2.   Источник документа (откуда получен документ).

3.   Ответственный исполнитель документа.

4.   Код документа по номенклатуре дел организации.

 

Кроме перечисленных, документы содержат такие сопутствующие атрибуты, как: даты и подпись, контрольный срок исполнения и контролирующее лицо и др.

Номенклатура дел – это формальный список дел организации, заранее утверждённый в ней на определённый период времени (как правило, на год). Она может обновляться от одного до четырёх раз в год.

Из сказанного явствует, что документы имеют некоторый, установленный для них, срок жизни или жизненный цикл (Рис. 25.).

 

 

Рис. 25. Жизненный цикл документов

 

Совокупность документов, оформленных по единым правилам, называется документацией. Документация делится на нормативно-справочную, конструкторскую, проектную, проектно-сметную, техническую, технико-экономическую, эксплуатационную и др.

По направленности различают организационно-распорядительные, плановые, статистические, бухгалтерские и научно-технические документы, содержащие сведения о составе, состоянии и деятельности любой организации, о любом изделии, товаре, замысле, разработке и т. п.

Важной составляющей процессов управления и принятия управленческих решений являются организации работы с документами, в значительной степени оказывающих влияние на оперативность и эффективность принимаемых решений. Отсутствие в организации грамотной работы с документами влечёт за собой пропажу документов и несвоевременность принятия решений по ним, низкокачественное их оформление, и как следствие, увеличение сроков их обработки, а также снижение полноты и ценности содержащейся в них информации.

Следует отметить, что существует некоторая общность (унификация), обусловленная соответствующими нормативными документами (стандартами, нормативами и т.п.).

Унифицированные системы документации создаются на государственном, республиканском, отраслевом и региональном уровнях. Главная их цель – обеспечение сопоставимости показателей различных сфер общественного производства. В разработанных стандартах установлены требования к:

·   унифицированным системам документации;

·   унифицированным формам документов различных уровней управления;

·   составу и структуре реквизитов и показателей;

·   порядку внедрения, ведения и регистрации унифицированных форм документов.

 

Несмотря на существование унифицированной системы документации, при обследовании большинства организаций, как правило, выявляются следующие типичные недостатки:

·   чрезвычайно большой объём документов обрабатывается вручную;

·   одни и те же показатели часто дублируются в разных документах;

·   работа с большим количеством документов отвлекает специалистов от решения непосредственных задач;

·   имеются показатели, которые создаются, но не используются и др.

 

Устранение названных недостатков является важной задачей любой организации. Простейшим примером решения такой задачи может быть создание схемы, отражающей все этапы прохождения служебной записки о приёме сотрудника на работу в организацию – от момента её создания до выхода приказа о его зачислении на работу.

Практически в любой организации, предприятии, учреждении, офисе и т.п. (в дальнейшем – организации) ведётся делопроизводств. Термин «делопроизводство» возник в России во второй половине XVIII века.

Делопроизводство – это отрасль деятельности, обеспечивающая документирование и организацию работы с официальными документами (документооборот).

Система делопроизводства если не стимулирует, то, по крайней мере, заставляет служащих работать вместе. Благодаря ей процесс движения документов и заданий в организации становится контролируемым, управляемым, а порой и предсказуемым. Внедрение такой системы облегчает коллективную работу и повышает её эффективность.

В теории систем управления делопроизводством выделяют три фундаментальных понятия:

Маршруты – пути, по которым следуют документы, информация и задания от стадии инициализации до завершения процесса. Маршрутизация может быть простой и последовательной, а так же сложной с включением соединений или разрывов, параллельной или итеративной маршрутизации (организация циклов). Выделяют также универсальную и множественную маршрутизацию.

Универсальная маршрутизация (англ. «Universal Routing Sheets») означает, что определяемые пользователем правила управляют потоком документов для конкретного процесса.

Множественная маршрутизация (англ. «Multiple Routing Instructions») предполагает, что для любого бизнес-процесса могут быть определены несколько маршрутов. Таким образом, у организации появляется возможность гибко и своевременно адаптироваться к изменяющимся условиям рынка и контролировать нестандартные ситуации.

Правила – процедуры, задающие выполнение каждого шага в ходе процесса. Правила определяют условия поэтапного выполнения работ в процессе делопроизводства. Определение правила не ограничивается процессом утверждения. В правилах учитывают разветвление маршрутов по определённым граничным значениям. Например, заказы на покупку, превышающие фиксированную сумму требуют дополнительного подтверждения. Параметры операций задают уровень авторизации.

Роли – обязанности людей на каждом этапе процесса делопроизводства.

Следует отметить появившуюся возможность визуального управления делопроизводством (англ. «Visual Control for Workflow Routes») ориентированную на использование для организации процессов средства графического построения в виде блок-схем и диаграмм вместо текстовых процедур.

Документооборот – это совокупность взаимосвязанных процедур, обеспечивающих движение документов в организации с момента их создания или поступления и до завершения исполнения или отправки и передачи в архив.

Документооборот (управление делопроизводством) широко используется в различных предметных областях и отраслях человеческой деятельности. Основной его характеристикой в современных условиях является автоматизация процессов, непосредственно связанных с взаимодействием человека с компьютером.

Количество документов, поступивших в организацию и созданных ей за определённый период, называется объёмом документооборота.

Основной принцип документооборота заключается в том, что не создаются локальные архивы документов. При этом любой входящий документ, не попавший в общий архив документов организации, может не исполняться.

От правильного решения таких задач, как оперативное и качественное формирование документов, контроль исполнения, чёткая организация хранения, поиска и использования документов, отлаженность работы справочно-информационной службы, самым непосредственным образом зависит эффективность управления организацией в целом. При этом формы, методы и объёмы документов в различных организациях могут существенно различаться.

В крупной организации типовые сроки хранения документов составляют: один и три года, пять, 10, 30 и 50 лет. По истечении срока хранения дела в государственных организациях, оно передаётся из архива конкретной организации на хранение в государственный архив. Для частных организаций дела по истечения срока их хранения уничтожаются или передаются в собственные архивы. Данные процессы оформляется соответствующими актами.

Ежедневно в масштабах организаций обрабатываются огромные массивы документов. Многие из них порождают большое количество сопровождающих документов. Согласно данным Siemens Business Services до 30% рабочего времени сотрудников уходит на поиск документов и другие рутинные операции, 15% документов безвозвратно теряется, а 80% времени руководитель тратит на работу с информацией. В результате появляются потоки документов, которые приходиться контролировать и перераспределять между различными подразделениями. Для решения данных проблем создаются и функционируют различные системы делопроизводства. Они бывают традиционные (ручные и механизированные), компьютерные (автоматизированные) и смешанные (гибридные).

С целью решения задач управления деловыми процессами и обслуживания пользователей в организациях используют различные автоматизированные системы. Автоматическая обработка документов позволяет:

·    снизить временные затраты на ввод данных;

·    освободить сотрудника службы контроля от выполнения механических операций, отвлекающих его внимание;

·    избавить клиента от необходимости ксерокопирования документов;

·    добиться высокого качества графических копий документов;

·    экспортировать из документов текстовую и графическую информацию (фотографию, подпись владельца);

·    вести полное протоколирование всех операций, произведённых сотрудником службы контроля;

·    вести автоматический контроль и проверку вводимых данных.

 

Организация WfMC, работающая над стандартизацией систем управления делопроизводством, отмечает что почти 90% времени, используемого для выполнения определённых задач внутри организаций, является «временем передачи», и только 10% фактически уходит на выполнение этих задач. Целью автоматизации делопроизводства является переопределение и затем преобразование компонентов продолжительных бизнес циклов с целью сокращения до минимума времени, необходимого на выполнение задач, и полной ликвидации времени перехода между заданиями.

Информационно-программные средства автоматизации делопроизводства обычно делят на следующие категории:

·     системы организации групповой работы;

·     системы управления электронными документами;

·     средства управления документооборотом.

 

С помощью автоматизированных систем в организациях функционируют электронные документы, организуются электронный документооборот, контроль выполнения заданий, загрузка сотрудников и др.

Электронный документ – это документ, в котором информация представлена в электронно-цифровой форме.

Он может быть изначально создан в электронном виде или введён в автоматизированную систему путём оцифровки традиционного документа. Разновидностью систем поддержки принятия решений можно считать системы документооборота и документационного обеспечения управления (ДОУ).

Электронный документооборот (англ. «Electronic data interchange», EDI) – это электронный обмен деловыми документами между автоматизированными системами различных организаций в стандартизованной форме.

Электронный документооборот базируется на использовании электронных документов или электронных копий традиционных документов и является важной составляющей электронных учреждений (электронных и виртуальных офисов).

Система электронного документооборота – это система, позволяющая обрабатывать неструктурированные данные (письма, приказы, отчёты, инструкции и т.д.).

Это также система создания, интерпретации, передачи, приёма, архивирования документов, контроля за их исполнением и защиты от несанкционированного доступа.

Цель использования таких систем заключается в сведении к минимуму создание и перемещение бумаг внутри организации. Значительное снижение объёмов бумаг, подлежащих обработке, приводит к снижению расходов на персонал и административное управление. Освободившихся сотрудников можно переориентировать на решение других задач.

Полностью отказаться от бумажных документов пока невозможно по причинам, главным образом, юридического характера, поэтому компьютерные системы делопроизводства должны позволять работать с электронными документами и электронными версиями бумажных документов.

Выделяют межведомственный, внутриведомственный электронный документооборот, а также предназначенный для выполнения услуг. Электронный документооборот является важной составляющей малого, среднего и крупного бизнеса; компонентой электронных учреждений (офисов).

Автоматизация документооборота заключается в комплексной автоматизации процессов разработки, согласования, распространения, поиска и архивного хранения документов организации. Многие современные системы электронного документооборота (СЭДО) используют библиотеки документов, содержащие в соответствующей БД карточки документов с атрибутами и ключевыми словами. Карточка обычно занимает примерно 3 Кб дискового пространства.

Основой любой системы управления электронными документами является архив, где документы находятся в процессе работы над ними и остаются до тех пор, пока содержащаяся в них информация представляет интерес.

Под электронным архивом понимается совокупность аппаратно-программных средств и технологий для создания хранилища электронных документов и обеспечения доступа к ним из систем управления электронными документами.

Важным аспектом использования современного документооборота является способ хранения документов – единое электронное хранилище, позволяющее осуществлять быстрый поиск по тексту документа, по значениям реквизитов его регистрационной карточки, принадлежности потоку и др. В результате:

·     исчезает зависимость от конкретного человека, знающего где какой документ находится;

·     предотвращается потеря документов;

·     сокращается бумажный документооборот, особенно в случае многократного копирования одного документа для проведения совместной работы с ним.

 

Поиск и фильтрация документов производится по запросам на основе контекстного поиска по: атрибутам, ключевым словам и полному содержанию текста на основе индекса.

Системы, связанные с делопроизводством, обычно являются учётно-аналитическими АИС. Важным аспектом в них является возможность определять достоверность документа, то есть наличие удостоверяющих его специальных реквизитов, одним из которых является электронная цифровая подпись.

Электронная цифровая подпись (ЭЦП, англ. «Electronic digital signature») – это реквизит электронного документа, предназначенный для придания ему статуса документа и защиты от подделки.

Она получается в результате криптографического преобразования информации с использованием закрытого ключа электронной цифровой подписи. ЭЦП позволяет идентифицировать владельца ключа подписи, а также установить отсутствие искажения информации в электронном документе.

Одним из достоинств таких систем является автоматический ввод в них необходимых документов. Для этого используют сканирование документов и сохранение их в виде графических образов. При этом применяется и технология оптического распознавания символов OCR (англ. «Optical Character Recognition»), позволяющая переводить электронные графические изображения документов в текст. После этого могут появиться ошибки распознавания, которые требуется исправить.

Для массового ввода однотипных документов используют электронные формы, обеспечивающие структуризацию документа за счёт выделения частей текста и добавления полей (атрибутов), например, для переписи населения и др. Такая технология позволяет упростить заполнение документов и выполнять необходимые вычисления. Информация в организацию может поступать путём импорта файлов с электронных носителей или по телекоммуникациям (факсы, сообщения электронной почты и т.п.).

Системы электронного делопроизводства обеспечивают работу с электронными версиями документов и реквизитами регистрационно-контрольных форм в соответствии с принятыми в стране правилами и стандартами делопроизводства. Они образуют электронный документооборот, позволяющий существенно сократить количество используемых бумажных документов и сроки выполнения заданий. Он включает использование электронных документов или электронных копий традиционных документов и является важной составляющей малого, среднего и крупного бизнеса; компонентой электронных учреждений (офисов).

Ныне термин «электронное делопроизводство» является синонимом термина «документационное обеспечение управления» (ДОУ).

ДОУ – это система вторичных процессов, обеспечивающих и отражающих процессы управления.

«Безбумажные технологии» значительно экономят силы и время персонала, денежные и иные средства использующих их организаций.

Сотрудничество организаций между собой и с клиентами на постоянной основе подразумевает определённую информационную прозрачность и беспрерывный обмен сведениями, влияющий на бесперебойное их функционирование. Если различные подразделения организации (бухгалтерия, отдел кадров, отдел сбыта, склад и т. д.) ведут учёт и документацию в различных компьютерных программах, это может сильно затруднить обмен данными между ними. Беспрепятственное циркулирование информации внутри предприятия играет важную роль не только для ускорения документооборота.

В электронном документообороте используют специализированные системы:

·    управления документами (СУД, англ. «Document Management System», DMS);

·    автоматизации деловых процедур (АДП, англ. «Work-Flow System»);

·    обработки изображений документов (англ. «Imaging System»);

·    оптического распознавания символов (OCR) и др.

 

Коллективную работу с документами обеспечивают технологии «Groupware» и «Workflow».

Технология Groupware предназначена для небольших рабочих групп. Она ориентирована на поддержку выполнения одной коллективной задачи при отсутствии структуризации в организации работ. Поддержка ограничивается обеспечением коллективного доступа к информации с помощью различных методов доступа:

·     сетевой доступ к файлам и базе данных;

·     локальная и глобальная электронная почта (включая конференции и дискуссии);

·     терминальный доступ, пересылка файлов и электронная доска объявлений;

·     просмотр и интерпретация гипертекста (гипермедиа).

 

При коллективной работе для разрешения конфликтов совместного использования ресурсов, санкционирования доступа по идентификаторам и паролям, защиты информации с помощью прав доступа важно иметь возможность использования соответствующих блокировок. Дополнительный уровень безопасности обеспечивается методами и средствами шифрации и электронной подписи.

Технологии Workflow служат для автоматизации документооборота в средних и крупных организациях, и обеспечивают поддержку многопользовательской работы с несколькими задачами одновременно при чёткой структуризации выполнения работ по ролям и документам с контролем исполнения. К таким системам относятся популярные в зарубежных странах автоматизированные системы построения и управления деловыми процессами в организациях. С их помощью можно организовать систему электронного документооборота, а также систему контроля выполнения заданий и загрузки сотрудников. При этом не ставится цель полного отказа от бумажных документов, а сведение к минимуму перемещения бумаг внутри организации.

Можно выделить две разновидности Workflow:

1. Структурированное делопроизводство (англ. «Structured Workflow»), использующее предопределённые и часто повторяющиеся процессы, которые хорошо автоматизируются и требуют минимального контроля со стороны пользователей.

2. Специфическое делопроизводство (англ. «Ad Hoc Workflow»), включающее неформализованные процессы, относящиеся к нестандартным заданиям или проектам и требующие интерактивного вмешательства пользователей в ходе их выполнения. Оно обусловлено тем обстоятельством, что служащие на практике сталкиваются с ситуациями, когда выполнение определённого задания является единичным, нетипичным случаем, при этом все неформализованные процессы приходится контролировать вручную.

 

После успешной автоматизации делопроизводства организации возникает задача автоматизации взаимодействия различных организаций. Самый очевидный пример такого взаимодействия – это обмен документами и распоряжениями между центральной организацией и ее филиалами. Аналогичные задачи возникают и внутри крупной организации (общение между подразделениями). В корпоративных системах важной задачей является создание единого корпоративного документального сервера, как правило, с централизованным хранением различных электронных документов. С этой задачей справляется специальное программное обеспечение, например фирмы «Электронные офисные системы» (http://www.eos.ru) «eDocLib» (англ. «Electronic Documents Library»). Создаваемая с её помощью единая библиотека электронных документов коллективного доступа может использоваться как совокупность отдельных хранилищ (каталогов и читальных залов) с управляемым доступом к хранящимся в них документам даже с неструктурированными материалами.

Другим подобным продуктом является eDRM (enterprise Documents and Records Management), позволяющий создавать инфраструктуру управления документами и записями, удовлетворять изменяющиеся потребности организации в управлении её информацией.

Для хранения документов используются СУБД MS SQL (MSDE) и Oracle и др.

АИС ДОУ образует единое информационное пространство, предоставляя средства совместной работы со всеми документами организации: поступающей и исходящей корреспонденцией, внутренними организационно-распорядительными материалами, а также с сопроводительной перепиской в течение всего их жизненного цикла. А после завершения «активной жизни» документов система должна поддерживать их архивное хранение или фиксировать информацию об их уничтожении.

При её выборе необходимо решать следующие основные задачи:

·  документирование (подготовка, оформление, согласование, утверждение и выпуск документов);

·  обеспечение документооборота организации (регистрация и движение документов и их проектов, контроль исполнения поручений по обработке документов, списание в дело и поиск документов);

·  архивное хранение (обеспечение поиска, выполнение правил хранения, использования и уничтожения архивных документов).

 

При этом рекомендуется учитывать способна ли выбранная система вести принятые в организации делопроизводство и документооборот; поддерживает ли она оборот документов, представленных как в бумажной, так и в электронной форме; обладает ли достаточной функциональной полнотой и имеет ли приемлемые эксплуатационные характеристики.

Поскольку современные информационные технологии и системы развиваются быстрее, чем совершенствуются системы управления предприятием, на рынке постоянно появляются новые АИС ДОУ, как правило, обладающие большим набором функций и ориентированные на разные сферы применения. В таблице 9 приведены сравнительные характеристики широко распространённых в нашей стране АИС ДОУ.

 

Таблица 9

 

Сравнительные характеристики АИС ДОУ

 

ИС ДОУ

«ДЕЛО»

Landocs

Documentum

Company-Media

«БОСС-Референт»

Учёт технологии отечественного делопроизводства и управления

+

+

Н/д

+

+

Поддержка бумажного и электронного документооборота

+

+

Н/д

+

Н/д

Функциональная полнота

+/-

+/-

+/-

+/-

+/-

Отдельные функциональные характеристики

Потоковый ввод бумажных документов

+

+

+

+

Н/д

Совместная работа над документами

+

+

+

+

Н/д

Организация электронного архива

+

+

+

+

+

Полнотекстовый поиск

+

+

+

+

+

Формирование отчётов

+

+/-

+/-

+

+/-

Эксплуатационные характеристики

Маштабируемость

+

+

+

+

+

Разграничение доступа пользователей и защита от несанкционированного обращения к документам и функциям системы

+

+

+

+

+

Протоколирование работы пользователей

+

+

+

+

+

Администрирование и обеспечение надёжности

+

+

+

+

+

Используемые СУБД

Oracle, MS SQL Server

Oracle, MS SQL Server, Informix

Oracle, MS SQL Server, Sybase

Lotus Domino

Lotus Domino

ОС клиентских рабочих мест (Windows NT, Workstation, 98, 2000)

+

+

+

+

+

 

Примечания:

«+» – высокая степень выражения данного свойства.

«+/-» – средняя степень выражения данного свойства.

«Н/д» – нет данных.

 

Электронный офис.

Любая большая, средняя или малая организация, предприятие, учреждение, ведомство, фирма, учебное заведение и т. п. с точки зрения функционирования в них информационных потоков может условно называться офисом. В одной организации может быть несколько офисов.

В этих случаях термин «офис» означает структуру, в которой совершаются служебные и (или) деловые операции. Он является рабочим местом людей, облечённых доверием и властью, производящих информационные продукты, оказывающих различные виды услуг и т. п.

Деятельность таких офисов характеризуется используемыми информационными технологиями. Обычно к традиционным функция офиса относят учётную, финансовую деятельность и организацию документооборота, необходимого и для подготовки информации с целью принятия управленческих решений.

Главным условием повышения эффективности производства, управления, качественного и оперативного оказания различных услуг и т. д. является автоматизация рабочих мест сотрудников офиса. Она реализуется путём построения и постоянного функционирования необходимых коммуникаций, программно-технических средств, более полного и своевременного информирования сотрудников офиса и его пользователей. При этом формируются АРМы сотрудников и клиентов офиса, а сам офис может позиционироваться как автоматизированное подразделение, широко (многоаспектно) использующее различные электронные средства организации работ, управления и принятия эффективных управленческих решений.

Электронная технология и электронные носители избавляют сотрудников и пользователей от медленной и трудоёмкой работы с бумажными документами. Замена «бумажных процессов» и носителей электронными позволяет интеллектуальным работникам заниматься плодотворной работой. При этом предпринимаются попытки создания полной электронной рабочей среды. Подобные офисы предлагается называть «безбумажными офисами». Этот термин появился в начале 1970-х годов.

Если в офисе преобладают информационные компьютерные технологии (ЭВМ, коммуникационная и организационная техника) и электронные носители информации, уместно говорить, что это электронный офис.

В таком офисе обычно используют универсальные компьютерные и офисные технические средства, а также широко распространяемые операционные системы и интегрированные пакеты прикладных программ.


Контрольные вопросы

 

1.        Дайте определение термину «Документ».

2.        Какие основные атрибуты содержат любые документы?

3.        Охарактеризуйте срок жизни или жизненный цикл документов.

4.        Дайте определение термину «Документация».

5.        Дайте классификацию документов по их направленности.

6.        Назовите основные требования к унифицированным системам документации.

7.        Дайте определение терминам «Делопроизводство» и «Документооборот».

8.        Какие три фундаментальных понятия выделяют в теории систем управления делопроизводством?

9.        В чем заключается основной принцип документооборота?

10.   На какие категории обычно делят информационно-программные средства автоматизации делопроизводства?

11.   Дайте определение понятия «Электронный документооборот».

12.   Что представляет собой система электронного документооборота?

13.   Что представляет собой электронный архив?

14.   Дайте определение понятия «Электронная цифровая подпись».

15.   Поясните термин «ДОУ» и что это за система?

16.   Поясните особенности использования технологий Groupware и Workflow.

17.   Дайте основные характеристики нескольких отечественных АИС ДОУ.

18.   В чем сущность электронного офиса? Возможности его организации и использования.


Глоссарий

 

Термины на английском языке:

 

A

 

ASCII (англ. «American Standard Code for Information Interchange» – стандартная американская кодовая таблица символов) – международный стандарт кодирования текстовой и числовой информации.

AVI (англ. «Audio Video Interleave») – формат-контейнер аудио и видео цифровых данных, позволяющий синхронно воспроизводить видеоизображения с сопровождающим их звуком.

 

B

 

B2B (сокращение от англ. «business to business») – взаимодействие одних бизнес-структур с другими, то есть между бизнес-партнерами.

B2C (сокращение от англ. «business to clients») – взаимодействие бизнес-структуры с клиентами.

BBS (англ. «Bulletin Board System») – используемый в кабельных компьютерных сетях способ общения пользователей через коммутируемые телефонные сети.

BI (англ. «Business Intelligence») – бизнес аналитика.

BPM (англ. «Business Performance Management» – управление работой бизнеса) и (англ. «Business Process Management» – управление бизнес-процессами) – методология внедрения изменений бизнес-процессов на предприятии; итерационный переход от одной модели бизнес-процесса к другой, то есть о постоянной эволюции (а не революции) бизнес-процессов на предприятии.

BPR (англ. «Business Process Reengineering» – реорганизация бизнес-процессов) – комплекс процессов анализа и управления как финансовой, так и операционной деятельностью организации; фундаментальное переосмысление и радикальное перепланирование бизнес-процессов с целью резкого улучшения таких показателей деятельности организации, как: затраты, качество, сервис и скорость. Основной целю BPM является помощь в оценке эффективности деятельности и определении стратегических целей организации.

 

C

 

CAD (англ. «Computing Aided Design») – автоматизированная система проектирования, САПР.

CAE (англ. «Computing Aided Engineering») – автоматизированная система инженерного проектирования, САПР.

CAM (англ. «Computing Aided Manufacturing») – автоматизированная система поддержки производства.

CASE (Computer-Aided Systems Engineering) – системы компьютерного проектирования программного обеспечения.

CIM (англ. «Computer Integrated Manufacturing») – компьютерные интегрированные системы.

CPM (англ. «Corporate Performance Management» – управление работой корпорации) – оптимизация деятельности организации и использование преимуществ информационных технологий при обработки данных и информационном обслуживании.

CRM (англ. «Customer Relationship Management» – управление взаимоотношениями с клиентами) – бизнес-стратегия, включающая клиентоориентированный подход, нацеленный на поддержку максимально эффективного персонифицированного обслуживания клиентов, на построение долгосрочных и взаимовыгодных взаимоотношений с клиентами.

CRP (англ. «Computing Resource Planning) – система планирования производственных мощностей.

 

D

 

DCS (англ. «Distributed Control Systems» – распределённая система контроля) – система управления технологическим процессом путём построения распределённой системы ввода вывода и децентрализации обработки данных.

DEM (англ. «Dynamic Enterprise Management System») – система динамического моделирования.

DSS (англ. «Decision Support System» – системы поддержки принятия решений) – развитие систем генерации отчётов и систем обработки транзакций. Обслуживают частично структурированные задачи, результаты которых трудно спрогнозировать заранее.

DVB (англ. «Digital Video Broadcasting») – стандарт цифрового телевизионного вещания.

 

E

 

EPM (англ. «Enterprise Performance Management» – управление эффективностью бизнеса) – постановка целей, анализ успешности работы и принятие необходимых мер для повышения эффективности деятельности организации.

ER-модель (англ. «Entity Relationship model») – представление концептуальной модели данных.

ERD (англ. «Entity Relationship Diagram») – Делопроизводство – отрасль деятельности, обеспечивающая документирование и организацию работы с официальными документами (документооборот).

Дескриптор (англ. «Descriptor») – нормативное ключевое слово, предназначенное для координатного индексирования документов и информационных запросов, по определенным правилам отобранное из основного словарного состава естественного языка.

Диаграмма «сущность-связь», ER-диаграмма.

ERP (англ. «Enterprise Resource Planning» – планирование ресурсов предприятия) – система управления ресурсами предприятия.

ESS (англ. «Enterprise Support Systems») – обеспечивающие системы предприятия; множество автоматизированных систем, документов и процедур, используемых для обеспечения бизнес-операций предприятия.

 

F

 

FTP (англ. «File Transfer Protocol» – протокол передачи файлов) – протокол, предназначенный для передачи файлов в компьютерных сетях.

 

G

 

GSS (англ. «Group Support Systems» – системы поддержки работы группы) – вариант DSS, предназначенный для поддержки работы группы, а не индивидуума.

 

H

 

HTML (англ. «HyperText Markup Language» – язык разметки гипертекста) – стандартный язык разметки документов в Интернете.

 

I

 

IRP (англ. «Intelligent Resource Planning») – система интеллектуального планирования, направленная на создание современной информационной инфраструктуры, обеспечивающей прозрачную поддержку процессов и адекватное реагирование на изменяющиеся условия внешней среды с минимизацией накладных расходов.

IRS (англ. «Information Reporting Systems»системы генерации отчётов) – системы, обеспечивающие руководство организации составленными на основе собранных данных отчётами, необходимыми для принятия управленческих решений.

IS (англ. «Information Systems») – информационная система.


K

 

KPI (англ. «Key Performance Indicator») – ключевой показатель деятельности используется для определения, насколько хорошо бизнес достигает своих целей.

 

M

 

MES (англ. «Manufacturing Execution System» – системы исполнения (управления) производством) – управления выпуском продукции. Включают все необходимые для этого функции: от оперативного планирования производства до автоматизированного контроля качества, управления техническим обслуживанием и производственного документооборота.

MIS (англ. «Management Information Systems») – управление информационными системами.

MPEG (англ. «Moving Picture Experts Group») – серия разработанных экспертной группа кинематографии форматов, использующих различные методы сжатия.

MRP (англ. «Material requirement planning») – планирование потребностей в материалах. Система расчета рекомендованных заказов и изменений к твердым заказам на изготовление и закупку изделий. Расчеты производятся в соответствии со спецификациями, имеющимися запасами и заказами, а также основным планом производства.

MRPII (англ. «Manufacturing resource planning») – планирование ресурсов предприятия. Относится к системам управления (планирования) производственной деятельности предприятия.

 

O

 

OLAP (англ. «On-line Analytical Processing») – онлайновый (диалоговый, многомерный) анализ данных в режиме реального времени; выборка и анализ данных в режиме диалога с целью получения сведений, неприсутствующих в них непосредственно: выявить тенденции и вычислить статистику для бизнеса.

OLTP (англ. «On-Line Transaction Processing» – обработка транзакций в реальном времени) – организация работы БД с идущими большим потоком небольшими по размерам транзакциями. При этом клиенту требуется от системы максимально быстрое время ответа. см. «Системы обработки транзакций».

 

P

 

PDM (англ. «Product Data Management») – управление данными о продукции предприятия – обработка и хранение всех данных об изделии; вся информация, относящаяся к сути изделия: его состав, возможность замены отдельных компонентов, конструкторская и рабочая документация.

 

R

 

RFID (англ. «Radio Frequency Identification» – радиочастотная идентификация) – автоматическая идентификация объектов, при которой с помощью радиосигналов считываются хранящиеся в RFID-метках данные или записываются в них.

 

S

 

SCM – (англ. «Supply Chain Management» – управление цепочкой поставок) – система управления распределённой логистикой, предназначенная для автоматизации и управления всеми этапами снабжения предприятия и контроля всего его товародвижения.

SQL (англ. «Structured Query Language») – яЯзык структурированных запросов.

SRM (англ. «Customer Relationship Management») – система управления отношениями с клиентами – поставщиками.

 

U

 

UNICODE (англ. «Unicode Standard») – 16-битный код (Юникод), стандарт кодирования символов, допускающий 65536 кодовых комбинаций.

URL (англ. «Uniform Resource Locator») – универсальный локатор (определитель местонахождения) ресурса; стандартизированный способ записи адреса ресурса в сети Интернет.

 

V

 

VPN (англ. «Virtual Private Network») – как правило, виртуальная локальная сеть корпорации.

 

Термины на русском языке:

 

А

 

Автоматизированная информационная система (англ. «Automated information system»)совокупность программных и аппаратных средств, предназначенных для хранения и/или управления данными и информацией и производства вычислений.

Автоматизированная система (англ. «Automated system») – комплекс технических, программных, других средств и персонала, предназначенный для автоматизации различных процессов.

Автоматизированная система управления (англ. «Automated control system») – комплекс технических и программных средств, совместно с организационными структурами (отдельными людьми пли коллективом), обеспечивающий управление объектом в производственной, научной или общественной среде.

Автоматизированное рабочее место (англ. «Automated workplace») – комплекс средств, разных устройств и мебели, предназначенных для решения различных информационных задач. С другой стороны, АРМ – это совокупность методов, средств и процедур информационного, технического, программно-математического и организационно-правового характера по взаимодействию пользователя с ресурсами АИС.

Анализ данных (англ. «Data Analysis») – процесс, ориентированный на извлечение полезной информации и получение из неё результатных данных; статистические исследования, как правило, связанные с обсчетом многомерной системы данных наблюдений, имеющей множество параметров.

Атрибут (лат. «attribuo» – придаю, наделяю) – показатель, характеризующий некоторый объект сущности и принимающий для конкретного экземпляра объекта конкретное числовое, текстовое или иное значение.

 

Б

 

Банк данных (англ. «Data Bank») – совокупность конкретной базы данных, СУБД, прикладных компонентов ИС (набор входных и выходных форм, типовых запросов для решения информационно-технологических задач в конкретной предметной области), а также комплекс технических средств, на которых они реализованы.

База данных (англ. «Database») – набор данных, обычно в форме таблиц или файлов, под управлением системы управления базой данных.

Бизнес-процесс (англ. «Business Process») – полный отклик бизнеса на событие. Бизнес-процесс состоит из одного или нескольких шагов и имеет четко определенный результат (outcome).

Бизнес-система (англ. «Business System») – объединение человеческих ресурсов и автоматизированных приложений, сформированное для достижения конкретной группы бизнес-целей (выражения делового намерения).

 

В

 

Веб-интеграция (англ. «Web-integration») – объединение внутренних и внешних информационных ресурсов при помощи веб-технологий с целью более эффективного использования корпоративной информационной системы.

Векторное изображение – совокупность графических примитивов (точек, отрезков, эллипсов и др.). Каждый примитив описывается математическими формулами.

Внешняя сущность (англ. «External Entity») – сущность, не входящая в область прикладной системы, и выступающая в роли источника либо приемника потоков данных. В качестве внешней сущности может рассматриваться физическое лицо, организационная единица, другая прикладная система, или любой другой объект, осуществляющий информационный обмен с внутренней функцией прикладной системы.

 

Г

 

Географическая информационная (геоинформационная) система (ГИС)информационная система, обеспечивающая сбор, хранение, обработку, доступ, отображение и распространение пространственно-координированных данных (пространственных данных). Основу ГИС составляют автоматизированные картографические системы, а главными источниками информации служат различные геоизображения.

 

Д

 

Делопроизводство – отрасль деятельности, обеспечивающая документирование и организацию работы с официальными документами (документооборот).

Дескриптор (англ. «Descriptor») – нормативное ключевое слово, предназначенное для координатного индексирования документов и информационных запросов, по определенным правилам отобранное из основного словарного состава естественного языка.

Диаграмма «сущность-связь», ER-диаграмма (англ. «Entity Relationship Diagram») – Диаграмма, графически представляющая сущности, связи между ними, и атрибуты, используемые для их описания.

Дискретизация переход от аналоговой (непрерывной) формы сигнала к дискретной путём его развёртки по времени и квантования по величине.

Документ (англ. «Document») – под этим термином будем понимать хранящийся в информационной базе, объект произвольной структуры, содержащий информацию произвольного характера, доступ, к которому можно получить по его реквизитам.

Документальная информационно-поисковая система (англ. «Document information retrieval system») – информационно-поисковая система, предназначенная для отыскания документов, содержащих необходимую пользователю информацию.

Документация (англ. «Documentation») – совокупность документов, оформленных по единым правилам.

Документооборот совокупность взаимосвязанных процедур, обеспечивающих движение документов в организации с момента их создания или поступления и до завершения исполнения или отправки и передачи в архив.

 

И

 

Индекс БД (англ. «Database Index») механизм поиска и выборки данных из БД. Индекс может использовать один или несколько столбцов и может служить средством обеспечения уникальности их значений.

Интеграция систем вид деятельности по комплексной автоматизации процессов управления и технологий конкретного предприятия.

Интегрированные (корпоративные) АИС используются для автоматизации всех функций организации и охватывают весь цикл работ от планирования деятельности до сбыта продукции или предоставления услуг. Включают в себя ряд модулей (подсистем), работающих в едином информационном пространстве и выполняющих функции поддержки соответствующих направлений деятельности.

Интеллектуальная информационная система (англ. «Intellectual Information System») – информационная система, основанная на концепции использования базы знаний для генерации алгоритмов решения задач различных классов в зависимости от конкретных информационных потребностей пользователей.

Интеллектуальный анализ данных (англ. «Data Mining») – выявление скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных; процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации).

Интерактивная информационная система (англ. «Interactive Information System») – информационно-вычислительная система, в которой передача и обмен информацией происходят в режиме диалога.

Интерактивный (диалоговый) режим (англ. «Conversational mode»; «Interactive mode») – способ взаимодействия пользователя или оператора с ЭВМ, при котором происходит непосредственный и двухсторонний обмен информацией, командами или инструкциями между человеком и ЭВМ.

Интероперабильность (англ. «Interoperability») – способность к взаимодействию различных аппаратных и программных платформ.
Интерфейс (англ. «Interface») связь между автоматизированными или ручными системами.
Интерфейс пользователя (англ. «User interface») – элементы и компоненты программы, которые способны оказывать влияние на взаимодействие пользователя с программным обеспечением.
Интерфейс системы (англ. «System Interface») механизм создания связи между двумя системами.

Информатика – область человеческой деятельности, связанная с всевозможными информационными процессами, реализуемыми с помощью различных средств компьютерной техники.

Информационная деятельность (англ. «Information Activity») – деятельность, обеспечивающая сбор, обработку, хранение, поиск и распространение информации, а также формирование организационного ресурса и организацию доступа к нему.

Информационная модель (англ. «Information model») модель объекта, процесса или явления, в которой представлены информационные аспекты моделируемого объекта, процесса или явления.

Информационная система (англ. «Information System») – взаимосвязанная совокупность средств, методов и персонала, используемых для хранения, обработки и выдачи информации в интересах достижения поставленной цели.

Информационная система – по законодательству РФ – организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники и связи, реализующих информационные процессы. Информационные системы предназначены для хранения, обработки, поиска, распространения, передачи и предоставления информации.

Информационное обеспечение нгл. «Dataware») – совокупность методов и средств по размещению и организации информации, включающих в себя системы классификации и кодирования, унифицированные системы документации, рационализации документооборота и форм документов, методов создания внутри машинной информационной базы информационной системы.
Информационно-поисковая система (англ. «Information Retrieval System») – система, выполняющая функции: хранения больших объемов информации; быстрого поиска требуемой информации; добавления, удаления и изменения хранимой информации и вывода информации в удобном для человека виде.

Информационно-поисковые языки – искусственные языки, представляющие совокупность средств описания формальной и содержательной структур информации, предназначенные для выражения содержания документов или запросов, описания фактов с целью проведения поиска; искусственные языки, сконструированные для выражения (формулировки) основного смыслового содержания документов и запросов с целью последующего их сопоставления.

Информационные процессы (англ. «Information Processes») – по законодательству РФ – процессы сбора, обработки, накопления, хранения, поиска и распространения информации.

Информационный документ (англ. «Uncontrolled Document») – документ, который готовится однократно и только в информационных целях. Он не подлежит согласованию или контролю изменений.

Информационный поиск (англ. «Information Retrieval») – некоторая последовательность операций, выполняемых с целью отыскания документов, содержащих определённую информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих ответы на данные вопросы.

Информация (франц. и англ. «Information») – это сведения об окружающем мире (объекте, процессе, явлении, событии), которые являются объектом преобразования (включая хранение, передачу и т.д.) и используются для выработки поведения, для принятия решения, для управления или для обучения.

 

К

 

Качество информационной системы – совокупность свойств системы, обусловливающих возможность её использования для удовлетворения информационных потребностей пользователей, определённых в соответствии с её назначением.

Классификация (от лат. «Classis» – группа и «Facere» – делать) – система распределения объектов по классам в соответствии с определённым признаком (основанием классификации).

Кластеризация (англ. «Clusterization») – метод, предназначенный для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации.

Ключевое слово (англ. «Keyword») – предметное слово, выбираемое из некоторого текста (документа) и используемое для координатного индексирования этого текста (документа).

Конечный пользователь (англ. «End User») – пользователь, не работающий непосредственно с системой, но использующий результат ее функционирования.

КонкордансConcordance» лингв.) в лексикографии – пример употребления слова в контексте фиксированной длины. Словари конкордансов включают примеры употребления всех слов в отдельном произведении или во всем творчестве писателя. В машинном переводе с помощью словарей-конкордансов можно достаточно эффективно использовать составление алгоритмов лексической сочетаемости и дистрибуции (распределения) языковых элементов речи.

Концепт – (англ. «concept», от лат. «conceptus» – понятие) – понятие, термин, сущность, категория предметной области, совокупность которых используется для описания фрагментов окружающего мира.

Концептуальная модель данных – схема базы данных в виде ER-модели. Сформированная концептуальная модель данных впоследствии преобразуется в физическую модель данных.

Корпоративная информационная система (КИС) совокупность специализированного программного обеспечения и вычислительной аппаратной платформы, на которой установлено и настроено программное обеспечение.

Кэширование (англ. «Caching») – накопление данных в доступном хранилище, с целью их быстрого извлечения по мере надобности. Кэширование ускоряет процесса обработки информации.

 

Л

 

Лингвистическое обеспечение ИСсовокупность языковых средств, используемых в системе для формализации естественного языка, построения и сочетания информационных единиц в ходе общения персонала с вычислительной техникой с целью повышения качества разработки и эксплуатации, а также облегчения общения человека с ЭВМ.

 

М

 

Масштабируемость программного обеспечения (англ. «Scalability») – способность программного обеспечения корректно работать на малых и на больших системах с производительностью, которая увеличивается пропорционально вычислительной мощности системы.

Математическое обеспечениесовокупность математических методов, моделей и алгоритмов обработки информации, используемых при решении функциональных задач и в процессе автоматизации проектирования ИС.

Международный информационный обмен (англ. «International Information Exchange») – согласно законодательству РФ, означает передачу и получение информационных продуктов, а также оказание информационных услуг через Государственную границу РФ.

Мобильность (переносимость) программного обеспечения – способность программного обеспечения работать на различных аппаратных платформах или под управлением различных операционных систем.

Модель бизнес-процессов (англ. «Business Process Model») – набор потоковых диаграмм процессов, включающий полный набор бизнес-процессов, находящихся в сфере ответственности приложения.

Модель данных (англ. «Data Model») – представление требований бизнес-области к информации (например, ER-модель); схема представления данных.

Модель «сущность-связь», ER-модель тип модели данных, являющийся составной частью бизнес-модели. Включает в себя несколько ER-диаграмм.

Модификация запросов – переформулировка запроса с целью его расширения, добавления терминов в запрос для уточнения информационной потребности.

Мультимедиа – совокупность компьютерных технологий, одновременно использующих несколько информационных сред: графику, текст, видео, фотографию, анимацию, звуковые эффекты, высококачественное звуковое сопровождение.

Мультимедийные информационно-справочные системы – совокупность логически связанных текстовых, графических, аудио- и видеоматериалов.

 

Н

 

Нанотехнологии – технологии производства изделий радиоэлектроники с размерами функциональных элементов порядка нанометров (10 в минус девятой степени, т.е. доли миллиметра).

Наследуемая система (англ. «Legacy System») – существующее хранилище информации и процессов.

Неструктурированная (не формализуемая) задача – задача, в которой невозможно выделить элементы и установить между ними связи.

Нейронные сети (англ. «Neural Networks») – специальные информационные сети, способные обучаться, распознавать неясные для людей модели и адаптировать их при получении новой информации.

Нормализация (англ. «Normalization») – методика исключения избыточности данных.

 

О

 

Обработка данных (англ. «Data processing») – процесс последовательного управления числами и символами, и преобразования их в информацию.

Объёмом документооборота – количество документов, поступивших в организацию и созданных ей за определённый период.

Организационное обеспечение ИС – комплекс документов, регламентирующих деятельность персонала в условиях функционирования ИС.

Открытая система (англ. «Open System») – система, реализующая открытые спецификации (стандарты) на интерфейсы, службы и форматы данных.

 

П

 

Перенос данных (англ. «Data Transfer») – физическое движение данных между приложениями и, возможно, между ЭВМ.

Пертинентность (англ. «Pertinent») – соответствие содержания документа информационной потребности конкретного специалиста; степень соответствия содержания документа, найденного в результате информационного поиска, информационной потребности пользователя, сформулированной в виде информационного запроса.

Пиксел (от англ. аббревиатуры «picsel» означающей словосочетание PICtureS ELement – элемент картинки)– мельчайшая единица компьютерного (цифрового) изображения, точка.

Платформа (англ. «Platform») – функциональный блок, интерфейс и сервис которого являются определяется стандартом, вводимым международной организацией либо группой фирм.

ПОД (поисковый образ документа) описание документа, выраженное средствами ИПЯ и характеризующее основное смысловое содержание или какие-либо другие признаки этого документа, необходимые для его поиска по запросу.

ПОЗ (поисковый образ запроса) записанный на ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания, необходимые для наиболее эффективного осуществления информационного поиска.

Пользователь информационной системы (англ. «Information System User») – лицо, группа лиц или организация, пользующееся услугами информационной системы для получения информации или решения других задач.

Поток данных (англ. «Dataflow») именованный поток информации между бизнес-функциями, хранилищами данных и внешними сущностями. На диаграммах потоков данных представляется в виде стрелки.

Правовое обеспечение ИС – совокупность правовых норм, регламентирующих правоотношения при создании, внедрении и функционировании информационной системы, а так же её юридический статус.

Предметная область – это, с точки зрения информационных систем, часть реального мира, данные о которой отражены в соответствующей базе данных.

Преобразование данных: 1. (англ. «Data Conversion») – перенос данных из старой системы в новую; 2. (англ. «Data Transformation») – переопределение данных на основании заданных правил (соответствующих формул или методик).

Преобразование информации – важный и наиболее часто используемый информационный процесс, представляющий целенаправленную обработку информации.

Прикладная система (англ. «Application System») – автоматизированный набор бизнес-функций, сущностей, модулей, технологических платформ и документации, предназначенный для исполнения набора бизнес-функций.

Прикладной процесс (англ. «Application Process») – процесс, выполняющий обработку данных для нужд пользователей.

Приложение (англ. «Application») – набор работающих совместно программных модулей, предназначенный для поддержки соответствующих им бизнес-функций.

Проверка качества (англ. «Quality Review») – проверка качества результата в смысле соответствия своему назначению и соблюдения стандартов и допущений.

Программное обеспечение – совокупность программ, необходимых для решения функциональных задач, позволяющих наиболее эффективно использовать вычислительную технику, обеспечивая пользователям наибольшие удобства в работе, реализующих функции и задачи ИС и обеспечивающих устойчивую работу комплексов технических средств.

 

Р

 

Распределенная БД (англ. «Distributed Database») – БД, физически расположенная на нескольких связанных компьютерах. Характеризуется тем, что у пользователей и программ создается впечатление работы с локальной БД.

Распределенная обработка (англ. «Distributed Processing») – способность вести одновременную обработку на нескольких компьютерах одновременно, причем каждый из них исполняет свои задачи.

Распределенная среда обработки данных – распределенная обработка данных, представляющая собой стандартный набор сетевых служб для выполнения прикладных процессов, рассредоточенных по группе абонентских систем (по гетерогенной сети).

Растровое изображение – совокупность отдельных пикселей, образующих кодированное цифровое изображение графической информации.

Релевантность (англ. «Relevance») – смысловое соответствие содержания документа информационному запросу; степень соответствия содержания документа, найденного в результате информационного поиска, содержанию информационного запроса.

Реляционная база данных (англ. «Relational Database») – способ хранения данных в связанных между собой отношениями таблицах базы данных. Каждое отношение представляет собой ссылку на запись в другой таблице.

Репликация данных (англ. «Data Replication») – копирование данных с и на ЭВМ с целью уменьшения времени ответа на запрос с локальной станции и повышения доступности данных. Обычно входит в стратегию копирования и восстановления.

Репозиторий (англ. «Repository») – механизм хранения любой информации о системе на любом этапе ее жизненного цикла. Обычное используется для обеспечения расширяемости, восстанавливаемости, целостности системы, соблюдения правил именования и решения многих других задач администрирования.

 

С

 

Связь (англ. «Relationship») – поименованная ассоциация между двумя сущностями, значимая для рассматриваемой предметной области.

Связываемость (англ. «Traceability») – возможность связать компонент прикладной системы с его бизнес-требованием.

Семантика (фр. «Sémantique» от др.-греч. «σημαντικός») – понимании определённых знаков, последовательностей символов и других условных обозначений; раздел семиотики. Сема́нтика в программировании – система правил определения поведения отдельных языковых конструкций. Семантика определяет смысловое значение предложений алгоритмического языка.

Сигнатура (от лат. «signatura» – обозначать, указывать): 1) порядковый номер печатного листа издания, проставляемый в левом нижнем углу на первой странице листа вместе с нормой и на третьей странице – со звездочкой; 2) обозначение тетрадей в книжно-журнальном производстве; 3) (англ. «Signature») означает подпись, характерную черту или какой-то идентификатор.

Система (от греческого «systema» – целое, составленное из частей соединение) – это совокупность элементов, взаимодействующих друг с другом, образующих определенную целостность, единство. Приведем некоторые понятия, часто использующиеся для характеристики системы.

Системы обработки транзакций (англ. «On-Line Transaction Processing», OLTP) преобладают в информационных системах организационного управления для отражения актуального состояния предметной области в любой момент времени. Для них характерен регулярный интенсивный поток довольно простых транзакций, играющих роль заказов, платежей, запросов и т.д.

Система поддержки принятия решений (англ. «Decision Support System», DSS) – приложение, используемое главным образом для объединения, подытоживания и изменения данных с целью подготовки аналитических отчетов и анализа тенденций.

Системы принятия решений – почти всегда интерактивные компьютерные системы, разработанные для оказания помощи специалисту или руководителю в принятии решений. Представляют собой тип АИС, в которых с помощью довольно сложных запросов производится отбор и анализ данных в различных разрезах (временных, географических и по другим показателям).

Система реального времени (англ. «Real-time System») – система, в которой события воздействуют на настоящие механизмы. Такие системы обычно управляют механизмами (например, система управления самолетом) и часто критичны с точки зрения времени или безопасности.

Система управления базой данных (англ. «Database Management System» DBMS) – программная среда, структурирующая и обрабатывающая данные и обеспечивающая безопасность данных, их целостность и восстановление.

Склад данных, хранилище данных (англ. «Warehouse») – набор предметно-ориентированных данных, предназначенный для выборки информации и поддержки принятия решений.

Слияние данных (англ. «Data Integration») – движение данных между двумя сосуществующими системами. Обмен данными может происходить раз в час, в день и т.д.

Событие (англ. «Event») – событие в сфере деятельности, на которое должен быть дан ответ.

Среда (англ. «Environment») – полное описание предприятия, в котором установлена система. Включает описание подразделений, складов, видов запасов и общесистемных управляющих параметров.

Стандарт (англ. «Standard») – набор правил, нацеленных на обеспечение качества. Обычно стандарты устанавливаются для результатов, их компонентов и процессов.

Стратегия (англ. «Strategy»; «Strategics») – набор методов и средств решения перспективных долгосрочных задач.

Стратегическая информационная система – информационная система, обеспечивающая поддержку принятия решений для реализации перспективных стратегических целей развития организации.

Структурированная (формализуемая) задача – задача, в которой известны все её элементы и взаимосвязи между ними.

Сущность (англ. «Entity») – реальный либо воображаемый объект, информация о котором представляет интерес для системы. В базе данных реализуется одной или несколькими таблицами.

Схема (англ. «Schema») – реализованная в БД информационная модель.

 

Т

 

Таблица (англ. «Table») – двумерное представление данных в реляционной СУБД, определяемое одним или несколькими столбцами и первичным ключом. Таблица наполняется строками данных.

Тезаурус (англ. «Thesaurus») – семантическая сеть, в которой понятия связаны регулярными и устойчивыми семантическими отношениями – иерархическими (например, род-вид, целое-часть), ассоциативными, а также отношениями эквивалентности. Отдельное понятие определённой области знаний в тезаурусе представлено словом или словосочетанием, соотносящимся с другими словами и словосочетаниями и образующим вместе с ними замкнутую систему.

Техническое обеспечение ИСкомплекс технических средств сбора, регистрации, передачи, обработки, отображения, размножения информации, оргтехники и других, обеспечивающих работу ИС.

 

У

 

Управление (англ. «Management») – процесс планирования, контроля и завершения функций бизнеса.

Управление доступом (англ. «Access Control») – способность управлять наличием у пользователей (или групп пользователей) прав выбирать, создавать, изменять или удалять данные из хранилища, такого, как реляционная база данных.

Управление качеством (англ. «Quality Management») – средство проведения политики в области качества. Оно принимает формы планирования, качества, его обеспечения, контроля и повышения.

 

Ф

 

Фактографическая информационная система – система, оперирующая фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных.

Фактографическая информация – сведения не только фактического характера, но и теоретического, предположительного, оценочного характера, т.е. включающие и факты, и концепции, всё то, что может быть объектом извлечения из текста, описания на определённом информационном языке, хранения и поиска в той или иной информационной системе.

Фактографическая информационно-поисковая система (англ. «Factographic information retrieval system») – информационно-поисковая система, обеспечивающая выдачу непосредственно фактических сведений, затребованных потребителем в информационном запросе.

Формализация (англ. «Formalization») – процесс построения информационных моделей с помощью формальных языков.

Фрактальная графика – разновидность компьютерной графики, в которой формирование изображений основано на математических формулах, уравнениях, описывающих те или иные фигуры, поверхности, тела. При этом само изображение в памяти компьютера фактически не хранится, а получается в результате обработки некоторых данных.

 

Х

 

Хранилище (англ. «Store») – собрание используемых в проекте информации или материалов.

Хранилище данных: 1. (англ. «Datastore») – умозрительное общее место хранения элементов данных, используемых указанными бизнес-функциями и процессами; 2. Хранилище данных (англ. «Data Warehouse») – электронное хранилище, позволяющее формировать интегрированную информационную среду, включающую разнородные информационные ресурсы.

Хэш-функция (англ. «Hash-function») – функция, осуществляющая хэширование (кеширование) массива данных посредством отображения значений из их большого множества в существенно меньшее множество значений.

 

Э

 

Экспертная система (ЭС, англ. «Expert Systems») – компьютерная программа, созданная для выполнения тех видов деятельности, которые под силу человеку-эксперту.

Электронная цифровая подпись (англ. «Electronic Digital Signature») – реквизит электронного документа, предназначенный для придания ему статуса документа и защиты от подделки.

Электронный архив (англ. «Electronic Archive») – совокупность аппаратно-программных средств и технологий для создания хранилища электронных документов и обеспечения доступа к ним из систем управления электронными документами.

Электронный документ (англ. «Electronic Document») – документ, в котором информация представлена в электронно-цифровой форме.

Электронный документооборот (англ. «Electronic Data Interchange», EDI) – электронный обмен деловыми документами между автоматизированными системами различных организаций в стандартизованной форме.

Электронный обмен данными (англ. «Electronic Data Interchange», EDI) – эффективное средство передачи различных, в том числе коммерческих, данных непосредственно из одной компьютерной системы в другую.

Электронный офис (англ. «Electronic Office») – офис, в котором преобладают информационные компьютерные технологии (ЭВМ, коммуникационная и организационная техника) и электронные носители информации.

Элемент системы – часть системы, имеющая определённое функциональное назначение.

Энтропия – (от греч. «entropía» – поворот, превращение): в термодинамике – для определения меры необратимого рассеяния энергии; в статистической физике – мера вероятности осуществления какого-либо макроскопического состояния; в теории информации – мера неопределенности какого-либо опыта (испытания), который может иметь разные исходы.

Эргономическое обеспечение ИС – совокупность методов и средств, используемых на разных этапах разработки и функционирования ИС, предназначено для создания оптимальных условий высокоэффективной и безошибочной деятельности человека, для быстрейшего освоения ИС.

 

Я

 

Язык структурированных запросов (англ. «Structured Query Language», SQL) – международно-признанный стандарт языка реляционных СУБД, предложенный Американским национальным институтом стандартов (ANSI). Поддерживает запросы, а также описание и обработку данных, обеспечение безопасности и некоторых аспектов ссылочной и сущностной безопасности.

 

Используемые сокращения

 

АС – автоматизированная система.

АСД – автоматизированная система делопроизводства.

АИИС – автоматизированная информационно-справочная система.

АИС – автоматизированная информационная система.

АИПС автоматизированная информационно-поисковая система.

АРМ – автоматизированное рабочее место.

АСУ – автоматизированная система управления.

АСУП – автоматизированная система управления предприятием.

АСУ ТП – система управления производственными технологическими процессами.

АСУ ТС – система управления техническими средствами.

АЦП – аналогово-цифровой преобразователь.

БД – база данных.

БО – библиографическое описание.

ВТ – вычислительная техника.

ВЦ – вычислительный центр.

ВЦКП – вычислительный центр коллективного пользования.

ГИС – географическая информационная (геоинформационная) система.

ДОУ – документационное обеспечение управления.

ЕКИС – единая корпоративная информационная система.

ИАД – интеллектуального анализа данных.

ИАС – информационно-аналитическая система.

ИИС – интеллектуальная информационная система.

ИП – информационный процесс.

ИПС – информационно-поисковая система.

ИПЯ – информационно-поисковый язык.

ИР – информационный ресурс.

ИРИ – избирательное распространение информации.

ИС – информационная система.

ЛО – лингвистическое обеспечение.

НИТ – новые информационные технологии.

ОАСУ – отраслевая автоматизированная система управления.

ПК – персональный компьютер.

ПО – программное обеспечение.

ПОД – поисковый образ документа.

ПОЗ – поисковый образ запроса.

ППП – пакет прикладных программ.

САПР – система автоматизированного проектирования.

СВТ – средства вычислительной техники.

СМИ – средства массовой информации.

СОД – система обработки данных.

СППР – система поддержки принятия решений.

СУБД – система управления базами данных.

СЭДО – система электронного документооборота.

ЦАП – цифро-аналоговый преобразователь.

ЦОД – центр обработки данных.

ЭВМ – электронно-вычислительная машина.

ЭСОД – электронная система обработки данных.

ЭК – электронный каталог.

 


Литература

 

1.       Автоматизированные информационные системы / Н. А. Криницкий, Г. Д. Миронов, Г. Д. Фролов. – М.: Наука, 1982. – 384 с.

2.       Автоматизированные информационные технологии в экономике. Учебник/ Под ред. Г. А. Титоренко. – М.: Юнити, 2006. – 400 с.

3.       Алешин, Л. И. Автоматизированные информационные системы (Study-Guide) / Л. И. Алешин. – М.: МФПА, 2006. – 290 с. (Серия «непрерывное образование»).

4.       Алешин, Л. И. Информационные технологии и системы. Учебное пособие+Тетрадь-практикум / Л. И. Алешин. – М.: МФПА, 2008. – 320 с. (Серия «Непрерывное образование»).

5.       Волкова, В. Н. Документальные и документально-фактографические информационные системы: Учеб. пособие / В. Н. Волкова; М-во общ. и проф. образования Рос. Федерации, С.-Петерб. гос. техн. ун-т. – СПб.: Изд-во СПбГТУ, 1998. – 68 с.

6.       Гайдамакин, Н. А. Автоматизированные информационные системы, базы и банки данных. Вводный курс: Учебное пособие /Н. А. Гайдамакин. – М.: Гелиос АРВ, 2002. – 368 с.

7.       Дейт, К. Введение в системы баз данных. 6-е изд/ К. Дейт. – М.; СПб: Вильямс, 2000. – 848 с.

8.       Диго, С. М. Учебное пособие по курсу «Базы данных»/С. М. Диго. – М: ММИЭИФП, 2004. – 177 с.

9.       Дубинский, А. Г. Проблема автоматизации поиска информации в глобальной сети/А. Г. Дубинский // Проблемы автоматизации информационных технологий. – Днепропетровск, 1999.– С. 40–48.

10.   Замыцкова О. И. Делопроизводство: Документационное обеспечение управления. – М.: Феникс, 2009. – 376 с.

11.   Зайцева, Е. М. Лингвистическое обеспечение АБИС: шаги на месте и движение вперед в сравнении с другими информационными/ Е. М. Зайцева // Науч. и техн. б-ки. – 2004.–№2.–С. 5–9.

12.   Избачков, Ю. С. Информационные системы. Учебник для вузов.–2-е издание/ Ю. С. Избачков, В. Н. Петров. –СПб.: Питер, 2005. – 656 с.

13.   Информационные системы в экономике: Учеб. пособие/Т. Л. Партыка, Н. З. Емельянова, И. И. Попов. – М.: ФОРУМ: ИНФРА-М, 2006. − 464 с.

14.   Исследование принципов и критериев оценки эффективности функционирования информационно-поисковых систем Интернета/ В. А. Яцко, А. А. Нестеренко, Т. Н. Вишняков и др. – Абакан, 2005. – 82 с.

15.   Когаловский, М. Р. Перспективные технологии информационных систем/ М. Р. Когаловский. – М.: ДМК Пресс; Компания АйТи, 2003. – 288 с.

16.   Компьютерные системы и сети: Учеб. пособие /Под ред. В. П. Косарева и Л. В. Еремина. – М.: Финансы и статистика, 2000. – 464 с.

17.   Лапшин, П. Б. Новости в сфере поисковых систем Интернета/ П. Б. Лапшин //НТИ. – Сер.1. – 2003.–№12. – С. 1–8.

18.   Максимов, Н. В. Компоненты и технологии интерактивного поиска документальной информации/ Н. В. Максимов // Международный форум по информатике и документалистике. – 2001, Т.26, №3.

19.   Меняев, М. Ф. Обработка фактографической информации в системах управления организации. Учебное пособие; Моск. гос. техн. ун-т им. Н.Э. Баумана/М. Ф. Меняев. – М.: Изд-во МГТУ, 2004.–84 с.

20.   Морган, Э. Электронные книги, библиотеки и право собственности/Э. Морган// Научные и технические библиотеки. – 2001.–№8.–С. 27–34.

21.   Основы построения автоматизированных информационных систем: Учебное пособие/ Н. З. Емельянова, Т. Л. Партыка, И. И. Попов. – М.: Форум: ИНФРА-М, 2005.–416 с.

22.   Першиков, В.И. Толковый словарь по информатике/ В. И. Першиков, В. М. Савинков. – М.: Финансы и статистика, 1991. – 192 с.

23.   Сычев, А. В. Информационно-поисковые системы [Электронный ресурс]/А. В. Сычев. – Воронеж: ВГУ, 2002.–Режим доступа: http://company.yandex.ru/class/courses/sychev.xml.

24.   Соколов В. С. Документационное обеспечение управления. Учебник/В. С. Соколов. – М.: Форум: Инфра-М, 2007. – 176 с.

25.   Сэлтон, Г. Автоматическая обработка, хранение и поиск информации/ Пер. с англ. Под ред. А. И. Китова. – М.: ИНФРА, 2003. – 560 с.

26.   Талантов, М. Профессиональный поиск в Интернете: полнота, достоверность, скорость [Электронный ресурс]//Компьютер-Пресс, 1999, №7. – Режим доступа: http://compress.ru/Archive/CP/1999/7/13/.

27.   Устинова, Г. М. Информационные системы менеджмента: Современные аналитические технологии в поддержке принятия решений. Учебное пособие/ Г. М. Устинова. – СПб.: ДиаСофтЮП, 2000. – 368 с.

28.   Филинов, Е. Н. Формирование и развитие национальной информационной инфраструктуры России/ Е. Н. Филинов//Связь времен: Сборник. – М.: МГВП КОКС, 2004. – С. 769–773.

29.   Цветков, В. Я. Геоинформационные системы и технологии/В. Я. Цветков. – М.: Финансы и статистика, 1998. –288 с.

 

Ресурсы Интернета:

1.      www.rbcinfosystems.ru – РБК – медиа-компания, занимающая лидирующие позиции в сегменте бизнес-информации в России и СНГ.

2.      www.sas.com. Сайт SAS Institute GmbH – разработчик и поставщик программного обеспечения, методологии интеллектуального анализа и прогнозирования поведения экономических объектов.

3.      www.bis.ru – банковские ИС.

4.      www.infosys.ru/infosys/company/about_isys.shtml – открытое акционерное общество «Информационные системы» (организовано в 1991 году).

5.      www.pravo.uz – юридическая ИС.

6.      www.folio.ru – «Фолио Купец» корпоративная информационная система для автоматизации предприятий.

7.      www.consultant.ru – «КонсультантПлюс» (образованная в 1992 году) разработчик компьютерной справочно-правовой системы.

8.      www.digdes.ru – Компания Digital Design (основана в 1992 году) занимается созданием и совершенствованием систем управления бизнесом, развитие и поддержка информационных систем.

9.      www.insysgel.ru/ – предоставление полного спектра услуг по автоматизации управления и учета на предприятиях (1С Франчайзинг).

10. www.corisys.ru – «CORIS» корпоративные ИС.

11. http://iastech.org – создание и сопровождение информационно-аналитических систем.

 

 



[1] Предметная область – это, с точки зрения информационных систем, часть реального мира, данные о которой отражены в соответствующей базе данных.

[2] СУБД – система управления базами данных.

[3] Устинова, Г.М. Информационные системы менеджмента. Учебное пособие.СПб: ДиаСофт ЮП, 2000.

[4] Релевантность – смысловое соответствие содержания документа информационному запросу.

[5] Источник: http://www.romver.ru/services/621.html.

[6] Пертинентность – соответствие содержания документа информационной потребности конкретного специалиста.

[7] Формальная релевантность – наличие в документе контекстных ситуаций, затребованных пользовательским запросом. Кроме формальной, выделяют содержательную и индивидуально-прагматическую релевантность. Содержательная релевантность – соответствие содержания документа информационной потребности пользователя. Индивидуально-прагматической релевантностью называют пертинентностью.