Технология и методы обработки экономической информации
Экономическая информационная система по своему составу напоминает предприятие по переработке данных и производству выходной информации. Как и в любом производственном процессе, в ЭИС присутствует технология преобразования исходных данных в результатную информацию. Понятие технология определяется как система взаимосвязанных способов обработки материалов и приемов изготовления продукции в производственном процессе.
Под информационной технологией (ИТ) понимается система методов и способов сбора, накопления, хранения, поиска и обработки информации на основе применения средств вычислительной техники.
Упорядоченная последовательность взаимосвязанных действий, выполняющихся с момента возникновения информации до получения результата, называется технологическим процессом.
Понятие информационной технологии, таким образом, неотделимо от той специфической среды, в которой она реализована, т.е. от технической и программной среды. Следует заметить, что информационная технология - достаточно общее понятие и как инструмент может использоваться различными пользователями, как непрофессионалами в компьютерной области, так и разработчиками новых ИТ.
Функциональная часть ЭИС всегда связана с предметной областью и понятием информационных технологий. Вообще говоря, технология как некоторый прецесс присутствует в любой предметной области. Так, например, технология выдачи кредита банком может иметь свои особенности в зависимости от вида кредита, вида залога и др. В ходе выполнения этих технологических процессов сотрудник банка обрабатывает соответствующую информацию.
Решение экономических и управленческих задач всегда тесно связано с выполнением ряда операций по сбору необходимой для решения этих задач информации, переработке ее по некоторым алгоритмам и выдаче лицу, принимающему решение (ЛПР), в удобной форме. Очевидно, что технология принятия решений всегда имела информационную основу, хотя обработка данных и осуществлялась вручную. Однако с внедрением средств вычислительной техники в процесс управления появился специальный термин информационная технология.
Чтобы терминологически выделить традиционную технологию решения экономических и управленческих задач, введем, термин предметная технология, которая представляет собой последовательность технологических этапов по модификации первичной информации в результатную. Например, технология бухгалтерского учета предполагает поступление первичной документации, которая трансформируется в форму бухгалтерской проводки. Последняя, изменяя состояние аналитического учета, приводит к изменению счетов синтетического учета и далее баланса.
ИТ отличаются по типу обрабатываемой информации (рис. 1.4), но могут объединяться в интегрированные технологии.
Рис. 1.4. Классификация ИТ в зависимости от типа обрабатываемой информации
Выделение, предложенное на этом рисунке, в известной мере условно, поскольку большинство этих ИТ позволяет поддерживать и другие виды информации. Так, в текстовых процессорах предусмотрена возможность выполнения примитивных расчетов, табличные процессоры могут обрабатывать не только цифровую, но и текстовую информацию, а также обладают встроенным аппаратом генерации графики. Однако каждая из этих технологий все-таки в большей мере акцентирована на обработке информации определенного вида.
Очевидно, что модификация элементов, составляющих понятие ИТ, дает возможность образования огромного их количества в различных компьютерных средах.
И сегодня можно говорить об обеспечивающих ИТ (ОИТ) и функциональных ИТ (ФИТ).
Обеспечивающие ИТ - технологии обработки информации, которые могут использоваться как инструментарий в различных предметных областях для решения различных задач. Информационные технологии обеспечивающего типа могут быть классифицированы относительно классов задач, на которые они ориентированы. Обеспечивающие технологии базируются на совершенно разных платформах, что обусловлено различием видов компьютеров и программных сред, поэтому при их объединении на основе предметной технологии возникает проблема системной интеграции. Она заключается в необходимости приведения различных ИТ к единому стандартному интерфейсу.
Функциональная ИТ представляет собой такую модификацию обеспечивающих ИТ, при которой реализуется какая-либо из предметных технологий. Например, работа сотрудника кредитного отдела банка с использованием ЭВМ обязательно предполагает применение совокупности банковских технологий оценки кредитоспособности ссудозаемщика, формирования кредитного договора и срочных обязательств, расчета графика платежей и других технологий, реализованных в какой-либо информационной технологии: СУБД, текстовом процессоре и т.д. Трансформация обеспечивающей информационной технологии в чистом виде в функциональную (модификация некоторого общеупотребительного инструментария в специальный) может быть сделана как специалистом-проектировщиком, так и самим пользователем. Это зависит от того, насколько сложна такая трансформация, т.е. от того, насколько она доступна самому пользователю; экономисту. Эти возможности все более и более расширяются, поскольку обеспечивающие технологии год от года становятся дружественнее. Таким образом, в арсенале сотрудника кредитного отдела могут находиться как обеспечивающие технологии, с которыми он постоянно работает: текстовые и табличные процессоры, так и специальные функциональные технологии: табличные процессоры, СУБД, экспертные системы, реализующие предметные технологии.
Предметная технология и информационная технология влияют друг на друга. Так, например, наличие пластиковых карточек как носителя финансовой информации принципиально меняет предметную технологию, предоставляя такие возможности, которые без этого носителя просто отсутствовали. С другой стороны, предметные технологии, наполняя специфическим содержанием ИТ, акцентируют их на вполне определенные функции. Такие технологии могут носить типовой характер или уникальный, что зависит от степени унификации технологии выполнения этих функций.
В качестве примера можно привести банковскую технологию работы с картотекой №3, которая содержит документы, поступившие на обработку и не выполненные из-за закрытия лицевого счета по мотивам финансового контроля. В этом случае сначала закрывается счет. Затем, если применяется информационная технология, эта запись помечается номером картотеки, с тем чтобы вес остальные документы, уменьшающие остаток на счете, попадали бы в эту картотеку. В структуре операционно-учетного отдела банка первая и вторая функции могут выполняться как одним исполнителем, так и двумя разными операционистами. Кроме того, процессы выполнения этих функций могут быть разнесены во времени. Таким образом, пометка в лицевом счете, сделанная при его временном закрытии одним операционистом, используется другим операционистом в процессе обработки поступающих к оплате документов. В то же время эта пометка может быть сделана тем операционистом, который является ответственным исполнителем по данному счету (открывает, закрывает счета, обеспечивает операции по счету, начисление процентов и др.).
Классификация ИТ по типу пользовательского интерфейса (рис.1.5) позволяет говорить о системном и прикладном интерфейсе. И если последний связан с реализацией некоторых функциональных ИТ, то системный интерфейс - это набор приемов взаимодействия с компьютером, который реализуется операционной системой или ее надстройкой. Современные операционные системы поддерживают командный, W1MP- и SILK- -интерфейсы. В настоящее время поставлена проблема создания общественного интерфейса (social interface).
Рис. 1.5. Классификация ИТ по типу пользовательского интерфейса
Командный интерфейс - самый простой. Он обеспечивает выдачу на экран системного приглашения для ввода команды. Например, в операционной системе MS-DOS приглашение выглядит как С:\>, а в операционной системе UNIX - это обычно знак доллара.
WIMP-интерфейс расшифровывается как Windows (окно) Image (образ) Menu (меню) Pointer (указатель). На экране высвечивается окно, содержащее образы программ и меню действий. Для выбора одного из них используется указатель.
SILK-интерфейс расшифровывается - Spich (речь) Image (образ) Language (язык) Knowledge (знание). При использований SILK-интерфейса на экране по речевой команде происходит перемещение от одних поисковых образов к другим по смысловым семантическим связям.
Общественный интерфейс будет включать в себя лучшие решения WIMP- и SILK-интерфейсов. Предполагается, что при использовании общественного интерфейса не нужно будет разбираться в меню. Экранные образы однозначно укажут дальнейший путь. Перемещение от одних поисковых образов к другим будет проходить по смысловым семантическим связям.
Операционные системы (ОС) делятся на однопрограммные, многопрограммные и многопользовательские. К однопрограммным операционным системам относятся, например, MS-DOS и др. Многопрограммные операционные системы, например UNIX (XENIX), Windows, начиная с версии 3.1, DOS 7.0, OS/2 и др., позволяют одновременно выполнять несколько приложений. Различаются они алгоритмом разделения времени. Если однопрограммные системы работают или в пакетном режиме, или в диалоговом, то многопрограммные могут совмещать указанные режимы. Таким образом, эти системы обеспечивают пакетную и диалоговую технологии.
Многопользовательские системы реализуются сетевыми операционными системами. Они обеспечивают удаленные сетевые технологии, а также пакетные и диалоговые технологии для общения на рабочем месте. Все три типа информационных технологий находят самое широкое распространение в экономических информационных системах.
Большинство обеспечивающих и функциональных ИТ могут быть использованы управленческим работником без дополнительных посредников (программистов). При этом пользователь может влиять на последовательность применения тех или иных технологий. Таким образом, с точки зрения участия или неучастия пользователя в процессе выполнения функциональных ИТ все они могут быть разделены на пакешые и диалоговые.
Экономические задачи, решаемые в пакетном режиме, характеризуются следующими свойствами:
· алгоритм решения задачи формализован, процесс ее решения не требует вмешательства человека;
· имеется большой объем входных и выходных данных, значительная часть которых хранится на магнитных носителях;
· расчет выполняется для большинства записей входных файлов;
· большое время решения задачи обусловлено большими объемами данных;
· регламентность, т.е. задачи решаются с заданной периодичностью.. Диалоговый режим является не альтернативой пакетному, а его развитием если применение пакетного режима позволяет уменьшить вмешательство пользователя в процесс решения задачи, то диалоговый режим предполагает отсутствие жестко закрепленной последовательности операций обработки данных (если она не обусловлена предметной технологией).
Особое место занимают сетевые технологии, которые обеспечивают взаимодействие многих пользователей.
Информационные технологии различаются по степени их взаимодействия между собой (рис. 1.6). Они могут быть реализованы различными техническими средствами: дискетное и сетевое взаимодействие, а также с использованием различных концепций обработки и хранения данных: распределенная информационная база и распределенная обработка данных.
Рис. 1.6. Классификация ИТ по степени их взаимодействия
Стандарт пользовательского интерфейса для диалоговых ИТ.
Пользовательский интерфейс включает в себя три понятия: общение приложения с пользователем; общение пользователя с приложением; язык общения. Язык общения определяется разработчиком программного приложения. Свойствами интерфейса являются: конкретность и наглядность. Наиболее распространенный ранее командный интерфейс имел ряд недостатков (многочисленность команд, отсутствие стандарта для приложений и т.д.), что ограничивало круг его применения. Для преодоления этих недостатков были предприняты попытки его упростить (например, Norton Commander (NC)). Однако настоящим решением проблемы стало создание графической оболочки для операционной системы. В настоящее время практически все распространенные операционные системы используют для своей работы графический интерфейс. Примером здесь может служить интерфейс, разработанный в исследовательском центре Пало Альто фирмы Xerox для компьютеров Macintosh фирмы Apple. Немного позже была разработана графическая оболочка под названием Microsoft Windows, реализующая технологию WIMP и удовлетворяющая стандарту CUA. Новшеством были применение мыши, выбор команд из меню, предоставление программам отдельных окон, использование для обозначения программ образов в виде пиктограмм.
Удобство интерфейса и богатство возможностей делают Windows оптимальной системой для повседневной работы. Приложения, написанные под Windows, используют тот же интерфейс, поэтому его единообразие сводит к минимуму процесс обучения работе с любым приложением Windows. Выход на рынок Windows-95 еще более упростил работу пользователя, так как интерфейс стал еще более простым, документированным, включающим встроенные коммуникационные возможности.
Некоторые наиболее распространенные информационные технологии
Самыми распространенными компьютерными технологиями являются редактирование текстовых данных, обработка графических и табличных данных.
Для работы с текстом используются текстовые процессоры (или редакторы).
К настоящему времени разработано много текстовых процессоров. В целом назначение у них одно, но предоставляемые возможности и средства их реализации - разные. То же относится к графическим процессорам и электронным таблицам.
Среди текстовых процессоров Windows, как наиболее распространенной среды, можно выделить Write и Word. Технология их использования основана на интерфейсе WIMP, но возможности процессоров типа Word значительно расширены и в какой-то мере его можно рассматривать как настольную издательскую систему.
Какие функции обеспечивают текстовые процессоры? Это набор текста, хранение его на компьютерных носителях, просмотр и печать. В большинстве процессоров реализованы функции проверки орфографии, выбора шрифтов и кеглей, центровки заголовков, разбиения текста на страницы, печати в одну или несколько колонок, вставки в текст таблиц и рисунков, использования шаблонов постраничных ссылок, работа с блоками текста, изменения структуры документа.
Для быстрого просмотра текста ему может быть присвоен статус черновика, а также изменен масштаб изображения. Перемещение по тексту упрощается за счет использования закладок.
С помощью средств форматирования можно создать внешний вид документа, изменить стиль, подчеркнуть, выделить курсивом, изменить размеры символов, выделить абзацы, выровнять их влево, вправо, к центру, выделить их рамкой.
Перед печатью документа его можно просмотреть, проверить текст, выбрать размер бумаги, задать число копий при печати.4
Повторяющиеся участки текста, например обращение в письме или заключительные слова, можно обозначить как автотекст, присвоить имя. В дальнейшем вместо данного текста достаточно указать его имя, а текстовый процессор автоматически заменит его.
Потребность ввода графиков, диаграмм, схем, рисунков, этикеток в произвольный текст или документ вызвала необходимость создания1 графических процессоров. Графические процессоры представляют собой инструментальные средства, позволяющие создавать и модифицировать графические образы с использованием соответствующих информационных технологий:
· коммерческой графики;
· иллюстративной графики;
· научной графики.
Информационные технологии коммерческой графики обеспечивают отображение информации, хранящейся в табличных процессорах, базах данных и отдельных локальных файлах в виде двух- или трехмерных графиков типа круговой диаграммы, столбиковой гистограммы, линейных графиков и др.
ИТ иллюстративной графики дают возможность создания иллюстраций для различных текстовых документов в виде регулярных - различные геометрические фигуры (так называемая векторная графика) - и нерегулярных структур - рисунки пользователя (растровая графика). Процессоры, реализующие ИТ иллюстративной растровой графики, позволяют пользователю выбрать толщину и цвет линий, палитру заливки, шрифт для записи и наложения текста, созданные ранее графические образы. Кроме того, пользователь может стереть, разрезать рисунок и перемещать его части. Эти средства реализованы в ИТ Paint Brush. Но есть ИТ, позволяющие просматривать изображения в режиме слайдов, спецэффектов и оживлять их (Corell Draw, Storyboard, 3d Studio).
ИТ научной графики предназначены для обслуживания задач картографии, оформления научных расчетов, содержащих химические, математические и прочие формулы.
Большинство графических процессоров удовлетворяют стандарту пользовательского интерфейса W1MP. Панель содержит меню действий и линейки инструментов и цветов. Линейка инструментов состоит из набора графических символов, требующихся для построения практически любого рисунка. Линейка цветов содержит цветовую гамму монитора компьютера.
Документы табличного вида составляют большую часть документооборота предприятия любого типа. Поэтому табличные ИТ особо важны при создании и эксплуатации ЭИС. Комплекс программных средств, реализующих создание, регистрацию, хранение, редактирование, обработку электронных таблиц и выдачу их на печать, принято называть табличным процессором. Электронная таблица представляет собой двухмерный массив строк и столбцов, размещенный в памяти компьютера.
Широкое распространение получили такие табличные процессоры, как SupcrCalc, VisiCalc, Lotus 1-2-3, Quattro Pro. Для Windows был создан процессор Excel, технология работы с. которым аналогична работе с любым приложением Windows интерфейса WIMP.
Табличный процессор позволяет решать большинство финансовых и административных задач, например, таких, как расчет заработной платы и другие учетные задачи; прогнозирование продаж, роста рынка, доходов; анализ процентных ставок и налогов; подготовка финансовых деклараций и балансовых таблиц; ведение бухгалтерских книг для учета платежей; сметные калькуляции; учет денежных чеков; бюджетные и статистические расчеты.
Основной единицей электронной таблицы является имеющий имя рабочий лист, где она располагается. Место пересечения строки со столбцом называется ячейкой или полем. Существуют два варианта адресации ячеек: абсолютная и относительная. Абсолютная адресация наиболее употребительна. Адресом ячейки (идентификатором) служат буква, указывающая столбец, и цифра, указывающая номер строки. И то, и другое видно на рабочем листе. При относительной адресации в верхней строке состояния указывается приращение со знаком от начала искомой клетки. В нижней строке рабочего листа дается расшифровка выбранного действия меню. В верхней части располагаются меню действий, панель инструментов и строка сумматора, где отражаются все воспроизводимые действия.
Ширина столбца и высота строки даются по умолчанию. Однако имеется возможность форматирования ячейки, столбца, строки, листа. При этом можно изменить стиль текста, что позволяет улучшить внешний вид документа без применения текстового редактора.
Данные в виде чисел, текста или формул вводятся в ту ячейку, которая отмечена текстовым курсором. Для указания блока ячеек достаточно обозначить адрес левой верхней ячейки диагонали блока, адрес нижней правой ячейки диагонали или, наоборот, поставить между ними точку либо двоеточие. Можно блок задать выделением.
Редактирование таблиц позволяет копировать, удалять, очищать ячейку, блок, лист и выполнять многие другие функции, перечисленные в меню действия Правка и Вставка. Можно вставить в таблицу посредством OLE-технологии рисунок, график, диаграмму, любой другой объект, подготовленный другой программой.
Большинство электронных таблиц имеют средства создания графиков и диаграмм, средства их редактирования и включения в нужное место листа. Кроме того, в них имеется большое число встроенных функций - математических, статистических и других. Это существенно облегчает процесс вычислений и расширяет диапазон применений. Пользователю предоставляется возможность переопределить панель инструментов, вид рабочего листа, изменить масштабирование, включить полосы прокрутки, переключатели, меню. Сервисные функции табличного процессора Excel позволяют проверить орфографию текста, защитить данные от чтения или записи. Возможно создание диалоговых окон или обращение к динамическим библиотекам. Заметим, что в табличном процессоре Excel есть средство создания макросов - Visual Basic. Он является объектно-ориентированным языком программирования. Отличие его, например, от C++ или Pascal в том, что в Visual Basic нет возможности создавать новые типы объектов или порождать потомков уже существующих: Однако пользователь получает большой набор готовых объектов: рабочие книги, листы, ячейки, диаграммы и т. д.
Все табличные процессоры позволяют создавать базы данных и предоставляют удобные средства работы с ними.
В Microsoft Excel 5.0 имеется один тип файла - рабочая книга, состоящая из рабочих листов, листов диаграмм и макросов, но при этом все листы подшиты в рабочую книгу. Такой подход упрощает работу с несколькими документами за счет быстрого доступа к каждому листу через ярлычки в нижней части листа, позволяет работать с листами, объединенными в группу, например группу учетных карточек на товар. Причем, если производится группа действий на одном листе, эти действия автоматически повторяются на всех листах группы, что упрощает оформление нескольких однотипных по структуре листов. Объемные ссылки позволяют создать сводный документ на основе данных из нескольких листов без ввода громоздких формул с внешними ссылками. Микротехнология «Мастер сводных таблиц» позволяет выбрать нужные данные из документа, представить их сводной таблицей, изменяя структуру, внешний вид, добавляя итоговые строки, группировать и сортировать. В рабочую книгу можно включать информацию о теме, авторе, ключевых словах. Ее же можно использовать при поиске файла на диске или при выяснении его назначения.
При выполнении всех функций в процессоре Excel можно использовать многооконную систему, позволяющую выполнять параллельные действия. Все объекты, созданные пользователем (сформированные таблицы, сводные таблицы, макросы, выборки из базы, диаграммы и графики), можно сохранить на диске в виде файла или распечатать.
На одном рабочем месте пользователь, как правило, имеет дело с разнотипной информацией. Использование для обработки каждого типа данных индивидуального программного инструмента усложняет технологический процесс работы, затрудняет пересылку данных для обработки несколькими средствами. Поэтому сначала появились интегрированные пакеты, совмещавшие в себе различные ИТ: текстовый, табличный и графический процессоры, систему управления базой данных, например Frame Work, Simphony и др. Для оболочки Windows был разработан набор технологий Works-2. Их цель - облегчение перемещения информации между различными приложениями - частями общего пакета. Далее в интегрированные пакеты были добавлены средства трехмерной графики, менеджер информации, системы электронного распознавания документов, электронной почты. Таким пакетом является Novell Perfect Office 3.0 для Windows. Он включает: современный текстовый процессор (Word Perfect 6.1); электронную таблицу с возможностью использования базы данных, построения графиков и диаграмм (Quattro Pro 4.1); программу для создания слайдовых шоу, презентационную графику, аналогичную по возможностям CorelDRAW (Presentations 3.0); персональный менеджер информации (Infocentral 1.1); систему электронного распространения документов (стандарт EYY), позволяющую перемещать документы по сети и просматривать их даже в том месте, где нет Perfect Office (Envoy 1.0a) и средство планирования (GroupWise 4.1 Client), которое используется для групповой работы с информацией и реализует встроенные коммуникации, и применение электронной почты.
В отечественной разработке - электронном офисе СКАТ (система комплексной автоматизации торговли) в системе LotusNotes для Windows интегрируется система управления базой данных, электронной почты, средств защиты информации и средств разработки приложений: текстовый и графический редакторы, электронные таблицы. Пакет СКАТ реализует подсистемы: склад комплектующих, склад готовой продукции, счета, договоры и другие документы, заказы на поставку, список фирм, прайс-лист, справочники, настройка системы, документация.
Электронный офис Link Works фирмы Digital обеспечивает централизованное хранение данных на основе средств реляционной СУБД и управление документооборотом в рамках сетевой технологии клиент-сервер. Этот интегрированный пакет помимо реляционной базы данных содержит текстовый, графический и табличный процессоры, которые, взаимодействуя между собой, реализуют объектно-ориентированный подход. Последний заключается в том, что пользователь работает с теми же объектами, что и раньше, до приобретения этого пакета (договоры, накладные, прайс-листы).
Пакет мобилен и работает в среде различных ОС, он обеспечивает взаимодействие с глобальными системами (по Протоколу TCP/IP или DECnet) и электронной почтой.
Информационные сетевые технологии.
В 60-х гг. появились первые вычислительные сети (ВС) ЭВМ. По сути дела они начали своего рода техническую революций, сравнимую с появлением первых ЭВМ, так как была предпринята попытка объединить технологию сбора, хранения, передачи и обработки информации на ЭВМ с техникой связи.
Одной из первых сетей, оказавших влияние на дальнейшее их развитие, явилась есть АРПА, созданная пятьюдесятью университетами и фирмами США. В настоящее время она охватывает всю территорию США, часть Европы и Азии. Сеть АРПА доказала техническую возможность и экономическую целесообразность разработки больших сетей для более эффективного использования ЭВМ и программного обеспечения.
В 60-х гг. в Европе сначала были разработаны и внедрены международные сети EIN и Евронет, затем появились национальные сети. В 1972 г. в Вене была внедрена сеть МИПСА, в 1979 г. к ней присоединились 17 стран Европы, СССР, США, Канада, Япония. Она предназначена для проведения фундаментальных работ по проблемам энергетики, продовольствия, сельского хозяйства, здравоохранения и т.д. Кроме того, благодаря новой технологии сеть позволила всем национальным институтам развивать связь друг с другом.
В 80-х гг. сдана в эксплуатацию система телеобработки статистической информации (СТОСИ), обслуживающая Главный вычислительный центр Центрального статистического управления СССР в Москве и республиканские вычислительные центры в союзных республиках.
В настоящее время в мире зарегистрировано более 200 глобальных сетей, 54 из которых созданы в США, 16 - в Японии.
С появлением микроЭВМ и персональных ЭВМ возникли локальные вычислительные сети. Они позволили поднять на качественно новую ступень управление производственным объектом, повысить эффективность использования ЭВМ, улучшить качество обрабатываемой информации, реализовать безбумажную технологию, создать новые технологии. Объединение ЛВС и глобальных сетей открыло доступ к мировым информационным ресурсам.
Все ЭВМ, объединенные в сеть, делятся на основные и вспомогательные. Основные ЭВМ - это абонентские ЭВМ (клиенты). Они выполняют вес необходимые информационно-вычислительные работы.и определяют ресурсы сети. Вспомогательные ЭВМ (серверы) служат для преобразования и передачи информации от одной ЭВМ к другой по каналам связи и коммутационным машинам (host-ЭВМ). К качеству и мощности серверов предъявляются повышенные требования, а в роли хост-машины могут выступать любые ПЭВМ.
Клиент - приложение, посылающее запрос к серверу. Он отвечает за обработку, вывод информации и передачу запросов серверу. В качестве ЭВМ клиента может быть использована любая ЭВМ.
Сервер- персональная или виртуальная ЭВМ, выполняющая функции по обслуживанию клиента и распределяющая ресурсы системы: принтеры, базы данных, программы, внешнюю память и др. Сетевой сервер поддерживает выполнение функций сетевой операционной системы, терминальный - выполнение функций многопользовательской системы. Сервер баз данных обеспечивает обработку запросов к базам данных в многопользовательских системах. Он является средством решения сетевых задач, в которых локальные сети используются для совместной обработки данных, а не просто для организации коллективного использования удаленных внешних устройств.
Host-ЭВМ -ЭВМ, установленная в узлах сети и решающая вопросы коммутации в сети. Коммутационная сеть образуется множеством серверов и host-ЭВМ, соединенных физическими каналами связи, которые называют магистральными. В качестве магистральных каналов используют коаксиальные и оптоволоконные кабели, кабели типа «витая пара».
По способу передачи информации вычислительные сети делятся на сети коммутации каналов, сети коммутации сообщений, сети коммутации пакетов и интегральные сети.
Первыми появились сети коммутации каналов. Например, чтобы передать сообщение между клиентами В и Е (рис. 1.7), образуется прямое соединение, включающее каналы одной из групп: 3, 5,7; 1, 2,4, 6; 1, 2, 5, 7; 3,4, 6. Это соединение должно оставаться неизменным в течение всего сеанса. Легкость реализации такого способа передачи информации влечет за собой и его недостатки: низкий коэффициент использования каналов, высокую стоимость передачи данных, увеличение времени ожидания других клиентов.
Рис. 1.7. Пример сети ЭВМ: Л, В, С, D, E, F - абонентские пункты; КМ - коммуникационные машины; 1-7 - магистральные каналы
При коммутации сообщений информация передается порциями, называемыми сообщениями. Прямое соединение обычно не устанавливается, а передача сообщения начинается после освобождения первого канала и так далее, пока сообщение не дойдет до адресата. Каждым сервером осуществляются прием информации, ее сборка, проверка, маршрутизация и передача сообщения. Недостатками коммутации сообщений являются низкая скорость передачи данных и невозможность проведения диалога между клиентами, хотя стоимость передачи и уменьшается.
При коммутации пакетов обмен производится, короткими пакетами фиксированной структуры. Пакет - часть сообщения, удовлетворяющая некоторому стандарту. Малая длина пакетов предотвращает блокировку линий связи, не дает расти очереди в узлах коммутации. Это обеспечивает быстрое соединение, низкий уровень ошибок, надежность и эффективность использования сети. Но при передаче пакета возникает проблема маршрутизации, которая решается программно-аппаратными методами. Наиболее распространенными способами являются фиксированная маршрутизация и маршрутизация способом кратчайшей очереди. Фиксированная маршрутизация предполагает наличие таблицы маршрутов, в которой закрепляется маршрут от одного клиента к другому, что обеспечивает простоту реализации, но одновременно и неравномерную загрузку сети. В методе кратчайшей очереди используется несколько таблиц, в которых каналы расставлены по приоритетам. Приоритет - функция, обратная расстоянию до адресата. Передача начинается по первому свободному каналу с высшим приоритетом. При использовании этого метода задержка передачи пакета минимальная.
В настоящее время разработаны программно-аппаратные средства маршрутизации. Повторитель (repeater) - самый простой тип устройства для соединения однотипных ЛВС, он ретранслирует все принимаемые пакеты из одной ЛВС в другую. Устройство связи, позволяющее соединять ЛВС с одинаковыми и разными системами сигналов, называется мостом. Устройство связи, аналогичное мосту (маршрутизатор), выполняет передачу пакетов в соответствии с определенными протоколами, обеспечивает соединение ЛВС на сетевом уровне. Шлюз - устройство соединения ЛВС с глобальной сетью.
Сети, обеспечивающие коммутацию каналов, сообщений и пакетов, называются интегральными. Они объединяют несколько коммутационных сетей. Часть интегральных каналов используется монопольно, т. е. для прямого соединения. Прямые каналы создаются на время проведения сеанса связи между различными коммутационными сетями. По окончании сеанса прямой канал распадается на независимые магистральные каналы. Интегральная сеть эффективна, если объем информации, передаваемой по прямым каналам, не превышает 10-15%.
При разработке сетей ЭВМ возникает задача согласования взаимодействия ЭВМ клиентов, серверов, линий связи и других устройств. Она решается путем установления определенных правил, называемых протоколами. Реализацию протоколов совместно с реализацией управления серверами называют сетевой ОС. Часть протоколов реализуется программно, часть - аппаратно. Для стандартизации протоколов была создана Международная организация по стандартизации (МОС) - ISO. Она ввела понятие архитектуры открытых систем, что означает возможность взаимодействия систем по определенным правилам, хотя сами системы могут быть созданы на различных технических средствах. Основой архитектуры открытых систем является понятие уровня логической декомпозиции сложной информационной сети. Система разбивается на ряд подсистем, или уровней, каждый из которых выполняет свои функции. ISO установила семь таких уровней.
Первый уровень, физический, определяет некоторые физические характеристики канала. Это требования к характеристикам кабелей разъемов (RS, EIA, X.21) и электрическим характеристикам сигнала (например, модель V.22 бис обеспечивает скорость передачи данных 2400 бод). В 1994 г. в Европе утвержден стандарт V.32 для работы на любых каналах. В нем определены десять процедур, по которым модем после тестирования линии (первоначально по стандарту V.21) выбирает соответствующие качеству линии несущие частоты и полосу пропускания (11 комбинаций) и пр. По типу характеристик сети делятся на аналоговые (V.21 и др.), например обычная телефонная есть, и цифровые, для которых разработан стандарт ISDN, распространенный за рубежом.
Второй уровень, канальный, управляет передачей данных между двумя узлами сети. Он обеспечивает контроль корректности передачи сблокированной информации. Каждый блок снабжается контрольной суммой. В последних разработках этот контроль перемещается в аппаратную среду. Модем, работающий по одному из протоколов коррекции ошибок и обнаруживший таковую, запрашивает перепередачу. Для повышения скорости обмена осуществляется сжатие данных по типу архивации с применением тех же алгоритмов, например алгоритма, используемого в архиваторе ARC, или алгоритма Зимпеля в архиваторе PKZIP. При получении сообщения оно разворачивается. Длина передаваемого блока может меняться в зависимости от качества канала. В настоящее время используются Протоколы V.42 бис (CCITT), MNP5, MNP7.
Трети и уровень, сетевой, обеспечивает управление потоком, маршрутизацию. Он распространяется на соглашения о блокировании данных и адресации. По одному каналу может передаваться информация с нескольких модемов для увеличения его загрузки. К этому уровню относятся Протоколы Х.25 и Х.75 (космический). Для объединения неоднородных сетей различных технологий используется Протокол IP.
Четвертый уровень, транспортный, отвечает за стандартизацию обмена данными между программами, находящимися на разных ЭВМ сети (ТР0.ТР1).
Пятый уровень, сеансовый, определяет правила диалога прикладных программ, рестарта, проверки прав доступа к сетевым ресурсам.
Шестой уровень, представительный, определяет форматы данных, алфавиты, коды представления специальных и графических символов (ASCII, EBCDIC, ASN.1..X.409).
Седьмой уровень, прикладной, определяет уровень услуг. Например, Протокол Х.400 связан со стандартизацией электронной почты. Известны такие технические средства, как телекс, телефакс, видеотекс, телетекс и др. При этом телекс поддерживает стандарт скорости передачи информации, принятый в 1988 г. в 50 бод. Телетекс обеспечивает уже 1200 бод.
Стандартизация распространяется на логический уровень передаваемой информации. Прежде всего - это стандарт на форму передаваемых документов. В банковской системе распространен стандарт SWIFT. Он определяет расположение и назначение полей документа. Принципиальным моментом при использовании этого и других компьютерных стандартов на документацию является официальное признание (де-юре) передаваемого по каналам связи документа юридически полноценным.
В апреле 1989 г. 44-я сессия Европейской экономической комиссии ООН объявила следующее десятилетие периодом широкомасштабного внедрения в международную торговлю универсальной системы электронного обмена данными в управлении, торговле и на транспорте (UN/ EDIFACT). С 1 января 1995 г. Европейский союз' (ЕС) перешел на обязательное использование EDIFACT при обмене документацией и информацией между госведомствами ЕС, работающими на английском, французском, немецком, испанском языках. ЦБ РФ в 1993 г. в ходе переговоров с Европейским банком реконструкции и развития (ЕБРР) столкнулся с недостаточностью использования SWIFT, поскольку для работы с европейскими банками необходимо постоянное средство общения всех участников. EDIFACT, являясь таким средством, представляет собой структурированный язык описания различных видов коммерческой деятельности. С помощью элементов и сегментов стандартных информационных сообщений можно составлять описание любого делового документа, форматировать его электронное отображение и передавать абоненту. Полученное им сообщение разворачивается в обычную форму и может быть распечатано в виде твердой копии документа. Использование этой схемы сокращает издержки обращения в торговле на 30 % [1]. В России в августе 1994 г. постановлением правительства (N540) принято решение о создании центра эффективной торговли с использованием международных стандартов и средств связи, затраты по которому составляют 1 млн дол. Дальнейшее создание региональных центров будет осуществляться на основе частичных взносов региональных администраций и предпринимателей данного региона, банков, финансирующих внешнеторговые операции. Ведущими организациями по распространению EDIFACT в России являются В/О "ИнформВЭС", Роскоминформ, ЦБ РФ, Государственный таможенный комитет, Ассоциация пользователей электронной передачи информации, Минтранс, РАН и др.
Каждый уровень решает свои задачи и обеспечивает сервисом расположенный над ним уровень. Правила взаимодействия разных систем одного уровня называют протоколом, правила взаимодействия соседних уровней в одной системе - интерфейсом. Каждый протокол должен быть прозрачным для соседних уровней. Прозрачность - свойство передачи информации, закодированной любым способом, быть понятным взаимодействующим уровням.
Сети делятся на общественные, частные и коммерческие. По рекомендациям ISO для физического уровня определены следующие классы общественных сетей: до 1000 км - средней длины; до 10 000 км - длинные; до 25 000 км - самые длинные наземные; до 80 000 км - магистральные через спутник; до 160 000 км - магистральные международные через два спутника.
Локальные сети делятся на централизованные и одноранговые. Централизованные используют файл-сервер. Рабочие станции не контактируют друг с другом. Число пользователей более десяти. В одноранговых сетях сетевое управление таково, что каждый узел может выступать и как рабочая станция, и как файл-сервер. Рабочие станции можно объединить и совместно использовать базы на файл-сервере. Такие сети недорогие, но число пользователей невелико. К наиболее распространенным локальным сетевым ОС относят. UNIX - для создания средних и больших сетей с сотнями пользователей; NetWare 3.11 -для создания средних сетей от 20 до 100 пользователей в пределах одного здания; VINES — для создания больших распределенных ЛВС; LAN Manager - для средних и больших сетей с числом пользователей от 25 до 200.
Не менее распространенной стала технология компьютерного способа пересылки и обработки информационных сообщений, обеспечивающая оперативную связь между руководством рабочих групп, сотрудниками, учеными, деловыми людьми, бизнесменами и всеми желающими. Такая технология получила название электронной почты.
Электронная почта - специальный пакет программ для хранения и пересылки сообщений между пользователями ЭВМ. Посредством электронной почты реализуется служба безбумажных почтовых отношений. Она является системой сбора, регистрации, обработки и передачи любой информации (текстовых документов, изображений, цифровых данных, звукозаписи и т.д.) по сетям ЭВМ и выполняет такие функции, как редактирование документов перед передачей, их хранение в специальном банке; пересылка корреспонденции; проверка и исправление ошибок, возникающих при передаче; выдача подтверждения о получении корреспонденции адресатом; получение и хранение информации в своем «почтовом ящике»; просмотр полученной корреспонденции.
«Почтовый ящик» - специально организованный файл для хранения корреспонденции. Почтовый ящик состоит из двух корзин: отправления и получения. Любой пользователь может обратиться к корзине получения другого пользователя и сбросить туда информацию. Но просмотреть ее он не может. Из корзины отправлений почтовый сервер забирает информацию для рассылки другим пользователям. Каждый почтовый ящик имеет сетевой адрес. Для пересылки корреспонденции можно установить связь с почтовым ящиком адресата в режиме on-line. Например, в сети SpnnlMail пользователь, зарегистрировавшись и получив определенный статус, по телефонным каналам может входить в ближайший к нему узел сети и сообщаться с нужными абонентами в режиме on-line. Этот способ неудобен, так как необходимо ждать, пока будет включена ЭВМ получателя. Поэтому более распространенным методом является выделение отдельных компьютеров в качестве почтовых отделений, называемых почтовыми серверами. При этом все компьютеры получателей подключены к ближайшему почтовому серверу, получающему, хранящему и пересылающему дальше по сети почтовые отправления, пока они не дойдут до адресата. Отправка адресату осуществляется по мере его выхода на связь с ближайшим почтовым сервером в режиме off-line. Примером может служить сеть Relcom. Пользователь передаст сообщение вместе с адресом по телефонному каналу через модем на ближайший почтовый сервер в режиме on-line. Сообщение регистрируется, ставится в очередь и по первому свободному каналу передастся на следующий почтовый сервер, пока адресат не заберет его в свой почтовый ящик. Почтовые серверы реализуют следующие функции: обеспечение быстрой и качественной доставки информации, управление сеансом связи, проверка достоверности информации и корректировка ошибок, хранение информации до востребования и извещение пользователя о поступившей в его адрес корреспонденции, регистрация и учет корреспонденции, проверка паролей при запросах корреспонденции, поддержка справочников с адресами пользователей.
Пересылка сообщений пользователю может выполняться в индивидуальном, групповом и общем режимах. При индивидуальном режиме адресатом является отдельный компьютер пользователя и корреспонденция содержит его адрес. При групповом режиме корреспонденция рассылается одновременно группе адресатов. Эта группа может быть сформирована по-разному. Почтовые серверы имеют средства распознавания группы. Например, в качестве адреса может быть указано: «получить всем, интересующимся данной темой» или указан список рассылки. В общем режиме корреспонденция отправляйся всем пользователям - владельцам почтовых ящиков. Посредством двух последних режимов можно организовать телеконференцию, электронные доски объявлений. Во избежание перегрузки почтовых ящиков в почтовых серверах хранятся справочники адресов, содержащих фильтры для групповых и общих сообщений.
Электронная почта поддерживает текстовые процессоры для просмотра и редактирования корреспонденции, информационно-поисковые системы для определения адресата, средства поддержания списка рассылаемой информации, средства предоставления расширенных видов услуг: факс, телекс и т.д.
Электронная почта moaci быть организована в локальной сети внутри предприятия для обеспечения внутреннего обмена информацией Например, ее. mail фирмы Lotus Development (отделение IBM) [12] Она служит для автоматизации внутриофисных операций. Ориентирована на DOS, Windows, OS/2, Macintosh, UNIX. Может обеспечивать межсистемный обмен с другими электронными почтами по глобальным сетям ЭВМ. Например, ее mail может быть подключена через любые каналы, включая спутниковые, посредством Протоколов Х.25, Х.75 к MHS, Sprint, Relcom, MCI Mail, Profs, AT&T, Easylink, 3ComMaiI, Soft Switch и другим сетям.
Если ранее применялись самостоятельные пакеты электронной почты, то сейчас наблюдается тенденция включения ее в интегрированные пакеты, например, электронный офис фирмы Novell для Windows - Perfect Office 3 0 Windows-95 поступила на отечественный рынок в августе 1995 г. Она сама и большинство приложений содержат встроенные коммуникационные возможности
Большинство глобальных сетей ЭВМ поддерживают электронную почту. В современных интегрированных пакетах используется объектно-ориентированная технология, а работа пользователя сводится к работе с меню. Почтовый ящик дополняется корзиной для мусора, куда пользователь может поместить ненужную корреспонденцию. Однако в случае необходимости он может оттуда се забрать или окончательно выбросить.
Электронная почта применяется во всех деловых сферах, сокращая время организации сделок Для расширения сферы услуг уже созданы системы взаимодействия электронной почты с сетями факсов и телексов. Например, система DECfaxMail обеспечивает обмен факсимильными сообщениями по телефонной линии с такими системами электронной почты, как Digital, cc Mail, MS Mail, MS Word for Windows. Электронная почта проникает и на бытовой уровень, становясь средством общения соседей из одного дома, улицы, разных стран.
Сетевые технологии позволяют создавать геосистемы для доступа к любым мировым хранилищам информации любых типов.
Распределенные технологии обработки и хранения данных.
При использовании информационных технологий сетей ЭВМ становится возможной реализация территориального распределения производства Для администрации фирмы безразлично, где именно находится производство, в этом здании, за 100 м или за 10 000 км. Появляются совсем другие проблемы, такие, как межконтинентальное снабжение, поясное время и т.д. Поскольку становится возможным планетарное распределение промышленного производства, могут создаваться транснациональные компании, реализующие мировой товарный экспорт внутри фирмы. При этом метрополия, вложив 5 - 7 % от суммы оборота в экономику другой страны, получает возможность контролировать 50 - 60 % ее экономики. Объясняется это тем, что за счет вложения наукоемких технологий страна-метрополия получает возможность оказывать влияние и даже осуществлять контроль за экономическим и политическим развитием другой страны. Например, 80 % всех международных кредитных операций совершаются банками США. Инвалютные резервы центральных банков западных стран на 75 % состоят из американских долларов, а 55 % расчетов по международной торговле реализуется американскими долларами. Т.е. США расплачиваются воспроизводимыми ресурсами: продуктами сельского хозяйства, информационными технологиями, научно-техническими знаниями, долларами. Это становится возможным благодаря новейшим сетевым технологиям и развитию коммуникаций.
Одной из важнейших сетевых технологий является распределенная обработка данных. Персональные компьютеры стоят на рабочих местах, т.е. на местах возникновения и использования информации. Они соединены каналами связи. Это дало возможность распределить их ресурсы по отдельным функциональным сферам деятельности и изменить технологию обработки данных в направлении децентрализации. Распределенная обработка данных позволила повысить эффективность удовлетворения изменяющейся информационной потребности информационного работника и тем самым обеспечить гибкость принимаемых им решений Преимущества распределенной обработки данных: большое число взаимодействующих между собой пользователей, выполняющих функции сбора, регистрации, хранения, передачи и выдачи информации, снятие пиковых нагрузок с централизованной базы путем распределения обработки и хранения локальных баз данных на разных ЭВМ; обеспечение доступа информационного работника к вычислительным ресурсам сети ЭВМ; обеспечение симметричного обмена данными между удаленными пользователями.
Введение классификации моделей представления данных на иерархические, сетевые и реляционные отразилось на архитектуре систем управления базами данных и технологии их обработки. Архитектура СУБД описывает ее функционирование как взаимодействие процессов двух типов: клиента и сервера.
Распределенная обработка и распределенная база данных не синонимы. Если при распределенной обработке производится работа с базой, то подразумевается, что представление данных, их содержательная обработка, работа с базой на логическом уровне выполняются на персональном компьютере клиента, а поддержание базы в актуальном состоянии - на сервере. В случае использования распределенной базы данных последняя размещается на нескольких серверах. Работа с ней осуществляется на тех же персональных компьютерах или на других, и для доступа к удаленным данным надо использовать сетевую СУБД.
В системе распределенной обработки клиент может послать запрос к собственной локальной базе или удаленной. Удаленный запрос — единичный запрос к одному серверу. Несколько удаленных запросов к одному серверу объединяются в удаленную транзакцию. Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределенной. При этом один запрос транзакции обрабатывается одним сервером. Распределенная СУБД позволяет обрабатывать один запрос несколькими серверами. Такой запрос называется распределенным. Только обработка распределенного запроса поддерживает концепцию распределенной базы данных.
Базы данных - автоматизированные хранилища оперативно обновляемой информации. Если в 70-е гг. шла торговля "сырой" информацией, данными, то в наше время созданы автоматизированные аналитические комплексы, торгующие результатами анализа "сырой" информации. Такие базы называют "серой" нефтью (мозг). Например, в США фирмы объединились в Ассоциацию информационной индустрии, что позволило обеспечить реализацию 80 % мировых информационных услуг.
Созданы базы данных по всем направлениям человеческой деятельности: финансовой, экономической, научно-технической, электронной документации, кредитной, статистической, маркетинга, газетных сообщений, правительственных распоряжений, патентной информации, библиографической и т.д. При этом базы делятся на коммерческие и общественные.
Организация обработки данных зависит от способа их распределения. Существуют централизованный, децентрализованный и смешанный способы распределения данных.
Централизованная организация данных является самой простой для реализации (рис. 1.8) На одном сервере находится единственная копия базы данных. Все операции с базой данных обеспечиваются этим сервером. Доступ к данным выполняется с помощью удаленного запроса или удаленной транзакции. Достоинством такого способа является легкая поддержка базы данных в актуальном состоянии, а недостатком!— то, что размер базы ограничен размером внешней памяти; все запросы направляются к единственному серверу с соответствующими затратами на стоимость связи и временную задержку. Отсюда - ограничение на параллельную обработку. База может быть недоступной для удаленных пользователей при появлении ошибок связи и полностью выходит из строя при отказе центрального сервера.
Рис. 1.8. Централизованная организация данных
Децентрализованная организация данных предполагас1 разбиение информационной базы на несколько физически распределенных Каждый клиент пользуется своей базой данных, которая может быть либо частью общей информационной базы (рис 1.9), либо копией информационной базы в целом (рис 1.10), что приводит к ее дублированию для каждого клиента.
Рис 1.9. Децентрализованная организация данных способом распределения
Рис 1.10. Децентрализованная организация данных способом дублирования
При распределении данных на основе разбиения база данных размещается на нескольких серверах. Существование копий отдельных частей недопустимо. Достоинства этого метода: большинство запросов удовлетворяются локальными базами, что сокращает время ответа; увеличиваются доступность данных и надежность их хранения; стоимость запросов на выборку и обновление снижается по сравнению с централизованным распределением; система останется частично работоспособной, если выйдет из строя один сервер. Имеются и недостатки: часть удаленных запросов или транзакций может потребовать доступ ко всем серверам, что увеличивает время ожидания и цену обслуживания; необходимо иметь сведения о размещении данных в различных БД. Однако доступность и надежность увеличатся. Расчлененные базы данных наиболее подходят к случаю совместного использования локальных и глобальных сетей ЭВМ.
Способ дублирования заключается в том, что в каждом сервере сети ЭВМ размещается полная база данных. Это обеспечивает наибольшую надежность хранения данных. Недостатки способа: повышенные требования к объему внешней памяти, усложнение корректировки баз, так как требуется синхронизация в целях согласования копий. Достоинства - все запросы выполняются локально, что обеспечивает быстрый доступ. Данный способ используется, когда фактор надежности является критическим, база небольшая, интенсивность обновления невелика.
Возможна и смешанная организация хранения данных, которая объединяет два способа распределения: разбиение и дублирование (рис. 1.11), приобретая при этом и преимущества, и недостатки обоих способов Появляется необходимость хранить информацию о том, где находятся данные в сети. При этом достигается компромисс между объемом памяти под базу в целом и под базу в каждом сервере, чтобы обеспечить надежность и эффективность ее работы; легко реализуется параллельная обработка, т с. обслуживание распределенного запроса, или транзакции Несмотря на гибкость смешанного способа организации данных, остается проблема взаимозависимости факторов, влияющих на производительность системы, проблема ее надежности и выполнения требовании к памяти Смешанный способ организации данных можно использовать лишь при наличии сетевой СУБД.
Рис. 1.11. Смешанная организация данных
В базах данных коллективного пользования центральным технологическим звеном становятся серверы баз данных. Программные средства серверов баз данных обеспечивают реализацию многопользовательских приложений, централизованное хранение, целостность и безопасность данных. Производительность серверов баз данных на порядок выше по сравнению с файл-серверами, которые используются в локальных сетях. Локальные вычислительные сети создавались для совместного использования дорогостоящего периферийного оборудования. Использование сервера баз данных обеспечило доступ многих пользователей к одним и тем же файлам. Это и стало предпосылкой создания сетевых СУБД.
Мощность сетевых СУБД, основанных на файл-сервере, в настоящее время недостаточна. В нагруженной сети неизбежно падает производительность, нарушаются безопасность и целостность данных. Проблема производительности возникла не потому , что процессоры 386 не обладают достаточной мощностью, а потому что файл-серверы реализуют принцип «все или ничего». Полные копии файлов базы перемещаются взад-вперед по сети. Проблемы с безопасностью, целостностью возникли из-за того, что с самого начала файл-серверы не были сконструированы с учетом сохранения целостности данных и их восстановления в случае аварии.
Технология клиент-сервер, как более мощная, заменила технологию файл-сервер. Она позволила совместить достоинства однопользовательских систем (высокий уровень диалоговой поддержки, дружественный интерфейс, низкая цена) с достоинствами более крупных компьютерных систем ( поддержка целостности, защита данных, многозадачность)
В классическом понимании СУБД представляет собой набор программ, позволяющих создавать и поддерживать базу данных в актуальном состоянии. Функционально СУБД состоит из трех частей: ядра (базы данных), языка и инструментальных средств программирования.
Инструментальные средства программирования относятся к интерфейсу клиента, или внешнему интерфейсу. Они могут включать процессор обработки данных на языке запросов. Язык - это совокупность процедурных и непроцедурных команд, поддерживаемых СУБД. Наиболее употребительными языками являются SQL и QBE. Ядро выполняет все остальные функции, которые включены в понятие «обработка базы данных»
Основная идея технологии клиент-сервер заключается в том, чтобы серверы расположить на мощных машинах, а приложения клиентов, использующих язык, - на менее мощных машинах. Тем самым будут задействованы ресурсы более мощного сервера и менее мощных машин клиентов. Ввод-вывод к базе основан не на физическом дроблении данных, а на логическом, т.е. сервер отправляет клиентам не полную копию базы, а только логически необходимые порции, тем самым сокращая трафик сети. Трафик сети - это поток сообщений сети. В технологии клиент-сервер программы клиента и его запросы хранятся отдельно от СУБД. Сервер обрабатывает запросы клиентов, выбирает необходимые данные из базы данных, посылает их клиентам по сети, производит обновление информации, обеспечивает целостность и сохранность данных.
Рассмотрим основные виды технологии распределенной обработки данных.
1. Технология клиент-сервер, ориентированная на автономный компьютер, т.е. и клиент, и сервер размещены на одной ЭВМ. По функциональным возможностям такая система аналогична централизованной СУБД. Ни распределенная обработка, ни распределенная СУБД не поддерживаются.
2. Технология клиент-сервер, ориентированная на централизованное распределение. При использовании этой технологии клиент получает доступ к данным одиночного удаленного сервера, данное могут только считываться, динамический доступ к данным реализуется- посредством удаленных транзакций и запросов, их число должно быть невелико, чтобы не снизилась производительность системы.
3. Технология клиент-сервер, ориентированная на локальную вычислительную сеть. Эта технология характеризуется следующими особенностями: единственный сервер обеспечивает доступ к базе; клиент формирует процесс, отвечающий за содержательную обработку данных, их представление и логический доступ к базе; доступ к базе данных замедлен, так как клиент и сервер связаны через локальную сеть.
4. Технология клиент-сервер, ориентированная на изменения данных в одном месте. В случае применения этой технологии реализуется обработка распределенной транзакции; удаленные серверы не связаны между собой сетью ЭВМ, т.е. отсутствует сервер-координатор; клиент может изменять данные только в своей локальной базе; возникает опасность «смертельных объятий», т.е. ситуация, когда задача А ждет записи, заблокированные задачей В, а задача В ждет записи, заблокированные задачей А. Поэтому распределенная СУБД должна иметь средство контроля совпадений противоречивых запросов. Распределение данных реализует метод расчленения.
5. Технология клиент-сервер, ориентированная на изменение данных в нескольких местах. В отличие от предыдущей технологии здесь имеется сервер-координатор, поддерживающий протокол передачи данных между различными серверами Возможна обработка распределенных транзакций в разных удаленных серверах. Это создаст предпосылки разработки распределенной СУБД. Реализуется стратегия смешанного распределения путем передачи копий с помощью СУБД.
6. Технология клиент-сервер, ориентированная на распределенную СУБД. Она обеспечивает стратегию разбиения и дублирования, позволяет получить более быстрый доступ к данным. Распределенная СУБД обеспечивает независимость клиента от места размещения сервера, глобальную оптимизацию, распределенный контроль целостности базы, распределенное административное управление.
Во всех технологиях существуют два способа связи прикладных программ клиента и. сервера баз данных: прямой и непрямой. При прямом соединении прикладная программа клиента связывается непосредственно с сервером базы данных, а при непрямом- доступ к удаленному серверу обеспечивается средствами локальной базы. Возможно объединение обоих способов.
Использование технологии клиент-сервер позволяет перенести часть работы с сервера на ЭВМ клиента, оснащенную инструментальными средствами для выполнения его профессиональных обязанностей. Тем самым данная технология позволяет независимо наращивать возможности сервера баз данных и совершенствовать инструментальные средства клиента. Недостаток технологии клиент-сервер заключается в повышении требований к производительности ЭВМ- сервера, в усложнении управления вычислительной сетью, а при отсутствии сетевой СУБД - в сложности организации распределенной обработки.
Под операционной средой сервера баз данных понимают возможности ОС компьютера и сетевой ОС. Каждый сервер баз данных может работать на определенном типе компьютера и сетевой ОС. Операционные системы серверов - это DOS версии 5.0, XENIX, UNIX, Windows NT, OS/2 и др. В настоящее время наиболее употребительными являются около десяти серверов, в частности SQL-server, SQLBASE-server, ORACLE-server и др. По экспертным оценкам, серверам баз данных принадлежит будущее
Серверы баз данных рассчитаны на поддержку большою числа различных типов приложении Для реализации интерфейса с сервером базы данных можно использовать объектно-ориентированные средства, электронные таблицы, текстовые процессоры, графические пакеты, настольные издательства и другие информационные технологии.
Гипертекстовая технология.
В 1945 г. В. Буш, научный советник президента Г. Трумэна, проанализировав способы представления информации в виде отчетов, докладов, проектов, графиков, планов и поняв неэффективность такого представления, предложил способ размещения информации по принципу ассоциативного мышления. На базе этого принципа была разработана модель гипотетической машины МЕМЕКС. Через 20 лет Т. Нельсон реализовал этот принцип на ЭВМ и назвал его гипертекстом.
Обычно любой текст представляется как одна длинная строка символов, которая читается в одном направлении. Гипертекстовая технология заключается в том, что текст представляется как многомерный, т.е. с иерархической структурой типа сети. Материал текста делится на фрагменты. Каждый видимый на экране ЭВМ фрагмент, дополненный многочисленными связями с другими фрагментами, позволяет уточнить информацию об изучаемом объекте и двигаться в одном или нескольких направлениях по выбранной связи
Гипертекст обладает нелинейной сетевой формой организации материала, разделенного на фрагменты, для каждого из которых указан переход к другим фрагментам по определенным типам связей. При установлении связей можно опираться на разные основания (ключи), но в любом случае речь идет о смысловой, семантической близости связываемых фрагментов. Следуя указанным связям, можно читать или осваивать материал в любом порядке, а не в единственном. Текст теряет свою замкнутость, становится принципиально открытым, в него можно вставлять новые фрагменты, указывая для них связи с имеющимися. Структура текста не разрушается, и вообще у гипертекста нет априорно заданной структуры. Таким образом, гипертекст - это новая технология представления неструктурированного свободно наращиваемого знания. Этим он отличается от других моделей представления информации.
Под гипертекстом понимают систему информационных объектов (статей), объединенных между собой направленными связями, образу
Дата добавления: 2015-11-18; просмотров: 2937;