ЛЕКЦИЯ 1. Обзор Курса лекций
Модели знаний - продукционная, фреймовая и модель семантических сетей - обладают практически равными возможностями представления знаний, использующих отношения "есть-нек" и "есть-часть". Дополнительно каждая модель знаний содержит средства усиления этой "базовой" конфигурации:
- продукционная модель позволяет легко расширять и усложнять множество правил вывода;
- фреймовая модель позволяет усилить вычислительные аспекты обработки знаний за счет расширения множества присоединенных процедур;
- модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественного языка.
4.9 Тезаурусы экономической информации
Первоначально идея разработки тезаурусов возникла в словарной практике в связи с составлением толковых словарей, как средство описания семантической структуры естественного языка. Затем они были применены в практике автоматизированных информационно-поисковых систем для обеспечения избыточного индексирования документов и информационных запросов. Под избыточным индексированием понимается дополнение поискового образа документов дополнительными дескрипторами, которые связаны по смыслу с основными дескрипторами.
Тезаурус - это словарь-справочник, в котором перечислены все лексические единицы ИМЯ с синонимичными им словами, а также выражены все важнейшие смысловые (парадигматические) отношения между лексическими единицами.
Тезаурус, как элемент информационного языка, выполняет следующие функции:
- средство формализации лексики;
- средство терминологического контроля;
- средство избыточного индексирования информационных запросов;
- средство выражения парадигматических отношений языка.
Основные этапы разработки тезауруса следующие:
а) Выбор источников лексики и отбор терминов.
б) Составление терминологического словаря.
в) Группировка терминов в тематические классы.
г) Формирование классов условной эквивалентности.
д) Установление парадигматических отношений.
е) Определение структуры тезауруса.
а) Для отбора лексического материала необходимо использовать экономические документы, отражающие характеристики экономического объекта. Кроме того, надо пользоваться такими вспомогательными средствами, как толковые и терминологические словари, справочники по исследуемой тематике, общесоюзные классификаторы.
Отбор терминов определяется специальными правилами. Перечислим некоторые из них:
- узкие термины применять, если в словаре отсутствуют подходящие общие термины;
- многословный термин вводить в том случае, если встречается довольно часто;
- прилагательное следует употреблять в сочетании с существительным.
б) В терминологическом словаре каждому отобранному термину дается определение, соответствующее его экономическому смыслу. Терминологический словарь служит в качестве пособия при формировании запросов конечными пользователями.
в) Все термины классифицируются в зависимости от функционального назначения в тематические классы. Ниже приведен перечень тематических классов экономической лексики:
1) Экономические категории, действия, события
2) Субъекты действия
3) Объекты действия
4) Назначение действия
5) Место действия
6) Источник поступления (финансирования)
7) Время действия
8) Функция управления
9) Единица измерения
10)Атрибутивные характеристики действия (разряд работ и т. п.)
11) Обоснование действия
12) Причина отклонения.
г) Дальнейшая работа по составлению тезауруса заключается в устранении многозначности (омонимия, полисемия) и синонимии терминов.
Омонимия - это совпадение в звучании и написании разных слов. Например: лук (растение) и лук (оружие).
Полисемия - это перенос названия одного предмета на другие предметы. Например: звезда (геометрическая фигура) и звезда (небесное тело), матрица (математическая) и матрица (техническая).
Омонимия и полисемия устраняются лексикографически при редактировании терминологического словаря.
Синонимия заключается в том, что одному "означаемому" (предмету, явлению) соответствует одно и более "означающих" (слов, словосочетаний). Например: алфавит - азбука, студенты - студенчество.
При построении тезауруса устранение синонимии производится путем группировки терминов в классы условной эквивалентности (КУЭ).
В КУЭ объединяются термины, между объемами понятий которых существуют отношения:
- равнозначности (геомагнетизм - земной магнетизм);
- перекрещивания, когда часть объема одного понятия входит в объем другого(книга - монография);
- подчинения, когда объем одного понятия составляет часть объема другого понятия (стол - мебель);
- внеположенности, когда объемы понятий полностью исключают друг друга и при этом не исчерпывают области предметов, о которых ведется рассуждение (стол - стул: общий класс - мебель).
В результате формирования классов условной эквивалентности термины тезауруса группируются в синонимические ряды. В каждом синонимическом ряду выделяется доминанта, то есть такой термин, который может заменить любое слово класса. Доминанту принято называть дескриптором. Однако фактически дескриптором является не имя КУЭ, а сам этот класс.
д) Парадигматические отношения в тезаурусах могут выражаться четырьмя способами:
- лексикографически;
- при помощи таблиц;
- аналитически;
- графически.
Лексикографический способ предполагает наличие специальных помет, которые указывают, в каких парадигматических отношениях находится данный дескриптор с заглавным. При этом используются условные обозначения, рекомендуемые ГОСТом, а именно:
н - нижестоящий видовой дескриптор по отношению к заглавному дескриптору;
в - вышестоящий родовой дескриптор по отношению к заглавному дескриптору;
ц - дескриптор находится в отношении - целое к заглавному дескриптору;
ч - дескриптор находится в отношении - часть к заглавному дескриптору;
с - ключевое слово находится в отношении синонимии к заглавному дескриптору;
см - отсылка от ключевого слова к дескриптору.
Табличный способ заключается в том, что под заглавным дескриптором записываются со сдвигом на несколько знаков вправо дескрипторы, находящиеся с ним в определенном отношении. Такой способ применяется в библиотечно-библиографических классификациях.
При аналитическом способе парадигматические отношения выражаются при помощи структуры кодов дескрипторов. Примером применения аналитического способа может служить универсальная десятичная классификация.
Графический способ предполагает применение различных графических схем.
Терминам экономических документов присущи отношения "вид-род", обозначающие смысловую соподчиненность терминов, и "целое-часть", дающие математическую взаимосвязь экономических категорий. Поэтому наиболее удобным будет сочетание лексикографического и табличного способов выражения парадигматических отношений.
е) Структура тезауруса влияет на результаты поиска и соответственно на эффективность работы всей системы.
Как правило, тезаурус представляется в виде совокупности расположенных в алфавитном порядке дескрипторных статей (семантических сегментов). Они представляет собой совокупность заглавного дескриптора и всех дескрипторов, связанных с ним какими-либо парадигматическими отношениями, а также ключевых слов-синонимов. Например:
Выпуск
с выпущено
с выработано
с произведено
с производство
Кольца уплотнительные круглого сечения
в Кольца уплотнительные
н Кольца резиновые уплотнительные круглого сечения, резина группы О
н Кольца резиновые уплотнительные круглого сечения, резина группы 1
ЛЕКЦИЯ 1. Обзор Курса лекций
Содержание Курса
Программное обеспечение, как и люди, имеет жизненный цикл. Под полным жизненным циклом программного обеспечения обычно понимают процесс его развития, состоящий из четырех последовательных фаз, которые называются "начало", "исследование", "проектирование" и "внедрение". В свою очередь фазы делятся на этапы. Разработка программного обеспечения - это процесс, охватывающий три первые фазы его жизненного цикла. В ходе разработки постепенно создается программный продукт, готовый к внедрению. Разработка завершается тестированием программного комплекса и принятием решения о готовности программ к внедрению.
Сегодня программное обеспечение разрабатывается с помощью типовых технологий. Они называются методологиями программирования или просто методами программирования. С точки зрения задач, решаемых в нашем Курсе, наибольший интерес представляет метод объектно-ориентированного программирования (ООП), по-английски object-oriented programming (ООР). С его помощью создаются программы, написанные на объектно-ориентированных языках программирования, таких как C++, Java и др.
Программное обеспечение - это важная, но не единственная часть проектируемой компьютерной информационной системы. Другой ее частью является предметная область. Поэтому для разработки информационных систем, наряду с методом ООП, используются также метод объектно-ориентированного проектирования (object-oriented design, OOD) и метод объектно-ориентированного анализа (object-oriented analysis, OOA). С помощью методов ООА и OOD моделируются предметные области информационных систем, которые у нас в России, иногда, называют объектами автоматизации. Примером объекта автоматизации может служить, например, Система регистрации учебных курсов, которая будет рассмотрена в Лекции 4.
Первая часть нашего Курса лекций посвящена визуальным (наглядным) и математическим моделям методов ООП, ООА и ООD. Визуальные модели это такие модели, которые можно рисовать на бумаге или экранах компьютеров. Математические модели это формальные модели, представляемые в виде символьных соотношений.
По определению одного из создателей языка UML (Unified Modelling Language) Гради Буча:
Объектно-ориентированное программирование (ООП) - это методология программирования, основанная на представлении программы в виде совокупности объектов, каждый из которых является экземпляром определенного класса, а классы образуют иерархию наследования.
Объектно-ориентированное проектирование (ООD) - это методология проектирования, соединяющая в себе процесс объектной декомпозиции и приемы представления логической и физической, а также статической и динамической моделей проектируемой системы.
Объектно-ориентированный анализ (ООА) – это методология, при использовании которой требования к проектируемой системе воспринимаются с точки зрения классов и объектов, выявленных в предметной области.
Как соотносятся ООА, OOD и ООП? На результатах ООА формируются модели, на которых основывается OOD. В свою очередь OOD создает фундамент для окончательной реализации компьютерной системы с использованием методологии ООП.
Следует сказать, что в нашей стране иногда применяется интегральное понятие – метод объектно-ориентированного анализа и проектирования (ООАП), объединяющий методы ООА и OOD. Например, термин ООАП используется в книге А. Леоненкова "Самоучитель UML".
Методы ООП и ООАП базируются на стандартном языке визуального моделирования UML. Он будет кратко рассмотрен в Лекции 3. Применение методов ООП/ООАП и языка UML иллюстрируется в Лекции 5 на примере автоматизированной системы регистрации учебных курсов.
Традиционные информационные системы, сегодня, опираются на архитектуру клиент-сервер. В нашем Курсе мы будем иметь дело не только с традиционными информационными системами, но также с веб-информационными системами. Кратко они называются веб-системами. Понятие веб-система появилось в конце 90-х годов. Веб-системы - это информационные системы, работающие на основе Интернет и Всемирной паутины (WWW). Интернет и Всемирную паутину мы будем обозначать Интернет/Веб. Примерами веб-систем являются открытые электронные правительства (е-правительства), торговые веб-системы, банковские веб-системы и многие другие системы, работающие на основе Интернет/Веб. Сегодня во всем мире происходит бурное развитие веб-систем, в том числе е-правительств.
Наряду с веб-системами мы будем изучать веб-документы и веб-книги. Веб-документы проще, чем веб-системы. Примерами веб-документов являются веб-страницы и другие документы, размеченные htm и XML тегами и распространяемые по Интернет/Веб. Веб-документы бывают автономными или они входят в веб-системы как составные части. Примерами веб-книг являются учебные веб-курсы. Веб-системы, веб-документы и веб-книги появились после того как возникла Всемирная паутина.
Помимо визуальных и математических моделей методов ООП, ООАП и языка UML, мы будем изучать в нашем Курсе визуальные и математические веб-модели, предназначенные для наглядного и формального (математического) представления веб-систем и веб-компонентов (например, веб-документов, веб-курсов). Веб-модели могут быть использованы также для описания и анализа языков разметки веб-документов. Но эти возможности веб-моделей в наших лекциях не рассматриваются.
В нашем курсе лекций мы построим наглядные и математические модели веб-систем и веб-курсов. Модели веб-курсов будут применены к моделированию и разработке веб-курса наших лекций. Во втором семестре этого учебного года вы разработаете в Курсовом проекте веб-курс с названием - "Создание веб-курса: Модели методов разработки программного обеспечения информационных систем". Этот веб-курс будет представлять собой 11 лекций первого семестра, размеченные тегами htm, которые можно читать на экранах ваших домашних компьютеров с помощью браузера Microsoft Explorer. Очевидно, что наш веб-курс может быть помещен на сайте кафедры МОВС.
Курс состоит из 11 лекций. Первая лекция обзорная, остальные 10 лекций разделены на три части.
Первая часть Курса (лекции 2, 3, 4, 5) посвящена технологиям программирования, методам ООП, ООАП и языку UML. Следует отметить, что в течение последнего десятилетия в области технологий программирования произошли существенные изменения. Они обусловлены появлением:
- Объектно-ориентированных языков программирования (С++, Java и др.).
- Метода объектно-ориентированного программирования.
- Метода объектно-ориентированного анализа и проектирования
- Языка UML, позволяющего моделировать и документировать предметные области информационных систем и коды объектно-ориентированных программ.
- Инструментальных компьютерных программ, помогающих создавать UML диаграммы. Одной из таких инструментальных программ является пакет Rational Rose 2000 фирмы Rational Software Corporation.
Методы ООП и ООАП взаимосвязаны друг с другом через язык UML. Диаграммы метода ООП, составленные из пиктограмм языка UML, описывают и документируют объектные коды программных средств информационных систем, а диаграммы метода ООАП, составленные на языке UML, используются для описания и проектирования самих информационных систем. Можно сказать, что язык UML представляет собой общий технологический инструмент методов ООП и ООАП, с помощью которого системные аналитики и программисты создают проектную документацию информационных систем и их программных средств.
В Лекции 2 рассказана история развития технологий программирования, методов ООА и ООD, а также языка UML. Исторический экскурс позволит нам увидеть современное состояние технологий программирования на фоне прошлого и задуматься о перспективах их дальнейшего развития.
Лекция 3 посвящена языку UML. К сожалению, в рамках одного семестра невозможно рассказать о всех деталях языка UML. Поэтому в нашем Курсе он рассмотрен очень кратко.
Практическое использование языка UML рассматривается в Курсе на примере его применения к системе регистрации учебных курсов. В этой связи в Лекции 4 изложена сущность американской автоматизированной системы регистрации учебных курсов для университетов. При этом американская система регистрации платных учебных курсов сопоставляется с системой регистрации бесплатных курсов, действующей в МИРЭА.
В Лекции 5 приведен пример конкретного применения языка UML к описанию и проектированию американской системы регистрации учебных курсов университета Истерн.
Вторая часть Курса (лекции 6, 7, 8, 9, 10, 11) посвящена теории графов, семантическим графовым сетям и новому виду семантических сетей, которые называются паттерновыми сетями.
Теория графов рассматривается в нашем Курсе в связи с тем, что графовые сети служат основой построения визуальных моделей языка UML и методов ООП и ООАП. Графовые сети хорошо подходят для моделирования и разработки традиционных информационных систем и их программного обеспечения, но они оказываются мало эффективными, когда надо решать задачи моделирования и разработки веб-систем, веб-документов и веб-курсов. В этой связи в наших лекциях построены паттерновые (модульные) сети, которые позволяют моделировать и проектировать веб-системы и веб-курсы.
Главная, полезная для компьютерной науки и практики особенность графовых и паттерновых сетей состоит в том, что они, с одной стороны, изображаются в виде наглядных схем, а с другой стороны, представляются формально в виде символьных соотношений. Графы широко используются в компьютерной науке и практике, в частности, в визуальных диаграммах языка UML.
В Лекции 6 рассматриваются теория графов и семантические графовые сети. Причем основы теории графов излагаются не традиционным способом, а с помощью пересказа рассуждений Эйлера о Кенигсбергских мостах.
Лекции 7, 8, 9 дают представление о паттерновых сетях, позволяющих формально и в виде наглядных схем описывать открытые информационные системы, состоящие из модулей с попарно соединенными выходами и входами. Паттерновые сети это новый вид семантических сетей, которые обладают модульными свойствами. В Курсе лекций они использованы для моделирования и проектирования веб-курсов.
В Лекции 10 рассматривается применение паттерновых сетей к моделированию и проектированию Автоматизированной информационной системы Консолидированного бюджета Российской Федерации.
Лекция 11 посвящена моделированию учебного веб-курса.
В заключение отметим три особенности нашего Курса. Главная – состоит в том, что в Курсе, наряду с общеизвестными истинами, содержатся новые знания о паттерновых (модульных) сетях и их практических применениях. Вторая особенность Курса - нетрадиционное изложение некоторые учебных тем. Третья особенность - при изложении материалов Курса лекций используется, по мере возможности, принцип: "Объясняй непонятное через понятное".
Оглавление Курса
ЛЕКЦИЯ 1. Обзор Курса лекций
ЛЕКЦИЯ 2. История технологий программирования, методов ООА, ООD и языка UML
ЛЕКЦИЯ 3. Язык UML
ЛЕКЦИЯ 4. Системы регистрации учебных курсов
ЛЕКЦИЯ 5. Пример применения языка UML к проектированию Системы регистрации
учебных курсов
ЛЕКЦИЯ 6. Теория графов и графовые сети
ЛЕКЦИЯ 7. Теория паттернов и паттерновые сети
ЛЕКЦИЯ 8. Образующие
ЛЕКЦИЯ 9. Паттерновые сети
ЛЕКЦИЯ 10. Модульные модели АИС Консолидированного бюджета Российской Федерации
ЛЕКЦИЯ 11. Графовые, модульные и табличные модели учебного веб-курса
Экзаменационные вопросы
Дата добавления: 2015-03-09; просмотров: 1008;