ЛЕКЦИЯ 1. Обзор Курса лекций

Модели знаний - продукционная, фреймовая и модель се­мантических сетей - обладают практически равными возмож­ностями представления знаний, использующих отношения "есть-нек" и "есть-часть". Дополнительно каждая модель зна­ний содержит средства усиления этой "базовой" конфигурации:

- продукционная модель позволяет легко расширять и ус­ложнять множество правил вывода;

- фреймовая модель позволяет усилить вычислительные аспекты обработки знаний за счет расширения множе­ства присоединенных процедур;

- модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественно­го языка.

 

4.9 Тезаурусы экономической информации

Первоначально идея разработки тезаурусов возникла в словарной практике в связи с составлением толковых слова­рей, как средство описания се­мантической структуры естественного языка. Затем они были применены в практике автоматизированных информационно-поисковых систем для обеспечения избыточ­ного индексирования документов и информационных запросов. Под избыточным индексированием понимается дополнение поискового образа документов дополнительными дескрипторами, которые связаны по смыс­лу с основными дескрипторами.

Тезаурус - это словарь-справочник, в котором перечисле­ны все лексические единицы ИМЯ с синонимичными им сло­вами, а также выражены все важнейшие смысловые (парадигматические) отноше­ния между лексическими единицами.

Тезаурус, как элемент информацион­ного языка, выполняет следующие функции:

- средство формализации лексики;

- средство терминологического контроля;

- средство избыточного индексирования информа­ционных запросов;

- средство выражения парадигматических отноше­ний языка.

Основные этапы разработки тезауруса сле­дующие:

а) Выбор источников лексики и отбор терминов.

б) Составление терминологического словаря.

в) Группировка терминов в тематические классы.

г) Формирование классов условной эквивалентности.

д) Установление парадигматических отношений.

е) Определение структуры тезауруса.

а) Для отбора лексического материала необходимо использо­вать экономические документы, отражающие характеристики экономического объекта. Кро­ме того, надо пользоваться такими вспомогательными средства­ми, как толковые и терминологические словари, справочники по исследуемой тематике, общесоюзные классификаторы.

Отбор терминов определяется специальными правилами. Перечислим некоторые из них:

- узкие термины применять, если в словаре отсут­ствуют подходящие общие термины;

- многословный термин вводить в том случае, если встречается довольно часто;

- прилагательное следует употреблять в сочетании с суще­ствительным.

б) В терминологическом словаре каждому отобранному тер­мину дается определение, соответствующее его экономичес­кому смыслу. Терминологический словарь служит в качестве пособия при формировании запросов конечными пользовате­лями.

в) Все термины классифицируются в зависимости от функци­онального назначения в тематические классы. Ниже приведен перечень тематических клас­сов экономической лексики:

1) Экономические категории, действия, события

2) Субъекты действия

3) Объекты действия

4) Назначение действия

5) Место действия

6) Источник поступления (финансирования)

7) Время действия

8) Функция управления

9) Единица измерения

10)Атрибутивные характеристики действия (разряд работ и т. п.)

11) Обоснование действия

12) Причина отклонения.

г) Дальнейшая работа по составлению тезауруса заключается в устранении многозначности (омонимия, полисемия) и сино­нимии терминов.

Омонимия - это совпадение в звучании и написании раз­ных слов. Например: лук (растение) и лук (оружие).

Полисемия - это перенос названия одного предмета на дру­гие предметы. Например: звезда (геометричес­кая фигура) и звезда (небесное тело), матрица (математическая) и матрица (техническая).

Омонимия и полисемия устраняются лексикографически при редактировании терминологического словаря.

Синонимия заключается в том, что одному "означаемому" (предмету, явлению) соответ­ствует одно и более "означающих" (слов, словосочетаний). Например: алфавит - азбука, студенты - студенчество.

При построении тезауруса устранение синонимии произво­дится путем группировки терминов в классы условной эквива­лентности (КУЭ).

В КУЭ объединяются термины, между объемами понятий которых существуют отношения:

- равнозначности (геомагнетизм - земной магнетизм);

- перекрещивания, когда часть объема одного поня­тия входит в объем другого(книга - монография);

- подчинения, когда объем одного понятия составляет часть объема другого понятия (стол - мебель);

- внеположенности, когда объемы понятий полностью ис­ключают друг друга и при этом не исчерпывают области предметов, о которых ведется рассуждение (стол - стул: общий класс - мебель).

В результате формирования классов условной экви­валентности термины тезауруса группируются в синонимичес­кие ряды. В каждом синонимическом ряду выделяется доминанта, то есть такой термин, который может заменить любое слово клас­са. Доминанту принято называть дескриптором. Однако фак­тически дескриптором является не имя КУЭ, а сам этот класс.

д) Парадигматические отношения в тезаурусах могут выражаться четырьмя способами:

- лексикографически;

- при помощи таблиц;

- аналитически;

- графически.

Лексикографический способ предполагает наличие специаль­ных помет, которые указывают, в каких парадигматических отношениях находится данный дескриптор с заглавным. При этом используются условные обозначения, рекомендуемые ГОСТом, а именно:

н - нижестоящий видовой дескриптор по отношению к заг­лавному дескриптору;

в - вышестоящий родовой дескриптор по отношению к заглавному дескриптору;

ц - дескриптор находится в отношении - целое к заглавно­му дескриптору;

ч - дескриптор находится в отношении - часть к заглавно­му дескриптору;

с - ключевое слово находится в отношении синонимии к заглавному дескриптору;

см - отсылка от ключевого слова к дескриптору.

Табличный способ заключается в том, что под заглавным дескриптором записываются со сдвигом на несколько знаков вправо дескрипторы, находящиеся с ним в определенном отношении. Такой способ применяется в библиотечно-библиографических классификациях.

При аналитическом способе парадигматические отношения выражаются при помощи структуры кодов дескрипторов. Примером применения аналитического способа может слу­жить универсальная десятичная классификация.

Графический способ предполагает применение различных графических схем.

Терминам экономических документов присущи отношения "вид-род", обозна­чающие смысловую соподчиненность терминов, и "целое-часть", дающие математичес­кую взаимосвязь экономических категорий. Поэтому наиболее удобным будет сочетание лексикогра­фического и табличного способов выражения парадигматичес­ких отношений.

е) Структура тезауруса влияет на результаты поиска и со­ответственно на эффективность работы всей системы.

Как правило, тезаурус представляется в виде совокупнос­ти расположенных в алфавитном порядке дескрипторных статей (семантических сегментов). Они пред­ставляет собой совокупность заглавного дескриптора и всех дес­крипторов, связанных с ним какими-либо парадигматичес­кими отношениями, а также ключевых слов-синонимов. Например:

Выпуск

с выпущено

с выработано

с произведено

с производство

Кольца уплотнительные круглого сечения

в Кольца уплотнительные

н Кольца резиновые уплотнительные круглого сечения, рези­на группы О

н Кольца резиновые уплотнительные круглого сечения, рези­на группы 1

 

ЛЕКЦИЯ 1. Обзор Курса лекций

Содержание Курса

Программное обеспечение, как и люди, имеет жизненный цикл. Под полным жизненным циклом программного обеспечения обычно понимают процесс его развития, состоящий из четырех последовательных фаз, которые называются "начало", "исследование", "проектирование" и "внедрение". В свою очередь фазы делятся на этапы. Разработка программного обеспечения - это процесс, охватывающий три первые фазы его жизненного цикла. В ходе разработки постепенно создается программный продукт, готовый к внедрению. Разработка завершается тестированием программного комплекса и принятием решения о готовности программ к внедрению.

Сегодня программное обеспечение разрабатывается с помощью типовых технологий. Они называются методологиями программирования или просто методами программирования. С точки зрения задач, решаемых в нашем Курсе, наибольший интерес представляет метод объектно-ориентированного программирования (ООП), по-английски object-oriented programming (ООР). С его помощью создаются программы, написанные на объектно-ориентированных языках программирования, таких как C++, Java и др.

Программное обеспечение - это важная, но не единственная часть проектируемой компьютерной информационной системы. Другой ее частью является предметная область. Поэтому для разработки информационных систем, наряду с методом ООП, используются также метод объектно-ориентированного проектирования (object-oriented design, OOD) и метод объектно-ориентированного анализа (object-oriented analysis, OOA). С помощью методов ООА и OOD моделируются предметные области информационных систем, которые у нас в России, иногда, называют объектами автоматизации. Примером объекта автоматизации может служить, например, Система регистрации учебных курсов, которая будет рассмотрена в Лекции 4.

Первая часть нашего Курса лекций посвящена визуальным (наглядным) и математическим моделям методов ООП, ООА и ООD. Визуальные модели это такие модели, которые можно рисовать на бумаге или экранах компьютеров. Математические модели это формальные модели, представляемые в виде символьных соотношений.

По определению одного из создателей языка UML (Unified Modelling Language) Гради Буча:

Объектно-ориентированное программирование (ООП) - это методология программирования, основанная на представлении программы в виде совокупности объектов, каждый из которых является экземпляром определенного класса, а классы образуют иерархию наследования.

Объектно-ориентированное проектирование (ООD) - это методология проектирования, соединяющая в себе процесс объектной декомпозиции и приемы представления логической и физической, а также статической и динамической моделей проектируемой системы.

Объектно-ориентированный анализ (ООА) – это методология, при использовании которой требования к проектируемой системе воспринимаются с точки зрения классов и объектов, выявленных в предметной области.

Как соотносятся ООА, OOD и ООП? На результатах ООА формируются модели, на которых основывается OOD. В свою очередь OOD создает фундамент для окончательной реализации компьютерной системы с использованием методологии ООП.

Следует сказать, что в нашей стране иногда применяется интегральное понятие – метод объектно-ориентированного анализа и проектирования (ООАП), объединяющий методы ООА и OOD. Например, термин ООАП используется в книге А. Леоненкова "Самоучитель UML".

Методы ООП и ООАП базируются на стандартном языке визуального моделирования UML. Он будет кратко рассмотрен в Лекции 3. Применение методов ООП/ООАП и языка UML иллюстрируется в Лекции 5 на примере автоматизированной системы регистрации учебных курсов.

Традиционные информационные системы, сегодня, опираются на архитектуру клиент-сервер. В нашем Курсе мы будем иметь дело не только с традиционными информационными системами, но также с веб-информационными системами. Кратко они называются веб-системами. Понятие веб-система появилось в конце 90-х годов. Веб-системы - это информационные системы, работающие на основе Интернет и Всемирной паутины (WWW). Интернет и Всемирную паутину мы будем обозначать Интернет/Веб. Примерами веб-систем являются открытые электронные правительства (е-правительства), торговые веб-системы, банковские веб-системы и многие другие системы, работающие на основе Интернет/Веб. Сегодня во всем мире происходит бурное развитие веб-систем, в том числе е-правительств.

Наряду с веб-системами мы будем изучать веб-документы и веб-книги. Веб-документы проще, чем веб-системы. Примерами веб-документов являются веб-страницы и другие документы, размеченные htm и XML тегами и распространяемые по Интернет/Веб. Веб-документы бывают автономными или они входят в веб-системы как составные части. Примерами веб-книг являются учебные веб-курсы. Веб-системы, веб-документы и веб-книги появились после того как возникла Всемирная паутина.

Помимо визуальных и математических моделей методов ООП, ООАП и языка UML, мы будем изучать в нашем Курсе визуальные и математические веб-модели, предназначенные для наглядного и формального (математического) представления веб-систем и веб-компонентов (например, веб-документов, веб-курсов). Веб-модели могут быть использованы также для описания и анализа языков разметки веб-документов. Но эти возможности веб-моделей в наших лекциях не рассматриваются.

В нашем курсе лекций мы построим наглядные и математические модели веб-систем и веб-курсов. Модели веб-курсов будут применены к моделированию и разработке веб-курса наших лекций. Во втором семестре этого учебного года вы разработаете в Курсовом проекте веб-курс с названием - "Создание веб-курса: Модели методов разработки программного обеспечения информационных систем". Этот веб-курс будет представлять собой 11 лекций первого семестра, размеченные тегами htm, которые можно читать на экранах ваших домашних компьютеров с помощью браузера Microsoft Explorer. Очевидно, что наш веб-курс может быть помещен на сайте кафедры МОВС.

Курс состоит из 11 лекций. Первая лекция обзорная, остальные 10 лекций разделены на три части.

Первая часть Курса (лекции 2, 3, 4, 5) посвящена технологиям программирования, методам ООП, ООАП и языку UML. Следует отметить, что в течение последнего десятилетия в области технологий программирования произошли существенные изменения. Они обусловлены появлением:

  1. Объектно-ориентированных языков программирования (С++, Java и др.).
  2. Метода объектно-ориентированного программирования.
  3. Метода объектно-ориентированного анализа и проектирования
  4. Языка UML, позволяющего моделировать и документировать предметные области информационных систем и коды объектно-ориентированных программ.
  5. Инструментальных компьютерных программ, помогающих создавать UML диаграммы. Одной из таких инструментальных программ является пакет Rational Rose 2000 фирмы Rational Software Corporation.

Методы ООП и ООАП взаимосвязаны друг с другом через язык UML. Диаграммы метода ООП, составленные из пиктограмм языка UML, описывают и документируют объектные коды программных средств информационных систем, а диаграммы метода ООАП, составленные на языке UML, используются для описания и проектирования самих информационных систем. Можно сказать, что язык UML представляет собой общий технологический инструмент методов ООП и ООАП, с помощью которого системные аналитики и программисты создают проектную документацию информационных систем и их программных средств.

В Лекции 2 рассказана история развития технологий программирования, методов ООА и ООD, а также языка UML. Исторический экскурс позволит нам увидеть современное состояние технологий программирования на фоне прошлого и задуматься о перспективах их дальнейшего развития.

Лекция 3 посвящена языку UML. К сожалению, в рамках одного семестра невозможно рассказать о всех деталях языка UML. Поэтому в нашем Курсе он рассмотрен очень кратко.

Практическое использование языка UML рассматривается в Курсе на примере его применения к системе регистрации учебных курсов. В этой связи в Лекции 4 изложена сущность американской автоматизированной системы регистрации учебных курсов для университетов. При этом американская система регистрации платных учебных курсов сопоставляется с системой регистрации бесплатных курсов, действующей в МИРЭА.

В Лекции 5 приведен пример конкретного применения языка UML к описанию и проектированию американской системы регистрации учебных курсов университета Истерн.

Вторая часть Курса (лекции 6, 7, 8, 9, 10, 11) посвящена теории графов, семантическим графовым сетям и новому виду семантических сетей, которые называются паттерновыми сетями.

Теория графов рассматривается в нашем Курсе в связи с тем, что графовые сети служат основой построения визуальных моделей языка UML и методов ООП и ООАП. Графовые сети хорошо подходят для моделирования и разработки традиционных информационных систем и их программного обеспечения, но они оказываются мало эффективными, когда надо решать задачи моделирования и разработки веб-систем, веб-документов и веб-курсов. В этой связи в наших лекциях построены паттерновые (модульные) сети, которые позволяют моделировать и проектировать веб-системы и веб-курсы.

Главная, полезная для компьютерной науки и практики особенность графовых и паттерновых сетей состоит в том, что они, с одной стороны, изображаются в виде наглядных схем, а с другой стороны, представляются формально в виде символьных соотношений. Графы широко используются в компьютерной науке и практике, в частности, в визуальных диаграммах языка UML.

В Лекции 6 рассматриваются теория графов и семантические графовые сети. Причем основы теории графов излагаются не традиционным способом, а с помощью пересказа рассуждений Эйлера о Кенигсбергских мостах.

Лекции 7, 8, 9 дают представление о паттерновых сетях, позволяющих формально и в виде наглядных схем описывать открытые информационные системы, состоящие из модулей с попарно соединенными выходами и входами. Паттерновые сети это новый вид семантических сетей, которые обладают модульными свойствами. В Курсе лекций они использованы для моделирования и проектирования веб-курсов.

В Лекции 10 рассматривается применение паттерновых сетей к моделированию и проектированию Автоматизированной информационной системы Консолидированного бюджета Российской Федерации.

Лекция 11 посвящена моделированию учебного веб-курса.

В заключение отметим три особенности нашего Курса. Главная – состоит в том, что в Курсе, наряду с общеизвестными истинами, содержатся новые знания о паттерновых (модульных) сетях и их практических применениях. Вторая особенность Курса - нетрадиционное изложение некоторые учебных тем. Третья особенность - при изложении материалов Курса лекций используется, по мере возможности, принцип: "Объясняй непонятное через понятное".

Оглавление Курса

ЛЕКЦИЯ 1. Обзор Курса лекций

ЛЕКЦИЯ 2. История технологий программирования, методов ООА, ООD и языка UML

ЛЕКЦИЯ 3. Язык UML

ЛЕКЦИЯ 4. Системы регистрации учебных курсов

ЛЕКЦИЯ 5. Пример применения языка UML к проектированию Системы регистрации

учебных курсов

ЛЕКЦИЯ 6. Теория графов и графовые сети

ЛЕКЦИЯ 7. Теория паттернов и паттерновые сети

ЛЕКЦИЯ 8. Образующие

ЛЕКЦИЯ 9. Паттерновые сети

ЛЕКЦИЯ 10. Модульные модели АИС Консолидированного бюджета Российской Федерации

ЛЕКЦИЯ 11. Графовые, модульные и табличные модели учебного веб-курса

Экзаменационные вопросы








Дата добавления: 2015-03-09; просмотров: 1008;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.027 сек.