ХАРАКТЕРИСТИКА И МОДЕЛИ БАЗОВЫХ ИНФОРМАЦИОННЫХ ПРОЦЕССОВ
Извлечение информации. Методы исследования данных предметной области. Декомпозиция предметной области на базе объектно-ориентированного подхода. Характеристика методов обогащения информации
Источниками данных в любой предметной области являются объекты и их свойства, процессы и функции, выполняемые этими объектами или для них. По аналогии с добычей полезных ископаемых процесс извлечения информации направлен на получение ее наибольшей концентрации. В связи с этим процесс извлечения можно представить, как прохождение информации через трехслойный фильтр, в котором осуществляется оценка синтаксической ценности (правильность представления), семантической (смысловой) ценности, прагматической (потребительской) ценности.
При извлечении информации важное место занимают различные методы исследования данных:
• обнаружение последовательностей событий во времени;
• выявление скрытых закономерностей по наборам данных, путем определения причинно-следственных связей между значениями определенных косвенных параметров исследуемого объекта (ситуации, процесса);
• оценка важности (влияния) параметров на развитие ситуации;
• классифицирование (распознавание), осуществляемое путем поиска критериев, по которым можно было бы относить объекты (события, ситуации, процессы) к той или иной категории;
• кластеризация, основанная на группировании объектов по каким-либо признакам;
• прогнозирование событий и ситуаций.
Для многих предметных областей характерна неоднородность (разнородность) информационных ресурсов. Одним из путей решения данной проблемы является объектно-ориентированный подход, наиболее распространенный в настоящее время.
Декомпозиция предметной области на основе объектно-ориентированного подхода основана на выделении следующих основных понятий: объект, класс, экземпляр.
Объект – это абстракция множества предметов реального мира, обладающих одинаковыми характеристиками и законами поведения. Объект характеризует собой типичный неопределенный элемент такого множества. Основной характеристикой объекта является состав его атрибутов (свойств).
Атрибуты – это специальные объекты, посредством которых можно задать правила описания свойств других объектов.
Экземпляр объекта – это конкретный элемент множества.
Класс – это множество предметов реального мира, связанных общностью структуры и поведением. Элемент класса – это конкретный элемент данного множества.
Обобщая эти определения, можно сказать, что объект – это типичный представитель класса, а термины «экземпляр объекта» и «элемент класса» равнозначны.
Важная особенность объектно-ориентированного подхода связана с понятием инкапсуляции, обозначающим сокрытие данных и методов (действий с объектом) в качестве собственных ресурсов объекта.
Понятия полиморфизма и наследования определяют эволюцию объектно-ориентированной системы, что подразумевает определение новых классов объектов на основе базовых.
Полиморфизм интерпретируется как способность объекта принадлежать более чем одному типу.
Наследование выражает возможность определения новых классов на основе существующих с возможностью добавления или переопределения данных и методов.
Для уменьшения избыточности используется процесс обогащения информации.
Среди методов обогащения информации различают структурное, статистическое, семантическое и прагматическое обогащения.
Структурное обогащение предполагает изменение параметров сообщения, отображающего информацию в зависимости от частотного спектра исследуемого процесса, скорости обслуживания источников информации и требуемой точности.
При статистическом обогащении осуществляют накопление статистических данных и обработку выборок из генеральных совокупностей накопленных данных.
Семантическое обогащение означает выделение и классификацию понятий, содержания информации, переход от частных понятий к более общим. В итоге семантического обогащения удается обобщенно представить обрабатываемую либо передаваемую информацию и устранить логическую противоречивость в ней.
Прагматическое обогащение является важной ступенью при использовании информации для принятия решения, при котором из полученной информации отбирается наиболее ценная, отвечающая целям и задачам пользователя.
Дата добавления: 2015-06-05; просмотров: 1380;