Оценка полноты и релевантности информации.
Полнота есть показатель, характеризующий меру достаточности информации для решения соответствующих задач.Отсюда следует, что данный показатель, так же как и предыдущий является относительным: полнота информации оценивается относительно вполне определенной задачи или группы задач. Поэтому, чтобы иметь возможность определять показатель полноты информации, необходимо для каждой задачи или группы задач заблаговременно составить перечень сведении, которые необходимы для их решения. Для представления таких сведений удобно воспользоваться так называемыми объектно-характеристическими таблицами (ОХТ), каждая из которых есть двухмерная матрица, по строкам которой приведен перечень наименовании объектов, процессов или явлений, которые входят в круг интересов соответствующей задачи, а по столбцам - наименования их характеристик (параметров), значения которых необходимы для решения задачи. Сами значения характеристик будут располагаться на пересечении соответствующих строк и столбцов. Совокупность всех ОХТ, необходимых для обеспечения решения всех задач предприятия (учреждения, другой организации), может быть названа информационным кадастром объекта. Таким образом, непременным условием оценки полноты информации является наличие информационного кадастра.
Методика оценки полноты может быть следующей.
Обозначим через элемент, находящийся в -и строке и v-м столбце рассматриваемого компонента соответствующей ОХТ, причем:
Тогда в качестве меры коэффициента полноты информации в данной ОХТ можно принять величину:
, (7.4)
где т - число строк,
п - число столбцов в рассматриваемой ОХТ.
Однако при этом не учитывается важность, значимость различных элементов, причем важность в том смысле, как это рассматривалось выше. Пусть
есть коэффициент важности элемента -й строки и v-гo столбца.
Тогда, очевидно, в качестве меры взвешенной полноты информации в рассматриваемой ОХТ можно принять величину:
(7.5)
Релевантность есть такой показатель информации, который характеризует соответствие ее потребностям решаемой задачи. Для количественного выражения данного показателя обычно используют так называемый коэффициент релевантности K(р) определяющий отношение объема релевантной информации Np к общему объему анализируемой информации N0:
K(р) = (7.6)
Сущность коэффициента релевантности очевидна, но трудности практическое его использования сопряжены количественным выражением объема информации. В сфере научно-технической информации под N0, например, понимается общее количество документов, выданных назапрос, а под Np - количество релевантных среди общего объема.
К оценке релевантности фактографической информации можно подойти следующим образом. Пусть имеется информационный кадастр, состоящий из некоторого количества ОХТ. Тогда релевантность -й ОХТ можно выразить формулой:
, (7.7)
где
или с учетом коэффициентов важности элементов ОХТ:
(7.8)
Коэффициент релевантности всего информационного кадастра, очевидно, может быть выражен формулой:
(7.9)
или с учетом коэффициентов важности элементов ОХТ:
(7.10)
Дата добавления: 2016-03-15; просмотров: 2576;