Тематическая структура текстов
Как уже отмечалось, семантическая сеть дает исчерпывающее наглядное представление о содержании текста - информация сети отражает все потенциально присутствующие смысловые связи, что с точки зрения полноты смыслового портрета, конечно же, превосходно. Однако, следует помнить, что сеть есть сеть - все пары понятий связаны двусторонне и каждый смысловой путь - бесконечен, так как может пересекаться сам с собой. Такая множественность связей вполне понятна с точки зрения формального описания семантики, однако едва ли удобна, когда дело касается более привычных структурированных представлений, когда связи идут от главного к второстепенному. Избежать подобного неудобства, а главное - взглянуть на текст иным образом поможет представление семантической сети в виде так называемой тематической структуры
Тематическая структура описывает содержание анализируемых текстов в виде иерархии связанных тем и подтем, раскрывающих содержание тем. Все темы и подтемы выражаются понятиями исходных текстов и соответствуют элементам семантической сети. Однако связи между понятиями односторонни и направлены от главного понятия к подчиненным. В результате представление тематической структуры текста оказывается иерархическим - от каждой темы раскрываются связи только к ее подтемам, от них - к подтемам следующего уровня и так далее, вплоть до самых незначительных тем, уже не имеющих нисходящих связей. Тематическая структура, таким образом, имеет вид древа, в корне которого стоят главные темы, в ветвях - подтемы, и каждая ветвь дерева заканчивается. Общий вид тематической структуры отражает смысловую структуру текстов. Так, если вся информация в текстах подчинена единой теме, структура будет иметь вид дерева с единственным корнем. Если же содержание текстов политематично, то вместо дерева мы видим целый "лес" независимых кустов, корни которых представляют главные темы, несвязанные друг с другом.
В дополнение к этому, TextAnalyst предоставляет возможность регулировать форму тематического дерева. Изменение порога по весу связей в семантической сети (разрыв более или менее сильных связей) изменяет вид дерева, разбивая его на большее или меньшее количество тематических кустов. В результате появляется возможность взглянуть на структуру текста в различных срезах, на разных уровнях глубины материала.
В остальном, с точки зрения интерфейса работа с тематической структурой, описываемая ниже, полностью аналогична работе с семантической сетью.
Понятия представляют названия тем, и некоторые из них имеют раскрывающиеся ветви связей с подтемами. Понятия в корне дерева представляют список главных тем анализируемых текстов, а связанные с ними элементы в ветвях последующих уровней дерева - списки подтем, в которых разворачиваются главные темы.
Щелкнув мышью на значке <+> возле выбранного понятия, вы можете раскрыть список всех понятий, связанных с ним. Щелчком мыши на значке <-> возле понятия с раскрытым списком вы закроете его обратно. Так же, как в семантической сети, численное значение возле понятия представляет его вес, а второе значение (перед ним) - вес связи с понятием в вершине раскрытого списка.
Чтобы просмотреть всю информацию по интересующему понятию, щелкните мышью на первом пункте <все> раскрытого списка. В окне появятся все предложения текстов, включающие понятие. Само понятие выделяется цветом.
Если же вас интересует не вся информация по понятию, а лишь та, которая касается его связи с одним из понятий раскрытого списка, щелкните мышью по второму понятию. В окне появятся все предложения текстов, в которых встречалась эта пара понятий. Оба понятия выделены цветом.
Выбрав интересующее предложение в окне, просто щелкните по нему мышью - и в новом окне появится соответствующий фрагмент исходного текста. Вы можете настраивать вид тематической структуры на экране, изменяя количество отображаемых понятий и связей, способ их сортировки, а также количество кустов в дереве.
Дата добавления: 2015-04-21; просмотров: 1710;