Обработка текстовой информации
Текстовый документ и технологии их создания
Текст – это упорядоченный набор предложений, предназначенный для того, чтобы выразить некий смысл. В смысловой цельности текста отражаются те связи и зависимости, которые имеются в самой действительности (общественные события, явления природы, человек, его внешний облик и внутренний мир, предметы неживой природы и т.д.).
В компьютере текст кодируется в последовательность байтов, образуя текстовый файл. Каждый байт хранит отдельный символ буквы, цифры или знака препинания.
Текстовый файл – обычная форма представления текста на компьютере. Каждый символ из используемого набора символов кодируется в виде одного байта, а иногда двух, трех и более байтов, в зависимости от используемой таблицы кодировки (ASCII, Windows 1252, ANSI и др).
Особой разновидностью текстовых данных следует считать т.н. гипертекст. Термин гипертекст был введен Тедом Нельсоном в 1965 году. Обычно гипертекст – это текст, содержащий узлы перехода (гиперссылки) от одного текста к какому-либо другому.
Пример гипертекста - веб-страницы – документы на HTML (гипертекстовом языке разметки), размещенные в Интернете.
Восприятие текста изучается в рамках таких дисциплин, как лингвистика текста и психолингвистика.
Дата добавления: 2015-10-19; просмотров: 986;