Обработка текстовой информации

Текстовый документ и технологии их создания

Текст – это упорядоченный набор предложений, предназначенный для того, чтобы выразить некий смысл. В смысловой цельности текста отражаются те связи и зависимости, которые имеются в самой действительности (общественные события, явления природы, человек, его внешний облик и внутренний мир, предметы неживой природы и т.д.).

В компьютере текст кодируется в последовательность байтов, образуя текстовый файл. Каждый байт хранит отдельный символ буквы, цифры или знака препинания.

Текстовый файл – обычная форма представления текста на компьютере. Каждый символ из используемого набора символов кодируется в виде одного байта, а иногда двух, трех и более байтов, в зависимости от используемой таблицы кодировки (ASCII, Windows 1252, ANSI и др).

Особой разновидностью текстовых данных следует считать т.н. гипертекст. Термин гипертекст был введен Тедом Нельсоном в 1965 году. Обычно гипертекст – это текст, содержащий узлы перехода (гиперссылки) от одного текста к какому-либо другому.

Пример гипертекста - веб-страницы – документы на HTML (гипертекстовом языке разметки), размещенные в Интернете.

Восприятие текста изучается в рамках таких дисциплин, как лингвистика текста и психолингвистика.








Дата добавления: 2015-10-19; просмотров: 986;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.006 сек.