ОБЗОР ЛИНГВИСТИЧЕСКИХ ПРОГРАММ

. ■ 2.1. ВИДЫ ЛИНГВИСТИЧЕСКИХ ПРОГРАММ

В наше время технологии автоматической обработки тек­стов на естественном языке являются весьма перспективными, и результаты их исследований представляют собой определен­ный коммерческий интерес, в связи с чем оказывается довольно трудным найти какую-либо специфическую информацию по данным темам, выходящую за рамки популярной литературы.

Компьютерная лингвистика (КЛ) — наука, родившаяся на стыке информатики и языкознания из потребности в общении с компьютером на естественном языке.

Спектр приложений КЛ простирается от простейших про­граммок обработки текста (транслитерации, проверки правопи­сания и других) до более сложных, например, программы авто­реферирования, поисковые системы и программы машинного перевода.

Изучением многообразия лингвистических программ, их ти- пологизацией и другими проблемами компьютерной лингвисти­ки в России занимается междисциплинарный семинар ДИАЛОГ, который проводился с 1975 по 1989 г. и был возобновлен в 1995 г. Это самое представительное российское мероприятие, целиком посвященное компьютерной лингвистике и ее приложениям, со­бирающее каждый год большое число ведущих специалистов в области интеллектуальных языковых технологий из компьютер­ных фирм, вузов и научных институтов со всей России и из-за ру­бежа. Постоянными участниками ДИАЛОГа являются Московс­кий государственный университет, РГГУ, Институт языкознания РАН, компании «ABBYY», «Яndex», «ПРОМТ»; РосНИИ искус-


ственного интеллекта, Институт проблем информации РАН. На­учная программа семинаров ДИАЛОГ охватывает основные на­правления фундаментальных исследований и коммерческих раз­работок, находящихся на пересечении лингвистики, методов представления и обработки знаний и самых современных инфор­мационных технологий. В 2007 г. обновился сайт семинара http:// www.dialog-21.ru/. Теперь этот профессионально сделанный веб-ресурс предоставляет самые свежие новости из мира компьютер­ной лингвистики и интеллектуальных технологий. На сайте ра­ботает конференция, публикуется еженедельный дайджест наи­более интересных новостей. Кроме того, здесь можно найти все материалы семинаров ДИАЛОГ за последние три года.

Возрожденный в 1995 г. в статусе международного ДИАЛОГ на сегодня остается единственным мероприятием подобного рода, собирающим не только цвет российской лингвистической науки, но и крупнейшие компании, работающие в области ком­пьютерной лингвистики, а также авторитетных представителей смежных наук. Он играет ключевую роль в развитии связей между отечественными фирмами, научными институтами и ву­зами, интересующимися данной тематикой. Аудитория семина­ра постоянно растет, а число докладов, опубликованных в тру­дах семинара, увеличилось по сравнению с 1995 г. втрое.

В определенный момент ДИАЛОГ достиг масштаба, требую­щего некоторой реорганизации для его дальнейшего развития. Поэтому в прошлом году было принято решение о создании Ас­социации «Компьютерная лингвистика и интеллектуальные технологии» (КОЛИНТ). Ее учредителями стали постоянные участники ДИАЛОГа: компании «ABBYY», «Яndex», «ПРОМТ», «Ашманов и партнеры», SCIPER (Париж), а также Российская ассоциация искусственного интеллекта, научные институты ИПИ и ИППИ РАН, РосНИИ искусственного интеллекта, ИМ СОРАН, ИИ Казанского госуниверситета, филологический фа­культет МГУ.

Это позволило вывести ДИАЛОГ на новый уровень органи­зации и представительности. Без преувеличения можно сказать, что именно ДИАЛОГ позволяет сегодня оценить текущее состо-


яние отечественной прикладной лингвистики и ее приложений в информационных технологиях, задать ориентиры для их раз­вития.

Предлагается выделить в области интересов ассоциации сле­дующие тематические направления КОЛИНТ (данный список открыт для обсуждения):

• теоретическая и когнитивная лингвистика;

• синтаксис, семантика, прагматика и их взаимодействие;

• диалог и речевой акт;

• модели национальных языков;

• интерфейсы на естественном языке;

• понимание связного текста и модель предметной области;

• речевое взаимодействие с компьютером: анализ и синтез;

• технологии представления и обработки знаний;

• естественный язык и Интернет;

• машинный перевод;

• автоматическая обработка полнотекстовых документов;

• корпусная лингвистика;

• словарь, тезаурус, онтология.

Большое количество лингвистических программ собрано в Каталоге лингвистических программ и ресурсов в Сети (www.rvb. ru/soft/-catalogue-/catalogue.html).

Данный каталог включает в себя описание программ, свя­занных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в Интер­нете. Упор при составлении каталога делался на бесплатные программы, доступные для загрузки. Однако описаны также не­которые on-line и коммерческие версии программ. Тематически каталог разбит на следующие разделы:

— программы анализа и лингвистической обработки текстов;

— программы преобразования текстов;


психолингвистические программы; генераторы текстов и «говорящие» программы; системы обработки естественного языка; коллекции ресурсов; словари и тезаурусы.

 








Дата добавления: 2014-12-21; просмотров: 3077;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.006 сек.