ОБЗОР ЛИНГВИСТИЧЕСКИХ ПРОГРАММ
. ■ 2.1. ВИДЫ ЛИНГВИСТИЧЕСКИХ ПРОГРАММ
В наше время технологии автоматической обработки текстов на естественном языке являются весьма перспективными, и результаты их исследований представляют собой определенный коммерческий интерес, в связи с чем оказывается довольно трудным найти какую-либо специфическую информацию по данным темам, выходящую за рамки популярной литературы.
Компьютерная лингвистика (КЛ) — наука, родившаяся на стыке информатики и языкознания из потребности в общении с компьютером на естественном языке.
Спектр приложений КЛ простирается от простейших программок обработки текста (транслитерации, проверки правописания и других) до более сложных, например, программы автореферирования, поисковые системы и программы машинного перевода.
Изучением многообразия лингвистических программ, их ти- пологизацией и другими проблемами компьютерной лингвистики в России занимается междисциплинарный семинар ДИАЛОГ, который проводился с 1975 по 1989 г. и был возобновлен в 1995 г. Это самое представительное российское мероприятие, целиком посвященное компьютерной лингвистике и ее приложениям, собирающее каждый год большое число ведущих специалистов в области интеллектуальных языковых технологий из компьютерных фирм, вузов и научных институтов со всей России и из-за рубежа. Постоянными участниками ДИАЛОГа являются Московский государственный университет, РГГУ, Институт языкознания РАН, компании «ABBYY», «Яndex», «ПРОМТ»; РосНИИ искус-
ственного интеллекта, Институт проблем информации РАН. Научная программа семинаров ДИАЛОГ охватывает основные направления фундаментальных исследований и коммерческих разработок, находящихся на пересечении лингвистики, методов представления и обработки знаний и самых современных информационных технологий. В 2007 г. обновился сайт семинара http:// www.dialog-21.ru/. Теперь этот профессионально сделанный веб-ресурс предоставляет самые свежие новости из мира компьютерной лингвистики и интеллектуальных технологий. На сайте работает конференция, публикуется еженедельный дайджест наиболее интересных новостей. Кроме того, здесь можно найти все материалы семинаров ДИАЛОГ за последние три года.
Возрожденный в 1995 г. в статусе международного ДИАЛОГ на сегодня остается единственным мероприятием подобного рода, собирающим не только цвет российской лингвистической науки, но и крупнейшие компании, работающие в области компьютерной лингвистики, а также авторитетных представителей смежных наук. Он играет ключевую роль в развитии связей между отечественными фирмами, научными институтами и вузами, интересующимися данной тематикой. Аудитория семинара постоянно растет, а число докладов, опубликованных в трудах семинара, увеличилось по сравнению с 1995 г. втрое.
В определенный момент ДИАЛОГ достиг масштаба, требующего некоторой реорганизации для его дальнейшего развития. Поэтому в прошлом году было принято решение о создании Ассоциации «Компьютерная лингвистика и интеллектуальные технологии» (КОЛИНТ). Ее учредителями стали постоянные участники ДИАЛОГа: компании «ABBYY», «Яndex», «ПРОМТ», «Ашманов и партнеры», SCIPER (Париж), а также Российская ассоциация искусственного интеллекта, научные институты ИПИ и ИППИ РАН, РосНИИ искусственного интеллекта, ИМ СОРАН, ИИ Казанского госуниверситета, филологический факультет МГУ.
Это позволило вывести ДИАЛОГ на новый уровень организации и представительности. Без преувеличения можно сказать, что именно ДИАЛОГ позволяет сегодня оценить текущее состо-
яние отечественной прикладной лингвистики и ее приложений в информационных технологиях, задать ориентиры для их развития.
Предлагается выделить в области интересов ассоциации следующие тематические направления КОЛИНТ (данный список открыт для обсуждения):
• теоретическая и когнитивная лингвистика;
• синтаксис, семантика, прагматика и их взаимодействие;
• диалог и речевой акт;
• модели национальных языков;
• интерфейсы на естественном языке;
• понимание связного текста и модель предметной области;
• речевое взаимодействие с компьютером: анализ и синтез;
• технологии представления и обработки знаний;
• естественный язык и Интернет;
• машинный перевод;
• автоматическая обработка полнотекстовых документов;
• корпусная лингвистика;
• словарь, тезаурус, онтология.
Большое количество лингвистических программ собрано в Каталоге лингвистических программ и ресурсов в Сети (www.rvb. ru/soft/-catalogue-/catalogue.html).
Данный каталог включает в себя описание программ, связанных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в Интернете. Упор при составлении каталога делался на бесплатные программы, доступные для загрузки. Однако описаны также некоторые on-line и коммерческие версии программ. Тематически каталог разбит на следующие разделы:
— программы анализа и лингвистической обработки текстов;
— программы преобразования текстов;
психолингвистические программы; генераторы текстов и «говорящие» программы; системы обработки естественного языка; коллекции ресурсов; словари и тезаурусы.
Дата добавления: 2014-12-21; просмотров: 3089;