Количественная и качественная оценка корпуса русских агнонимов
Полученный лексический массив нуждается в определенной количественной и качественной оценке.
А. Количественная оценка
На первый взгляд вопрос о количественной оценке кажется лишним. Действительно, если нам известно, что извлеченная из MAC совокупность слов включает в себя 8813 единицы, разве эта цифра не является исчерпывающей количественной характеристикой массива русских агнонимов? Оказывается, нет. Дело в том, что последовательное рассмотрение массива именно в антропоцентрическом ракурсе заставляет, с одной стороны, учитывать указанные выше следствия из щербовского положения о двух режимах использования человеком языка, а с другой, не упускать из виду и то обстоятельство, что полученный массив рассматривается как бы глазами среднего носителя русского языка. Последний же, как убедительно и остроумно доказал Л.В.Щерба своим примером с бокром и бокренком, обладает огромными по объему практическими знаниями о родном языке, в том числе и о тех его фрагментах (например, агнонимах), которые он не в состоянии использовать в речевой деятельности. В состав этого знания входит, в частности, информация практически о всех правилах грамматики и словообразования, о значениях всех морфологических и словообразовательных средств и т.д. Отмеченное обстоятельство заставляет рассматривать полученный массив всего лишь как основу для получения приближенных к реальности сведений о действительном объеме знаемого и незнаемого в пределах того, что в МАС называется общеупотребительной лексикой современного русского литературного языка. При этом в количественном отношении обсуждаемый массив можно охарактеризовать как одновременно и избыточный, и недостаточный. Его избыточность с указанной точки зрения прямо вытекает из отмеченного факта практического владения всей грамматической и всей словообразовательной системой родного языка. Если так, то объем незнаемого в аспекте рецептивного владения языком определяется количеством незнакомых непроизводных основ (корней), которое заведомо меньше полученного количества слов. Недостаточность же рассматриваемого массива определяется тем, что MAC далеко не всегда приводит все лексические единицы, входящие в представленные в нем словообразовательные гнезда: часть гнезд отражается в словаре только частично Между тем, поскольку среди русских словообразовательных средств имеет место, как известно, не только одноосновная (ср., уснуть и заснуть), но и разноосновная (ср., антициклон, но противоток) синонимия, при производстве речи носитель языка нуждается во всех без исключения словах с тем или иным агнонимическим корнем. Таким образом, поскольку сам по себе извлеченный из MAC агнонимический массив не содержит в явном виде всех сведений об искомых количественных характеристиках, для их получения необходимо предложить какие-то особые процедуры. Таких процедур две.
Первая — ее можно назвать словообразовательной конденсацией — состоит в сведении всех имеющихся в исходном списке однокоренных слов в словообразовательные гнезда. Ведь, если для понимания слова достаточно, обычно, знания его корня, то, по изложенным выше причинам, рецептивное овладение всем обсуждаемым массивом предполагает, по сути дела, усвоение хотя бы одного из членов каждого гнезда. Иначе говоря, количественная оценка агнонимического массива с точки зрения обеспечения рецептивной речевой деятельности должна сводиться к установлению числа словообразовательных гнезд, по которым распределяются извлеченные из MAC слова. В качестве регулирующего источника здесь может использоваться известный «Словообразовательный словарь русского языка» А.Н.Тихонова. Выбор этого словаря объясняется тем, что он представляет собой единственное лексикографическое произведение данного жанра, словник которого полностью включает в себя словник Малого академического словаря. В результате применения процедуры словообразовательной конденсации искомое число, характеризующее мощность агнонимического массива в рассматриваемом аспекте, оказалось равным 6080 единицам (коэффициент сжатия — 0,69).
Вторая процедура — мы называем ее словообразовательным развертыванием — заключается в дополнении исходного списка теми словами, которые входят в полученные на нем словообразовательные гнезда, но по тем или иным причинам не включены в MAC. Источником здесь в дополнение к уже упомянутому «Словообразовательному словарю» А.Н.Тихонова служил «Толковый отоварь русского языка» С.И.Ожегова, в котором помимо 42500 заголовочных слов рассматривается еще около 30000 производных лексических единиц в гнездах, завершающих словарные статьи. Процедура словообразовательного развертывания позволила установить число, характеризующее мощность агнонимического массива с точки зрения обеспечения продуктивных видов речевой деятельности. Это число — 11986 лексических единиц (коэффициент расширения 1,36).
Все сказанное о процедурах количественной оценки полученного перечня агнонимов можно проиллюстрировать следующей таблицей, демонстрирующей содержание и результаты словообразовательной конденсации и словообразовательного развертывания на материале агнонимов, начинающихся на букву <<Б». (Необходимые пояснения: в первой графе дается номер словообразовательного гнезда; во второй графе приводятся слова, составляющие соответствующее гнездо; в третьей графе содержатся сведения о мощности гнезда, т.е. о количестве слов, составляющих гнездо в русском языке; в четвертой графе указывается, сколько слов гнезда представлено в MAC; подчеркнуты слова, имеющиеся в MAC, а без подчеркивания приводятся слова, отсутствующие в MAC; арабская цифра после слова — это номер значения соответствующего слова в MAC; обозначение 0// это указание на то, что речь идет об оттенке однозначного слова).
№п/п | Агнонимическое гнездо | Мощность гнезда | Представленность в MAC |
1. 2. 3. 4. | бабашка баббит баббитный баббитовый бабка 3 бабка 4 |
Б. Качественная оценка
Качественную оценку полученного массива агнонимов можно осуществлять с опорой на разные основания. Среди последних важнейшими, как нам представляется, являются два, а именно, степень агнонимичности включенных в массив лексических единиц и распределение этих единиц в понятийном пространстве, покрываемом лексикой русского языка.
Агнонимичность как качество языковой единицы, определяющая меру ее незнания носителем языка, применительно к каждому конкретному слову выражается в разной степени. Это вытекает уже из того, что агнонимы отбирались на основе не одного, а ряда критериев, причем таких, которые обладают разной разрешающей силой. Например, кажется очевидным, что слово ендова в значении 'старинная русская посуда для вина' и это же слово в значении 'пространство между двумя скатами крыши' характеризуются разной степенью агнонимичности: в первом случае мы имеем дело с частичным незнанием (слово включено в массив на основе пятого критерия), а во втором — с практически полным незнанием (слово включено в массив на основе первого критерия). Возникает вопрос, как можно охарактеризовать состав рассматриваемого лексического массива, учитывая меру знания (незнания) входящих в него слов? Это можно сделать разными способами, среди которых вполне представимы и весьма тонкие, позволяющие устанавливать в МЛК носителя языка наличие или отсутствие информем, соотносящихся с любой наперед заданной семой из состава лексического значения агнонима. Такого рода способы ввиду громоздкости их процедурной составляющей могут применяться в работах, посвященных установлению степени агнонимичности небольших групп слов. В нашем же случае представляется достаточным использовать для получения искомых данных те же критерии, с учетом которых производилось формирование базового списка. При этом мы исходим из того, что, устранив неопределенность относительно количества совершенно незнакомых слов и слов незнакомых в той или мере, мы тем самым получим хорошее представление о степени агнонимичности массива в целом и каждого его элемента в отдельности. Проведенное обследование исходного перечня агнонимов под указанным углом зрения позволило получить следующую картину. В обсуждаемом лексическом массиве слов, оцениваемых как совершенно незнакомые (высшая степень агнонимичности) — 4795 единиц; слов, знание которых ограничено отнесением именуемого факта к определенной широкой сфере действительности — 1234 единиц; слов, называющих предметы, относительно которых известно только то, что они входят в определенные классы предметов, — 1287 единиц; слов, обозначающих известный в общих чертах предмет, относительно функциональных свойств которого, однако, сохраняется неясность – 532 единиц; слов, обозначающих известный в общих чертах предмет, относительно внешнего вида которого сохраняется неясность, — 661 единиц; известных исследователю в связи с особенностями его жизненного опыта и специальности слов, которые, как он предполагает, незнакомы лицам с другим жизненным опытом и другой специальностью, - 304 единиц. Все сказанное здесь можно проиллюстрировать на материале слов, начинающихся с буквы Ч(числовой индекс напротив каждого агнонима указывает, в соответствии с каким из обозначенных выше критериев данная лексическая единица была отнесена к агнонимам).
Агнонимы | Краткое толкование | № критерия |
чапельник чеботарить чепан червоводня червь2 черноризец | сковородник сапожничать старинная крестьянская верхняя одежда помещение для выкармливания гусениц шелкопряда устарелое название буквы «ч» монах |
Другой аспект качественной опенки полученного агнонимического массива состоит в установлении его содержательного разнообразия.
Даже беглого взгляда на обсуждаемый массив достаточно, чтобы убедиться, с одной стороны, в его исключительной смысловой пестроте, а с другой, в очевидной неравномерности распределения интересующих нас лексико-семантических единиц по разным лексико-семантическим и тематическим группам. В связи с этим весьма интересным представляется вопрос о локализации агнонимов в понятийном пространстве, покрываемом лексикой русского языка, и установлении, таким образом, зон повышенной агнонимической активности. Обнаружение и анализ таких зон позволит, как нам представляется, сделать выводы о закономерностях и аномалиях движения лексики в пределах лексикона русской языковой личности, о факторах (естественно-языковых, социальных, идеологических и т.п.), определяющих это движение. Один из возможных путей, ведущих к решению поставленной задачи, состоит в идеографической классификации отобранного массива агнонимов <..>.
Основная проблема, с которой сталкивается создатель идеографического словаря тезаурусного типа, состоит в построении генеральной синоптической схемы, отражающей содержание и структуру понятийного пространства, покрываемого соответствующим лексическим массивом. Было предложено два основных пути, ведущих к решению этой проблемы. Первый путь предполагает построение синопсиса исключительно на индуктивной основе. Предложенная Ю.Н.Карауловым версия индуктивного подхода предусматривает поэтапную работу с языковым материалом (декомпозиционный, агрегационный и ассоциативно-компонентный этапы), в результате которой, по предположению автора, можно прийти к органичному членению всего словаря в соответствии с его системными свойствами и получить искомую синоптическую схему идеографической классификации. Практическое идеографирование, осуществленное на основе этой методики, позволило Ю.Н.Караулову прийти к выводу о невозможности «перехода от языковой модели мира» на более высокий уровень обобщения — к «концептуальной модели мира» на основе чисто лингвистических приемов. Иными словами, указанный метод, будучи вполне приемлемым для смысловой группировки слов, не приводит, однако, к построению целостной, логически связанной картины мира.
Второй подход к построению идеографического словаря — индуктивно-дедуктивный. В содержательном отношении этот подход предполагает последовательное осуществление двух взаимодополняющих операций дедуктивного разбиения понятийного континуума, покрываемого лексикой языка, и индуктивного «восхождения» от отдельных слов к выделенным дедуктивным методом рубрикам Кроме того, рассматриваемая методика предусматривает специальную процедуру стыковки, притирки результатов упомянутых операций, в результате чего раскрывающие содержание каждой понятийной области младшие понятия выделяются как на логико-философской, так и на вполне эмпирической основе. Сильную сторону индуктивно-дедуктивною подхода мы усматриваем в том, что он позволяет не только произвести идеографирование всех без исключения лексико-семантических единиц любого наперед заданного массива слов, но и создать хорошо структурированный и психологически приемлемый синопсис понятий, которые отражаются классифицируемыми языковыми единицами.
Подобный синопсис может рассматриваться как понятийная схема, образующая своеобразную несущую конструкцию той концептуально-языковой картины мира, которая закодирована в русской лексике. Хорошее представление о подобного рода несущей понятийной конструкции дает синопсис первого на русском языковом материале идеографического словаря тезаурусного типа, включенного в качестве самостоятельной части в комплексный учебный словарь «Лексическая основа русского языка» (далее ЛОРЯ).
Сказанное дает нам основание избрать в качестве ориентира при исследовании семантического разнообразия русских агнонимов именно Синопсис идеографической классификации, на основе которого организована Идеографическая часть «Лексической основы». Он представляет собой упорядоченный перечень понятийных рубрик, отражающих (с разной степенью детализации) смысловое разнообразие русской лексики. В нем выделяются 29 именованных понятийных классов, 254 именованных понятийных разряда и 649 нумерованных групп
Как проводилась классификация? На базе предлагаемого в MAC толкования агнонимической лексико-семантической единицы устанавливалась ее семная структура с выделением опорной и квалифицирующих сем. Наибольшей информативностью характеризуются описательные толкования, особенно построенные по родо-видовому принципу, т.е. такие, в которых указывается ближайшее родовое понятие и видовые отличия денотата. Вполне понятно, что подобные толкования существенно облегчают задачу классификации слов. Иначе обстоит дело с толкованиями, в которых в качестве семантизирующего средства используются синонимы толкуемой единицы, например, перелеска — 'то, же, что печеночница'. Для того, чтобы оценить и классифицировать такую единицу, необходимо привести ее толкование к виду, удобному для классификации, т.е. заменить синонимическое толкование описательным, например, перелеска — 'рано цветущее вечнозеленое растение семейства лютиковых с кожистыми листьями и крупными зимующими синевато-фиолетовыми или белыми цветками'. Такого рода преобразования составляют весьма важный и ответственный этап подготовки языкового материала к смысловой классификации.
В полном виде процедура смысловой классификации агнонимов включала в себя: а)оценку толкования лексико-семантической единицы с целью установления его пригодности для использования в качестве основы классификации; б) приведение нестандартных толкований к виду, удобному для классификации; в) выделение на основе толкования опорной и квалифицирующих сем; г) отнесение лексико-семантической единицы к определенной рубрике Синопсиса идеографической классификации ЛОРЯ.
Общее представление о распределении агнонимов по основным понятийным классам дает следующая таблица.
Наименование классов | Количество агнонимов | |
1.0. | Абстрактные отношения и формы существования материи | |
1.1. | Существование, бытие | |
1.2. | Пространство | |
1.3. | Форма | |
1.4. | Время | |
1.5. | Изменение | |
1.6. | Движение | |
1.7. | Количество | |
1.8. | Качество | |
1.9. | Отношение | |
1.10. | Порядок | |
1.11. | Причинность | |
2.0. | Материальный мир | |
2.1. | Неорганический мир | |
2.2. | Органический мир | |
2.2.1. | Органический мир: общие понятия | |
2.2.2. | Растительный мир | |
2.2.3. | Животный мир (без человека) | |
2.3. | Человек | |
2.3.1. | Человек как живое существо | |
2.3.2. | Человек как разумное существо | |
2.3.2.1. | Ощущения и восприятие | |
2.3.2.2. | Чувства и эмоции | |
2.3.2.3. | Воля | |
2.3.2.4. | Интеллектуальные действия и состояния | |
2.3.2.5. | Душевный склад человека | |
2.3.2.6. | Деятельность человека | |
2.3.2.7. | Поведение человека | |
2.3.3. | Человеческое общество | |
2.3.3.1. | Человек как общественное существо | |
2.3.3.2. | Коммуникация мыслей и чувств | |
2.3.3.3. | Отношения в обществе | |
2.3.3.4. | Трудовая деятельность человека | |
2.3.3.5. | Социальная организация общества |
Наиболее наполненными оказались следующие именованные группы.
<…> Прежде всего это касается первой из упомянутых групп, а именно «Религиозные чувства». Её чрезвычайная наполненность объясняется особенностями конструирования синопсиса ЛОРЯ. Как указывается в вводной статье к словарю ЛОРЯ, «Процедура получения идеографического списка состояла в последовательном анализе словника алфавитной части с точки зрения принадлежности каждого ЛСВ к той или иной лексико-семантической группе и получении таким образом связанных по смыслу лексических групп. После того, как все лек-сико-семантические единицы исходного списка были распределены по лексико-семантическим группам, последние упорядочивались, нумеровались и каждая из них дополнялась ассоциируемыми с нею словами, которые отбирались по соображениям учебно-методической целесообразности» [82: 19|. Дело, однако, в том, что упомянутый словник алфавитной части, анализ единиц которого позволил авторам создать каркас синопсиса, представлял собой список 2500 самых частых русских слов, полученный особым совмещением и преобразованием данных восьми частотных словарей русского языка. В этом списке оказалось только три слова, относящихся к сфере религии: вера, верить и Бог. Такая ситуация объясняется тем, что период отечественной истории, к которому относятся все имеющиеся на сегодняшний день частотные словари, был, как известно, далеко не самым благоприятным для Русской Православной Церкви и ее народа. <…>
Нa втором и третьем местах по наполненности находятся группы, отражающие степень нашего незнания животного и растительного мира. Главное объяснение этого факта состоит в том, что словарь, из которого мы извлекали агнонимы, охватывает в той или иной мере фауну и флору всей планеты, тогда как лексикон языковой личности всегда ориентирован прежде всего на те их фрагменты, которые соответствуют зоне ее проживания. Кроме того, нельзя не учитывать и неблагоприятного в интересующем нас отношении влияния на человека цивилизации как таковой. В ее силовом поле иерархия ценностей существенно меняется: мы все выше ставим знание артефактов и все меньше обращаем внимание на явления и предметы природы.
То, что в отобранном массиве агнонимов будет широко представлена функционально связанная лексика (различные терминологии) можно было, по понятным причинам, предвидеть, а вот то, что на пятом месте обнаружится группа слов передвижения по воде, оказалось определенной неожиданностью. Впрочем, если мы вспомним, что люди от века не могли смириться с наличием разделяющих их пространств, среди которых особые хлопоты доставляли им водные просторы, и от века они изобретали и строили средства передвижения, позволяющие освоить эти враждебные им просторы, то полученный результат не так уж и удивителен. Недаром ведь одним из первых известных нам средств передвижения был знаменитый Ноев ковчег.
Исчерпывающие данные о характере и результатах идеографирования слов, входящих в рассматриваемый массив, содержатся в классификационной графе перечня агнонимов, приводимого в качестве Приложения. Числовой показатель в этой графе указывает, к какой рубрике синопсиса ЛОРЯ относится соответствующая лексико-семантическая единица. Если такой показатель сопровождается каким-л. надстрочным знаком, это значит, что слово отнесено к вновь выделенной рубрике.
Печатается по кн. Морковкин В.В., Морковкина А.В. Русские агнонимы: Слова, которые мы не знаем. М., 1997.
А.Г. Лыков
Дата добавления: 2014-12-03; просмотров: 1491;