Лексическое функционирование словообразования и лексико-словообразовательная системность русского языка в свете статистики Интернета | Вестник Томского государственного университета. Филология. 2011. № 1 (13).

Лексическое функционирование словообразования и лексико-словообразовательная системность русского языка в свете статистики Интернета

Исследуется взаимодействие словообразовательной и лексической систем русского языка, а именно лексическое функционирование русских производных слов, которые оцениваются с точки зрения их частотности в текстах Интернета. Количественные характеристики извлекаются автором из поисковых систем Яндекс, Рамблер идр. Их данные используются для выявления степени «лексичности» производного слова, описания словообразовательных парадигм на шкале лексического функционирования, переоценки границ между потенциальными и реальными словами, лексикографической репрезентации в частотных, толковых и словообразовательных словарях.Значительное место в работе занимает обсуждение методологической проблемы соотносимости показаний языкового сознания, полученных в эксперименте, и объективных данных статистики Интернета.

Lexical functioning of word-building and the lexical-word-building system of theRussian language in the light of Internet statistics.pdf В статье реализуется лексикоцентрический взгляд на образование ифункционирование производного слова, в соответствии с которым сама по-требность в новообразовании лежит в лексике, а ее реализация подчиняетсязаконам лексического функционирования. При таком взгляде на влияние сло-вообразования на неологический процесс подобное влияние относится к сфе-ре следствий, а не причин, в частности, такие функции словообразовательнойсистемы, как категоризация или пропозиция, оцениваются как следовые [1].Объектом описания выступают словообразовательные дериваты, вошед-шие (или входящие) в сферу лексического функционирования, где они под-чиняются его законам и, как следствие, приобретают собственно лексическиесвойства. Этот процесс достаточно длительный, трудно отслеживаемый, по-скольку границы его этапов размыты, поэтому долгое время он не был пред-метом внимания дериватологов. В предлагаемом исследовании данный про-цесс рассматривается на материале, позволяющем в какой-то мере вывестиего в «наблюдаемую зону» и описать, опираясь на достаточно надежные ко-личественные данные. Источником такого материала являются поисковыесистемы Интернета и сопровождающие результаты поиска отдельных словстатистические показатели.1. Идея исследования и ее методологические презумпцииВзаимодействие словообразования и лексики начинается уже с этапа воз-никновения слова, с процесса трансформации производного слова, традици-онно называемого потенциальным, в окказиональное слово. Окказиональныеслова весьма противоречивы по своему языко-речевому статусу. С однойстороны, они отчетливо несут на себе отпечаток внутреннего устройства вир-туального словообразовательного механизма, представляясь «правильными»словами, не осложненными индивидуально-лексическими наслоениями, при-сущими узуальным словам. С другой стороны, говоря даже о начальных эта-пах деривации слова, мы должны отметить, что они возникают не в вирту-альных пространствах, а в реальных речевых актах вследствие вполне кон-кретных потребностей контекста и речевой ситуации, поэтому уже первыеупотребления деривата так или иначе индивидуализированы и конкретизиро-ваны. Поэтому они одновременно «лексичны» и «алексичны». Читатель мо-жет в предыдущем предложении найти иллюстрацию развиваемого тезиса:несмотря на то, что лексические новообразования лексичны и алексичны, са-мим фактом употребления их в приведенном контексте «перешли» из разрядапотенциальных в окказиональные и, казалось бы, насквозь прозрачны и вы-водимы, они на самом деле впитали в себя определенные смыслы контекста,и их значения выводимы лишь с учетом этих смыслов, и (если позволительнопредположить, что за ними есть будущее в плане узуализации) эти смыслы вдальнейшем могут лексикализоваться на уровне словарных единиц, обрестикакие-либо модификации и еще более отдалиться от «чистого» (=выводимогобез остатка) лексико-словообразовательного значения.За такой постановкой вопроса имеется и более общий теоретический во-прос, уже не однажды поднимавшийся нами (см., например, работы [2; 3]), -предметом какой науки является функционирование производного слова:словообразования (куда его относят по сложившейся традиции) или лексико-логии. Мы показали выше, что уже с первого акта реализации (явленности)потенциального слова в речевом материале оно «лексично», тем более чтоего дальнейшее бытие неизбежно усиливает его «лексичность», ослабляя (пе-реводя в план генетического) его связь со словообразованием.Лексичность окказионализма отчетливо проявляется и в том, что его ин-дивидуально-ситуативный характер относителен: никакое слово, образован-ное по действующим словообразовательнымпровизируемое мной слово, например, in-decor-adle «такой, которого невоз-можно украсить», уже существует потенциально в языке его реализацияв речи есть факт незначительный по сравнению с самой возможностью егообразования» [5. С. 200]. Все сказанное лишний раз подтверждает, что вопро-сы о сущности основополагающих понятий словообразования, находящихсяна стыке с лексикологией, остаются открытыми; в их числе понятия словооб-разовательного процесса, словообразовательной интенции, нового слова(лексической инновации), потенциального слова, окказионального слова и др.Одну из попыток конкретно-исследовательского решения проблемы по-степенного «вырастания» окказионального слова из потенциального, а узу-ального - из потенциального находим в статье Н.Б. Лебедевой [6], выполнен-ной на статистической базе. Исследования Н.Б. Лебедевой заключаются вразработке и исследовательской реализации эксперимента, основанного насоздании ситуации, активизирующей у испытуемых языковую интуицию;такая ситуация формирует у них установку на интроспекцию по отношениюк результатам языко-интуитивной деятельности, что позволяет эксперимен-татору статистически фиксировать их рефлексии на те или иные дериваты врамках направленной установки. Статистика таких рефлексий и давала осно-вания для квалификации дериватов на шкале «степень лексичности». Такимобразом, в идеях анализируемой статьи Н.Б. Лебедевой лежит лексикоцен-трическое в своей основе представление об эволютивном характере словооб-разовательного процесса и нахождении зарождающейся лексической едини-цы на одном из этапов этого процесса. Данная эволюция проецируется в сис-темную плоскость и обнаруживается в возможности типологии дериватов попризнаку «степень лексичности» (или, от обратного, по признаку «степеньотдаления от этапа потенциальности и виртуальности»).В данной методике реализован принцип единства системного и менталь-ного бытия языка, основы которого мы находимдолжны строиться в ряды» [8. C. 184]. В разделе «Ассоциативные отноше-ния» Ф. де Соссюр совершенно естественным образом переходит от «ассо-циативных групп в нашем сознании» к словоизменительным и словообразо-вательным парадигмам как проявлениям собственно языковой системности[5. C. 158-159].Применительно к настоящей статье приведенные методологические тези-сы не отдаленные абстракции, они достаточно непосредственно включаютсяв квантитативную методику, применяемую как в статье Н.Б. Лебедевой, так идалее в нашем непосредственном исследовании фрагмента языкового мате-риала.2. Методика квантитативного измерения функционального потен-циала лексических дериватовПредметом рефлексии испытуемых в эксперименте Н.Б. Лебедевой сталичетыре глагола: нахвастаться, перехвастаться, забодриться, нахрабри-ваться. В результате эксперимента получено 300 анкет. Обобщая результаты,автор отмечает, что степень нормативности этих глаголов различна - от без-условно недопустимого, неприятие которого указывается большинством ин-формантов, до понимания их как «естественных». Сопоставление словообра-зовательной и лексической нормы дает возможность выяснить, в какой сте-пени образованное слово соответствует словообразовательной системе и вкакой - лексической норме. Предполагается, что есть определенная (нежест-кая) корреляция между первым и вторым.Продолжим линию оценки перспективности исследований данного на-правления. Обратимся к практическим значимостям. Они заключены в лек-сикографических потребностях. Уже давно существует потребность отделе-ния собственно узуальных слов от неузуальных. Нерешенность этой пробле-мы бросается в глаза всякому, кто рассматривал с этих позиций любой толко-вый словарь (как и словари многих других типов): вопросы типа, почему всловарях нашло отражение слово наболтаться, но нет слова натрепаться,есть наливочка, но отсутствует настоечка, есть наипрекраснейший, но нетнаикрасивейший1? - остаются до сих открытыми для теоретической лексико-графии, а в лексикографической практике решаются на основе интуиции со-ставителей словарей. Было бы весьма упрощенно трактовать интуицию тако-го тонкого знатока языка, каким, несомненно, является лексикограф, как не-надежный и неприемлемый инструмент познания семантики языка. Интуициядаже рядового носителя языка достаточно адекватно ее отражает, что - вчисле прочего - доказывает и эксперимент Н.Б. Лебедевой в указанной ста-тье, результаты которого подтверждают наши квантитативные данные2, и темне менее потребность в получении более объективных (желательно формали-зованных) оценок функционально-семантического статуса слова неизбежновозникает по мере развития как теории семантики, так и лексикографическойпрактики.Далее мы осуществляем попытку апробации для этой цели одной из про-стейших методик квантитативного представления функционально-семантического статуса слова - использование его частотностных характери-стик. При этом речь идет не об известных частотных словарях, «мощность»которых не соответствует потребностям такого исследования. Их выборка непозволяет системно фиксировать столь тонкий лексический материал, како-вым являются едва лишь зарождающиеся лексические единицы, эпизодиче-ски выходящие за пределы статуса потенциальных слов и высвечивающиесяв речевом материале как словообразовательные окказионализмы. В качестветакого инструмента мы предлагаем использовать статистические и иллюстра-тивные данные поисковых систем Интернета, превосходящие по квантита-тивной мощности частотные словари в сотни тысяч раз (см. другие штудииавтора на эту тему: [3; 10]). Например, сделаем запрос в поисковой системеЯндекс на потенциальное слово вболеться, которое оказалось зафиксирован-ным на 4 марта 2007 г. в Интернете на четырех страницах и в трех сайтах и,следовательно, потенциальность которого уже не может быть оценена какабсолютная (но по сравнению с другими окказионализмами она тем не менеевесьма высокая). При необходимости качественной оценки окказионализмаИнтернет позволяет обратиться к иллюстративным данным, в частности, поотношению к слову вболеться они таковы: «Рискну в белизну страницы -седьмое небо, в чистый слог Вболеться, вслышаться, вродиться. Вмолчать-ся. Как всему итог…» (персональный сайт поэта В. Петрова); Понимаю те-бя, я еще не сильно вболелся в Кими, а уже категорически против его воз-можного перехода в Феррари. (Форум «Переход Монтои»); Нужно было до-биться инвалидности 1-й группы, и я добилась, отказавшись ходить и есть,имитируя падучую. Я так вболелась в свою роль, что уже не могла из неевыйти. (И. Лиснянская. Хвастунья). Как не трудно убедиться, каналом пере-хода слова вболеться с уровня потенциальных на уровень реальных являетсяхудожественная речь, что легко объяснимо, учитывая высокую степень ин-тенсивности-выразительности, которую несет словообразовательная модель«В…СЯ» в сочетании с глаголами чувства.Теперь вернемся к методологическим тезисам из подраздела 1. Сопоста-вим качественную сторону данных, полученных в эксперименте, и статиче-ских данных Интернета. Рассмотрим в этой связи вопросы, предлагаемыеиспытуемым Н.Б. Лебедевой. Информанты должны ответить на вопрос 1:Данное слово Вам: а) понятно, обычное слово; б) понятно, но как-то непри-вычно; в) понятно, но так не говорят, режет слух; г) непонятно, нет такогослова и на вопрос 2: «Можно ли так сказать?», отмечая один из пунктов во-просника: а) да; б) скорее да, чем нет; в) скорее нет, чем да; г) нет. Какой ме-ханизм рефлективной деятельности предполагается этими вопросами? Есте-ственно, что отвечающий должен сконцентрировать свои усилия на форми-ровании и затем оценке концентрированного образа, обобщающего в чувст-венной (чувственно-языковой?) форме свой коммуникативный опыт (в пер-вую очередь - в позиции слушающего и читающего) использования данногослова, т.е. оценку языкового материала, по терминологии Л.В. Щербы в ука-занной выше статье. Большую роль в этом образе играет количественная сто-рона такого функционирования, что означает, что в языковое чувство входити такой компонент, как частотность.Насколько точен внутренний «счетчик» рядового носителя языка? Иссле-дование Н.Б. Лебедевой расположило анализируемые ею глаголы в следую-щей последовательности на оси «степень лексичности» (начиная с более вы-сокой) или, напротив, «степень потенциальности (начиная с наиболее низ-кой)»: нахвастаться - перехвастаться - забодриться - нахрабриваться.Краткий комментарий исследователя. Глагол нахвастаться (вдоволь похва-статься) - узуальный, словарный. Глагол перехвастаться (похвастатьсясверх меры) - узуальный (хотя не отмечен в словаре), входит в «ближнюю»потенцию, но еще не вошел в лексическую норму; потенциальное слово. Гла-гол - забодриться (начать бодриться) - неузуальный, создан с некоторымидеформациями словообразовательной системы, входит в «дальнюю» потен-цию, лексической норме не соответствует; среднее между потенциальным иокказиональным словом. Глагол нахрабриваться (длительно, интенсивносовершать действие «храбриться») - неузуальное слово, созданное со значи-тельными деформациями словообразовательной нормы; составляет «сверх-дальнюю» потенцию, лексической норме не соответствует; появление его вречи маловероятно, оно находится на грани окказионального и невозможно-го. Эта цепочка на оси частотности в Интернете выглядит следующим обра-зом (табл. 1).Таблица 1Частотные показатели слов по данным поисковых систем ИнтернетаПоисковая систем аГлагол Яндекс Rambler GoogleНахвастаться 3143 493 636Перехвастаться 292 9 10Забодриться 319 62 62Нахрабриться 151 6 2Как видим, имеется несоответствие оценок, оно касается второго итретьего члена анализируемой цепочки. Причина такого несоответствия, нанаш взгляд, заключается в том обстоятельстве, что глагол забодриться отно-сительно широко вошел в узуальный фонд, который, однако, по тем илииным обстоятельствам не отразился в языковомется, нельзя говорить о высокой степени коррелятивности квантитативныхоценок языковой интуиции и объективной частотности, но и он дает предпо-сылки для постановки вопроса о степени их коррелятивности и, следователь-но, о необходимости (а также и возможности) его решения. Можно априорипредположить как наличие тенденций к их сближению, так и возможностьсистемных (не случайных) расхождений.3. Семантические отношения между словообразовательными и лек-сико-словообразовательными единицами сквозь призму их частотностиНепосредственным объектом изучения в данном, конкретно-исследовательском, разделе выступают результаты реализации продуктивныхсловообразовательных моделей в речевом материале, отраженном в русскомИнтернете (Рунете). Таковыми результатами являются внутриглагольные мо-дификационные образования от глаголов состояния. Исходным пунктом дляотбора выступили сами глаголы, которые проанализированы в статьеН.Б. Лебедевой (хвастаться, храбриться, бодриться), а также их синонимы,антонимы и гипонимы: хвалиться, бахвалиться, трепаться, болтать, мол-чать, грустить, тосковать, печалиться, горевать, болеть, хворать. Данныеглаголы выступали в качестве мотивирующих для модификатов, образуемыхпутем присоединения формантов. Их список: В-, В…СЯ, ВЗ-, ВЫ-, ДО-,ДО…СЯ, ЗА-, ЗА…СЯ, ИЗ…СЯ, НЕДО-, О-, ОТ-, ОТ…СЯ, ПЕРЕ-, ПО-,ПОД-, ПРИ-, ПРО-, НА-, НА…СЯ, С-, У- и под. Таким образом мы испыты-ваем возможность вписывания «экспериментальных глаголов Н.Б. Лебеде-вой» в более широкий контекст. Результаты сведены в табл. 2 и 31.Таблица 2Префиксальные дериваты невозвратных глаголовПрефиксГлагол до- пере- за- недо- на- по- вз-Болеть16 431 5683 075475323 2241444 232 88829924501 010 8831971303 283505414Горевать819 55324538387956 9738411031572044 5191423277Грустить1 958 38254828670587177 9231 06614022859597 9762844637Молчать11 450 2211 7942 0812 5424R1 512 77329R41440R2 3553 4081 133 86923R30RТосковать665 00971984365084 690546105152110 283305176703Хвастать184 55713357R4729R286636R221 8342 959327 1251 744 440046Хворать947 7365747R917060 28937R00278175R8950R00Болеть16 431 56854142300721937816328 902651197 823962924Горевать819 55342327726118100239311 458564000Болеть16 431 5683 075475323 2241444 232 88829924501 010 8831 971303 283505414Таблица 3Префиксальные дериваты невозвратных глаголов (продолжение)1ПрГлагол ефиксдо- пере- за- недо- на- по- вз-1 958 382 4463770694422111 23106330601Молчать11 450 22130R90R122 4290R1 046 42716R919220 735418444Y6364RТоско-вать665 009176703407423 59201120848100122Хвастать184 55704623798016351246100210410Хворать947 73600550R000023803 843300Далее мы покажем некоторые наиболее общие «выходы» такого рода по-строений.1. В нашем материале не нашлось ни одного приставочного производногоглагола, который был бы частотнее исходного, бесприставочного, что не тре-бует комментариев: все сложное (а производное, как правило, сложнее и поформе, и по семантике) существует в меньших количествах, чем простое.Однако некоторые приставочные глаголы существенно приближаются в ко-личественном отношении к бесприставочным, резко выделяясь по этому при-знаку среди прочих приставочных образований (помолчать, похвастаться,погрустить, заболеть, загрустить, замолчать), и причины здесь тоже по-нятны лингвисту-«системщику» - так или иначе такое сближение по частот-ности отражает приближение пары бесприставочный / приставочный глагол ккорреляциям собственно видового содержания2 (известно, что в сфере видаидет своеобразная конкуренция за первенство на оси семантической марки-рованности / немаркированности, и частотность отражает ее); нет сомнения втом, что в области так называемых чисто видовых корреляций мы вправеожидать дальнейшее сближение и обнаружение случаев с обратной корреля-цией, ср.: стараться - 18 млн, постараться - 10 млн, но уже писать -103 млн, написать - 122 млн, делать - 93 млн, сделать - 169 млн. Как ви-дим, тут есть материал для системной прогностики в области динамикиграмматической системы русского языка.Таким образом, в конкуренцию лексики и словообразования самым ре-шительным образом вторгается грамматика, и мы можем наблюдать процес-сы их грамматикализации в «квантитативном зеркале».2. Очевидно, что такие таблицы дают исследователю возможность изме-рения потенциала функционирования словообразовательных моделей (ти-пов). К примеру, хорошо видно, что порождающая мощность моделей с фор-мантом НЕДО- явно «недотягивает» до мощности модели с ПЕРЕ- или ОТ-;очевидно слабы модели с У-, С-, ВЗ-, ПОД-; напротив, сильны модели с ЗА-,НА-; модели с ДО- и ИЗ- близки по квантитативной мощности, но ДО- все-таки несколько «сильнее».3. Весьма интересен факт конкуренции лексики и словообразования, обна-руживаемой в горизонтальных рядах. Сравнение показывает наличие двух кана-лов пополнения речевого материала: наращивание мощности словообразова-тельной модели и, напротив, - лексикализация. Так, в сфере действия слабых (ине только слабых) моделей мы всегда можем найти «всплески» активности от-дельных лексем с явными лексическими наслоениями: приболеть, изболеть,отболеть, умолчать, смолчать, отмолчаться, взгрустить (ср.: взгрустнулось),наболеть (ср.: наболело). Их суммарные показатели явно не уступают показате-лям более многочисленных регулярных и стандартных производных.4. Горизонтальные ряды, выстроенные в порядке частотности (убываю-щей или возрастающей), показывают мотивирующий потенциал исходныхглаголов. В определенном аспекте он коррелятивен частотности самих этихисходных глаголов, что не требует особых комментариев: частотное - значитактивное во всех отношениях, в том числе и в отношении деривационногоразвития. По этой причине больше всего «нулей» в табл. 2 - у глагола хво-рать, а в табл. 3 - у глагола бахвалиться. Мы попытались найти коррелятив-ность в этом плане на уровне общих частотностей мотивирующего глагола исуммарного выхода всех производных от него, однако закономерностей здесьне оказалось: слишком сильно «возмущающее» влияние лексикализованныхпроизводных глаголов.Гораздо больше проявлений коррелятивности на уровне ранговых коэф-фициентов частотности: во многихТаким образом, мы видим хорошие возможности у статистики Интернетаучаствовать в решении проблем системной лингвистики. На наш взгляд, оникомпенсируют (хотя здесь все достаточно относительно) имеющиеся в этомплане ограничения. Большая часть их связана с высокой степенью формали-зации квантитативного коэффициента слова и, как следствие (недостатки -продолжение достоинств!), отвлечения от вариативности семантики, поэтомувозникает эффект неоднозначности моделей: полисемия производных всегдаостается фактором, снижающим «чистоту» получаемых характеристик сис-темных отношений единиц. Очевидны и сугубо программные ограниченияпоисковых систем Интернета, связанные с дифференциацией слов и слово-форм, слов и вариантов слова. В частности, в ходе нашей работы в отдельныхзапросах не различались возвратные и невозвратные глаголы, глаголы со-вершенного и несовершенного видов, дифференцируемые суффиксами.Оценка значимости такого рода помех для решения конкретных задач, види-мо, еще долго будет присутствовать при обсуждении результатов, получен-ных на основе статистик поисковых систем Интернета. И тем не менее длярешения многих задач данный источник, несомненно, перспективен. Кванти-тативная мощность, доступность, проверяемость (как фактор достоверности),возможность обращения к непосредственным речевым произведениям - су-щественные лингвоисточниковедческие достоинства статистических данныхИнтернета. Для словообразования они важны возможностью переходить отспорадических фиксаций производных слов к системным, в частности воз-можностью верификации любого потенциального слова как реального.

Ключевые слова

словообразование, лексика, словообразовательная парадигма, внутриглагольное словообразование, потенциальное слово, окказионализм, узуальное слово, отглагольный дериват, статистика, word-building, lexis, word-building paradigm, intra-verbal word-building, potential word, nonce word, usual word, verbal derivative, statistics

Авторы

ФИООрганизацияДополнительноE-mail
Голев Николай ДаниловичКемеровский государственный университетд-р филол. наук, профессор кафедры русского языкаngolevd@mail.ru
Всего: 1

Ссылки

Голев Н.Д. Словообразование как эволютивный синергетический процесс // Актуальные проблемы современного словообразования. Вып. 2 / Под ред. Л.А. Араевой. Кемерово, 2008. С. 21-31.
Голев Н.Д. О возможностях Интернета в количественном описании лексической семантики // Славянская филология: исследовательский и методический аспекты: Материалы I Междунар. науч. конф., 23-24 марта 2006 г. / Под ред. Н.Б. Лебедевой. Вып. 1. Кемерово, 2006
Голев Н.Д. Поисковые системы Интернета как лингвистический источник (на примере решения некоторых теоретических и прикладных вопросов русского словообразования) // Новые явления в славянском словообразовании: Система и функционирование: Докл. XI Междунар.
Земская Е.А. Современный русский язык: Словообразование. М., 1973.
Соссюр Ф. де. Труды по языкознанию. М., 1977.
Лебедева Н.Б. Экспериментальное исследование производного слова: соотношение выводимости как словообразовательного признака и узуальности как лексического признака // Новые явления в славянском словообразовании: Система и функционирование: Докл. XI Междун
Щерба Л.В. О трояком аспекте языковых явлений и об эксперименте в языкознании // Щерба Л.В. Языковая система и речевая деятельность. Л., 1974.
Бодуэн де Куртенэ И.А. Николай Крушевский, его жизнь и научные труды // Бодуэн де Куртенэ И.А. Избранные труды по общему языкознанию. М., 1963. Т. 1. С. 146-202.
Сводный словарь современной русской лексики. М., 1991.
Голев Н.Д. Лингвистический статус и некоторые особенности функционирования мотивированных единиц русского языка // Номинативные единицы языка и их функционирование: Межвуз. сб. науч. тр. Кемерово, 1987. С. 105-115.
 Лексическое функционирование словообразования и лексико-словообразовательная системность русского языка в свете статистики Интернета | Вестник Томского государственного университета. Филология. 2011. № 1 (13).

Лексическое функционирование словообразования и лексико-словообразовательная системность русского языка в свете статистики Интернета | Вестник Томского государственного университета. Филология. 2011. № 1 (13).

Полнотекстовая версия