Следите за нашими новостями!
Твиттер      Google+
Русский филологический портал

И. А. Угланова

ОБ "ЭФФЕКТЕ ЧАСТОТЫ" В ТИПОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ И ТЕОРИИ ЯЗЫКОВЫХ УНИВЕРСАЛИЙ [1]

(Филологические заметки. - Пермь, 2009. - Вып. 7. - Т. 1)


 
In the present paper there is discussed the role of frequency effect in language universals and typology studies. In quantitative typological works the frequency acts as a quantitative measure for an investigation of statistical dependences between language phenomena. In other words, the frequency acts here only as a tool of metaanalysis. The experience of the development of typological direction in linguistics, the experience of the quantitative analysis in psycholinguistics allows to extend the interpretive base of «frequency effect» and to consider it as a part of cognitive processes, as a tool of the mind.
 
1. Введение. В типологических исследованиях, а также в исследованиях, занимающихся поиском языковых универсалий, фактор частоты встречаемости тех или иных языковых единиц или определенных характеристик (признаков) языковых единиц играет вспомогательную роль. Другими словами, он является скорее средством анализа, нежели частью онтологических характеристик речевой деятельности в целом. Такой подход позволяет лишь подсчитать, предварительно выделенные признаки, и установить на этом основании определенную систему взаимосвязей. Таким образом, частота здесь выступает как средство метаанализа. Термин метаанализ используется в данном контексте не в терминологическом смысле (как статистический метод оценки вероятности значимых эффектов), а как инструмент исследования языка (ср., метаязыковая функция языка в терминологии Р.О. Якобсона; (Якобсон, 1975).
2. «Grammatica universalis»: ретроспектива эволюции с общеметодологических позиций. Как известно, типологические исследования и теория языковых универсалий - два разных подхода к решению одной задачи - выявлению определенной меры схожести и различия в языках и установлению на этом основании общих законов организации и функционирования языка. В настоящей статье я не буду акцентировать внимание на специфике этих подходов, здесь важен сам предмет, а не аспекты его исследования в вышеуказанном смысле.
Представляется, что направление поиска - поиска общих принципов организации языков (как радикальный вариант - общего источника происхождения языка) - является отражением особенностей мифологического сознания древних (ср., библейскую историю о вавилонской башне), особенностей их космологических представлений о себе и своем месте в этом мире. Этот аспект можно назвать культурной интерпретацией экзистенциального вопроса об основах основ. Однако, с другой стороны, все, возможно, еще «проще» - такова человеческая природа, такова специфика человеческой организации психических процессов. Когнитивный механизм человека - мощный инструмент категоризации, которая, как известно, основывается на нашей способности находить сходства и различия между воспринимаемыми объектами и на этом основании осуществлять их группировку (Evans et al., 2006: p. 248).
Первые опыты разработки универсальных грамматик обычно относят к средним векам. Еще в XIII в. Роджер Бэкон говорил о том, что грамматика для всех языков едина, ср.: «Grammatica una et eadem est secundum substantiam in omnibus linguis, licet accidentaliter varietur [2]» (Bacon, цит. по: Ferguson, 1978: p. 9). Автором первой универсальной грамматики считается испанский ученый Франсиско Санчес (Francisco Sánchez de las Brozas; 1523-1601). Ключевой в его труде «Минерва, или о первоосновах латинского языка» (1587) является идея о том, что язык суть универсальный феномен, единый для всего человечества, который реализуется в каждом языке определенным образом.
Апофеозом развития рационально-универсального подхода, конечно же, является работа двух монахов-янсенистов из монастыря Пор-Рояль Клода Лансло (1615-1695) и Антуана Арно (1612-1694) «Общая и рациональная грамматика Пор-Рояль…», известная больше как «Грамматика Пор-Рояль» (1660). В этой грамматике исходной является идея подчиненности языка разуму, законам логики [3]. Поскольку законы мышления универсальны, соответственно, и структурные закономерности построения языков тоже должны быть универсальными.
Качественно новый этап в разработке идеи языковых универсалий связан уже с событиями середины XX в. Речь идет о конференции, состоявшейся в Нью-Йорке 13-15 апреля 1961 г., где был принят всем известный Меморандум о языковых универсалиях (Гринберг и др., 1970). Принципиальное отличие нового этапа связано прежде всего с методологической экспансией в данной области исследования. Именно эту черту новейших разработок особо подчеркивает Б.А. Успенский.
По мысли Б.А. Успенского, история типологических исследований есть смена двух подходов - эмпирического и методологического. Первый этап типологических исследований Б.А. Успенский характеризует как эмпирический, а второй - как методологический. Он пишет: «Если для типологий XIX в. характерен преимущественный акцент на том, что в действительности есть в разных языках, то для типологического подхода нашего времени характерен интерес прежде всего к тому, как вообще можно описывать разные языки» (Успенский, 1969: 5).
Таким образом, на современном этапе на фоне отсутствия общих онтологических представлений об объекте исследования стали экстенсивно разрабатываться методологические основания анализа. Эта асимметричность в развитии (до сих так и не преодоленная) привела, как пишет Б.А. Успенский, к своеобразному дисбалансу в типологических исследованиях, в которых отсутствие фиксированного представления о предмете исследования сочетается с продвинутостью методологической стороны языкознания как точной науки (Успенский, 1969: 5).
Другой крупный российский теоретик, методолог и философ Г.П. Щедровицкий, размышляя о проблеме универсалий в свете современного состояния лингвистики, указывает на терминологическую проблему, на нерешенность базовых понятий в этой области (Щедровицкий, 1969). Терминологическая проблема является одним из следствий более серьезной проблемы - отсутствия единого онтологического представления об исследуемом объекте - языке.
Несмотря на то, что цитируемые статьи как Б.А. Успенского, так и Г.П. Щедровицкого относятся к концу 60-х годов XX в. (статьи опубликованы в 1969 г.), однако каких-либо парадигмальных изменений в этой области не произошло: общая картина стала только еще более дробной и расплывчатой. С одной стороны, усилилась предметная специализация в лингвистике, с другой стороны - сблизились отдельные отрасли лингвистики с другими дисциплинами, в результате чего возникли смежные дисциплины. Все это пока не способствовало выработке единого представления об онтологии языка.
Условно ситуацию можно представить следующим образом (см. рис. 1). Отдельные секторы со стрелками на рисунке обозначают различные подходы к рассмотрению языковых универсалий (структурный, когнитивный, качественный, количественный и пр.). В центре схемы в круге с проницаемыми границами со знаком вопроса расположен непосредственно сам объект анализа - онтология языка.
Существующие подходы по отношению друг к другу, как мне представляется, являются резистентными. Резистентность подходов обусловлена тем, что объекту навязывается методология тех школ, направлений, собственных представлений отдельных ученых, в рамках которых исследуются вопросы типологии и проблемы универсалий. Конечно же, исследования строятся в определенной степени на системной онтологии объекта, что на схеме отражено в проницаемости границ между аспектами исследования объекта и его онтологическими характеристиками.
Разработанность проблемы универсалий, типологических исследований имеет принципиальное значение для понимания объекта лингвистики в целом, поскольку здесь степень разработанности является отражением того, насколько глубоко мы знаем свой объект, что мы вообще знаем о языке.
Лингвистика по своему предмету и методам - наука эмпирическая. В этом заключается ее познавательная мощь. Перспектива ее развития связана с интеграцией подходов. По этому пути, в частности, как раз и движутся науки когнитивного направления. Возможно, именно междисциплинарный «мозговой штурм» расширит системные границы непознанного. Значение междисциплинарности в исследованиях сложных объектов заключается в том, что подобные подходы выступают в роли своеобразных реактивов, позволяющих обнаружить «присутствие искомого вещества». Такая динамика развития позволит наметить новые общетеоретические и методологические задачи и способы их решения, а значит, «средствами более мощной теории» хотя бы отчасти познать онтологию объекта - языка.
Однако вернемся к теории лингвистических универсалий и типологии. Ситуация в этой области знания подобна той, которая была в химии до открытия в 1869 г. Д.И. Менделеевым периодического закона. Как известно, открытие периодического закона не только позволило свести все химические элементы в определенную систему, но и предсказать еще неизвестные тогда элементы и оставить свободные места для неоткрытых элементов. Так и в области языковых универсалий: открыты определенные универсальные явления в языках, существуют целые таблицы универсалий, но не хватает какого-то звена в общей эмпирической и теоретической цепочке для оформления общего концептуального основания. Очевидно, это связано с тем, о чем писал Г.П. Щедровицкий, - нет онтологически единого видения объекта. Особенно наглядно это проявляется в отношении анализа частотных (количественных) закономерностей системных характеристик отдельных составляющих объекта и тех выводов, которые на этих основаниях делаются. Некоторые исследователи вообще отрицают значимость частоты как в системно-языковых образованиях, так и в речевой деятельности индивида. Так, например, в работе Тома Роепера (Roeper) утверждается, что «frequency is a misleading abstraction» (Roeper, 2007: p. 43). Причем этот вывод ученый обосновывает на примерах частного характера (я бы даже сказала сомнительного, поскольку их выбор не обоснован ни экспериментально, ни теоретически), не принимая во внимание не только всю богатую экспериментальную традицию, которая в этой области исследований на сегодняшний день существует (ср., обширную библиографию по проблеме в сборнике «Probabilistic linguistics» (2003)), но и серьезные теоретические работы, где показан системный характер «эффекта частоты» (ср., Андреев, 1976; Андреев, Зиндер, 1963; Бодуэн де Куртенэ, 1963; Herdan, 1966; Zipf, 1949 и др.). Появление таких утверждений я связываю именно с отсутствием единой онтологии объекта.
3. Джозеф Харольд Гринберг: квантитативный подход к типологии и описанию языковых универсалий. С именем Дж.Х. Гринберга в истории современных типологических исследований связан парадигмальный прорыв: возникновение квантитативной типологии. Однако историческое первенство в этом направлении лингвистики нового времени (XX в.), безусловно, принадлежит предшественнику Дж.Х. Гринберга - Эдуарду Сепиру (1884-1939). Идеи последнего Гринберг блестяще переосмыслил с позиций современной ему научной методологии. Именно благодаря работам Дж.Х. Гринберга типологические исследования вышли на новый, строго научный уровень описания и осмысления, преодолев нечеткость и двусмысленность оснований предшествующих типологических построений. По Дж.Х. Гринбергу, принципиальная проблема предшествующих типологических классификаций заключалась в отсутствии объективных критериев разграничения языков (Greenberg, 1960). Разрубить этот гордиев узел ему удалось, разработав формальный аппарат для классификации языков.
В основе методологии Гринберга лежит пять признаков: сложность слова, способ связи, наличие / отсутствие деривационных и конкретно-реляционных понятий, порядок следования подчиненных элементов по отношению к корню, способ установления связи между словами. Каждый признак характеризуется через отношение: «количество X по отношению к количеству Y». Таким образом, каждая единица получает строгое количественное определение, выраженное в соответствующем числовом индексе. Метод, предлагаемый Гринбергом, основывается на анализе существующих в тексте отношений между единицами. Каждый типологический индекс (всего их в его работе 10) определяется на основе относительной частотности сопоставляемых единиц объемом в 100 слов. Анализ полученной кривой частотности дистрибуции соответствующих элементов позволяет сделать вывод о типологической характеристике того или иного языка. В дальнейшем квантитативный подход Дж.Х. Гринберг реализовал применительно к языковым универсалиям (см. его работу «Language Universals», 1966 [4]).
Исходным понятием в анализе языковых универсалий у Гринберга является понятие маркированности / немаркированности. Эта категория, как известно, была разработана в рамках Пражской школы функциональной лингвистики, в частности, в известном сочинении Н.С. Трубецкого «Основы фонологии» (1939). Впоследствии Р.О. Якобсон расширил функциональное содержание этой категории, вывел ее за рамки фонологии и показал, что это понятие может быть применено к изучению грамматических категорий и семантики (речь идет прежде всего о таких работах Р.О. Якобсона, как «Нулевой знак» (1985) и «К структуре русского глагола» (1985)).
Маркированность / немаркированность - две противопоставленные друг другу характеристики, существующие в оппозиции по отношению друг к другу. Маркированная категория в широком смысле - обладание какими-то характеристиками, в то время как противопоставленная немаркированная категория характеризуется отсутствием этих характеристик, ср.: «…the marked feature is a positive something, e.g. nasality, aspiration, while the unmarked feature is merely its lack» (Greenberg, 1966: p. 14). Или пример из области семантики: «In English ‘man’ has two meanings, the masculine being the unmarked category. Thus, in Jacobson’s terms, ‘woman’ states in presence of the marked category, ‘feminine’, while ‘man’ is used chiefly but not exclusively to indicate the absence of ‘feminine’. ‘Man’ thus has two meanings, to indicate the explicit absence of ‘feminine’ in the meaning ‘male human being’ but also to indicate ‘human being’ in general» (Greenberg, 1966: p. 25).
Квантитативный подход к анализу языковых универсалий Дж.Х. Гринберга заключается в анализе дистрибуции относительных частот маркированных / немаркированных категорий на трех языковых уровнях - фонологическом, грамматическом и семантическом. Проведенный сопоставительный анализ частот обнаружил количественную значимость немаркированных категорий: немаркированные категории (вне зависимости от языкового уровня и языка) оказались частотнее маркированных. К интерпретации данного вывода я еще вернусь позднее, после обсуждения всех концепций.
На основе проведенного эмпирического исследования Гринберг делает некоторые заключения о функционале, используемого им метода. В частности, он отмечает, что показатель частоты, в отличие от других критериев, обладает одним очевидным методологическим преимуществом: он может применяться в любом языке без ограничений (Greenberg, 1966: p. 67).
Метод анализа дистрибуции частот позволяет также проводить межлингвистические сопоставления языковых категорий, что является проблемной задачей контрастивных исследований, которым как раз не хватает методов с подобным функционалом. В качестве иллюстрации действенности применяемого им метода Гринберг приводит примеры сопоставления категорий рода и падежа в разных языках. Так, например, он отмечает: «for gender categories, we may at least conjecture that the associated phenomena such as zero expression and neutralization will be present to the degree that frequency differences exist among the genders. Since these are largely or completely conventional semantically and differ in size of membership, it is entirely plausible that the gender labelled ‘masculine’ in one language will be of much greater text frequency than the feminine in that language, while in another language, the relationship is reserved. We may hypothesize that in the first language the masculine will display the other characteristics of the unmarked category, while in the second it will rather be the feminine» (Greenberg, 1966: p. 67-68).
Функционал метода оказывается более прозрачен при сопоставлении падежных систем разных языков, категориальная структура которых, как известно, не отличается изоморфизмом. Общее распределение частот по падежам в языках, вероятнее всего, будет иметь сходную структуру, отличным же будет набор комбинаций частот в разных языках (Greenberg, 1966: p. 68). Иллюстрирует этот тезис Гринберг на примере сопоставления аблатива в латинском языке со сходными по функциям аблатива субкатегориями падежной системы русского языка. Ср.: «…traditional grammar describes the uses of the ablative in Latin under such rubrics as the ablative of personal agent, separation, instrument etc. If we had the frequencies of each of these, we could then, for ex., compare it with the Russian cases by equating a component of separation with the genitive with prepositions ot and iz while agent and instrument would be equated with the Russian instrumental» (Greenberg, 1966: p. 68).
В случае с маркированными / немаркированными категориями частотные распределения позволяют определить степень данного категориального признака. Таким образом, считает Дж.Х. Гринберг, применение этого метода дает возможность создавать более тонкие и разнообразные иерархии.
Относительно влияния фактора частоты на системные языковые процессы Гринберг делает очень осторожные замечания. На основе проведенного им анализа частотных распределений на разных языковых уровнях он заключает, что между маркированными категориями в фонологии и грамматике существует определенная связь. Так, например, умлаут в немецком языке может быть представлен как маркированная фонетическая категория по отношению к немаркированному члену оппозиции. В то же время сам умлаут в немецком языке используется как грамматический способ для выражения маркированной категории множественного числа у существительных, сравнительной и превосходной степени у прилагательных, для выражения сослагательного наклонения у глагола (Greenberg, 1966: p. 69). Однако на разных языковых уровнях и в разные исторические периоды развития языка фактор частоты обнаруживает разный интерпретативный статус: «In phonology, diachronic process explains frequency, while in grammar, frequency explains diachronic process» (Greenberg, 1966: p. 69).
Таким образом, в своей работе Гринберг показал, что в системе языка существуют стабильные закономерности, характеризующиеся соответствующими относительными частотными отношениями (frequency relations), однако какой-либо теоретический вывод о статусе этого фактора в языке он не делает. Из рассуждений автора можно заключить, что феномен частоты для него - комплексный феномен, природа которого не может быть объяснена действием какого-либо одного принципа. Ср., Гринберг пишет: «But frequency is itself but a symptom and the consistent relative frequency relations which appear to hold for lexical items and grammatical categories are themselves in need of explanation. Such explanations will not, in all probability, arise from a single principle» (Greenberg, 1966: p. 70). Вероятнее всего, для Гринберга феномен частоты - это экстралингвистический по своей природе феномен, о чем косвенно свидетельствуют следующие размышления автора: «Frequency not included in la langue definitionally (здесь и далее выделено мной - И.У.) is in fact an ever present and powerful factor in the evolution of grammatical categories and thus helps in explaining the types of synchronic states actually found » (Greenberg, 1966: p. 69). И сразу же далее, в новом абзаце, он делает еще более удивительный вывод: «That such things happen is not to be wondered at. Though we may justifiably define our subject in a coherent and consistent way, the world is under no obligation to respect these boundaries and it is a commonplace that we must often bring in external explanatory factors» (Greenberg, 1966: p. 69).
Если соотнести приведенные выше итоговые размышления с установкой, которую Дж.Х. Гринберг продекларировал в начале своей монографии, то общая картина для онтологической интерпретации результатов исследования получает неоднозначный эпистемологический фон. Так, в самом начале своей работы Гринберг пишет: «The search for universals, therefore, coincides… with the search for laws of human behaviour, in the present context more specifically those of linguistic behaviour» (Greenberg, 1966: p. 9). Таким образом, в свете первого заявленного Дж.Х. Гринбергом тезиса частотная дистрибуция является основанием для анализа языковых универсалий, т.е. является той базой, на основе которой делается вывод о специфике работы универсальных механизмов, лежащих в основе языковых явлений. А это означает, что косвенно полученные данные могут быть экстраполированы на особенности человеческого поведения в целом (к сожалению, в работе данный аспект не был раскрыт). Однако скепсис заключительного замечания ставит под сомнение эпистемологическую ценность создаваемых эмпирических моделей. В заключении Гринберг сам создает эпистемологическую ловушку, постулируя ограниченность поиска и интерпретации границами познания интеллекта исследователя (в широком смысле) или просто сознательно уходит от ответа. Может быть, я, конечно, домысливаю и даже несколько преувеличиваю, но в свете общей методологической проблемы теории универсалий, которая обсуждалась выше, мои выводы выглядят вполне правдоподобно.
4. Габриель Альтманн & Вернер Лефельдт: лингвистическая интерпретация нумерической таксономии. Основная цель типологии - исследовать взаимосвязи, существующие между языковыми феноменами - пишут Г. Альтманн и В. Лефельдт со ссылкой на В. Скаличку (Altmann et al., 1973: p. 15). Эта цель подразумевает обнаружение всех латентных языковых механизмов, всех скрытых и подсознательных сил, которые оказывают влияние на язык, другими словами, эта цель предполагает описание всей динамики языка, которую, как считают Г. Альтманн и В. Лефельдт, нельзя осмыслить одними детерминистскими методами описательной лингвистики (Altmann et al., 1973: p. 15). Для решения задач такого уровня в работе предлагается использовать принципы и методы нумерической таксономии.
Нумерическая таксономия - разработанная в рамках биологии классификационная система, в основе которой лежит квантитативный метод оценки степени подобия между объектами. Теория нумерической таксономии была разработана Робертом Р. Сокэлом и Питером X.A. Снитом (Sokal et al., 1963). Основным методом анализа является метод кластер-анализа, позволяющий исследовать многомерные качественные и количественные признаки. Результатом нумерической таксономии являются классы особого рода - политетические (Beckner, 1959; Sneath, 1962).
Г. Альтманн & В. Лефельдт отмечают, что разрабатываемые в традиционной типологической лингвистике языковые классификации по своему характеру являются монотетичными, деление на классы в них определяется логикой (Altmann et al., 1973: p. 28). Исторически монотетическая методология восходит к идеям Аристотеля, к его пониманию сущности, потому в философской литературе этот подход еще именуют аристотелевским эссенциализмом.
По Аристотелю, знание о вещах - это знание их сущностных свойств. Другими словами, если мы знаем сущность вещи или класса, то нам имплицитно известны также все ее (их) свойства. И здесь возникает вопрос - что считать существенным, а что не существенным? Дискуссионным также оказывается один из основных тезисов эссенциализма, согласно которому, признак является либо существенным, либо не существенным, при этом особо подчеркивается, что один признак не может быть более существенен, чем другой. Однако эмпирические свойства сложных объектов не укладываются в такое прокрустово ложе. Подобный подход оказывается односторонним, не отражающим природу исследуемых объектов, более того, даже ей противоречащим. Исторически нумерическая таксономия возникла как оппозиционная эссенциализму методология.
Не буду здесь пересказывать принципы нумерической таксономии, на основе которых Альтманн & Лефельдт строят свою теорию. Они представлены как в работе самих авторов подхода (Sokal et al., 1963; Altmann et al., 1973), так и в последующих монографиях, посвященных проблемам языковой типологии (Haarmann, 1976). Основное содержание принципов нумерической типологии я попытаюсь представить в виде оппозиций основных характеристик монотетической (традиционной) и политетической (зд.: квантитативной) классификаций (см. табл. 1.).

Табл. 1
Основные характеристики монотетической и политетической классификаций

Монотетическая классификация
Политетическая классификация
1. Онтологическое видение объекта
Идеализированная гомогенная модель объекта «Естественная» гетерогенная модель объекта
2. Основания для классификации
Небольшое количество логически выделенных существенных признаков Как можно большее количество признаков
3. Принадлежность к классу
Объект либо принадлежит к классу, либо не принадлежит Принадлежность носит вероятностный характер; описывается величиной, значение которой образует континуум; нет привязанности к одному набору характеристик
4. Тип связи признаков в таксономическом объекте
Признаки жестко связаны, отделены и однозначно определены по отношению друг к другу Связи не являются механическими, жестко заданными, а являются вероятностными: могут перераспределяться, выстраивается в определенные комплексы, обусловленные системой определенного языка
5. Эвристическая ценность
Потенциал ограничен выбранными (существенными) признаками Потенциальные возможности открытой динамичной системы
 
Выделенные пять пунктов позволяют, на мой взгляд, получить общую картину об исследовательских принципах и эвристических возможностях этих двух таксономий. Рассмотрим каждый из этих принципов по отдельности.
Пункт 1: Онтологическое видение объекта. При монотетическом подходе к классификации, исследуемый объект представлен как некое идеальное образование, обладающее всеми свойствами, признаками, на которых строится классификация. В традиционной типологии выделяются четыре основных языковых типа (изолирующий, агглютинирующий, полисинтетический, флективный). Они представляют собой идеальные языковые типы, в том смысле, что содержат абсолютный и непересекающийся друг с другом набор признаков. Естественные языки, как показывает даже поверхностный анализ, не соответствуют этим идеализированным типологическим моделям (на что в свое время указывал еще В. фон Гумбольдт). Другими словами, чистых языковых типов нет. Каждый язык представляет собой определенную смесь типологических признаков.
Пункт 2: Основания для классификации. Монотетические классификации основаны на логически выделенных существенных признаках, количество которых обычно ограничено. В политетических классификациях, как ясно уже из внутренней формы самого слова, группировка осуществляется, по возможности, на привлечении как можно большего количества признаков. Набор признаков здесь зависит от глубины разработанности объекта.
Пункт 3: Принадлежность к классу. В монотетических классификациях функция принадлежности является, во-первых, двузначной - объект либо принадлежит А, либо не принадлежит А, т.е. объект либо обладает существенными свойствами, либо ими не обладает.
В политетических классификациях установка совершенно иная: во-первых, a priori полагается, что все признаки равноценны, а их значимость (вес) устанавливается только a posteriori. Во-вторых, принадлежность к классу в политетических классификациях определяется «большинством голосов» (наибольшее число общих значений признаков), и ни один из признаков не определяет принадлежность к данному классу, или таксону (Сокал, [электронный ресурс]).
Пункт 4: Тип связи признаков в таксономическом объекте. Монотетические классификации построены на априорных, логически выделенных, установках, соответственно, и признаки в них уже изначально однозначно определены и выстроены в иерархии. Организация политетических классов, напротив, является нежесткой, определяется эмпирически. Установка на эмпиричность является одним из базовых принципов нумерической таксономии.
Пункт 5: Эвристическая ценность. Каждая из типологий обладает своей определенной значимостью, каждая из них ограничена своими методологическими принципами. Классификация, построенная на монотетических основаниях, ориентирована на решение узко специальных задач, ограниченных теми признаками, на которых она основана. Политетическая классификация дает широкие исследовательские возможности, поскольку она представляет собой открытую динамическую таксономию, что позволяет вводить новые признаки и устанавливать новые корреляционные зависимости, а значит, все глубже проникать в латентные механизмы языка.
Такова в общих чертах философско-методологическая основа, предлагаемого Альтманном & Лефельдтом подхода к типологизации. Каждый таксономический языковой тип трактуется ими как конструкт (в терминологии В. Скалички). В качестве иллюстрации процедуры анализа, Альтманн & Лефельдт использовали методику Гринберга: взяли 10 морфологических индексов и рассчитали их значения для 20 языков (Greenberg, 1960).
Эти 10 признаков Альтманн & Лефельдт предлагают рассматривать как элементы профильного вектора (Profilvektor), которые представляют координаты языка в десятимерном пространстве. Если свести все полученные значения в таблицу, то мы получим для каждого языка отдельный вектор (см. табл. 2 [5]).

Табл. 2
Значения морфологических признаков

 
W/M
A/J
W/R
D/M
I/M
P/M
S/M
O/N
Pi/N
Co/N
Санскрит
0,39
0,09
0,88
0,24
0,32
0,06
0,46
0,16
0,46
0,38
Греческий (Гомер)
0,48
0,10
0,99
0,10
0,41
0,03
0,48
0,48
0,27
0,26
Новогреческий
0,55
0,40
0,98
0,07
0,37
0,02
0,42
0,53
0,21
0,26
Древнеанглийский
0,47
0,11
1,00
0,09
0,42
0,03
0,48
0,15
0,47
0,38
Новоанглийский
0,60
0,30
1,00
0,09
0,32
0,02
0,38
0,75
0,14
0,11
Готский
0,43
0,19
0,97
0,13
0,42
0,04
0,52
0,37
0,34
0,29
Церковнославянский
0,44
0,20
1,00
0,15
0,41
0,05
0,51
0,41
0,33
0,26
Эскимосский
0,27
0,03
1,00
0,34
0,47
0,00
0,73
0,02
0,46
0,38
 
Следующим этапом является анализ степени расхождения / близости между парами языков. Этот критерий Альтманн & Лефельдт предлагают рассчитывать по следующей формуле:
 
d (A, B) = [Σ (ai - bi)2]1/2
 
Для примера рассчитаем степень расхождения для пары церковнославянский / эскимосский языки:
 
d (церк.-слав., эским.) = [(0,44 - 0,27)2 + (0,20 - 0,03)2 + … + (0,26 - 0,38)2]1/2 = 0,58.
 
Полученные таким образом данные для всех сопоставляемых пар для удобства последующего анализа можно свести в матрицу дистанций (см. табл. 3).

Табл. 3
Матрица евклидовых дистанций [6] для 8 языков

 
Санскрит
Греческий
(Гомер)
Новогреческий
Др.-английский
Ново-
английский
Готский
Церковно-
славянский
Эскимосский
Санскрит
-
0,45
0,62
0,23
0,81
0,34
0,38
0,40
Греческий (Гомер)
0,45
-
0,33
0,40
0,43
0,18
0,15
0,66
Новогреческий
0,62
0,33
-
0,57
0,31
0,34
0,31
0,80
Древнеанглийский
0,21
0,40
0,57
-
0,78
0,29
0,34
0,44
Новоанглийский
0,81
0,43
0,31
0,78
-
0,54
0,49
1,05
Готский
0,34
0,18
0,34
0,29
0,54
-
0,07
0,54
Церковнославянский
0,38
0,15
0,31
0,34
0,49
0,07
-
0,58
Эскимосский
0,40
0,66
0,86
0,44
1,05
0,54
0,58
-
 
Следующая процедура заключается в группировке языков. Для решения этой задачи Альтманн & Лефельдт используют метод кластеризации: языки группируются в кластеры по степени их близости / расхождения. Отнесение кластера к определенному типу языка осуществляется уже на следующем этапе анализа, который предполагает установление между 10 выбранными признаками статистических зависимостей. Эта процедура основана на применении расчета между парами признаков коэффициента корреляции. Признак, у которого сумма всех коэффициентов корреляции наибольшая, считается диагностирующим языковой тип параметром. На основании полученных значений коэффициента корреляции можно построить соответствующую классификацию языков.
Таково в общих чертах основное содержание предлагаемого Альтманном & Лефельдтом нумерического подхода к построению типологических классов.
Обсудим, какие могут быть сделаны выводы в свете рассматриваемой в настоящей статье проблемы.
По замечанию Харольда Хаарманна, «quantifizierende Methoden stellen für Altmann und Lehfeldt nicht bloss ein operationelles Instrumentarium dar, sondern sie sind konstitutives Element der Theoriebildung im Rahmen einer allgemeinen Sprachtypologie» (Haarmann, 1976: p. 44). Как мне представляется, никакого противопоставления на самом деле здесь нет. Между «операциональным инструментом» и «конститутивным элементом формирования теории» нет принципиальной разницы. В обоих случаях речь идет лишь о методике исследования, разница, может быть, лишь в степени внедренности квантитативных методов в общую методологию познания объекта.
Как мне представляется, «квантитативные» рассуждения Альтманна & Лефельдта не выходят за рамки методического дискурса. Квантификация здесь есть лишь средство регистрации определяемых исходными теоретическими положениями языковых явлений. Исходя из принципов данной теории, оказывается не важным, что измерять. По мысли авторов подхода, квантифицировать можно все. В этом они видят основную задачу языковой типологии. Ср.: «Die wichtigste Aufgabe der Sprachtypologie sehen wir im Augenblick darin, alle messbaren Eigenschaften der Sprache zu messen und diejenigen Eigenschaften, die noch nicht messbar sind, messbar zu machen» (Altmann et al., 1973: p. 63). При этом нигде не обсуждается природа самого процесса квантификации: На каких собственно языковых механизмах основана процедура квантификации? Что в природе языка позволяет осуществлять процесс квантификации? Есть ли ограничения в применении этого метода: не процедурного характера, а онтологического, коренящегося в природе языка, в природе человека? Альтманн & Лефельдт исходят из априорной возможности применения квантификации и данные вопросы не обсуждают, хотя в общетеоретическом контексте они далеки от однозначного решения. Вспомним, хотя бы тезис Н.С. Трубецкого о том, что «язык лежит вне меры и числа».
Таким образом, «эффект частоты» в данном исследовании оказывается исключительно внешним инструментом выявления закономерностей между языковыми явлениями.
5. Заключение: «эффект частоты» - все-таки инструмент анализа или инструмент мышления? Таким образом, результаты проведенного анализа дают однозначный ответ в выборе компонента контроверзы «эффекта частоты» - инструмент анализа versus инструмент мышления. В методологии рассмотренных концепций фактор частоты выступает как инструмент анализа. Конечно же, моя цель заключалась не в доказательстве этого тезиса, поскольку для его подтверждения не нужно было проводить столь пространного анализа. И концепция Дж.Х. Гринберга, и концепция Альтманна & Лефельдта суть разработка и совершенствование техники формального анализа для решения типологических проблем. Предлагаемое «технологичное» решение в идеале должно быть способным обнаружить латентные языковые механизмы. Однако, как мне представляется, аналитичная по своему характеру процедура квантитативного подхода (sic! в том виде, в котором он представлен в рассматриваемых работах) не может вскрыть синтетичных языковых процессов.
Исторически типология возникла как синтетическая наука. Как уже отмечалось ранее, рационально-универсальный подход средневекового компаративного анализа опирался на категории мышления (ср., исходные посылки грамматики Пор-Рояль), т.е. в основе средневековых теоретических построений лежали синтетические посылки. Только с выходом работ Э. Сепира начинается новый аналитический этап в истории типологических исследований. Любопытно, что онтологические представления самого Сепира были сугубо синтетическими по своему характеру (Сепир, 1993). Считая язык социальным и культурным продуктом, он полагал, что познание языкового механизма - ключ к решению основных проблем человеческой культуры.
Восприняв в целом идеи своего предшественника Сепира, Дж.Х. Гринберг разрабатывает строго аналитическую методологию исследования типологических проблем и языковых универсалий. Как было показано выше, Гринберг считает, что поиск языковых универсалий суть поиск законов человеческого поведения. Однако этот тезис в работе остался только продекларированным, не получил развития. Соединить синтетическую установку с аналитической методологией ему не удалось. Основной эмпирический вывод Гринберга о том, что немаркированные категории частотнее, чем маркированные, не получил в работе серьезной теоретической интерпретации.
Попытку объяснить постулируемые в области языковых универсалий закономерности предприняли психолингвисты Эве В. Кларк и Херберт Х. Кларк (Clark et al., 1978). Они предложили рассмотреть универсалии с психологической и социокультурной точек зрения, т.е. с синтетических позиций. В своей интерпретации психолингвисты исходили из следующих онтологических представлений о языке: «Language does not exist in vacuum. It serves and is moulded by other systems in the human mind. Because it is used for conveying ideas, its structure and function must reflect these ideas. Because it must be spoken and understood easily and efficiently, its structure and function are forced to stay within limits imposed by people’s processing capacities. Because it is used for communication within a complex social and cultural system, its structure and function are moulded by these forces as well» (Clark et al., 1978: p. 227).
Э.В. Кларк и Х.Х. Кларк полагают, что универсальность языковых явлений обусловлена, с одной стороны, спецификой работы когнитивной системы человека, с другой стороны - социокультурной средой как языкового коллектива в целом, так и носителя языка, в частности. Так, например, со ссылкой на известное исследование Брента Берлина и Поля Кея «Базовые цветообозначения: их универсальность и развитие» (1969) они показывают, что система цветообозначений является универсальной именно потому, что универсальна визуальная система человека (Clark et al., 1978: 234).
Значимость в процессах категоризации так называемых категорий базового уровня (Brown, 1978; Rosch et al., 1975), фокальных цветов (Heider, 1971), универсальность в наименовании геометрических фигур (Rosch, 1973), размерности пространства (spatial dimensions) (Clark, 1974) - все это связано с особенностями организации перцептивных процессов. «People have natural, built-in ways of perceiving and representing colour, objects, shapes, distances, and spatial relations, and this is reflected in the basic names given them» (Clark et al., 1978: p. 247).
Более сложные по своей организации (по степени абстрактности) категории, например, система грамматических категорий, также обнаруживают свою обусловленность и зависимость как от внутренних когнитивных процессов (в свою очередь более сложных), так и от внешних социокультурных факторов.
В качестве «когнитивных» категорий в работе Э. Кларк и Х. Кларка анализируются категории отрицания, падежа, времени и т.д. Я здесь не буду подробно излагать всю систему рассуждений, которую приводят авторы, остановлюсь только на характеристике категории отрицания в связи с обсуждением природы маркированных и немаркированных категорий.
Еще в работе Дж. Гринберга (1966) было показано, что отрицательная степень является маркированной категорией по отношению к немаркированной положительной категории. Причину, по которой люди обычно предпочитают положительную степень негативной, Э. Кларк и Х. Кларк связывают с понятием «нормальности» (the notion of normality). Они говорят о том, что «normal states are conceived of positively, abnormal states as the absence of normal states, as negative states» (Clark et al., 1978: p. 249). Со ссылкой на М. Бирвиша (1967) исследователи отмечают, что «goodness is considered normal because it is what is expected - what should be - and so badness is abnormal» (Clark et al., 1978: p. 249).
Обсуждая категорию маркированности / немаркированности, Э. Кларк и Х. Кларк формулируют принцип комплексности (the complexity principle): «Complexity in thought tends to be reflected in complexity of expression» (Clark et al., 1978: p. 230). Дифференциальная особенность маркированных категорий заключается в том, что они всегда сложнее по своей структуре, чем немаркированные категории. Основываясь на положениях работы Дж. Гринберга, они вводят два критерия комплексности: 1) критерий дополнительной морфемы (added morphemes), 2) критерий контекстуальной нейтрализации (contextual neutralization).
Суть первого критерия заключается в следующем: «If expression B consists of expression A plus an added morpheme, then B is more complex then A» (Clark et al., 1978: p. 231). Так, например, по своей структуре плюральная (маркированная) форма слова ‘dogs’ является более сложной (комплексной), чем сингулярная (немаркированная) форма того же слова - ‘dog’.
Критерий контекстуальной нейтрализации Э. Кларк и Х. Кларк трактуют следующим образом: «If expression A can neutralize in meaning in contexts that the almost equivalent expression B cannot, then B is more complex than A» (Clark et al., 1978: p. 231). В качестве иллюстрации данного критерия авторы приводят пример со словами ‘актер’ и ‘актриса’. В анализируемой паре лексема ‘актриса’ является маркированной (категория рода) и, соответственно, более комплексной, cp.: «In some contexts, however, actor but not actress can be neutralized in meaning to cover both males and females. Actress therefore is a more complex expression than actor» (Clark et al., 1978: p. 231).
Частотность немаркированных категорий Э. Кларк и Х. Кларк объясняют принципом комплексности: менее сложные категории всегда являются более частотными. Такова специфика деятельности когнитивных процессов, заключающаяся в тенденции к упрощению, к минимизации «когнитивных усилий». В пользу данного положения свидетельствует то, что самые частотные языковые единицы - те, которые обозначают более простые понятия, категории, как например, положительные категории вместо отрицательных, сингулярные формы вместо плюральных, родовые понятия вместо специальных терминов («generic instead of specific categories in Berlin’s hierarchy»). Последнюю оппозицию Э. Кларк и Х. Кларк иллюстрируют примером из истории наименования лексемы ‘фильм’. Cp.: «when the moving picture was a technical gadget in Edison’s laboratory, it had a specific-level name moving-picture. But when it became common, it was reclassified as a generic-level category, and moving-picture was shortened to movie» (Clark et al., 1978: p. 265).
Принципом комплексности Э. Кларк и Х. Кларк также объясняют результаты исследований Дж.К. Ципфа, который показал, что самые частотные слова английского языка состоят из одной силлабемы и, соответственно, менее частотные слова, напротив оказываются длиннее (Zipf, 1949).
Таким образом, в отличие от других типологических исследований, в работе Э. Кларк и Х. Кларка представлена попытка объяснить с социопсихолингвистической точки зрения лингвистическую категорию маркированности / немаркированности. Однако, как видно из приведенных выше рассуждений, «эффект частоты» в этих комментариях играет лишь диагностирующую роль, т.е. рассматривается как инструмент анализа.
Как мне представляется, следующий шаг в эволюции типологических исследований - развитие синтетической типологии, т.е. в соответствии с общегуманитарным трендом - переход от одномерного (внутрисистемного) описания системы единиц и отношений между ними к четырехмерному описанию языковых явлений в координатах «человек - социум - знак - объективная действительность» [7]. Уже некоторые шаги в этом направлении сделаны (см. обзор и ссылки в: Evans et al., 2006). Нельзя, конечно же, не упомянуть концепцию универсальной грамматики Ноэма Хомского, который в своих построениях исходит из того, что человек обладает набором врожденных универсальных принципов, который обеспечивает возможность овладения языком (Chomsky 2000; 2002).
Подобное расширение координат исследования позволит переосмыслить многие проблемы и, в частности, «эффект частоты» с синтетических, когнитивных позиций. Как показывает опыт многочисленных исследований, «эффект частоты», с одной стороны, отражает как внутреннюю организацию языковой системы, так и речевую систему индивида. «Эффект частоты» при этом здесь выступает как инструмент метаанализа: в отношении языковой системы как результат сознательного метаанализа исследователя, в отношении индивидуальной речевой организации - как результат во многом бессознательных преференций носителя языка, формирующихся «контекстом» его медиасреды. Однако все это вторичные проявления «эффекта частоты», т.е. здесь мы на самом деле имеем дело лишь с эффектом частоты. Как мне представляется, природа этого эффекта - неязыковая. Проявление его обусловлено действием когнитивных механизмов, в частности, процессами категоризации.
Категоризация является «сквозным» когнитивным процессом, связанным со всеми когнитивными уровнями. Категоризация, как отмечалось выше, - способность устанавливать сходства / различия между объектами и осуществлять их группировку. Процессы категоризации основаны на отражении сознанием вероятностных закономерностей объективной действительности, которые фиксируются особым когнитивным «счетчиком». Эти фиксируемые вероятностные закономерности могут быть проинтерпретированы и интерпретируются как количественная мера силы связи. Конечно же, не может не возникнуть соблазн взять калькулятор и все подсчитать. Но здесь (при анализе языковых и речевых явлений) возникает несколько проблем. Проблема первая: чтобы вычислить силу связи, нужно знать сумму всех слагаемых, а мы их не знаем. Вторая проблема связана с решением вопроса о пределах квантификации. Дело в том, что есть точка зрения (разделяемая и мной в том числе), согласно которой не все процессы, не всякую физическую активность можно смоделировать вычислительными методами (Penrose, 1995). Как отмечает Роджер Пенроуз, часть нашего мозга работает по формально-вычислительным процессам, а часть - принципиально «невычислительная» по своей природе. В этой связи я с большим скепсисом отношусь к гиперустановке на тотальную (вероятностную) квантификацию, заявленной Альтманном & Лефельдтом. Единственным «арбитром» здесь может быть только искомая константа - онтология языка-объекта.
 

Примечания

1. Работа выполнена при финансовой поддержке РГНФ 08-04-0004а «Русский язык в изменяющемся языковом пространстве города начала 20 века» (рук. Т.И. Ерофеева).

2. Grammar is one and the same in all languages in substance, though it may vary in accidents (Ferguson, 1978: p. 9).

3. Логика, в традиции идущей от Аристотеля - наука о формах мышления.

4. Здесь и далее речь будет идти именно об этой работе Дж.Х. Гринберга.

5. В таблице представлены только выборочные значения.

6. Евклидовая дистанция - это наименьшее расстояние между двумя параметрами (точками).

7. Порядок и наименование «координат» условны.


Литература

Андреев. Николай. Д. 1976. Речевые, языковые и метаязыковые вероятности. Исследования по структурно-вероятностному анализу. Горький. Стр. 3-5.
Андреев. Николай. Д., Зиндер. Лев. Р. 1963. О понятии речевого акта, речи, речевой вероятности и языка. в Вопросы языкознания. № 3. Стр. 15-21.
Бодуэн де Куртенэ. Иван. A. 1963. Количественность в языковом мышлении. в Избранные труды по общему языкознанию Т. 2. Москва: АН СССР. Стр. 311-323.
Гринберг. Джозеф. Х., Осгуд. Чарльз, Дженкинс. Джеймс. Дж. 1970. Меморандум о языковых универсалиях. в Новое в лингвистике. Вып. 5: Языковые универсалии. Москва: прогресс. Стр. 31-44.
Сепир. Эдуард. 1993. Избранные труды по языкознанию и культурологии. Москва: Прогресс.
Сокал. Роберт Р. Кластер-анализ и классификация: предпосылки и основные направления. [электронный ресурс] http://lib.socio.msu.ru/l/library?e=d-000-00---001ucheb--00-0-0-0prompt-10---4------0-1l--1-ru-50---20-help---00031-001-1-0windowsZz-1251-10&cl=CL1&d=HASH5a0442ba94841e3d8b5e1a&x=1
Успенский. Борис. А. 1969. Языковые универсалии и актуальные проблемы типологического описания языка. в Языковые универсалии и лингвистическая типология. Москва: Наука. Стр. 5-18.
Щедровицкий. Георгий. П. 1969. Методологический смысл проблемы лингвистических универсалий. в Языковые универсалии и лингвистическая типология. Москва: Наука. [электронный ресурс] [http://www.fondgp.ru/gp/biblio/rus/65/
Якобсон. Роман. O. 1975. Лингвистика и поэтика. Структурализм: за и против. Москва: Прогресс. Стр. 193-230.
Якобсон. Роман. О. 1985. Нулевой знак. в Избранные работы. Москва: Прогресс. Стр. 222-230.
Якобсон. Роман. О. 1985. О структуре русского глагола. в Избранные работы. Москва. Стр. 210-221.
Altmann. Gabriel, Lehfeldt. Werner. 1973. Allgemeine Sprachtypologie: Prinzipien und Messverfahren. Muenchen: Wilhelm Fink Verlag.
Beckner. M. 1959. The Biological Way of Thought. New York: Columbia University Press.
Bierwisch. Manfred. 1967. Some semantic universals at German adjectivals. Foundations of Language. 3. P. 1-36.
Brown. Roger. W. 1958. How shell a thing be called? Psychological Review. 65. P. 14-21.
Chomsky. Noam. 2000. Minimalist inquires. Step by step: essays on minimalist syntax in honor of Howard Lasnik. Cambridge; MA: MIT Press.
Chomsky. Noam. 2002. On nature and language. Cambridge: Cambridge University Press.
Clark. Eve. V., Clark. Herbert. H. 1978. Universals, relativity, and language processing. Universals of human language: Vol. 1. Method and theory. Stanford. Stanford University Press. P. 225-277.
Clark. Herbert. H. 1974. Semantics and comprehension. Current trends in linguistics. V. 12: Linguistics and adjacent arts and sciences. The Hague. Mouton. P. 1291-1438.
Evans. Vyvyan, Green. Melanie. 2006. Cognitive Linguistics: An Introduction. Edinburgh: Edinburgh University Press.
Ferguson. Ch. A. 1978. Historical background of universals research. Universals of human language: Vol. 1. Method and theory. Stanford. Stanford University Press. P. 7-31.
Greenberg. Joseph. H. 1960. A Quantitative Approach to the Morphological Typology of Language. International Journal of American Linguistics. 26. P. 178-194. (русский перевод 1963 г.)
Greenberg. Joseph. H. 1966. Language Universals: With special references to feature hierarchies. The Hague: Mouton & Co.
Haarmann. Harald. 1976. Grundzuge der Sprachtypologie: Methodik, Empire und Systematik der Sprachen Europas. Stuttgart, Berlin, Koln, Meinz: Kohlhammer.
Heider. Eleanor. 1971. Universals in color naming and memory. Journal of Experimental Psychology. 93. P. 10-20.
Herdan. Gustav. 1956. Language as Choice and Chance. Groningen: Noordhoff.
Penrose. Roger. 1995. Schatten des Geistes: Wege zu einer neuen Physik des Bewusstseins. Heidelberg, Berlin, Oxford. Spektrum Akademischer Verlag.
Roeper. Tom. 2007. What frequency can do and what it canЃft. Frequency effects in language acquisition: defining the limits of frequency as an explanatory concept. Guezlow I., Gagarina N. (eds.). (Studies on language acquisition; 32). Berlin. P. 23-47.
Rosch. Eleanor, Mervis. Caroline. 1975. Family resemblances: studies in the internal structure of categories. Cognitive Psychology. 7. P. 573-605.
Rosch. Eleanor. 1973. On the internal structure of perceptual and semantic categories. Cognitive development and the acquisition of language. New York: Academic Press. P. 111-144.
Sneath. Peter. H. The construction of taxonomic groups. Microbial Classification. Cambridge: Cambridge University Press. P. 289-332.
Sokal. Robert. R., Sneath. Peter. H. 1963. Principles of numerical taxonomy. San Francisco: W.H. Freeman and Company.
Zipf. George. K. 1949. Human behavior and the principle of least effort. Cambridge, MA: Addison-Wesley.