НОВОЕ ПРИЛОЖЕНИЕ ПОКАЗАТЕЛЕЙ РАЗНОЯЗЫЧИЯ ГРИНБЕРГА
(Новое в лингвистике. - Вып. 6. - М., 1972. - С. 215-224)
1. В различных странах и местностях возможности языкового общения между жителями
колеблются в широком диапазоне от ситуации полной разобщенности, когда ни один
из обитателей данной территории не понимает языка, на котором говорит другой,
до такого положения, когда все они владеют некоторым общим языком, то есть составляют
речевой коллектив. Для числовой характеристики этих различий Гринбергом были
в 1956 г. предложены восемь «показателей разноязычия», которые в отличие от
чисто словесных описаний позволяют соотносить данные о распределении языков
в некоторой местности с теми или иными социально-экономическими, политическими
и географическими факторами [1].
Хотя сам Гринберг, определяя разноязычие, говорит лишь о населении некоторой
территории, например страны, области или города, его показатели можно с равным
успехом применить и к группам населения, выделенным не по территориальному,
а по какому-либо социальному признаку. Например: «служащие государственного
аппарата Индии», «украинцы, проживающие в СССР», «подростки - жители Брюсселя»
или «негры, живущие в Чикаго».
Все показатели Гринберга предназначены для измерения разноязычия или, наоборот,
возможностей языкового общения внутри какой-то одной группы населения. В настоящей
работе я расширил область применения его показателей, предложив пользоваться
ими для измерения степени разноязычия и, соответственно, возможностей общения
уже не внутри одной группы, а между двумя или более группами населения, различающимися
либо территориально, либо как социально-разнородные подгруппы территориально
единого конгломерата. Предлагаемые мною показатели межтерриториального или межгруппового
разноязычия являются обобщением внутритерриториальных вероятностных показателей
Гринберга, и они непосредственно, без какого бы то ни было пересчета, сопоставимы
с его показателями, заслужившими похвальный отзыв специалистов-статистиков Гудмена
и Крускэла [2].
Предлагаемый метод вычисления межгрупповых отношений в равной мере приложим
ко всем восьми показателям Гринберга, но я рассмотрю его на примере двух показателей,
поскольку существо процедуры при этом не меняется.
2. Алжир накануне ухода французов - удобный пример для того, чтобы объяснить,
как вычисляется показатель Н, характеризующий межгрупповые возможности языкового
общения. Внутригрупповой показатель H определяется как «вероятность того, что
два произвольно взятых жителя некоторой местности говорят хотя бы на одном общем
языке» (стр. 209). Вычислим значения этого показателя по данным табл. 1, отражающей
распределение языков среди населения старше десяти лет: H для населения Алжира
в целом составит 0,669, а отдельно для неевропейской части населения - 0,801,
для европейской - 1,000. Таким образом, мы получаем довольно высокую вероятность
общения для всего населения Алжира, более высокую - для неевропейцев и максимально
высокую - для европейцев. Последняя цифра может вызвать сомнения - получается,
что нет ни одного европейца, не говорящего по-французски. Расчеты основаны на
формуле, описанной Гринбергом, и мы их не приводим.
Но как же измерить возможности языкового общения между двумя главными
этническими группами - неевропейцами и европейцами? Какова вероятность, что произвольно
взятый неевропеец и произвольно взятый европеец смогут объясниться на каком-нибудь
известном им обоим языке? Показатель Н, вычисленный по обычной формуле, не отвечает
на этот вопрос, и возникает необходимость в новом показателе, характеризующем
возможности межгруппового общения. Объясним сначала, почему для этой цели нельзя
просто взять обычный показатель Н, вычисленный для населения страны в целом.
Дело в том, что в это общее значение Н, равное 0,669, в действительности вносит
поправку соотношение по численности групп: на 5,4 миллиона неевропейцев в возрасте
старше десяти лет приходится лишь 0,8 миллиона европейцев, то есть реально значение
Н взвешивается пропорционально численности преобладающей группы. Кроме того,
следует учесть, что значение Н, вычисленное по формуле Гринберга, зависит и
от вероятностей общения внутри каждой из групп, а не только между ними: действительно,
представим себе, что население некоторой страны состоит из двух групп - А и
В, причем все члены группы А говорят только на языке X, а все члены группы В
- только на языке Y; ясно, что если Н в этом случае и отразит уровень языковой
коммуникации по стране в целом, его значение ровным счетом ничего не скажет
о возможностях общения между отдельными этническими группами.
Оба указанных недостатка можно преодолеть следующим способом. По данным распределения
языков среди неевропейцев и европейцев, как это показано в табл. 1, определяем
векторные произведения чисел членов обеих групп, владеющих одним или более общими
языками.
Таблица 1
Распределение языков в Алжире среди населения от 10 лет и старше,
по данным на 1948 г.
Арабский
Берберский
Французский +
арабский
Французский +
арабский +
берберский
Французский +
берберский
Французский
Всего
Население в целом
0,676
0,097
0,064
0,041
0,006
0,116
1,000
Неевропейцы
0,780
0,112
0,053
0,047
0,007
0,001
1,000
Европейцы
-
-
0,135
0,003
0,001
0,860
0,999
Внутри групп мы такие векторные произведения определять не будем: это нужно
лишь тогда, когда определяется внутри-групповое значение Н. Пусть А, Б и Ф обозначают,
соответственно, арабский, берберский и французский языки, индекс 1 - неевропейцев,
а индекс 2 - европейцев; тогда межгрупповой показатель Н будет равен:
A1 (A2 +ФА2 + ФАБ2) +
+ Б1 (Б2 +ФАБ2 + ФБ2) +
+ ФА1 (А2 + ФА2 + ФАБ2 + ФБ2 + Ф2) +
+ ФАБ1 (Ф2 + Б2 + ФА2 + ФАБ2 + ФБ2 + Ф2) +
+ ФБ1 (Б2 + ФА2 + ФАБ2 + ФБ2 + Ф2) +
+ Ф1 (ФА2 + ФАБ2 + ФБ2 + Ф2)
По данным табл. 1, возможности языкового общения между африканцами и французами
определяются так:
0,780 (0 + 0,135 + 0,003) +
+ 0,112 (0 + 0,003 + 0,001) +
+ 0,053 (0 + 0,135 + 0,003 + 0,001 + 0,860) +
+ 0,047 (0 + 0 + 0,135 + 0,003 + 0,001 + 0,860) +
+ 0,007 (0 + 0,135 + 0,003 + 0,001 + 0,860) +
+ 0,001 (0,135 + 0,003 + 0,001 + 0,860)
Значение межгруппового показателя Н в данном случае составит, таким образом,
0,216.
Как было указано, предлагаемый нами показатель по своим отправным точкам не
отличается от показателя Гринберга, и поэтому несовпадение расчетных формул
не препятствует сопоставлению результатов. Предреволюционный Алжир представлял
собой общество с довольно высоким уровнем языковой коммуникации по стране в
целом (0,669), но наряду с этим налицо была резкая разобщенность этнических
групп. Иначе говоря, уровень коммуникации был довольно высоким внутри групп,
но низким между группами: произвольно выбранные европеец и неевропеец могли
объясниться на общем языке чуть чаще, чем в двух случаях из десяти.
3. Межгрупповые показатели можно вычислять для любого количества групп, а
не только для двух. Покажем это на примере Бельгии. Бельгия разделяется на три
зоны: зона с преобладанием французского языка (Эно, Льеж, Люксембург и Намюр),
зона с преобладанием голландского языка (Антверпен, Западная Фландрия, Восточная
Фландрия и Лимбург) и, наконец, Брабант - центральная провинция, на территории
которой находится Брюссель. Вычисляя показатель Н по формуле Гринберга, определим
возможности языкового общения внутри каждой из трех зон. Значение этого показателя
оказывается довольно высоким во всех зонах, хотя в Брабанте оно несколько ниже,
чем в двух других (см. табл. 2).
Таблица 2
Распределение языков в Бельгии среди населения всех возрастов,
по данным на 1947 г.
(Ф = французский язык, Г = голландский язык, Н = немецкий язык)
Ф
Г
Н
Ф + Г
Ф + Н
Г + Н
Ф + Г + Н
Не владеют
ни одним из
трех языков
Внутригрупповой
показатель Н
Брабант
0,293
0,309
0,001
0,318
0,010
0,002
0,036
0,030
0,748
Зона французского языка
0,837
0,007
0,018
0,056
0,023
0,001
0,012
0,046
0,866
Зона голландского языка
0,019
0,753
0,002
0,152
0,001
0,005
0,030
0,040
0,893
Вычисляя межгрупповой показатель Н по описанному выше способу, получаем, что
вероятность общения между Брабантом и зоной голландского языка равна 0,695,
а между Брабантом и зоной французского языка - 0,639, то есть что она довольно
высока как в том, так и в другом случае. В то же время показатель Н, характеризующий
возможности общения между зонами французского и голландского языков, оказывается
совсем невысоким - его значение составляет 0,249. Любопытно, что значение Н
внутри Брабанта ниже, чем в каждой из двух других зон. Получается, что при сравнительно
низком уровне коммуникации внутри некоторой зоны уровень ее коммуникации с другими
зонами может быть значительно выше, чем у менее разноязычных областей. Добавим,
что расчет внутриобластных и межобластных показателей свидетельствует, что бельгийцам,
живущим в Брабанте, в общем не труднее общаться с бельгийцами из областей, где
говорят в основном по-фламандски или по-валлонски, чем между собой (значения
Н соответственно 0,695 и 0,639, с одной стороны, и 0,748 - с другой).
4. В общем виде сформулировать порядок расчета межгрупповых значений по всем
восьми показателям разноязычия Гринберга довольно просто. Во-первых, всякий
раз необходимо знать распределение языков по исследуемым группам населения.
Далее, на основе этих данных необходимо вычислить векторные произведения чисел,
показывающих, какие доли от общей численности населения составляют те подгруппы
исследуемых групп, члены которых имеют общий(-ие) язык(и), --то есть сомножителями
выступают только подгруппы из разных групп (составляющие пересечение групп между
собой по совпадающим языкам), но ни в коем случае не из одной группы. Наконец,
если требуется учесть степень близости языков по методу глоттохронологии, то
к межгрупповым показателям применяются те же весовые коэффициенты, что и ко
внутригрупповым. Это относится к показателям Гринберга B, D и F (см. стр. 205
и сл.). Все полученные таким образом межгрупповые показатели разноязычия не
зависят ни от степени языковой однородности групп, ни от соотношения последних
по численности и потому в общем более непосредственно характеризуют вероятность
языкового общения между группами.
5. Объясним расчет и истолкование показателей на примере показателя разноязычия
А. Измерение разноязычия с помощью этого показателя называется «одноязычным
невзвешенным методом», который формулируется так: «Вероятность того, что два
произвольно взятых жителя данной территории говорят на общем языке, можно считать
мерой разноязычия этой территории» (стр. 204). Вычисление межгруппового показателя
А производится в принципе, как указано выше: задача состоит в том, чтобы определить
вероятность того, что произвольно взятый представитель первой группы и произвольно
взятый представитель второй группы будут говорить на одном и том же языке. Эта
вероятность считается показателем языковой близости данных групп. Предположим,
например, что, имея данные о распределении двух или более групп населения по
признаку «родной язык», мы хотим определить их разноязычие с помощью межгруппового
аналога показателя А, описанного выше как внутригрупповой показатель. Вычислив
векторные произведения для пересечений групп по совпадающим языкам, получаем
следующее значение показателя разноязычия между первым и вторым поколением иммигрантов
в США из Норвегии на 1940 г. (табл. 3) [3].:
0,924 x 0,502 + 0,051 x 0,477 + 0,012 x 0,008 + 0,013 x 0,013 = 0,488
Таблица 3
Распределение по родному языку норвежских иммигрантов
в США, данные 1940 г.
Норвежский
Английский
Шведский
Все прочие +
нет сведений
Всего
Первое поколение
0,924
0,051
0,012
0,013
1,000
Второе поколение
0,502
0,477
0,008
0,013
1,000
Поскольку все показатели Гринберга, за исключением Н, о котором была речь
выше, выражаются как вероятностные показатели разноязычия, то для полной аналогии
с его расчетами мы вычитаем наши векторные произведения из единицы; тогда А
= 1 - 0,488 = 0,512. Интервал значений, которые может пробегать данный показатель,
ограничен с одной стороны нулем (любые два представителя двух групп всегда говорят
на общем языке), а с другой стороны, единицей (любые два представителя разных
групп всегда разноязычны). Для групп населения, сплошь одноязычного, А - 1 -
Н.
Возможности сопоставления межгрупповых показателей разноязычия с внутригрупповыми
показателями Гринберга иллюстрируются данными таблицы 4.
Таблица 4
Показатели А внутри- и межгрупповые, отражающие
распределение по родному языку у первого и второго поколения
иммигрантов в США. Данные 1940 г.
Внутригрупповой показатель А
Межгрупповой показатель А
между двумя поколениями
внутри первого поколения
внутри второго поколения
Норвегия
0,143
0,520
0,512
Швеция
0,122
0,513
0,589
Швейцария
0,495
0,531
0,739
Германия
0,124
0,524
0,535
Греция
0,113
0,529
0,468
Польша
0,407
0,485
0,476
СССР
0,603
0,690
0,762
Литва
0,430
0,583
0,555
В первых двух столбцах приведены значения внутригрупповых показателей А для
двух поколений иммигрантов в США из различных стран Европы. Бросается в глаза
рост разноязычия во втором поколении, в особенности у групп, отличавшихся языковой
однородностью на родине, в частности у норвежцев, шведов, немцев и греков. Например,
вероятность, что два произвольно взятых иммигранта из Германии говорят не на
общем родном языке, равна 0,124; во втором поколении вероятность разных родных
языков у двух представителей этой группы поднимается до 0,524. Языковая однородность
групп во втором поколении во всех случаях падает, что вызвано увеличением числа
лиц, для которых родным языком является английский, хотя значительная часть
группы может и во втором поколении сохранить родной национальный язык, как,
например, иммигрант из Норвегии (см. табл. 3). Значения межгрупповых показателей
А, приведенные в последнем столбце таблицы 4, отражают вероятность несовпадения
родного языка у произвольно взятых представителей первого и второго поколения
одних и тех же национальных групп. Характерно, что вероятность разноязычия здесь
значительно выше, чем внутри старшего поколения.
6. В табл. 5 над линией расположены значения показателя А, рассчитанные по
указанному выше методу и показывающие уровни разноязычия между группами иммигрантов
старшего поколения.
Таблица 5
Показатель А, отражающий вероятность совпадения родного языка
между группами иммигрантов в США из Европы на 1940 г.
Норвегия
Швеция
Швейцария
Германия
Греция
Польша
СССР
Литва
Норвегия
-
0,980
0,996
0,998
0,999
0,999
0,998
0,999
Швеция
0,725
-
0,997
0,998
0,999
0,999
0,998
0,999
Швейцария
0,711
0,659
-
0,353
0,999
0,984
0,949
0,984
Германия
0,763
0,721
0,548
-
0,999
0,971
0,921
0,978
Греция
0,808
0,774
0,756
0,800
-
0,999
0,999
0,999
Польша
0,892
0,872
0,859
0,875
0,909
-
0,887
0,952
СССР
0,797
0,761
0,710
0,738
0,829
0,872
-
0,918
Литва
0,865
0,840
0,825
0,854
0,886
0,904
0,855
-
Первое поколение над линией.
Второе поколение под линией.
Как видно из таблицы, эти уровни чрезвычайно высоки. Например, вероятность
несовпадения родного языка у иммигранта из Норвегии и у иммигранта из Германии
равна 0,998. Под линией приведены соответствующие межгрупповые показатели разноязычия
для второго поколения. Во втором поколении значения показателей всегда уменьшаются;
единственное исключение составляют группы иммигрантов из Швейцарии и Германии.
Вероятность несовпадения родного языка у норвежца и немца во втором поколении
уменьшается, в частности, до 0,763.
Смысл данных этой таблицы в их сопоставлении с табл. 4 заключается в следующем.
Группы иммигрантов в США из Европы в большинстве случаев резко отличались друг
от друга по родному языку. Во втором поколении происходит сдвиг в сторону ослабления
языковых барьеров между иммигрантами из разных стран при одновременном уменьшении
языковой однородности внутри самих национальных групп. Более того, расхождение
в родном языке между разными поколениями весьма существенно и значительно превосходит
разноязычие в первом поколении, иными словами, процесс ассимиляции сопровождается
ростом несовпадений родного языка у представителей одной национальности при
параллельном падении разноязычия между национальностями.
7. Показатели Гринберга позволяют измерять уровень языковой коммуникации внутри
групп населения, выделенных по территориальному либо по социальному признаку.
Предлагаемые здесь показатели позволят подойти к вопросам языковой коммуникации
между отдельными группами конгломерата. Используя те и другие показатели вместе,
мы получаем в руки средство к решению основной проблемы социолингвистики, состоящей
в том, чтобы выяснить, до какой степени язык определяет границы социальных групп,
то есть насколько языковая коммуникация внутри отдельных социальных групп выше,
чем между ними.
Примечания
1. Joseph H. Greenberg, The Measurement of
Linguistic Diversity, «Language», 32, 1956, 1, стр. 109-115 (См. стр, 204-214
настоящего издания).
2. Они упоминают работу Гринберга как «один
из немногих известных нам примеров, когда данные описательной статистики имеют
структуру, позволяющую их операционное истолкование в указанном выше смысле».
См. Leo A. Goodman and William H. Кruskal, Measures of Association for Cross
Classification: II. Further Discussion and References, «Journal of the American
Statistical Association», 54, 1959, стр. 155.
3. Для простоты я принимаю, что оба поколения
малочисленной группы «все прочие + нет сведений» говорят на языке старшего
поколения.