ЛЕКСИКОСТАТИСТИЧЕСКИЙ СПИСОК С.Е. ЯХОНТОВА: ПРОБЛЕМА ВЕРИФИКАЦИИ
(Иностранные языки в научном и учебно-методическом аспектах. - Вып. 7. - Новосибирск,
2008. - С. 14-18)
Лексикостатистический список С.Е. Яхонтова был предложен известным советским
лингвистом-востоковедом в начале 1960-х гг. Он представляет собой несколько
видоизмененный список М. Сводеша [1], разбитый
на две части. Первый из этих списков включает 35 слов: ветер, вода, вошь,
глаз, год, дать, два, знать, зуб, имя, камень, кость, кровь, кто, луна, новый,
нос, огонь, один, полный, рог, рука, рыба, собака, солнце, соль, ты, умереть,
ухо, хвост, что, этот, я, язык, яйцо. 32 слова входят в 100-словный список
М. Сводеша, 3 слова (ветер, год и соль) добавлены С.Е. Яхонтовым.
По мнению С.Е. Яхонтова, этот список включает наиболее устойчивую лексику любого
языка мира. Второй список включает 65 слов и содержит менее устойчивую лексику.
Список С.Е. Яхонтова, составленный из 35 слов, в отличие от списка М. Сводеша,
изначально не был рассчитан на проведение каких-либо углубленных лексикостатистических
исследований. Его предназначение - сориентировать исследователя в вопросе, являются
ли данные языки родственными и в какой мере.
Преимуществом 35-словного списка является его краткость, которая позволяет
быстро определить, являются ли анализируемые языки родственными или нет. Естественно,
наиболее плодотворной сферой применения списка С.Е. Яхонтова являются малоизученные
языки, еще сохранившиеся в настоящее время в Латинской Америке, Африке, Новой
Гвинее и отдельных районах Азии. Генеалогическая классификация этих языков до
сих пор разработана недостаточно. Существует большое число языков, которые считаются
изолированными или "неклассифицированными" (этот термин используют
в случае недостатка данных). Кроме того, возможно применение списка и в тех
случаях, когда родственные связи тех или иных языков до сих пор вызывают споры
(так обстоит дело, например, с чукотско-корякскими и ительменскими языками [2]).
Статистические параметры определения степени языкового родства при использовании
35-словного списка С.Е. Яхонтова были предложены С.А. Старостиным [3].
Кратко они могут быть сформулированы следующим образом:
1. Близкородственные языки (например, славянские или германские) имеют более
30 родственных слов в списке.
2. Языки, родственные на уровне языковых групп внутри языковой семьи (например,
индоевропейской), насчитывают более 15 родственных слов в списке.
3. Языки, родственные на уровне макросемей (например, ностратической), имеют
более 5 схожих слов в списке.
4. Если же количество родственных слов меньше 5, то это означает, что либо
данные языки не являются родственными вообще, либо их родство настолько далеко,
что не может быть доказано методами традиционного сравнительно-исторического
языкознания. Сходство слов при этом возникает в результате заимствования или
случайного совпадения.
Проблема, однако, состоит в том, что в случае, когда мы имеем дело с малоизученными
языками, говорить о родстве слов можно только предположительно. Обычно в качестве
гипотетически родственных слов рассматриваются слова, имеющие одинаковое значение
и близкие по своему внешнему облику. Так, в частности, долгое время анализировались
лексикостатистические списки по папуасским языкам [4].
В результате основным критерием при определении близости языков оказывается
не действительное генетическое родство слов, а их фонетическое сходство. Следует,
однако, отметить, что в случаях, когда языки претерпевают существенные фонетические
изменения, сходство даже родственных слов может отсутствовать, ср., напр., испанское
agua и французское eau 'вода' (< лат. aqua) или индонезийское
dua и иааи (меланезийский язык Новой Каледонии) lo 'два' (<
праавстронез. *d̥uva').
Таким образом, если родственные связи языков не установлены (а именно на работу
с такими языками во многом и рассчитан список С.Е. Яхонтова), то на практике
приходится учитывать лишь внешнее подобие слов. Естественно, что точного критерия
"похожести" слов предложить нельзя: одна и та же пара слов может казаться
похожей для одного человека и непохожей для другого. Тем не менее, существуют
и явно сходные слова, ср., напр. русское новый и итальянское nuovo
или индонезийское darah и иааи dra 'кровь' (< праавстронез. *[dd̥]aγah). Именное такие слова и будут принимать участие в анализе.
Чтобы проверить, насколько эффективно применение списка С.Е. Яхонтова в условиях,
когда нам неизвестны родственные связи слов, а во внимание принимается лишь
их фонетическое сходство, рассмотрим списки по следующим языкам: русскому, английскому,
испанскому и хинди. Эти языки относятся к разным группам в пределах индоевропейской
языковой семьи, причем расстояние между этими группами примерно одинаково (см.
таблицу).
Рассмотрим, сколько слов из этих списков будут действительно родственными,
а сколько - похожими лишь внешне.
русский
английский
испанский
хинди
ветер
wind
viento
havā
вода
water
agua
pānī
вошь
louse
piojo
jũ
глаз
eye
ojo
ākh
год
year
año
sāl
дать
give
dar
denā
два
two
dos
do
знать
know
saber
jānnā
зуб
tooth
diente
dãt
имя
name
nombre
nām
камень
stone
pieso
patthar
кость
bone
hueso
haddi
кровь
blood
sangre
xun
кто
who
quien
kaun
луна
moon
luna
candra
новый
new
nuevo
nayā
нос
nose
nariz
nāk
огонь
fire
fuego
āg
один
one
uno
ek
полный
full
lleno
bhar-pūr
рог
horn
cuerno
sīg
рука
hand
mano
hāth
рыба
fish
pescado
machlī
собака
dog
perro
kuttā
солнце
sun
sol
surya
соль
salt
sal
namak
ты
you
tú
tū
умереть
die
morir
marnā
ухо
ear
oreja
kān
хвост
tail
cola
dum
что
what
que
kyā
этот
this
este
yah
я
I
yo
mãi
язык
tongue
lengua
jībh
яйцо
egg
huevo
andā
Подсчеты дают следующие результаты.
В русском и английском языке имеется 18 родственных слов: ветер - wind,
вода - water, два - two, знать - know, имя - name, кто - who, новый - new, нос
- nose, один - one, полный - full, солнце - sun, соль - salt, ухо - ear, что
- what, этот - this, я - I, язык - tongue, яйцо - egg.
Из них по меньшей мере 8 слов сохраняют фонетическое сходство и воспринимаются
как родственные с первого взгляда, без обращения к истории языков: ветер
- wind, вода - water, два - two, новый - new, нос - nose, полный - full, солнце
- sun, соль - salt.
В русском и испанском языках имеется 20 родственных слов: ветер - viento,
дать - dar, два - dos, имя - nombre, кость - hueso, кто - quien, луна - luna,
новый - nuevo, нос - nariz, один - uno, полный - lleno, солнце - sol, соль -
sal, ты - tú, умереть - morir, ухо - oreja, что - que, я - yo, язык -
lengua, яйцо - huevo.
По крайней мере 10 слов сохраняют фонетическое сходство: ветер - viento,
дать - dar, два - dos, луна - luna, новый - nuevo, нос - nariz, солнце - sol,
соль - sal, ты - tú, умереть - morir.
В русском и хинди имеется 15 родственных слов: дать - denā, два - do, знать
- jānnā, имя - nām, кость - haddi, кто - kaun, новый - nayā, нос - nāk, огонь
- āg, полный - bhar-pūr, солнце - surya, ты - tū, умереть - marnā, что - kyā,
яйцо - andā.
Родственными с первого взгляда могут быть признаны по крайней мере 8 слов:
дать - denā, два - do, знать - jānnā, новый - nayā, нос - nāk, огонь - āg, ты
- tū, умереть - marnā.
Аналогичные подсчеты могут быть проведены и между другими парами сравниваемых
языков: английским - испанским, английским - хинди и т.д.
Таким образом, можно сделать следующий вывод: в пределах одной языковой семьи
(на уровне языковых групп) фонетически сходными оказывается примерно половина
родственных слов. Иначе говоря, языки могут быть признаны родственными в пределах
одной языковой семьи, если в списке С.Е. Яхонтова имеется не менее 7-8 фонетически
близких слов с одинаковым значением.
Нетрудно предположить, что в случаях более отдаленного языкового родства (например,
на уровне более глубоких семей или макросемей), количество фонетически близких
слов будет существенно меньше. Так, сравнение списка С.Е. Яхонтова для турецкого
и японского языков, родственных в пределах алтайской языковой семьи, распад
которой произошел значительно раньше, чем индоевропейской (примерно в 6 тысячелетии
до н. э.), дает следующие результаты.
В японском и турецком списках оказывается всего 5 родственных слов: 'год'
(япон. tosi - тур. yıl < праалт. *dila), 'камень' (япон.
isi - тур. taş < праалт. *tiōl'a), 'один' (япон. hitotsu - тур.
bir < праалт. *birV), 'что'
(япон. nan(i) - тур. ne < праалт. *ŋia-), 'я' (япон. watasi - тур.
ben <
праалт. *bä-) [5]. Из них лишь одна пара слов
(япон. nan(i) - тур. ne) близка фонетически. Прийти к каким-либо значимым выводам
на основании одного слова, конечно же, невозможно.
Итак, использование 35-словного списка С.Е. Яхонтова возможно только в том
случае, когда глубина языкового родства сравниваемых языков примерно равна возрасту
индоевропейской языковой семьи, т.е. находится в пределах 3-4 тыс. лет до н.
э. Для определения более отдаленных родственных связей необходимо использовать
другие, более точные, методы. Тем не менее, список С.Е. Яхонтова представляет
собой достаточно надежный инструмент, позволяющий дать предварительную оценку
степени языкового родства и указать лингвисту на направление дальнейших исследований.
Примечания
1. См. Сводеш М. Лексикостатистическое датирование
доисторических этнических контактов // Новое в лингвистике. Вып. 1. - М.,
1960; Сводеш М. К вопросу о повышении точности в лексикостатистическом датировании
// Там же.; Дьячок М.Т. Глоттохронология: пятьдесят лет спустя // Сибирский
лингвистический семинар. - Новосибирск, 2002, № 1.
2. Володин А.П. Ительменский язык // Языки
мира. Палеоазиатские языки. - М., 1977. - С. 60.
3. Starostin S.A. Old Chinese Basic Vocabulary:
A Historical Perspective // Journal of Chinese Linguistics. V. 8. - Berkeley,
1995.
4. Леонтьев А.А. Папуасские языки. - М.,
1977. - С. 23.
5. Старостин С.А. Алтайская проблема и происхождение
японского языка. - М., 1991. - С. 82-107.