КВАНТИТАТИВНЫЙ ПОДХОД К МОРФОЛОГИЧЕСКОЙ ТИПОЛОГИИ ЯЗЫКОВ (ЛИНГВИСТИКА)

Library.BY

⇑ Вернуться к полной версии публикации №1106126506

LIBRARY.BY → ЛИНГВИСТИКА → КВАНТИТАТИВНЫЙ ПОДХОД К МОРФОЛОГИЧЕСКОЙ ТИПОЛОГИИ ЯЗЫКОВ → Версия для печати

Цитирование (постоянный адрес по стандартам ВАКа и ГОСТа)

По стандарту ВАК Республики Беларусь:
КВАНТИТАТИВНЫЙ ПОДХОД К МОРФОЛОГИЧЕСКОЙ ТИПОЛОГИИ ЯЗЫКОВ [Электронный ресурс]: электрон. данные. - Минск: Белорусская цифровая библиотека LIBRARY.BY, 19 января 2005. - Режим доступа: https://library.by/portalus/modules/linguistics/readme.php?subaction=showfull&id=1106126506&archive=&start_from=&ucat=& (свободный доступ). – Дата доступа: 19.04.2024.

публикация №1106126506, версия для печати

КВАНТИТАТИВНЫЙ ПОДХОД К МОРФОЛОГИЧЕСКОЙ ТИПОЛОГИИ ЯЗЫКОВ

Дата публикации: 19 января 2005
Публикатор: Алексей Петров (номер депонирования: BY-1106126506)
Рубрика: ЛИНГВИСТИКА ОБЩЕЕ ЯЗЫКОЗНАНИЕ →

(Новое в лингвистике. Вып. III. - М., 1963. - С. 60-94)

--------------------------------------------------------------------------------

Один из шагов, которые должна предпринять любая наука, если она хочет ясно осмыслить потенциальные возможности своего научного метода, заключается в том, чтобы, не ограничиваясь простым описанием изучаемых объектов, перейти к их сравнению и классификации. На то, что лингвистика сделала такой шаг, указывает само существование так называемого "сравнительного языкознания", особой отрасли науки, которая к тому же занимает почетное место среди наук, изучающих человека. Однако сравнительно-исторический метод представляет собой лишь один из двух основных методов, при помощи которых можно сравнивать языки. Второй метод (его можно было бы назвать типологическим) является предметом рассмотрения настоящей статьи. Судьба его была не столь гладкой, как судьба историко-генетического метода, являющегося неотъемлемой принадлежностью сравнительного языкознания. Важно по возможности более отчетливо дифференцировать различия, существующие между этими двумя методами. Каждый из них вполне правомерен в своей собственной сфере, но смешение указанных методов, например в тех случаях, когда типологические критерии используются для установления родственных связей, принесло много вреда в прошлом.
Историко-генетический метод классифицирует языки по "семьям", которые имеют общее историческое происхождение. Известным примером является развитие современных форм романских языков - французского, испанского, португальского, итальянского, румынского и других - из первоначально единой латыни в результате изменений одной и той же речевой формы в различных ареалах. Если бы подобное расхождение языков не было таким отдаленным во времени, что исчезли все его следы, сравнение могло бы вскрыть характерные черты сходства между языками, имеющими общее происхождение. При этом наиболее существенным для подобных сравнений является сходство между отдельными формами языков как в их звучании, так и в их значении. Например, англ. nose и нем. Nase имеют сходные звуки и фактически тождественные значения - "нос"; англ. hound "охотничья собака", "гончая" и нем. Hund "собака" сходны по звучанию и близки, хотя и не совпадают полностью, по значению. В любом языке есть тысячи форм, обладающих как звучанием, так и значением, связь между которыми не мотивирована. В принципе любое звучание может передавать любое значение. Поэтому, если в каких-либо двух языках значительное число таких единиц совпадает - как, например, в немецком и английском - и если (эта проблема здесь не рассматривается) случаи сходства нельзя объяснить заимствованием, мы по необходимости приходим к выводу об общем историческом происхождении этих языков. Подобные генетические классификации не являются условными, поскольку они не допускают установления других критериев, могущих привести к иным результатам. Это объясняется тем, что подобные классификации отражают исторические события, которые либо действительно имели место, либо нет. Либо немцы и англичане говорят на языке, полученном в наследство от первоначально единого протогерманского речевого коллектива, либо нет. Использование таких терминов, как "семья", "родственный" и "генетический", сближает эту классификацию с биологической классификацией. С генетическими гипотезами в языке дело обстоит также, как в биологии, где мы относим виды к одному и тому же роду или к подразделению более высокого порядка, поскольку их сходство таково, что наводит на мысль об их общем происхождении.
Можно, однако, сравнивать и языки, генетическую близость которых нельзя продемонстрировать либо в отношении звуковых, либо в отношении семантических явлений. Приводимые ниже два примера послужат иллюстрацией такой возможности и в то же время покажут, что при подобном сравнении возникает ряд научных проблем, имеющих полное право на существование. Во всех языках должны быть средства для выражения сравнения - того, скажем, факта, что один предмет больше, чем другой. Если мы сопоставим все языки мира в этом отношении, мы обнаружим, что число таких приемов ограниченно - особая словоизменительная форма прилагательного (англ. greater "больше" [ср. great "большой".- Перев.]), использование предлога со значением "от" (семитские языки), использование глагола, означающего "превосходит, превышает" (широко распространено в Африке), - и что некоторые из них встречаются чаще других и имеют вполне определенные границы распространения, не совпадающие с генетическими границами. Все эти факты, несомненно, представляют научный интерес и требуют объяснения. Пример, который мы привели выше,- факт семантический. В области фонетических моделей, безусловно, заслуживает внимания независимое становление системы из пяти гласных с двумя ступенями долготы - a,a';e,e';i,i';o,o';u,u' - в классической латыни, в языке хауса (Зап. Африка), в йокутс (= Yokuts) - индейском языке Калифорнии и, несомненно, также в других языках. Именно подобные явления изучали Трубецкой и другие, пытаясь определить, какие типы систем гласных и согласных возможны, сколь часто они встречаются и какова область их распространения.
Если сравнение языков в генетическом плане позволяет нам установить классы языков, то есть языковые семьи в общепринятом смысле, то разве типологическая классификация не дает такой возможности? Конечно, дает, но в отличие от генеалогической классификации у нее нет конкретных связей с историей, и она условна, то есть в зависимости от выбранного критерия или совокупности критериев она приводит к различным результатам.
В этом отношении она похожа на классификацию по расам, основанную на ряде условно выбранных признаков. Если, например, мы выберем такой чисто фонетический критерий, как наличие или отсутствие округления губ, в качестве признака, различающего пары гласных фонем, языки мира распадутся на две группы: на языки, в которых данный принцип противопоставления используется, и языки, в которых он не используется. Английский и итальянский языки, не использующие лабиализации, попадут в один класс А с бесчисленными другими языками, а французский и немецкий вместе с меньшим числом языков из различных частей света попадут в класс Б. Если будет выбран какой-либо иной типологический признак, скажем, позиция зависимого родительного падежа по отношению к существительному, опять возникнут два класса языков, но они не совпадут с теми, которые были получены на основе критерия противопоставления лабиализованных и нелабиализованных гласных. Приняв во внимание оба фактора, можно получить четыре класса. Некоторые признаки позволят выделить более чем два класса. Если классифицировать языки семантически на основе имеющихся в них систем числительных, мы получим несколько классов языков: языки с двоичными, пятеричными, десятичными, двенадцатеричными и, без сомнения, также другими системами. Короче говоря, в отличие от генеалогической классификации, в данной, то есть типологической классификации, число языковых групп и их состав будет различным, в зависимости от числа и определенного выбора языковых явлений, использованных для сравнения. Одним крайним случаем окажется такой случай, когда в качестве единственного критерия будет взят какой-либо признак вроде наличия системы гласных и когда языки мира распадутся на две группы: языки, обладающие системой гласных (в эту группу войдут все языки земного шара), и языки, где такая система отсутствует. Этот последний класс, разумеется, не будет включать ни одного языка. С другой стороны, возможен и такой крайний случай, когда при классификации учитывают так много признаков, что каждый язык становится единственным представителем особого языкового типа.
Многие из таких классификаций, как явствует из только что приведенных примеров, приносят мало пользы. Мы стремимся создать типологическую классификацию, которая затрагивала бы важнейшие основные признаки языка и которая была бы полезна во многих отношениях. Такая классификация действительно существует - это идущее от XIX в. деление языков на три типа (в своем классическом варианте) - изолирующие, агглютинирующие и флектирующие.
Эта trop fameuse classification ("пресловутая классификация"), если вспомнить язвительное замечание Мейе, обнаруживает весьма существенные недостатки, которые неминуемо привели к тому, что в настоящее время она пользуется дурной славой. И тем не менее сама эта проблема представлялась настолько важной Сепиру, что он сделал ее центральной темой своей книги "Язык", единственной книги, внесшей после XIX в. значительный вклад в изучение типологии языков. Какими бы несовершенными ни казались сейчас рассуждения ученых XIX в. на эту тему, все же главного достоинства выдвинутых схем отрицать нельзя. В качестве основы для классификации инстинктивно было найдено нечто, имеющее кардинальное значение для всесторонней общей характеристики языка, а именно морфологическая структура слова, и Сепир просто продолжил, в измененной, форме, эту важнейшую традицию более раннего времени. Возможны и другие типологические классификации, в частности фонологические, и эти последние стояли в центре внимания в типологических дискуссиях последних лет. Однако проблема морфологической типологии остается нерешенной, о чем свидетельствует недавнее заявление Рулона Уэллза: "Позор, что не существует общепринятой таксономии языков мира" (1950, стр. 31). Свидетельством ожившего интереса к этой теме является, далее, фактически одновременное и независимое развитие идей, сходных с изложенными в настоящей статье, предпринятое Хокеттом из Корнелльского университета [1]. Короче говоря, наступил благоприятный момент пересмотреть подход к данной проблеме, характерный для ученых XIX в., с тем чтобы, отбросив все теории, несостоятельность которых была за истекший период доказана лингвистической критикой, и, взяв на вооружение все новейшие достижения лингвистических методов, дать существующим гипотезам более строгую и точную формулировку. Краткий критический обзор более ранних попыток создания типологических классификаций послужит надлежащим фоном для излагаемой здесь теории.
В основе всех позднейших классификаций лежит различие, впервые выдвинутое Фридрихом фон Шлегелем в его сочинении "Ueber die Sprache und Weisheit der Inder" (1808), между языками с аффиксами и языками с флексиями. Оценочное отношение, столь явно проступавшее на протяжении всей последующей истории развития данной теории, ясно видно уже в этой наиболее ранней ее формулировке. Аффиксирующие языки выражают отношения чисто механическим путем. В примечательном сравнении они уподобляются "груде атомов, рассеиваемых или сметаемых вместе любым случайным ветром" (стр. 51). Флективными языками являются только индоевропейские, хотя в этом же направлении развиваются и семитские языки.
Эта классификация языков по двум типам была переработана братом Фридриха Шлегеля Августом фон Шлегелем, который в сочинении "Sur la litterature provencale" (1818) описывает уже три класса языков: "языки без грамматической структуры, аффиксирующие и флективные языки" (стр. 559). О языках первого типа, названных последующими авторами изолирующими или корневыми, Шлегель говорит: "Можно было бы сказать, что все слова в них - корни, но корни бесплодные, не производящие ни растений, ни деревьев" (стр. 159). Писать научное сочинение таким языком - это tour de force ("просто подвиг"). Аффиксирующие языки используют прибавляемые элементы ("аффиксы") для передачи отношений и оттенков понятий, выражаемых корнями, но эти аффиксы все еще сохраняют самостоятельное значение. Относительно флективных языков, в которых подобные аффиксы лишены значений (то есть не имеют конкретных значений), мы узнаем, что в них можно обнаружить нечто вроде органической жизни ("организм"), потому что "им присущ жизнеспособный принцип развития и роста" (стр. 159). У Шлегеля, как и у последующих авторов, образцом корневого языка является китайский язык, к флективной группе относятся только семитские и индоевропейские языки; все остальные принадлежат к обширному и неоднородному промежуточному, или агглютинирующему, классу. Немало смущает его, так же как и других, позднейших авторов, тот затруднительный факт, что индоевропейские языки обнаруживали тенденцию утрачивать флексии. Поэтому Шлегель вводит дальнейшее подразделение флективных языков на более ранние - синтетические и более поздние - аналитические. Все известные нам аналитические языки возникают в результате переразложения синтетических языков. Не касаясь других авторов, рассматривавших данный вопрос в основном также, как Шлегель, мы подходим к Вильгельму фон Гумбольдту, который в своем сочинении "Ueber die Verschiedenheit der menschlichen Sprachen" (1836) сделал типологический тип анализа центральным при исследовании языка. Гумбольдт видел в каждом языке особое, индивидуальное самораскрытие духа (Geist). Каждое такое самовыражение духа имеет свою ценность и право на существование, но обнаруживает большую или меньшую степень совершенства. В схеме Гумбольдта выделены четыре класса языков. К ставшей к тому времени уже традиционной тройной классификации языков он добавляет четвертый - инкорпорирующий тип, чтобы охватить некоторые языки американских индейцев, в которых очень сложные модели слова включают случаи, когда приглагольное дополнение инкорпорировано в том же самом слове в виде глагольного корня. Гумбольдт совершенно недвусмысленно отказывается от какого бы то ни было историко-эволюционного объяснения, при котором более высокоорганизованные типы выводятся из более низких типов. Эти четыре типа - идеальные типы, связанные с различными степенями развертывания формы. Изолирующие языки "бесформенны", инкорпорирующие языки в силу чрезмерной перегруженности своих форм также не обнаруживают подлинного чувства формы. Как и можно было ожидать, истинным пониманием формы наделяются только флектирующие языки, так как только в них мы встречаем гармоническое слияние корня и аффикса в единое целое.
Изложение данной теории в ее окончательном виде мы находим в работах А. Шлейхера, который находился под двойным влиянием Дарвина и Гегеля. Классы языков рассматриваются теперь как соответствующие историко-эволюционные фазы в развитии языков. Число типов ограничивается тремя, и они приравниваются к трем ступеням гегелевской диалектики. Флектирующий класс языков понимается как более высокая ступень синтеза, возникающая из прежней оппозиции. Распад флексий в историческое время знаменует новую фазу развития духа (Geist), для которой материальная сторона языка уже несущественна. Поскольку шлейхеровский вариант типологической классификации вполне гармонировал с интеллектуальными тенденциями века и был снабжен внушительным аппаратом квазиалгебраических формул для обозначения различных отношений между корнем и подчиненными элементами, он завоевал широкое признание и был использован двумя великими популяризаторами лингвистической науки - Максом Мюллером в Европе и Дуайтом Уитни в Соединенных Штатах. Последующие варианты, такие, например, как вариант Штейнталя-Мистели, лишь усложнившие схему Шлейхера, ничем ее взамен не улучшив, никогда не имели такой популярности, как вариант Шлейхера, который, таким образом, закрепился в качестве основной формы данной теории.
На протяжении всего этого периода этноцентризм и расплывчатость указанных типологических классификаций неоднократно подвергались критике. Приведем лишь один пример: Уитни, который отнюдь не был столь восторженным почитателем типологической классификации Шлейхера, как его современник европеец Макс Мюллер, указывал, что английское loved "любил" от love "любить"- такая же удачная форма претерита, как led "вел" от lead "водить" или sang "пел" от sing "петь" (1876, стр. 362). Loved - это, несомненно, случай применения способа агглютинации, в то время как в led и sang используется внутренняя флексия. И все же в применении к изолирующим языкам он говорит об "отсутствии способов, присущих более развитым языкам; ...мысль выражена лишь отрывочно, и ее орудие [то есть язык. - Перев.] ей слабо помогает". Другие лингвисты, особенно в более поздний период, относились к типологической классификации в высшей степени критически или даже презрительно, как, например, Маутнер, по словам которого "... оценивать [языки] в зависимости от того, насколько отчетливо проступают в них флексии, столь же глупо, как судить о достоинствах европейских армий по тому, насколько заметны швы на брюках их солдат" (1923, стр. 309).
Обращение Сепира к этой теме в книге "Язык" (1921) открывает новую эпоху. Он решительно отбрасывает как оценочный, так и эволюционный аспекты типологической теории. Нет никаких реальных оснований полагать, что китайский или венгерский языки не являются столь же эффективными орудиями мысли, как латинский или английский. "Когда дело доходит до языковых форм, Платон равен македонскому свинопасу, а Конфуций - охотящемуся за черепами дикарю из Ассама" (стр. 234). Язык, по-видимому, существует по крайней мере 500 000 лет; следовательно, если и есть линия развития - изолирующие, агглютинирующие п флектирующие языки, - то современные изолирующие языки никак не могут отражать соответствующую первобытную стадию. И действительно, данные палеонтологии человека и геологии ледникового периода уже давно показали несостоятельность такого допущения. Ко времени Сепира было уже известно (как из более ранних памятников китайского языка, так и из сравнения с тибетским и другими родственными языками), что китайский язык, выдвигавшийся в качестве классического примера изолирующего языка, ранее обладал более сложной морфологической системой.
Вероятно, более серьезными недостатками, чем те, которые содержатся в этих уже развенчанных идеях, были другие логические дефекты, на что время от времени указывалось. Критерии разграничения различных типов языков так и не получили четкого определения и ни разу не были применены объективно. Когда мы читаем работу в духе теории Штейнталя-Мистели, нас не покидает ощущение, что автор ведет нечестную игру. Во всех тех случаях, где на основе его же собственной аргументации неарийский или несемитский язык оказывается обладателем какого-либо достойного похвалы явления, путем неожиданного молчаливого изменения определения получается, что в виду не имеется "истинная форма" или "истинная флексия". Определения выглядят не только расплывчатыми, но частично относятся к совершенно разным вещам, и в результате оказывается, что какой-либо язык принадлежит одновременно к нескольким в принципе взаимоисключающим классам. Так, агглютинация рассматривается обычно как характеристика способа механической аффиксации, и, по выражению Макса Мюллера, "различие между арийскими и туранскими языками несколько напоминает различие между хорошей и плохой мозаикой. Арийские слова кажутся сделанными из одного куска, в туранских же словах ясно видны швы и трещины в тех местах, где соединяются вместе небольшие камешки" (1890, стр. 292). Термину агглютинация должен противостоять термин флективность. Но термин флективность используется также для указания на наличие аффиксов, лишенных конкретного значения и служащих для обозначения отношений между словами в предложении; таковыми являются, например, падежные окончания у существительных или флексии лица и числа у глагола. Исходя из этих определений, турецкий язык является одновременно и агглютинирующим (если принимать во внимание способ), и флектирующим (если учитывать падежную систему и систему спряжения глагола).
Как указывали некоторые критики, другой недостаток данной теории заключается в том, что язык причисляется к какой-либо одной определенной категории, хотя учитываемые при классификации признаки могут характеризовать его в большей или меньшей степени. Термин, подобный термину агглютинирующий, применим главным образом к какой-то отдельной конструкции. В то же время язык вполне может содержать, и обычно действительно содержит, как агглютинирующие, так и неагглютинирующие конструкции. Иными словами, речь идет скорее о преобладающей общей тенденции, чем о наличии или отсутствии тех или иных отличительных признаков вообще. Подвергнув рассмотрению различные критерии, используемые в традиционной классификации бессознательно и совершенно непоследовательно, Сепир создает более сложную систему, в которой языки классифицируются по ряду независимых друг от друга критериев, а традиционные термины хотя и сохранены, но используются строго определенным образом и часто относятся к разным аспектам сравнения, в силу чего они уже больше не являются взаимоисключающими.
Один из таких аспектов, различаемых Сепиром, связан с учетом общей сложности слова в целом, то есть со степенью сложности, проявляющейся в количестве содержащихся в слове подчиненных значимых элементов. Термины, используемые здесь Сепиром, - аналитический, синтетический и полисинтетический - расположены в порядке возрастающей сложности. С теоретической точки зрения крайний случай анализа здесь представлен языками, в которых каждое слово состоит только из одной значимой единицы и, таким образом, не имеет внутренней структуры. К этому полюсу действительно приближаются языки китайский, вьетнамский и эве (Западная Африка). Данные языки традиционно называются изолирующими, но, как мы увидим, Сепир использовал этот термин в другом смысле. Языки, подобные английскому, где слова не отличаются большой сложностью, Сепир включил в группу аналитических. Однако степень синтеза - это лишь один критерий и к тому же относительно поверхностный, поскольку он ничего не говорит нам о том, в чем именно заключается сложность слова. Второе, совершенно иное соображение относится к технике построения конструкций. Грубо говоря, здесь противопоставляются языки, в которых подчиненные элементы механически прибавляются к корневым элементам, то есть ни те, ни другие элементы не подвергаются никаким изменениям (таково наиболее распространенное значение агглютинации в классической схеме классификации), и языки, в которых наблюдается фузия, в результате чего составные элементы трудно узнать и выделить. Для иллюстрации воспользуемся примерами Сепира: good+ness в английском языке [goodness "доброта", ср. good "добрый". - Перев.) - это агглютинация, dep+th - фузия (depth "глубина", ср. deep "глубокий". - Перев.). Неоднократно возвращаясь к этому вопросу и приходя к различным выводам, Сепир в конце концов устанавливает четыре группы языков: а) изолирующие; b) агглютинирующие; с) фузионные; d) символические. Изоляция, под которой Сепир разумеет значимый порядок элементов, включается им сюда потому, что он истолковывает эту категорию как имеющую отношение к технике соединения элементов. Подобно тому как в John hit Bill "Джон ударил Билла" John выступает в конструкции с hit в качестве субъекта глагола, поскольку оно предшествует глаголу, так и в dep-th изменение deep в dep- указывает, что последнее связано в конструкции с -th. Поскольку противопоставление агглютинация - фузия относится скорее к способам выражения, чем к объектам отношения, Сепир рассматривает эту шкалу также как несколько поверхностную, хотя и полезную в качестве дополнительного критерия.
Деление, которое представляется Сепиру наиболее существенным, вызывается следующими соображениями. Существует два типа понятий, которые должны быть выражены во всех языках: корни с конкретными значениями, например "стол", "есть", и чисто реляционные понятия, "служащие для установления связи между конкретными элементами предложения" и, таким образом, придающие ему определенную синтаксическую форму; например, в латинском языке -um является знаком глагольного дополнения. Эти два класса понятий Сепир ставит в начале и в конце своей шкалы - I (конкретные), IV (чисто-реляционные), поскольку они представляют собой два полюса - конкретносгь и абстрактность. Между ними он располагает две группы понятий, являющихся факультативными, так как в одних языках они имеются, а в других отсутствуют. Класс II состоит из деривационных (словообразовательных) понятий, которые "отличаются от типа I тем, что выражают идеи, не относящиеся ко всему предложению в целом, но придающие корневому элементу более конкретное значение и, следовательно, связанные специфическим образом с понятиями типа b. В качестве примера Сепир приводит английский суффикс -er в слове farmer "фермер", уточняющий значение farm- "ферм-", но не связанный со структурой остальной части предложения. Язык, не содержащий понятий типа II, использовал бы для передачи значения "фермер" какой-либо один неразложимый элемент. Понятия типа III (конкретные, реляционные понятия) подводят к типу IV (чисто-реляционные понятия), поскольку они помогают установить связь одних членов предложения с другими, но отличаются тем, что содержат в своем значении элемент конкретности. Примером являются элементы, указывающие род в языке типа немецкого: -еr в d-er в предложении Der Bauer totet das Entelein "Фермер убивает утенка" связывает d- с Bauer при помощи согласования в числе, роде и падеже. Оно указывает, таким образом, на то, что d- определяло Bauer и что Bauer стоит в единственном числе и является подлежащим этого предложения. Однако, кроме того, оно выполняет еще важную функцию указателя рода, в данном случае мужского.
Такие понятия Сепир называет конкретно-реляционными. Поскольку существует 4 типа понятий, из которых I и IV обязательно наличествуют во всех языках, а II и III - необязательно, выделяются следующие четыре класса языков: класс А - включает языки, содержащие только I и IV типы понятий. Сепир называет их "простыми чисто-реляционными языками". Таков, например, китайский язык. Группа В - включает языки, в которых наряду с обязательными I и IV типами имеется еще и тип II. Это "сложные (то есть словообразующие) чисто-реляционные языки". Группу С составляют языки, в которых имеются типы I, III и IV, но нет II-го. Это "простые смешанно-реляционные языки". И, наконец, в группу D включаются те языки, которым присущи все четыре типа понятий - это "сложные смешанно-реляционные языки". Из двух признаков - наличия или отсутствия понятий чипа II (деривационные) и наличия или отсутствия понятий типа III (конкретно-реляционные) - последний, объединяющий классы А и В в противоположность классам С и D, Сепир считает более важным. В своей сводной классификационной таблице Сепир рассматривает ряд языков и, используя выдвинутые выше критерии, сначала подводит тот или иной конкретный язык под один из уже упомянутых "основных типов" А, В, С, D. Он также указывает степень синтеза.
Третий фактор - техника установления связи между элементами языка - особо уточняется для каждой из групп понятий II, III (когда они имеются налицо) и IV, исходя из вышеупомянутой шкалы: а) изоляция; b) агглютинация; с) фузия; d) символизация. Сепир часто говорит одновременно о двух, а иногда и трех способах. В случае, если тот или иной способ развит в языке слабо, Сепир заключает соответствующее условное обозначение в скобки. Затем он приводит общие данные о преобладающих способах, употребляемых в языке в целом, нередко используя при этом такие составные термины, как, например, агглютинативно-фузионный, для указания на относительно равную распространенность обоих этих способов. Отметим, что в окончательной редакции своей классификации Сепир нигде не употребляет термин флектирующие. Он определяет флексию (inflection) как использование способа фузии в сфере словоизменительных единиц. Он полагает, что при таком определении термин "флектирующие" не настолько важен, чтобы фигурировать в качестве основного термина в его классификации. О наличии флективности, таким образом, свидетельствует появление b, указывающего на фузию, или b u d, указывающих на фузию и символизм в связи с понятиями группы III (смешанно-реляционные). Для иллюстрации общей схемы Сепира обратимся к его классификации семитских языков. Эти языки в целом причисляются к D, то есть к сложно-смешанно-реляционным языкам, содержащим все четыре типа понятий. Они синтетичны. В области словообразовательных понятий (II) используемые способы характеризуются как d и b именно в таком порядке, то есть это символизация и фузия. В области смешанно-реляционных понятий (III) используются приемы b и d, то есть фузионные, символические. В рубрике IV указан способ (а) - изоляция, то есть значимый порядок слов, скобки указывают на его слабое развитие. Наконец, в целом эти способы определяются как символико-фузионные.
Предлагаемый здесь метод базируется на классификации Сепира, представленной в переработанной форме. Основные критические замечания в адрес Сепира, уже высказанные Моустом (1948, стр. 183-190), сводятся в целом к двум.
Первое и наиболее важное замечание заключается в том, что в своем делении языков на четыре основных типа Сепир, казалось бы, говорит о понятиях, но в действительности исходит из формальных критериев, а не из семантических - обстоятельство, которое приводит к некоторым трудностям при изложении материала. Например, Сепир рассматривает понятие множественности, которое он считает в высшей степени абстрактным. Однако, как он указывает, в каком-либо конкретном языке оно может быть помещено в любом месте вдоль шкалы I-IV. Следовательно, является ли множественность понятием корневым (I), деривационным (II) или реляционным (III и IV), зависит от того, к какому формальному классу тот или иной конкретный язык ее причисляет. Сепир сам признает это несоответствие. "Мы не можем заранее сказать, куда следует поместить то или иное понятие, именно потому, что наша классификация понятий представляет собой скорее скользящую шкалу, чем философский анализ опыта" (1921, стр. 117). В типологической классификации, предлагаемой в настоящей статье, исходный пункт является формальным. Мы признаем, что в силу действительно существующей тенденции корневые морфемы (I у Сепира) обычно более конкретны по значению, чем деривационные (II у Сепира) или словоизменительные морфемы (III или IV); однако эта тенденция слишком расплывчата, чтобы на ней можно было строить обоснованную методику. В данном случае, так же как в современной лингвистике вообще, мы выделяем наши дистинктивные единицы при помощи формального, а не семантического критерия по чисто практическим соображениям.
Второе критическое замечание относится к шкале Сепира: а) изолирующие; b) агглютинирующие; с) фузионные; d) символические. Изоляция - это способ связи, так же как и другие приемы, но применяется он почти исключительно к словам, поскольку относительный порядок расположения элементов внутри слова имеет значение лишь в редких случаях. Изоляция, следовательно, в данной шкале неуместна, и это сказывается на асимметричности ее появления в схеме Сепира: она выступает в качестве способа только под рубрикой IV (чисто-реляционные понятия) и относится к связям, осуществляемым не внутри слова, как другие способы, но между словами.
Метод классификации языков, предлагаемый в настоящей статье, - это в своей основе метод Сепира, но с некоторыми видоизменениями в свете указанных критических замечаний. Более того, вместо интуитивных определений, опирающихся на общие впечатления, делается попытка охарактеризовать каждый признак, используемый в данной классификации, через отношение двух единиц, каждая из которых получает достаточно точное определение посредством исчисления числового индекса, основанного на относительной частотности этих двух единиц в отрезках текста. В основу классификации положено пять признаков вместо трех у Сепира и устанавливается ряд из одного или более индексов для определения места того или иного языка в отношении каждого из них. Первый из этих параметров - степень синтеза или общая сложность слова. Со времен Сепира минимальная значимая последовательность фонем в языке стала в американской лингвистике называться морфемой. Например, англ. sing-ing "пение" содержит две морфемы, но образует одно слово. Отношение M/W, где М - число морфем, a W - число слов [ср. англ. word "слово". - Перев.], является мерой синтеза и может быть названо индексом синтетичности. Теоретически низшим пределом его является 1,00, поскольку каждое слово должно содержать по крайней мере одну значимую единицу. Высший предел теоретически отсутствует, но на практике величины выше 3,00 встречаются редко. Показатели этого индекса для аналитических языков будут низкими, для синтетических - более высокими, а для полисинтетических - самыми высокими.
Второй параметр относится к способам связи. На одном полюсе здесь находятся языки, в которых значимые элементы, соединяясь, не изменяются совсем или изменяются незначительно. Таково классическое определение агглютинации. Явление, противоположное агглютинации, - взаимная модификация или слияние элементов. Здесь также можно выделить несколько конструкций и таким образом построить более детальную типологическую классификацию. Для целей настоящей статьи выбрана альтернатива, которая представляется наиболее точно соответствующей идеям Сепира и обычных исследований XIX в. Используя современную терминологию, можно сказать, что имеется в виду степень морфо-фонематических альтернаций. Значимые отрезки, реально обнаруживаемые в высказывании, называются "морфами". Ряд сходных морф подводится под одну основную единицу - морфему. Различные морфы, следовательно, находятся в отношении альтернации. Например, в английском языке мы связываем морфу lijf (leaf "лист") с морфой lijv-, которая встречается только в сочетании с морфой множественного числа -z и образует lijvz (leaves "листья"). Lijf и lijv- - это морфы, альтернирующие в пределах одной и той же морфологической единицы. Правила констатации подобного альтернирования относятся к морфо-фонематической части описания английского языка. В тех случаях, когда среди морф, составляющих морфему, варьирования не наблюдается или когда варьирование происходит автоматически, о самой морфеме говорят, что она автоматична. Под автоматической альтернацией понимается такая альтернация, при которой все альтернанты можно образовать от основной формы, зная ряд правил сочетаемости, сохраняющих в данном языке силу для всех аналогичных случаев. Этот вопрос будет рассмотрен ниже более детально. Если обе морфы в какой-либо конструкции относятся к морфемам, являющимся автоматическими, конструкция называется агглютинативной.
Индекс агглютинации - это отношение числа агглютинативных конструкций к числу морфных швов. Число морфных швов в слове всегда на единицу меньше, чем число морф. Так, в leaves две морфы, но только один морфный шов. Индекс агглютинации - A/J, где А равно числу агглютинативных конструкций, a J - числу швов между морфемами [англ. juncture "стык, шов". - Перев.]. Язык с высоким индексом агглютинации является агглютинирующим, а язык, имеющий малый по величине индекс, - фузионным. В целом, чем ниже первый индекс (индекс синтетичности), тем меньше фиксируется границ между морфами и тем менее важен для характеристики языка второй индекс - индекс агглютинации. Если язык достигает теоретически низшего предела в синтетическом индексе (1,00), исчисление второго индекса становится невозможным, поскольку это означает, что никаких границ между морфемами вообще нет. Иными словами, индекс агглютинации становится равным О/О, что бессмысленно. При исчислении индекса агглютинации не принимались во внимание различия между степенью агглютинации, которые можно обнаружить в конструкциях, включающих понятия групп II, III и IV у Сепира, и которые как мы видели, фигурируют в окончательной формулировке его классификации. Такие индексы можно было бы вычислить на основе разграничения классов корневых, деривационных и словоизменительных морфем, ибо именно эти категории наиболее точно соответствуют делению понятий у Сепира. Они не были установлены, частично чтобы избежать слишком больших общих осложнений в типологической классификации, а отчасти потому, что исчисление их сопряжено с значительными трудностями.
Третий параметр соответствует наиболее точно тому, что для Сепира было центральным признаком при классификации языков, - это наличие или отсутствие деривационных и конкретно-реляционных понятий. Поскольку, как мы видели, взяв за отправную точку значения понятий, нельзя добиться необходимой научной точности, в настоящем исследовании мы исходим из возможности исчерпывающего деления морфем на три класса - корневые, деривационные и словоизменительные. Каждое слово должно содержать по крайней мере одну корневую морфему, и многие слова во многих языках больше ничего и не содержат. Наличие в слове более чем одной корневой морфемы называется словосложением (compounding). Это важный признак, благодаря которому языки существенно отличаются друг от друга. В некоторых языках словосложение либо вообще отсутствует, либо встречается очень редко. Другие, напротив, широко используют словосложение. Однако большинство языков занимает в этом отношении промежуточное положение. Примечательно, что Сепир, по-видимому, не принимает этого во внимание в своей классификации. Указанное явление можно легко измерить при помощи структурного индекса (compositional index) R/W, где R равно числу корневых морфем [ср. англ. root "корень". - Перев.), а W равно числу слов. Второй класс морфем - деривационные морфемы. Примерами деривационных морфем в английском языке могут служить re- в re-make "пере-делать", -ess в lion-ess "льв-ица", -er в lead-er "предводи-тель". Деривационный индекс D/W - отношение числа деривационных морфем [ср. англ. derivational "словообразовательный, деривационный". - Перев.] к числу слов. Языки с высоким D/W принадлежат к сложным, или деривационным, подтипам у Сепира и, таким образом, попадают в классы Б и Г его классификации. Словоизменительные морфемы образуют третий класс. Примеры из английского языка: -s в eats "ест" и -es в houses "дома".
Словоизменительный индекс I/W есть отношение числа словоизменительных морфем [ср. англ. inflectional "словоизменительный". - Перев.] к числу слов Это, как будет показано, не вполне тождественно сепировским понятиям типа III (конкретно-реляционные). Однако язык, в котором эти понятия существуют и который, таким образом, принадлежит у Сепира к смешанно-реляционным типам В и Г, обязательно характеризуется довольно высокой величиной индекса словоизменения; обратное отношение верно не всегда.
Четвертый параметр связан с фактором, который Сепир считал важным для морфологической структуры языка, но который он не включил в окончательную формулировку своей классификации. Это порядок следования подчиненных элементов по отношению к корню. Основным различием здесь является различие между использованием префиксов и суффиксов. Префиксальный индекс P/W представляет собой отношение числа префиксов к числу слов, а суффиксальный индекс S/W -отношение числа суффиксов к числу слов. Сходным образом можно исчислить и индекс инфиксации, то есть количества подчиненных элементов, которые инкорпорируются внутри корня, но в исследованных языках инфиксы встречались настолько редко, что представлялось обоснованным их опустить. Существует неопределенное число и других возможных типов положения подчиненных элементов по отношению к корню, например обрамление (containment), как у арабского имперфективного префикса второго лица женского рода, который окружает глагольную морфему в taqtuli' "ты (ж. р.) убиваешь", где морфемой второго лица женского рода является ta- - -i-, в то время как "убивать" передается при помощи -q-t-l, а "имперфектное время" - через -u-. Точно так же существует и вставка (intercalation), обнаруживаемая опять-таки в семитских языках, при которой часть подчиненного элемента предшествует корню или следует за ним, а другая часть вставляется внутрь. Все эти способы, встречаются настолько редко, что, по крайней мере для изученных нами языков, вычислять их индексы не имело смысла. Сюда же по существу относится и сепировский символизм, который он рассматривает как особый технический прием наряду с изоляцией, агглютинацией и фузией. Сепировский символизм, или внутреннее изменение, является, на мой взгляд, просто инфиксацией словоизменительного элемента: ср., например, инфикс прошедшего времени -а- в английском sang "пел". Когда подобные элементы являются деривационными, как в индонезийских языках, процесс обычно называется инфиксацией. Это выявляет тот факт, что с использованием термина "символизм" у Сепира связаны два определенных соображения - позиция и регулярность. Процесс инфиксации вполне может быть регулярным, и в этом случае конструкция должна быть агглютинирующей. В действительности же, однако, это вряд ли когда-либо случается.
Последний параметр имеет дело со способами, используемыми в различных языках для установления связи между словами. Он, следовательно, вводит критерии как синтаксического, так и морфологического порядка. Существуют три способа, которые языки могут использовать, - словоизменение без согласования, значимый порядок слов и согласование.
Языки, применяющие первые два способа, принадлежат, по классификации Сепира, к чисто-реляционной категории, в то время как языки, применяющие согласование, являются смешанно-реляционными. Словоизменительный индекс, рассмотренный выше, будет включать как несогласуемые, так и согласуемые словоизменительные морфемы. Этот индекс, который можно было бы назвать индексом преобладающего словоизменения, для настоящей проблемы можно использовать лишь с известными ограничениями. Весьма вероятно, что, разграничив согласуемые и несогласуемые словоизменительные морфемы и причислив слова без словоизменительных морфем к изолирующему классу, можно было бы произвести четкое тройное деление. Степень характерности для языка изолирующих, словоизменительных и согласуемых приемов можно было бы исчислить тогда при помощи трех индексов, опирающихся на отношение каждого из этих типов к общему числу слов. Существует, однако, ряд осложнений, препятствующих осуществлению такой простой методики. Во многих языках, в частности в латыни, согласуемые и несогласуемые явления сливаются в одной и тон же словоизменительной морфеме. Так, -um латинских прилагательных мужского рода винительного падежа единственного числа имеет два согласуемых признака - род и число - и один чисто словоизменительный - падеж. В подобных случаях наша методика заключается в том, что одну и ту же морфему мы считаем обычно несколько раз, т. е. столько, сколько в ней дифференциальных признаков. Другая трудность возникает в связи с порядком следования элементов. Порядок, по-видимому, всегда имеет известное значение для установления связи между элементами даже там, где существует словоизменение. Мы связываем винительный падеж с ближайшим глаголом даже при наличии нефиксированного порядка слов. Порядок может быть фиксированным даже тогда, когда в наличии имеются и другие средства, указывающие на то, какие слова входят в конструкцию. В целом это, например, справедливо в отношении немецкого языка. Значимый порядок придется ограничить такими случаями, при которых изменение порядка элементов вызывает изменение значения конструкции. Использованный здесь критерий ближе всего к этому последнему, но более легко применим. Отсутствие словоизменительной морфемы в том или ином слове принималось за указание на то, что связь осуществлялась при помощи порядка. Если назвать каждый случай использования того или иного принципа указания отношений между словами в предложении нексусом (nexus), то можно вычислить три индекса - О/N, Pi/N и Co/N, где О - порядок (order), Pi - чистое словоизменение (pure inflection), Co - согласование (concord) и N - нексус.
Таким образом, в общей сложности были охарактеризованы следующие типологические индексы:

1) M/W - индекс синтеза
2) A/J - индекс агглютинации
3) R/W - индекс словосложения
4) D/W - индекс деривации
5) I/W - индекс преобладающего словоизменения
6) P/W - индекс префиксации
7) S/W - индекс суффиксации
8) О/N - индекс изоляции
9) Pi/N - индекс словоизменения в чистом виде
10) Co/N - индекс согласования

Ценность данных индексов заключается в том, что мы можем определить использованные величины последовательно и таким образом, что они окажутся применимыми ко всем языкам. В действительности почти все величины, употребленные в приведенных выше формулах, допускают несколько определений. Предпочтение, оказанное здесь тем или иным определениям, обусловлено конкретными задачами исследования. Мы всегда задаем вопрос, что же, собственно, мы хотим измерить. С этой точки зрения в некоторых случаях, как представляется, нет достаточных оснований для предпочтения того или иного определения, и выбор производится совершенно произвольно, поскольку к какому-то решению волей-неволей нужно было прийти. Известным утешением является то, что теоретически широкий диапазон возможных определений для некоторых величин оказывает влияние на решение только сравнительно небольшой части трудных случаев. В качестве доказательства приведем результаты индексов, вычисленных для отрывка из 100 слов на английском языке в 1951 г. при помощи методов, которые уже невозможно ретроспективно полностью восстановить, и сравним их с индексами для отрывка из 100 слов, полученными недавно в соответствии с методами, охарактеризованными здесь.

1951 1953
Синтез 1,62 1,68
Агглютинация 0,31 0,30
Словосложение 1,03 1,00
Префиксация 1,00 1,04
Суффиксация 0,50 0,64
Преобладающее словоизменение 0,64 0,53

Следует подчеркнуть, что в равной степени возможны, а для других целей, например для создания грамматики того или иного языка, вероятно, заслуживают предпочтения другие определения единиц, чем те, которые были выбраны здесь.

В нижеследующем разделе обсуждаются основные проблемы, которые возникают при определении единиц, использованных в индексах. Они касаются морфы, морфемы, агглютинирующих конструкций и разграничения корня, деривационных и словоизменительных морфем и слова. Мы не пытаемся здесь дать ничего приближающегося к исчерпывающему изложению этих проблем. Цель настоящего обсуждения - наметить главные проблемы, возникшие в данном исследовании, и указать основания для решений, принятых в каждом конкретном случае.
Основной для индекса синтеза, так же как для большинства других, является возможность сегментирования любого высказывания языка на определенное число значимых последовательностей, которые уже нельзя подвергнуть дальнейшему членению. Такая единица называется морфой. Существуют вполне очевидные деления, которые полностью оправданы и которые может произвести любой исследователь. Например, каждый разделил бы английское eating "принятие пищи" на eat-ing и сказал бы, что оно состоит из двух единиц. Существуют и другие членения, столь же явно неоправданные. Например, анализ chair "стул" на ch- "деревянный предмет" и -air "нечто для сидения" был бы всеми, безусловно, отвергнут. Имеются, однако, промежуточные неясные случаи, относительно которых мнения расходятся. Следует ли, например, разлагать английское deceive "обманывать" на de- и -ceive? Именно такие неясные случаи нам и нужно научиться анализировать. Начнем с ряда форм, которые мы в дальнейшем будем называть квадратом (square) Квадрат существует тогда, когда в языке имеется четыре значимые последовательности, принимающие форму АС, ВС, AD, BD. Примером в английском языке может служить eating "принятие пищи": sleeping "процесс сна":: eats "ест": sleeps "спит", где А = eat-, B = sleep-, C = -ing и D - это -s [2]. В тех случаях, когда квадрат существует с соответствующим варьированием значения, мы вправе сегментировать все последовательности, из которых он состоит. После того как квадрат расчленен, каждый из его сегментов следует подвергнуть анализу, чтобы выяснить, не является ли он также членом квадрата. Если да, тогда он в свою очередь будет разделен на две морфы. Если же этого сделать нельзя, значит, мы достигли предела анализа и дальнейшее членение невозможно. Во избежание возникновения таких квадратов, как hammer "молоток": ham "ветчина":: badger "барсук": badge "значок, медаль", прибегают к проверке соответствия в значении. Квадрат, отвечающий описанным условиям, всегда даст нам возможность правильного и в общем приемлемого анализа. Однако он слишком ограничен в том смысле, что исключает некоторые членения, которые могли бы быть приняты всеми. Прежде всего необходимо несколько расширить понятие морфы. Последовательность, которая встречается с каким-либо членом квадрата, выделяется как морфа также и в других случаях, если по отношению к этому члену (а) последовательность фонем является тождественной (за исключением автоматических изменений, о которых см. ниже) и (б) если значение ее одинаково. На этом основании мы признаем членение huckleberry "черника" на huckle+berry, поскольку berry "ягода" само является в других случаях морфой. Отсюда и huckle- также оказывается морфой, хотя оно никогда не встречается в составе квадрата. Если бы обнаружилось, что huckle- встречается в каком-нибудь другом сочетании, мы бы выделили его и там и, следовательно, добавили бы еще одну новую морфу. Этот процесс продолжается до тех пор, пока мы не подойдем к последовательности, которая не повторяется больше ни в каком сочетании. В нашем примере такой последовательностью является huckle-.
Границы должны быть расширены и для случаев так называемого неполного квадрата, недостаточного с формальной точки зрения. Было бы очень желательно выделить в men "люди" две морфы, одну со значением "человек", а другую - "множественное число", но нет такого квадрата, в который его можно было бы включить. Так, квадрат man "человек": men "люди":: boy "мальчик": boys "мальчики" формально недостаточен. Мы формулируем следующее правило: если можно найти квадрат, подобный только что приведенному, в котором boy: boys само является парой другого правильного или полного квадрата, например boy : boys:: lad "парень": lads "парни", и если boy всегда можно заменить man, a boys - men и получить нормальное с грамматической точки зрения (хотя и семантически невероятное) предложение, тогда man : men можно подвергнуть сегментации, аналогичной сегментации boy : boys, и men можно рассматривать как две морфы. В случае sheep "овца": sheep "овцы":: goat "коза": goats "козы" мы признаем в sheep "овцы" две морфы, одна из которых является нулевой. Подобный анализ не следует смешивать с членением на две или более семантические категории, где для субституции не существует обоснованного квадрата. В латыни, например, мы не можем разложить -us "именительный падеж единственного числа" на две морфемы - именительный падеж и единственное число. Квадрат -us : -o :: -i : -is - "им. п. ед. ч.: дат. п. ед. ч.:: им. п. мн. ч.: дат. п. мн. ч." - не имеет пары, которой можно было бы заменить члены формально полноценного квадрата, и, следовательно, сегментация этих форм неосуществима. Подобно тому как существуют формально неполноценные квадраты, существуют также квадраты неполноценные семантически. В них, если возможно параллельное неавтоматическое варьирование, членение допускается даже несмотря на то, что морфам нельзя приписать определенных значений. Так, в английском языке ряды deceive "обманывать": receive "принимать":: decep-tion "обман": recep-tion "прием":: decei-t "обман": recei(p)t "получение, расписка" оправдывают сегментацию de+ceive и re+ceive. Данное правило позволяет обычно выделить морфы для производных форм глагола в семитских языках. Без этого правила, ввиду многообразия значений в подобных примерах, трудно было бы работать.
Существуют и другие пути расширения понятия морфы, которые, однако, здесь отвергаются как несоответствующие задачам настоящего исследования, хотя и полностью приемлемые для других целей. Не принимаются, например, прерывающиеся морфы, сегменты которых содержатся в двух различных словах. Это понятно, поскольку мы хотим вычислить отношение морфем к словам и, следовательно, хотим, чтобы каждое слово содержало определенное число морфем, ограниченных пределами самого слова. Подобным же образом мы не рассматриваем в качестве морф значимые единицы, сопровождающие грамматические отрезки более длинные, чем слово, например интонационные модели предложения. Причины этого также ясны. Мы хотим, чтобы морфемы были частями слов, а они не могут быть таковыми, если они появляются одновременно с целой последовательностью слов. В этой связи следует заметить, что ни индекс синтеза, ни какой-либо иной индекс, используемый в настоящем исследовании, не является мерилом сложности того или иного языка в целом. Не включаются в число морф также интонационные модели и некоторые другие явления, усложняющие функционирование языка.
Следующий шаг, который нужно сделать после отождествления морф, - это установление более сложных единиц - морфем - с морфами в качестве их членов. Именно данная сторона проблемы как составляющая основное содержание морфемного анализа получила наиболее полное освещение в трудах Хэрриса, Хокетта, Блока, Найды и др. В целом принципы, выдвинутые Найдой (1948, стр. 414-441), являются вполне обоснованными и достаточными. Они включают общепринятые критерии сходства значения (здесь этот критерий применяется очень строго) и дополнительной дистрибуции, а также следующее правило: если мы хотим подвести под одну и ту же морфемную единицу морфы, различные по своей фонематической форме, нужно иметь по крайней мере одну неварьирующую единицу со столь же широкой дистрибуцией.
По этому вопросу, однако, по причинам, которые будут раскрыты в дальнейшем, нецелесообразно принимать дополнения, рекомендуемые Найдой в соответствии с его правилом о том, что "дополнительная дистрибуция в тактически различных окружениях является основой для объединения различных форм в одну морфему только при условии, если какая-то другая морфема, принадлежащая к тому же дистрибуционному классу и имеющая либо одну-единственную фонематическую форму, либо фонологически определяемые альтернирующие формы, встречается во всех тех тактически различных окружениях, где мы находим данные формы" (стр. 421). Например, в арабском языке существуют местоименные суффиксы, обозначающие принадлежность, когда они присоединяются к существительному, и другой ряд суффиксов, указывающих на глагольное дополнение, когда они присоединяются к глаголу. Эти окружения тактически различны, то есть глагол, как правило, не может быть заменен существительным, и наоборот. Наличие -ka со значением "второе лицо мужского рода единственного числа" и Других фонематически тождественных форм в обоих рядах должно было бы, согласно правилу Найды, позволить нам объединить морфы первого лица единственного числа -i и -уа (притяжательность у существительного) и -in (глагольный объект) как морфы, составляющие одну и ту же морфему. Эта альтернация, разумеется, нерегулярна, и если бы мы согласились с указанной точкой зрения, то, вычисляя наш индекс агглютинации, мы должны были бы считать любую конструкцию, включающую одну из форм суффикса 1-го лица единственного числа, неправильной или неагглютинативной. Таким образом, мы поставили бы арабский язык в невыгодное положение, и только из-за того, что данные формы характеризуются известной степенью регулярности. В языке с двумя совершенно различными рядами местоимений в подобных употреблениях, согласно правилу Найды, нельзя было бы обнаружить указанного ограничения; следовательно, не существовало бы нерегулярных альтернаций такого происхождения, хотя с точки зрения здравого смысла мы должны были бы назвать подобную ситуацию еще более нерегулярной. Поэтому только члены одного и того же структурного ряда, то есть те, которые могут заменять друг друга в одинаковом тактическом окружении, рассматриваются здесь как возможные альтернанты одной и той же морфемы.
Если нам даны некоторые морфы как альтернанты одних и тех же основных морфемных единиц, мы можем определить агглютинативную конструкцию. Для традиционного понимания термина "агглютинация" характерно, по-видимому, то, что основной ее чертой считается морфологическая регулярность. Однако в термин "регулярность" вкладывалось самое различное содержание. В работах Блумфилда, Уэллза и других обычно различаются разные типы и степени регулярности и нерегулярности. В данной статье мы придерживаемся определения регулярности, наиболее близкого к тому, которое в настоящее время распространено в работах по проблемам типологии. Согласно нашему определению, понятие регулярности подразумевает, что все фонематически варьирующиеся формы морф можно произвести от нефиктивной (то есть реально встречающейся) основной формы с помощью правил сочетаемости (rules of combination), сохраняющих силу для всех сходных комбинаций в языке. Обычно это является автоматической альтернацией (случай, когда морфема являет собой один морф, то есть когда она представляет собой одну и ту же фонематическую последовательность во всех своих употреблениях, является частным случаем, который тоже, конечно, рассматривается как случай автоматического альтернирования. Иногда сам выбор одной формы в качестве основной уже ведет к автоматичности, то есть позволяет предсказать производные формы, исходя из основной, в то время как выбор другой формы такой возможности не дает. В сомнительных случаях за основные принимаются те формы, которые дают наибольшую степень автоматизма при исчерпывающем описании языка. Разумеется, это нельзя считать точным правилом, но на практике никаких особых трудностей в этом плане не возникает.
Мы называем автоматичной всю морфему в целом тогда, когда каждая из ее морф находится в автоматической альтернации со всеми другими ее морфами. Часто морфы можно сгруппировать в субальтернирующие ряды. Для них одной автоматической альтернации уже недостаточно. Морфема множественного числа в английском языке имеет статистически наиболее часто встречающийся ряд морф -s, -z, -еz, которые находятся в автоматической альтернации между собой. Существуют, однако, и другие альтернанты, а именно -en, -нуль и т. п., которые в целом не находятся в отношениях автоматической альтернации с -s, -z, -ez. Таким образом, английская морфема множественного числа не является автоматической.
Возможность исчисления индексов словосложения, деривации и словоизменения зависит от нашего умения различать корневые, деривационные и словоизменительные морфемы. Из них, пожалуй, класс корневых морфем поддается определению труднее всего, но выделить его легче чем другие классы. Этим мы хотим сказать, что на практике существует полное единодушие относительно того, какие морфемы считать корневыми. Корневые морфемы в слове характеризуются конкретностью значения и входят в обширные и легко увеличивающиеся ряды. В этом смысле корневым морфемам наиболее четко противостоят морфемы словоизменительные, число которых обычно весьма невелико, а значения абстрактны и выражают отношения. Все согласились бы, видимо, также и с тем, что каждое слово должно включать по крайней мере одну корневою морфему.
В отличие от корней, деривационные и словоизменительные морфемы встречаются не всегда; существуют, например, языки - так называемые корневые или изолирующие, - в которых деривационные и словоизменительные морфемы встречаются редко или вообще не встречаются. Деривационные морфемы можно определить как морфемы, которые, вступая в конструкцию с корневыми морфемами, образуют последовательность, которая всегда может быть заменена каким-то определенным классом отдельных морфем, не вызывая изменений в этой конструкции. Если такой класс отдельных морфем, для которых деривационная последовательность может быть заместителем, включает одну из морфем самой деривационной последовательности, то мы называем подобную последовательность эндоцетрической; если же нет, последовательность является экзоцентрической.
Так, например, duckling "утенок" в английском языке - это деривационная последовательность, потому что ее всюду можно заменить посредством goose "гусь", turkey "индюк" и т. д. без изменения значения конструкции. Поскольку duck включается в такой класс отдельных морфем, которые могут быть заменены duckling, -ling является здесь эндоцентрической деривационной морфемой. Singer "певец" - это экзоцентрическая последовательность, ибо тот класс единых морфемных последовательностей, для которого заместителем может быть singer, состоит из одних только одноморфемных существительных и не включает глагола sing "петь".Следовательно, -er - это экзоцентрическая деривационная морфема.
Теперь мы можем определить словоизменительную морфему просто как некорневую, недеривационную морфему. Получившиеся три класса морфем охватывают все виды морфем в языке и являются взаимоисключающими. Подобно деривационным морфемам, словоизменительные морфемы также в принципе вовсе не обязательны для каждого конкретного языка в отдельности. Однако если они представляют собой часть модели слова, их появление в надлежащем месте столь же обязательно, как и наличие корня. Один из членов этого класса часто является нулевым. В подобных случаях отсутствие материально выраженной фонематической последовательности является значимым так как слово в этой нулевой форме определенным образом ситуативно oграничено в своем употреблении; так обстоит дело с именительным падежом единственного числа в турецком языке или единственным числом существительных в английском языке.
Теперь мы подходим к тому, что в известном смысле представляет собой наиболее трудную проблему, а именно к определению слова как особой единицы языка. Нет сомнения, что это имеет важнейшее значение для целей настоящего исследования, ибо все рассматриваемые здесь индексы так или иначе связаны с вычислением количества слов В большинстве случаев это вполне очевидно; в других молчаливо подразумевается, как, например, для индекса агглютинации, в котором число морфемных швов всегда на единицу меньше количества слов. В настоящее время единого общепринятого определения слова не существует. Некоторые вообще отрицают значение слова как особой языковой единицы. Другие признают важное значение слова, но отрицают необходимость учитывать слово при описании конкретных языков. Третьи утверждают, что определить слово можно только для каждого языка в отдельности, ad hoc. Одни определяют слово с позиций фонологии, другие - с точки зрения морфологии. На практике, однако, слово продолжает оставаться ключевой единицей в большинстве существующих описаний языков. Из двух основных типов общих определений слова - фонологического и морфологического - первое, и это совершенно ясно, для целей настоящего исследования не подходит. Определяя слово фонологически, мы исходим из какого-либо одного фонологического признака или из сочетания отличительных признаков, служащих особыми указателями. Таковыми обычно являются ударение или пограничные модификации фонем, то есть явления стыка. Однако помимо того факта, что использование фонологических признаков для определения слова ведет к выделению отдельных единиц, которые по ряду других причин нежелательно было бы причислять к словам, во многих языках подобные явления вообще отсутствуют, поэтому на основе фонологического анализа универсального определения слова создать нельзя. Отправная точка других определений слова - морфологическая, так как они исходят из дистрибуции значащих элементов. Из определений этого рода определение слова Блумфилдом как минимальной свободной формы следует признать наиболее удовлетворительным, поскольку оно универсально по своему применению и правильно указывает на наличие или отсутствие свободы (или связанности) как на основной критерий слова. Однако применение этого критерия, то есть проверка возможности изолированного употребления, на практике затруднительно и иногда приводит к неожиданным результатам; так, если исходить из определения Блумфилда, артикль the в английском языке нельзя было бы признать отдельным словом.
Метод, которым мы пользовались в настоящем исследовании, может быть описан лишь в самых общих чертах. Он дал удовлетворительные (для поставленных здесь задач) результаты в тех относительно немногочисленных сомнительных случаях, которые были связаны с выяснением наличия или отсутствия границ слова в изучаемых языках. Вместо того чтобы задаваться вопросом, свободна или связанна та или иная минимальная форма вообще, как это обычно делается, в настоящем исследовании мы исходим из морф в конкретных контекстах. Это позволяет нам, например в латинском языке, считать ab "от" свободной формой в качестве предлога, но связанной формой в качестве глагольного префикса в abduco "я увожу". Свобода или связанность формы характеризуется не морфой как таковой, а контекстуально определяемым классом взаимозаменимых морф. Такой класс называется здесь классом взаимозаменимых морф (КВМ; morph substitution class - MSC). Мы расширяем это понятие, включая в него и последовательность классов взаимозаменяемых морфем, которые во всех случаях могут быть заменены каким-либо определенным классом взаимозаменимых морф, ни один из членов которого не идентичен его членам [3]. Для того чтобы охватить и индивидуальные классы взаимозаменимых морф и заменяющие их последовательности, удобно использовать термин ядро (nucleus). Разбив указанным способом высказывание на отдельные ядра, необходимо далее выяснить, является ли каждая граница между ядрами одновременно и границей между словами или нет. Граница ядра является границей слова, если в данном случае возможно вклинивание последовательности ядер любой длины. Если же граница является внутрисловной, то либо вклинивание ядер невозможно вообще, либо максимальное количество вставляемых ядер строго ограниченно. Так, например, в английском предложении The farmer killed the ugly duckling "Фермер убил уродливого утенка" девять морфем: 1) the 2) farm 3) er 4) kill 5) ed 6) the 7) ugly 8) duck 9) ling; семь ядер: 1) the 2) farmer 3) kill 4) ed 5) the 6) ugly 7) duckling и шесть слов: 1) the 2) farmer 3) killed 4) the 5) ugly 6) duckling. Граница kill-ed является внутрисловной, так как включение ядра здесь невозможно.
С другой стороны, на границе между farmer и killed ограничения максимального количества ядер, которые могут быть здесь включены нет. Мы можем говорить о farmer who killed the man who killed the man who... killed the ugly duckling, то есть о "фермере, который убил человека, который убил человека, который... убил уродливого утенка". Расхождение с фонологическим словом в некоторых случаях только кажущееся. Так, в латинском языке энклитическая частица -que "и", которая считается слогом, относящимся к любой предшествующей последовательности, и определяет место ударения, служащего фонологическим признаком слова, согласно нашему тексту является также частью слова. Dominus "хозяин" и dominus в dominusque "и хозяин" не являются членами одного КВМ, так как они не взаимозаменяемы. Dominus- относится к тому же классу ядер, что и legatus-, puer-, и этот класс зависит от класса последующих -que, -ve, поскольку они обязательно следуют за ним и, таким образом, принадлежат тому же слову. Даже односложные образования, где сдвига ударения не происходит (ср. mus "мышь" и mus в mus-que "и мышь"), являются членами разных ядер, поскольку первое может быть заменено только dominus, puer и т. д., а последнее -только классом dominus-, puer-.
В таблице 1 приведены вычисленные индексы. Были взяты главным образом тe языки, которые чаще всего упоминаются в качестве примеров определенных языковых типов в существующей литературе по типологии. Выбор языков ограничен также моими собственными познаниями в области отдельных языков. В качестве примера агглютинативного языка вместо турецкого языка мною был выбран родственный ему якутский язык, поскольку обширные заимствования из арабского в османском турецком языке привели к нарушениям гармонии гласных и осложнениям в других областях в такой степени, что турецкий язык перестал быть типичным. Чтобы проиллюстрировать изменения в типе языка, происшедшие за длительный период, были выбраны два древних индоевропейских языка - англосаксонский и санскрит, а также два современных языка тех же групп - германской и индоиранской - современный английский и персидский. Вьетнамский язык был взят в качестве представителя корнеизолирующего типа языков, эскимосский - в качестве полисинтетического, а суахили - один из языков банту - в качестве агглютинирующего языка, использующего согласование [4] (см. прилагаемую таблицу).

Санскрит Англо-сакс. Персид-ский Англий-ский Якутский Суахили Вьетнам-ский Эскимос-ский
Синтез 2,59 2,12 1,52 1,68 2,17 2,55 1,06 3,72
Агглютинация 0,09 0,11 0,34 0,30 0,51 0,67 ... 0,03
Словосложение 1,13 1,00 1,03 1,00 1,02 1,00 1,07 1,00
Деривация 0,62 0,20 0,10 0,15 0,35 0,07 0,00 1,25
Преобладающее словоизменение 0,84 0,90 0,39 0,53 0,82 0,80 0,00 1,75
Префиксация 0,16 0,06 0,01 0,04 0,00 1,16 0,00 0,00
Суффиксация 1,18 1,03 0,49 0,64 1,15 0,41 0,00 2,72
Изоляция 0,16 0,15 0,52 0,75 0,29 0,40 1,00 0,02
Собственно словоизменение 0,46 0,47 0,29 0,14 0,59 0,19 0,00 0,46
Согласование 0,38 0,38 0,19 0,11 0,12 0,41 0,00 0,38

На основе подсчетов, подобных приведенным выше, в качестве следующего шага после уточнения кривой частотности дистрибуции соответствующих явлений можно было бы дать определение таким терминам, как аналитический, синтетический, агглютинирующий, префигирующий и т. п. Поскольку здесь представлено слишком мало языков, эту задачу осуществить невозможно. Тем не менее даже беглое ознакомление с приведенными здесь индексами показывает, что если мы определим аналитический язык как язык с индексом синтеза в 1,00-1,99, синтетический - в 2,00-2,99, а полисинтетический - в 3,00, то результаты будут соответствовать обычным представлениям, не связанным с какими-либо статистическими подсчетами. Подобным же образом мы могли бы назвать агглютинативным такой язык, где индекс агглютинации превышает 0,50 и т. д.
Результаты, полученные в настоящем исследовании, необходимо также подкрепить дальнейшими подсчетами, поскольку они были выведены для отдельных отрывков по 100 слов в каждом; помимо этого, следовало бы указать возможный процент ошибок. Можно было бы вполне допустить существование различий, обусловленных различиями в стиле выбранных отрывков. Индекс синтетичности поэтому был вычислен для целого ряда разных по стилю отрывков из английского и немецкого языков, однако были достигнуты удивительно близкие результаты.

Английский язык:
"Ladies' Home Journal", January 1950, стр. 55 - 1,62
R. Lintоn. Study of man, стр. 271 - 1,65
О. J. Карlan, Mental disorders in later life, стр. 373 - 1,60.

Немецкий язык:
Baumann, Nama Folk-tale - 1,90
Ratsеl, Anthropogeographie, стр. 447 - 1,92
Сassirеr, Philosophie der symbolischen formen, стр. 1 - 2,11.

Разумеется, это не заменяет статистических данных. Другая проблема, которую можно изучить с помощью предложенного нами метода, - это общее направление исторических изменений в языке за длительный период времени. Совпадения, наблюдаемые в санскрите и англосаксонском языках, с одной стороны, и персидском и английском - с другой, поразительны: направление изменений при переходе от более древнего языка к современному буквально для каждого индекса одно и то же. Быть может, при выборе более консервативных индоевропейских языков, например славянских, результаты были бы иными.
Настоящая работа должна рассматриваться исключительно как предварительный набросок Некоторые из индексов, возможно, придется исключить или заменить другими. В последующих работах вероятно, будут пересмотрены также некоторые конкретные определения. Вместе с тем я полагаю, что общий метод вычисления индексов, основанных на существующих в тексте отношениях между строго определенными лингвистическими элементами, представляет известный интерес для типологических исследований.

--------------------------------------------------------------------------------

Примечания

1. Аналогичный в своей основе метод был предложен в неопубликованном докладе Чарльза Хокетта, прочитанном им на ежегодном заседании Лингвистического общества Америки в 1949 г. в Филадельфии, и в моем выступлении на заседании Нью-Йоркского Лингвистического кружка в Колумбийском университете в январе 1950 г.

2. Один из четырех элементов может быть нулевым при условии, если последовательности, в которых он встречается, представляют собой свободные формы, то есть встречаются в изоляции. Так, hand "рука": hands "руки":: table "стол": tables "столы" - это правильныи квадрат, и котором A hand, В table, C нуль и D -s.

3. Это необходимо для того, чтобы исключить эндоцентрические словосочетания, где последовательность слов всегда может быть замещена главным, или основным, членом. Последовательность прилагательных, за которой следует одноморфное существительное, составляла бы ядро, если бы не зависимость, существующая между ее членами. Прилагательные в английском языке не совпадают с существительными, например, потому, что они встречаются также в предикативных адъективных конструкциях. В отношении понятии класса взаимозаменимых морф и деривационной последовательности я в значительной мере обязан работам 3. Хэрриса и Р. Уэллза. Особенно близки эти понятия к понятию фокусного класса Р. Уэллза.

4. Для каждого языка были выбраны следующие отрывки текста длиной в 100 слов: для санскрита ("Hitopadesa", ed. M. Mueller, стр. 5) - varamekas (и т. д.); для англосаксонского (J. W. Bright. An Anglo-Saxon Reader, New York, 1917, стр. 5) - gelamp gio (и т. д.); для персидского (Pizzi, I, "Chrestomathie Persane", Turin, 1889. стр. 107) - ruzi Ibrahimi (и т. д.); для английского ("New Yorker", Dec. 13, 1952, стр. 29) - Anyone т. д.); для якутского ("Ueber die Sprache der Yakuten", St. Petersburg, 1851, стр. 29) - min bayasa (и т. д.); для суахили (С. Sасlеux, Grammaire Swahilie, Paris, 1909, стр. 321) - Iiyana mmoja (и т. д.); для вьетнамского (M. В. Еmenеаu, Studies in Vietnamese (Annamese) Grammar, Los Angeles, 1951, стр. 226) - mot horn; для эскимосского (W. Thalbitzer "Handbook of American Indian Languages", Pt. 1, ed. F. Boas, Wash., 1911, стр. 1066) - kaasawruuruaq (и т. д.) (в фонематической транскрипции).

Опубликовано 19 января 2005 года

Главное изображение:

Полная версия публикации №1106126506 + комментарии, рецензии →

LIBRARY.BY → ЛИНГВИСТИКА → КВАНТИТАТИВНЫЙ ПОДХОД К МОРФОЛОГИЧЕСКОЙ ТИПОЛОГИИ ЯЗЫКОВ

При перепечатке индексируемая активная ссылка на LIBRARY.BY обязательна!