Історія застосування математичних методів у лінгвістиці. Перспективи застосування математичних методів у лінгвістиці

Проникнення у лінгвістику математичних методівта «математичного духу» сприяло розвитку лінгвістики у бік точності та об'єктивності. Однак на шляху її подальшого розвиткуу цьому напрямі стоять серйозні перешкоди. Автор розмірковує про причини зближення лінгвістики та математики, про межі застосування в лінгвістиці математичних методів та про природу факторів, що перешкоджають взаєморозумінню математиків та лінгвістів.

Коли в другій половині 50-х років деякі молоді лінгвісти задумалися про застосування математичних методів для дослідження структури мови і почали співпрацювати з математиками, це викликало в багатьох їх колег здивування і навіть шок - адже вони з дитинства були переконані, що гуманітарні науки, Однією з яких є лінгвістика, з математикою та іншими «точними» науками не мають і не можуть мати нічого спільного.

Тим часом наявність тісного зв'язку між природною мовою та математикою зовсім не було на той час новим відкриттям. Л. С. Виготський писав в опублікованій в 1934 році книзі «Мислення і мова»: «Першим, хто побачив у математиці мислення, що походить з мови, але долає його, був, мабуть, Декарт» і продовжував: «Наш звичайний розмовна мовачерез властиві йому коливань і невідповідностей граматичного та психологічного перебуває у стані рухомої рівноваги між ідеалами математичної та фантастичної гармонії та в безперервному русі, який ми називаємо еволюцією».

Виникло в Стародавню Греціювчення про граматичні категорії вже являло собою опис низки найважливіших аспектів будови мови за допомогою абстрактних моделей, близьких за стилем до тих моделей, які були створені давньогрецькими математиками для опису просторових форм; лише звичність таких понять, як відмінок, рід тощо., стали, як писав Х. Штейнталь, «нашою другою натурою», заважає зрозуміти, якого високого рівня абстрактного мислення зажадало їх створення. Так що дивуватися варто було б швидше тому, Що перші спроби використовувати для опису мовного «ідеалу математичної гармонії» справжні математичні засоби були зроблені лише в середині ХХ століття.

Можна вказати дві причини такого запізнення. По-перше, наука про мову після значних кроків, зроблених у античну епоху, знову почала по-справжньому розвиватися тільки в XIX столітті, але протягом усього цього століття головна увага лінгвістів була звернена на історію мови, і лише в наступному столітті, яка взагалі була для гуманітарних наук століттям структуралізму, лінгвістика вперше після античного періоду звернулася до вивчення мовних структур, але на новому рівні. Коли лінгвісти усвідомили, що мова є, кажучи словами Ф. де Соссюра, «систему чистих відносин», тобто систему знаків, фізична природа яких несуттєва, а істотні тільки відносини між ними, стала цілком очевидна паралель між мовою та математичними конструкціями , які теж є «системами чистих відносин», і вже на початку ХХ століття той самий де Соссюр мріяв про вивчення мови математичними засобами.

По-друге, в математиці на початку Нового часу вийшли на перший план кількісні методи, і тільки в XIX столітті математики знову почали будувати абстрактні кількісні моделі, що відрізнялися від античних. високим рівнемабстракції, а також – що для нашої теми особливо важливо – тим, що вони могли використовуватися для опису значно ширшого кола явищ, ніж просторові форми; нерідко такі моделі виявлялися зручними і навіть необхідним засобомвивчення явищ, про які будували їх математики зовсім не думали і навіть не знали про їх існування. Серед цих моделей були й ті, які згодом отримали застосування у лінгвістиці; особливо інтенсивний розвиток математичних дисциплін, змістом яких була їхня побудова, припала на першу половину ХХ століття. Тому зустріч математики та лінгвістики в середині цього століття була цілком закономірною.

Одним із результатів цієї зустрічі було виникнення нової математичної дисциплін – математичної лінгвістики, предметом якої є розробка математичного апарату для лінгвістичних досліджень. Центральне місце в математичній лінгвістиці займає теорія формальних граматик, за характером використовуваного в ній апарату споріднена з математичною логікою і особливо теорії алгоритмів. Вона доставляє формальні методи опису правильних мовних одиниць різних рівнів, і навіть, що особливо важливо, формальні методи описи перетворень мовних одиниць - як у одному рівні, і міжрівневих. До теорії формальних граматик примикає теорія синтаксичних структур, значно простіша щодо апарату, але не менш важлива для лінгвістичних додатків. У математичній лінгвістиці розробляються також аналітичні моделі мови, в яких на основі тих чи інших - вважаються відомими - даних про «правильні тексти» виробляються формальні побудови, результатом яких є опис якихось « складових частинмеханізму мови. На цьому шляху можна отримати формальний опис традиційних граматичних понять. Сюди слід віднести опис сенсу пропозиції з допомогою апарату інтенсіональної логіки («семантику Монтегю»).

Зрозуміло, за допомогою математичного апарату можна описати лише один із двох ідеалів мови, про які говорив Виготський; тому часто заперечення проти використання тієї чи іншої математичної моделі (або математичних моделей взагалі) на тій підставі, що такі-то й такі-то окремі випадки вона не охоплює, не мають сенсу: для опису властивих мові «коливань і невідповідностей» потрібні зовсім інші, не математичні засоби, і саме чіткий опис «математичного ідеалу» міг би допомогти їх знаходити, оскільки він дозволив би чітко відмежовувати у мові «фантастичне» від «математичного». Але це поки що справа майбутнього.

Не менше, а може бути й більшого значення, ніж виникнення математичної лінгвістики, мало безпосереднє проникнення в лінгвістику фундаментальних математичних ідей та понять - таких, як безліч, функція, ізоморфізм. У сучасній лінгвістичній семантиці важливу роль відіграють поняття предикату і квантора, що прийшли з математичної логіки. (Перше з них виникло в логіці ще тоді, коли вона не відмежовувалась від лінгвістики, і тепер повернулося в лінгвістику в узагальненому та математично обробленому вигляді.)

І, нарешті, дуже велике значеннямає уточнення мови лінгвістичних досліджень, що відбувається завдяки проникненню в лінгвістику «математичного духу» не тільки в тих її сферах, де можливе використання математичних ідей та методів. Усе це можна коротко резюмувати так: лінгвістика стає дедалі точнішою і об'єктивнішою наукою - не перестаючи, звісно ж, бути наукою гуманітарною.

Однак на цьому природному шляхуРозвитку лінгвістики стоять серйозні перешкоди, які можуть його надовго загальмувати. Головне з них - поділ факультетів, що виник на початку Нового часу: природодослідники та математики з одного боку і гуманітарні вчені з іншого не цікавляться роботою колег "на іншому факультеті" і, більше того, - в глибині душі, а нерідко і відкрито зневажають їх . Математики та природодослідники (і ще більше «технарі») схильні бачити в гуманітарних дослідженнях лише якусь «прикрасу» або навіть «порожню балаканину», а «гуманітарії» готові терпіти математику та природничі науки лише заради практичної користі та переконані, що вони нічим не можуть допомогти розуміння природи людського духу.

Тільки в середині XIX століттяу цій, кажучи словами великого біолога і великого мислителя Конрада Лоренца, «шкідливій стіні між природничими та гуманітарними науками (die böse Mauer zwischen Natur-und Geistwissenschaften)» була пробита перша пролом у найтоншому місці, що відокремлювало логіку від математики. У ХХ столітті з'явилися й інші проломи - серед них і та, яку пробили з двох сторін математики та лінгвісти, - але їх все ще мало, стіна міцна досі, і немає браку зусиль з обох боків зміцнювати її далі і латати пробоїни. Нерідко ці зусилля бувають досить успішними; останнє «досягнення» у цьому напрямі – «профільна освіта» в середній школі, що вже в дитинстві розділяє здатних і цікавляться людей на «факультети» і привчає їх пишатися невіглаством в «чужих» науках - може дуже перешкодити подальшому зближенню природничих і гуманітарних наук, настійно необхідного для нормального розвитку тих та інших. Один із наслідків спорудження стіни полягає в тому, що «гуманітарії», включаючи переважну більшість лінгвістів, нічого не знають навіть про ази тих розділів математики, які мають найбільше значеннядля гуманітарних наук (і уявляють собі математика як людину, зайняту виключно обчисленнями).

Інша перешкода - характерна для нинішнього стану науки шалена гонка, безперервна погоня за все новими і новими «результатами», що звужує кругозір і не залишає часу задуматися над глибшими проблемами або зайнятися серйозним вивченням суміжної і тим не зовсім суміжної наукової дисципліни. Це стосується однаково до лінгвістів і математиків - як, втім, і всіх, хто професійно займається наукою.

І третє - інертність, або, простіше кажучи, ліньки. На перший погляд ліньки і шалена гонка несумісні, але насправді вони чудово уживаються між собою і, більше того, підтримують та стимулюють один одного. Коли людині ліньки взятися за важку справу, він хапається за легше і «надійніше», успіхи в якому виправдовують і заохочують його інертність. Зарозуміле ставлення до « меншим братам», що копошаться по інший бік стіни, також заохочує лінощі і заохочується нею. Коли, наприклад, математик пропонує переглянути всі уявлення про давньої історії, не давши собі труднощів хоч трохи познайомитися з давніми мовами, за це дуже значною мірою відповідальна та ж лінь-матінка.

Небезпека для розвитку науки, створювана цими перешкодами, набагато серйозніша, ніж може здатися на перший погляд. Коли невігластво в «чужих» науках стає предметом гордості, це закономірно веде до поверхневості та невігластва також і у «своїх». «Факультетів» давно вже набагато більше двох, число їх зростає рік у рік, і кожен відгороджується стіною від інших; з'являються стіни та всередині факультетів. Кругозір дослідників поступово звужується; щоправда, апарат дослідження стає дедалі тоншим і вишуканим, але у його зору потрапляють майже виключно дрібні предмети, і зміцнюється уявлення, ніби тільки вони і заслуговують на вивчення. Є всі підстави говорити про кризу у науці, і лінгвістика не є винятком. Зараз, на мою думку, саме час озирнутися і задуматися.

Тут зібралися лінгвісти того напряму, який пов'язаний із моделлю «Зміст – Текст». Ця модель, створена в 60-ті роки тепер уже минулого століття, була одним із перших і кращих результатівзустрічі лінгвістики та математики, після якої виросли вже два покоління лінгвістів, які зі студентських років привчилися до точного мислення. Але й вони, на жаль, не вільні від інертності, що заважає їм усвідомити наявність кризи та задуматися про шляхи її подолання. Тим часом серед усіх лінгвістів - і, можливо, навіть серед усіх, хто займається гуманітарними науками - вони мають найбільше об'єктивних можливостей для такого усвідомлення, і хотілося б сподіватися, що вони цими можливостями скористаються.

Текст доповіді люб'язно надано А. В. Гладким та видавництвом

Історія застосування математичних методів у лінгвістиці ЛЕКЦІЯ № 1

план

Становлення
структурної лінгвістики
на рубежі XIX– ХХ століть.
Застосування математичних методів
у лінгвістиці у другій половині ХХ
століття.
Перспективи
застосування
математичних методів у
лінгвістиці.

Фердинанд де Соссюр (1857-1913) мова як система

власне мова langue
мова - parole
мовну діяльність
- langage

І.А. Бодуен де Куртене (1845 – 1929)

«Звуки – «атоми» мовної
системи, що володіють
обмеженою кількістю
легко вимірних властивостей.
Це найзручніший
матеріал для формальних,
суворих методів
описи.»

Структурна лінгвістика –

це сукупність поглядів на мову та
методів його дослідження, в основі
яких лежить розуміння мови як
знакової системи з чітко виділеними
структурними елементами (одиницями
мови, їх класами та ін.) та прагнення до
строгому (наближається до точним
наук) формального опису мови.

Ленінградська
фонологічна школа
(Л.В. Щерба) використовувала як
основного критерію узагальнення звуку в
вигляді фонеми психолінгвістичний
експеримент, заснований на аналізі
мови носіїв мови.
Празький лінгвістичний гурток
(Н.С. Трубецькой) розробив теорію
опозицій – семантична структура
мови була описана ними як набір
оппозитивно побудованих
семантичних одиниць – сем.

Застосування математичних методів у лінгвістиці у другій половині ХХ ст.

Американський
дескриптивізм
(Л. Блумфілд та Е. Сепір). Мова
представлявся дескриптивістам у вигляді
сукупності мовних висловлювань.
Формальна граматика М. Хомського.
Московська
фонологічна школа,
представниками якої були А.А.
Реформатський, В.М. Сидоров, П.С.
Кузнєцов, А.М. Сухотін, Р.І. Аванесів.

системи машинного перекладу

Алгоритм
послідовного перекладу
"слово за словом", "фраза за фразою."
Т-системи (від англійського слова«transfer»
- Перетворення), в яких переклад
здійснювався на рівні синтаксичних
структур.
І-системи (від слова «інтерлінгва») отримання смислового уявлення
вхідної пропозиції шляхом його
семантичного аналізу та синтезу
вхідної пропозиції щодо отриманого
смисловому уявленню.

10. Прокладна лінгвістика

вивчає
не мова у його стані (тобто.
системі), а мова в дії (тобто
спілкуванні);
вирішує конкретне прикладне завдання,
створюючи мовні моделі, і при цьому не
претендує на пояснення фактів мови
(як теоретична лінгвістика);
орієнтована на конкретні підмови
(тобто на вибіркові знання про мову), а не
на всю мову загалом.

11. квантитативна лінгвістика

- міждисциплінарний напрямок
прикладних дослідженнях, в якому в
як основний інструмент вивчення
мови та мови використовуються
кількісні чи статистичні
методи аналізу.

12. комп'ютерна лінгвістика

– розробка методів, технологій та
конкретних систем, що забезпечують
спілкування людини з ЕОМ на природному
або обмеженою природною мовою.

13. комп'ютерна лінгвістика

створення систем обробки природного
мови (наприклад, систем обробки зв'язного
тексту);
розробка інформаційно-пошукових систем
(документальних, тобто у яких зберігаються
тексти, та фактографічних, тобто. в яких
зберігаються факти, подані не тільки в
текстової форми, то й у формі таблиць
формул тощо);
створення гіпертекстових систем (тобто.
безлічі текстів зі зв'язуючими їх
відносинами);
розробка комп'ютерних технологій
складання та експлуатації словників.

14. Дякую за увагу!

15. Доповіді:

Закони
природи та «гуманітарні» закони.
Математична революція у лінгвістиці.
Копенгагенська школа структурної
лінгвістики.
Становлення прикладної лінгвістики як
наукової дисципліни.

16. Практичне заняття:

Опис історії застосування математичних
методів у лінгвістиці від античності до наших
днів.
Вияв тенденцій інтеграції
математичних, лінгвістичних та ін.
історії розвитку науки про мову
Порівняльна характеристика прикладної та
теоретичної лінгвістики (заповніть таблицю
Порівняльна характеристика прикладної та
теоретичної лінгвістики).
Корпусна лінгвістика як розділ прикладний
лінгвістики.
Прикладні аспекти квантитативної лінгвістики.
Комп'ютерна лінгвістика та її інструментарій.

Протягом останнього століття мовознавство завжди наводилося як приклад науки, що розвивалася стрімко та дуже швидко досягла методичної зрілості. Вже в середині минулого століття молода наука впевнено зайняла місце в колі наук, що мали тисячолітню традицію, а один з найвизначніших її представників - А. Шлейхер - мав сміливість думати, що своїми працями він підводить вже підсумкову лінію.<113>Історія лінгвістики, однак, показала, що така думка була надто поспішною і невиправданою. Наприкінці століття мовознавство зазнало першого великого потрясіння, пов'язане з критикою младограматичних принципів, за яким пішли й інші. Слід зазначити, що всі кризи, які ми можемо розкрити в історії науки про мову, як правило, не розхитували її основ, але, навпаки, сприяли зміцненню і зрештою приносили з собою уточнення та вдосконалення методів лінгвістичного дослідження, розширюючи разом із тим самим і наукову проблематику.

Але поруч із мовознавством жили та розвивалися й інші науки, зокрема й багато нових. Особливо бурхливий розвиток нашого часу отримали фізичні, хімічні та технічні (так звані «точні») науки, а з усіх ними запанувала їх теоретична основа - математика. Точні науки як сильно потіснили все гуманітарні науки, але у час прагнуть «привести в свою віру», підпорядкувати своїм звичаям, нав'язати їм свої методи дослідження. При створеному становищі, використовуючи японський вираз, можна сказати, що нині мовознавці-філологи опоганюють собою самий краєчок циновки, де тріумфально і вольготно розташувалися точні науки на чолі з математикою.

Чи не доцільніше з точки зору загальнонаукових інтересів капітулювати перед математикою, цілком віддатися у владу її методів, до чого вже відверто закликають деякі голоси 5 9 і тим самим, можливо, набути нової сили? Щоб відповісти на ці питання, треба спочатку подивитися, на що претендує математика даному випадку, в якій галузі лінгвістики знаходять своє застосування математичні методи, якою мірою вони узгоджуються зі специфікою мовного матеріалу і чи здатні вони дати або навіть підказати відповіді на ті питання, які ставить перед собою наука про мову.

З самого початку слід зазначити, що і серед ентузіастів нового, математичного спрямування в лінгві<114>стичних дослідженнях немає єдності думок щодо його цілей та завдань. Акад. А. А. Марков, який першим застосував математичні методи до мови, Болдріні, Юл, Маріотті розглядають мовні елементи як підходящий ілюстративний матеріал для побудови квантитативних методів, або для статистичних теорем, зовсім не задаючись питанням, чи цікаві результати такого дослідження для лінгвістів 6 0 . Рос вважає, що теорія ймовірностей і математична статистика представляють інструмент або, як нині вважають за краще говорити, математичну модель для перевірки та підтвердження тих лінгвістичних висновків, які допускають числове трактування. Тим самим було математичні методи мисляться лише як допоміжні засоби лінгвістичного дослідження 6 1 . На набагато більше претендує Хердан, який у своїй книзі не лише підсумував та систематизував усі спроби математичного вивчення мовних проблем, а й спробував дати їм чітку орієнтацію щодо подальшої роботи. Виклад всього матеріалу своєї книги він орієнтує на «розуміння літературної статистики (так називає вивчення текстів методами математичної статистики. - У 3.)як невід'ємну частину лінгвістики» 6 2 , а сутність і завдання цього нового розділу в мовознавстві формулює в таких словах: «Літературна статистика як квантитативної філософії мови застосовна до всіх галузей лінгвістики. На нашу думку, літературна статистика є структуральна лінгвістика, піднята на рівень квантитативної науки або квантитативної філософії. Таким чином, однаково неправильно визначати її результати як такі, що не належать до області<115>лінгвістики або трактувати її як допоміжний засіб для дослідження» 6 3 .

Чи доцільно вдаватися до теоретизування щодо того, чи правомірно в даному випадку говорити про виникнення нової галузі лінгвістики та вирішувати питання про її претензії, не звернувшись спочатку до розгляду вже фактично зробленого в цій галузі, та до з'ясування того, в якому напрямку йде застосування нових методів 6 4 . Це допоможе нам розібратися й у різноголосці думок.

Застосування математичного (чи, точніше кажучи, статистичного) критерію для вирішення лінгвістичних питань є аж ніяк не новим для науки про мову і тією чи іншою мірою вже давно використовується мовознавцями. Адже, по суті, такі традиційні поняття лінгвістики, як фонетичний закон (і пов'язаний<116>нє з ним - виняток із закону), продуктивність граматичних елементів (наприклад, словотвірних суфіксів) або навіть критерії споріднених відносин між мовами певною мірою будуються на відносних статистичних ознаках. Адже чим різкіше і виразніше статистичне протиставлення випадків, тим більше в нас підстав говорити про продуктивні і непродуктивні суфікси, про фонетичний закон і винятки з нього, про наявність або відсутність споріднених відносин між мовами. Але якщо в подібних випадках статистичний принцип використовувався більш менш стихійно, то надалі він став застосовуватися свідомо і вже з певною цілеустановкою. Так, у наш час великого поширення набули так звані частотні словники лексики та виразів окремих мов 6 5 або навіть значень різномовних слів із «загальною спрямованістю на дійсність» 6 6 . Дані цих словників використовуються для складання підручників іноземних мов (тексти яких будуються на найбільш уживаній лексиці) та словників-мінімумів. Спеціально лінгвістичне використання статистичних обчислень знайшли у методі лексикостатистики або глоттохронології М. Сводеша, де на основі статистичних формул, що враховують випадки зникнення з мов слів основного фонду, виявляється можливим встановити абсолютну хронологію розчленовування мовних сімейств 6 7 .

У Останніми рокамивипадки застосування математичних методів до мовного матеріалу значно помножилися і в масі подібних спроб намітилися більш-менш певні напрямки. Звернемося<117>до послідовного їх розгляду, не вдаючись до деталей.

Почнемо з напряму, якому присвоєно найменування стилостатистики. Мова в даному випадку йдеться про визначення та характеристику стилістичних особливостей окремих творів або авторів через кількісні відносини використовуваних мовних елементів. В основі статистичного підходу до дослідження стилістичних явищ лежить розуміння літературного стилю як індивідуального способу володіння мовними засобами. При цьому дослідник зовсім відволікається від питання про якісну значущість обчислюваних мовних елементів, зосереджуючи всю свою увагу лише на кількісному боці; смислова сторона досліджуваних мовних одиниць, їх емоційно-експресивне навантаження, так само як і їхня питома вага в тканині художнього твору - все це залишається поза врахуванням, відноситься до так званих надлишкових явищ. Таким чином, художній твір виступає у вигляді механічної сукупності, специфіка побудови якого знаходить своє вираження лише через числові відносини її елементів. На всі зазначені обставини представники стилостатистики не заплющують очі, протиставляючи методам традиційної стилістики, які, безсумнівно, включають елементи суб'єктивності, одна єдина якість математичного методу, яка, на їхню думку, окупає всі його недоліки - об'єктивність досягнутих результатів. «Ми прагнемо, - пише, наприклад, В. Фукс, - ... охарактеризувати стиль мовного вираження математичними засобами. Для цієї мети повинні бути створені методи, результати яких повинні мати об'єктивність такою самою мірою, як і результати точних наук... Це передбачає, що ми, принаймні спочатку, займатимемося лише формальними структурними якостями, а не смисловим змістом мовних виразів. . Таким чином ми отримаємо систему порядкових відносин, яка у своїй сукупності являтиме собою основу та вихідний пункт математичної теорії стилю» 6 8 .<118>

Найпростішим видом статистичного підходу до вивчення мови письменників чи окремих творів є підрахунок вживаних слів, оскільки багатство словника, певне, має певним чином характеризувати і автора. Однак результати подібних підрахунків дають дещо несподівані в цьому плані результати і ніяк не сприяють естетичному пізнанню та оцінці літературного твору, що не в останню чергу входить до завдань стилістики. Ось деякі дані щодо загальної кількості слів, які вживаються у низці творів:

Біблія (латинська). . . . . . . . . . 5649 слів

Біблія (давньоєврейська). . . . 5642 слова

Демосфен (промови). . . . . . . . . . . . 4972 слова

Саллюстій. . . . . . . . . . . . . . . . . 3394 слова

Горацій. . . . . . . . . . . . . . . . . . . .6084 слова

Данте (Божественна комедія) 5860 слів

(сюди входить 1615 власних назв і географічних назв)

Тассо (Шалений Орланд) . . . . 8474 слова

Мілтон. . . . . . . . . . . . . . . . . . . . .8000 слів (прибл. дан.)

Шекспір. . . . . . . . . . . . . . . . . . .15000 слів

(приблизно, за іншими даними 20 000 слів)

О. Есперсен вказує, що словник Золя, Кіплінга та Джека Лондона значно перевищує словник Мілтона, тобто число 8000 6 9 . Підрахунок словника промов президента США В. Вілсона встановив, що він багатший, ніж у Шекспіра. До цього слід додати дані психологів. Так, Терман на основі спостережень над великою кількістю випадків встановив, що словник середньої дитини складає близько 3600 слів, а в 14 років – вже 9000. Середній дорослий вживає 11700 слів, а людина «підвищеної інтелігентності» до 13500 7 0 . Таким чином, подібні числові дані самі по собі не дають жодних підстав для виявлення стилістичних якостей творів і лише «об'єктивно» кон.<119>статують вживання різної кількості слів різними авторами, що, як свідчать наведені підрахунки, пов'язані з відносної художньої цінністю їх творів.

Дещо по-іншому будуються підрахунки відносної частоти вживання слів в окремих авторів. І тут враховується як загальна сума слів, а й частота вживання окремих слів. Статистична обробка отриманого таким чином матеріалу полягає в тому, що слова з рівною частотою вживання групуються за класами (або рангами), що призводить до встановлення частотної дистрибуції всіх слів, що вживаються даним автором. Приватним випадком таких підрахунків є визначення відносної частотності спеціальних слів (наприклад, романської лексики у творах Чосера, як це було зроблено Мерсандом 7 1). Відносна частотність вживаних авторами слів містить такі ж об'єктивні відомості про стиль окремих авторів, як і наведені вище сумарні підрахунки, з тією різницею, що в результаті виходять більш точні числові дані. Але вона використовується і для датування окремих творів одного і того ж автора на основі попередньо зробленого підрахунку відносної частоти вживання ним слів у різні періоди його життя (за датованим самим автором творами). Іншим видом використання даних подібних підрахунків є встановлення справжності авторства творів, щодо яких це питання є сумнівним 7 2 . У цьому разі все будується на порівнянні статистичних формул частоти вживання в справжніх і спірних творах. Немає потреби говорити про дуже велику відносність і приблизність результатів, отриманих такими методами. Адже відносна частота вживання змінюється не лише з віком автора, а й залежно від жанру, сюжету, а також і історичного середовища дії твору (порівн., наприклад, «Хліб» та «Петро I» А. Толстого).<120>

Поглиблюючи вищеописаний метод, стилостатистика як стильової характеристики стала вдаватися до критерію стабільності відносної частоти найбільш уживаних слів. Метод, що застосовується в даному випадку, можна проілюструвати статистичною обробкою оповідання Пушкіна «Капітанська дочка», виробленої Есселсоном та Епштейном в Інституті слов'янських мов при Детройтському університеті (США) 7 3 . Обстеженню піддав весь текст оповідання (близько 30000 випадків вживання слів), а потім уривки, що містять близько 10000 і 5000 випадків вживання. Далі, з метою визначення стабільності відносної частоти вживання слів, у 102 найбільш уживаних слів (з частотою від 1160 разів до 35) було зроблено порівняння розрахункової відносної частоти (зробленої на основі вибіркових уривків) з дійсною. Наприклад, союз «і» у всьому оповіданні вживався 1160 разів. У уривку, що містить 5 000 випадків вживання всіх слів, слід очікувати, що цей союз буде використовуватися 5 000 x 1 160: 30 000, або округло 193 рази, а у уривку, що містить 10 000 випадків вживання всіх слів, він ймовірно використовується x 1 160: 30 000 або 386 разів. Порівняння отриманих за допомогою таких розрахунків даних з фактичними показує дуже незначне відхилення (в межах 5%). На основі подібних розрахунків було встановлено, що в даному оповіданні Пушкіна прийменник «к» використовується вдвічі частіше, ніж «у», а займенник «ти» втричі частіше, ніж «їх» тощо. попри всі перипетії сюжету, як упродовж всього оповідання, і у окремих його частинах, спостерігається стабільність відносної частоти вживання слів. Те, що спостерігається щодо деяких (найбільш уживаних) слів, імовірно застосовно і стосовно всіх використаних у творі слів. Звідси випливає, що стиль автора можна характеризувати певним співвідношенням мінливості середньої частоти вживання слова до загальної мови.<121>частоті його вживання. Це і розглядається як об'єктивної квантитативної характеристики стилю автора.

Аналогічно досліджуються й інші формальні елементи структури мови. Так, наприклад, В. Фукс піддав порівняльно-статистичному розгляду метричні особливості творів Гете, Рільке, Цезаря, Саллюстія та ін.

Критерій стабільності відносної частоти вживання слів, уточнюючи техніку квантитативної властивості іміджу, нічого важливо нового не вносить проти вище розібраними найпростішими методами. Усі методи стилостатистики дають зрештою однаково безпристрасні, що ковзають поверхнею мови і чіпляються лише за суто зовнішні ознаки «об'єктивні» результати. Квантитативні методи, мабуть, не здатні орієнтуватися на якісні відмінності досліджуваного матеріалу і фактично нівелюють усі об'єкти, що вивчаються.

Там, де потрібна максимальна конкретизація, пропонуються максимально узагальнені критерії; якісні характеристики виражаються мовою кількості. Тут як логічне протиріччя, а й незгоду з природою речей. Справді, що вийде, якщо ми спробуємо отримати порівняльну стилістичну (тобто, отже, якісну) характеристику творів Олександра Герасимова та Рембрандта на підставі кількісного відношення червоної та чорної фарби на їхніх полотнах? Мабуть, абсолютна нісенітниця. Якою мірою цілком «об'єктивні» квантитативні відомості про фізичні дані людини здатні дати нам уявлення про все те, що характеризує людину і становить її справжню сутність? Очевидно, у жодній. Вони можуть бути лише індивідуальною ознакою, що відрізняє одну людину від іншої, на кшталт відбитка звивин на великому пальці руки. Аналогічно і з квантитативними характеристиками літературного стилю. Якщо уважно розібратися, то вони дають настільки ж убогі дані для судження про дійсні стилістичні<122>якості мови автора, як і опис звивин на пальці для вивчення психології людини.

До всього сказаного слід додати, що в так званій формальній школі літературознавства вже робилася спроба квантитативного дослідження стилю письменників, коли проводилися підрахунки епітетів, метафор, ритмо-мелодійних елементів вірша. Однак ця спроба не набула свого подальшого розвитку.

Інший напрямок застосування математичних методів для вивчення мовних явищ можна об'єднати під ім'ям лінгвостатистики. Воно прагне вторгнутися до основних питань теорії мови і таким чином отримати покликання у власне лінгвістичній сфері. Для ознайомлення з цим напрямком найкраще звернутися до вже згадуваної роботи Хердана, за висловом одного з її численних рецензентів, «жахливо претензійної книги» 7 5 , яка отримала, однак, широкий відгук серед мовознавців 7 6 . Зважаючи на те, що Хердан (на що вже вказувалося вище) прагнув зібрати у своїй книзі все найбільш суттєве в галузі застосування математичних методів до лінгвістичної проблематики, у його книзі ми фактично маємо справу не стільки з Херданом, скільки з цілим напрямком. Як показує сама назва книги - «Мова як вибір і ймовірність», - основна її увага спрямована на з'ясування того, що в мові надано вільному вибору мовця і що обумовлено іманентною структурою мови, так само, як і визначення кількісного співвідношення елементів першого і другого порядку. Книга Хердана дає майже вичерпну інформацію про всі роботи в цій галузі, проведені представниками різних спеціальностей<123>(філософами, лінгвістами, математиками, техніками), але не обмежується цим і включає багато оригінальних спостережень, міркувань та висновків самого автора. Як підсумовуючий праці вона дає гарне уявлення про застосовувані квантитативні методи, і про результати, що досягаються з їх допомогою. Питання, які ми умовно поєднуємо в розділ лінгвостатистики, трактуються у другій та четвертій частинах книги.

З багатьох випадків застосування методів математичної статистики до вивчення лінгвістичних питань ми зупинимося на найбільш загальних, які одночасно можна розглядати і як найбільш типові. Використовуючи дані інших авторів - Болдріні 7 7 , Матезіуса 7 8 , Маріотті 7 9 , Ципфа 8 0 , Діуей 8 1 та ін., а також наводячи власні дослідження, що визначають відносну частоту розподілу фонем, літер, довжини слів (вимірювану кількістю літер і складів), граматичних форм і метричних елементів та грецькому гекзаметрі, Хердан встановлює факт стабільності відносної частоти мовних елементів як загальну характеристику всіх лінгвістичних структур. Він виводить таке правило: «Пропорції лінгвістичних елементів, що належать тому чи іншому рівню чи сфері лінгвістичного кодування - фонології, граматиці, метриці, - залишаються більш менш постійними для даної мови, в даний період її розвитку і в межах досить великих і неупереджено проведених спостережень » 8 2 . Це правило, яке Хердан називає основним законом мови, він прагне певним чином витлумачити і розширити. «Він, – пише Хердан про цей закон, – є виразом факту, що навіть тут, де людській волі та свободі вибору надано<124>найширші рамки, де свідомий вибір і безтурботна гра жваво чергуються один з одним, загалом існує значна стабільність... Наші дослідження виявили ще один чинник загального порядку: далекосяжна схожість між членами одного мовного колективу спостерігається не тільки в системі фонем, у словнику та у граматиці, але також і щодо частоти вживання конкретних фонем, лексичних одиниць (слів) та граматичних фонем та конструкцій; інакше кажучи, подібність у тому, що використовується, а й у тому, як часто використовується» 8 3 . Таке становище обумовлюється зрозумілими причинами, але це дає привід нових висновків. При дослідженні різних текстів або відрізків цієї мови, наприклад, виявляється, що відносні частоти використання цієї конкретної фонеми (або інших мовних елементів) різними людьми залишаються в основному одними і тими самими. Це і призводить до тлумачення індивідуальних форм мовлення як деяких коливань постійної ймовірності вживання аналізованої фонеми у цій мові. Таким чином виходить, що у своїй мовній діяльності людина підпорядкована певним законам ймовірності щодо кількості лінгвістичних елементів, що використовуються. А тоді, коли ми спостерігаємо величезну кількість лінгвістичних елементів у великій сукупності текстів або мовних відрізків, у нас складається враження причинної залежності в тому сенсі, що в даному випадку має місце також детермінування щодо використання певних лінгвістичних елементів. Іншими словами, виявляється допустимим стверджувати, що те, що з інтуїтивної точки зору є причинним ставленням, у квантитативному плані є ймовірністю 8 4 . При цьому очевидно, що чим більше сукупність<125>ність обстежуваних текстів чи мовних відрізків, тим виразніше виявлятиметься стабільність відносної частоти вживання мовних елементів й у індивідуальному використанні (закон великих чисел). Звідси робиться новий загальний висновокпро те, що мова є масовим явищем і повинна трактуватися як така.

Зазначені висновки, досягнуті на підставі частотних обчислень фонетичних елементів, слів і граматичних форм, які в сукупності складають мову, застосовуються потім до «статистичної інтерпретації» поділу, що проводиться Соссюром, на «мову» (lalangue) і «мова» (laparole). За Соссюр, «мова» є сукупність лінгвістичних звичок, які уможливлюють спілкування між членами даного мовного колективу. Це соціальна реальність, «масове явище», обов'язкове для всього, хто говорить цією мовою народу. Хердан, як вказувалося, доводить, що члени єдиного мовного колективу схожі один з одним не тільки тим, що використовують одні й ті ж фонеми, лексичні одиниці та граматичні форми, а й тим, що всі ці елементи використовуються з однаковою частотою. Таким чином, статистичне визначення «мови» набуває у неї такої форми: «мова» (lalangue) є сукупність загальних лінгвістичних елементів плюс їх відносна ймовірність вживання.

Таке визначення «мови» є вихідним і для відповідного статистичного тлумачення «мови», яка, згідно з Соссюром, є індивідуальним висловом. Протиставляючи «мова» як соціальне «мови» як явище індивідуальному, Соссюр писав: «Мова є індивідуальний акт волі й розуміння, у якому слід розрізняти: 1. комбінації, з яких мовний суб'єкт користується мовним кодексом із єдиною метою висловлювання своєї особистої думки; 2. психофізичний механізм, що дозволяє йому об'єктивувати ці комбінації» 85. Оскільки «мова» в лінгвостатистиці розглядається як сукупність елементів з певною відносною<126>ної ймовірністю їх вживання, остільки він включає в себе як суттєву характеристику статистичну сукупність або ансамбль (популяцію) і може розглядатися в цьому аспекті. Відповідно до цього «мова» перетворюється на окрему вибірку, взяту з «мови» як статистичної сукупності. Імовірність у разі обумовлюється ставленням «мови» до «мови» (у тому «квантитативному» розумінні), а розподіл відносної частоти вживання різних елементів мови тлумачиться як наслідок колективного «вибору» (choice) у певний хронологічний період існування мови. Розуміючи, що таке трактування відмінностей «мови» і «мови» будується все-таки на зовсім інших підставах, ніж у Соссюра, Хердан пише у зв'язку з цим: «Це, мабуть, незначна модифікація концепції Соссюра має те важливе наслідок, що «мова» ( lalangue) нині набуває суттєвої характеристики у вигляді статистичної сукупності (популяції). Ця популяція характеризується певними відносними частотами чи ймовірностями коливань, маючи на увазі, що кожен лінгвістичний елемент відноситься до певного лінгвістичного рівня. У цьому випадку "мова" (laparole) відповідно до свого значення виявляється терміном для визначення статистичних вибірок, взятих з "мови" як статистичної сукупності. Стає очевидним, що вибір (choice) виступає тут як ставлення «мови» до «мови», будучи ставленням взятої навмання вибірки до статистичної сукупності (популяції). Сам порядок розподілу частоти, як відкладення мовної діяльності мовного колективу протягом століть, є елементом вибору (choice), але з індивідуального вибору, як і стилі, а колективного вибору. Використовуючи метафору, ми можемо тут говорити про вибір, зроблений духом мови, якщо розуміємо під цим принципи лінгвістичної комунікації, які у відповідність до комплексом психічних даних членів конкретного мовного колективу. Стабільність серій є результатом ймовірності (chance)» 8 6 .

Приватним випадком застосування викладеного принци<127>па є відмежування у мові нормативних явищ від «виключень» (відхилень). У лінгвостатистиці стверджується, що статистичний метод дозволяє усунути існуючу в даному питаннінечіткість і встановити чіткі критерії для розмежування зазначених явищ. Якщо під нормою розуміється статистична сукупність (у вищезгаданому сенсі), а винятком (або помилкою) - відхилення від частот, що показуються статистичною сукупністю, квантитативне вирішення питання напрошується само собою. Тут усе зводиться до статистичних відносин між «популяцією» та «відхиленням». Якщо частоти, що спостерігаються в окремій вибірці, відхиляються від ймовірностей, зумовлених статистичною сукупністю, більш ніж це визначається серією вибіркових підрахунків, то ми маємо підставу укладати, що демаркаційна лінія між «тим самим» (нормою) і «не тим самим» (Винятком) виявляється порушеною.

Квантитативні відмінності між «мовою» та «мовленню» використовуються і для розмежування мовних елементів двох типів: граматичних та лексичних. Вихідним моментом для вирішення цієї задачі, що представляє з лінгвістичної точки зору часто великі труднощі, є припущення, що рівень величини частотності граматичних елементів інший, ніж у лексичних одиниць. Це нібито пов'язують із «узагальненістю» граматичних елементів, що вони відрізняються від понять, фіксованих лексичними одиницями. Крім того, граматичні елементи нібито, як правило, значно менші за своїм обсягом: як самостійні слова (до них зараховуються займенники, прийменники, спілки та службові слова) вони зазвичай складаються з малої кількості фонем, а у вигляді «пов'язаних форм» - з однієї або двох фонем 8 7 . Чим менший лінгвістичний елемент, тим менш здатна його «довжина» (кількісний момент) служити як визначальна характеристика і тим більше значення набуває для цієї мети «якість» фонем. Які ж методи пропонуються для вирішення проблеми? Вона вирішується через звернення до суто квантитативного поняття граматичної.<128>навантаження, «Припустимо, - пише у зв'язку з цим Хердан, - що нас цікавить порівняння у зазначеному відношенні двох мов. Як ми визначаємо з певним ступенем об'єктивності «граматичне навантаження», яке несе мову? Зрозуміло, що це навантаження залежатиме від положення демаркаційної лінії, що відмежовує граматику від лексики. Перше міркування, яке може спасти при цьому нам на думку, полягає в тому, щоб визначити, наскільки «складна» граматика цієї мови. Адже «складність» – якісна характеристика, а поняття «граматичного навантаження» є кількісною характеристикою. Щоправда, навантаження до певної міри залежить від складності, але не цілком. Мова може бути нагороджена надзвичайно складною граматикою, але в діяльності мови набуває застосування лише порівняно невелика її частина. Ми визначаємо «граматичне навантаження» як сукупність граматики, яку несе мова, коли він перебуває в дії, що зараз переводить нашу проблему в область структуральної лінгвістики в тому сенсі, в якому ця дисципліна була визначена Соссюр. У наступному викладі застосовуються квантитативні методи визначення різниці мов залежно від цього, де проходить кордон, поділяюча граматику від лексики» 8 8 . Іншими словами, відмінності мов у даному випадку мають бути зведені до відмінностей числових відносин між граматичними та лексичними елементами.

Наявні у нашому розпорядженні матеріали малюють таку картину. У англійською(враховувалися лише «граматичні слова»: займенники, або, як вони також називаються, «заступники», прийменники, спілки та допоміжні дієслова) у відрізку, що включає 78633 випадки вживання всіх слів (1027 різних слів), було виявлено 53 102 випадки вживання граматичних елементів, або, точніше кажучи, «граматичних слів» (149 різних слів), що становить 67,53% при 15,8 % різних слів. Такі дані Діуей 8 9 . Інші дані показують інше відсоткове<129>співвідношення: 57,1% при 5,4% різних слів 9 0 . Така значна розбіжність пояснюється різницею письмової та усної мови. Письмові формимови (перші дані) використовують нібито більше граматичних елементів, ніж усні (другий випадок). У «Божественній комедії» Данте (італійським оригіналом) Маріотті встановив 54,4% випадків вживання «граматичних слів».

Інший і, мабуть, досконаліший спосіб визначення граматичного навантаження мови полягає в підрахунку фонем, що входять до граматичних елементів. У разі враховуються як самостійні граматичні слова, а й пов'язані форми. Тут можливі різні варіанти. Наприклад, визначення відносної частоти вживання окремих приголосних фонем у граматичних елементах та зіставлення їх із частотою сумарного вживання цих же фонем (підсумкові дані такого співвідношення в англійській мові дають пропорцію 99,9% до 100000 - сумарного вживання); або подібне зіставлення згодних за окремими класифікаційними групами (лабіальні, палатальні, велярні та інші фонеми). Підсумкове співвідношення тут набуває форми пропорції 56,47% (у граматичних елементах) до 60,25% (у сумарному вживанні); або таке ж зіставлення початкових приголосних фонем (у разі сталося співвідношення 100,2% у граматичних словах до 99,95 - у сумарному вживанні). Можливі й інші складніші статистичні операції, які, проте, у результаті дають подібні квантитативні висловлювання досліджуваної проблеми.

Наведені квантитативні дані є підставою для загального висновку. Він зводиться до того що, що розподіл фонем у граматичних елементах обумовлює характер розподілу (у числовому, звісно, ​​вираженні) фонем у мові загалом. А це в свою чергу дозволяє зробити висновок, що вживання граматичних елементів найменше залежить від індивідуального вибору і становить ту частину лінгвістичного виразу, яка контролюється ймовірністю<130>ністю. Цей умоглядний висновок підтверджується підрахунком граматичних форм у російській мові, зробленим Есселсоном 9 1 . Дослідженню було піддано 46896 слів, взятих з II джерел (твори Грибоєдова, Достоєвського, Гончарова, Салтикова-Щедріна, Гаршина, Бєлінського, Амфітеатрова, Гусєва-Оренбурзького, Еренбурга, Симонова та Н. Островського). Вони були поділені на розмовні слова (17756 слів, або 37,9%) та нерозмовні (29140 слів, або 62,1%). Потім вся сукупність слів була поділена на 4 групи в залежності від їх граматичного характеру: до 1-ї групи увійшли іменники, прикметники, прикметники до функцій іменників, займенники та схильні числові; у 2-у групу – дієслова; в 3-ю групу - віддієслівні дієприкметники, дієприкметники у функції прикметників і іменників та дієприслівника; в 4-у групу - незмінні форми прислівника, прийменники, спілки та частки. Сумарні результати (наводяться також таблиці з даними щодо окремих авторів) дають таке співвідношення:

1-я група

2-я група

3-я група

4-я група

розмовні.

нерозмовний.

Хердан такими словами характеризує розгляд отриманих таким чином квантитативних даних: «Вони виправдовують висновок, що граматичні елементи слід розглядати як фактор, що зумовлює ймовірність лінгвістичного вираження. Такий висновок дозволяє уникнути обтяжливої ​​кваліфікації кожного слова, що вживається. Цілком очевидно, що оскільки граматика і лексика не зберігаються у водонепроникних оболонках, ні та й інша не є чистим «вибором» (choice) або чистою «імовірністю» (chance). І граматика і лексика містять обидва елементи, хоча й у пропорціях, що значно варіюються» 9 2 .<131>

Великий розділ книги Хердана присвячений дослідженню у мові двоплановості чи двоїстості (duality), причому саме поняття двоїстості ґрунтується на математичних характеристиках.

Так, теореми в проективній геометрії можна розташовувати в два ряди, так що кожна теорема одного ряду може бути отримана з деякої теореми іншого ряду шляхом заміни один на одного слів крапкаі пряма.Наприклад, якщо дано положення: «будь-які різні точки належать одній і тільки одній прямій», то ми можемо з нього вивести співвіднесене йому положення: «будь-які дві різні прямі належать одній і тільки одній точці». Іншим методом визначення двоїстості є нанесення по осі абсцис та осі ординат різних планівдосліджуваного явища. Так, як це, наприклад, робить Юл 9 3 по осі абсцис відлічуються різні частоти вживання, а по осі ординат - кількість лексичних одиниць, у яких визначається частотність і т. д. Так трактується поняття двоїстості, нібито в рівною міроюзастосовне і до. лінгвістичним дослідженням.

Під певне таким чином поняття двоїстості, яке у всіх випадках фактично має характер бінарного коду і яке також вважається найістотнішою рисою мовної структури, підводяться надзвичайно різноякісні явища, що допускають протилежність за двома планами: розподіл вживання слів відповідно до характеру лексичних одиниць та розподіл лексичних одиниць відповідно до частоти вживання слів; письмову та розмовну форми мови; лексичні та граматичні елементи; синоніми та антоніми; фонема та її графічне зображення; обумовлене та визначальне (соссюрівські signifiantиsignifiй) і т.д.

Після квантитативного дослідження двоїстості тієї чи іншої приватного, мовного явища чи обмеженого «тексту», зазвичай, робиться висновок, якому приписуються якості лінгвістичної універсальності. Характер подібних висновків та спосіб їх обґрунтування можна простежити на прикладі<132>дослідження двоїстості слова та поняття (фактично ж йдеться про співвідношення довжини слова та обсягу поняття - треба мати на увазі, що надзвичайно вільне вживання лінгвістичних та інших термінів у подібних роботах часто дуже ускладнює розуміння). Важливо при цьому відзначити, що як матеріал, що послужив джерелом спостережень даного виду лінгвістичної двоїстості, були використані: міжнародна номенклатура хвороб (близько 1000 назв) та загальний регістр захворювань по Англії та Уеллсу за 1949 р. У цьому випадку робиться наступний загальний висновок: « Кожне поняття, що означає загальну ідею, має те, що можна назвати "сферою" або "обсягом". Воно дозволяє через своє посередництво думати про багато предметів чи інші поняття, що знаходяться всередині його «сфери». З іншого боку, всі предмети, необхідні визначення поняття, становлять те, що називається його «змістом». Обсяг і змістом взаємно співвідносні - що менше зміст і що більш абстрактне поняття, то більше вписувалося його сфера чи обсяг, т. е. тим більше об'єктів підводиться під нього. Це можна як аналогію (в понятійної сфері) принципам кодування, відповідно до яких довжина символу і частота вживання взаємозалежні» 9 4 .

Принцип двоїстості застосовується до приватних проблем. Наприклад, при встановленні еквівалентності значень двох слів різних мов. У результаті вивчення англо-німецького словника Мюре - 3андерса із застосуванням математичного методу ітерацій робиться висновок, що ймовірність вживання англійського слова з одним або більше значенням у німецькому перекладі залишається постійною для кожної початкової літери у всьому словнику 9 5 . Розгляд порядку розташування слів у китайських словниках призводить до висновку, що він носить таксономічний характер, оскільки кількість рис в ієрогліфі вказує його місце (як самостійного радикала чи певного підкласу, що підкоряється радикалу). Таксономія є супідрядний принцип класифікації, що застосовується в зоології та ботаніці. Хердан стверджує, що<133>основи китайської лексикографії також будуються на засадах таксономії 9 6 і т.д.

Роблячи загальну оцінку даного напряму застосування математичних методів до вивчення лінгвістичних проблем (тобто лінгвостатистики), необхідно, мабуть, виходити з того положення, яке було сформульовано Еттінгер: «Математика може бути ефективно використана на службі лінгвістики тільки тоді, коли мовознавцям будуть зрозумілі реальні межі її застосування, як і можливості використовуваних математичних моделей» 9 7 . Іншими словами, про математичну лінгвістику може йтися тоді, коли математичні методи доведуть свою придатність для вирішення тих власне лінгвістичних завдань, які у своїй сукупності становлять науку про мову. Якщо ж цього немає, хоча при цьому, можливо, і відкриваються нові аспекти наукового дослідження, то в такому випадку можна говорити про що завгодно, але тільки не про лінгвістику - в даному випадку маються на увазі не різні видиприкладної лінгвістики (про неї ще буде мова нижче), а наукове, чи теоретичне, мовознавство. Виходячи з цієї позиції, слід зазначити, що з погляду лінгвіста багато в лінгвостатистиці викликає сумнів і навіть подив.

Звернемося до розбору лише двох прикладів (щоб не захаращувати викладу), обмовившись, що дуже суттєві заперечення можна зробити для кожного з них. Ось перед нами квантитативне розмежування граматичних та лексичних одиниць. Виявляється, для того, щоб зробити таке розмежування, необхідно вже заздалегідь знати, що відноситься до галузі граматики, а що - до лексики, оскільки «граматичне навантаження» мови (тобто сукупність вживаних у мові граматичних елементів), як вказується в наведена вище цитата, «залежить від демаркаційної лінії, що відмежовує лексику від граматики». Не знаючи, де пролягає ця лінія, не можна, отже, провести зазначеного розмежування. У чому тоді сенс квантитативного методу розмежування лексичного від грам<134>матичного? Втім, що стосується Хердана, то він особливо не замислюється над цим питанням і сміливо класифікує мовні елементи, відносячи до граматичних елементів «пов'язані форми», під якими, судячи з викладу, слід розуміти зовнішню флексію, та «граматичні слова», куди ставляться прийменники , Спілки, допоміжні дієслова і займенники - останні тому, що є «заступниками». Але якщо говорити тільки про цю якість займенників і на цій підставі відносити їх до граматичних елементів, то тоді до них, очевидно, слід віднести і такі слова, як «згаданий вище», «названий», «даний» і т. д., так як вони теж виступають як заступники. У зв'язку з застосовуваним у лінгвостатистиці способом виділення граматичних елементів природно виникає питання, як же чинити в цьому випадку з такими «граматичними явищами, що не мають виду», як порядок слів, тони, нульові морфеми, парадигматичні відносини (частина цих явищ, до речі кажучи, знаходить відображення й у мовах, які досліджуються математичними методами)? Як проводити розмежування в мовах з багатою внутрішньою флексією (як, наприклад, у семітських мовах), де вона здійснює не лише граматичну модифікацію кореня (радикала), а й повідомляє йому лексичне існування, оскільки корінь без перегласувань не має реального існування у мові? Що слід розуміти під граматичною складністю мови, яким критерієм вона визначається? Якщо кількісним моментом, який у цьому випадку всіляко підкреслюється, тоді однією з найскладніших у граматичному відношенні мов виявиться англійська, що володіє такими конструкціями, як IshallhavebeencallingабоHewouldhavebeencalling. У цих реченнях тільки call можна віднести до лексичного, а все інше, отже, слід вважати граматичним. Які є підстави пов'язувати частотність вживань граматичних елементів із узагальненістю чи абстрактністю значень граматичних слів? Адже цілком очевидно, що відносно велика частота вживання граматичних елементів визначається їхньою функцією у побудові речень, а щодо абстрактності значень, то дуже просто знайти велике<135>кількість лексичних елементів, які легко в цьому відношенні можуть змагатися з граматичними елементами, багато в чому поступаючись їм частотністю (наприклад, буття, існування, довжина, простір, субстанціяі т.д).

Подібного роду безглуздя постають перед нами і у випадку з визначенням двоїстості (duality) слова і поняття. Треба мати надзвичайно своєрідне розуміння структурної сутності мови, щоб піддавати її дослідженню, користуючись номенклатурою хвороб та лікарняним регістром захворювань, що, як зазначалося вище, послужило вихідним матеріалом для вельми відповідальних лінгвістичних висновків. Не зупиняючись на абсолютно неясному вживанні таких термінів, що не мають лінгвістичного буття, як сфера, обсяг і зміст поняття (до речі кажучи, при цьому грубо плутаються лексичне значення слова і поняття, що позначається науковим терміном), звернемося до висновку, яке в цьому випадку робиться. Як зазначалося вище, ми маємо справу із твердженням, що «обсяг та зміст взаємно співвідносні». Весь хід міркування, який дає підставу для такого висновку, так само як і спосіб математичного оперування мовними фактами, чітко показує, що в цьому випадку зовсім не враховується одна дуже істотна якість мови, яка перекидає всі розрахунки, що проводяться: здатність виражати одне і те ж зміст» лінгвістичними одиницями різного «об'єму», які безперечно володіють до того ж різною відносною частотою вживання. Так, одне й те саме обличчя ми можемо позначити як Петров, мій знайомий, він, москвич, юнак, співробітник університету, брат моєї дружини, людина, яку ми зустріли на мосту, і т. д. У світлі подібних фактів сумніви викликають не лише окремі висновки, яким, проте, як зазначалося, надається універсальне значення, а й доцільність застосування самих квантитативних методів до подібних лінгвістичних проблем.

Але іноді лінгвістам пропонуються висновки, справедливість яких не викликає жодного сумніву. Таким є «основний закон мови», який полягає в тому, що в мові спостерігається певна стабільність її елементів і відносної частоти їх упо<136>вимоги. Біда подібних відкриттів полягає, однак, у тому, що вони давно відомі лінгвістам. Адже цілком очевидно, що якби мова не мала відомої стабільності і кожен член даного мовного колективу вільно варіював елементи мови, то не було б можливо взаємне спілкування і саме існування мови стало б безглуздим. А щодо розподілу відносної частоти вживання окремих елементів мови, то вона знайшла своє вираження в мовознавстві у вигляді виділення категорій пасивної та активної лексики та граматики, чому так багато приділяв уваги Л. В. Щерба. У цьому випадку статистичні методи можуть надати допомогу лінгвістам лише у розподілі конкретних мовних елементів за розрядами відносної частоти їх вживання, але з жодних підстав претендувати на відкриття якихось нових закономірностей, які мають цінність для теоретичної лінгвістики.

З іншого боку, лінгвостатистика пропонує ряд справді «оригінальних» висновків, які є надзвичайно показовими для характеру наукового мислення її адептів. Так, складними статистичними методами досліджується «політична лексика» у працях Черчілля, Бенеша, Халіфакса, Штреземана та інших, причому у підрахунках для неангломовних авторів використовуються переклади їхніх робіт англійською мовою. Результати підрахунків представлені у вигляді численних таблиць, математичних формул та рівнянь. Лінгвістична інтерпретація квантитативних даних у цьому випадку зводиться лише до того, що вживання Черчіллем «політичної лексики» є найбільш типовим (?) для цієї групи авторів і що використання Черчіллем слів у тих випадках, коли він стосується політичних питань, типово для англійського мовного колективу 9 8 .

В іншому випадку після відповідних статистичних маніпуляцій робиться висновок, що Гітлер у слововжитку нацистської Німеччини порушив двоїстість між «мовою» та «мовою» у квантитативному розумінні цих термінів. Приватним випадком знищення цієї двоїстості є буквальне розуміння<137>ня метафоричних оборотів (наприклад, «сипати сіль у відкриті рани»). Нацистська Німеччина затаврувала себе такою кількістю нелюдських вчинків, що навряд чи є потреба викривати її і в цьому лінгвістичному лиходійстві 9 9 . До порушення лінгвістичної двоїстості веде, як стверджує Хердан, і визначення Марксом мови як безпосередньої дійсності думки, а закон діалектики про перехід явища у свою протилежність є, на його думку, неправильно зрозумілий лінгвістичний закон двоїстості мови 100 . Подібні інтерпретації говорять самі за себе.

Нарешті, загальним недоліком, властивим усім наведеним випадкам квантитативного способу вивчення лінгвістичного матеріалу і тим самим набуває методологічного характеру, є підхід до мовних елементів як до механічної сукупності абсолютно незалежних один від одного фактів, відповідно до чого, якщо при цьому і розкриваються які- чи закономірності, всі вони ставляться лише до числовим відносинам розподілу автономних фактів, поза їх системних залежностей. Щоправда, Дж. Уотмоу всіляко прагне запевнити, що саме математика краще, ніж будь-який вид лінгвістичного структурного аналізу, здатна розкрити структурні особливості мови. «Сучасна математика, - пише він, - займається не виміром і обчисленням, точність яких за своєю природою обмежена, але в першу чергу структурою. Ось чому математика найвищою мірою сприяє точності вивчення мови - такою мірою, на яку не здатний роздільний опис, ще більш обмежений за своєю природою... Так само як у фізиці математичні елементи використовуються для опису фізичного світу, оскільки передбачається, що вони відповідають елементам фізичного світу, і у математичної лінгвістиці математичні елементи імовірно повинні відповідати елементам світу промови» 1 01 . Але така постановка питання аж ніяк не рятує положення, тому що в кращому випадку вона може<138>дати аналіз мови або як фізичної структури, що для мови ще далеко не достатньо, і в кінцевому рахунку носить все той же механістичний характер, або як логіко-математичної структури, а це переносить мову в іншу і багато в чому чужу йому площину 102. Не зайве при цьому відзначити, що успіхи математичної лінгвістики Уотмоу передбачає тільки в майбутньому, а щодо їхніх реальних результатів, то він дає їм оцінку в наступних словах: «...майже вся робота, виконана нині Херданом, Ципфом, Юлом, Гіро (Guiraux) та іншими, знаходиться аж ніяк не за межами критики як з боку лінгвістики, так і математики; вона значною мірою віддає любительщиною »103. Таким чином, якщо не намагатися передбачати майбутнє математичних методів у лінгвістичних дослідженнях, а постаратися по заслугах оцінити те, чим ми маємо на сьогоднішній день, то за потребою доведеться визнати, що математика фактично поки що обмежувалася в галузі мовознавства лише «вимірюванням та підрахунком», а якісного аналізу мови, що вникає у його структуру, не змогла дати.<139>

Постараємося все ж таки бути максимально об'єктивними. У відомій своїй частині квантитативні дані, мабуть, можуть бути використані лінгвістикою, але лише як допоміжні переваги в проблемах, що мають практичну спрямованість. Щодо більшої частини квантитативних способів вивчення окремих лінгвістичних явищ, безсумнівно, виправдано загальний висновок Р. Брауна: «Їх можна розглядати так, як їх розглядає Хердан, але який сенс всього цього?». 1 04 . Уявімо, що ми ставимо питання: «Що являють собою дерева в цьому саду?». І у відповідь отримуємо: "У цьому саду сто дерев". Хіба це відповідь на наше запитання і чи справді вона має сенс? Адже щодо багатьох лінгвістичних питань математичні методи дають саме такі відповіді.

Однак існує широка галузь дослідницької діяльності, яка використовує переважно математичні методи і в той же час орієнтує їх на мовний матеріал, де доцільність такого об'єднання не викликає жодного сумніву. «Сенс» цієї дослідницької діяльності, її значущість обумовлюється тими цілями, яких вона прагне. Вона вже апробована практикою. В даному випадку йдеться про проблеми, пов'язані зі створенням інформаційних машин, конструкцій для машинного перекладу письмових. наукових текстів, автоматизацією перекладу мовлення з однієї мови на іншу і з усім тим комплексом завдань, які поєднуються в лінгвістичних питаннях кібернетики. Всій сукупності подібних проблем зазвичай надають загальну назву прикладної лінгвістики. Тим самим вона відмежовується від так званої математичної лінгвістики, що включає ті напрямки роботи, які були позначені як стилостатистика і лінгвостатистика, хоча аж ніяк не уникає статистичної обробки лінгвістичного матеріалу. Мабуть, найбільш важливою рисою прикладної лінгвістики, що відокремлює її від математичної лінгвістики, як вона описувалася вище, є те, що перша має зворотну спрямованість: не математика для лінгвістики, але лінгвістика<140>(формалізована математичними методами) для широкого набору практичних завдань.

Немає потреби розкривати зміст окремих проблем, що включаються нині в надзвичайно широку область прикладної лінгвістики. На противагу математичній лінгвістиці ці проблеми активно обговорюються в радянській лінгвістичній літературі і справедливо починають займати все більш чільне місце в науковій проблематиці дослідних інститутів 105 . Таким чином вони вже досить відомі нашій лінгвістичній громадськості. Ця обставина, однак, не звільняє нас від необхідності їх осмислення, зокрема, з погляду принципів науки про мову. Це, безперечно, допоможе усунення непорозумінь, які все частіше й частіше виникають між представниками дуже далеких один від одного наук, що беруть участь у роботі над проблемами прикладної лінгвістики, і намітить шляхи їх зближення, з одного боку, і розмежування областей дослідження, з іншого боку. Само собою зрозуміло, що нижченаведені міркування будуть представляти точку зору лінгвіста, і необхідно, щоб математики не тільки постаралися її засвоїти, але у зв'язку з питаннями, що піднімаються, дали їм своє трактування.

Лінгвіста-теоретика ніяк не може задовольнити ту обставину, що у всіх випадках дослідження є<141>лень мови у тих цілях, які ставляться прикладною лінгвістикою, основою їх є математична модель. Відповідно до цього спостереження над явищами мови та одержувані при цьому результати виражаються в термінах та поняттях математики, тобто за допомогою математичних рівнянь та формул. Звернемося для наочності наприклад. Кондон 106 і Ципф 107 встановили, що логарифми частоти ( f) Вживання слів у тексті великого обсягу розташовуються майже на прямій лінії, якщо на діаграмі співвіднести їх з логарифмами рангу або розряду ( r) цих слів. Рівняння f = c: r,де зє константою, відбиває це ставлення у тому обмеженому значенні, що c: rдля заданого значення rз великою наближеністю відтворює частоту, що спостерігається. Відношення між fі r,виражене математичною формулою, є моделлю для відносин між значеннями частоти вживання, що спостерігаються, і рангу, або розряду, слів. Такий один із випадків математичного моделювання. 

Вся теорія інформації цілком базується на математичній моделі процесу комунікації, розробленої К. Шенноном 108 . Вона визначається як «математична дисципліна, присвячена способам обчислення та оцінки кількості інформації, що міститься в будь-яких даних, та дослідженню процесів зберігання та передачі інформації» (БСЕ, т. 51, стор 128). Відповідно і основні поняття теорії інформації одержують математичний вираз. -або коду і середньою кількістю переданої ін<142>формації. Надмірність виражається у відсотках до загальної передавальної здатності коду» 1 09 та ін. Так само і для машинного перекладу необхідна алгоритмічна розробка відображення елементів однієї мови в іншій і т. д. 1 10 . Такими є інші випадки моделювання.

Використання моделей поза всяким значенням може надати дуже істотну допомогу, зокрема, ймовірно, при вирішенні тих завдань, які ставить перед собою прикладна лінгвістика. Однак для теоретичного мовознавства дуже суттєвою є та обставина, що абстрактна модель, як правило, не відтворює всіх особливостей дійсного явища, всіх його функціональних якостей. Так, архітектор, перед тим як побудувати будинок, може створити його модель, що відтворює у всіх найдрібніших деталях проектований будинок, і це допомагає йому вирішити низку практичних питань, пов'язаних із будівництвом самого будинку. Але така модель будинку, якою б вона не була точною, позбавлена ​​тієї «функції» і того призначення, заради чого будуються взагалі всі будинки - вона не здатна забезпечити людину житлом. Аналогічно і з мовою, де модель не завжди здатна відтворити всі його якості. У цьому випадку справа ускладнюється ще й тим, що для побудови моделі використовуються не власне лінгвістичні, а математичні мірила. «Математичні моделі...- пише А. Еттінгер, - відіграють надзвичайно важливу роль у всіх галузях техніки, але оскільки вони є знаряддям синтезу, їх значення для лінгвістики, що є насамперед історичною та описовою дисципліною, природно має обмежений характер» 1 11 .<143>

Математичне моделювання мови фактично застосовується тільки до його статичного стану, який для мовознавця є умовним і насправді перебуває у прямому протиріччі з основною якістю мови, самою формою існування якої є розвиток. Само собою зрозуміло, статичне вивчення мови аж ніяк не виключається і з мовознавства і є основою при складанні нормативних граматик та словників, описових граматик, практичних граматик та словників, що є посібником для практичного вивчення іноземних мов, і т. д. Однак у всіх таких роботах, мають переважно прикладний характер, мовознавці йдуть на свідоме обмеження поля дослідження і аж ніяк не заплющують очі на інші аспекти мови 1 12 . При статичному розгляді мови, зокрема, цілком зникають з поля зору дослідника такі якості мови, пов'язані з його динамічним характером, як продуктивність, залежність від форм мислення, широка взаємодія з культурними, соціальними, політичними, історичними та іншими факторами. Тільки в плані синхронічному можна мову розглядати як систему умовних знаків або кодів, що, однак, виявляється абсолютно неправомірним, як тільки ми стаємо більш динамічною для точки зору мови. Саме в процесах розвитку проявляються такі якості мови, як мотивованість, яка не має стабільних кордонів, багатозначність слів, неавтономність значення слова та його звукової оболонки, пов'язані з контекстом творчі потенції слова, а це все знаходиться в різкій суперечності з основними характеристиками коду або знака 1 13 . Очевидно, в прикладній лінгвістиці також можна відмислюватися від усіх цих якостей мови і в практичних цілях задовольнятися, так би мовити, «моментальним знімком» мови, який все ж таки здатний дати досить наближене уявлення про механізм його функції<144>нування. Однак кожен такий «моментальний знімок», якщо його розглядати як факт мови, а не як факт системи умовних кодів, має бути включеним у нескінченний процес руху, в якому мова завжди перебуває 1 14 . Його не можна вивчати поза тими конкретними умовами, які характеризують цей рух, що накладає свій відбиток на даний станмови та зумовлює потенції подальшого її розвитку. Тут існує така ж різниця, як між моментальною фотографією людини та її портретом, написаним пензлем справжнього художника. У творі художника маємо узагальнюючий образ людини у всій своєрідності як його фізичного образу, а й внутрішнього духовного змісту. По художньому портрету ми можемо прочитати і минуле відображеної на ньому людини і визначити, на що вона здатна у своїх вчинках. А миттєва фотографія, хоч і здатна дати більш точне зображення зовнішності оригіналу, позбавлена ​​цих якостей і нерідко фіксує і випадковий прищ, що схопився на носі, і<145>абсолютно нехарактерну позу або вираз, що зрештою призводить до спотворення та оригіналу.

Слід зазначити, що спосіб «моментальних знімків» можна, звичайно, застосовувати і до фактів розвитку мови. Але в цьому випадку ми насправді матимемо справу тільки з окремими станами мови, які за квантитативною своєю характеристикою виявляються пов'язаними не більшою мірою, ніж порівняльна квантитативна характеристика різних мов. Подібного роду квантитативна «динаміка» нічого органічного не укладатиме в собі, і зв'язок окремих станів мови буде лежати лише на зіставленні числових відносин. Якщо й у разі вдаватися до аналогії, можна послатися зростання дитини. Його розвиток, зрозуміло, можна у вигляді динаміки числових даних про його вагу, зростання, змінних відносин обсягу частин його тіла, але всі ці дані абсолютно відхилені від усього того, що в першу чергу становить індивідуальну сутність людини - її характеру, нахилів, звичок , смаки і т.д.

Іншою негативною стороною математичного «моделювання» мови є та обставина, що воно не може служити тим загальним принципом, на основі якого можна здійснити всебічний та всеосяжний – систематичний опис мови. Тільки математичний підхід до явищ мови, наприклад, не дасть можливості відповісти навіть на такі корінні питання (без яких немислиме саме існування науки про мову), як: що таке мова, які явища слід відносити до власне мовної, як визначається слово або речення, Які основні поняття та категорії мови та ін. Перш ніж звернутися до математичних методів дослідження мови, необхідно вже заздалегідь мати відповіді (хоча б і у формі робочої гіпотези) на всі ці питання. Немає потреби заплющувати очі на те, що у всіх відомих нам випадках дослідження мовних явищ математичними методами всі зазначені поняття та категорії неминуче доводилося приймати такими, як вони були визначені традиційними або, умовно кажучи, якісними методами.

Цю особливість математичних методів у їхньому лінгвістичному застосуванні відзначив Спанг-Ханссен, коли пі<146>сал: «Слід мати на увазі, що спостережені факти, що отримують квантитативний вираз... не мають цінності, якщо вони не становлять частини опису, а для лінгвістичних цілей це має бути систематичний опис, тісно пов'язаний з якісним лінгвістичним описом та теорією» 1 15 . В іншому виступі Спанг-Ханссена ми зустрічаємо уточнення цієї думки: «Доки не буде доведено можливість побудови квантитативної системи, і доти, доки існує загальноприйнята якісна система для даної галузі дослідження, частотні підрахунки та інші числові характеристики з лінгвістичної точки зору немає сенсу» 1 16 . Подібні ідеї висловлює і Улдалль, дещо несподівано пов'язуючи їх із розробкою, загальнотеоретичних основ глоссематики: «Коли лінгвіст вважає чи вимірює усе те, що вважає і вимірює, саме собою визначається не квантитативно; наприклад, слова, коли вони підраховуються, визначаються, якщо вони взагалі визначаються, в інших термінах» 1 17 .<147>

Таким чином виявляється, що як у теоретичному відношенні, так і в практичному їх застосуванні математичні методи знаходяться у прямій залежності від лінгвістичних понять та категорій, визначених традиційними, філологічними, або, як говорилося вище, якісними методами. У плані прикладного мовознавства важливим є усвідомлення цієї залежності, а отже, і знайомство з усією сукупністю основних категорій традиційної лінгвістики.

Ні, щоправда, жодних підстав дорікати представників точних наук, які працюють у галузі прикладної лінгвістики, у цьому, що де вони використовують даних сучасної лінгвістики. Це не відповідає дійсному стану речей. Вони не тільки добре знають, а й широко використовують у своїй роботі встановлені лінгвістами системи диференціальних ознак, властиві різним мовам, дистрибуцію та аранжування мовних елементів у межах конкретних мовних систем, досягнення акустичної фонетики тощо. Але в цьому випадку необхідне дуже суттєве застереження . Фактично представники точних наук користуються даними лише одного напряму в мовознавстві - так званої дескриптивної лінгвістики, яка свідомо відмежувалася від традиційних проблем теоретичного мовознавства, далеко не покриває собою всього поля лінгвістичного дослідження, з власне лінгвістичної точки зору має суттєві методичні недоліки, що і привело її кризі, що розкрилася останнім часом 1 18 , і, крім того, має суто практичну спрямованість, що відповідає інтересам прикладної лінгвістики. До дескриптивної лінгвістики застосовні всі застереження і закиди, які були зроблені на адресу статичного розгляду мови. Подібний односторонній підхід дескриптивної лінгвістики може, слідчий<148>Проте, виправдовуватися лише тими завданнями, які ставить собі прикладна лінгвістика, але не вичерпує всього змісту науки про мову.

У процесі розробки питань прикладного мовознавства можуть виникнути і вже виникли нові теоретичні проблеми. Деякі з цих проблем тісно пов'язані з конкретними завданнями прикладного мовознавства та спрямовані на подолання тих труднощів, які виникають під час вирішення цих завдань. Інші проблеми мають пряме відношення до теоретичного мовознавства, дозволяючи в новому аспекті поглянути на традиційні уявлення або відкриваючи нові галузі лінгвістичного дослідження, нові поняття та теорії. До цих останніх, наприклад, відноситься проблема створення «машинної» мови (або мови-посередника), яка найтіснішим чином пов'язана зі складним комплексом таких кардинальних питань теоретичного мовознавства, як взаємини понять і лексичних значень, логіки та граматики, діахронії та синхронії, знакової природи мови, сутності лінгвістичного значення, принципів побудови штучних мов тощо. 1 19 . У цьому випадку особливо важливо налагодити взаєморозуміння та співдружність у спільній роботі представників лінгвістичних дисциплін та точних наук. Щодо лінгвістичної сторони, то мова в даному випадку, мабуть, повинна йти не про те, щоб уже заздалегідь обмежувати зусилля, наприклад, конструкторів перекладацьких машин» і намагатися встановити робочі можливості подібних машин віршами М. Грибачова чи прозою В. Кочетова 1 20 . Машина сама знайде межі своїх можливостей, а рентабельність – межі її використання. Але мовознавці як свій внесок у спільну справу повинні внести своє знання особливостей структури мови, її багатогранності, внутрішніх перехрещуваних відносин її елементів, а також широких та багатосторонніх зв'язків мови з фізичними, фізіологічними, психічними та логічно<149>ми явищами, специфічними закономірностями функціонування та розвитку мови. Вся сукупність цих знань необхідна конструкторам відповідних машин, щоб не блукати в неправильних напрямках, але зробити пошуки цілеспрямованими та чітко орієнтованими. Навіть і той дуже короткий оглядвипадків застосування математичних методів до лінгвістичної проблематики, який був зроблений у цьому нарисі, переконує, що такі знання не будуть зайвими для представників точних наук.

На підставі всіх викладених міркувань можна, очевидно, дійти деяких загальних висновків.

Отже, математична лінгвістика? Якщо під цим розуміється застосування математичних методів як універсальної відмички для вирішення всіх лінгвістичних проблем, такі претензії слід визнати абсолютно неправомірними. Все, що було зроблено у цьому напрямі, поки що дуже мало чи навіть зовсім не сприяло вирішенню традиційних проблем науки про мову. У гіршому випадку застосування математичних методів супроводжується очевидними безглуздями або з лінгвістичної точки зору є абсолютно безглуздим. У кращому разі математичні методи можуть бути використані як допоміжні прийоми лінгвістичного дослідження, будучи поставлені на службу конкретним та обмеженим за своїм характером лінгвістичним завданням. Ні про яку «квантитативну філософію мови» при цьому не може бути й мови. На самостійність науки про мову свого часу зазіхали і фізика, і психологія, і фізіологія, і логіка, і соціологія, і етнологія, але не змогли підкорити мовознавства. Сталося протилежне - мовознавство скористалося досягненнями цих наук й у потрібній собі стало користуватися їх допомогою, збагативши цим арсенал своїх дослідницьких прийомів. Тепер, мабуть, настала черга математики. Слід сподіватися, що ця нова співдружність також сприятиме зміцненню науки про мову, удосконаленню її робочих прийомів, збільшенню їх різноманіття. Про математичну лінгвістику, отже, правомірно такою ж мірою говорити, як і про фізичну лінгвістику, фізіологічну лінгвістику, логічну лінгвістику, психологічну лінгвістику та<150>т. д. Таких лінгвістик немає, є тільки одна лінгвістика, яка з користю для себе реалізує дані інших наук як допоміжні дослідницькі засоби. Таким чином, немає жодних підстав відступати перед натиском нової науки і легко поступатися їй завойовані позиції. Тут дуже доречно згадати слова А. Мартіне: «Можливо, це і спокусливо - приєднатися шляхом використання кількох вдало вибраних термінів до того чи іншого великого руху думки, або заявити якоюсь математичною формулою про суворість свого міркування. Однак лінгвістам вже настав час усвідомити самостійність їхньої науки і звільнитися від того комплексу неповноцінності, який змушує їх пов'язувати будь-яку свою дію з тим чи іншим загальнонауковим принципом, внаслідок чого контури дійсності завжди стають лише більш розпливчастими, натомість, щоб стати чіткішими» 1 21 .

Отже, математика сама собою і мовознавство саме собою. Це аж ніяк не виключає їхньої взаємної допомоги чи дружньої зустрічі у спільній роботі над спільними проблемами. Такого роду місцем застосування приголосних зусиль двох наук і є все широке коло проблем, що входять у прикладне мовознавство і мають велику народногосподарську значимість. Слід побажати лише, щоб у своїй спільній роботі обидві науки виявили максимум взаєморозуміння, що, безсумнівно, сприятиме й максимальній плідності їхньої співпраці.<151>

Зміст
Вступ
Розділ 1. Історія застосування математичних методів у лінгвістиці
1.1. Становлення структурної лінгвістики межі ХІХ – ХХ століть
1.2. Застосування математичних методів у лінгвістиці у другій половині ХХ ст.
Висновок
Література
Вступ
У ХХ столітті намітилася тенденція до взаємодії та взаємопроникнення різних галузей знань, що триває і донині. Поступово стираються межі між окремими науками; з'являється все більше галузей розумової діяльності, що знаходяться «на стику» гуманітарного, технічного та природничо знання.
Інша очевидна особливість сучасності – прагнення до вивчення структур та складових їх елементів. Тому все більше місце як у наукової теорії, і на практиці приділяється математиці. Стикаючись, з одного боку, з логікою та філософією, з іншого боку, зі статистикою (а, отже, і з суспільними науками), математика все глибше проникає в ті сфери, які протягом тривалого часу було прийнято вважати чисто «гуманітарними», розширюючи їхній евристичний потенціал (відповідь на запитання «скільки» часто допоможе відповісти і на запитання «що» та «як»). Винятком не стало і мовознавство. курсової роботи– коротко висвітлити зв'язок математики з такою галуззю мовознавства, як лінгвістика. Починаючи з 50-х років минулого століття, математика застосовується в лінгвістиці при створенні теоретичного апарату для опису будови мов (як природних, так і штучних). Однак слід сказати, що вона не одразу знайшла собі подібне практичне застосування. Спочатку математичні методи в лінгвістиці стали використовуватися у тому, щоб уточнити основні поняття мовознавства, проте з недостатнім розвитком комп'ютерної техніки подібна теоретична посилка стала знаходити застосування практично. Розв'язання таких завдань, як машинний переклад, машинний пошук інформації, автоматична обробка тексту вимагало нового підходу до мови. Перед лінгвістами назріло питання: як навчитися представляти мовні закономірності в тому вигляді, в якому їх можна подавати безпосередньо на техніку. Популярним у час терміном «математична лінгвістика» називають будь-які лінгвістичні дослідження, у яких застосовуються точні методи (а поняття точних методів у науці завжди тісно пов'язані з математикою). Деякі вчені минулих років вважають, що саме вираз не можна зводити вранг терміну, оскільки він позначає не якусь особливу «лінгвістику», а лише новий напрямок, орієнтований на вдосконалення, підвищення точності та надійності методів вивчення мови. У лінгвістиці використовуються як кількісні (алгебраїчні), і некількісні методи, що зближує її з математичної логікою, отже, і з філософією, і навіть із психологією. Ще Шлегельот відзначав взаємодію мови та свідомості, а видний лінгвіст початку ХХ століття Фердинанд де Соссюр (про його вплив на становлення математичних методів у лінгвістиці розповім пізніше) пов'язував структуру мови з її приналежністю до народу. Сучасний дослідник Л. Перловський йде далі, ототожнюючи кількісні характеристики мови (наприклад, кількість пологів, відмінків) з особливостями національного менталітету (про це у розділі 2.2, «Статистичні методи в лінгвістиці»).
Взаємодія математики та мовознавства – тема багатогранна, і у своїй роботі я зупинюся не на всіх, а насамперед на її прикладних аспектах.
Глава I. Історія застосування математичних методів у лінгвістиці
1.1 Становлення структурної лінгвістики межі ХІХ – ХХ століть
Математичний опис мови заснований на уявленні про мову як про механізм, що сягає відомого швейцарського лінгвіста початку ХХ століття Фердинанду де Соссюру.
Початкова ланка його концепції - теорія мови як системи, що складається з трьох частин (власне мова - langue, мова - parole, і мовну діяльність - langage), в якій кожне слово (член системи) розглядається не саме по собі, а у зв'язку з іншими ...


Top