Історія застосування математичних методів у лінгвістиці. Роздуми про взаємодію лінгвістики та математики

Становлення структурної лінгвістики межі ХІХ – ХХ століть. Статистичні методи вивчення мови. Застосування математичних методів у лінгвістиці у другій половині ХХ ст. Вивчення мови методами формальної логіки Особливості машинного переказу.

ВСТУП

Розділ 1. Історія застосування математичних методів у лінгвістиці

1.1. Становлення структурної лінгвістики межі ХІХ - ХХ століть

1.2. Застосування математичних методів у лінгвістиці у другій половині ХХ ст.

Розділ 2. Окремі приклади використання математики у лінгвістиці

2.1. Машинний переклад

2.2.Статистичні методи у вивченні мови

2.3. Вивчення мови методами формальної логіки

2.4. Перспективи застосування математичних методів у лінгвістиці

Висновок

Література

Додаток 1. Ronald Schleifer. Ferdinand de Saussure

Додаток 2. Фердінанд де Соссюр (переклад)

ВСТУП

У ХХ столітті намітилася тенденція до взаємодії та взаємопроникнення різних областей знань, що триває і донині. Поступово стираються межі між окремими науками; з'являється все більше галузей розумової діяльності, що знаходяться «на стику» гуманітарного, технічного та природничо знання.

Інша очевидна особливість сучасності - прагнення до вивчення структур та складових їх елементів. Тому все більше місце як у науковій теорії, так і на практиці приділяється математиці. Стикаючись, з одного боку, з логікою та філософією, з іншого боку, зі статистикою (а, отже, і з суспільними науками), математика все глибше проникає в ті сфери, які протягом довгого часу було прийнято вважати чисто «гуманітарними», розширюючи їхній евристичний потенціал (відповідь на запитання «скільки» часто допоможе відповісти і на запитання «що» та «як»). Винятком не стало і мовознавство.

Мета моєї курсової - коротко висвітлити зв'язок математики з такою галуззю мовознавства, як лінгвістика. Починаючи з 50-х років минулого століття, математика застосовується в лінгвістиці при створенні теоретичного апарату для опису будови мов (як природних, так і штучних). У цьому слід сказати, що вона відразу знайшла собі подібне практичне застосування. Спочатку математичні методи в лінгвістиці стали використовуватися для того, щоб уточнити основні поняття мовознавства, проте з розвитком комп'ютерної техніки подібна теоретична посилка почала знаходити застосування на практиці. Розв'язання таких завдань, як машинний переклад, машинний пошук інформації, автоматична обробка тексту вимагало нового підходу до мови. Перед лінгвістами назріло питання: як навчитися репрезентувати мовні закономірності в тому вигляді, в якому їх можна подавати безпосередньо на техніку. Популярним у час терміном «математична лінгвістика» називають будь-які лінгвістичні дослідження, у яких застосовуються точні методи (а поняття точних методів у науці завжди тісно пов'язані з математикою). Деякі вчені минулих років вважають, що саме вираз не можна зводити в ранг терміна, оскільки він позначає не якусь особливу «лінгвістику», а лише новий напрямок, орієнтований на вдосконалення, підвищення точності та надійності методів вивчення мови. У лінгвістиці використовуються як кількісні (алгебраїчні), і некількісні методи, що зближує її з математичної логікою, отже, і з філософією, і навіть із психологією. Ще Шлегель наголошував на взаємодії мови і свідомості, а видний лінгвіст початку ХХ століття Фердинанд де Соссюр (про його вплив на становлення математичних методів у лінгвістиці розповім пізніше) пов'язував структуру мови з її приналежністю до народу. Сучасний дослідник Л. Перловський йде далі, ототожнюючи кількісні характеристики мови (наприклад, кількість пологів, відмінків) з особливостями національного менталітету (про це розділ 2.2, «Статистичні методи в лінгвістиці»).

Взаємодія математики та мовознавства - тема багатогранна, і у своїй роботі я зупинюся не на всіх, а насамперед на її прикладних аспектах.

Глава I.Історія застосування математичних методів у лінгвістиці

1.1 Становлення структурної лінгвістикина рубежі XIX – ХХ століть

Математичний опис мови заснований на уявленні про мову як механізм, що сходить до відомого швейцарського лінгвіста початку ХХ століття Фердинанду де Соссюру.

Початкова ланка його концепції - теорія мови як системи, що складається з трьох частин (власне мова - langue, мова - parole, та мовну діяльність - langage), в якій кожне слово (член системи) розглядається не саме собою, а у зв'язку з іншими членами. Як згодом зазначив інший видний лінгвіст, данець Луї Єльмслєв, Соссюр «перший вимагав структурного підходу до мови, тобто наукового опису мови шляхом реєстрації співвідношень між одиницями».

Розуміючи мову як ієрархічну структуру, Соссюр першим поставив проблему цінності, важливості мовних одиниць. Окремі явища та події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не власними силами, а в системі, в якій вони співвіднесені з подібними ж складовими.

Структурною одиницею мови Соссюр вважав слово, «знак», у якому поєднувалися звучання та зміст. Жоден з цих елементів немає один без одного: тому носію мови зрозумілі різні відтінки значення багатозначного слова як окремого елемента в структурному цілому, в мові.

Таким чином, в теорії Ф. де Соссюра можна побачити взаємодію лінгвістики, з одного боку, з соціологією та соціальною психологією (слід зазначити, що в цей же час розвиваються феноменологія Гуссерля, психоаналіз Фрейда, теорія відносності Ейнштейна, відбуваються експерименти над формою та змістом у літератури, музики та образотворчого мистецтва), з іншого боку - з математикою (поняття системності відповідає алгебраїчної концепції мови). Подібна концепція змінила поняття мовної інтерпретації як такої: явища почали трактуватися не щодо причин їх виникнення, а щодо сьогодення та майбутнього. Тлумачення перестало бути незалежним від намірів людини (не дивлячись на те, що наміри можуть бути безособовими, «несвідомими» у фрейдистському розумінні цього слова).

Функціонування ж мовного механізму проявляється через мовну діяльність носіїв мови. Результатом промови є звані «правильні тексти» - послідовності мовних одиниць, підпорядковуються певним закономірностям, багато з яких допускають математичний опис. Вивченням методів математичного опису правильних текстів (насамперед, пропозицій) займається теорія методів опису синтаксичної структури. У подібній структурі мовні аналогії визначені не за допомогою властивих їм якостей, а за допомогою системних («структурних») відносин.

На Заході сосюрівські ідеї розвивають молодші сучасники великого швейцарського лінгвіста: у Данії - вже згаданий мною Л. Єльмсльов, який дав початок алгебраїчної теорії мови у своїй праці "Основи лінгвістичної теорії", в США - Е. Сепір, Л. Блумфілд у Чехії – російський учений-емігрант Н. Трубецькой.

Статистичними ж закономірностями у вивченні мови став займатися ніхто інший, як основоположник генетики Георг Мендель. Тільки 1968 року філологи виявили, що, виявляється, останні роки життя він був захоплений вивченням лінгвістичних явищ з допомогою методів математики. Цей метод Мендель привніс у лінгвістику з біології; у дев'яності роки дев'ятнадцятого століття лише найсміливіші лінгвісти і біологи заявляли про доцільність такого аналізу. В архіві монастиря св. Томаша в Брно, абатом якого був Мендель, були знайдені листки зі стовпцями прізвищ, що закінчуються на «mann», «bauer», «mayer», і з якимись дробами та обчисленнями. Прагнучи виявити формальні закони походження фамільних імен, Мендель робить складні підрахунки, в яких враховує кількість голосних і приголосних у німецькій мові, загальна кількість слів, кількість прізвищ і т.д.

У нашій країні структурна лінгвістика почала розвиватися приблизно водночас, як і Заході - межі XIX-XX століть. Поруч із Ф. де Соссюром поняття мови як системи розробляли у працях професора Казанського університету Ф.Ф. Фортунатов та І.А. Бодуен де Куртене. Останній упродовж тривалого часу листувався з де Соссюром, відповідно, женевська та казанська школи мовознавства співпрацювали одна з одною. Якщо Соссюра можна назвати ідеологом «точних» методів у лінгвістиці, Бодуен де Куртене заклав практичні основи їх застосування. Він першим відокремив лінгвістику (як точнунауку, що використовує статистичні методи та функціональну залежність) від філології (спільності гуманітарних дисциплін, що вивчають духовну культуру через мову та мову). Сам учений вважав, що «мова знання може принести користь у найближчому майбутньому, лише звільнившись від обов'язкового союзу з філологією та історією літератури». «Випробовуваним полігоном» для впровадження математичних методів у лінгвістику стала фонологія – звуки як «атоми» мовної системи, що мають обмежену кількість легко вимірних властивостей, були найзручнішим матеріалом для формальних, суворих методів опису. Фонологія заперечує наявність сенсу у звуку, отже, у дослідженнях усувався «людський» чинник. У цьому сенсі фонеми подібні до фізичних або біологічних об'єктів.

Фонеми, як найдрібніші мовні елементи, прийнятні сприйняття, є окрему сферу, окрему «феноменологічну реальність». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але у всіх випадках людина, яка володіє англійською, сприйматиме її як «т». Головне, що фонема виконуватиме свою головну – сенсорозрізнювальну – функцію. Більше того - відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншій; наприклад "л" і "р" в англійській різні, у той час як в інших мовах це різновиди однієї фонеми (подібно до англійської "т", сказаному з придихом або без). Великий словниковий запас будь-якої природної мови є набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для вимовлення та написання близько мільйона слів використовується лише 40 фонем.

Звуки мови є системно організований набір характеристик. У 1920-1930-ті, за Соссюром, Якобсон і Н.С.Трубецкой виділили «відмінні риси» фонем. Ці риси засновані на будові органів мови – язика, зубів, голосових зв'язок. Скажімо, в англійській різниця між "т" і "д" полягає в наявності або відсутності "голосу" (напрузі голосових зв'язок) і в рівні голосу, що відрізняє одну фонему від іншої. Отже, фонологію вважатимуться прикладом загального мовного правила, описаного Соссюром: «У мові є лише відмінності» . Більш важливо навіть це: відмінність зазвичай має на увазі точні умови, між якими воно й перебуває; але у мові існують лише відмінності без точних умов. Розглядаємо ми «позначення» чи «позначається» - у мові немає ні понять, ні звуків, які б до того, як розвинулася мовна система.

Таким чином, в соссюрівському мовознавстві феномен, що вивчається, розуміється як зведення зіставлень і протиставлень мови. Мова - це вираз значення слів, і засіб спілкування, причому ці дві функції ніколи не збігаються. Ми можемо помітити чергування форми та змісту: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють, щоб створити певний зміст. Оскільки елементи мови випадкові, ні контраст, ні поєднання неможливо знайти основою. Отже, у мові відмітні ознаки формують фонетичний контраст іншому рівні розуміння, фонеми поєднуються в морфеми, морфеми - у слова, слова - у речення тощо. У будь-якому випадку ціла фонема, слово, речення і т.д. є чимось більшим, ніж просто сума складових.

Соссюр запропонував ідею нової науки ХХ століття, окремо від лінгвістики вивчаючої роль знаків у суспільстві. Соссюр назвав цю науку семіологією (від грецького «semeion» – знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920-1930 і в Парижі в 1950-1960, розширила вивчення мови і лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своєму курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою вивчити в системі проблему «імовірності» у мові. Таке дослідження допомагає зосередитись на «речовій стороні» ймовірності; "ключове слово", анаграму якого шукає Соссюр, як стверджує Жан Старобінський, "інструмент для поета, а не джерело життя вірша". Вірш служить у тому, щоб поміняти місцями звуки ключового слова. За словами Старобинського, у цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, у його роботах помітне бажання уникнути питань, пов'язаних зі свідомістю: «оскільки поезія виражається у словах, а й у тому, що породжують ці слова, вона виходить з-під контролю свідомості залежить тільки від законів мови» (cм . Додаток 1).

Спроба Соссюра вивчити власні імена в пізній римській поезії підкреслює одну зі складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюрівської лінгвістики, що виключає можливість аналізу сенсу. Тодоров робить висновок, що у наші дні праці Соссюра виглядають на диво послідовними у небажанні вивчати символи явища, мають чітко певне значення [Додаток 1]. Досліджуючи анаграми, Соссюр звертає увагу лише з повторення, але з попередні варіанти. . . . Вивчаючи «Пісню про Нібелунги», він визначає символи лише для того, щоб привласнити їх хибним читанням: якщо вони ненавмисні, символів не існує. Зрештою, у своїх працях із загальної лінгвістики він припускає існування семіології, описує як лінгвістичні знаки; але це припущення обмежується тим, що семіологія може описувати лише випадкові, довільні знаки.

Якщо це справді так, то тільки тому, що не міг уявити «намір» без предмета; він не міг до кінця подолати прірву між формою та змістом - у його працях це перетворювалося на питання. Натомість він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, заснованими на історії та суб'єктивних здогадах, і методами випадкової інтерпретації, заснованих на цих концепціях, і, з іншого боку, структуралістськими концепціями, що стирають протистояння між формою та змістом (суб'єктом та об'єктом), значенням і походженням у структуралізмі, психоаналізі і навіть квантової механіки - праці Фердинанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Російські вчені були представлені і на Першому міжнародному конгресі лінгвістів у Гаазі у 1928 році. С. Карцевський, Р. Якобсон та Н. Трубецькой виступили з доповіддю, в якій розглядалася ієрархічна структура мови – у дусі найсучасніших для початку минулого століття уявлень. Якобсон у своїх працях розвивав ідеї Соссюра у тому, що базові елементи мови повинні вивчатися, насамперед, у зв'язку зі своїми функціями, а чи не з причинами їх виникнення.

На жаль, після приходу у 1924 році до влади Сталіна вітчизняне мовознавство, як і багато інших наук, відкидає назад. Багато талановитих вчених змушені були емігрувати, були вислані з країни або загинули в таборах. Тільки з середини 1950-х став можливий деякий плюралізм теорій - про це в розділі 1.2.

1.2 Застосування математичних методів у лінгвістиці у другій половині ХХ ст.

До середини ХХ століття сформувалося чотири світові лінгвістичні школи, кожна з яких виявилася родоначальником певного «точного» методу. Ленінградська фонологічна школа(її родоначальником був учень Бодуена де Куртене Л.В. Щерба) використовувала як основний критерій узагальнення звуку у вигляді фонеми психолінгвістичний експеримент, заснований на аналізі мови носіїв мови.

Вчені Празького лінгвістичного гуртка, зокрема – його засновник Н.С. Трубецькій, що емігрував з Росії, розробили теорію опозицій - семантична структура мови була описана ними як набір оппозитивно побудованих семантичних одиниць - сем. Ця теорія застосовувалася у вивченні як мови, а й художньої культури.

Ідеологами американського дескриптивізмубули мовознавці Л. Блумфілд та Е. Сепір. Мова представлялася дескриптивістам у вигляді сукупності мовних висловлювань, які були головним об'єктом їх дослідження. У центрі їхньої уваги опинилися правила наукового опису (звідси назва) текстів: вивчення організації, аранжування та класифікація їх елементів. Формалізація аналітичних процедур у галузі фонології та морфології (розробка принципів дослідження мови на різних рівнях, дистрибутивного аналізу, методу безпосередньо складових тощо) призвела до постановки загальних питань лінгвістичного моделювання. Неувага до плану змісту мови, а також парадигматичного боку мови не дозволила дескриптивістам досить повно інтерпретувати мову як систему.

У 1960-х роках розвивається теорія формальних граматик, що виникла головним чином завдяки роботам американського філософа та лінгвіста Н. Хомського. Він по праву вважається одним із найвідоміших сучасних вчених та громадських діячів, йому присвячено безліч статей, монографій і навіть повнометражний документальний фільм. На ім'я принципово нового способу опису синтаксичної структури, винайденого Хомським - генеративної (що породжує) граматики - відповідна течія в лінгвістиці отримала назву генеративізму.

Хомський, нащадок вихідців з Росії, з 1945 року вивчав у Пенсільванському університеті лінгвістику, математику та філософію, перебуваючи під сильним впливом свого вчителя Зеліга Харріса - як і Герріс, Хомський вважав і вважає свої політичні погляди близькими до анархізму (досі він відомий критик існуючого політичного устрою США і як один із духовних лідерів антиглобалізму).

Перша велика наукова робота Хомського, магістерська дисертація «Морфологія сучасного івриту » (1951), і залишилася неопублікованою. Докторський ступінь Хомський отримав у Пенсільванському університеті в 1955 році, проте велика частина досліджень, покладених в основу дисертації (повністю опублікованої лише в 1975 році під назвою «Логічна структура лінгвістичної теорії») та його першої монографії «Синтаксичні структури» (Syntactic Structures, 1975). пер 1962), була виконана в Гарвардському університеті в 1951-1955. У тому ж 1955 р. вчений перейшов до Массачусетського технологічного інституту, професором якого він став у 1962 році.

У розвитку теорія Хомського пройшла кілька етапів.

У першій монографії «Синтактичні структури» вчений представив мову як механізм породження нескінченного безлічі пропозицій за допомогою кінцевого набору граматичних засобів. Для опису мовних властивостей він запропонував поняття глибинної (прихованої від безпосереднього сприйняття і породжуваної системою рекурсивних, тобто можуть багаторазово застосовуватися, правил) і поверхневої (безпосередньо сприймається) граматичних структур, а також трансформацій, що описують перехід від глибинних структур до поверхневих. Однією глибинною структурою можуть відповідати декілька поверхневих (наприклад, пасивна конструкція Указ підписується президентомвиводиться з тієї ж глибинної структури, що й активна конструкція Президент підписує указ) і навпаки (так, неоднозначність Мати любить дочкуописується як результат збігу поверхневих структур, що сягають двох різних глибинних, в одній з яких мати - та, хто любить дочку, а в іншій - та, кого любить дочка).

Стандартною теорією Хомського вважається модель Аспектів, викладена в книзі Хомського Аспекти теорії синтаксису. У цій моделі у формальну теорію вперше вводилися правила семантичної інтерпретації, що приписують значення глибинним структурам. В «Аспектах» мовна компетенція протиставлена ​​вживанню мови (performance), прийнята так звана гіпотеза Катца - Постала про збереження сенсу при трансформації, у зв'язку з чим виключено поняття факультативної трансформації, а також запроваджено апарат синтаксичних ознак, що описують лексичну сполучність.

У 1970-ті Хомський працює над теорією управління та зв'язування (GB-теорія – від слів governmentі binding) - більш загальної, ніж попередня. У ній вчений відмовився від специфічних правил, що описують синтаксичні структури конкретних мов. Усі трансформації замінили однією універсальною трансформацією переміщення. В рамках GB-теорії існують і приватні модулі, кожен із яких відповідає за свою частину граматики.

Вже нещодавно, 1995 року, Хомський висунув мінімалістську програму, де людська мова описується подібно до машинної. Це лише програма – не модель і не теорія. У ній Хомський виділяє дві основні підсистеми мовного апарату людини: лексикон і обчислювальну систему, і навіть два інтерфейси - фонетичний і логічний.

Формальні граматики Хомського стали класичними для опису як природних, а й штучних мов - зокрема, мов програмування. Розвиток структурної лінгвістики у другій половині ХХ століття можна вважати «хомскіанською революцією».

Московська фонологічна школа, представниками якої були А.А. Реформатський, В.М. Сидоров, П.С. Кузнєцов, А.М. Сухотін, Р.І. Аванесов, використовувала таку ж теорію вивчення фонетики. Поступово «точні» методи починають застосовуватися не лише фонетики, а й синтаксису. Структурністю мови починають займатися і лінгвісти, і математики – як у нас, так і за кордоном. У 1950-60-ті в СРСР починається новий етап у взаємодії математики та лінгвістики, пов'язаний із розробкою систем машинного перекладу.

Поштовхом до початку цих робіт у нашій країні послужили перші розробки в галузі машинного перекладу в США (хоча перший механізований переказний пристрій П.П. Смирнова-Троянського було винайдено в CCCР ще в 1933 році, воно, будучи примітивним, не набуло поширення). У 1947 році А. Бутт і Д. Бріттен придумали код для послівного перекладу за допомогою ЕОМ, через рік Р. Річенс запропонував правило розбиття слів на основу і закінчення при машинному перекладі. У роки досить сильно відрізнялися від сучасних. Це були дуже великі та дорогі машини, які займали цілі кімнати та вимагали для свого обслуговування великий штат інженерів, операторів та програмістів. В основному ці комп'ютери використовувалися для здійснення математичних розрахунків для потреб військових установ - нове в математиці, фізиці та техніці служило насамперед військовій справі. На ранніх етапах розробка МП активно підтримувалася військовими, при цьому (в умовах «холодної війни») в США розвивалося російсько-англійське напрям, а в СРСР - англо-російське.

У січні 1954 року в Массачусетському технічному університеті відбувся "Джорджтаунський експеримент" - перша публічна демонстрація перекладу з російської мови на англійську машиною ІБМ-701. Реферат повідомлення про успішне проходження експерименту, зроблений Д.Ю. Пановим, народився РЖ «Математика», 1954, №10: «Переклад з однієї мови іншою з допомогою машини: звіт про перше успішному випробуванні».

До робіт з машинного перекладу Д. Ю. Панов (тоді директор Інституту наукової інформації - ІНІ, пізніше ВІНІТІ) залучив І. К. Бєльську, яка пізніше очолить групу машинного перекладу в Інституті точної математики та обчислювальної техніки АН СРСР. До кінця 1955 відноситься перший досвід перекладу з англійської мови на російську за допомогою машини БЭСМ. Програми для БЕСМ складали Н.П. Трифонов та Л.М. Корольов, кандидатську дисертацію якого було присвячено методам побудови словників для машинного перекладу.

Паралельно роботи з машинного перекладу велися у Відділенні прикладної математики Математичного інституту АН СРСР (зараз Інститут прикладної математики імені М.В. Келдиша РАН). З ініціативи математика А.А. Ляпунова. До робіт з перекладу текстів на машині «Стріла» з французької на російську він залучив аспірантку МІАН О.С. Кулагіну та своїх учениць Т.Д. Вентцель та Н.М. Рікко. Уявлення Ляпунова та Кулагіної про можливість використання техніки для перекладу з однієї мови на іншу були опубліковані в журналі «Природа», 1955 №8. З кінця 1955 року до них приєдналася Т.М. Молошня, потім розпочала самостійну роботу над алгоритмом англо-російського перекладу.

Р.Фрумкіна, яка займалася на той час алогритмом перекладу з іспанської, згадує, що на цьому етапі робіт складно було робити якісь послідовні кроки. Набагато частіше доводилося наслідувати евристичний досвід - свій чи колег.

У цьому перше покоління систем машинного перекладу було дуже недосконалим. Усі вони базувалися на алгоритмах послідовного перекладу "слово за словом", "фраза за фразою" - смислові зв'язки між словами та реченнями ніяк не враховувалися. Наприклад можна навести пропозиції: « John був looking for his toy box.Finally he found it. The box was in the pen.John was very happy. (Джон шукав свою іграшкову коробку. Нарешті він її знайшов. Коробка була в манежі. Джон був дуже щасливий.)». "Pen" в даному контексті - не "ручка" (інструмент для письма), а "дитячий манеж" ( play-pen). Знання синонімів, антоніів та переносних значень складно вводити в комп'ютер. Перспективним напрямом ставала розробка машинних систем, орієнтованих використання людиною-перекладачем.

Згодом зміну системам прямого перекладу прийшли Т-системи (від англійського слова «transfer» - перетворення), у яких переклад здійснювався лише на рівні синтаксичних структур. В алгоритмах Т-систем використовувався механізм, що дозволяє побудувати синтаксичну структуру за правилами граматики мови вхідної речення (подібно до того, як вчать іноземної мови в середній школі), а потім синтезувати вихідну пропозицію, перетворюючи синтаксичну структуру і підставляючи з словника потрібні слова.

Ляпунов говорив про переклад шляхом отримання сенсу тексту, що перекладається, і його подання іншою мовою. Підхід до побудови систем машинного перекладу, заснований на отриманні смислового уявлення вхідного речення шляхом його семантичного аналізу та синтезу вхідної речення за отриманим смисловим уявленням, досі вважається найбільш досконалим. Такі системи називають І-системами (від слова "інтерлінгва"). При цьому завдання щодо їх створення, поставлене ще наприкінці 50-х – на початку 60-х, не вирішене повністю досі, незважаючи на зусилля Міжнародної федерації IFIP – світової спільноти вчених у галузі обробки інформації.

Вчені замислилися над тим, як потрібно формалізувати та будувати алгоритми для роботи з текстами, які словники треба вводити в машину, які лінгвістичні закономірності слід використовувати при машинному перекладі. Такими уявленнями традиційна лінгвістика не мала - не тільки в частині семантики, але і в частині синтаксису. Для жодної мови на той час не існувало переліків синтаксичних конструкцій, не були вивчені умови їхньої сполучуваності та взаємозмаєняльності, не були розроблені правила побудови великих одиниць синтаксичної структури з дрібніших складових елементів.

Потреба створення теоретичних основ машинного перекладу і призвела до формування та розвитку математичної лінгвістики. Провідну роль цій справі СРСР зіграли математики А.А. Ляпунов, О.С. Кулагіна, В.А. Успенський, лінгвісти В.Ю. Розенцвейг, П.С. Кузнєцов, Р.М. Фрумкіна, А.А. Реформатський, І.А. Мельчук, В.В. Іванов. Дисертація Кулагіної була присвячена дослідженню формальної теорії граматик (одночасно з Н.Хомським у США), Кузнєцов висунув завдання аксіоматизації лінгвістики, що сходить до робіт Ф.Ф. Фортунатова.

6 травня 1960 року було прийнято Постанову Президії АН СРСР «Про розвиток структурних та математичних методів вивчення мови», в Інституті мовознавства та Інституті російської були створені відповідні підрозділи. З 1960 року у провідних гуманітарних вузах країни - філологічному факультеті МДУ, Ленінрадському, Новосибірському університетах, МДПІІЯ - розпочалася підготовка кадрів у галузі автоматичної обробки тексту.

При цьому роботи з машинного перекладу цього періоду, званого «класичним», є радше теоретичним, ніж практичним інтересом. Економічно ефективні системи машинного перекладу стали створюватися лише у вісімдесяті роки минулого століття. Про це я розповім пізніше, у розділі 2.1 «Машинний переклад».

До 1960-х - 70-х років відносяться глибокі теоретичні розробки, що використовують методи теорії множин і математичної логіки, такі, як теорія поля і теорія нечітких множин.

Автором теорії поля у лінгвістиці був радянський поет, перекладач та лінгвіст В.Г. Адмоні. Свою теорію він розробляв на основі німецької мови. У Адмоні поняття «поле» позначає довільну непорожню безліч мовних елементів (наприклад, «лексичне поле», «семантичне поле»).

Структура поля неоднорідна: воно складається з ядра, елементи якого мають повний набір ознак, що визначають безліч, і периферії, елементи якої можуть мати як ознаки даної множини (не всіма), так і сусідніх. Наведу приклад, що ілюструє цей вислів: скажімо, в англійській мові поле складних слів («day-dream» - «мріяти» важковідокремлено від поля словосполучень («tear gas» - «сльозогінний газ»).

З теорією поля тісно пов'язана вже згадана вище теорія нечітких множин. У її обгрунтуванням займалися лінгвісти В.Г. Адмоні, І.П. Іванова, Г.Г. Поченцов, проте її родоначальником був американський математик Л. Заде, який у 1965 році випустив статтю «Fuzzy Logic». Даючи математичне обгрунтування теорії нечітких множин, Заде розглядав їх у лінгвістичному матеріалі.

У цій теорії мова йде вже не стільки про належність елементів до даної множини (Аа), скільки про ступінь цієї приналежності (Аа), оскільки периферійні елементи можуть тією чи іншою мірою належати кільком полям. Заде (Лофті-заде) був вихідцем з Азербайджану, до 12 років мав практику спілкування чотирма мовами - азербайджанською, російською, англійською та перською - і користувався трьома різними алфавітами: кирилицею, латинською, арабською. Коли вченого запитують, що спільного між теорією нечітких множин і лінгвістикою, він не заперечує цього зв'язку, але уточнює: «Я не впевнений, що вивчення цих мов дуже вплинуло на моє мислення. Якщо це й мало місце, то хіба підсвідомо». У юності Заде навчався у Тегерані у пресвітеріанській школі, а після Другої світової війни емігрував до США. «Питання не в тому, чи я американець, російський, азербайджанець чи хтось ще, - сказав він в одній з бесід, - я сформований усіма цими культурами і народами і почуваюся досить комфортабельно серед кожного з них» . У цих словах є щось споріднене з тим, що характеризує теорію нечітких множин - відхід від однозначних визначень і різких категорій.

У нашій країні в 70-ті перекладаються та вивчаються праці західних лінгвістів ХХ століття. І.А. Мельчук переклав російською мовою твори М. Хомського. Н.А. Слюсарьова у своїй книзі «Теорія Ф. де Соссюра у світлі сучасної лінгвістики» пов'язує постулати соссюровського вчення з актуальними проблемами лінгвістики 70-х. Намічається тенденція до подальшої математизації лінгвістики. У провідних вітчизняних вузах йде підготовка кадрів за спеціальністю «Математична (теоретична, прикладна) лінгвістика». У той самий час у країнах відбувається різкий стрибок у розвитку обчислювальної техніки, навіщо потрібні дедалі нові лінгвістичні основи.

У 1980-х роках професор Інституту сходознавства АН Ю.К. Лекомцев, займаючись аналізом мови лінгвістики через аналіз схем, таблиць та інших видів записи, які у лінгвістичних описах, розглядає математичні системи, придатні цих цілей (переважно - системи матричної алгебри).

Таким чином протягом усього ХХ століття йшло зближення точних і гуманітарних наук. Взаємодія математики з лінгвістикою все частіше знаходила практичне застосування. Про це – у наступному розділі.

Розділ 2. Окремі приклади використання математики у лінгвістиці

2.1 Машинний переклад

Ідея перекладу з однієї мови на іншу за допомогою універсального механізму виникла кількома століттями раніше, ніж почалися перші розробки в цій галузі - ще в 1649 Рене Декарт запропонував ідею мови, в якій еквівалентні ідеї різних мов виражалися б одним символом. Перші спроби здійснити цю ідею в 1930-40-ті, початок теоретичних розробок у середині століття, удосконалення систем перекладу за допомогою техніки в 1970-80-ті, бурхливий розвиток перекладацької техніки в останнє десятиліття - такі етапи розвитку машинного перекладу як галузі. Саме з робіт із машинного перекладу виросла комп'ютерна лінгвістика як наука.

З розвитком обчислювальної техніки наприкінці 70-х - початку 80-х дослідники задалися більш реалістичними та економічно вигідними цілями - машина ставала не конкурентом (як передбачалося раніше), а помічником людини-перекладача. Машинний переклад перестає служити виключно військовим завданням (всі радянські та американські винаходи та дослідження, орієнтовані, насамперед, російською та англійською мовами, тією чи іншою мірою сприяли «холодній війні»). У 1978 році слова природної мови були передані в об'єднаній мережі Arpa, шістьма роками пізніше в США з'явилися перші програми перекладу мікрокомп'ютерів.

У 70е Комісія Європейських Общин купує англо-французьку версію комп'ютерного перекладача Systran, замовляючи також франко-аглійську та італо-англійську версії, і систему перекладу з російської на англійську, що використовувалася американськими Збройними Силами. Так було закладено основи проекту EUROTRA.

Про відродження машинного перекладу в 70-80-ті роки. свідчать такі факти: Комісія Європейських громад (CEC) купує англо-французьку версію Systran, а також систему перекладу з російської на англійську (остання розвивалася після доповіді ALPAC і продовжувала використовуватись ВПС США та НАСА); крім того, CEC замовляє розробку франко-англійської та італо-англійської версій. Одночасно відбувається швидке розширення діяльності зі створення систем машинного перекладу Японії; США Панамериканська організація охорони здоров'я (PAHO) замовляє розробку іспано-англійського напряму (система SPANAM); ВПС США фінансують розробку системи машинного перекладу в Лінгвістичному дослідному центрі при Техаському університеті в Остіні; група TAUM у Канаді досягає помітних успіхів у розробці своєї системи METEO (для перекладу метеорологічних зведень). Ціла низка проектів, започаткованих у 70-80-ті роки. згодом розвинулися у повноцінні комерційні системи.

За період 1978-93 в США на дослідження в галузі машинного переказу витрачено 20 мільйонів доларів, у Європі – 70 мільйонів, у Японії – 200 мільйонів.

Однією з нових розробок стала технологія TM (translation memory), що працює за принципом накопичення: у процесі перекладу зберігається вихідний сегмент (пропозиція) та його переклад, у результаті утворюється лінгвістична база даних; якщо ідентичний або подібний вихідний сегмент виявляється у тексті, що знову перекладається, він відображається разом з перекладом і зазначенням збігу у відсотках. Потім перекладач приймає рішення (редагувати, відхилити або прийняти переклад), результат якого зберігається системою, тому не потрібно двічі перекладати одну й ту саму пропозицію. В даний час розробником відомої комерційної системи, заснованої на технології TM є система TRADOS (заснована в 1984 р.).

Нині кілька десятків компаній займаються розробкою комерційних систем машинного перекладу, серед них: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvistica b.v. та ін. З'явилася можливість скористатися послугами автоматичних перекладачів безпосередньо в Мережі: alphaWorks; PROMT"s Online Translator; LogoMedia.net; AltaVista"s Babel Fish Translation Service; InfiniT.com; Translating the Internet.

Комерційно ефективні перекладацькі системи з'явилися в другій половині 80-х і в нашій країні. Розширилося саме поняття машинного перекладу (до нього почали відносити «створення низки автоматичних і автоматизованих систем і пристроїв, виконують автоматично чи напівавтоматично весь цикл перекладу чи окремі завдання у діалозі з людиною» ), збільшилися державні асигнування в розвитку цієї галузі.

Основними мовами вітчизняних перекладацьких систем стали російська, англійська, німецька, французька та японська. У Всесоюзному центрі перекладів (ВЦП) було розроблено систему перекладу з англійської та німецької мов російською машиною ЕОМ ЕС-1035 -АНРАП. Вона складалася з трьох словників - вхідних англійської та німецької та вихідної російської - під єдиним програмним забезпеченням. Існувало кілька змінних спеціалізованих словників - з обчислювальної техніки, програмування, радіоелектроніки, машинобудування, сільського господарства, металургії. Система могла працювати у двох режимах - автоматичному та інтерактивному, коли на екрані відображався пофразно вихідний текст та переклад, який людина могла відредагувати. Швидкість перекладу тексту на Анрап (від початку набору до закінчення друку) становила приблизно 100 сторінок на годину.

У 1989 році було створено сімейство комерційних перекладачів типу СПРИНТ, які працювали з російською, англійською, німецькою та японською мовами. Їхньою головною перевагою стала їхня сумісність з IBM PC - таким чином вітчизняні системи машинного перекладу досягали міжнародного рівня якості. У цей час розробляється система машинного перекладу з французької на російський ФРАП, що включає 4 етапи аналізу тексту: графематичний, морфологічний, синтаксичний і семантичний. У ЛДПІ ім. Герцена йшла робота над чотиримовною (англійською, французькою. Іспанською, російською) системою СІЛОД-МП (у промисловому режимі експлуатувалися англо-російський і франко-російський словники.

Для спеціалізованого перекладу текстів електротехнікою існувала система ЕТАП-2. Аналіз вхідного тексту в ній здійснювався на двох рівнях – морфологічному та синтаксичному. Словник ЕТАП-2 містив близько 4 тисяч статей; етап перетворення тексту - близько 1000 правил (96 загальних, 342 приватні, інші - словникові). Все це забезпечувало задовільну якість перекладу (скажімо, заголовок патенту "Optical phase grid arrangement and coupling device having such an arrangement" перекладався як "Пристрій оптичної фазової сітки і пристрій, що з'єднує з таким пристроєм" - незважаючи на тавтологію, сенс збережений).

У Мінському педагогічному інституті іноземних мов на базі англо-російського словника словоформ і оборотів була винайдена система машинного перекладу заголовків), в Інституті сходознавства АН - система перекладу з японської на російську. Створена в Московському НДІ систем автоматизації перша автоматична словниково-термінологічна служба (СЛОТЕРМ) з обчислювальної техніки та програмування містила приблизно 20000 термінів у тлумачному словнику та спеціальних словниках для лінгвістичних досліджень.

Системи машинного перекладу поступово почали використовуватися як за прямим призначенням, а й як важливий компонент автоматичних навчальних систем (на навчання перекладу, контролю орфографічних і граматичних знань).

90-ті роки принесли з собою бурхливий розвиток ринку ПК (від настільних до кишенькових) та інформаційних технологій, широке використання мережі Інтернет (яка стає все більш міжнародною та багатомовною). Все це зробило затребуваним розвиток автоматизованих перекладацьких систем. З початку 1990-х років. ринку систем ПК виходять і вітчизняні розробники.

У липні 1990 року на виставці PC Forum у Москві була представлена ​​перша в Росії комерційна система машинного перекладу під назвою PROMT (PROgrammer's Machine Translation).У 1991 р. було створено ЗАТ [!!! У відповідність до ФЗ-99 від 05.05. 2014 року ця форма замінена на непублічне акціонерне товариство] "Проект МТ", і вже в 1992 р. компанія "ПРОМТ" виграла конкурс NASA на постачання систем МП (ПРОМТ була єдиною неамериканською фірмою на цьому конкурсі). У 1992 р. "ПРОМТ" випускає ціле сімейство систем під новою назвою STYLUS для перекладу з англійської, німецької, французької, італійської та іспанської мов російською та з російської на англійську, а в 1993 р. на базі STYLUS створюється перша у світі система машинного перекладу для Windows. вийшла версія STYLUS 2.0 для Windows 3.Х/95/NT, а в 1995-1996 рр. представлено третє покоління систем машинного перекладу, повністю 32-розрядних STYLUS 3.0 для Windows 95/NT, одночасно з цим успішно завершено розробку абсолютно нових, перших у світі російсько-німецької та російсько-французької систем машинного перекладу.

У 1997 р. підписано угоду з французькою фірмою Softissimo про створення систем перекладу з французької мови на німецьку та англійську та назад, а в грудні цього року була випущена перша у світі система німецько-французького перекладу. У цьому ж році компанія "ПРОМТ" компанія випустила систему, реалізовану за технологією Гігант, що підтримує кілька мовних напрямів в одній оболонці, а також спеціальний перекладач для роботи в Інтернеті WebTranSite.

У 1998 р. випускається ціле сузір'я програм під новою назвою PROMT 98. Через рік компанія ПРОМТ випустила два нових продукти: унікальний пакет програм для роботи в Інтернеті – PROMT Internet, та перекладач для корпоративних поштових систем – PROMT Mail Translator. У листопаді 1999 року PROMT була визнана найкращою системою машинного перекладу серед тестованих французьким журналом PC Expert, обійшовши конкурентів за сумою показників на 30 відсотків. Для корпоративних клієнтів розроблено також спеціальні серверні рішення - корпоративний сервер перекладів PROMT Translation Server (PTS) та Інтернет-рішення PROMT Internet Translation Server (PITS). У 2000 р. "ПРОМТ" оновила всю лінію своїх програмних продуктів, випустивши МП системи нового покоління: PROMT Translation Office 2000, PROMT Internet 2000 та Magic Gooddy 2000.

Переклад у режимі он-лайн за підтримки системи "ПРОМТ" використовується на ряді вітчизняних та зарубіжних сайтів: PROMT's Online Translator, InfiniT.com, Translate.Ru, Lycos та ін., а також в установах різного профілю для перекладу ділової документації, статей та листів (існують системи перекладу, що вбудовуються безпосередньо в Outlook Express та інші поштові клієнти).

В наш час з'являються нові технології машинного перекладу, що базуються на використанні систем штучного інтелекту, статистичних методах. Про останні – у наступному розділі.

2.2 Статистічні методи у вивченні мови

Велика увага в сучасній лінгвістиці приділяється вивченню мовних явищ методами кількісної математики. Кількісні дані часто допомагають більш глибоко осмислити явища, що вивчаються, їх місце і роль у системі суміжних явищ. Відповідь на запитання «скільки» допомагає відповісти і на запитання «що», «як», «чому» – такий евристичний потенціал кількісної характеристики.

Чималу роль статистичні методи грають у створенні систем машинного перекладу (див. Розділ 2.1). При статистичному підході проблема перекладу у термінах каналу з перешкодами. Уявімо, що нам потрібно перекласти пропозицію з англійської на російську. Принцип каналу з перешкодами пропонує нам таке пояснення відносин між англійською та російською фразою: англійська пропозиція є не що інше, як російська пропозиція, спотворена якимось шумом. Для того щоб відновити вихідну російську пропозицію, нам потрібно знати, що саме люди зазвичай говорять російською мовою і як російські фрази спотворюються до стану англійської. Переклад здійснюється шляхом пошуку такої російської пропозиції, яка максимізує твори безумовної ймовірності російської пропозиції та ймовірності англійської пропозиції (оригіналу) за умови даної російської пропозиції. Згідно з теоремою Байєса, ця російська пропозиція є найбільш вірогідним перекладом англійської:

де e – пропозиція перекладу, а f – пропозиція оригіналу

Таким чином, нам потрібна модель джерела та модель каналу, або модель мови та модель перекладу. Модель мови повинна надавати оцінку ймовірності будь-якій пропозиції кінцевої мови (у нашому випадку, російської), а модель перекладу -пропозиції оригіналу. (див. табл.1)

У випадку система машинного перекладу працює у двох режимах:

1. Навчання системи: береться тренувальний корпус паралельних текстів, і за допомогою лінійного програмування шукаються такі значення таблиць перекладних відповідностей, які максимізують ймовірність (наприклад) російської частини корпусу за наявною англійською згідно з обраною моделлю перекладу. На російській частині того ж самого корпусу будується модель російської мови.

2. Експлуатація: на основі отриманих даних для незнайомої англійської пропозиції шукається російський, максимізуючий твір ймовірностей, що присвоюються моделлю мови та моделлю перекладу. Програма, яка використовується для такого пошуку, називається дешифратором.

Найпростішою статистичною моделлю перекладу є модель дослівного перекладу. У цій моделі передбачається, що з перекладу речення з однієї мови іншою досить перекласти всі слова (створити «мішок слів»), а розстановку в правильному порядку забезпечить модель Для приведення P(a, f | e) до P(a | e , f), тобто. ймовірності даного вирівнювання при даній парі речень, кожна ймовірність P(a, f | e) нормалізується за сумою ймовірностей всіх вирівнювань даної пари речень:

Реалізація алгоритму Вітербі, що використовується для навчання Моделі №1, полягає в наступному:

1.Вся таблиця ймовірностей переказних відповідностей заповнюється однаковими значеннями.

2. Для всіх можливих варіантів попарних зв'язків слів обчислюється ймовірність P(a, f|e):

3. Значення P(a, f|e) нормалізуються для отримання значень P(a|e, f).

4. Підраховується частота кожної перекладної пари, зважена на ймовірність кожного варіанта вирівнювання.

5. Отримані зважені частоти нормалізуються та формують нову таблицю ймовірностей перекладних відповідностей

6. Алгоритм повторюється з кроку 2.

Розглянемо як приклад тренування подібної моделі на корпусі з двох пар речень (рис.2):

Білий Дім/White House

Після великої кількості ітерацій отримаємо таблицю (табл.2.), з якої видно, що переклад здійснюється з високою точністю.

Також статистичні методи широко використовуються у вивченні лексики, морфології, синтаксису, стилістики. Вчені Пермського державного університету провели дослідження, в основі якого лежало твердження, що стереотипні словосполучення є важливим «будівельним матеріалом» тексту. Ці словосполучення складаються з «ядерних» слів, що повторюються, і залежних слів-конкретизавторів і мають яскраво виражене стилістичне забарвлення.

У науковому стилі «ядерними» словами можна назвати: дослідження, вивчення, завдання, проблема, питання, явище, факт, спостереження, аналізта ін. У публіцистиці «ядерними» будуть вже інші слова, які мають підвищену цінність саме для тексту газети: час, особа, влада, справа, дія, закон, життя, історія, місцеі т.д. (Всього 29)

Особливий інтерес для лінгвістів представляє також професійна диференціація загальнонародної мови, своєрідність використання лексики та граматики залежно від роду занять. Відомо, що шофери у професійному мовленні вживаю форму ш про фер, медики говорять до про клюш замість кокл ю ш – подібних прикладів можна навести. Завдання статистики - простежити за варіативністю вимови та зміною мовної норми.

Професійні відмінності ведуть у себе відмінності як граматичні, а й лексичні. У Якутському державному університеті ім. М.К. Аммосова було проаналізовано по 50 анкет з реакціями, що найчастіше зустрічаються, на деякі слова серед медиків і будівельників (табл.3).

Будівельники

людина

пацієнт (10), особистість (5)

чоловік (5)

добро

допомога (8), допомагати (7)

зло (16)

життя

смерть (10)

чудова (5)

смерть

труп (8)

життя (6)

вогонь

жар (8), опік (6)

пожежа (7)

палець

рука (14), панарицій (5)

великий (7), вказівний (6)

очі

зір (6), зіниця, окуліст (по 5)

карі (10), великі (6)

голова

розум (14), мізки (5)

велика (9), розумна (8), розум (6)

втрачати

свідомість, життя (по 4)

гроші (5), знаходити (4)

Можна зауважити, що медики частіше, ніж будівельники, дають асоціації, пов'язані з їхньою професійною діяльністю, тому що наведені в анкеті слова-стимули мають до їхньої професії більше відношення, ніж до професії будівельника.

Статистичні закономірності в мові використовуються для створення частотних словників - словників, в яких наводяться числові характеристики уживаності слів (словоформ, словосполучень) будь-якої мови - мови письменника, будь-якого твору тощо. Зазвичай як характеристика уживаності використовується частота народження слова у тексті певного обсягу

Модель сприйняття мови неможлива без словника як свого найістотнішого компонента. При сприйнятті промови основний оперативної одиницею виступає слово. З цього випливає, зокрема, що кожне слово тексту, що сприймається, має бути ототожнено з відповідною одиницею внутрішнього словника слухача (або читаючого). Природно вважати, що з самого початку пошук обмежений деякими підобластями словника. Відповідно до більшості сучасних теорій сприйняття промови, власне фонетичний аналіз тексту, що звучить, в типовому випадку дає лише деяку часткову інформацію про можливе фонологічному вигляді слова, і такого роду інформації відповідає не одне, а певне БАГАТО слів словника; отже, виникає два завдання:

(а) виділити відповідну множину за тими чи іншими параметрами;

(б) у межах окресленої множини (якщо вона виділена адекватно) зробити «відсів» всіх слів, крім того єдиного, яке і найкраще відповідає даному слову тексту, що розпізнається. Одна із стратегій «відсіву» – виняток низькочастотних слів. Звідси випливає, що словник сприйняття мови - це частотний словник. Саме створення комп'ютерної версії частотного словника російської мови і є початковим завданням проекту.

На матеріалі російської існує 5 частотних словників (крім галузевих). Відзначимо лише деякі загальні недоліки словників.

Усі відомі частотні словники російської побудовані на обробці масивів письмових (друкованих) текстів. Частково з цієї причини, коли тотожність слова багато в чому спирається на формальний, графічний збіг, недостатньо враховується семантика. В результаті виявляються зміщеними, спотвореними та частотні характеристики; наприклад, якщо слова з поєднання один одного укладач частотного словника включає в загальну статистику вживання слова друг, то навряд чи це виправдано: враховуючи семантику, ми повинні визнати, що це вже інші слова, а точніше, що самостійною словниковою одиницею виступає лише саме собою поєднання загалом.

Також у всіх існуючих словниках слова вміщені лише у своїх основних формах: іменники у формі однини, називного відмінка, дієслова у формі інфінітиву і т.д. Деякі словники дають інформацію про частотність словоформ, але зазвичай роблять це недостатньо послідовно, не вичерпним чином. Частотності різних словоформ одного й того самого слова свідомо не збігаються. Розробник моделі сприйняття мови повинен враховувати, що в реальному перцептивному процесі розпізнаванню підлягає саме конкретна словоформа, «занурена» в текст: на базі аналізу початкової ділянки експонента словоформи формується безліч слів з ідентичним початком, причому початкова ділянка словоформи не обов'язково тотожна початковому у . Саме словоформі належить конкретна ритмічна структура – ​​також надзвичайно важливий параметр для перцептивного відбору слів. Нарешті, у підсумковому поданні розпізнаного висловлювання знову ж таки слова представлені відповідними словоформами.

Існує безліч робіт, у яких демонструється важливість частотності у процесі сприйняття мови. Але нам не відомі роботи, де використовувалася б частотність словоформ – навпаки, всі автори практично ігнорують частотність окремих словоформ, звертаючись виключно до лексем. Якщо отримані ними результати вважати артефактами, доводиться припустити, що носію мови якимось чином доступна інформація про співвідношення частотностей словоформ і словникової форми, тобто, фактично, лексеми. Причому такого роду перехід від словоформи до лексеми, звісно, ​​неможливо пояснити природним знанням відповідної парадигми, оскільки інформація про частотність має використовуватися до остаточної ідентифікації слова, інакше вона втрачає сенс.

За первинними статистичними характеристиками можна визначити із заданою відносною похибкою ту частину словника, куди входять слова з високою частотою появи незалежно від типу тексту. Можливо також, ввівши ступінчасте впорядкування в словник, отримати серію словарів, що охоплюють перші 100, 1000, 5000 і т. д. часті слова. Статистичні характеристики словника викликають інтерес у зв'язку зі смисловим аналізом лексики. Вивчення предметно-ідеологічних груп та семантичних полів показує, що лексичні об'єднання підтримуються семантичними зв'язками, які концентруються навколо лексем з найбільш загальним значенням. Опис значень у межах лексико-семантичного поля може проводитись за допомогою ідентифікації слів із найбільш абстрактними за змістом лексемами. Очевидно, «порожні» (з погляду номінативних потенцій) одиниці словника становлять статистично однорідний пласт.

Не меншу цінність мають і словники з окремих жанрів. Вивчення міри їхньої подібності та характеру статистичних розподілів дасть цікаві відомості про якісне розшарування лексики в залежності від сфери мовлення.

Упорядкування великих частотних словників вимагає звернення до обчислювальної техніки. ВСТУП часткової механізації та автоматизації в процес роботи над словником представляє інтерес як експеримент машинної обробки словників до різних текстів. Такий словник потребує суворішої системи обробки та накопичення словникового матеріалу. У мініатюрі це інформаційно-пошукова система, яка здатна видавати відомості про різні сторони тексту та словника. Деякі основні запити до цієї системи плануються від самого початку: загальна кількість інвентаризованих слів, статистичні характеристики окремого слова та цілих словників, упорядкування частих та рідкісних зон словника тощо. Машинна картотека дозволяє автоматично будувати зворотні словники за окремими жанрами та джерелами. Багато інших корисних статистичних відомостей про мову буде вилучено з накопиченого масиву інформації. Комп'ютерний частотний словник створює експериментальну основу переходу до ширшої автоматизації словникових робіт.

Статистичні дані частотних словників можуть бути широко використані і при вирішенні інших лінгвістичних завдань - наприклад, при аналізі та визначенні активних засобів словотвору сучасної російської мови, вирішенні питань удосконалення графіки та орфографії, які пов'язані з урахуванням статистичних відомостей про словниковий склад (при цьому важливо враховувати ймовірнісні характеристики комбінацій графем, реалізовані в словах типи буквосполучень), практичної транскрипції та транслітерації. Статистичні параметри словника будуть корисні і під час вирішення питань автоматизації друкованої справи, розпізнавання та автоматичного читання буквеного тексту.

Сучасні тлумачні словники і граматики російської переважно побудовані з урахуванням літературно-художніх текстів. Існують частотні словники мови А.С. Пушкіна, А.С. Грибоєдова, Ф.М. Достоєвського, В.В. Висоцького та багатьох інших авторів. На кафедрі історії та теорії літератури Смоленського держ. Педагогічного університету кілька років ведеться робота зі складання частотних словників віршованих і прозових текстів. Для цього дослідження відібрано частотні словники всієї лірики Пушкіна і ще двох поетів золотого століття - «Горя з розуму» Грибоєдова і всієї поезії Лермонтова; Пастернака та ще п'ятьох поетів срібного віку - Бальмонта 1894-1903 рр., «Вірш про Прекрасну Даму» Блоку, «Камінь» Мандельштама, «Вогняного стовпа» Гумільова, «Anno Domini MCMXXI» Ахматової та «Сестри мого життя» Пастернах поетів століття залізного – «Віршів Юрія Живаго», «Коли розгуляється», всього корпусу лірики М. Петрових, «Дорога далека», «Вітрового скла», «Прощання зі снігом» та «Підкови» Межирова, «Антимирів» Вознесенського та «Сніжниці » Риленкова.

Слід зазначити, що ці словники за своєю природою різні: одні представляють лексику одного драматичного твору, інші - книги лірики, або кількох книг, або всього корпусу віршів поета. Результати аналізу, представлені у цій роботі, слід сприймати з обережністю, їх не можна абсолютизувати. При цьому за допомогою спеціальних заходів різницю онтологічної природи текстів можна певною мірою зменшити.

В останні роки все більш чітко усвідомлюється протиставлення розмовної та книжкової мови. Особливо гостро обговорюється питання серед методистів, які вимагають повороту навчання у бік розмовної мови. При цьому специфіка розмовної мови досі залишається незрозумілою.

Обробка словників виконувалася шляхом створення користувальницького застосування в середовищі офісної програми EXCEL97. Додаток включає чотири робочі листи книги EXCEL - "Титульний лист", лист "Словники" з вихідними даними, "Близькості" та "Відстані" з результатами, а також набір макросів.

Початкова інформація вводиться на лист «Словники». У осередку EXCEL, записуються словники досліджуваних текстів, останній стовпець S формується з отриманих результатів і дорівнює кількості слів, які у інших словниках. Таблиці «Близькості» та «Відстані» містять розраховані заходи близькості M, кореляції R та відстані D.

Макроси програми є подієвими програмними процедурами на мові Visual Basic for Application (VBA). Основу процедур складають бібліотечні об'єкти VBA та методи їх обробки. Так, для операцій з робочими листами програми використовується ключовий об'єкт Worksheet (робочий лист) та відповідний метод активізації листа Activate (активізувати). Завдання діапазону аналізованих вихідних даних на аркуші «Словники» виконується методом Select (вибрати) об'єкта Range (діапазон), а передача слів як значення змінним виконується як властивість Value (значення) цього об'єкта Range.

Незважаючи на те, що ранговий кореляційний аналіз змушує з обережністю говорити про залежність тематики між різними текстами, більшість найчастіших слів кожного тексту має відповідності в одному або кількох інших текстах. У колонці S показано кількість таких слів серед 15 найчастіших у кожного автора. Напівжирним шрифтом виділено слова, які у нашій таблиці лише в одного поета. Немає виділених слів зовсім у Блоку, Ахматової і Петрових, вони S = ​​15. У цих трьох поетів все 15 найчастіших слів одні й самі, розрізняються вони лише місцем у списку. Але навіть у Пушкіна, лексика якого найоригінальніша, S = 8, а виділених слів 7.

Результати показують, що є певний шар лексики, який концентрує основні теми поезії. Як правило, ці слова короткі: із загальної кількості (225) слововжитків односкладових 88, двоскладових 127, трискладових 10. Найчастіше ці слова представляють основні міфологеми і можуть розпадатися на пари: ніч – день, земля – небо (сонце), Бог – людина (люди), життя – смерть, тіло – душа, Рим – світ(У Мандельштама); можуть об'єднуватися в міфологеми вищого рівня: небо, зірка, сонце, земля; в людині зазвичай виділяються тіло, серце, кров, рука, нога, щока, очі. З людських станів перевага надається сну та любові. До світу людини належать будинок та міста – Москва, Рим, Париж. Творчість представлена ​​лексемами словоі пісня.

Грибоєдов і Лермонтов серед найбільш частотних слів майже не мають слів, що позначають природу. У них утричі більше слів, які означають людину, частини її тіла, елементи її духовного світу. У Пушкіна та поетів ХХ ст. позначень людини та природи приблизно порівну. У цьому важливому аспекті тематики, можемо сказати, ХХ ст. пішов за Пушкіним.

Мінімальна тема справасеред найчастіших слів зустрічається лише у Грибоєдова та Пушкіна. У Лермонтова та поетів ХХ ст. вона поступається місцем мінімальній темі слово. Слово не виключає справи (біблійне трактування теми: у Новому Завіті все вчення Ісуса Христа розглядається як слово Боже або слово Ісуса, а апостоли іноді називають себе служителями Слова). Сакральний зміст лексеми слово переконливо проявляється, наприклад, у вірші Пастернака «І образ світу, у Слові явлений». Сакральний зміст лексеми словоу спів- та протиставленні з людськими справами переконливо проявляється в однойменному вірші Гумільова.

Лексеми, що зустрічаються лише у одному тексті, характеризують своєрідність цієї книжки чи сукупності книжок. Наприклад, слово "розум" - найчастіше в комедії Грибоєдова "Лихо з розуму" - але воно не зустрічається серед частотних слів інших текстів. Тема розуму, безумовно, є найбільш значущою в комедії. Ця лексема супроводжує образ Чацького, причому ім'я Чацького є найчастішим у комедії. Таким чином, у творі органічно поєднуються найчастіше ім'я загальне з найчастішим власним ім'ям.

Найвищий коефіцієнт кореляції пов'язує тематику трагічних книг Гумільова "Вогненний стовп" та Ахматової "Anno Domini MCMXXI". Серед 15 найчастіших іменників тут 10 загальних, у тому числі кров, серце, душа, любов, слово, небо. Нагадаємо, що до книги Ахматової увійшла мініатюра «Не бувати тобі в живих...», написана між арештом Гумільова та його розстрілом.

Теми свічки та натовпу у дослідженому матеріалі зустрічаються лише у «Вірші Юрія Живаго». Тема свічки у віршах із роману має безліч контекстуальних значень: вона пов'язана з образом Ісуса Христа, з темами віри, безсмертя, творчості, любовного побачення. Свічка – найважливіше джерело світла у центральних сценах роману. Тема натовпу розвивається у зв'язку з основною ідеєю роману, в якому приватне життя людини з її непорушними цінностями протиставлено аморальності нової держави, побудованої на засадах догодження натовпу.

Робота передбачає і третій етап, теж відображений у програмі, - це обчислення різниці порядкових номерів слів, загальних для двох словників та середнього показника відстані між однаковими словами двох словників. Цей етап дозволяє від загальних тенденцій взаємодії словників, виявлених за допомогою статистики, перейти на рівень, що наближається до тексту. Наприклад, статистично значуще корелюють книги Гумільова та Ахматової. Ми дивимося, які слова виявилися спільними для їхніх словників, і вибираємо насамперед ті, різниця між порядковими номерами яких є мінімальною або дорівнює нулю. Саме ці слова мають той самий ранговий номер і, отже, саме ці мінімальні теми у свідомості двох поетів однаково важливі. Далі слід переходити до рівня текстів і контекстів.

Кількісні методи допомагають вивчити особливості народів - носіїв мови. Скажімо, в російській мові 6 відмінків, в англійській відмінків немає, а в окремих мовах народів Дагестану кількість відмінків доходить до 40. Л.Перловський у своїй статті «Свідомість, мова та культура» співвідносить ці характеристики зі схильністю народів до індивідуалізму чи колективізму, з сприйняттям речей та явищ окремо або у зв'язку з іншими. Адже саме в англомовному світі (відмінків немає – річ сприймається «сама по собі») з'явилися такі поняття, як свобода особистості, лібералізм і демократія (зауважу, що я вживаю ці поняття лише у зв'язку з мовою, без оцінки). Незважаючи на те, що подібні припущення поки що залишаються лише на рівні сміливих наукових гіпотез, вони допомагають подивитися по-новому на вже знайомі явища.

Як бачимо, кількісні характеристики можуть застосовуватися у різних областях мовознавства, що дедалі більше стирає кордону між «точними» і «гуманітарними» методами. Лінгвістика все частіше вдається до допомоги не лише математики, а й обчислювальної техніки для вирішення своїх завдань.

2.3 Вивчення язика методами формальної логіки

З некількісними методами математики, зокрема, з логікою, сучасна теоретична лінгвістика взаємодіє щонайменше плідно, ніж із кількісними. Швидкий розвиток комп'ютерних технологій та зростання їхньої ролі в сучасному світі зажадало перегляду підходу до взаємодії мови та логіки в цілому.

Методи логіки широко використовуються в розробці формалізованих мов, зокрема, мов програмування, елементами яких є деякі символи (подібно до математичних), вибираються (або конструйовані з обраних раніше символів) і інтерпретовані певним чином, пов'язаним з жодним «традиційним» вживанням, розумінням і функціями таких самих символів в інших контекстах. Програміст має справу з логікою у своїй роботі. Сенс програмування у тому, щоб навчити комп'ютер міркувати (у сенсі слова). При цьому методи "міркування" виявляються різними. Кожен програміст витрачає певний час на пошук помилок у своїх та чужих програмах. Тобто, на пошук помилок у міркуваннях, у логіці. І це також накладає свій відбиток. Набагато легше виявляєш логічні помилки і у звичайній мові. Відносна простота мов, що вивчаються логіками, дозволяє їм з'ясовувати структури цих мов більш чітко, ніж це можна досягти для лінгвістів, які аналізують виключно складні природні мови. Зважаючи на те, що мови, що вивчаються логіками, використовують відносини, скопійовані з природних мов, логіки здатні зробити істотний внесок у загальну теорію мови. Ситуація тут подібна до тієї, яка має місце у фізиці: фізик також формулює теореми для ідеально спрощених випадків, які не відбуваються в природі взагалі - він формулює закони для ідеальних газів, ідеальних рідин, говорить про рух за відсутності тертя і т.д. Для цих ідеалізованих випадків можна встановити прості закони, які б значно сприяли розумінню того, що відбувається насправді і що, ймовірно, залишилося б невідомим фізиці, якби вона пробувала розглядати дійсність безпосередньо, у всій складності.

У вивченні природних мов логічні методи використовуються для того, щоб ті, хто вивчає мову, могли не тупо «зазубрити» якомога більше слів, а краще зрозуміти її структуру. Ще Л. Щерба використав на своїх лекціях приклад пропозиції, побудованої за законами російської мови: «Глока куздра штеко бушнула бокра і курдячить бокренка», - а потім питав у студентів, що це означає. Незважаючи на те, що сенс слів у реченні залишався незрозумілим (їх просто не існує в російській мові), можна було чітко відповісти: «куздра» - підмет, іменник жіночого роду, в однині, називному відмінку, «бокр» - одухотворене, і і т.д. Переклад фрази виходить приблизно такою: «Дещо жіночого роду в один прийом зробило щось над якоюсь істотою чоловічого роду, а потім почало щось таке витворяти тривале, поступове з його дитинчатою». Подібним прикладом тексту (художнього) з неіснуючих слів, побудованого повністю за законами мови, є «Бармаглот» Льюїса Керролла (в «Алісі в країні чудес» Керролл вустами свого персонажа Шалтая-Болтая пояснює і значення придуманих ним слів: «варкалося» - вісім годин вечора, коли вже час варити вечерю, «хливий» - хлипкий і спритний, «шорек» - помісь тхора, борсука і штопора, «піратися» - стрибати, пірнати, крутитися, «нава» - трава під сонячним годинником (простірається трохи праворуч , трохи ліворуч і трохи назад), «хрюкати» - хрюкати і реготати, «зелюк» - зелений індик, «мюмзік» - птах; .

Одне з основних понять сучасної логіки та теоретичної лінгвістики, що використовується при дослідженні мов різних логіко-математичних обчислень, природних мов, для опису відносин між мовами різних «рівнів» і для характеристики відносин між мовами, що розглядаються, і описуються з їх допомогою предметними областями - поняття метамови. Метамова - це мова, що використовується для вираження суджень про іншу мову, мову-об'єкт. За допомогою метамови вивчають структуру знакосполучення (виразів) мови-об'єкта, доводять теореми про її виразні властивості, про відношення її до інших мов і т.п. Як предметна мова, так і метамову можуть бути звичайними (природними) мовами. Метамова може відрізнятися від мови-об'єкта (наприклад, у підручнику англійської мови для російських російська мова є метамовою, а англійська - мовою-об'єктом), але може і збігатися з нею або відрізнятися лише частково, наприклад, спеціальною термінологією (російська лінгвістична термінологія - елемент метамови для опису російської мови, так семантичні множники - частина метамови описи семантики природних мов).

Поняття «метазик» стало дуже плідним у зв'язку з вивченням формалізованих мов, що будуються в рамках математичної логіки. На відміну від формалізованих предметних мов, у цьому випадку метамова, засобами якої формулюється метатеорія (що вивчає властивості предметної теорії, що формулюється предметною мовою), є, як правило, звичайною природною мовою, деяким спеціальним чином обмеженим фрагментом природної мови, що не містить різного роду двозначностей , метафор, «метафізичних» понять тощо елементів звичайної мови, що перешкоджають використанню його як знаряддя точного наукового дослідження. При цьому метамова сама може бути формалізована і (незалежно від цього) виявитися предметом дослідження, що проводиться засобами метаметоязика, причому такий ряд можна «мислити» нескінченно.

Логіка вчить нас плідному розмежуванню мови-об'єкта та метамови. Мова-об'єкт - це сам предмет логічного дослідження, а метамова - та неминуче штучна мова, якою таке дослідження ведеться. Логічне мислення якраз і полягає в тому, щоб сформулювати мовою символів (метази) відносини і структуру реальної мови (мови-об'єкта).

Метамова повинна бути принаймні «не бідніша» за свою предметну мову (тобто для кожного вираження останньої в метамові має бути його ім'я-«переклад») - інакше, при невиконанні цих вимог (що свідомо має місце в природних мовах, якщо спеціальними угодами не передбачено протилежне) виникають семантичні парадокси (антиномії).

У міру створення нових і нових мов програмування у зв'язку з проблемою програмування трансляторів з'явилася гостра необхідність у створенні метамов. В даний час найбільш уживаним для опису синтаксису мов програмування є метамова форм Бекуса-Наура (скорочено БНФ). Він є компактною формою у вигляді деяких формул, схожих на математичні. До кожного поняття мови існує єдина метаформула (нормальна формула). Вона складається з лівої та правої частин. У лівій частині вказується поняття, що визначається, а в правій - задається безліч допустимих конструкцій мови, які об'єднуються в це поняття. У формулі використовують спеціальні метасимволи у вигляді кутових дужок, в яких укладено поняття (у лівій частині формули) або раніше певне поняття (в її правій частині), а поділ лівої і правої частин вказується метасимволом "::=", зміст якого еквівалентний словам "за визначенням є". Металінгвістичні формули у певному вигляді закладені в транслятори; з їх допомогою ведеться перевірка конструкцій, що використовуються програмістом, на формальну відповідність будь-якій з конструкцій, синтаксично допустимих у цій мові. Існують і окремі метамови різних наук – таким чином, знання існують у вигляді різних метамов.

Логічні методи також послужили основою створення систем штучного інтелекту, заснованих на концепції коннекціонізму. Коннекціонізм - це особлива течія у філософській науці, предметом якого є питання пізнання. В рамках цієї течії робляться спроби пояснити інтелектуальні здібності людини, використовуючи штучні нейронні мережі. Складені з великої кількості структурних одиниць, аналогічних нейронам, із заданим для кожного елемента вагою, що визначає силу зв'язку з іншими елементами, нейронні мережі є спрощеними моделями людського мозку. Експерименти з нейронними мережами подібного роду продемонстрували їхню здатність до навчання виконання таких завдань, як розпізнавання образів, читання та визначення простих граматичних структур.

Філософи почали виявляти інтерес до коннекціонізму, оскільки коннекціоністський підхід обіцяв забезпечити альтернативу класичній теорії розуму та широко поширеній у рамках цієї теорії ідеї, згідно з якою механізми роботи розуму мають схожість із обробкою символічної мови цифровим комп'ютером. Ця концепція дуже спірна, проте останніми роками вона знаходить дедалі більше прибічників.

Логічне вивчення мови продовжує сосюрівську концепцію про мову як систему. Те, що воно постійно продовжується, ще раз підтверджує сміливість наукових припущень початку минулого століття. Останній розділ своєї роботи я присвячую перспективам розвитку математичних методів у лінгвістиці у наші дні.

2.4 Перспективи застосування математичних методів у лінгвістиці

В епоху комп'ютерних технологій методи математичної лінгвістики набули нової перспективи розвитку. Пошук вирішення проблем лінгвістичного аналізу дедалі активніше реалізується тепер лише на рівні інформаційних систем. Водночас автоматизація процесу обробки мовного матеріалу, надаючи досліднику значні можливості та переваги, неминуче висуває перед ним нові вимоги та завдання.

Поєднання «точного» та «гуманітарного» знання стало родючим ґрунтом для нових відкриттів у галузі лінгвістики, інформатики та філософії.

Машинний переклад з однієї мови на іншу залишається галуззю інформаційних технологій, що швидко розвивається. Незважаючи на те, що переклад за допомогою комп'ютера ніколи не зрівняється з перекладом, зробленим людиною (особливо це стосується художніх текстів), машина стала невід'ємним помічником людини в перекладі великих обсягів тексту. Вважається, що в найближчому майбутньому буде створено досконаліші перекладацькі системи, засновані насамперед на семантичному аналізі тексту.

Не менш перспективним напрямком залишається взаємодія лінгвістики та логіки, яка є філософським фундаментом для осмислення інформаційних технологій і так званої «віртуальної реальності». У найближчому майбутньому продовжиться робота над створенням систем штучного інтелекту - хоча, знову ж таки, він ніколи не дорівнюватиме людському за його можливостями. Подібна конкуренція безглузда: у наш час машина має стати (і стає) не суперником, а помічником людини, не чимось із галузі фантастики, а частиною реального світу.

Продовжується вивчення мови методами статистики, що дозволяє точніше визначити її якісні властивості. Важливо, щоб найбільш сміливі гіпотези про мову знаходили свій математичний, а отже, і логічний доказ.

Найбільш значимо те, що різні галузі застосування математики в лінгвістиці, до цього досить розрізнені, останніми роками співвідносяться між собою, з'єднуючись у струнку систему, за аналогією з системою мови, відкритою сторіччя тому Фердинандом де Соссюром та Іваном Бодуеном де Куртене. У цьому – наступність наукового знання.

Лінгвістика у світі стала фундаментом у розвиток інформаційних технологій. Поки інформатика залишається галуззю людської діяльності, що бурхливо розвивається, союз математики і лінгвістики продовжить відігравати свою роль у розвитку науки.

Висновок

За ХХ століття комп'ютерні технології пройшли великий шлях - від військового застосування до мирного, від вузького кола цілей до проникнення у всі галузі людського життя. Математика як наука знаходила все нове практичне значення із розвитком обчислювальної техніки. Цей процес продовжується і сьогодні.

Немислимий раніше «тандем» «фізиків» та «ліриків» став реальністю. Для повноцінної взаємодії математики та інформатики з гуманітарними науками були потрібні кваліфіковані фахівці як з того, так і з іншого боку. У той час як фахівцям-комп'ютерникам все більш потрібні систематичні гуманітарні знання (лінгвістичні, культурологічні, філософські), щоб осмислювати зміни в реальності, що оточує їх, у взаємодії людини і техніки, розробляти все нові і нові мовні та розумові концепції, писати програми, то будь-який «гуманітарій» у наш час для свого професійного зростання має опанувати хоча б аз роботи з комп'ютером.

Математика, будучи тісно взаємопов'язаною з інформатикою, продовжує розвиватися і взаємодіяти з природничим та гуманітарним знанням. У новому столітті не слабшає, а навпаки, посилюється тенденція до математизації науки. На кількісних даних осмислюються закономірності розвитку мови, її історичні та філософські характеристики.

Математичний формалізм найбільше підходить для опису закономірностей у лінгвістиці (як, втім, і в інших науках – і гуманітарних, і природних). Ситуація часом складається у науці отже без застосування відповідного математичного мови зрозуміти характер фізичного, хімічного тощо. процесу неможливо. Створюючи планетарну модель атома, відомий англійський фізик XX ст. Еге. Резерфорд відчув математичні проблеми. Спочатку його теорію не прийняли: вона не звучала доказово, і виною тому стало незнання Резерфордом теорії ймовірності, на основі механізму якої тільки й можливо було зрозуміти модельне уявлення атомних взаємодій. Усвідомивши це, видатний вже на той час вчений, володар Нобелівської премії, записався до семінару математика професора Лемба і протягом двох років разом зі студентами прослухав курс і відпрацював практикум з теорії ймовірності. На її основі Резерфорд зміг описати поведінку електрона, надавши своїй структурній моделі переконливу точність та здобувши визнання. Те саме - і з мовознавством.

Напрошується питання, що ж міститься в об'єктивних явищах таке математичне, завдяки чому вони піддаються опису мовою математики, мовою кількісних характеристик? Це однорідні одиниці речовини, що розподіляються у просторі та часі. Ті науки, які далі за інших пройшли шлях до виділення однорідності, і виявляються краще пристосованими для використання в них математики.

Мережа Інтернет, що стрімко розвинулася в 90-і роки, об'єднала під собою представників різних країн, народів і культур. Незважаючи на те, що основною мовою міжнародного спілкування продовжує служити англійська, Інтернет у наш час став багатомовним. Це зумовило розвиток комерційно успішних систем машинного перекладу, які широко використовуються в різних галузях людської діяльності.

Комп'ютерні мережі стали об'єктом філософського осмислення - створювалися нові лінгвістичні, логічні, світоглядні концепції, що допомагають зрозуміти «віртуальну реальність». Багато художніх творах створювалися сценарії - частіше песимістичні - про панування машин над людиною, а віртуальної реальності - над навколишнім світом. Не завжди подібні прогнози виявлялися безглуздими. Інформаційні технології - як перспективна галузь вкладення людських знань, це ще й спосіб контролю за інформацією, отже, і з людської думкою.

Це явище є як негативна, і позитивна сторона. Негативна - тому що контроль за інформацією суперечить невід'ємному людському праву на вільний доступ до неї. Позитивна – тому що відсутність цього контролю може призвести до катастрофічних наслідків для людства. Досить згадати один із наймудріших фільмів останнього десятиліття – «Коли настане кінець світу» Віма Вендерса, герої якого повністю поринули у «віртуальну реальність» власних снів, що записуються на комп'ютер. При цьому жоден учений і жоден художник не може дати однозначної відповіді на запитання: що ж чекає на науку і техніку в майбутньому.

Орієнтування на «майбутнє», що часом здається фантастичним, було відмінною особливістю науки середини ХХ століття, коли винахідники прагнули створити досконалі зразки техніки, які можуть працювати без втручання людини. Час показав утопічність подібних досліджень. При цьому було б зайвим засуджувати вчених за це - без їхнього ентузіазму в 1950-ті - 60-ті інформаційні технології не зробили б такого потужного стрибка в 90-ті, і ми б не мали того, що маємо зараз.

Останні десятиліття ХХ століття змінили пріоритети науки – дослідницький, винахідницький пафос поступився місцем комерційному інтересу. Знову ж таки - це не добре і не погано. Це - реальність, у якій наука виявляється все більш інтегрованою у повсякденне життя.

Настало XXI століття продовжило цю тенденцію, і в наш час за винаходами стоять не тільки слава та визнання, але, в першу чергу, гроші. Ще й тому важливо дбати про те, щоб нові досягнення науки та техніки не потрапили до рук терористичних угруповань чи диктаторських режимів. Завдання складне до неможливості; максимально здійснити її – завдання всього світового співтовариства.

Інформація - зброя, причому зброя не менш небезпечна, ніж ядерна або хімічна - тільки діє вона не фізично, а швидше психологічно. Людству треба задуматися про те, що для нього в цьому випадку важливіше – свобода чи контроль.

Нові філософські концепції, пов'язані з розвитком інформаційних технологій і спробою їх осмислити, показали обмеженість як природничо матеріалізму, що панував протягом ХIХ - початку ХХ століть, так і крайнього ідеалізму, що заперечує значущість матеріального світу. Сучасній думці, особливо думки Заходу, важливо подолати цей дуалізм у мисленні, коли навколишній світ чітко ділиться на матеріальне та ідеальне. Шлях до цього - діалог культур, зіставлення різних точок зору навколишні явища.

Як не парадоксально, інформаційні технології можуть відіграти не останню роль у цьому процесі. Комп'ютерні мережі, і особливо Інтернет - це не лише ресурс для розваги та бурхливої ​​комерційної діяльності, це ще й засіб осмисленого, спірного спілкування між представниками різних цивілізацій у сучасному світі, а також для діалогу минулого із сьогоденням. Можна сказати, що Інтернет розсуває просторові та часові рамки.

А в діалозі культур за допомогою інформаційних технологій, як і раніше, важлива роль мови як найдавнішого універсального засобу спілкування. Саме тому лінгвістика у взаємодії з математикою, філософією та інформатикою пережила своє друге народження і продовжує розвиватися досі. Тенденція сьогодення продовжиться і в майбутньому - "until the end of the world", як 15 років тому передбачав той самий В. Вендерс. Щоправда, невідомо, коли відбудеться цей кінець – але чи важливо це зараз, адже майбутнє рано чи пізно все одно стане сьогоденням.

Додаток 1

Ferdinand de Saussure

Швидкий лінгвіст Ferdinand de Saussure (1857-1913) є вельми сприйнятий як провідник сучасних лінгвістичних в його дослідах, щоб позначити структуру англійської мовою, аніж історія особливих мов і мовних форм. У факті, метод Структуралізму в лінгвістичних і літературних статтях і значущому літопису Semiotics find their major starting point in his work at the twentieth century. Це буде навіть argued, що комплекс стратегій і думок, що має бути названий "poststructuralism" - робота з Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, і інші - є зауважений за Saussure"s work У лінгвістичних і анаграматичних readings late Latin poetry.If this is so, it can be seen most clearly in the way that Saussure"s work in linguistics and interpretation participates in transformations in modes of understanding across a wide range of intellectualy disciplines f літературний модернізм до психоаналізу і філософії в ранньому двадцятьох зонах. Як Algirdas Julien Greimas і Joseph Courtes argue в Semiotics і Language: An Analytic Dictionary, під заголовком "Interpretation," в новому способі interpretation arose в ранній 20-річчя, що їх identify s Saussurean лінгвістики, Husser. У цьому режимі, "interpretation is no longer matter attributing a given content to for form which would otherwise lack one; 159). У цьому підданому "interpretation," форма і вміст не відрізняються; ще, будь-яка "форма" є, власне, несвідомий "content" як добре, як "значна форма," з тим, що interpretation offers analogical paraphrase of something that already signifies within some other system of signification.

Така реінтерпретація форми і understanding - які Claude Levi-Strauss повідомлено в одному з його найбільш programmaticky articulations of concept of structuralism, in "Structure and Form: Reflections on Work by Vladimir Propp" - is implicit in Saussure's posthumou У General Linguistics (1916, trans., 1959, 1983).В його життя, Saussure публікувався відносно мало, і його важлива робота, Курси, був перенесенням його школярів з кількох курсів в загальних лінгвістичних 1 offered1. У курсі спостережень називається "науково-дослідницька" освіта мовлення як залучена до роботи в історичних лінгвістиках, що він був виконаний в центрі ланцюжка. language, historical (or "diachronic") лінгвістичних traced оригіналу і розбудови Western languages ​​від позитивного єдиного джерела джерел, першою "Indo-European" language and then earlier "p roto-Indo-European" language.

Це неодноразово ця стаття з unique occurrences of words, with concomitant assumption that the basic "unit" of language is, in fact, the positive existence of these "word-elements," that Saussure questioned. Його робота була сприйнятою до зменшення маси фактів про англійську мову, вивчена з моменту історичної лінгвістики, до управлінської кількості речей. "компаративна освіта" з молодіжної центру філології, суспільство, що збирається в курсі, "діти не входять в надання true школярів лінгвістичних" тому, що "використано виходити з природи його об'єкта освіти" (3). Те, що "природа," я argues, є, щоб бути не тільки в "елементальних" слів, що англійською мовою - це позначення "позитивних" фактів (або "субстанції") з ​​англійською мовою - але в звичайних відносинах, що ведеться до цього "substances."

Saussure''s systematic reexamination of language is based upon three assumptions. її особливий "speech-events," які його designes as parole - і the proper object of lingustics, the system (or "code") governing those events, which he designates as langue. synchronic" поняття relationship за елементами мови на особливій instant rather than "diachronic" study of development language through history.

Це усвідомлення тягнеться на те, що Роман Якобсон в 1929 році встановлюється як "структуралізм", в якому "будь-який рівень феномену, вивчений за сучасною практикою, не застосовується не як механічна агломерація, але як структурне, що для механізмів of their function" ("Romantic" 711). У цій угоді Jakobson є articulating Saussure"s intention to define lingustics as scientific system as opposed to a simple, "mechanical" accounting of historical accidents. now call it "structural" - лінгвістики: що основні елементи англійської мови можуть бути тільки вивчені в відношенні до своїх функцій, що йдуть у відношенні до своїх подій. Європейські "слова"), ці явища і громадськості мають бути зроблені з в systemic framework в яких вони є віднесені до інших незв'язаних дій і громадськості. Cassirer has compared to "нове училище Galileo, яке в сьомій середини центру змінювалося, що всі концепції фізичного світу" (cited in Culler, Pursuit 2 4). Це зміна, як Greimas і Courtes note, reconceives " interpretation " і це reconceives explanation і піддаються їмсамовито. У ході explanations's being in terms of phenomenon's causas, so that, as an "effect," it is in some ways subordinate to its causas, explanation here consists in subordinating phenomenon to its future-oriented "function" or "purpose." Розповсюдження не є longer незалежними від людських намірів або purposes (одна з цих спроб може бути індивідуальним, комунальним, або, в Freudian terms, "unconscious").

У його лінгвістиці Saussure пристосовується до цього перетворення specifically в пересвідченні лінгвістичного "word", які я говорив як лінгвістичний "сигнал" і defines в функціональних термінах. Сигнал, який argues, є основою "концепції і звукового зображення," який називається "зазначений і підпис" (66-67; Roy Harris"s 1983 translation offers the terms "signification" and "signal"). Природа їхньої "з'єднання" є "функціональним" в тому, що нібито ця цифра signifier є "відповідь" з іншого; element of language, sign, relationally and makes the basic assumption of historical linguistics, namely, the identity of elemental units of language and signification (i.e., "words"), subject to rigorous analysis. word "tree" як "same" word not because the word is defined by inherent qualities - it no is "mechanical agglomeration" of such qualities - but because it is defined as an element in a system, the "structural whole ," of language.

Такий порівняльний (або "діаграфічний") визначення entity governs, концепція всіх елементів мови в структурних лінгвістичних. Це clearest в most impressive achievement of Saussurean lingustics, розробка концепцій "phonemes" і "різноманітних рис" of language. Phonemes є дрібно відзначені і signifying units of language. Вони не мають звуків, що трапляється в мові, але "зображення звуків" мелодії, які apprehended by speakers - phenomenally apprehended - as conveying meaning. (Thus, Elmar Holenstein написав Якобсон "з лінгвістичною, яка досліджує Saussure в важливих способах, як "феноменологічний структуралізм.") Це є для цього розуміння того, що керування прапором для Прага Структуралізм, 7, 7 Mukarovsky. . . is a phenomenological and not empirical reality; it is not the work itself, but set of functional relationships which are located in the consciousness of collective (generation, milieu, etc.)" (cited in Galan 35). , noted in 1960 that "структура не відрізняється content; "Це містить вміст його, і логічну організацію, в якій він є розбитим, є визнаним як властивість реального" (167; viz also Jakobson, Fundamentals 27-28).

Phonemes, then, smallest perceptible elements of language, are not positive objects but a "phenomenological reality." У англійській, за умовами, на телефоні /t/ може бути відомий в багатьох різних способах, але в усіх випадках англійською мовою буде відповідати її як функціонування як /t/. Прихований t (i.e., t pronounced with h-like breath after it), high-pitched or low-pitched t sound, an extended t sound, and so on, буде все функціонувати в самий manner в distinguishing the meaning of "to" та "do" in English. Більше, різниці між мовами є такими, що фізичні зміни в одній мові можуть бути визначені різними телефонами в іншому; Таким чином, англійські відрізняються між /l/ і /r/, деінші мови є структурованими, що ці articulations є визначеними варіаціями того ж фону (як ви хистете, так і ні в англійському). У кожній природній мові, величезна кількість можливих слів є комбінацією малого числа телефонів. Англійською мовою, для останнього, посещають не більше 40 телефонів, які поєднують у вигляді над мільйоном різних слів.

Phonemess language є нимисамостійно організовані структури features. У 1920-х роках і 1930-х років, спираючись на сприйнятливість, якобсон і Н. С. Trubetzkoy, ізолюються на "різноманітні особливості" телефонів. Сприйняття ментіонів в курсі і те, що Harris повідомила як "фізичні фонатики" (39; Baskin's earlier translation використовує термін "фонології" [(1959) 38]) - і вони поєднують в "bundles" з binary позицій до форми. Для останнього, в англійській дифференціації між /t/ і /d/ є причиною або неможливістю "голос" (engagement of vocal chords), і на рівні звуку цих телефонів reciprocally define one another. У цьому способі, фізіологія є конкретним прикладом загальної ланки англійської мови, описаної відповідно до мети: В англійській мові є тільки різниці. Even more important: a difference generally implies positive terms between which the difference is set up; але в англійській мові є тільки тільки відмінності без позитивних термінів. Коли ми будемо сформульовано або сигналізувати, мова має деякі ідеї nor sounds, що існують перед лінгвістичною системою. ( 120)

У цій framework, лінгвістичні подібності не визначаються не врівноваженими якостями, але systemic ("structural") відносини.

Я повинен усвідомити, що фонологія "засмучена лівою" з Сауссурі, тому що після її аналітики з фізиології з англійської продукції "були невідомі," як Harris says, "буде називати "фізичною," як зроблено для всіх" "" (Reading 49), невідповідність в курсі, що характеризується direction і outlines of functional analysis of language. У той же час, її тільки виконала публіковану роботу, Memoire sur le system primitif des voyelles dans les langues indo-europeennes (Memoir on the primitive system of vowels in Indo-European languages), які виявлено в 1878, був повністю центри історичних лінгвістичних. Несправедливість, зцьою цією роботою, як Jonathan Culler має віру, Saussure демонстрував "температура мислення англійської мови як система суворо відносної частини, навіть коли працює на ходу історичної реконструкції" (Saussure 6). Будучи analyzing systematic structural relationships між phonemes до облікового запису з vowel alternation у існуючих Indonesian European Languages, Saussure suggested що в додатку до several different phonemes /a/, вони повинні бути будь-яким повідомленим будь-яким телефоном. "What makes Saussure"s work so very impresive," Culler concludes, "is fact that nearly fifty years later, when cuneiform Hittite був затверджений і принесений, він був заснований на contain a phoneme, written h, which behaved as . Він мав усвідомити, як точніше formal analysis, який є новим знав як літератури з Індоєвропейської "(66).

Цей висновок щодо відносного або значущого визначання елементів значущості, які є як implicit, так і explicit в курсі, позначаються на третій прихильності керуючих структурних лінгвістичних, які спонукають прохання "на arbitrary nature of the sign." За цими способами те, що відносини між знаком і встановленим в англійській мові є необов'язково (або "змінено"): один може тільки добре проходити звуковий сигналіст arbre as signifier tree до unite with the concept "tree". Але більше, ніж це, це означає, що він є вірним як добре: один може бути впевнено визначений на концепції "tree" з її woody quality (яка буде exclude palm trees) як її розмір (яка виключає "low woody plants" call shrubs). Це повинно бути чутливим, що число приписів, що ми повинні бути впевнені, що не відповідає ордеру priority: їх усвідомлення - систематична природа значущості (велика визнана послідовною мовою "синхронно"), relative or "diacritical" of signification, the arbitrary nature of signs - derives its value from thethers.

Що це, Saussurean лінгвістики піддаються phenomena it studies in overarching relationships of combination and contrast in language. У цій концепції, англійською мовою є процес процесу технічного аналізу (сигналізація) і його продукту (комунікацій), і ці дві функції англійської мови є кожний подібний або повністю загартований (див. Schleifer, "Deconstruction"). Тут, ми можемо повідомити про між собою форму і зміст, що Greimas і Courtes повідомила в модерністському тлумаченні: англійська визнання суперечки про те, що formally define its units, і thes units combine on succeeding levels to create the signifying content. Безсумнівно, елементи англійської мови є arbitrary, moreover, деякий contrast nor combination може бути спрямований на basic. Таким чином, в мові характерні особливості комбінації для форми спілкування телефонів на іншому рівні apprehension, телефонів з'єднується з формою повідомлень morphemes, morphemes combine for words, words combine to form sentences, and so on. У будь-якому випадку, протягом всього телефону, або слово, або повідомлення, і тому, що є більшою, ніж сума своїх частин (just as water, H2O, in Saussure"s example [(1959) 103] is more than mechanical agglomeration з hydrogen і oxygen).

Три припущення з курсу в загальному лінгвістиці ведуть суспільство, щоб скористатися новою школою двадцятьох центірів, які повинні бути в лінгвістичній школі, щоб вивчити "життя слів з в соціумі." Saussure називається цією основою "семіології" (16). "Середня" semiotics, як це може бути виконана в Великобританії в 1920-х і 1930-х роках і Париж в 1950-х і 1960-х роках, вивчається вивчення лінгвістичних і лінгвістичних структур для літературних архітектурних структур. Через нову частину своєї кар'єри, morever, навіть якщо вона була в курсі курсів в загальних лінгвістичних, Saussure pursued його власні "семіотичні" аналітика останньої латиної поетри в дослідженні довідник наближено налаштованих анаграм. Метод методики був у багатьох випадках з'єднаний з функціональним rationalism своїх лінгвістичних analyses: він спричинений, як сприйняття ментіонів в одному з 99 notebooks в яких було випущено це дослідження, яке вивчається систематично на питання стає inevitable foundation of everything" (cited in Starobinski 101). Такий вивчання, як Saussure himself says, фокусується на "матеріальної факту" chance and meaning (показано 101), так, що "тем-слово", який anagram Saussure є скидання, як Jean Starobinski argues, "є, для поети , an instrument, and not a vital germ of the poem. У цьому аналізі, Starobinski says, "Saussure did not lose himself in asearch for hidden meanings." Instead, його робота seems to demonstrate a desire to evade all the problems rising from consciousness: "Since poetry is notly realized in words but is something born from words, it escapes arbitrary control of consciousness to depending (121).

Що це, Saussure's attempt to discover properes names в останній Латинська поетра - what Tzvetan Todorov називає reduction of a "word . . . до її signifier" (266) - emphasizes один з елементів, що владнає його лінгвістичне analysis, arbitrary природи of sign. a substance" - які ефективно eliminates semantics as major object of analysis.) Як Todorov concludes, Saussure"s work appears remarkably homogeneous today in its refusal to accept symbolic phenomena . . . . У його вивченні на анаграмах, ви отримаєте попит тільки на феномен repetition, не на той еволюції. . . . У його дослідженнях з Nibelungen, які визнають символи тільки в ордері, щоб розглянути їх до поводження readings: since they not intentional, symbols do no exist. Finally in his courses on general linguistics, he contemplates the existence of semiology, and thus of signs other than linguistics ones; Але ця affirmation is at once limited by fact that semiology is devoted to a single type of sign: those which are arbitrary. (269-70)

Якщо це є true, це означає, що Saussure не може визнати "наслідування" без предмета; я не можу, щоб не вистачило, щоб одержати між формою і вмістом його роботи, щоб скористатися роботою. Instead, he resorted до "лінгвістичної legality." Закінчено між, на одній стороні, нісенітної-центру концепції історії, підприємництва, і в режимі causal interpretation регулювалися цими концепціями і, на іншій стороні, двадцять-центру "structuralist" conceptions what Levi-Strauss called "Kantianism with a transcendental subject" (cited in Connerton 23) - концепції, що можливе одержання між формою і вмістом (або предмет і об'єкт) і hierarchy of foreground and background в full-blown structuralism, psychoanalysis, і навіть quantum mechanics - work of Ferdinand de Saussure в лінгвістиках і semiotics circumscribes в signal moment в study of meaning and culture.

Ronald Schleifer

Додаток 2

Фердинанд де Соссюр (переклад)

Швейцарський мовознавець Фердинанд де Соссюр (1857-1913) вважається засновником сучасної лінгвістики завдяки своїм спробам описати структуру мови, а не історію окремих мов і словоформ. За великим рахунком, основи структурних методів у лінгвістиці та літературознавстві і значною мірою семіотики були закладені в його роботах на початку ХХ століття. Доведено, що методи та концепції так званого "постструктуралізму", розвинені в роботах Жака Дерріда, Мішеля Фуко, Жака Лакана, Юлії Крістєвої, Ролана Барта та інших, сягають лінгвістичних праць Соссюра та анаграматичних прочитань пізньої римської поезії. Слід зауважити, що роботи Соссюра з лінгвістики та мовної інтерпретації допомагає пов'язати широке коло інтелектуальних дисциплін – від фізики до літературних нововведень, психоаналізу та філософії початку двадцятого століття. А. Дж. Греймас та Ж. Курте пишуть у «Семіотиці та мові»: «Аналітичний словник із заголовком «Інтерпретація» як новий вид інтерпретації з'явився на початку ХХ століття разом із лінгвістикою Соссюра, феноменологією Гуссерля та психоаналізом Фрейда. У такому разі, "інтерпретація - це не приписування даного змісту до форми, яка інакше зазнала б недоліку в тому; швидше це - переказ, який формулює іншим способом той самий зміст значущого елемента в межах даної семіотичної системи" (159). У такому розумінні «інтерпретації», форма та зміст нерозривні; навпаки, кожна форма наповнена семантичним значенням («значуща форма»), тому інтерпретація пропонує новий, аналогічний переказ чогось, значимого в іншій знаковій системі.

Подібне розуміння форми і змісту, що представляється Клодом Леві-Строссом в одній з програмних робіт структуралізму, ("Структура і Форма: Роздуми над працями Володимира Проппа") - можна побачити в книзі Соссюра «Курс загальної лінгвістики» (1916, пров. 1959, 1983). За життя Соссюр мало публікувався, "Курс" - його основна робота - був зібраний за конспектами студентів, які відвідували його лекції з загальної лінгвістики в 1907-11 рр. У «Курсі» Соссюр закликав до «наукового» вивчення мови, протиставляючи його порівняльно-історичному мовознавству дев'ятнадцятого століття. Цю роботу можна вважати одним із найбільших досягнень західної думки: беручи за основу окремі слова як структурні елементи мови, історичне (або «діахронічне») мовознавство доводило походження та розвиток західноєвропейських мов від загальної, індоєвропейської мови- та більш ранньої праіндоєвропейської.

Це - точно це дослідження унікальних виникнення слів, з супутнім припущенням, що основна "одиниця" мови, фактично, позитивне існування цих "елементів слова", що Соссюр поставив під сумнів. Його робота була спробою скоротити безліч фактів про мову, побіжно вивчених порівняльною лінгвістикою, до небагатьох теорем. Порівняльна філологічна школа ХІХ століття, пише Соссюр, «не досягла успіху у створенні справжньої школи лінгвістики», оскільки «вона зрозуміла сутності об'єкта вивчення» ( 3). Ця «сутність», стверджує він, полягає у окремих словах - «позитивних субстанціях» мови - а й у формальних зв'язках, які допомагають цим субстанціям існувати.

Соссюрівська "перевірка" мови заснована на трьох припущеннях. Перше: наукове розуміння мови засноване не так на історичному, але в структурному феномені. Тому він розрізняв окремі явища мови - "події мови", які він визначає як "parole" - і належний, на його думку, об'єкт вивчення лінгвістики, систему (код, структуру), що керує цими подіями ("langue"). Подібне систематичне вивчення, крім того, потребує «синхронної» концепції відносин між елементами мови на даний момент, а не «діахронічного» дослідження розвитку мови через її історію.

Ця гіпотеза стала передвісником того, що Роман Якобсон в 1929 назве «структуралізмом» - теорії, де "будь-який набір явищ, досліджений сучасною наукою, розглядається не як механічне скупчення, а як структурне ціле, в якому конструктивна складова співвідноситься з функцією" ("Romantic "711). У цьому уривку Якобсон сформулював сосюрівську ідею визначення мови як структури на противагу «машинальному» перерахуванню історичних подій. Крім того, Якобсон розвиває й інше соссюрівське припущення, що стало предтечею структурної лінгвістики: базові елементи мови повинні вивчатися у зв'язку не стільки зі своїми причинами, скільки зі своїми функціями. Окремі явища та події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не власними силами, а в системі, в якій вони співвіднесені з подібними ж складовими. Це був радикальний поворот у зіставленні явищ з навколишньою дійсністю, значимість якого філософ Ернст Кассірер порівняв з «наукою Галілея, що перевернула в сімнадцятому столітті уявлення про матеріальний світ». Сивова, і самі пояснення.Яви стали трактуватися не щодо причин їх виникнення, а щодо того ефекту, який вони можуть опинитися в сучасному і майбутньому.Тлумачення перестало бути незалежним від намірів людини(попри те, що наміри можуть бути безособовими, «несвідомими») у фрейдистському розумінні цього слова).

У своїй лінгвістиці Соссюр особливо показує цей поворот у зміні поняття слова у лінгвістиці, яке він визначає як знак та описує з погляду його функцій. Знак для нього -з'єднання звучання і сенсу, що "позначається і позначення" (66-67; в англійському перекладі 1983 авторства Роя Харріса - "signification" і "signal"). Природа цієї сполуки - «функціональна» (ні той, ні інший елемент що неспроможні існувати друг без друга); більше, " одне запозичує якості в іншого " (8). Таким чином Соссюр визначає основний структурний елемент мови – знак – і робить основою історичного мовознавства ідентичність знаків словами, що потребує особливо суворого аналізу. Тому ми можемо зрозуміти різні значення, скажімо, одного і того ж слова «дерево» - не тому що слово є лише набір певних якостей, а тому що воно визначено як елемент у знаковій системі, в «структурному цілому», в мові.

Подібне відносне («діакритичне») поняття єдності лежить в основі уявлення про всі елементи мови у структурній лінгвістиці. Це особливо ясно видно у найбільш оригінальній знахідці соссюрівського мовознавства, у розвитку концепції «фонем» та «відмінних рис» мови. Фонеми - найдрібніші зі сказаних і значних мовних одиниць. Вони є не тільки звуками, що зустрічаються в мові, але «звуковими образами», зауважує Соссюр, які сприймаються носіями мови як такі, що мають значення. (Слід зазначити, що Елмар Холенштейн називає лінгвістику Якобсона, за основними положеннями Соссюра, що продовжує ідеї та концепції, «феноменологічним структуралізмом»). Саме тому провідний доповідач празької школи структуралізму Ян Мукаровський зауважив у 1937 році, що «структура. . . не емпіричне, а феноменологічне поняття; це сам результат, а набір значних відносин колективного свідомості (покоління, оточуючих тощо.)». Схожу думку висловив у 1960 році Леві-Стросс, лідер французького структуралізму: «У структури немає певного змісту; вона сама по собі змістовна, і логічна конструкція, в яку вона укладена, є відбитком реальності».

У свою чергу фонеми, як найдрібніші мовні елементи, прийнятні для сприйняття, є окремою цілісною «феноменологічною реальністю». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але у всіх випадках людина, яка володіє англійською, сприйматиме її як «т». Вимовлений з придыханием, з високим чи низьким підйомом мови, довгий звук «т» тощо однаково розрізнятиме значення слів «to» і «do». Більше того - відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншій; наприклад «л» і «р» в англійській різні, тоді як в інших мовах це різновиди однієї фонеми (подібно до англійської «т», сказаному з придихом і без). Великий словниковий запас будь-якої природної мови є набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для вимовлення та написання близько мільйона слів використовується лише 40 фонем.

Звуки мови є системно організований набір характеристик. У 1920-1930-ті, за Соссюром, Якобсон і Н.С.Трубецкой виділили «відмінні риси» фонем. Ці риси засновані на будові органів мови – мови, зубів, голосових зв'язок – Соссюр зауважує це в «Курсі загальної лінгвістики», а Харріс називає «фізіологічною фонетикою» (у більш ранньому перекладі Баскіна використовується термін «фонологія») – вони поєднуються в «вузли дург проти друга, щоб видавати звуки. Скажімо, in в англійській різниця між "т" і "д" полягає в наявності або відсутності "голосу" (напрузі голосових зв'язок), і в рівні голосу, що відрізняє одну фонему від іншої. Таким чином, фонологію можна вважати прикладом загального мовного правила, описаного Соссюр: «У мові є лише відмінності». Більш важливо навіть це: відмінність зазвичай має на увазі точні умови, між якими воно й перебуває; але у мові існують лише відмінності без точних умов. Розглядаємо ми «позначення» чи «позначається» - у мові немає ні понять, ні звуків, які б до того, як розвинулася мовна система.

У подібній структурі мовні аналогії визначені не за допомогою властивих їм якостей, а за допомогою системних («структурних») відносин.

Я вже згадав, що фонологія у своєму розвитку спиралася на ідеї Соссюра. Незважаючи на те, що його аналіз мовної фізіології в наш час за словами Харріса, «було б названо «фізичним», на противагу «психологічному» чи «функціональному», у «Курсі» він виразно сформулював напрямок та основні засади функціонального аналізу мови. Його єдина видана за життя робота, «Записки про початкову систему голосних в індоєвропейських мовах», видана в 1878, повністю знаходилася в руслі порівняльно-історичного мовознавства XIX століття. Проте цією працею, як каже Джонатан Каллер, Соссюр показав «плідність уявлення про мову як систему взаємопов'язаних явищ, навіть за його історичної реконструкції». Аналізуючи взаємозв'язки між фонемами, пояснюючи чергування голосних у сучасних мовах індоєвропейської групи, Соссюр припустив, що крім кількох різних звуків «а», мають бути інші фонеми, описувані формально. «Що справляє особливе враження у праці Соссюра, - робить висновок Каллер, - те, що майже через 50 років, при відкритті і розшифровці хетського клинопису, була знайдена фонема, на листі позначається «h», яка поводилася так, як пророкував Соссюр. За допомогою формального аналізу він відкрив те, що зараз відоме як гортанний звук в індоєвропейських мовах.

У концепції відносного (діакритичного) визначення знаків, як явно вираженої, так і на увазі в «Курсі», існує і третє ключове припущення структурної лінгвістики, назване Соссюром «довільною природою знака». Під цим мається на увазі, що відношення між звучанням і значенням у мові нічим не мотивоване: з однаковою легкістю можна поєднати слово arbre і слово tree з поняттям дерево. Більше того, це означає, що звучання теж довільне: можна визначити поняття «дерево» щодо наявності у нього кори (крім пальм) та за розміром (крім «низьких деревних рослин» - чагарників). З цього має бути зрозуміло, що всі припущення, що представляються мною, не діляться на більш і менш важливі: кожне з них - системний характер знаків (найбільш зрозумілий при «синхронному» вивченні мови), їх відносна (діакритична) сутність, довільна природа знаків - виходить з решти.

Таким чином, в соссюрівському мовознавстві феномен, що вивчається, розуміється як зведення зіставлень і протиставлень мови. Мова - це і вираз значення слів (позначення), та його результат (спілкування) - і ці дві функції будь-коли збігаються (див. «Деконструкцію мови» Шлейфера). Ми можемо помітити чергування форми та змісту, яке Греймас і Курте описують у новітньому варіанті інтерпретації: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють на рівні, що змінюють один одного, щоб створити певний значущий зміст. Оскільки елементи мови випадкові, ні контраст, ні поєднання неможливо знайти основою. Отже, у мові відмітні ознаки формують фонетичний контраст іншому рівні розуміння, фонеми поєднуються в контрастні морфеми, морфеми - у слова, слова - у речення тощо. У будь-якому випадку ціла фонема, слово, речення і т.д. є чимось більшим, ніж сума складових (як і вода, в соссюровском прикладі - більше, ніж поєднання водню і кисню).

Три припущення «Курсу загальної лінгвістики» привели Соссюра до ідеї нової науки ХХ століття, окремо від лінгвістики вивчає «життя знаків у суспільстві». Соссюр назвав цю науку семіологією (від грецького «semeion» – знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920-1930 і в Парижі в 1950 і 1960, розширила вивчення мови і лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своєму курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою, як пише Соссюр в одній із 99 записників, вивчити в системі проблему «імовірності», яка «стає основою всього». Таке дослідження, як стверджує сам Соссюр, допомагає зосередитись на «речовій стороні» ймовірності; «ключове слово», анаграму якого шукає Соссюр, як стверджує Жан Старобинський, «інструмент для поета, а чи не джерело життя вірша. Вірш служить у тому, щоб поміняти місцями звуки ключового слова». За словами Старобинського, у цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, у його роботах помітно бажання уникнути питань, пов'язаних зі свідомістю: «оскільки поезія виражається у словах, а й у тому, що породжують ці слова, вона виходить з-під контролю свідомості і від законів мови».

Спроба Соссюра вивчити власні імена в пізній римській поезії (Цветан Тодоров назвав це скороченням «слова... лише до його написання») підкреслює одну зі складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюрівської лінгвістики («Я він, «суть форма, а чи не явище»), що виключає можливість аналізу сенсу. Тодоров робить висновок, що в наші дні праці Соссюра виглядають на диво послідовними в небажанні вивчати символи [яви, що мають чітко визначене значення]. . . . Досліджуючи анаграми, Соссюр звертає увагу лише з повторення, але з попередні варіанти. . . . Вивчаючи «Пісню про Нібелунги», він визначає символи лише для того, щоб привласнити їх хибним читанням: якщо вони ненавмисні, символів не існує. Зрештою, у своїх працях із загальної лінгвістики він припускає існування семіології, описує як лінгвістичні знаки; але це припущення обмежується тим, що семилогоя може описувати лише випадкові, довільні знаки.

Якщо це справді так, то тільки тому, що не міг уявити «намір» без предмета; він не міг до кінця подолати прірву між формою та змістом - у його працях це перетворювалося на питання. Натомість він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, що ґрунтуються на історії та суб'єктивних здогадах, та методах випадкової інтерпретації, що ґрунтуються на цих концепціях, і, з іншого боку, структуралістськими концепціями, які Леві-Стросс назвав «кантіанством без трансцендентної дійової особи». що стирають протистояння між формою і змістом (суб'єктом і об'єктом), значенням і походженням у структуралізмі, психоаналізі і навіть квантової механіки - праці Ферлінанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Рональд Шлейфер

Література

1. Адмоні В.Г. Основи теорії граматики/В.Г. Адмоні; АН СРСР.-М.: Наука, 1964.-104с.

3. Арапов, М.В., Херц, М.М. Математичні методи у лінгвістиці. М., 1974.

4. Арнольд І.В. Семантична структура слова в сучасній англійській мові та методика її дослідження. /І.В. Арнольд-Л.: Просвітництво, 1966. – 187 с.

6.Башликов А.М. Система автоматизованого перекладу. / А.М. Башликов, А.А. Соколів. – М.: ТОВ «ФІМА», 1997. – 20 с.

7.Бодуен де Куртене: Теоретична спадщина та сучасність: Тези доповідей міжнародної наукової конференції / Ред.І.Г. Кондратьєва. – Казань: КДУ, 1995. – 224 с.

8. Гладкий А.В., Елементи математичної лігвістики. /. Гладкий О.В., Мельчук І.О. -М., 1969. – 198 с.

9. Головін, Б.М. Мова та статистика. /Б.М. Головін-М., 1971. – 210 с.

10. Звегінців, В.А. Теоретична та прикладна лінгвістика. / В.А. Звегінців -М., 1969. - 143 с.

11. Касевич, В.Б. Семантика. Синтаксису. Морфологія // В.Б. Касевич-М., 1988. – 292 c.

12. Лекомцев Ю.К. ВСТУП у формальну мову лінгвістики/Ю.К. Лекомців. - М: Наука, 1983, 204 с., іл.

13. Лінгвістична спадщина Бодуена де Куртене наприкінці ХХ століття: Тези доповідей міжнародної науково-практичної конференції 15-18 березня 2000 року. – Красноярськ, 2000. – 125 с.

Матвєєва Г.Г. Приховані граматичні значення та ідентифікація соціальної особи («портрета») мовця/Г.Г. Матвєєва. – Ростов, 1999. – 174 с.

14. Мельчук, І.А. Досвід побудови лінгвістичних моделей "Сенс<-->Текст". / І.А. Мельчук. - М., 1974. - 145 c.

15. Нелюбін Л.Л. Переклад та прикладна лінгвістика / Л.Л. Нелюбін. - М.: Вища школа, 1983. - 207 с.

16. Про точні методи дослідження мови: про так звану «математичну лінгвістику»/О.С. Ахманова, І. А. Мельчук, Є.В. Падучова та ін. - М., 1961. - 162 с.

17. Піотровський Л.Г. Математична лінгвістика: Навчальний посібник/Л.Г. Піотровський, К.Б. Бектаєв, А.А. Піотрівська. – М.: Вища школа, 1977. – 160 с.

18.Він же. Текст, машина, людина. – Л., 1975. – 213 с.

19. Він же. Прикладне мовознавство/За ред. О.С Герда. – Л., 1986. – 176 с.

20. Ревзін, І.І. Моделі мови. М., 1963. Ревзін, І.І. Сучасна структурна лінгвістика. Проблеми та методи. М., 1977. – 239 с.

21. Ревзін, І.І., Розенцвейг, В.Ю. Основи загального та машинного перекладу / Ревзін І.І., Розенцвейг, В.Ю. – М., 1964. – 401 с.

22. Слюсарьова Н.А. Теорія Ф.де Соссюра у світлі сучасної лінгвістики/Н.А. Слюсарєва. - М:Наука, 1975. - 156 с.

23. Сова, Л.З. Аналітична лінгвістика/Л.З. Сова – М., 1970. – 192 с.

24. Соссюр Ф. де. Нотатки із загальної лінгвістики/ Ф. де Соссюр; Пров. із фр. – М.: Прогрес, 2000. – 187 с.

25. Він же. Курс загальної лінгвістики/Пер. із фр. - Єкатеринбург, 1999. -426 с.

26. Статистика мови та автоматичний аналіз тексту / Відп. ред. Р.Г. Піотровський. Л., 1980. – 223 с.

27. Столл, P. Безліч. Логікa. Аксіоматичні теорії. / Р. Столл; Пров. з англ. – М., 1968. – 180 с.

28. Теньєр, Л. Основи структурного синтаксису. М., 1988.

29. Убін І.І. Автоматизація перекладацької діяльності у СРСР/І.І. Убін, Л.Ю. Коростелев, Б.Д. Тихомиров. – М., 1989. – 28 с.

30. Фор, P., Кофман, A., Дені-Папен, М. Сучасна математика. М., 1966.

31. Шенк, Р. Обробка концептуальної інформації. М., 1980.

32. Шихaнович, Ю.A. ВСТУП у сучасну математику (початкові поняття). М., 1965

33. Щерба Л.В. Російські голосні в якісному та кількісному відношенні/Л.В. Щерба – Л.: Наука, 1983. – 159 с.

34. Абдулла-заде Ф. Громадянин світу// Вогник - 1996. - №5. - С.13

35. В.А. Успенський. Попередження для читачів "Нового літературного огляду" до семіотичних послань Андрія Миколайовича Колмогорова. - Новий літературний огляд. -1997. - №24. - С. 18-23

36. Перловський Л. Свідомість, мова та культура. - Знання сила. -2000. №4 - С. 20-33

Вступ? Теорія перекладу лекції

2.4 Перспективи застосування математичних методів у лінгвістиці

В епоху комп'ютерних технологій методи математичної лінгвістики набули нової перспективи розвитку. Пошук вирішення проблем лінгвістичного аналізу дедалі активніше реалізується тепер лише на рівні інформаційних систем. Водночас автоматизація процесу обробки мовного матеріалу, надаючи досліднику значні можливості та переваги, неминуче висуває перед ним нові вимоги та завдання.

Поєднання «точного» та «гуманітарного» знання стало родючим ґрунтом для нових відкриттів у галузі лінгвістики, інформатики та філософії.

Машинний переклад з однієї мови на іншу залишається галуззю інформаційних технологій, що швидко розвивається. Незважаючи на те, що переклад за допомогою комп'ютера ніколи не зрівняється з перекладом, зробленим людиною (особливо це стосується художніх текстів), машина стала невід'ємним помічником людини в перекладі великих обсягів тексту. Вважається, що в найближчому майбутньому буде створено досконаліші перекладацькі системи, засновані насамперед на семантичному аналізі тексту.

Не менш перспективним напрямком залишається взаємодія лінгвістики та логіки, яка є філософським фундаментом для осмислення інформаційних технологій і так званої «віртуальної реальності». У найближчому майбутньому продовжиться робота над створенням систем штучного інтелекту – хоча, знову ж таки, він ніколи не дорівнюватиме людському за його можливостями. Подібна конкуренція безглузда: у наш час машина повинна стати (і стає) не суперником, а помічником людини, не чимось із галузі фантастики, а частиною реального світу.

Продовжується вивчення мови методами статистики, що дозволяє точніше визначити її якісні властивості. Важливо, щоб найбільш сміливі гіпотези про мову знаходили свій математичний, а отже, і логічний доказ.

Найбільш значимо те, що різні галузі застосування математики в лінгвістиці, до цього досить розрізнені, останніми роками співвідносяться між собою, з'єднуючись у струнку систему, за аналогією з системою мови, відкритою сторіччя тому Фердинандом де Соссюром та Іваном Бодуеном де Куртене. У цьому – наступність наукового знання.

Лінгвістика у світі стала фундаментом у розвиток інформаційних технологій. Поки інформатика залишається галуззю людської діяльності, що бурхливо розвивається, союз математики і лінгвістики продовжить відігравати свою роль у розвитку науки.


Висновок

За ХХ століття комп'ютерні технології пройшли великий шлях - від військового застосування до мирного, від вузького кола цілей до проникнення у всі галузі людського життя. Математика як наука знаходила все нове практичне значення із розвитком обчислювальної техніки. Цей процес продовжується і сьогодні.

Немислимий раніше «тандем» «фізиків» та «ліриків» став реальністю. Для повноцінної взаємодії математики та інформатики з гуманітарними науками були потрібні кваліфіковані фахівці як з того, так і з іншого боку. У той час як фахівцям-комп'ютерникам все більш потрібні систематичні гуманітарні знання (лінгвістичні, культурологічні, філософські), щоб осмислювати зміни в реальності, що оточує їх, у взаємодії людини і техніки, розробляти все нові і нові мовні та розумові концепції, писати програми, то будь-який «гуманітарій» у наш час для свого професійного зростання має опанувати хоча б аз роботи з комп'ютером.

Математика, будучи тісно взаємопов'язаною з інформатикою, продовжує розвиватися і взаємодіяти з природничим та гуманітарним знанням. У новому столітті не слабшає, а навпаки, посилюється тенденція до математизації науки. На кількісних даних осмислюються закономірності розвитку мови, її історичні та філософські характеристики.

Математичний формалізм найбільше підходить для опису закономірностей у лінгвістиці (як, втім, і в інших науках – і гуманітарних, і природних). Ситуація часом складається у науці отже без застосування відповідного математичного мови зрозуміти характер фізичного, хімічного тощо. процесу неможливо. Створюючи планетарну модель атома, відомий англійський фізик XX ст. Еге. Резерфорд відчув математичні проблеми. Спочатку його теорію не прийняли: вона не звучала доказово, і виною тому стало незнання Резерфордом теорії ймовірності, на основі механізму якої тільки й можливо було зрозуміти модельне уявлення атомних взаємодій. Усвідомивши це, видатний вже на той час вчений, володар Нобелівської премії, записався до семінару математика професора Лемба і протягом двох років разом зі студентами прослухав курс і відпрацював практикум з теорії ймовірності. На її основі Резерфорд зміг описати поведінку електрона, надавши своїй структурній моделі переконливу точність та здобувши визнання. Те саме – і з мовознавством.

Напрошується питання, що ж міститься в об'єктивних явищах таке математичне, завдяки чому вони піддаються опису мовою математики, мовою кількісних характеристик? Це однорідні одиниці речовини, що розподіляються у просторі та часі. Ті науки, які далі за інших пройшли шлях до виділення однорідності, і виявляються краще пристосованими для використання в них математики.

Мережа Інтернет, що стрімко розвинулася в 90-і роки, об'єднала під собою представників різних країн, народів і культур. Незважаючи на те, що основною мовою міжнародного спілкування продовжує служити англійська, Інтернет у наш час став багатомовним. Це зумовило розвиток комерційно успішних систем машинного перекладу, які широко використовуються в різних галузях людської діяльності.

Комп'ютерні мережі стали об'єктом філософського осмислення – створювалися нові лінгвістичні, логічні, світоглядні концепції, які допомагають зрозуміти «віртуальну реальність». У багатьох художніх творах створювалися сценарії – частіше песимістичні – про панування машин над людиною, а віртуальну реальність – над навколишнім світом. Не завжди подібні прогнози виявлялися безглуздими. Інформаційні технології – як перспективна галузь вкладення людських знань, це ще й спосіб контролю за інформацією, отже, і з людської думкою.

Це явище є як негативна, і позитивна сторона. Негативна – тому що контроль за інформацією суперечить невід'ємному людському праву на вільний доступ до неї. Позитивна – тому, що відсутність цього контролю може призвести до катастрофічних наслідків для людства. Досить згадати один із наймудріших фільмів останнього десятиліття – «Коли настане кінець світу» Віма Вендерса, герої якого повністю поринули у «віртуальну реальність» власних снів, які записуються на комп'ютер. Однак жоден учений і жоден художник не може дати однозначної відповіді на запитання: що ж чекає на науку і техніку в майбутньому.

Орієнтування на «майбутнє», що часом здається фантастичним, було відмінною особливістю науки середини ХХ століття, коли винахідники прагнули створити досконалі зразки техніки, які можуть працювати без втручання людини. Час показав утопічність подібних досліджень. Однак було б зайвим засуджувати вчених за це – без їхнього ентузіазму в 1950-ті – 60-ті інформаційні технології не зробили б такого потужного стрибка у 90-х, і ми б не мали того, що маємо зараз.

Останні десятиліття ХХ століття змінили пріоритети науки – дослідницький, винахідницький пафос поступився місцем комерційному інтересу. Знову ж таки – це не добре і не погано. Це – реальність, у якій наука виявляється дедалі більше інтегрованою у повсякденне життя.

Настало XXI століття продовжило цю тенденцію, і в наш час за винаходами стоять не тільки слава та визнання, але, в першу чергу, гроші. Ще й тому важливо дбати про те, щоб нові досягнення науки та техніки не потрапили до рук терористичних угруповань чи диктаторських режимів. Завдання складне до неможливості; максимально здійснити її – завдання всього світового співтовариства.

Інформація - зброя, причому зброя не менш небезпечна, ніж ядерна або хімічна - тільки діє вона не фізично, а швидше психологічно. Людству треба задуматися про те, що для нього в цьому випадку важливіше – свобода чи контроль.

Нові філософські концепції, пов'язані з розвитком інформаційних технологій і спробою їх осмислити, показали обмеженість як природничо матеріалізму, що панував протягом ХIХ - початку ХХ століть, так і крайнього ідеалізму, що заперечує значущість матеріального світу. Сучасній думці, особливо думки Заходу, важливо подолати цей дуалізм у мисленні, коли навколишній світ чітко ділиться на матеріальне та ідеальне. Шлях до цього – діалог культур, зіставлення різних точок зору навколишні явища.

Як не парадоксально, інформаційні технології можуть відіграти не останню роль у цьому процесі. Комп'ютерні мережі, і особливо Інтернет – це не лише ресурс для розваги та бурхливої ​​комерційної діяльності, це ще й засіб осмисленого, спірного спілкування між представниками різних цивілізацій у сучасному світі, а також для діалогу минулого із сьогоденням. Можна сказати, що Інтернет розсуває просторові та часові рамки.

А в діалозі культур за допомогою інформаційних технологій, як і раніше, важлива роль мови як найдавнішого універсального засобу спілкування. Саме тому лінгвістика у взаємодії з математикою, філософією та інформатикою пережила своє друге народження і продовжує розвиватися досі. Тенденція сьогодення продовжиться і в майбутньому – «until the end of the world», як 15 років тому передбачав той самий В. Вендерс. Щоправда, невідомо, коли відбудеться цей кінець – але чи важливо це зараз, адже майбутнє рано чи пізно все одно стане сьогоденням.


Додаток 1

Ferdinand de Saussure

Швидкий лінгвіст Ferdinand de Saussure (1857-1913) є вельми сприйнятий як провідник сучасних лінгвістичних в його дослідах, щоб позначити структуру англійської мовою, аніж історія особливих мов і мовних форм. У факті, метод Структуралізму в лінгвістичних і літературних статтях і значущому літопису Semiotics find their major starting point in his work at the twentieth century. Це буде навіть argued that the complex of strategies and conceptions that has to be called "poststructuralism" - work of Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, і інші - is suggested by Saussure"s work У лінгвістичних і анаграматичних readings late Latin poetry.If this is so, it can be seen most clearly in the way that Saussure"s work in linguistics and interpretation participates in transformations in modes of understanding across a wide range of intellectualy disciplines f літературний модернізм до психоаналізу і філософії в ранньому двадцятьох зонах. Як Algirdas Julien Greimas і Joseph Courtés argue в Semiotics і Language: An Analytic Dictionary, під заголовком "Interpretation," в новому способі interpretation arose в ранній 20-річчя, що їх identify з Saussurean лінгвістики, Hus. У цьому режимі, "interpretation is no longer matter attributing a given content to for form which would otherwise lack one; 159). У цьому підданому "interpretation," форма і вміст не відрізняються; ще, будь-яка "форма" є, власне, несвідомий "content" як добре, як "значна форма," з тим, що interpretation offers analogical paraphrase of something that already signifies within some other system of signification.

Така реінтерпретація форм і подій – які Claude Lévi-Strauss повідомлено в одному з його найбільш програмних літератур з концепцією структуралізму, в "Структурі і формі: Reflections on Work by Vladimir Propp" – є implicit in Saussure"s posthum У General Linguistics (1916, trans., 1959, 1983).В його життя, Saussure публікувався відносно мало, і його важлива робота, Курси, був перенесенням його школярів з кількох курсів в загальних лінгвістичних 1 offered1. У курсі спостережень називається "науково-дослідницька" освіта мовлення як залучена до роботи в історичних лінгвістиках, що він був виконаний в центрі ланцюжка. language, historical (or "diachronic") лінгвістичних traced оригіналу і розбудови Western languages ​​від позитивного єдиного джерела джерел, першою "Indo-European" language and then earlier "p roto-Indo-European" language.

Це неодноразово ця стаття з unique occurrences of words, with concomitant assumption that the basic "unit" of language is, in fact, the positive existence of these "word-elements," that Saussure questioned. Його робота була сприйнятою до зменшення маси фактів про англійську мову, вивчена з моменту історичної лінгвістики, до управлінської кількості речей. "компаративна освіта" з молодіжної центру філології, суспільство, що збирається в курсі, "діти не входять в надання true школярів лінгвістичних" тому, що "використано виходити з природи його об'єкта освіти" (3). Що "природа," я argues, is to be found no simply in the "elemental" words that a language comrises – the seeming "positive" facts (or "substances") of language – but in the formal relationships that give rise to those "substances."

Saussure's systematic reexamination of language is based upon three assumptions. її особливий "speech-events," які його designates as parole – and the property object of lingustics, the system (or "code") governing those events, which he designates as langue. synchronic" поняття relationship за елементами мови на особливій instant rather than "diachronic" study of development language through history.

Це усвідомлення тягнеться на те, що Роман Якобсон в 1929 році встановлюється як "структуралізм", в якому "будь-який рівень феномену, вивчений за сучасною практикою, не застосовується не як механічна агломерація, але як структурне, що для механізмів of their function" ("Romantic" 711). У цій угоді Jakobson є articulating Saussure"s intention to define lingustics as scientific system as opposed to a simple, "mechanical" accounting of historical accidents. now call it "structural" – лінгвістики: що основні елементи англійської мови можуть бути тільки вивченими у відношенні до своїх функцій, що існують у відношенні до своїх подій. Європейські "слова"), ці явища і громадськості мають бути зроблені з в systemic framework в яких вони є віднесені до інших незв'язаних дій і громадськості. Cassirer has compared to "нове училище Galileo, яке в сьомій середини центру змінювалося, що всі концепції фізичного світу" (cited in Culler, Pursuit 2 4). Це зміна, як Greimas і Courtés note, reconceives " interpretation " і це reconceives explanation і піддаються тимсамовидання. У ході explanations's being in terms of phenomenon's causas, so that, as an "effect," it is in some ways subordinate to its causas, explanation here consists in subordinating phenomenon to its future-oriented "function" or "purpose." Розповсюдження не є longer незалежними від людських намірів або purposes (одна з цих спроб може бути індивідуальним, комунальним, або, в Freudian terms, "unconscious").

У його лінгвістиці Saussure пристосовується до цього перетворення specifically в пересвідченні лінгвістичного "word", які я говорив як лінгвістичний "сигнал" і defines в функціональних термінах. Сигнал, який argues, є основою "концепції і звукового зображення," який називається "зазначений і підпис" (66-67; Roy Harris"s 1983 translation offers the terms "signification" and "signal"). Природа їхньої "з'єднання" є "функціональним" в тому, що нібито ця цифра signifier є "відповідь" з іншого; element of language, sign, relationally and makes the basic assumption of historical linguistics, namely, the identity of elemental units of language and signification (i.e., "words"), subject to rigorous analysis. word "tree" як "same" слово is not because the word is defined by inherent qualities – it is not a 'mechanical agglomeration' of such qualities – but because it is defined as an element in a system, the "structural whole ," of language.

Такий порівняльний (або "діаграфічний") визначення entity governs, концепція всіх елементів мови в структурних лінгвістичних. Це clearest в most impressive achievement of Saussurean lingustics, розробка концепцій "phonemes" і "різноманітних рис" of language. Phonemes є дрібно відзначені і signifying units of language. Вони не мають звуків, що трапляється в англійській мові, але "sound images" Saussure mentions, які apprehended by speakers – phenomenally apprehended – as conveying meaning. (Thus, Elmar Holenstein написав Якобсон "з лінгвістичною, яка досліджує Saussure в важливих способах, як "феноменологічний структуралізм.") Це є для цього розуміння того, що керування прапором для Прага Структуралізм, 7, 7 Mukarovsky. . . is a phenomenological and not empirical reality; it is not the work itself, але set of functional relationships which are located in the consciousness of collective (generation, milieu, etc.)" (cited in Galan 35). , noted in 1960 that "структура не відрізняється content; "Це містить вміст його, і логічну організацію, в якій він є розбитим, є визнаним як властивість реального" (167; viz also Jakobson, Fundamentals 27-28).

Phonemes, then, smallest perceptible elements of language, are not positive objects but a "phenomenological reality." У англійській, за умовами, на телефоні /t/ може бути відомий в багатьох різних способах, але в усіх випадках англійською мовою буде відповідати її як функціонування як /t/. Прихований t (i.e., t pronounced with h-like breath after it), high-pitched or low-pitched t sound, an extended t sound, and so on, буде все функціонувати в самий manner в distinguishing the meaning of "to" та "do" in English. Більше, різниці між мовами є такими, що фізичні зміни в одній мові можуть бути визначені різними телефонами в іншому; Таким чином, англійські відрізняються між /l/ і /r/, деінші мови є структурованими, що ці articulations є визначеними варіаціями того ж фону (як ви хистете, так і ні в англійському). У кожній природній мові, величезна кількість можливих слів є комбінацією малого числа телефонів. Англійською мовою, для останнього, посещають не більше 40 телефонів, які поєднують у вигляді над мільйоном різних слів.

Phonemess language є нимисамостійно організовані структури features. У 1920-х і 1930-х роках, спричиняючи Saussure's lead, Jakobson and N.S. Сприйняття ментіонів в курсі і те, що Harris описується як "фізичні фонатики" ( 39; Baskin's earlier translation use the term "phonology" [(1959) 38]) – і вони поєднують в "bundles" of binary oppositions to form form. Для останнього, в англійській дифференціації між /t/ і /d/ є причиною або неможливістю "голос" (engagement of vocal chords), і на рівні звуку цих телефонів reciprocally define one another. У цьому способі, фізіологія є конкретним прикладом загальної ланки англійської мови, описаної відповідно до мети: В англійській мові є тільки різниці. Even more important: a difference generally implies positive terms between which the difference is set up; але в англійській мові є тільки тільки відмінності без позитивних термінів. Коли ми будемо сформульовано або сигналізувати, мова має деякі ідеї nor sounds, що існують перед лінгвістичною системою. ( 120)

У цій framework, лінгвістичні подібності не визначаються не врівноваженими якостями, але systemic ("structural") відносини.

Я повинен усвідомити, що фонологія "засмучена лівою" з Сауссурі, тому що після її аналітики з фізиології з англійської продукції "були невідомі," як Harris says, "буде називати "фізичною," як зроблено для всіх" "" (Reading 49), невідповідність в курсі, що характеризується direction і outlines of functional analysis of language. У той же час, її тільки виконала публіковану роботу, Mémoire sur le système primitif des voyelles dans les langues indo-europeennes (Memoir on the primitive system of vowels in Indo-European languages), які виявлено в 1878 році, було центри історичних лінгвістичних. Несправедливість, зцьою цією роботою, як Jonathan Culler має віру, Saussure демонстрував "температура мислення англійської мови як система суворо відносної частини, навіть коли працює на ходу історичної реконструкції" (Saussure 6). Будучи analyzing systematic structural relationships між phonemes до облікового запису з vowel alternation у існуючих Indonesian European Languages, Saussure suggested що в додатку до several different phonemes /a/, вони повинні бути будь-яким повідомленим будь-яким телефоном. "What makes Saussure"s work so very impresive," Culler concludes, "is fact that nearly fifty years later, when cuneiform Hittite був затверджений і принесений, він був заснований на contain a phoneme, written h, which behaved as . Він мав усвідомити, як точніше formal analysis, який є новим знав як літератури з Індоєвропейської "(66).

Цей висновок щодо відносного або значущого визначання елементів значущості, які є як implicit, так і explicit в курсі, позначаються на третій прихильності керуючих структурних лінгвістичних, які спонукають прохання "на arbitrary nature of the sign." За цими способами те, що відносини між знаком і встановленим в англійській мові є необов'язково (або "змінено"): один може тільки добре проходити звуковий сигналіст arbre as signifier tree до unite with the concept "tree". Але більше, ніж це, це означає, що він є вірним як добре: один може бути впевнено визначений на концепції "tree" з її woody quality (яка буде exclude palm trees) як її розмір (яка виключає "low woody plants" call shrubs). Це повинно бути чутливим до того, що число віртуальних повідомлень, що ми не можемо усвідомити, що ордер of priority: їх усвідомлення – систематична природа значущості (більш apprehended by studying language "синхронно"), the relational or "diacritical of signification, the arbitrary nature of signs – derives its value from the others.

Що це, Saussurean лінгвістики піддаються phenomena it studies in overarching relationships of combination and contrast in language. У цій концепції, англійською мовою є процес процесу технічного аналізу (сигналізація) і його продукту (комунікацій), і ці дві функції англійської мови є кожний подібний або повністю загартований (див. Schleifer, "Deconstruction"). Тут, мабуть, можна визначити між собою форму і зміст, що Greimas і Courtés повторюється в сучасних interpretations: language presents contrasts, що formalmente define його units, і ці units combine on succeeding levels to create the signifying content. Безсумнівно, елементи англійської мови є arbitrary, moreover, деякий contrast nor combination може бути спрямований на basic. Таким чином, в мові характерні особливості комбінації для форми спілкування телефонів на іншому рівні apprehension, телефонів з'єднується з формою повідомлень morphemes, morphemes combine for words, words combine to form sentences, and so on. У будь-якому випадку, протягом всього телефону, або слово, або повідомлення, і тому, що є більшою, ніж сума своїх частин (just as water, H2O, in Saussure"s example [(1959) 103] is more than mechanical agglomeration з hydrogen і oxygen).

Три припущення з курсу в загальному лінгвістиці ведуть суспільство, щоб скористатися новою школою двадцятьох центірів, які повинні бути в лінгвістичній школі, щоб вивчити "життя слів з в соціумі." Saussure називається цією основою "семіології" (16). "Середня" semiotics, як це може бути виконана в Великобританії в 1920-х і 1930-х роках і Париж в 1950-х і 1960-х роках, вивчається вивчення лінгвістичних і лінгвістичних структур для літературних архітектурних структур. Через нову частину своєї кар'єри, morever, навіть якщо вона була в курсі курсів в загальних лінгвістичних, Saussure pursued його власні "семіотичні" аналітика останньої латиної поетри в дослідженні довідник наближено налаштованих анаграм. Метод методики був у багатьох випадках з'єднаний з функціональним rationalism своїх лінгвістичних analyses: він спричинений, як сприйняття ментіонів в одному з 99 notebooks в яких було випущено це дослідження, яке вивчається систематично на питання стає inevitable foundation of everything" (cited in Starobinski 101). Такий вивчання, як Saussure himself says, фокусується на "матеріальної факту" chance and meaning (показано 101), так, що "тем-слово", який anagram Saussure є скидання, як Jean Starobinski argues, "є, для поети , an instrument, and not a vital germ of the poem. У цьому аналізі, Starobinski says, "Saussure did not lose himself in asearch for hidden meanings." Instead, його робота seems to demonstrate a desire to evade all the problems rising from consciousness: "Since poetry is notly realized in words but is something born from words, it escapes arbitrary control of consciousness to depending (121).

Що це, Saussure's attempt to discover propera names в останній Latin poetry – what Tzvetan Todorov Calls the reduction of a "word . . . to its signifier" (266) – emphasizes one of the elements that governed his linguistic analysis, the arbitrary nature of the sign. (It also emphasizes the formal nature of Saussurean linguistics – "Language," a substance" – які ефективно eliminates semantics as major object of analysis.) Як Todorov concludes, Saussure"s work appears remarkably homogeneous today in its refusal to accept symbolic phenomena . . . . У його вивченні на анаграмах, ви отримаєте попит тільки на феномен repetition, не на той еволюції. . . . У його дослідженнях з Nibelungen, які визнають символи тільки в ордері, щоб розглянути їх до поводження readings: since they not intentional, symbols do no exist. Finally in his courses on general linguistics, he contemplates the existence of semiology, and thus of signs other than linguistics ones; Але ця affirmation is at once limited by fact that semiology is devoted to a single type of sign: those which are arbitrary. (269-70)

Якщо це є true, це означає, що Saussure не може визнати "наслідування" без предмета; я не можу, щоб не вистачило, щоб одержати між формою і вмістом його роботи, щоб скористатися роботою. Instead, he resorted до "лінгвістичної legality." Закінчено між, на одній стороні, нітейнто-центру концепції історії, підприємництва, і в способі causal interpretation регулювалися за їхніми словами, і на іншій стороні, двадцять-центру "structuralist" conceptions what Lévi-Strauss називається "Kantianism a transcendental subject" (cited in Connerton 23) – conceptions that erase the opposition between form and content (or subject and object) and the hierarchy of foreground and background in full-blown structuralism, psychoanalysis, and even quantum mechanics - the work of Ferdinand de Saussure в лінгвістиках і semiotics circumscribes в signal moment в study of meaning and culture.

Ronald Schleifer


Додаток 2

Фердинанд де Соссюр (переклад)

Швейцарський мовознавець Фердинанд де Соссюр (1857-1913) вважається засновником сучасної лінгвістики завдяки своїм спробам описати структуру мови, а не історію окремих мов і словоформ. За великим рахунком, основи структурних методів у лінгвістиці та літературознавстві і значною мірою семіотики були закладені в його роботах на початку ХХ століття. Доведено, що методи та концепції так званого "постструктуралізму", розвинені в роботах Жака Дерріда, Мішеля Фуко, Жака Лакана, Юлії Крістєвої, Ролана Барта та інших, сягають лінгвістичних праць Соссюра та анаграматичних прочитань пізньої римської поезії. Слід зауважити, що роботи Соссюра з лінгвістики та мовної інтерпретації допомагає пов'язати широке коло інтелектуальних дисциплін – від фізики до літературних нововведень, психоаналізу та філософії початку ХХ століття. А. Дж. Греймас та Ж. Курте пишуть у «Семіотиці та мові»: «Аналітичний словник із заголовком «Інтерпретація» як новий вид інтерпретації з'явився на початку ХХ століття разом із лінгвістикою Соссюра, феноменологією Гуссерля та психоаналізом Фрейда. У разі, " інтерпретація – це приписування даного змісту до форми, яка інакше зазнала б недолік у цьому; скоріш це - переказ, який формулює іншим способом той самий зміст значимого елемента не більше даної семіотичної системи " (159). У такому розумінні «інтерпретації», форма та зміст нерозривні; навпаки, кожна форма наповнена семантичним значенням («значуща форма»), тому інтерпретація пропонує новий, аналогічний переказ чогось, значимого в іншій знаковій системі.

Подібне розуміння форми і змісту, що представляється Клодом Леві-Строссом в одній з програмних робіт структуралізму, ("Структура і Форма: Роздуми над працями Володимира Проппа") - можна побачити в книзі Соссюра «Курс загальної лінгвістики» (1916, пров. 1959, 1983). За життя Соссюр мало публікувався, "Курс" - його основна робота - був зібраний за конспектами студентів, які відвідували його лекції з загальної лінгвістики в 1907-11 роках. У «Курсі» Соссюр закликав до «наукового» вивчення мови, протиставляючи його порівняльно-історичному мовознавству дев'ятнадцятого століття. Цю роботу можна вважати одним із найбільших досягнень західної думки: беручи за основу окремі слова як структурні елементи мови, історичне (або «діахронічне») мовознавство доводило походження та розвиток західноєвропейських мов від загальної, індоєвропейської мови – та більш ранньої праіндоєвропейської.

Це - точно це дослідження унікальних виникнення слів, з супутнім припущенням, що основна "одиниця" мови, фактично, позитивне існування цих "елементів слова", що Соссюр поставив під сумнів. Його робота була спробою скоротити безліч фактів про мову, побіжно вивчених порівняльною лінгвістикою, до небагатьох теорем. Порівняльна філологічна школа ХІХ століття, пише Соссюр, «не досягла успіху у створенні справжньої школи лінгвістики», оскільки «вона зрозуміла сутності об'єкта вивчення» ( 3). Ця «сутність», стверджує він, полягає у окремих словах – «позитивних субстанціях» мови – а й у формальних зв'язках, які допомагають цим субстанціям існувати.

Соссюрівська "перевірка" мови заснована на трьох припущеннях. Перше: наукове розуміння мови засноване не так на історичному, але в структурному феномені. Тому він розрізняв окремі явища мови – «подія мови», які він визначає як «parole» – і належний, на його думку, об'єкт вивчення лінгвістики, систему (код, структуру), що керує цими подіями («langue»). Подібне систематичне вивчення, крім того, потребує «синхронної» концепції відносин між елементами мови на даний момент, а не «діахронічного» дослідження розвитку мови через її історію.

Ця гіпотеза стала передвісником того, що Роман Якобсон у 1929 назве «структуралізмом» - теорії, де "будь-який набір явищ, досліджений сучасною наукою, розглядається не як механічне скупчення, а як структурне ціле, в якому конструктивна складова співвідноситься з функцією" ("Romantic "711). У цьому уривку Якобсон сформулював сосюрівську ідею визначення мови як структури на противагу «машинальному» перерахуванню історичних подій. Крім того, Якобсон розвиває й інше соссюрівське припущення, що стало предтечею структурної лінгвістики: базові елементи мови повинні вивчатися у зв'язку не стільки зі своїми причинами, скільки зі своїми функціями. Окремі явища та події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не власними силами, а в системі, в якій вони співвіднесені з подібними ж складовими. Це був радикальний поворот у зіставленні явищ з навколишньою дійсністю, значимість якого філософ Ернст Кассірер порівняв з «наукою Галілея, що перевернула в сімнадцятому столітті уявлення про матеріальний світ». Сивова, і самі пояснення.Яви стали трактуватися не щодо причин їх виникнення, а щодо того ефекту, який вони можуть опинитися в сучасному і майбутньому.Тлумачення перестало бути незалежним від намірів людини(попри те, що наміри можуть бути безособовими, «несвідомими») у фрейдистському розумінні цього слова).

У своїй лінгвістиці Соссюр особливо показує цей поворот у зміні поняття слова у лінгвістиці, яке він визначає як знак та описує з погляду його функцій. Знак для нього - поєднання звучання і сенсу, що "позначається і позначення" (66-67; в англійському перекладі 1983 авторства Роя Харріса - "signification" і "signal"). Природа цієї сполуки – «функціональна» (ні той, ні інший елемент що неспроможні існувати друг без друга); більше, " одне запозичує якості в іншого " (8). Таким чином, Соссюр визначає основний структурний елемент мови – знак – і робить основою історичного мовознавства ідентичність знаків словами, що потребує особливо суворого аналізу. Тому ми можемо зрозуміти різні значення, скажімо, одного й того ж слова «дерево» – не тому що слово є лише набір певних якостей, а тому що воно визначено як елемент у знаковій системі, у «структурному цілому», у мові.

Подібне відносне («діакритичне») поняття єдності лежить в основі уявлення про всі елементи мови у структурній лінгвістиці. Це особливо ясно видно у найбільш оригінальній знахідці соссюрівського мовознавства, у розвитку концепції «фонем» та «відмінних рис» мови. Фонеми – найдрібніші зі сказаних і значних мовних одиниць. Вони є не тільки звуками, що зустрічаються в мові, але «звуковими образами», зауважує Соссюр, які сприймаються носіями мови як такі, що мають значення. (Слід зазначити, що Елмар Холенштейн називає лінгвістику Якобсона, за основними положеннями Соссюра, що продовжує ідеї та концепції, «феноменологічним структуралізмом»). Саме тому провідний доповідач празької школи структуралізму Ян Мукаровський зауважив у 1937 році, що «структура. . . не емпіричне, а феноменологічне поняття; це сам результат, а набір значних відносин колективного свідомості (покоління, оточуючих тощо.)». Схожу думку висловив у 1960 році Леві-Стросс, лідер французького структуралізму: «У структури немає певного змісту; вона сама по собі змістовна, і логічна конструкція, в яку вона укладена, є відбитком реальності».

У свою чергу фонеми, як найдрібніші мовні елементи, прийнятні для сприйняття, є окремою цілісною «феноменологічною реальністю». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але у всіх випадках людина, яка володіє англійською, сприйматиме її як «т». Вимовлений з придыханием, з високим чи низьким підйомом мови, довгий звук «т» тощо однаково розрізнятиме значення слів «to» і «do». Більше того – відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншій; наприклад «л» і «р» в англійській різні, тоді як в інших мовах це різновиди однієї фонеми (подібно до англійської «т», сказаному з придихом і без). Великий словниковий запас будь-якої природної мови є набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для вимовлення та написання близько мільйона слів використовується лише 40 фонем.

Звуки мови є системно організований набір характеристик. У 1920е –1930е, за Соссюром, Якобсон і Н.С.Трубецкой виділили «відмінні риси» фонем. Ці риси засновані на будові органів мови - мови, зубів, голосових зв'язок - Соссюр зауважує це в "Курсі загальної лінгвістики", а Харріс називає "фізіологічною фонетикою" (у більш ранньому перекладі Баскіна використовується термін "фонологія") - вони поєднуються в "вузли" дург проти друга, щоб видавати звуки. Скажімо, in в англійській різниця між "т" і "д" полягає в наявності або відсутності "голосу" (напрузі голосових зв'язок), і в рівні голосу, що відрізняє одну фонему від іншої. Таким чином, фонологію можна вважати прикладом загального мовного правила, описаного Соссюр: «У мові є лише відмінності». Більш важливо навіть це: відмінність зазвичай має на увазі точні умови, між якими воно й перебуває; але у мові існують лише відмінності без точних умов. Чи розглядаємо ми «позначення» чи «позначається» – у мові немає ні понять, ні звуків, які б до того, як розвинулася мовна система.

У подібній структурі мовні аналогії визначені не за допомогою властивих їм якостей, а за допомогою системних («структурних») відносин.

Я вже згадав, що фонологія у своєму розвитку спиралася на ідеї Соссюра. Незважаючи на те, що його аналіз мовної фізіології в наш час за словами Харріса, «було б названо «фізичним», на противагу «психологічному» чи «функціональному», у «Курсі» він виразно сформулював напрямок та основні засади функціонального аналізу мови. Його єдина видана за життя робота, «Записки про початкову систему голосних в індоєвропейських мовах», видана в 1878, повністю знаходилася в руслі порівняльно-історичного мовознавства XIX століття. Проте цією працею, як каже Джонатан Каллер, Соссюр показав «плідність уявлення про мову як систему взаємопов'язаних явищ, навіть за його історичної реконструкції». Аналізуючи взаємозв'язки між фонемами, пояснюючи чергування голосних у сучасних мовах індоєвропейської групи, Соссюр припустив, що крім кількох різних звуків «а», мають бути інші фонеми, описувані формально. «Що справляє особливе враження у праці Соссюра, – робить висновок Каллер, – те, що майже через 50 років, при відкритті і розшифровці хетського клинопису, була знайдена фонема, на листі позначається «h», яка поводилася так, як пророкував Соссюр. За допомогою формального аналізу він відкрив те, що зараз відоме як гортанний звук в індоєвропейських мовах.

У концепції відносного (діакритичного) визначення знаків, як явно вираженої, так і на увазі в «Курсі», існує і третє ключове припущення структурної лінгвістики, назване Соссюром «довільною природою знака». Під цим мається на увазі, що відношення між звучанням і значенням у мові нічим не мотивоване: з однаковою легкістю можна поєднати слово arbre і слово tree з поняттям дерево. Більше того, це означає, що звучання теж довільне: можна визначити поняття «дерево» щодо наявності у нього кори (крім пальм) та за розміром (крім «низьких деревних рослин» - чагарників). З цього має бути зрозуміло, що всі припущення, які я представляю, не діляться на більш і менш важливі: кожне з них – системний характер знаків (найбільш зрозумілий при «синхронному» вивченні мови), їх відносна (діакритична) сутність, довільна природа знаків – виходить. з решти.

Таким чином, в соссюрівському мовознавстві феномен, що вивчається, розуміється як зведення зіставлень і протиставлень мови. Мова – це і вираз значення слів (позначення), та його результат (спілкування) – і ці дві функції будь-коли збігаються (див. «Деконструкцію мови» Шлейфера). Ми можемо помітити чергування форми та змісту, яке Греймас і Курте описують у новітньому варіанті інтерпретації: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють на рівні, що змінюють один одного, щоб створити певний значущий зміст. Оскільки елементи мови випадкові, ні контраст, ні поєднання неможливо знайти основою. Отже, у мові відмітні ознаки формують фонетичний контраст іншому рівні розуміння, фонеми поєднуються в контрастні морфеми, морфеми – у слова, слова – у речення тощо. У будь-якому випадку ціла фонема, слово, речення і т.д. є чимось більшим, ніж сума складових (як і вода, в соссюровском прикладі – більше, ніж поєднання водню і кисню).

Три припущення «Курсу загальної лінгвістики» привели Соссюра до ідеї нової науки ХХ століття, окремо від лінгвістики вивчає «життя знаків у суспільстві». Соссюр назвав цю науку семіологією (від грецької «semeîon» – знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920-1930 і в Парижі в 1950 і 1960, розширила вивчення мови і лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своєму курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою, як пише Соссюр в одній із 99 записників, вивчити в системі проблему «імовірності», яка «стає основою всього». Таке дослідження, як стверджує сам Соссюр, допомагає зосередитись на «речовій стороні» ймовірності; «ключове слово», анаграму якого шукає Соссюр, як стверджує Жан Старобинський, «інструмент для поета, а чи не джерело життя вірша. Вірш служить у тому, щоб поміняти місцями звуки ключового слова». За словами Старобинського, у цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, у його роботах помітно бажання уникнути питань, пов'язаних зі свідомістю: «оскільки поезія виражається у словах, а й у тому, що породжують ці слова, вона виходить з-під контролю свідомості і від законів мови».

Спроба Соссюра вивчити власні імена в пізній римській поезії (Цветан Тодоров назвав це скороченням «слова... лише до його написання») підкреслює одну зі складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюрівської лінгвістики («Я він, «суть форма, а чи не явище»), що виключає можливість аналізу сенсу. Тодоров робить висновок, що в наші дні праці Соссюра виглядають на диво послідовними в небажанні вивчати символи [яви, що мають чітко визначене значення]. . . . Досліджуючи анаграми, Соссюр звертає увагу лише з повторення, але з попередні варіанти. . . . Вивчаючи «Пісню про Нібелунги», він визначає символи лише для того, щоб привласнити їх хибним читанням: якщо вони ненавмисні, символів не існує. Зрештою, у своїх працях із загальної лінгвістики він припускає існування семіології, описує як лінгвістичні знаки; але це припущення обмежується тим, що семилогоя може описувати лише випадкові, довільні знаки.

Якщо це справді так, то тільки тому, що не міг уявити «намір» без предмета; він не міг до кінця подолати прірву між формою та змістом – у його працях це перетворювалося на питання. Натомість він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, що ґрунтуються на історії та суб'єктивних здогадах, та методах випадкової інтерпретації, що ґрунтуються на цих концепціях, і, з іншого боку, структуралістськими концепціями, які Леві-Стросс назвав «кантіанством без трансцендентної дійової особи» – такими, що стирають протистояння між формою і змістом (суб'єктом і об'єктом), значенням і походженням у структуралізмі, психоаналізі і навіть квантової механіки – праці Ферлінанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Рональд Шлейфер

Література

1. Адмоні В.Г. Основи теорії граматики/В.Г. Адмоні; АН СРСР.-М.: Наука, 1964.-104с.

3. Арапов, М.В., Херц, М.М. Математичні методи у лінгвістиці. М., 1974.

4. Арнольд І.В. Семантична структура слова в сучасній англійській мові та методика її дослідження. /І.В. Арнольд-Л.: Просвітництво, 1966. - 187 с.

6.Башликов А.М. Система автоматизованого перекладу. / А.М. Башликов, А.А. Соколів. - М.: ТОВ «ФІМА», 1997. - 20 с.

7.Бодуен де Куртене: Теоретична спадщина та сучасність: Тези доповідей міжнародної наукової конференції / Ред.І.Г. Кондратьєва. - Казань: КДУ, 1995. - 224 с.

8. Гладкий А.В., Елементи математичної лігвістики. /. Гладкий О.В., Мельчук І.О. -М., 1969. - 198 с.

9. Головін, Б.М. Мова та статистика. /Б.М. Головін -М., 1971. - 210 с.

10. Звегінців, В.А. Теоретична та прикладна лінгвістика. / В.А. Звегінців -М., 1969. - 143 с.

11. Касевич, В.Б. Семантика. Синтаксису. Морфологія // В.Б. Касевич -М., 1988. - 292 c.

12. Лекомцев Ю.К. Введення у формальну мову лінгвістики/Ю.К. Лекомців. - М.: Наука, 1983, 204 с., Іл.

13. Лінгвістична спадщина Бодуена де Куртене наприкінці ХХ століття: Тези доповідей міжнародної науково-практичної конференції 15-18 березня 2000 року. - Красноярськ, 2000. - 125 с.

Матвєєва Г.Г. Приховані граматичні значення та ідентифікація соціальної особи («портрета») мовця/Г.Г. Матвєєва. - Ростов, 1999. - 174 с.

14. Мельчук, І.А. Досвід побудови лінгвістичних моделей "Сенс<-->Текст". / І.А. Мельчук. - М., 1974. - 145 c.

15. Нелюбін Л.Л. Переклад та прикладна лінгвістика / Л.Л. Нелюбін. - М.: Вища школа, 1983. - 207 с.

16. Про точні методи дослідження мови: про так звану «математичну лінгвістику»/О.С. Ахманова, І. А. Мельчук, Є.В. Падучова та інших. – М., 1961. – 162 з.

17. Піотровський Л.Г. Математична лінгвістика: Навчальний посібник/Л.Г. Піотровський, К.Б. Бектаєв, А.А. Піотрівська. - М.: Вища школа, 1977. - 160 с.

18.Він же. Текст, машина, людина. - Л., 1975. - 213 с.

19. Він же. Прикладне мовознавство/За ред. О.С Герда. - Л., 1986. - 176 с.

20. Ревзін, І.І. Моделі мови. М., 1963. Ревзін, І.І. Сучасна структурна лінгвістика. Проблеми та методи. М., 1977. - 239 с.

21. Ревзін, І.І., Розенцвейг, В.Ю. Основи загального та машинного перекладу / Ревзін І.І., Розенцвейг, В.Ю. - М., 1964. - 401 с.

22. Слюсарьова Н.А. Теорія Ф.де Соссюра у світлі сучасної лінгвістики/Н.А. Слюсарєва. - М.: Наука, 1975. - 156 с.

23. Сова, Л.З. Аналітична лінгвістика/Л.З. Сова - М., 1970. - 192 с.

24. Соссюр Ф. де. Нотатки із загальної лінгвістики/ Ф. де Соссюр; Пров. із фр. - М.: Прогрес, 2000. - 187 с.

25. Він же. Курс загальної лінгвістики/Пер. із фр. - Єкатеринбург, 1999. -426 с.

26. Статистика мови та автоматичний аналіз тексту / Відп. ред. Р.Г. Піотровський. Л., 1980. - 223 с.

27. Столл, P. Безліч. Логікa. Аксіоматичні теорії. / Р. Столл; Пров. з англ. - М., 1968. - 180 с.

28. Теньєр, Л. Основи структурного синтаксису. М., 1988.

29. Убін І.І. Автоматизація перекладацької діяльності у СРСР/І.І. Убін, Л.Ю. Коростелев, Б.Д. Тихомиров. - М., 1989. - 28 с.

30. Фор, P., Кофман, A., Дені-Папен, М. Сучасна математика. М., 1966.

31. Шенк, Р. Обробка концептуальної інформації. М., 1980.

32. Шихaнович, Ю.A. Введення в сучасну математику (початкові поняття). М., 1965

33. Щерба Л.В. Російські голосні в якісному та кількісному відношенні/Л.В. Щерба - Л.: Наука, 1983. - 159 с.

34. Абдулла-заде Ф. Громадянин світу// Вогник – 1996. – №5. - С.13

35. В.А. Успенський. Попередження для читачів "Нового літературного огляду" до семіотичних послань Андрія Миколайовича Колмогорова. - Новий літературний огляд. -1997. - № 24. - С. 18-23

36. Перловський Л. Свідомість, мова та культура. - Знання сила. -2000. №4 - С. 20-33

37. Фрумкіна Р.М. Про нас – навскіс. //Російський Журнал. - 2000. - №1. - С. 12

38. Фітіалов, С.Я. Про моделювання синтаксису у структурній лінгвістиці // Проблеми структурної лінгвістики. М., 1962.

39. Він же. Про еквівалентність граматики СР та граматики залежностей // Проблеми структурної лінгвістики. М., 1967.

40. Хомський, Н. Логічні основи лінгвістичної теорії // Нове у лінгвістиці. Вип. 4. М., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. press. jhu.ru

46. ​​ru.wikipedia.org

47. www.smolensk.ru


Криптоаналіз - наука (і практика її застосування) про методи та способи розкриття шифрів. Криптографія та криптоаналіз становлять єдину галузь знань – криптологію, яка в даний час є областю сучасної математики, що має важливі додатки у сучасних інформаційних технологіях. Термін «криптографія» запровадив Д. Валліс. Потреба шифрувати повідомлення виникла дуже давно. У V - ...

Є найближче, а чи не подальше значення слова. Таким чином, психологічний напрямок і особливо младо-граматизм відповіли на багато питань, що стояли перед мовознавством у середині ХІХ ст. Було уточнено методику порівняльно-історичного мовознавства, поставлено основні проблеми семасіології та функціонально-семантичної граматики, проаналізовано взаємовідносини мови та мови, ...

Контакти", "Багатомовність в соціологічному аспекті". Їх дослідженням займаються соціолінгвістика (соціальна лінгвістика), що виникла на стику мовознавства та соціології, а також етнолінгвістика, етнографія мови, стилістика, риторика, прагматика, теорія мовного спілкування. Мова виконує в суспільстві такі соціальні функції: комунікативна/іформативна (...

На розділи та склад Мовазнавства. Розділи, що емпірично склалися, Мовазнавства, що частково перетинаються і вже тому не утворюють логічно єдиної системи, можна уявити як співвідносні один з одним за деякими різними параметрами. Загальне Мова та часткові науки про мову. Розрізняються найбільш загальні та приватні розділи Мовазнавства. Один із великих розділів Мовазнавства – теорія...

Вступ

Розділ 1. Історія застосування математичних методів у лінгвістиці

1.1. Становлення структурної лінгвістики межі ХІХ - ХХ століть

1.2. Застосування математичних методів у лінгвістиці у другій половині ХХ ст.

Розділ 2. Окремі приклади використання математики у лінгвістиці

2.1. Машинний переклад

2.2.Статистичні методи у вивченні мови

2.3. Вивчення мови методами формальної логіки

2.4. Перспективи застосування математичних методів у лінгвістиці

Висновок

Література

Додаток 1. Ronald Schleifer. Ferdinand de Saussure

Додаток 2. Фердінанд де Соссюр (переклад)

Вступ

У ХХ столітті намітилася тенденція до взаємодії та взаємопроникнення різних областей знань, що триває і донині. Поступово стираються межі між окремими науками; з'являється все більше галузей розумової діяльності, що знаходяться «на стику» гуманітарного, технічного та природничо знання.

Інша очевидна особливість сучасності - прагнення до вивчення структур та складових їх елементів. Тому все більше місце як у науковій теорії, так і на практиці приділяється математиці. Стикаючись, з одного боку, з логікою та філософією, з іншого боку, зі статистикою (а, отже, і з суспільними науками), математика все глибше проникає в ті сфери, які протягом довгого часу було прийнято вважати чисто «гуманітарними», розширюючи їхній евристичний потенціал (відповідь на запитання «скільки» часто допоможе відповісти і на запитання «що» та «як»). Винятком не стало і мовознавство.

Мета моєї курсової - коротко висвітлити зв'язок математики з такою галуззю мовознавства, як лінгвістика. Починаючи з 50-х років минулого століття, математика застосовується в лінгвістиці при створенні теоретичного апарату для опису будови мов (як природних, так і штучних). Однак слід сказати, що вона не відразу знайшла собі подібне практичне застосування. Спочатку математичні методи в лінгвістиці стали використовуватися для того, щоб уточнити основні поняття мовознавства, проте з розвитком комп'ютерної техніки подібна теоретична посилка почала знаходити застосування на практиці. Розв'язання таких завдань, як машинний переклад, машинний пошук інформації, автоматична обробка тексту вимагало нового підходу до мови. Перед лінгвістами назріло питання: як навчитися репрезентувати мовні закономірності в тому вигляді, в якому їх можна подавати безпосередньо на техніку. Популярним у час терміном «математична лінгвістика» називають будь-які лінгвістичні дослідження, у яких застосовуються точні методи (а поняття точних методів у науці завжди тісно пов'язані з математикою). Деякі вчені минулих років вважають, що саме вираз не можна зводити в ранг терміна, оскільки він позначає не якусь особливу «лінгвістику», а лише новий напрямок, орієнтований на вдосконалення, підвищення точності та надійності методів вивчення мови. У лінгвістиці використовуються як кількісні (алгебраїчні), і некількісні методи, що зближує її з математичної логікою, отже, і з філософією, і навіть із психологією. Ще Шлегель наголошував на взаємодії мови і свідомості, а видний лінгвіст початку ХХ століття Фердинанд де Соссюр (про його вплив на становлення математичних методів у лінгвістиці розповім пізніше) пов'язував структуру мови з її приналежністю до народу. Сучасний дослідник Л. Перловський йде далі, ототожнюючи кількісні характеристики мови (наприклад, кількість пологів, відмінків) з особливостями національного менталітету (про це розділ 2.2, «Статистичні методи в лінгвістиці»).

Взаємодія математики та мовознавства - тема багатогранна, і у своїй роботі я зупинюся не на всіх, а насамперед на її прикладних аспектах.

Глава I. Історія застосування математичних методів у лінгвістиці

1.1 Становлення структурної лінгвістики межі ХІХ - ХХ століть

Математичний опис мови заснований на уявленні про мову як механізм, що сходить до відомого швейцарського лінгвіста початку ХХ століття Фердинанду де Соссюру.

Початкова ланка його концепції - теорія мови як системи, що складається з трьох частин (власне мова - langue, мова - parole, та мовну діяльність - langage), в якій кожне слово (член системи) розглядається не саме собою, а у зв'язку з іншими членами. Як згодом зазначив інший видний лінгвіст, данець Луї Єльмслєв, Соссюр «перший вимагав структурного підходу до мови, тобто наукового опису мови шляхом реєстрації співвідношень між одиницями».

Розуміючи мову як ієрархічну структуру, Соссюр першим поставив проблему цінності, важливості мовних одиниць. Окремі явища та події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не власними силами, а в системі, в якій вони співвіднесені з подібними ж складовими.

Структурною одиницею мови Соссюр вважав слово, «знак», у якому поєднувалися звучання та зміст. Жоден з цих елементів немає один без одного: тому носію мови зрозумілі різні відтінки значення багатозначного слова як окремого елемента в структурному цілому, в мові.

Таким чином, в теорії Ф. де Соссюра можна побачити взаємодію лінгвістики, з одного боку, з соціологією та соціальною психологією (слід зазначити, що в цей же час розвиваються феноменологія Гуссерля, психоаналіз Фрейда, теорія відносності Ейнштейна, відбуваються експерименти над формою та змістом у літератури, музики та образотворчого мистецтва), з іншого боку - з математикою (поняття системності відповідає алгебраїчної концепції мови). Подібна концепція змінила поняття мовної інтерпретації як такої: явища почали трактуватися не щодо причин їх виникнення, а щодо сьогодення та майбутнього. Тлумачення перестало бути незалежним від намірів людини (не дивлячись на те, що наміри можуть бути безособовими, «несвідомими» у фрейдистському розумінні цього слова).

Функціонування ж мовного механізму проявляється через мовну діяльність носіїв мови. Результатом промови є звані «правильні тексти» - послідовності мовних одиниць, підпорядковуються певним закономірностям, багато з яких допускають математичний опис. Вивченням методів математичного опису правильних текстів (насамперед, пропозицій) займається теорія методів опису синтаксичної структури. У подібній структурі мовні аналогії визначені не за допомогою властивих їм якостей, а за допомогою системних («структурних») відносин.

На Заході сосюрівські ідеї розвивають молодші сучасники великого швейцарського лінгвіста: у Данії - вже згаданий мною Л. Єльмсльов, який дав початок алгебраїчної теорії мови у своїй праці "Основи лінгвістичної теорії", в США - Е. Сепір, Л. Блумфілд у Чехії – російський учений-емігрант Н. Трубецькой.

Статистичними ж закономірностями у вивченні мови став займатися ніхто інший, як основоположник генетики Георг Мендель. Тільки 1968 року філологи виявили, що, виявляється, останні роки життя він був захоплений вивченням лінгвістичних явищ з допомогою методів математики. Цей метод Мендель привніс у лінгвістику з біології; у дев'яності роки дев'ятнадцятого століття лише найсміливіші лінгвісти і біологи заявляли про доцільність такого аналізу. В архіві монастиря св. Томаша в Брно, абатом якого був Мендель, були знайдені листки зі стовпцями прізвищ, що закінчуються на «mann», «bauer», «mayer», і з якимись дробами та обчисленнями. Прагнучи виявити формальні закони походження фамільних імен, Мендель робить складні підрахунки, в яких враховує кількість голосних і приголосних у німецькій мові, загальна кількість слів, кількість прізвищ і т.д.

У нашій країні структурна лінгвістика почала розвиватися приблизно водночас, як і Заході - межі XIX-XX століть. Поруч із Ф. де Соссюром поняття мови як системи розробляли у працях професора Казанського університету Ф.Ф. Фортунатов та І.А. Бодуен де Куртене. Останній упродовж тривалого часу листувався з де Соссюром, відповідно, женевська та казанська школи мовознавства співпрацювали одна з одною. Якщо Соссюра можна назвати ідеологом «точних» методів у лінгвістиці, Бодуен де Куртене заклав практичні основи їх застосування. Він першим відокремив лінгвістику (як точнунауку, що використовує статистичні методи та функціональну залежність) від філології (спільності гуманітарних дисциплін, що вивчають духовну культуру через мову та мову). Сам учений вважав, що «мова знання може принести користь у найближчому майбутньому, лише звільнившись від обов'язкового союзу з філологією та історією літератури». «Випробовуваним полігоном» для впровадження математичних методів у лінгвістику стала фонологія – звуки як «атоми» мовної системи, що мають обмежену кількість легко вимірних властивостей, були найзручнішим матеріалом для формальних, суворих методів опису. Фонологія заперечує наявність сенсу у звуку, отже, у дослідженнях усувався «людський» чинник. У цьому сенсі фонеми подібні до фізичних або біологічних об'єктів.

Фонеми, як найдрібніші мовні елементи, прийнятні сприйняття, є окрему сферу, окрему «феноменологічну реальність». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але у всіх випадках людина, яка володіє англійською, сприйматиме її як «т». Головне, що фонема виконуватиме свою головну – сенсорозрізнювальну – функцію. Більше того - відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншій; наприклад "л" і "р" в англійській різні, у той час як в інших мовах це різновиди однієї фонеми (подібно до англійської "т", сказаному з придихом або без). Великий словниковий запас будь-якої природної мови є набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для вимовлення та написання близько мільйона слів використовується лише 40 фонем.

Звуки мови є системно організований набір характеристик. У 1920-1930-ті, за Соссюром, Якобсон і Н.С.Трубецкой виділили «відмінні риси» фонем. Ці риси засновані на будові органів мови – язика, зубів, голосових зв'язок. Скажімо, в англійській різниця між "т" і "д" полягає в наявності або відсутності "голосу" (напрузі голосових зв'язок) і в рівні голосу, що відрізняє одну фонему від іншої. Отже, фонологію вважатимуться прикладом загального мовного правила, описаного Соссюром: «У мові є лише відмінності» . Більш важливо навіть це: відмінність зазвичай має на увазі точні умови, між якими воно й перебуває; але у мові існують лише відмінності без точних умов. Розглядаємо ми «позначення» чи «позначається» - у мові немає ні понять, ні звуків, які б до того, як розвинулася мовна система.

Таким чином, в соссюрівському мовознавстві феномен, що вивчається, розуміється як зведення зіставлень і протиставлень мови. Мова - це вираз значення слів, і засіб спілкування, причому ці дві функції ніколи не збігаються. Ми можемо помітити чергування форми та змісту: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють, щоб створити певний зміст. Оскільки елементи мови випадкові, ні контраст, ні поєднання неможливо знайти основою. Отже, у мові відмітні ознаки формують фонетичний контраст іншому рівні розуміння, фонеми поєднуються в морфеми, морфеми - у слова, слова - у речення тощо. У будь-якому випадку ціла фонема, слово, речення і т.д. є чимось більшим, ніж просто сума складових.

Соссюр запропонував ідею нової науки ХХ століття, окремо від лінгвістики вивчаючої роль знаків у суспільстві. Соссюр назвав цю науку семіологією (від грецької «semeîon» – знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920-1930 і в Парижі в 1950-1960, розширила вивчення мови і лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своєму курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою вивчити в системі проблему «імовірності» у мові. Таке дослідження допомагає зосередитись на «речовій стороні» ймовірності; "ключове слово", анаграму якого шукає Соссюр, як стверджує Жан Старобінський, "інструмент для поета, а не джерело життя вірша". Вірш служить у тому, щоб поміняти місцями звуки ключового слова. За словами Старобинського, у цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, у його роботах помітне бажання уникнути питань, пов'язаних зі свідомістю: «оскільки поезія виражається у словах, а й у тому, що породжують ці слова, вона виходить з-під контролю свідомості залежить тільки від законів мови» (cм . Додаток 1).

Спроба Соссюра вивчити власні імена в пізній римській поезії підкреслює одну зі складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюрівської лінгвістики, що виключає можливість аналізу сенсу. Тодоров робить висновок, що у наші дні праці Соссюра виглядають на диво послідовними у небажанні вивчати символи явища, мають чітко певне значення [Додаток 1]. Досліджуючи анаграми, Соссюр звертає увагу лише з повторення, але з попередні варіанти. . . . Вивчаючи «Пісню про Нібелунги», він визначає символи лише для того, щоб привласнити їх хибним читанням: якщо вони ненавмисні, символів не існує. Зрештою, у своїх працях із загальної лінгвістики він припускає існування семіології, описує як лінгвістичні знаки; але це припущення обмежується тим, що семіологія може описувати лише випадкові, довільні знаки.

Якщо це справді так, то тільки тому, що не міг уявити «намір» без предмета; він не міг до кінця подолати прірву між формою та змістом - у його працях це перетворювалося на питання. Натомість він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, заснованими на історії та суб'єктивних здогадах, і методами випадкової інтерпретації, заснованих на цих концепціях, і, з іншого боку, структуралістськими концепціями, що стирають протистояння між формою та змістом (суб'єктом та об'єктом), значенням і походженням у структуралізмі, психоаналізі і навіть квантової механіки - праці Фердинанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Російські вчені були представлені і на Першому міжнародному конгресі лінгвістів у Гаазі у 1928 році. С. Карцевський, Р. Якобсон та Н. Трубецькой виступили з доповіддю, в якій розглядалася ієрархічна структура мови – у дусі найсучасніших для початку минулого століття уявлень. Якобсон у своїх працях розвивав ідеї Соссюра у тому, що базові елементи мови повинні вивчатися, насамперед, у зв'язку зі своїми функціями, а чи не з причинами їх виникнення.

На жаль, після приходу у 1924 році до влади Сталіна вітчизняне мовознавство, як і багато інших наук, відкидає назад. Багато талановитих вчених змушені були емігрувати, були вислані з країни або загинули в таборах. Тільки з середини 1950-х став можливий деякий плюралізм теорій - про це в розділі 1.2.

1.2 Застосування математичних методів у лінгвістиці у другій половині ХХ ст.

До середини ХХ століття сформувалося чотири світові лінгвістичні школи, кожна з яких виявилася родоначальником певного «точного» методу. Ленінградська фонологічна школа(її родоначальником був учень Бодуена де Куртене Л.В. Щерба) використовувала як основний критерій узагальнення звуку у вигляді фонеми психолінгвістичний експеримент, заснований на аналізі мови носіїв мови.

Вчені Празького лінгвістичного гуртка, зокрема – його засновник Н.С. Трубецькій, що емігрував з Росії, розробили теорію опозицій - семантична структура мови була описана ними як набір оппозитивно побудованих семантичних одиниць - сем. Ця теорія застосовувалася у вивченні як мови, а й художньої культури.

Ідеологами американського дескриптивізмубули мовознавці Л. Блумфілд та Е. Сепір. Мова представлялася дескриптивістам у вигляді сукупності мовних висловлювань, які були головним об'єктом їх дослідження. У центрі їхньої уваги опинилися правила наукового опису (звідси назва) текстів: вивчення організації, аранжування та класифікація їх елементів. Формалізація аналітичних процедур у галузі фонології та морфології (розробка принципів дослідження мови на різних рівнях, дистрибутивного аналізу, методу безпосередньо складових тощо) призвела до постановки загальних питань лінгвістичного моделювання. Неувага до плану змісту мови, а також парадигматичного боку мови не дозволила дескриптивістам досить повно інтерпретувати мову як систему.

У 1960-х роках розвивається теорія формальних граматик, що виникла головним чином завдяки роботам американського філософа та лінгвіста Н. Хомського. Він по праву вважається одним із найвідоміших сучасних вчених та громадських діячів, йому присвячено безліч статей, монографій і навіть повнометражний документальний фільм. На ім'я принципово нового способу опису синтаксичної структури, винайденого Хомським - генеративної (що породжує) граматики - відповідна течія в лінгвістиці отримала назву генеративізму.

Хомський, нащадок вихідців з Росії, з 1945 року вивчав у Пенсільванському університеті лінгвістику, математику та філософію, перебуваючи під сильним впливом свого вчителя Зеліга Харріса - як і Герріс, Хомський вважав і вважає свої політичні погляди близькими до анархізму (досі він відомий критик існуючого політичного устрою США і як один із духовних лідерів антиглобалізму).

Перша велика наукова робота Хомського, магістерська дисертація «Морфологія сучасного івриту » (1951), і залишилася неопублікованою. Докторський ступінь Хомський отримав у Пенсільванському університеті в 1955 році, проте велика частина досліджень, покладених в основу дисертації (повністю опублікованої лише в 1975 році під назвою «Логічна структура лінгвістичної теорії») та його першої монографії «Синтаксичні структури» (Syntactic Structures, 1975). пер 1962), була виконана в Гарвардському університеті в 1951-1955. У тому ж 1955 р. вчений перейшов до Массачусетського технологічного інституту, професором якого він став у 1962 році.

У розвитку теорія Хомського пройшла кілька етапів.

У першій монографії «Синтактичні структури» вчений представив мову як механізм породження нескінченного безлічі пропозицій за допомогою кінцевого набору граматичних засобів. Для опису мовних властивостей він запропонував поняття глибинної (прихованої від безпосереднього сприйняття і породжуваної системою рекурсивних, тобто можуть багаторазово застосовуватися, правил) і поверхневої (безпосередньо сприймається) граматичних структур, а також трансформацій, що описують перехід від глибинних структур до поверхневих. Однією глибинною структурою можуть відповідати декілька поверхневих (наприклад, пасивна конструкція Указ підписується президентомвиводиться з тієї ж глибинної структури, що й активна конструкція Президент підписує указ) і навпаки (так, неоднозначність Мати любить дочкуописується як результат збігу поверхневих структур, що сягають двох різних глибинних, в одній з яких мати - та, хто любить дочку, а в іншій - та, кого любить дочка).

Стандартною теорією Хомського вважається модель Аспектів, викладена в книзі Хомського Аспекти теорії синтаксису. У цій моделі у формальну теорію вперше вводилися правила семантичної інтерпретації, що приписують значення глибинним структурам. В «Аспектах» мовна компетенція протиставлена ​​вживанню мови (performance), прийнята так звана гіпотеза Катца - Постала про збереження сенсу при трансформації, у зв'язку з чим виключено поняття факультативної трансформації, а також запроваджено апарат синтаксичних ознак, що описують лексичну сполучність.

У 1970-ті Хомський працює над теорією управління та зв'язування (GB-теорія – від слів governmentі binding) - більш загальної, ніж попередня. У ній вчений відмовився від специфічних правил, що описують синтаксичні структури конкретних мов. Усі трансформації замінили однією універсальною трансформацією переміщення. В рамках GB-теорії існують і приватні модулі, кожен із яких відповідає за свою частину граматики.

Вже нещодавно, 1995 року, Хомський висунув мінімалістську програму, де людська мова описується подібно до машинної. Це лише програма – не модель і не теорія. У ній Хомський виділяє дві основні підсистеми мовного апарату людини: лексикон і обчислювальну систему, і навіть два інтерфейси - фонетичний і логічний.

Формальні граматики Хомського стали класичними для опису як природних, а й штучних мов - зокрема, мов програмування. Розвиток структурної лінгвістики у другій половині ХХ століття можна вважати «хомскіанською революцією».

Московська фонологічна школа, представниками якої були А.А. Реформатський, В.М. Сидоров, П.С. Кузнєцов, А.М. Сухотін, Р.І. Аванесов, використовувала таку ж теорію вивчення фонетики. Поступово «точні» методи починають застосовуватися не лише фонетики, а й синтаксису. Структурністю мови починають займатися і лінгвісти, і математики – як у нас, так і за кордоном. У 1950-60-ті в СРСР починається новий етап у взаємодії математики та лінгвістики, пов'язаний із розробкою систем машинного перекладу.

Поштовхом до початку цих робіт у нашій країні послужили перші розробки в галузі машинного перекладу в США (хоча перший механізований переказний пристрій П.П. Смирнова-Троянського було винайдено в CCCР ще в 1933 році, воно, будучи примітивним, не набуло поширення). У 1947 році А. Бутт і Д. Бріттен придумали код для послівного перекладу за допомогою ЕОМ, через рік Р. Річенс запропонував правило розбиття слів на основу і закінчення при машинному перекладі. У роки досить сильно відрізнялися від сучасних. Це були дуже великі та дорогі машини, які займали цілі кімнати та вимагали для свого обслуговування великий штат інженерів, операторів та програмістів. В основному ці комп'ютери використовувалися для здійснення математичних розрахунків для потреб військових установ - нове в математиці, фізиці та техніці служило насамперед військовій справі. На ранніх етапах розробка МП активно підтримувалася військовими, причому (за умов «холодної війни») США розвивалося російсько-англійське напрям, а СРСР - англо-русское.

У січні 1954 року в Массачусетському технічному університеті відбувся "Джорджтаунський експеримент" - перша публічна демонстрація перекладу з російської мови на англійську машиною ІБМ-701. Реферат повідомлення про успішне проходження експерименту, зроблений Д.Ю. Пановим, народився РЖ «Математика», 1954, №10: «Переклад з однієї мови іншою з допомогою машини: звіт про перше успішному випробуванні».

До робіт з машинного перекладу Д. Ю. Панов (тоді директор Інституту наукової інформації - ІНІ, пізніше ВІНІТІ) залучив І. К. Бєльську, яка пізніше очолить групу машинного перекладу в Інституті точної математики та обчислювальної техніки АН СРСР. До кінця 1955 відноситься перший досвід перекладу з англійської мови на російську за допомогою машини БЭСМ. Програми для БЕСМ складали Н.П. Трифонов та Л.М. Корольов, кандидатську дисертацію якого було присвячено методам побудови словників для машинного перекладу.

Паралельно роботи з машинного перекладу велися у Відділенні прикладної математики Математичного інституту АН СРСР (зараз Інститут прикладної математики імені М.В. Келдиша РАН). З ініціативи математика А.А. Ляпунова. До робіт з перекладу текстів на машині «Стріла» з французької на російську він залучив аспірантку МІАН О.С. Кулагіну та своїх учениць Т.Д. Вентцель та Н.М. Рікко. Уявлення Ляпунова та Кулагіної про можливість використання техніки для перекладу з однієї мови на іншу були опубліковані в журналі «Природа», 1955 №8. З кінця 1955 року до них приєдналася Т.М. Молошня, потім розпочала самостійну роботу над алгоритмом англо-російського перекладу.

Р.Фрумкіна, яка займалася на той час алогритмом перекладу з іспанської, згадує, що на цьому етапі робіт складно було робити якісь послідовні кроки. Набагато частіше доводилося наслідувати евристичний досвід - свій чи колег.

Проте перше покоління систем машинного перекладу було дуже недосконалим. Усі вони базувалися на алгоритмах послідовного перекладу "слово за словом", "фраза за фразою" - смислові зв'язки між словами та реченнями ніяк не враховувалися. Наприклад можна навести пропозиції: « John був looking for his toy box.Finally he found it. The box was in the pen.John was very happy. (Джон шукав свою іграшкову коробку. Нарешті він її знайшов. Коробка була в манежі. Джон був дуже щасливий.)». "Pen" в даному контексті - не "ручка" (інструмент для письма), а "дитячий манеж" ( play-pen). Знання синонімів, антоніів та переносних значень складно вводити в комп'ютер. Перспективним напрямом ставала розробка машинних систем, орієнтованих використання людиною-перекладачем.

Згодом зміну системам прямого перекладу прийшли Т-системи (від англійського слова «transfer» - перетворення), у яких переклад здійснювався лише на рівні синтаксичних структур. В алгоритмах Т-систем використовувався механізм, що дозволяє побудувати синтаксичну структуру за правилами граматики мови вхідної речення (подібно до того, як вчать іноземної мови в середній школі), а потім синтезувати вихідну пропозицію, перетворюючи синтаксичну структуру і підставляючи з словника потрібні слова.

Ляпунов говорив про переклад шляхом отримання сенсу тексту, що перекладається, і його подання іншою мовою. Підхід до побудови систем машинного перекладу, заснований на отриманні смислового уявлення вхідного речення шляхом його семантичного аналізу та синтезу вхідної речення за отриманим смисловим уявленням, досі вважається найбільш досконалим. Такі системи називають І-системами (від слова "інтерлінгва"). Однак завдання щодо їх створення, поставлене ще наприкінці 50-х – на початку 60-х, не вирішене повністю досі, незважаючи на зусилля Міжнародної федерації IFIP – світової спільноти вчених у галузі обробки інформації.

Вчені замислилися над тим, як потрібно формалізувати та будувати алгоритми для роботи з текстами, які словники треба вводити в машину, які лінгвістичні закономірності слід використовувати при машинному перекладі. Такими уявленнями традиційна лінгвістика не мала - не тільки в частині семантики, але і в частині синтаксису. Для жодної мови на той час не існувало переліків синтаксичних конструкцій, не були вивчені умови їхньої сполучуваності та взаємозмаєняльності, не були розроблені правила побудови великих одиниць синтаксичної структури з дрібніших складових елементів.

Потреба створення теоретичних основ машинного перекладу і призвела до формування та розвитку математичної лінгвістики. Провідну роль цій справі СРСР зіграли математики А.А. Ляпунов, О.С. Кулагіна, В.А. Успенський, лінгвісти В.Ю. Розенцвейг, П.С. Кузнєцов, Р.М. Фрумкіна, А.А. Реформатський, І.А. Мельчук, В.В. Іванов. Дисертація Кулагіної була присвячена дослідженню формальної теорії граматик (одночасно з Н.Хомським у США), Кузнєцов висунув завдання аксіоматизації лінгвістики, що сходить до робіт Ф.Ф. Фортунатова.

6 травня 1960 року було прийнято Постанову Президії АН СРСР «Про розвиток структурних та математичних методів вивчення мови», в Інституті мовознавства та Інституті російської були створені відповідні підрозділи. З 1960 року у провідних гуманітарних вузах країни - філологічному факультеті МДУ, Ленінрадському, Новосибірському університетах, МДПІІЯ - розпочалася підготовка кадрів у галузі автоматичної обробки тексту.

Проте роботи з машинного перекладу цього періоду, званого «класичним», є швидше теоретичним, ніж практичним інтересом. Економічно ефективні системи машинного перекладу стали створюватися лише у вісімдесяті роки минулого століття. Про це я розповім пізніше, у розділі 2.1 «Машинний переклад».

До 1960-х - 70-х років відносяться глибокі теоретичні розробки, що використовують методи теорії множин і математичної логіки, такі, як теорія поля і теорія нечітких множин.

Автором теорії поля у лінгвістиці був радянський поет, перекладач та лінгвіст В.Г. Адмоні. Свою теорію він розробляв на основі німецької мови. У Адмоні поняття «поле» позначає довільну непорожню безліч мовних елементів (наприклад, «лексичне поле», «семантичне поле»).

Структура поля неоднорідна: воно складається з ядра, елементи якого мають повний набір ознак, що визначають безліч, і периферії, елементи якої можуть мати як ознаки даної множини (не всіма), так і сусідніх. Наведу приклад, що ілюструє цей вислів: скажімо, в англійській мові поле складних слів («day-dream» - «мріяти» важковідокремлено від поля словосполучень («tear gas» - «сльозогінний газ»).

З теорією поля тісно пов'язана вже згадана вище теорія нечітких множин. У її обгрунтуванням займалися лінгвісти В.Г. Адмоні, І.П. Іванова, Г.Г. Поченцов, проте її родоначальником був американський математик Л. Заде, який у 1965 році випустив статтю «Fuzzy Logic». Даючи математичне обгрунтування теорії нечітких множин, Заде розглядав їх у лінгвістичному матеріалі.

У цій теорії мова йде вже не стільки про належність елементів до даної множини (АÎа), скільки про ступінь цієї приналежності (mАÎа), оскільки периферійні елементи можуть тією чи іншою мірою належати кільком полям. Заде (Лофті-заде) був вихідцем з Азербайджану, до 12 років мав практику спілкування чотирма мовами - азербайджанською, російською, англійською та перською - і користувався трьома різними алфавітами: кирилицею, латинською, арабською. Коли вченого запитують, що спільного між теорією нечітких множин і лінгвістикою, він не заперечує цього зв'язку, але уточнює: «Я не впевнений, що вивчення цих мов дуже вплинуло на моє мислення. Якщо це й мало місце, то хіба підсвідомо». У юності Заде навчався у Тегерані у пресвітеріанській школі, а після Другої світової війни емігрував до США. «Питання не в тому, чи я американець, російський, азербайджанець чи хтось ще, - сказав він в одній з бесід, - я сформований усіма цими культурами і народами і почуваюся досить комфортабельно серед кожного з них» . У цих словах є щось споріднене з тим, що характеризує теорію нечітких множин - відхід від однозначних визначень і різких категорій.

У нашій країні в 70-ті перекладаються та вивчаються праці західних лінгвістів ХХ століття. І.А. Мельчук переклав російською мовою твори М. Хомського. Н.А. Слюсарьова у своїй книзі «Теорія Ф. де Соссюра у світлі сучасної лінгвістики» пов'язує постулати соссюровського вчення з актуальними проблемами лінгвістики 70-х. Намічається тенденція до подальшої математизації лінгвістики. У провідних вітчизняних вузах йде підготовка кадрів за спеціальністю «Математична (теоретична, прикладна) лінгвістика». У той самий час у країнах відбувається різкий стрибок у розвитку обчислювальної техніки, навіщо потрібні дедалі нові лінгвістичні основи.

У 1980-х роках професор Інституту сходознавства АН Ю.К. Лекомцев, займаючись аналізом мови лінгвістики через аналіз схем, таблиць та інших видів записи, які у лінгвістичних описах, розглядає математичні системи, придатні цих цілей (переважно - системи матричної алгебри).

Таким чином протягом усього ХХ століття йшло зближення точних і гуманітарних наук. Взаємодія математики з лінгвістикою все частіше знаходила практичне застосування. Про це – у наступному розділі.

Розділ 2. Окремі приклади використання математики у лінгвістиці

2.1 Машинний переклад

Ідея перекладу з однієї мови на іншу за допомогою універсального механізму виникла кількома століттями раніше, ніж почалися перші розробки в цій галузі - ще в 1649 Рене Декарт запропонував ідею мови, в якій еквівалентні ідеї різних мов виражалися б одним символом. Перші спроби здійснити цю ідею в 1930-40-ті, початок теоретичних розробок у середині століття, удосконалення систем перекладу за допомогою техніки в 1970-80-ті, бурхливий розвиток перекладацької техніки в останнє десятиліття - такі етапи розвитку машинного перекладу як галузі. Саме з робіт із машинного перекладу виросла комп'ютерна лінгвістика як наука.

З розвитком обчислювальної техніки наприкінці 70-х - початку 80-х дослідники задалися більш реалістичними та економічно вигідними цілями - машина ставала не конкурентом (як передбачалося раніше), а помічником людини-перекладача. Машинний переклад перестає служити виключно військовим завданням (всі радянські та американські винаходи та дослідження, орієнтовані, насамперед, російською та англійською мовами, тією чи іншою мірою сприяли «холодній війні»). У 1978 році слова природної мови були передані в об'єднаній мережі Arpa, шістьма роками пізніше в США з'явилися перші програми перекладу мікрокомп'ютерів.

У 70е Комісія Європейських Общин купує англо-французьку версію комп'ютерного перекладача Systran, замовляючи також франко-аглійську та італо-англійську версії, і систему перекладу з російської на англійську, що використовувалася американськими Збройними Силами. Так було закладено основи проекту EUROTRA.

Про відродження машинного перекладу в 70-80-ті роки. свідчать такі факти: Комісія Європейських громад (CEC) купує англо-французьку версію Systran, а також систему перекладу з російської на англійську (остання розвивалася після доповіді ALPAC і продовжувала використовуватись ВПС США та НАСА); крім того, CEC замовляє розробку франко-англійської та італо-англійської версій. Одночасно відбувається швидке розширення діяльності зі створення систем машинного перекладу Японії; США Панамериканська організація охорони здоров'я (PAHO) замовляє розробку іспано-англійського напряму (система SPANAM); ВПС США фінансують розробку системи машинного перекладу в Лінгвістичному дослідному центрі при Техаському університеті в Остіні; група TAUM у Канаді досягає помітних успіхів у розробці своєї системи METEO (для перекладу метеорологічних зведень). Ціла низка проектів, започаткованих у 70-80-ті роки. згодом розвинулися у повноцінні комерційні системи.

За період 1978-93 в США на дослідження в галузі машинного переказу витрачено 20 мільйонів доларів, у Європі – 70 мільйонів, у Японії – 200 мільйонів.

Однією з нових розробок стала технологія TM (translation memory), що працює за принципом накопичення: у процесі перекладу зберігається вихідний сегмент (пропозиція) та його переклад, у результаті утворюється лінгвістична база даних; якщо ідентичний або подібний вихідний сегмент виявляється у тексті, що знову перекладається, він відображається разом з перекладом і зазначенням збігу у відсотках. Потім перекладач приймає рішення (редагувати, відхилити або прийняти переклад), результат якого зберігається системою, тому не потрібно двічі перекладати одну й ту саму пропозицію. В даний час розробником відомої комерційної системи, заснованої на технології TM є система TRADOS (заснована в 1984 р.).

Нині кілька десятків компаній займаються розробкою комерційних систем машинного перекладу, серед них: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvistica b.v. та ін. З'явилася можливість скористатися послугами автоматичних перекладачів безпосередньо в Мережі: alphaWorks; PROMT"s Online Translator; LogoMedia.net; AltaVista"s Babel Fish Translation Service; InfiniT.com; Translating the Internet.

Комерційно ефективні перекладацькі системи з'явилися в другій половині 80-х і в нашій країні. Розширилося саме поняття машинного перекладу (до нього почали відносити «створення низки автоматичних і автоматизованих систем і пристроїв, виконують автоматично чи напівавтоматично весь цикл перекладу чи окремі завдання у діалозі з людиною» ), збільшилися державні асигнування в розвитку цієї галузі.

Основними мовами вітчизняних перекладацьких систем стали російська, англійська, німецька, французька та японська. У Всесоюзному центрі перекладів (ВЦП) було розроблено систему перекладу з англійської та німецької мов російською машиною ЕОМ ЕС-1035 -АНРАП. Вона складалася з трьох словників - вхідних англійської та німецької та вихідної російської - під єдиним програмним забезпеченням. Існувало кілька змінних спеціалізованих словників - з обчислювальної техніки, програмування, радіоелектроніки, машинобудування, сільського господарства, металургії. Система могла працювати у двох режимах - автоматичному та інтерактивному, коли на екрані відображався пофразно вихідний текст та переклад, який людина могла відредагувати. Швидкість перекладу тексту на Анрап (від початку набору до закінчення друку) становила приблизно 100 сторінок на годину.

У 1989 році було створено сімейство комерційних перекладачів типу СПРИНТ, які працювали з російською, англійською, німецькою та японською мовами. Їхньою головною перевагою стала їхня сумісність з IBM PC - таким чином вітчизняні системи машинного перекладу досягали міжнародного рівня якості. У цей час розробляється система машинного перекладу з французької на російський ФРАП, що включає 4 етапи аналізу тексту: графематичний, морфологічний, синтаксичний і семантичний. У ЛДПІ ім. Герцена йшла робота над чотиримовною (англійською, французькою. Іспанською, російською) системою СІЛОД-МП (у промисловому режимі експлуатувалися англо-російський і франко-російський словники.

Для спеціалізованого перекладу текстів електротехнікою існувала система ЕТАП-2. Аналіз вхідного тексту в ній здійснювався на двох рівнях – морфологічному та синтаксичному. Словник ЕТАП-2 містив близько 4 тисяч статей; етап перетворення тексту - близько 1000 правил (96 загальних, 342 приватні, інші - словникові). Все це забезпечувало задовільну якість перекладу (скажімо, заголовок патенту "Optical phase grid arrangement and coupling device having such an arrangement" перекладався як "Пристрій оптичної фазової сітки і пристрій, що з'єднує з таким пристроєм" - незважаючи на тавтологію, сенс збережений).

У Мінському педагогічному інституті іноземних мов на базі англо-російського словника словоформ і оборотів була винайдена система машинного перекладу заголовків), в Інституті сходознавства АН - система перекладу з японської на російську. Створена в Московському НДІ систем автоматизації перша автоматична словниково-термінологічна служба (СЛОТЕРМ) з обчислювальної техніки та програмування містила приблизно 20000 термінів у тлумачному словнику та спеціальних словниках для лінгвістичних досліджень.

Системи машинного перекладу поступово почали використовуватися як за прямим призначенням, а й як важливий компонент автоматичних навчальних систем (на навчання перекладу, контролю орфографічних і граматичних знань).

90-ті роки принесли з собою бурхливий розвиток ринку ПК (від настільних до кишенькових) та інформаційних технологій, широке використання мережі Інтернет (яка стає все більш міжнародною та багатомовною). Все це зробило затребуваним розвиток автоматизованих перекладацьких систем. З початку 1990-х років. ринку систем ПК виходять і вітчизняні розробники.

У липні 1990 року на виставці PC Forum у Москві була представлена ​​перша в Росії комерційна система машинного перекладу під назвою PROMT (PROgrammer"s Machine Translation). У 1991 р. було створено ЗАТ "Проект МТ", і вже в 1992 р. компанія ПРОМТ" виграла конкурс NASA на постачання систем МП (ПРОМТ була єдиною неамериканською фірмою на цьому конкурсі). У 1992 р. "ПРОМТ" випускає цілу родину систем під новою назвою STYLUS для перекладу з англійської, німецької, французької, італійської та іспанської мов на російську і з російської на англійську, а в 1993 р. на базі STYLUS створюється перша в світі система машинного перекладу для Windows. третє покоління систем машинного перекладу, повністю 32-розрядних STYLUS 3.0 для Windows 95/NT, одночасно успішно завершена розробка абсолютно нових, перших у світі російсько-німецької і російсько-французької систем машинного перекладу.

У 1997 р. підписано угоду з французькою фірмою Softissimo про створення систем перекладу з французької мови на німецьку та англійську та назад, а в грудні цього року була випущена перша у світі система німецько-французького перекладу. У цьому ж році компанія "ПРОМТ" компанія випустила систему, реалізовану за технологією Гігант, що підтримує кілька мовних напрямів в одній оболонці, а також спеціальний перекладач для роботи в Інтернеті WebTranSite.

У 1998 р. випускається ціле сузір'я програм під новою назвою PROMT 98. Через рік компанія ПРОМТ випустила два нових продукти: унікальний пакет програм для роботи в Інтернеті – PROMT Internet, та перекладач для корпоративних поштових систем – PROMT Mail Translator. У листопаді 1999 року PROMT була визнана найкращою системою машинного перекладу серед тестованих французьким журналом PC Expert, обійшовши конкурентів за сумою показників на 30 відсотків. Для корпоративних клієнтів розроблено також спеціальні серверні рішення - корпоративний сервер перекладів PROMT Translation Server (PTS) та Інтернет-рішення PROMT Internet Translation Server (PITS). У 2000 р. "ПРОМТ" оновила всю лінію своїх програмних продуктів, випустивши МП системи нового покоління: PROMT Translation Office 2000, PROMT Internet 2000 та Magic Gooddy 2000.

Переклад у режимі он-лайн за підтримки системи "ПРОМТ" використовується на ряді вітчизняних та зарубіжних сайтів: PROMT's Online Translator, InfiniT.com, Translate.Ru, Lycos та ін., а також в установах різного профілю для перекладу ділової документації, статей та листів (існують системи перекладу, що вбудовуються безпосередньо в Outlook Express та інші поштові клієнти).

В наш час з'являються нові технології машинного перекладу, що базуються на використанні систем штучного інтелекту, статистичних методах. Про останні – у наступному розділі.

2.2 Статистичні методи вивчення мови

Велика увага в сучасній лінгвістиці приділяється вивченню мовних явищ методами кількісної математики. Кількісні дані часто допомагають більш глибоко осмислити явища, що вивчаються, їх місце і роль у системі суміжних явищ. Відповідь на запитання «скільки» допомагає відповісти і на запитання «що», «як», «чому» – такий евристичний потенціал кількісної характеристики.

Чималу роль статистичні методи грають у створенні систем машинного перекладу (див. Розділ 2.1). При статистичному підході проблема перекладу у термінах каналу з перешкодами. Уявімо, що нам потрібно перекласти пропозицію з англійської на російську. Принцип каналу з перешкодами пропонує нам таке пояснення відносин між англійською та російською фразою: англійська пропозиція є не що інше, як російська пропозиція, спотворена якимось шумом. Для того щоб відновити вихідну російську пропозицію, нам потрібно знати, що саме люди зазвичай говорять російською мовою і як російські фрази спотворюються до стану англійської. Переклад здійснюється шляхом пошуку такої російської пропозиції, яка максимізує твори безумовної ймовірності російської пропозиції та ймовірності англійської пропозиції (оригіналу) за умови даної російської пропозиції. Згідно з теоремою Байєса, ця російська пропозиція є найбільш вірогідним перекладом англійської:

де e – пропозиція перекладу, а f – пропозиція оригіналу

Таким чином, нам потрібна модель джерела та модель каналу, або модель мови та модель перекладу. Модель мови повинна надавати оцінку ймовірності будь-якій пропозиції кінцевої мови (у нашому випадку, російської), а модель перекладу -пропозиції оригіналу. (див. табл.1)

У випадку система машинного перекладу працює у двох режимах:

1. Навчання системи: береться тренувальний корпус паралельних текстів, і за допомогою лінійного програмування шукаються такі значення таблиць перекладних відповідностей, які максимізують ймовірність (наприклад) російської частини корпусу за наявною англійською згідно з обраною моделлю перекладу. На російській частині того ж самого корпусу будується модель російської мови.

2. Експлуатація: на основі отриманих даних для незнайомої англійської пропозиції шукається російський, максимізуючий твір ймовірностей, що присвоюються моделлю мови та моделлю перекладу. Програма, яка використовується для такого пошуку, називається дешифратором.

Найпростішою статистичною моделлю перекладу є модель дослівного перекладу. У цій моделі передбачається, що з перекладу речення з однієї мови іншою досить перекласти всі слова (створити «мішок слів»), а розстановку в правильному порядку забезпечить модель Для приведення P(a, f | e) до P(a | e , f), тобто. ймовірності даного вирівнювання при даній парі речень, кожна ймовірність P(a, f | e) нормалізується за сумою ймовірностей всіх вирівнювань даної пари речень:

Реалізація алгоритму Вітербі, що використовується для навчання Моделі №1, полягає в наступному:

1.Вся таблиця ймовірностей переказних відповідностей заповнюється однаковими значеннями.

2. Для всіх можливих варіантів попарних зв'язків слів обчислюється ймовірність P(a, f|e):

3. Значення P(a, f|e) нормалізуються для отримання значень P(a|e, f).

4. Підраховується частота кожної перекладної пари, зважена на ймовірність кожного варіанта вирівнювання.

5. Отримані зважені частоти нормалізуються та формують нову таблицю ймовірностей перекладних відповідностей

6. Алгоритм повторюється з кроку 2.

Розглянемо як приклад тренування подібної моделі на корпусі з двох пар речень (рис.2):

Білий Дім/White House

  • Дім/House

Після великої кількості ітерацій отримаємо таблицю (табл.2.), з якої видно, що переклад здійснюється з високою точністю.

Також статистичні методи широко використовуються у вивченні лексики, морфології, синтаксису, стилістики. Вчені Пермського державного університету провели дослідження, в основі якого лежало твердження, що стереотипні словосполучення є важливим «будівельним матеріалом» тексту. Ці словосполучення складаються з «ядерних» слів, що повторюються, і залежних слів-конкретизавторів і мають яскраво виражене стилістичне забарвлення.

У науковому стилі «ядерними» словами можна назвати: дослідження, вивчення, завдання, проблема, питання, явище, факт, спостереження, аналізта ін. У публіцистиці «ядерними» будуть вже інші слова, які мають підвищену цінність саме для тексту газети: час, особа, влада, справа, дія, закон, життя, історія, місцеі т.д. (Всього 29)

Особливий інтерес для лінгвістів представляє також професійна диференціація загальнонародної мови, своєрідність використання лексики та граматики залежно від роду занять. Відомо, що шофери у професійному мовленні вживаю форму ш про фер, медики говорять до про клюш замість кокл ю ш – подібних прикладів можна навести. Завдання статистики - простежити за варіативністю вимови та зміною мовної норми.

Професійні відмінності ведуть у себе відмінності як граматичні, а й лексичні. У Якутському державному університеті ім. М.К. Аммосова було проаналізовано по 50 анкет з реакціями, що найчастіше зустрічаються, на деякі слова серед медиків і будівельників (табл.3).

Будівельники

людина

пацієнт (10), особистість (5)

чоловік (5)

добро

допомога (8), допомагати (7)

зло (16)

життя

смерть (10)

чудова (5)

смерть

труп (8)

життя (6)

вогонь

жар (8), опік (6)

пожежа (7)

палець

рука (14), панарицій (5)

великий (7), вказівний (6)

очі

зір (6), зіниця, окуліст (по 5)

карі (10), великі (6)

голова

розум (14), мізки (5)

велика (9), розумна (8), розум (6)

втрачати

свідомість, життя (по 4)

гроші (5), знаходити (4)

Можна зауважити, що медики частіше, ніж будівельники, дають асоціації, пов'язані з їхньою професійною діяльністю, тому що наведені в анкеті слова-стимули мають до їхньої професії більше відношення, ніж до професії будівельника.

Статистичні закономірності в мові використовуються для створення частотних словників - словників, в яких наводяться числові характеристики уживаності слів (словоформ, словосполучень) будь-якої мови - мови письменника, будь-якого твору тощо. Зазвичай як характеристика уживаності використовується частота народження слова у тексті певного обсягу

Модель сприйняття мови неможлива без словника як свого найістотнішого компонента. При сприйнятті промови основний оперативної одиницею виступає слово. З цього випливає, зокрема, що кожне слово тексту, що сприймається, має бути ототожнено з відповідною одиницею внутрішнього словника слухача (або читаючого). Природно вважати, що з самого початку пошук обмежений деякими підобластями словника. Відповідно до більшості сучасних теорій сприйняття промови, власне фонетичний аналіз тексту, що звучить, в типовому випадку дає лише деяку часткову інформацію про можливе фонологічному вигляді слова, і такого роду інформації відповідає не одне, а певне БАГАТО слів словника; отже, виникає два завдання:

(а) виділити відповідну множину за тими чи іншими параметрами;

(б) у межах окресленої множини (якщо вона виділена адекватно) зробити «відсів» всіх слів, крім того єдиного, яке і найкраще відповідає даному слову тексту, що розпізнається. Одна із стратегій «відсіву» – виняток низькочастотних слів. Звідси випливає, що словник сприйняття мови - це частотний словник. Саме створення комп'ютерної версії частотного словника російської мови і є початковим завданням проекту.

На матеріалі російської існує 5 частотних словників (крім галузевих). Відзначимо лише деякі загальні недоліки словників.

Усі відомі частотні словники російської побудовані на обробці масивів письмових (друкованих) текстів. Частково з цієї причини, коли тотожність слова багато в чому спирається на формальний, графічний збіг, недостатньо враховується семантика. В результаті виявляються зміщеними, спотвореними та частотні характеристики; наприклад, якщо слова з поєднання один одного укладач частотного словника включає в загальну статистику вживання слова друг, то навряд чи це виправдано: враховуючи семантику, ми повинні визнати, що це вже інші слова, а точніше, що самостійною словниковою одиницею виступає лише саме собою поєднання загалом.

Також у всіх існуючих словниках слова вміщені лише у своїх основних формах: іменники у формі однини, називного відмінка, дієслова у формі інфінітиву і т.д. Деякі словники дають інформацію про частотність словоформ, але зазвичай роблять це недостатньо послідовно, не вичерпним чином. Частотності різних словоформ одного й того самого слова свідомо не збігаються. Розробник моделі сприйняття мови повинен враховувати, що в реальному перцептивному процесі розпізнаванню підлягає саме конкретна словоформа, «занурена» в текст: на базі аналізу початкової ділянки експонента словоформи формується безліч слів з ідентичним початком, причому початкова ділянка словоформи не обов'язково тотожна початковому у . Саме словоформі належить конкретна ритмічна структура – ​​також надзвичайно важливий параметр для перцептивного відбору слів. Нарешті, у підсумковому поданні розпізнаного висловлювання знову ж таки слова представлені відповідними словоформами.

Існує безліч робіт, у яких демонструється важливість частотності у процесі сприйняття мови. Але нам не відомі роботи, де використовувалася б частотність словоформ – навпаки, всі автори практично ігнорують частотність окремих словоформ, звертаючись виключно до лексем. Якщо отримані ними результати вважати артефактами, доводиться припустити, що носію мови якимось чином доступна інформація про співвідношення частотностей словоформ і словникової форми, тобто, фактично, лексеми. Причому такого роду перехід від словоформи до лексеми, звісно, ​​неможливо пояснити природним знанням відповідної парадигми, оскільки інформація про частотність має використовуватися до остаточної ідентифікації слова, інакше вона втрачає сенс.

За первинними статистичними характеристиками можна визначити із заданою відносною похибкою ту частину словника, куди входять слова з високою частотою появи незалежно від типу тексту. Можливо також, ввівши ступінчасте впорядкування в словник, отримати серію словарів, що охоплюють перші 100, 1000, 5000 і т. д. часті слова. Статистичні характеристики словника викликають інтерес у зв'язку зі смисловим аналізом лексики. Вивчення предметно-ідеологічних груп та семантичних полів показує, що лексичні об'єднання підтримуються семантичними зв'язками, які концентруються навколо лексем з найбільш загальним значенням. Опис значень у межах лексико-семантичного поля може проводитись за допомогою ідентифікації слів із найбільш абстрактними за змістом лексемами. Очевидно, «порожні» (з погляду номінативних потенцій) одиниці словника становлять статистично однорідний пласт.

Не меншу цінність мають і словники з окремих жанрів. Вивчення міри їхньої подібності та характеру статистичних розподілів дасть цікаві відомості про якісне розшарування лексики в залежності від сфери мовлення.

Упорядкування великих частотних словників вимагає звернення до обчислювальної техніки. Введення часткової механізації та автоматизації в процес роботи над словником представляє інтерес як експеримент машинної обробки словарів до різних текстів. Такий словник потребує суворішої системи обробки та накопичення словникового матеріалу. У мініатюрі це інформаційно-пошукова система, яка здатна видавати відомості про різні сторони тексту та словника. Деякі основні запити до цієї системи плануються від самого початку: загальна кількість інвентаризованих слів, статистичні характеристики окремого слова та цілих словників, упорядкування частих та рідкісних зон словника тощо. Машинна картотека дозволяє автоматично будувати зворотні словники за окремими жанрами та джерелами. Багато інших корисних статистичних відомостей про мову буде вилучено з накопиченого масиву інформації. Комп'ютерний частотний словник створює експериментальну основу переходу до ширшої автоматизації словникових робіт.

Статистичні дані частотних словників можуть бути широко використані і при вирішенні інших лінгвістичних завдань - наприклад, при аналізі та визначенні активних засобів словотвору сучасної російської мови, вирішенні питань удосконалення графіки та орфографії, які пов'язані з урахуванням статистичних відомостей про словниковий склад (при цьому важливо враховувати імовірнісні характеристики комбінацій графем, реалізовані у словах типи буквосполучень), практичної транскрипції та транслітерації. Статистичні параметри словника будуть корисні і під час вирішення питань автоматизації друкованої справи, розпізнавання та автоматичного читання буквеного тексту.

Сучасні тлумачні словники і граматики російської переважно побудовані з урахуванням літературно-художніх текстів. Існують частотні словники мови А.С. Пушкіна, А.С. Грибоєдова, Ф.М. Достоєвського, В.В. Висоцького та багатьох інших авторів. На кафедрі історії та теорії літератури Смоленського держ. Педагогічного університету кілька років ведеться робота зі складання частотних словників віршованих і прозових текстів. Для цього дослідження відібрано частотні словники всієї лірики Пушкіна і ще двох поетів золотого століття - «Горя з розуму» Грибоєдова і всієї поезії Лермонтова; Пастернака та ще п'ятьох поетів срібного віку - Бальмонта 1894-1903 рр., «Вірш про Прекрасну Даму» Блоку, «Камінь» Мандельштама, «Вогняного стовпа» Гумільова, «Anno Domini MCMXXI» Ахматової та «Сестри мого життя» Пастернах поетів століття залізного – «Віршів Юрія Живаго», «Коли розгуляється», всього корпусу лірики М. Петрових, «Дорога далека», «Вітрового скла», «Прощання зі снігом» та «Підкови» Межирова, «Антимирів» Вознесенського та «Сніжниці » Риленкова.

Слід зазначити, що ці словники за своєю природою різні: одні представляють лексику одного драматичного твору, інші - книги лірики, або кількох книг, або всього корпусу віршів поета. Результати аналізу, представлені у цій роботі, слід сприймати з обережністю, їх не можна абсолютизувати. Однак за допомогою спеціальних заходів різницю онтологічної природи текстів можна певною мірою зменшити.

В останні роки все більш чітко усвідомлюється протиставлення розмовної та книжкової мови. Особливо гостро обговорюється питання серед методистів, які вимагають повороту навчання у бік розмовної мови. Проте специфіка розмовної мови досі залишається незрозумілою.

Обробка словників виконувалася шляхом створення користувальницького застосування в середовищі офісної програми EXCEL97. Додаток включає чотири робочі листи книги EXCEL - "Титульний лист", лист "Словники" з вихідними даними, "Близькості" та "Відстані" з результатами, а також набір макросів.

Початкова інформація вводиться на лист «Словники». У осередку EXCEL, записуються словники досліджуваних текстів, останній стовпець S формується з отриманих результатів і дорівнює кількості слів, які у інших словниках. Таблиці «Близькості» та «Відстані» містять розраховані заходи близькості M, кореляції R та відстані D.

Макроси програми є подієвими програмними процедурами на мові Visual Basic for Application (VBA). Основу процедур складають бібліотечні об'єкти VBA та методи їх обробки. Так, для операцій з робочими листами програми використовується ключовий об'єкт Worksheet (робочий лист) та відповідний метод активізації листа Activate (активізувати). Завдання діапазону аналізованих вихідних даних на аркуші «Словники» виконується методом Select (вибрати) об'єкта Range (діапазон), а передача слів як значення змінним виконується як властивість Value (значення) цього об'єкта Range.

Незважаючи на те, що ранговий кореляційний аналіз змушує з обережністю говорити про залежність тематики між різними текстами, більшість найчастіших слів кожного тексту має відповідності в одному або кількох інших текстах. У колонці S показано кількість таких слів серед 15 найчастіших у кожного автора. Напівжирним шрифтом виділено слова, які у нашій таблиці лише в одного поета. Немає виділених слів зовсім у Блоку, Ахматової і Петрових, вони S = ​​15. У цих трьох поетів все 15 найчастіших слів одні й самі, розрізняються вони лише місцем у списку. Але навіть у Пушкіна, лексика якого найоригінальніша, S = 8, а виділених слів 7.

Результати показують, що є певний шар лексики, який концентрує основні теми поезії. Як правило, ці слова короткі: із загальної кількості (225) слововжитків односкладових 88, двоскладових 127, трискладових 10. Найчастіше ці слова представляють основні міфологеми і можуть розпадатися на пари: ніч – день, земля – небо (сонце), Бог – людина (люди), життя – смерть, тіло – душа, Рим – світ(У Мандельштама); можуть об'єднуватися в міфологеми вищого рівня: небо, зірка, сонце, земля; в людині зазвичай виділяються тіло, серце, кров, рука, нога, щока, очі. З людських станів перевага надається сну та любові. До світу людини належать будинок та міста – Москва, Рим, Париж. Творчість представлена ​​лексемами словоі пісня.

Грибоєдов і Лермонтов серед найбільш частотних слів майже не мають слів, що позначають природу. У них утричі більше слів, які означають людину, частини її тіла, елементи її духовного світу. У Пушкіна та поетів ХХ ст. позначень людини та природи приблизно порівну. У цьому важливому аспекті тематики, можемо сказати, ХХ ст. пішов за Пушкіним.

Мінімальна тема справасеред найчастіших слів зустрічається лише у Грибоєдова та Пушкіна. У Лермонтова та поетів ХХ ст. вона поступається місцем мінімальній темі слово. Слово не виключає справи (біблійне трактування теми: у Новому Завіті все вчення Ісуса Христа розглядається як слово Боже або слово Ісуса, а апостоли іноді називають себе служителями Слова). Сакральний зміст лексеми слово переконливо проявляється, наприклад, у вірші Пастернака «І образ світу, у Слові явлений». Сакральний зміст лексеми словоу спів- та протиставленні з людськими справами переконливо проявляється в однойменному вірші Гумільова.

Лексеми, що зустрічаються лише у одному тексті, характеризують своєрідність цієї книжки чи сукупності книжок. Наприклад, слово "розум" - найчастіше в комедії Грибоєдова "Лихо з розуму" - але воно не зустрічається серед частотних слів інших текстів. Тема розуму, безумовно, є найбільш значущою в комедії. Ця лексема супроводжує образ Чацького, причому ім'я Чацького є найчастішим у комедії. Таким чином, у творі органічно поєднуються найчастіше ім'я загальне з найчастішим власним ім'ям.

Найвищий коефіцієнт кореляції пов'язує тематику трагічних книг Гумільова "Вогненний стовп" та Ахматової "Anno Domini MCMXXI". Серед 15 найчастіших іменників тут 10 загальних, у тому числі кров, серце, душа, любов, слово, небо. Нагадаємо, що до книги Ахматової увійшла мініатюра «Не бувати тобі в живих...», написана між арештом Гумільова та його розстрілом.

Теми свічки та натовпу у дослідженому матеріалі зустрічаються лише у «Вірші Юрія Живаго». Тема свічки у віршах із роману має безліч контекстуальних значень: вона пов'язана з образом Ісуса Христа, з темами віри, безсмертя, творчості, любовного побачення. Свічка – найважливіше джерело світла у центральних сценах роману. Тема натовпу розвивається у зв'язку з основною ідеєю роману, в якому приватне життя людини з її непорушними цінностями протиставлено аморальності нової держави, побудованої на засадах догодження натовпу.

Робота передбачає і третій етап, теж відображений у програмі, - це обчислення різниці порядкових номерів слів, загальних для двох словників та середнього показника відстані між однаковими словами двох словників. Цей етап дозволяє від загальних тенденцій взаємодії словників, виявлених за допомогою статистики, перейти на рівень, що наближається до тексту. Наприклад, статистично значуще корелюють книги Гумільова та Ахматової. Ми дивимося, які слова виявилися спільними для їхніх словників, і вибираємо насамперед ті, різниця між порядковими номерами яких є мінімальною або дорівнює нулю. Саме ці слова мають той самий ранговий номер і, отже, саме ці мінімальні теми у свідомості двох поетів однаково важливі. Далі слід переходити до рівня текстів і контекстів.

Кількісні методи допомагають вивчити особливості народів - носіїв мови. Скажімо, в російській мові 6 відмінків, в англійській відмінків немає, а в окремих мовах народів Дагестану кількість відмінків доходить до 40. Л.Перловський у своїй статті «Свідомість, мова та культура» співвідносить ці характеристики зі схильністю народів до індивідуалізму чи колективізму, з сприйняттям речей та явищ окремо або у зв'язку з іншими. Адже саме в англомовному світі (відмінків немає – річ сприймається «сама по собі») з'явилися такі поняття, як свобода особистості, лібералізм і демократія (зауважу, що я вживаю ці поняття лише у зв'язку з мовою, без оцінки). Незважаючи на те, що подібні припущення поки що залишаються лише на рівні сміливих наукових гіпотез, вони допомагають подивитися по-новому на вже знайомі явища.

Як бачимо, кількісні характеристики можуть застосовуватися у різних областях мовознавства, що дедалі більше стирає кордону між «точними» і «гуманітарними» методами. Лінгвістика все частіше вдається до допомоги не лише математики, а й обчислювальної техніки для вирішення своїх завдань.

2.3 Вивчення мови методами формальної логіки

З некількісними методами математики, зокрема, з логікою, сучасна теоретична лінгвістика взаємодіє щонайменше плідно, ніж із кількісними. Швидкий розвиток комп'ютерних технологій та зростання їхньої ролі в сучасному світі зажадало перегляду підходу до взаємодії мови та логіки в цілому.

Методи логіки широко використовуються в розробці формалізованих мов, зокрема, мов програмування, елементами яких є деякі символи (подібно до математичних), вибираються (або конструйовані з обраних раніше символів) і інтерпретовані певним чином, пов'язаним з жодним «традиційним» вживанням, розумінням і функціями таких самих символів в інших контекстах. Програміст має справу з логікою у своїй роботі. Сенс програмування у тому, щоб навчити комп'ютер міркувати (у сенсі слова). При цьому методи "міркування" виявляються різними. Кожен програміст витрачає певний час на пошук помилок у своїх та чужих програмах. Тобто, на пошук помилок у міркуваннях, у логіці. І це також накладає свій відбиток. Набагато легше виявляєш логічні помилки і у звичайній мові. Відносна простота мов, що вивчаються логіками, дозволяє їм з'ясовувати структури цих мов більш чітко, ніж це можна досягти для лінгвістів, які аналізують виключно складні природні мови. Зважаючи на те, що мови, що вивчаються логіками, використовують відносини, скопійовані з природних мов, логіки здатні зробити істотний внесок у загальну теорію мови. Ситуація тут подібна до тієї, яка має місце у фізиці: фізик також формулює теореми для ідеально спрощених випадків, які не відбуваються в природі взагалі - він формулює закони для ідеальних газів, ідеальних рідин, говорить про рух за відсутності тертя і т.д. Для цих ідеалізованих випадків можна встановити прості закони, які б значно сприяли розумінню того, що відбувається насправді і що, ймовірно, залишилося б невідомим фізиці, якби вона пробувала розглядати дійсність безпосередньо, у всій складності.

У вивченні природних мов логічні методи використовуються для того, щоб ті, хто вивчає мову, могли не тупо «зазубрити» якомога більше слів, а краще зрозуміти її структуру. Ще Л. Щерба використав на своїх лекціях приклад пропозиції, побудованої за законами російської мови: «Глока куздра штеко бушнула бокра і курдячить бокренка», - а потім питав у студентів, що це означає. Незважаючи на те, що сенс слів у реченні залишався незрозумілим (їх просто не існує в російській мові), можна було чітко відповісти: «куздра» - підмет, іменник жіночого роду, в однині, називному відмінку, «бокр» - одухотворене, і і т.д. Переклад фрази виходить приблизно такою: «Дещо жіночого роду в один прийом зробило щось над якоюсь істотою чоловічого роду, а потім почало щось таке витворяти тривале, поступове з його дитинчатою». Подібним прикладом тексту (художнього) з неіснуючих слів, побудованого повністю за законами мови, є «Бармаглот» Льюїса Керролла (в «Алісі в країні чудес» Керролл вустами свого персонажа Шалтая-Болтая пояснює і значення придуманих ним слів: «варкалося» - вісім годин вечора, коли вже час варити вечерю, «хливий» - хлипкий і спритний, «шорек» - помісь тхора, борсука і штопора, «піратися» - стрибати, пірнати, крутитися, «нава» - трава під сонячним годинником (простірається трохи праворуч , трохи ліворуч і трохи назад), «хрюкати» - хрюкати і реготати, «зелюк» - зелений індик, «мюмзік» - птах; .

Одне з основних понять сучасної логіки та теоретичної лінгвістики, що використовується при дослідженні мов різних логіко-математичних обчислень, природних мов, для опису відносин між мовами різних «рівнів» і для характеристики відносин між мовами, що розглядаються, і описуються з їх допомогою предметними областями - поняття метамови. Метамова - це мова, що використовується для вираження суджень про іншу мову, мову-об'єкт. За допомогою метамови вивчають структуру знакосполучення (виразів) мови-об'єкта, доводять теореми про її виразні властивості, про відношення її до інших мов і т.п. Як предметна мова, так і метамову можуть бути звичайними (природними) мовами. Метамова може відрізнятися від мови-об'єкта (наприклад, у підручнику англійської мови для російських російська мова є метамовою, а англійська - мовою-об'єктом), але може і збігатися з нею або відрізнятися лише частково, наприклад, спеціальною термінологією (російська лінгвістична термінологія - елемент метамови для опису російської мови, так семантичні множники - частина метамови описи семантики природних мов).

Поняття «метазик» стало дуже плідним у зв'язку з вивченням формалізованих мов, що будуються в рамках математичної логіки. На відміну від формалізованих предметних мов, у цьому випадку метамова, засобами якої формулюється метатеорія (що вивчає властивості предметної теорії, що формулюється предметною мовою), є, як правило, звичайною природною мовою, деяким спеціальним чином обмеженим фрагментом природної мови, що не містить різного роду двозначностей , метафор, «метафізичних» понять тощо елементів звичайної мови, що перешкоджають використанню його як знаряддя точного наукового дослідження. При цьому метамова сама може бути формалізована і (незалежно від цього) виявитися предметом дослідження, що проводиться засобами метаметоязика, причому такий ряд можна «мислити» нескінченно.

Логіка вчить нас плідному розмежуванню мови-об'єкта та метамови. Мова-об'єкт - це сам предмет логічного дослідження, а метамова - та неминуче штучна мова, якою таке дослідження ведеться. Логічне мислення якраз і полягає в тому, щоб сформулювати мовою символів (метази) відносини і структуру реальної мови (мови-об'єкта).

Метамова повинна бути принаймні «не бідніша» за свою предметну мову (тобто для кожного вираження останньої в метамові має бути його ім'я-«переклад») - інакше, при невиконанні цих вимог (що свідомо має місце в природних мовах, якщо спеціальними угодами не передбачено протилежне) виникають семантичні парадокси (антиномії).

У міру створення нових і нових мов програмування у зв'язку з проблемою програмування трансляторів з'явилася гостра необхідність у створенні метамов. В даний час найбільш уживаним для опису синтаксису мов програмування є метамова форм Бекуса-Наура (скорочено БНФ). Він є компактною формою у вигляді деяких формул, схожих на математичні. До кожного поняття мови існує єдина метаформула (нормальна формула). Вона складається з лівої та правої частин. У лівій частині вказується поняття, що визначається, а в правій - задається безліч допустимих конструкцій мови, які об'єднуються в це поняття. У формулі використовують спеціальні метасимволи у вигляді кутових дужок, в яких укладено поняття (у лівій частині формули) або раніше певне поняття (в її правій частині), а поділ лівої і правої частин вказується метасимволом "::=", зміст якого еквівалентний словам "за визначенням є". Металінгвістичні формули у певному вигляді закладені в транслятори; з їх допомогою ведеться перевірка конструкцій, що використовуються програмістом, на формальну відповідність будь-якій з конструкцій, синтаксично допустимих у цій мові. Існують і окремі метамови різних наук – таким чином, знання існують у вигляді різних метамов.

Логічні методи також послужили основою створення систем штучного інтелекту, заснованих на концепції коннекціонізму. Коннекціонізм - це особлива течія у філософській науці, предметом якого є питання пізнання. В рамках цієї течії робляться спроби пояснити інтелектуальні здібності людини, використовуючи штучні нейронні мережі. Складені з великої кількості структурних одиниць, аналогічних нейронам, із заданим для кожного елемента вагою, що визначає силу зв'язку з іншими елементами, нейронні мережі є спрощеними моделями людського мозку. Експерименти з нейронними мережами подібного роду продемонстрували їхню здатність до навчання виконання таких завдань, як розпізнавання образів, читання та визначення простих граматичних структур.

Філософи почали виявляти інтерес до коннекціонізму, оскільки коннекціоністський підхід обіцяв забезпечити альтернативу класичній теорії розуму та широко поширеній у рамках цієї теорії ідеї, згідно з якою механізми роботи розуму мають схожість із обробкою символічної мови цифровим комп'ютером. Ця концепція дуже спірна, проте останніми роками вона знаходить дедалі більше прибічників.

Логічне вивчення мови продовжує сосюрівську концепцію про мову як систему. Те, що воно постійно продовжується, ще раз підтверджує сміливість наукових припущень початку минулого століття. Останній розділ своєї роботи я присвячую перспективам розвитку математичних методів у лінгвістиці у наші дні.

2.4 Перспективи застосування математичних методів у лінгвістиці

В епоху комп'ютерних технологій методи математичної лінгвістики набули нової перспективи розвитку. Пошук вирішення проблем лінгвістичного аналізу дедалі активніше реалізується тепер лише на рівні інформаційних систем. Водночас автоматизація процесу обробки мовного матеріалу, надаючи досліднику значні можливості та переваги, неминуче висуває перед ним нові вимоги та завдання.

Поєднання «точного» та «гуманітарного» знання стало родючим ґрунтом для нових відкриттів у галузі лінгвістики, інформатики та філософії.

Машинний переклад з однієї мови на іншу залишається галуззю інформаційних технологій, що швидко розвивається. Незважаючи на те, що переклад за допомогою комп'ютера ніколи не зрівняється з перекладом, зробленим людиною (особливо це стосується художніх текстів), машина стала невід'ємним помічником людини в перекладі великих обсягів тексту. Вважається, що в найближчому майбутньому буде створено досконаліші перекладацькі системи, засновані насамперед на семантичному аналізі тексту.

Не менш перспективним напрямком залишається взаємодія лінгвістики та логіки, яка є філософським фундаментом для осмислення інформаційних технологій і так званої «віртуальної реальності». У найближчому майбутньому продовжиться робота над створенням систем штучного інтелекту - хоча, знову ж таки, він ніколи не дорівнюватиме людському за його можливостями. Подібна конкуренція безглузда: у наш час машина має стати (і стає) не суперником, а помічником людини, не чимось із галузі фантастики, а частиною реального світу.

Продовжується вивчення мови методами статистики, що дозволяє точніше визначити її якісні властивості. Важливо, щоб найбільш сміливі гіпотези про мову знаходили свій математичний, а отже, і логічний доказ.

Найбільш значимо те, що різні галузі застосування математики в лінгвістиці, до цього досить розрізнені, останніми роками співвідносяться між собою, з'єднуючись у струнку систему, за аналогією з системою мови, відкритою сторіччя тому Фердинандом де Соссюром та Іваном Бодуеном де Куртене. У цьому – наступність наукового знання.

Лінгвістика у світі стала фундаментом у розвиток інформаційних технологій. Поки інформатика залишається галуззю людської діяльності, що бурхливо розвивається, союз математики і лінгвістики продовжить відігравати свою роль у розвитку науки.

Висновок

За ХХ століття комп'ютерні технології пройшли великий шлях - від військового застосування до мирного, від вузького кола цілей до проникнення у всі галузі людського життя. Математика як наука знаходила все нове практичне значення із розвитком обчислювальної техніки. Цей процес продовжується і сьогодні.

Немислимий раніше «тандем» «фізиків» та «ліриків» став реальністю. Для повноцінної взаємодії математики та інформатики з гуманітарними науками були потрібні кваліфіковані фахівці як з того, так і з іншого боку. У той час як фахівцям-комп'ютерникам все більш потрібні систематичні гуманітарні знання (лінгвістичні, культурологічні, філософські), щоб осмислювати зміни в реальності, що оточує їх, у взаємодії людини і техніки, розробляти все нові і нові мовні та розумові концепції, писати програми, то будь-який «гуманітарій» у наш час для свого професійного зростання має опанувати хоча б аз роботи з комп'ютером.

Математика, будучи тісно взаємопов'язаною з інформатикою, продовжує розвиватися і взаємодіяти з природничим та гуманітарним знанням. У новому столітті не слабшає, а навпаки, посилюється тенденція до математизації науки. На кількісних даних осмислюються закономірності розвитку мови, її історичні та філософські характеристики.

Математичний формалізм найбільше підходить для опису закономірностей у лінгвістиці (як, втім, і в інших науках – і гуманітарних, і природних). Ситуація часом складається у науці отже без застосування відповідного математичного мови зрозуміти характер фізичного, хімічного тощо. процесу неможливо. Створюючи планетарну модель атома, відомий англійський фізик XX ст. Еге. Резерфорд відчув математичні проблеми. Спочатку його теорію не прийняли: вона не звучала доказово, і виною тому стало незнання Резерфордом теорії ймовірності, на основі механізму якої тільки й можливо було зрозуміти модельне уявлення атомних взаємодій. Усвідомивши це, видатний вже на той час вчений, володар Нобелівської премії, записався до семінару математика професора Лемба і протягом двох років разом зі студентами прослухав курс і відпрацював практикум з теорії ймовірності. На її основі Резерфорд зміг описати поведінку електрона, надавши своїй структурній моделі переконливу точність та здобувши визнання. Те саме - і з мовознавством.

Напрошується питання, що ж міститься в об'єктивних явищах таке математичне, завдяки чому вони піддаються опису мовою математики, мовою кількісних характеристик? Це однорідні одиниці речовини, що розподіляються у просторі та часі. Ті науки, які далі за інших пройшли шлях до виділення однорідності, і виявляються краще пристосованими для використання в них математики.

Мережа Інтернет, що стрімко розвинулася в 90-і роки, об'єднала під собою представників різних країн, народів і культур. Незважаючи на те, що основною мовою міжнародного спілкування продовжує служити англійська, Інтернет у наш час став багатомовним. Це зумовило розвиток комерційно успішних систем машинного перекладу, які широко використовуються в різних галузях людської діяльності.

Комп'ютерні мережі стали об'єктом філософського осмислення - створювалися нові лінгвістичні, логічні, світоглядні концепції, що допомагають зрозуміти «віртуальну реальність». Багато художніх творах створювалися сценарії - частіше песимістичні - про панування машин над людиною, а віртуальної реальності - над навколишнім світом. Не завжди подібні прогнози виявлялися безглуздими. Інформаційні технології - як перспективна галузь вкладення людських знань, це ще й спосіб контролю за інформацією, отже, і з людської думкою.

Це явище є як негативна, і позитивна сторона. Негативна - тому що контроль за інформацією суперечить невід'ємному людському праву на вільний доступ до неї. Позитивна – тому що відсутність цього контролю може призвести до катастрофічних наслідків для людства. Досить згадати один із наймудріших фільмів останнього десятиліття – «Коли настане кінець світу» Віма Вендерса, герої якого повністю поринули у «віртуальну реальність» власних снів, що записуються на комп'ютер. Однак жоден учений і жоден художник не може дати однозначної відповіді на запитання: що ж чекає на науку і техніку в майбутньому.

Орієнтування на «майбутнє», що часом здається фантастичним, було відмінною особливістю науки середини ХХ століття, коли винахідники прагнули створити досконалі зразки техніки, які можуть працювати без втручання людини. Час показав утопічність подібних досліджень. Однак було б зайвим засуджувати вчених за це - без їхнього ентузіазму в 1950-ті - 60-ті інформаційні технології не зробили б такого потужного стрибка в 90-ті, і ми б не мали того, що маємо зараз.

Останні десятиліття ХХ століття змінили пріоритети науки – дослідницький, винахідницький пафос поступився місцем комерційному інтересу. Знову ж таки - це не добре і не погано. Це - реальність, у якій наука виявляється все більш інтегрованою у повсякденне життя.

Настало XXI століття продовжило цю тенденцію, і в наш час за винаходами стоять не тільки слава та визнання, але, в першу чергу, гроші. Ще й тому важливо дбати про те, щоб нові досягнення науки та техніки не потрапили до рук терористичних угруповань чи диктаторських режимів. Завдання складне до неможливості; максимально здійснити її – завдання всього світового співтовариства.

Інформація - зброя, причому зброя не менш небезпечна, ніж ядерна або хімічна - тільки діє вона не фізично, а швидше психологічно. Людству треба задуматися про те, що для нього в цьому випадку важливіше – свобода чи контроль.

Нові філософські концепції, пов'язані з розвитком інформаційних технологій і спробою їх осмислити, показали обмеженість як природничо матеріалізму, що панував протягом ХIХ - початку ХХ століть, так і крайнього ідеалізму, що заперечує значущість матеріального світу. Сучасній думці, особливо думки Заходу, важливо подолати цей дуалізм у мисленні, коли навколишній світ чітко ділиться на матеріальне та ідеальне. Шлях до цього - діалог культур, зіставлення різних точок зору навколишні явища.

Як не парадоксально, інформаційні технології можуть відіграти не останню роль у цьому процесі. Комп'ютерні мережі, і особливо Інтернет - це не лише ресурс для розваги та бурхливої ​​комерційної діяльності, це ще й засіб осмисленого, спірного спілкування між представниками різних цивілізацій у сучасному світі, а також для діалогу минулого із сьогоденням. Можна сказати, що Інтернет розсуває просторові та часові рамки.

А в діалозі культур за допомогою інформаційних технологій, як і раніше, важлива роль мови як найдавнішого універсального засобу спілкування. Саме тому лінгвістика у взаємодії з математикою, філософією та інформатикою пережила своє друге народження і продовжує розвиватися досі. Тенденція сьогодення продовжиться і в майбутньому - "until the end of the world", як 15 років тому передбачав той самий В. Вендерс. Щоправда, невідомо, коли відбудеться цей кінець – але чи важливо це зараз, адже майбутнє рано чи пізно все одно стане сьогоденням.

Додаток 1

Ferdinand de Saussure

Швидкий лінгвіст Ferdinand de Saussure (1857-1913) є вельми сприйнятий як провідник сучасних лінгвістичних в його дослідах, щоб позначити структуру англійської мовою, аніж історія особливих мов і мовних форм. У факті, метод Структуралізму в лінгвістичних і літературних статтях і значущому літопису Semiotics find their major starting point in his work at the twentieth century. Це буде навіть argued, що комплекс стратегій і думок, що має бути названий "poststructuralism" - робота з Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, і інші - є зауважений за Saussure"s work У лінгвістичних і анаграматичних readings late Latin poetry.If this is so, it can be seen most clearly in the way that Saussure"s work in linguistics and interpretation participates in transformations in modes of understanding across a wide range of intellectualy disciplines f літературний модернізм до психоаналізу і філософії в ранньому двадцятьох зонах. Як Algirdas Julien Greimas і Joseph Courtés argue в Semiotics і Language: An Analytic Dictionary, під заголовком "Interpretation," в новому способі interpretation arose в ранній 20-річчя, що їх identify з Saussurean лінгвістики, Hus. У цьому режимі, "interpretation is no longer matter attributing a given content to for form which would otherwise lack one; 159). У цьому підданому "interpretation," форма і вміст не відрізняються; ще, будь-яка "форма" є, власне, несвідомий "content" як добре, як "значна форма," з тим, що interpretation offers analogical paraphrase of something that already signifies within some other system of signification.

Така реінтерпретація форми і understanding - які Claude Lévi-Strauss повідомлено в одному з його найбільш programmaticky articulations of concept of structuralism, в "Structure and Form: Reflections on Work by Vladimir Propp" - is implicit in Saussure"s posthum У General Linguistics (1916, trans., 1959, 1983).В його життя, Saussure публікувався відносно мало, і його важлива робота, Курси, був перенесенням його школярів з кількох курсів в загальних лінгвістичних 1 offered1. У курсі спостережень називається "науково-дослідницька" освіта мовлення як залучена до роботи в історичних лінгвістиках, що він був виконаний в центрі ланцюжка. language, historical (or "diachronic") лінгвістичних traced оригіналу і розбудови Western languages ​​від позитивного єдиного джерела джерел, першою "Indo-European" language and then earlier "p roto-Indo-European" language.

Це неодноразово ця стаття з unique occurrences of words, with concomitant assumption that the basic "unit" of language is, in fact, the positive existence of these "word-elements," that Saussure questioned. Його робота була сприйнятою до зменшення маси фактів про англійську мову, вивчена з моменту історичної лінгвістики, до управлінської кількості речей. "компаративна освіта" з молодіжної центру філології, суспільство, що збирається в курсі, "діти не входять в надання true школярів лінгвістичних" тому, що "використано виходити з природи його об'єкта освіти" (3). Те, що "природа," я argues, є, щоб бути не тільки в "елементальних" слів, що англійською мовою - це позначення "позитивних" фактів (або "субстанції") з ​​англійською мовою - але в звичайних відносинах, що ведеться до цього "substances."

Saussure''s systematic reexamination of language is based upon three assumptions. її особливий "speech-events," які його designes as parole - і the proper object of lingustics, the system (or "code") governing those events, which he designates as langue. synchronic" поняття relationship за елементами мови на особливій instant rather than "diachronic" study of development language through history.

Це усвідомлення тягнеться на те, що Роман Якобсон в 1929 році встановлюється як "структуралізм", в якому "будь-який рівень феномену, вивчений за сучасною практикою, не застосовується не як механічна агломерація, але як структурне, що для механізмів of their function" ("Romantic" 711). У цій угоді Jakobson є articulating Saussure"s intention to define lingustics as scientific system as opposed to a simple, "mechanical" accounting of historical accidents. now call it "structural" - лінгвістики: що основні елементи англійської мови можуть бути тільки вивчені в відношенні до своїх функцій, що йдуть у відношенні до своїх подій. Європейські "слова"), ці явища і громадськості мають бути зроблені з в systemic framework в яких вони є віднесені до інших незв'язаних дій і громадськості. Cassirer has compared to "нове училище Galileo, яке в сьомій середини центру змінювалося, що всі концепції фізичного світу" (cited in Culler, Pursuit 2 4). Це зміна, як Greimas і Courtés note, reconceives " interpretation " і це reconceives explanation і піддаються тимсамовидання. У ході explanations's being in terms of phenomenon's causas, so that, as an "effect," it is in some ways subordinate to its causas, explanation here consists in subordinating phenomenon to its future-oriented "function" or "purpose." Розповсюдження не є longer незалежними від людських намірів або purposes (одна з цих спроб може бути індивідуальним, комунальним, або, в Freudian terms, "unconscious").

У його лінгвістиці Saussure пристосовується до цього перетворення specifically в пересвідченні лінгвістичного "word", які я говорив як лінгвістичний "сигнал" і defines в функціональних термінах. Сигнал, який argues, є основою "концепції і звукового зображення," який називається "зазначений і підпис" (66-67; Roy Harris"s 1983 translation offers the terms "signification" and "signal"). Природа їхньої "з'єднання" є "функціональним" в тому, що нібито ця цифра signifier є "відповідь" з іншого; element of language, sign, relationally and makes the basic assumption of historical linguistics, namely, the identity of elemental units of language and signification (i.e., "words"), subject to rigorous analysis. word "tree" як "same" word not because the word is defined by inherent qualities - it no is "mechanical agglomeration" of such qualities - but because it is defined as an element in a system, the "structural whole ," of language.

Такий порівняльний (або "діаграфічний") визначення entity governs, концепція всіх елементів мови в структурних лінгвістичних. Це clearest в most impressive achievement of Saussurean lingustics, розробка концепцій "phonemes" і "різноманітних рис" of language. Phonemes є дрібно відзначені і signifying units of language. Вони не мають звуків, що трапляється в мові, але "зображення звуків" мелодії, які apprehended by speakers - phenomenally apprehended - as conveying meaning. (Thus, Elmar Holenstein написав Якобсон "з лінгвістичною, яка досліджує Saussure в важливих способах, як "феноменологічний структуралізм.") Це є для цього розуміння того, що керування прапором для Прага Структуралізм, 7, 7 Mukarovsky. . . is a phenomenological and not empirical reality; it is not the work itself, але set of functional relationships which are located in the consciousness of collective (generation, milieu, etc.)" (cited in Galan 35). , noted in 1960 that "структура не відрізняється content; "Це містить вміст його, і логічну організацію, в якій він є розбитим, є визнаним як властивість реального" (167; viz also Jakobson, Fundamentals 27-28).

Phonemes, then, smallest perceptible elements of language, are not positive objects but a "phenomenological reality." У англійській, за умовами, на телефоні /t/ може бути відомий в багатьох різних способах, але в усіх випадках англійською мовою буде відповідати її як функціонування як /t/. Прихований t (i.e., t pronounced with h-like breath after it), high-pitched or low-pitched t sound, an extended t sound, and so on, буде все функціонувати в самий manner в distinguishing the meaning of "to" та "do" in English. Більше, різниці між мовами є такими, що фізичні зміни в одній мові можуть бути визначені різними телефонами в іншому; Таким чином, англійські відрізняються між /l/ і /r/, деінші мови є структурованими, що ці articulations є визначеними варіаціями того ж фону (як ви хистете, так і ні в англійському). У кожній природній мові, величезна кількість можливих слів є комбінацією малого числа телефонів. Англійською мовою, для останнього, посещають не більше 40 телефонів, які поєднують у вигляді над мільйоном різних слів.

Phonemess language є нимисамостійно організовані структури features. У 1920-х роках і 1930-х років, спираючись на сприйнятливість, якобсон і Н. С. Trubetzkoy, ізолюються на "різноманітні особливості" телефонів. Сприйняття ментіонів в курсі і те, що Harris повідомила як "фізичні фонатики" (39; Baskin's earlier translation використовує термін "фонології" [(1959) 38]) - і вони поєднують в "bundles" з binary позицій до форми. Для останнього, в англійській дифференціації між /t/ і /d/ є причиною або неможливістю "голос" (engagement of vocal chords), і на рівні звуку цих телефонів reciprocally define one another. У цьому способі, фізіологія є конкретним прикладом загальної ланки англійської мови, описаної відповідно до мети: В англійській мові є тільки різниці. Even more important: a difference generally implies positive terms between which the difference is set up; але в англійській мові є тільки тільки відмінності без позитивних термінів. Коли ми будемо сформульовано або сигналізувати, мова має деякі ідеї nor sounds, що існують перед лінгвістичною системою. ( 120)

У цій framework, лінгвістичні подібності не визначаються не врівноваженими якостями, але systemic ("structural") відносини.

Я повинен усвідомити, що фонологія "засмучена лівою" з Сауссурі, тому що після її аналітики з фізиології з англійської продукції "були невідомі," як Harris says, "буде називати "фізичною," як зроблено для всіх" "" (Reading 49), невідповідність в курсі, що характеризується direction і outlines of functional analysis of language. У той же час, її тільки виконала публіковану роботу, Mémoire sur le système primitif des voyelles dans les langues indo-europeennes (Memoir on the primitive system of vowels in Indo-European languages), які виявлено в 1878 році, було центри історичних лінгвістичних. Несправедливість, зцьою цією роботою, як Jonathan Culler має віру, Saussure демонстрував "температура мислення англійської мови як система суворо відносної частини, навіть коли працює на ходу історичної реконструкції" (Saussure 6). Будучи analyzing systematic structural relationships між phonemes до облікового запису з vowel alternation у існуючих Indonesian European Languages, Saussure suggested що в додатку до several different phonemes /a/, вони повинні бути будь-яким повідомленим будь-яким телефоном. "What makes Saussure"s work so very impresive," Culler concludes, "is fact that nearly fifty years later, when cuneiform Hittite був затверджений і принесений, він був заснований на contain a phoneme, written h, which behaved as . Він мав усвідомити, як точніше formal analysis, який є новим знав як літератури з Індоєвропейської "(66).

Цей висновок щодо відносного або значущого визначання елементів значущості, які є як implicit, так і explicit в курсі, позначаються на третій прихильності керуючих структурних лінгвістичних, які спонукають прохання "на arbitrary nature of the sign." За цими способами те, що відносини між знаком і встановленим в англійській мові є необов'язково (або "змінено"): один може тільки добре проходити звуковий сигналіст arbre as signifier tree до unite with the concept "tree". Але більше, ніж це, це означає, що він є вірним як добре: один може бути впевнено визначений на концепції "tree" з її woody quality (яка буде exclude palm trees) як її розмір (яка виключає "low woody plants" call shrubs). Це повинно бути чутливим, що число приписів, що ми повинні бути впевнені, що не відповідає ордеру priority: їх усвідомлення - систематична природа значущості (велика визнана послідовною мовою "синхронно"), relative or "diacritical" of signification, the arbitrary nature of signs - derives its value from thethers.

Що це, Saussurean лінгвістики піддаються phenomena it studies in overarching relationships of combination and contrast in language. У цій концепції, англійською мовою є процес процесу технічного аналізу (сигналізація) і його продукту (комунікацій), і ці дві функції англійської мови є кожний подібний або повністю загартований (див. Schleifer, "Deconstruction"). Тут, мабуть, можна визначити між собою форму і зміст, що Greimas і Courtés повторюється в сучасних interpretations: language presents contrasts, що formalmente define його units, і ці units combine on succeeding levels to create the signifying content. Безсумнівно, елементи англійської мови є arbitrary, moreover, деякий contrast nor combination може бути спрямований на basic. Таким чином, в мові характерні особливості комбінації для форми спілкування телефонів на іншому рівні apprehension, телефонів з'єднується з формою повідомлень morphemes, morphemes combine for words, words combine to form sentences, and so on. У будь-якому випадку, протягом всього телефону, або слово, або повідомлення, і тому, що є більшою, ніж сума своїх частин (just as water, H2O, in Saussure"s example [(1959) 103] is more than mechanical agglomeration з hydrogen і oxygen).

Три припущення з курсу в загальному лінгвістиці ведуть суспільство, щоб скористатися новою школою двадцятьох центірів, які повинні бути в лінгвістичній школі, щоб вивчити "життя слів з в соціумі." Saussure називається цією основою "семіології" (16). "Середня" semiotics, як це може бути виконана в Великобританії в 1920-х і 1930-х роках і Париж в 1950-х і 1960-х роках, вивчається вивчення лінгвістичних і лінгвістичних структур для літературних архітектурних структур. Через нову частину своєї кар'єри, morever, навіть якщо вона була в курсі курсів в загальних лінгвістичних, Saussure pursued його власні "семіотичні" аналітика останньої латиної поетри в дослідженні довідник наближено налаштованих анаграм. Метод методики був у багатьох випадках з'єднаний з функціональним rationalism своїх лінгвістичних analyses: він спричинений, як сприйняття ментіонів в одному з 99 notebooks в яких було випущено це дослідження, яке вивчається систематично на питання стає inevitable foundation of everything" (cited in Starobinski 101). Такий вивчання, як Saussure himself says, фокусується на "матеріальної факту" chance and meaning (показано 101), так, що "тем-слово", який anagram Saussure є скидання, як Jean Starobinski argues, "є, для поети , an instrument, and not a vital germ of the poem. У цьому аналізі, Starobinski says, "Saussure did not lose himself in asearch for hidden meanings." Instead, його робота seems to demonstrate a desire to evade all the problems rising from consciousness: "Since poetry is notly realized in words but is something born from words, it escapes arbitrary control of consciousness to depending (121).

Що це, Saussure's attempt to discover properes names в останній Латинська поетра - what Tzvetan Todorov називає reduction of a "word . . . до її signifier" (266) - emphasizes один з елементів, що владнає його лінгвістичне analysis, arbitrary природи of sign. a substance" - які ефективно eliminates semantics as major object of analysis.) Як Todorov concludes, Saussure"s work appears remarkably homogeneous today in its refusal to accept symbolic phenomena . . . . У його вивченні на анаграмах, ви отримаєте попит тільки на феномен repetition, не на той еволюції. . . . У його дослідженнях з Nibelungen, які визнають символи тільки в ордері, щоб розглянути їх до поводження readings: since they not intentional, symbols do no exist. Finally in his courses on general linguistics, he contemplates the existence of semiology, and thus of signs other than linguistics ones; Але ця affirmation is at once limited by fact that semiology is devoted to a single type of sign: those which are arbitrary. (269-70)

Якщо це є true, це означає, що Saussure не може визнати "наслідування" без предмета; я не можу, щоб не вистачило, щоб одержати між формою і вмістом його роботи, щоб скористатися роботою. Instead, he resorted до "лінгвістичної legality." Закінчено між, на одній стороні, нітейнто-центру концепції історії, підприємництва, і в способі causal interpretation регулювалися за їхніми словами, і на іншій стороні, двадцять-центру "structuralist" conceptions what Lévi-Strauss називається "Kantianism a transcendental subject" (cited in Connerton 23) - концепції, що можливе одержання між формою і вмістом (або предмет і об'єкт) і hierarchy of foreground and background в full-blown structuralism, psychoanalysis, і навіть quantum mechanics - work of Ferdinand de Saussure в лінгвістиках і semiotics circumscribes в signal moment в study of meaning and culture.

Ronald Schleifer

Додаток 2

Фердинанд де Соссюр (переклад)

Швейцарський мовознавець Фердинанд де Соссюр (1857-1913) вважається засновником сучасної лінгвістики завдяки своїм спробам описати структуру мови, а не історію окремих мов і словоформ. За великим рахунком, основи структурних методів у лінгвістиці та літературознавстві і значною мірою семіотики були закладені в його роботах на початку ХХ століття. Доведено, що методи та концепції так званого "постструктуралізму", розвинені в роботах Жака Дерріда, Мішеля Фуко, Жака Лакана, Юлії Крістєвої, Ролана Барта та інших, сягають лінгвістичних праць Соссюра та анаграматичних прочитань пізньої римської поезії. Слід зауважити, що роботи Соссюра з лінгвістики та мовної інтерпретації допомагає пов'язати широке коло інтелектуальних дисциплін – від фізики до літературних нововведень, психоаналізу та філософії початку двадцятого століття. А. Дж. Греймас та Ж. Курте пишуть у «Семіотиці та мові»: «Аналітичний словник із заголовком «Інтерпретація» як новий вид інтерпретації з'явився на початку ХХ століття разом із лінгвістикою Соссюра, феноменологією Гуссерля та психоаналізом Фрейда. У такому разі, "інтерпретація - це не приписування даного змісту до форми, яка інакше зазнала б недоліку в тому; швидше це - переказ, який формулює іншим способом той самий зміст значущого елемента в межах даної семіотичної системи" (159). У такому розумінні «інтерпретації», форма та зміст нерозривні; навпаки, кожна форма наповнена семантичним значенням («значуща форма»), тому інтерпретація пропонує новий, аналогічний переказ чогось, значимого в іншій знаковій системі.

Подібне розуміння форми і змісту, що представляється Клодом Леві-Строссом в одній з програмних робіт структуралізму, ("Структура і Форма: Роздуми над працями Володимира Проппа") - можна побачити в книзі Соссюра «Курс загальної лінгвістики» (1916, пров. 1959, 1983). За життя Соссюр мало публікувався, "Курс" - його основна робота - був зібраний за конспектами студентів, які відвідували його лекції з загальної лінгвістики в 1907-11 рр. У «Курсі» Соссюр закликав до «наукового» вивчення мови, протиставляючи його порівняльно-історичному мовознавству дев'ятнадцятого століття. Цю роботу можна вважати одним із найбільших досягнень західної думки: беручи за основу окремі слова як структурні елементи мови, історичне (або «діахронічне») мовознавство доводило походження та розвиток західноєвропейських мов від загальної, індоєвропейської мови- та більш ранньої праіндоєвропейської.

Це - точно це дослідження унікальних виникнення слів, з супутнім припущенням, що основна "одиниця" мови, фактично, позитивне існування цих "елементів слова", що Соссюр поставив під сумнів. Його робота була спробою скоротити безліч фактів про мову, побіжно вивчених порівняльною лінгвістикою, до небагатьох теорем. Порівняльна філологічна школа ХІХ століття, пише Соссюр, «не досягла успіху у створенні справжньої школи лінгвістики», оскільки «вона зрозуміла сутності об'єкта вивчення» ( 3). Ця «сутність», стверджує він, полягає у окремих словах - «позитивних субстанціях» мови - а й у формальних зв'язках, які допомагають цим субстанціям існувати.

Соссюрівська "перевірка" мови заснована на трьох припущеннях. Перше: наукове розуміння мови засноване не так на історичному, але в структурному феномені. Тому він розрізняв окремі явища мови - "події мови", які він визначає як "parole" - і належний, на його думку, об'єкт вивчення лінгвістики, систему (код, структуру), що керує цими подіями ("langue"). Подібне систематичне вивчення, крім того, потребує «синхронної» концепції відносин між елементами мови на даний момент, а не «діахронічного» дослідження розвитку мови через її історію.

Ця гіпотеза стала передвісником того, що Роман Якобсон в 1929 назве «структуралізмом» - теорії, де "будь-який набір явищ, досліджений сучасною наукою, розглядається не як механічне скупчення, а як структурне ціле, в якому конструктивна складова співвідноситься з функцією" ("Romantic "711). У цьому уривку Якобсон сформулював сосюрівську ідею визначення мови як структури на противагу «машинальному» перерахуванню історичних подій. Крім того, Якобсон розвиває й інше соссюрівське припущення, що стало предтечею структурної лінгвістики: базові елементи мови повинні вивчатися у зв'язку не стільки зі своїми причинами, скільки зі своїми функціями. Окремі явища та події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не власними силами, а в системі, в якій вони співвіднесені з подібними ж складовими. Це був радикальний поворот у зіставленні явищ з навколишньою дійсністю, значимість якого філософ Ернст Кассірер порівняв з «наукою Галілея, що перевернула в сімнадцятому столітті уявлення про матеріальний світ». Сивова, і самі пояснення.Яви стали трактуватися не щодо причин їх виникнення, а щодо того ефекту, який вони можуть опинитися в сучасному і майбутньому.Тлумачення перестало бути незалежним від намірів людини(попри те, що наміри можуть бути безособовими, «несвідомими») у фрейдистському розумінні цього слова).

У своїй лінгвістиці Соссюр особливо показує цей поворот у зміні поняття слова у лінгвістиці, яке він визначає як знак та описує з погляду його функцій. Знак для нього -з'єднання звучання і сенсу, що "позначається і позначення" (66-67; в англійському перекладі 1983 авторства Роя Харріса - "signification" і "signal"). Природа цієї сполуки - «функціональна» (ні той, ні інший елемент що неспроможні існувати друг без друга); більше, " одне запозичує якості в іншого " (8). Таким чином Соссюр визначає основний структурний елемент мови – знак – і робить основою історичного мовознавства ідентичність знаків словами, що потребує особливо суворого аналізу. Тому ми можемо зрозуміти різні значення, скажімо, одного і того ж слова «дерево» - не тому що слово є лише набір певних якостей, а тому що воно визначено як елемент у знаковій системі, в «структурному цілому», в мові.

Подібне відносне («діакритичне») поняття єдності лежить в основі уявлення про всі елементи мови у структурній лінгвістиці. Це особливо ясно видно у найбільш оригінальній знахідці соссюрівського мовознавства, у розвитку концепції «фонем» та «відмінних рис» мови. Фонеми - найдрібніші зі сказаних і значних мовних одиниць. Вони є не тільки звуками, що зустрічаються в мові, але «звуковими образами», зауважує Соссюр, які сприймаються носіями мови як такі, що мають значення. (Слід зазначити, що Елмар Холенштейн називає лінгвістику Якобсона, за основними положеннями Соссюра, що продовжує ідеї та концепції, «феноменологічним структуралізмом»). Саме тому провідний доповідач празької школи структуралізму Ян Мукаровський зауважив у 1937 році, що «структура. . . не емпіричне, а феноменологічне поняття; це сам результат, а набір значних відносин колективного свідомості (покоління, оточуючих тощо.)». Схожу думку висловив у 1960 році Леві-Стросс, лідер французького структуралізму: «У структури немає певного змісту; вона сама по собі змістовна, і логічна конструкція, в яку вона укладена, є відбитком реальності».

У свою чергу фонеми, як найдрібніші мовні елементи, прийнятні для сприйняття, є окремою цілісною «феноменологічною реальністю». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але у всіх випадках людина, яка володіє англійською, сприйматиме її як «т». Вимовлений з придыханием, з високим чи низьким підйомом мови, довгий звук «т» тощо однаково розрізнятиме значення слів «to» і «do». Більше того - відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншій; наприклад «л» і «р» в англійській різні, тоді як в інших мовах це різновиди однієї фонеми (подібно до англійської «т», сказаному з придихом і без). Великий словниковий запас будь-якої природної мови є набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для вимовлення та написання близько мільйона слів використовується лише 40 фонем.

Звуки мови є системно організований набір характеристик. У 1920-1930-ті, за Соссюром, Якобсон і Н.С.Трубецкой виділили «відмінні риси» фонем. Ці риси засновані на будові органів мови – мови, зубів, голосових зв'язок – Соссюр зауважує це в «Курсі загальної лінгвістики», а Харріс називає «фізіологічною фонетикою» (у більш ранньому перекладі Баскіна використовується термін «фонологія») – вони поєднуються в «вузли дург проти друга, щоб видавати звуки. Скажімо, in в англійській різниця між "т" і "д" полягає в наявності або відсутності "голосу" (напрузі голосових зв'язок), і в рівні голосу, що відрізняє одну фонему від іншої. Таким чином, фонологію можна вважати прикладом загального мовного правила, описаного Соссюр: «У мові є лише відмінності». Більш важливо навіть це: відмінність зазвичай має на увазі точні умови, між якими воно й перебуває; але у мові існують лише відмінності без точних умов. Розглядаємо ми «позначення» чи «позначається» - у мові немає ні понять, ні звуків, які б до того, як розвинулася мовна система.

У подібній структурі мовні аналогії визначені не за допомогою властивих їм якостей, а за допомогою системних («структурних») відносин.

Я вже згадав, що фонологія у своєму розвитку спиралася на ідеї Соссюра. Незважаючи на те, що його аналіз мовної фізіології в наш час за словами Харріса, «було б названо «фізичним», на противагу «психологічному» чи «функціональному», у «Курсі» він виразно сформулював напрямок та основні засади функціонального аналізу мови. Його єдина видана за життя робота, «Записки про початкову систему голосних в індоєвропейських мовах», видана в 1878, повністю знаходилася в руслі порівняльно-історичного мовознавства XIX століття. Проте цією працею, як каже Джонатан Каллер, Соссюр показав «плідність уявлення про мову як систему взаємопов'язаних явищ, навіть за його історичної реконструкції». Аналізуючи взаємозв'язки між фонемами, пояснюючи чергування голосних у сучасних мовах індоєвропейської групи, Соссюр припустив, що крім кількох різних звуків «а», мають бути інші фонеми, описувані формально. «Що справляє особливе враження у праці Соссюра, - робить висновок Каллер, - те, що майже через 50 років, при відкритті і розшифровці хетського клинопису, була знайдена фонема, на листі позначається «h», яка поводилася так, як пророкував Соссюр. За допомогою формального аналізу він відкрив те, що зараз відоме як гортанний звук в індоєвропейських мовах.

У концепції відносного (діакритичного) визначення знаків, як явно вираженої, так і на увазі в «Курсі», існує і третє ключове припущення структурної лінгвістики, назване Соссюром «довільною природою знака». Під цим мається на увазі, що відношення між звучанням і значенням у мові нічим не мотивоване: з однаковою легкістю можна поєднати слово arbre і слово tree з поняттям дерево. Більше того, це означає, що звучання теж довільне: можна визначити поняття «дерево» щодо наявності у нього кори (крім пальм) та за розміром (крім «низьких деревних рослин» - чагарників). З цього має бути зрозуміло, що всі припущення, що представляються мною, не діляться на більш і менш важливі: кожне з них - системний характер знаків (найбільш зрозумілий при «синхронному» вивченні мови), їх відносна (діакритична) сутність, довільна природа знаків - виходить з решти.

Таким чином, в соссюрівському мовознавстві феномен, що вивчається, розуміється як зведення зіставлень і протиставлень мови. Мова - це і вираз значення слів (позначення), та його результат (спілкування) - і ці дві функції будь-коли збігаються (див. «Деконструкцію мови» Шлейфера). Ми можемо помітити чергування форми та змісту, яке Греймас і Курте описують у новітньому варіанті інтерпретації: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють на рівні, що змінюють один одного, щоб створити певний значущий зміст. Оскільки елементи мови випадкові, ні контраст, ні поєднання неможливо знайти основою. Отже, у мові відмітні ознаки формують фонетичний контраст іншому рівні розуміння, фонеми поєднуються в контрастні морфеми, морфеми - у слова, слова - у речення тощо. У будь-якому випадку ціла фонема, слово, речення і т.д. є чимось більшим, ніж сума складових (як і вода, в соссюровском прикладі - більше, ніж поєднання водню і кисню).

Три припущення «Курсу загальної лінгвістики» привели Соссюра до ідеї нової науки ХХ століття, окремо від лінгвістики вивчає «життя знаків у суспільстві». Соссюр назвав цю науку семіологією (від грецької «semeîon» – знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920-1930 і в Парижі в 1950 і 1960, розширила вивчення мови і лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своєму курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою, як пише Соссюр в одній із 99 записників, вивчити в системі проблему «імовірності», яка «стає основою всього». Таке дослідження, як стверджує сам Соссюр, допомагає зосередитись на «речовій стороні» ймовірності; «ключове слово», анаграму якого шукає Соссюр, як стверджує Жан Старобинський, «інструмент для поета, а чи не джерело життя вірша. Вірш служить у тому, щоб поміняти місцями звуки ключового слова». За словами Старобинського, у цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, у його роботах помітно бажання уникнути питань, пов'язаних зі свідомістю: «оскільки поезія виражається у словах, а й у тому, що породжують ці слова, вона виходить з-під контролю свідомості і від законів мови».

Спроба Соссюра вивчити власні імена в пізній римській поезії (Цветан Тодоров назвав це скороченням «слова... лише до його написання») підкреслює одну зі складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюрівської лінгвістики («Я він, «суть форма, а чи не явище»), що виключає можливість аналізу сенсу. Тодоров робить висновок, що в наші дні праці Соссюра виглядають на диво послідовними в небажанні вивчати символи [яви, що мають чітко визначене значення]. . . . Досліджуючи анаграми, Соссюр звертає увагу лише з повторення, але з попередні варіанти. . . . Вивчаючи «Пісню про Нібелунги», він визначає символи лише для того, щоб привласнити їх хибним читанням: якщо вони ненавмисні, символів не існує. Зрештою, у своїх працях із загальної лінгвістики він припускає існування семіології, описує як лінгвістичні знаки; але це припущення обмежується тим, що семилогоя може описувати лише випадкові, довільні знаки.

Якщо це справді так, то тільки тому, що не міг уявити «намір» без предмета; він не міг до кінця подолати прірву між формою та змістом - у його працях це перетворювалося на питання. Натомість він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, що ґрунтуються на історії та суб'єктивних здогадах, та методах випадкової інтерпретації, що ґрунтуються на цих концепціях, і, з іншого боку, структуралістськими концепціями, які Леві-Стросс назвав «кантіанством без трансцендентної дійової особи». що стирають протистояння між формою і змістом (суб'єктом і об'єктом), значенням і походженням у структуралізмі, психоаналізі і навіть квантової механіки - праці Ферлінанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Рональд Шлейфер

Література

1. Адмоні В.Г. Основи теорії граматики/В.Г. Адмоні; АН СРСР.-М.: Наука, 1964.-104с.

3. Арапов, М.В., Херц, М.М. Математичні методи у лінгвістиці. М., 1974.

4. Арнольд І.В. Семантична структура слова в сучасній англійській мові та методика її дослідження. /І.В. Арнольд-Л.: Просвітництво, 1966. – 187 с.

6.Башликов А.М. Система автоматизованого перекладу. / А.М. Башликов, А.А. Соколів. – М.: ТОВ «ФІМА», 1997. – 20 с.

7.Бодуен де Куртене: Теоретична спадщина та сучасність: Тези доповідей міжнародної наукової конференції / Ред.І.Г. Кондратьєва. – Казань: КДУ, 1995. – 224 с.

8. Гладкий А.В., Елементи математичної лігвістики. /. Гладкий О.В., Мельчук І.О. -М., 1969. – 198 с.

9. Головін, Б.М. Мова та статистика. /Б.М. Головін-М., 1971. – 210 с.

10. Звегінців, В.А. Теоретична та прикладна лінгвістика. / В.А. Звегінців -М., 1969. - 143 с.

11. Касевич, В.Б. Семантика. Синтаксису. Морфологія // В.Б. Касевич-М., 1988. – 292 c.

12. Лекомцев Ю.К. Введення у формальну мову лінгвістики/Ю.К. Лекомців. - М: Наука, 1983, 204 с., іл.

13. Лінгвістична спадщина Бодуена де Куртене наприкінці ХХ століття: Тези доповідей міжнародної науково-практичної конференції 15-18 березня 2000 року. – Красноярськ, 2000. – 125 с.

Матвєєва Г.Г. Приховані граматичні значення та ідентифікація соціальної особи («портрета») мовця/Г.Г. Матвєєва. – Ростов, 1999. – 174 с.

14. Мельчук, І.А. Досвід побудови лінгвістичних моделей "Сенс Текст". / І.А. Мельчук. – М., 1974. – 145 c.

15. Нелюбін Л.Л. Переклад та прикладна лінгвістика / Л.Л. Нелюбін. - М.: Вища школа, 1983. - 207 с.

16. Про точні методи дослідження мови: про так звану «математичну лінгвістику»/О.С. Ахманова, І. А. Мельчук, Є.В. Падучова та ін. - М., 1961. - 162 с.

17. Піотровський Л.Г. Математична лінгвістика: Навчальний посібник/Л.Г. Піотровський, К.Б. Бектаєв, А.А. Піотрівська. – М.: Вища школа, 1977. – 160 с.

18.Він же. Текст, машина, людина. – Л., 1975. – 213 с.

19. Він же. Прикладне мовознавство/За ред. О.С Герда. – Л., 1986. – 176 с.

20. Ревзін, І.І. Моделі мови. М., 1963. Ревзін, І.І. Сучасна структурна лінгвістика. Проблеми та методи. М., 1977. – 239 с.

21. Ревзін, І.І., Розенцвейг, В.Ю. Основи загального та машинного перекладу / Ревзін І.І., Розенцвейг, В.Ю. – М., 1964. – 401 с.

22. Слюсарьова Н.А. Теорія Ф.де Соссюра у світлі сучасної лінгвістики/Н.А. Слюсарєва. - М:Наука, 1975. - 156 с.

23. Сова, Л.З. Аналітична лінгвістика/Л.З. Сова – М., 1970. – 192 с.

24. Соссюр Ф. де. Нотатки із загальної лінгвістики/ Ф. де Соссюр; Пров. із фр. – М.: Прогрес, 2000. – 187 с.

25. Він же. Курс загальної лінгвістики/Пер. із фр. - Єкатеринбург, 1999. -426 с.

26. Статистика мови та автоматичний аналіз тексту / Відп. ред. Р.Г. Піотровський. Л., 1980. – 223 с.

27. Столл, P. Безліч. Логікa. Аксіоматичні теорії. / Р. Столл; Пров. з англ. – М., 1968. – 180 с.

28. Теньєр, Л. Основи структурного синтаксису. М., 1988.

29. Убін І.І. Автоматизація перекладацької діяльності у СРСР/І.І. Убін, Л.Ю. Коростелев, Б.Д. Тихомиров. – М., 1989. – 28 с.

30. Фор, P., Кофман, A., Дені-Папен, М. Сучасна математика. М., 1966.

31. Шенк, Р. Обробка концептуальної інформації. М., 1980.

32. Шихaнович, Ю.A. Введення в сучасну математику (початкові поняття). М., 1965

33. Щерба Л.В. Російські голосні в якісному та кількісному відношенні/Л.В. Щерба – Л.: Наука, 1983. – 159 с.

34. Абдулла-заде Ф. Громадянин світу// Вогник - 1996. - №5. - С.13

35. В.А. Успенський. Попередження для читачів "Нового літературного огляду" до семіотичних послань Андрія Миколайовича Колмогорова. - Новий літературний огляд. -1997. - №24. - С. 18-23

36. Перловський Л. Свідомість, мова та культура. - Знання сила. -2000. №4 - С. 20-33

37. Фрумкіна Р.М. Про нас - навскіс. //Російський Журнал. – 2000. – №1. - С. 12

38. Фітіалов, С.Я. Про моделювання синтаксису у структурній лінгвістиці // Проблеми структурної лінгвістики. М., 1962.

39. Він же. Про еквівалентність граматики СР та граматики залежностей // Проблеми структурної лінгвістики. М., 1967.

40. Хомський, Н. Логічні основи лінгвістичної теорії // Нове у лінгвістиці. Вип. 4. М., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. press. jhu.ru

46. ​​ru.wikipedia.org

Протягом останнього століття мовознавство завжди наводилося як приклад науки, що розвивалася стрімко та дуже швидко досягла методичної зрілості. Вже в середині минулого століття молода наука впевнено зайняла місце в колі наук, що мали тисячолітню традицію, а один з найвизначніших її представників - А. Шлейхер - мав сміливість думати, що своїми працями він підводить вже підсумкову лінію.<113>Історія лінгвістики, однак, показала, що така думка була надто поспішною і невиправданою. Наприкінці століття мовознавство зазнало першого великого потрясіння, пов'язане з критикою младограматичних принципів, за яким пішли й інші. Слід зазначити, що всі кризи, які ми можемо розкрити в історії науки про мову, як правило, не розхитували її основ, але, навпаки, сприяли зміцненню і зрештою приносили з собою уточнення та вдосконалення методів лінгвістичного дослідження, розширюючи разом із тим самим і наукову проблематику.

Але поруч із мовознавством жили та розвивалися й інші науки, зокрема й багато нових. Особливо бурхливий розвиток нашого часу отримали фізичні, хімічні та технічні (так звані «точні») науки, а з усіх ними запанувала їх теоретична основа - математика. Точні науки як сильно потіснили все гуманітарні науки, але у час прагнуть «привести в свою віру», підпорядкувати своїм звичаям, нав'язати їм свої методи дослідження. При створеному становищі, використовуючи японський вираз, можна сказати, що нині мовознавці-філологи опоганюють собою самий краєчок циновки, де тріумфально і вольготно розташувалися точні науки на чолі з математикою.

Чи не доцільніше з точки зору загальнонаукових інтересів капітулювати перед математикою, цілком віддатися у владу її методів, до чого вже відверто закликають деякі голоси 5 9 і тим самим, можливо, набути нової сили? Щоб відповісти на ці питання, треба спочатку подивитися, на що претендує математика в даному випадку, в якій галузі лінгвістики знаходять своє застосування математичні методи, якою мірою вони узгоджуються зі специфікою мовного матеріалу і чи здатні вони дати або навіть підказати відповіді на ті питання. , які ставить перед собою наука про мову

З самого початку слід зазначити, що і серед ентузіастів нового, математичного спрямування в лінгві<114>стичних дослідженнях немає єдності думок щодо його цілей та завдань. Акад. А. А. Марков, який першим застосував математичні методи до мови, Болдріні, Юл, Маріотті розглядають мовні елементи як підходящий ілюстративний матеріал для побудови квантитативних методів, або для статистичних теорем, зовсім не задаючись питанням, чи цікаві результати такого дослідження для лінгвістів 6 0 . Рос вважає, що теорія ймовірностей і математична статистика представляють інструмент або, як нині вважають за краще говорити, математичну модель для перевірки та підтвердження тих лінгвістичних висновків, які допускають числове трактування. Тим самим було математичні методи мисляться лише як допоміжні засоби лінгвістичного дослідження 6 1 . На набагато більше претендує Хердан, який у своїй книзі не лише підсумував та систематизував усі спроби математичного вивчення мовних проблем, а й спробував дати їм чітку орієнтацію щодо подальшої роботи. Виклад всього матеріалу своєї книги він орієнтує на «розуміння літературної статистики (так називає вивчення текстів методами математичної статистики. - У 3.)як невід'ємну частину лінгвістики» 6 2 , а сутність і завдання цього нового розділу в мовознавстві формулює в таких словах: «Літературна статистика як квантитативної філософії мови застосовна до всіх галузей лінгвістики. На нашу думку, літературна статистика є структуральна лінгвістика, піднята на рівень квантитативної науки або квантитативної філософії. Таким чином, однаково неправильно визначати її результати як такі, що не належать до області<115>лінгвістики або трактувати її як допоміжний засіб для дослідження» 6 3 .

Чи доцільно вдаватися до теоретизування щодо того, чи правомірно в даному випадку говорити про виникнення нової галузі лінгвістики та вирішувати питання про її претензії, не звернувшись спочатку до розгляду вже фактично зробленого в цій галузі, та до з'ясування того, в якому напрямку йде застосування нових методів 6 4 . Це допоможе нам розібратися й у різноголосці думок.

Застосування математичного (чи, точніше кажучи, статистичного) критерію для вирішення лінгвістичних питань є аж ніяк не новим для науки про мову і тією чи іншою мірою вже давно використовується мовознавцями. Адже, по суті, такі традиційні поняття лінгвістики, як фонетичний закон (і пов'язаний<116>нє з ним - виняток із закону), продуктивність граматичних елементів (наприклад, словотвірних суфіксів) або навіть критерії споріднених відносин між мовами певною мірою будуються на відносних статистичних ознаках. Адже чим різкіше і виразніше статистичне протиставлення випадків, тим більше в нас підстав говорити про продуктивні і непродуктивні суфікси, про фонетичний закон і винятки з нього, про наявність або відсутність споріднених відносин між мовами. Але якщо в подібних випадках статистичний принцип використовувався більш менш стихійно, то надалі він став застосовуватися свідомо і вже з певною цілеустановкою. Так, у наш час великого поширення набули так звані частотні словники лексики та виразів окремих мов 6 5 або навіть значень різномовних слів із «загальною спрямованістю на дійсність» 6 6 . Дані цих словників використовуються для складання підручників іноземних мов (тексти яких будуються на найбільш уживаній лексиці) та словників-мінімумів. Спеціально лінгвістичне використання статистичних обчислень знайшли у методі лексикостатистики або глоттохронології М. Сводеша, де на основі статистичних формул, що враховують випадки зникнення з мов слів основного фонду, виявляється можливим встановити абсолютну хронологію розчленовування мовних сімейств 6 7 .

В останні роки випадки застосування математичних методів до мовного матеріалу значно помножилися і в масі подібних спроб намітилися більш-менш певні напрямки. Звернемося<117>до послідовного їх розгляду, не вдаючись до деталей.

Почнемо з напряму, якому присвоєно найменування стилостатистики. Мова в даному випадку йдеться про визначення та характеристику стилістичних особливостей окремих творів або авторів через кількісні відносини використовуваних мовних елементів. В основі статистичного підходу до дослідження стилістичних явищ лежить розуміння літературного стилю як індивідуального способу володіння мовними засобами. При цьому дослідник зовсім відволікається від питання про якісну значущість обчислюваних мовних елементів, зосереджуючи всю свою увагу лише на кількісному боці; смислова сторона досліджуваних мовних одиниць, їх емоційно-експресивне навантаження, так само як і їхня питома вага в тканині художнього твору - все це залишається поза врахуванням, відноситься до так званих надлишкових явищ. Таким чином, художній твір виступає у вигляді механічної сукупності, специфіка побудови якого знаходить своє вираження лише через числові відносини її елементів. На всі зазначені обставини представники стилостатистики не заплющують очі, протиставляючи методам традиційної стилістики, які, безсумнівно, включають елементи суб'єктивності, одна єдина якість математичного методу, яка, на їхню думку, окупає всі його недоліки - об'єктивність досягнутих результатів. «Ми прагнемо, - пише, наприклад, В. Фукс, - ... охарактеризувати стиль мовного вираження математичними засобами. Для цієї мети повинні бути створені методи, результати яких повинні мати об'єктивність такою самою мірою, як і результати точних наук... Це передбачає, що ми, принаймні спочатку, займатимемося лише формальними структурними якостями, а не смисловим змістом мовних виразів. . Таким чином ми отримаємо систему порядкових відносин, яка у своїй сукупності являтиме собою основу та вихідний пункт математичної теорії стилю» 6 8 .<118>

Найпростішим видом статистичного підходу до вивчення мови письменників чи окремих творів є підрахунок вживаних слів, оскільки багатство словника, певне, має певним чином характеризувати і автора. Однак результати подібних підрахунків дають дещо несподівані в цьому плані результати і ніяк не сприяють естетичному пізнанню та оцінці літературного твору, що не в останню чергу входить до завдань стилістики. Ось деякі дані щодо загальної кількості слів, які вживаються у низці творів:

Біблія (латинська). . . . . . . . . . 5649 слів

Біблія (давньоєврейська). . . . 5642 слова

Демосфен (промови). . . . . . . . . . . . 4972 слова

Саллюстій. . . . . . . . . . . . . . . . . 3394 слова

Горацій. . . . . . . . . . . . . . . . . . . .6084 слова

Данте (Божественна комедія) 5860 слів

(сюди входить 1615 власних назв і географічних назв)

Тассо (Шалений Орланд) . . . . 8474 слова

Мілтон. . . . . . . . . . . . . . . . . . . . .8000 слів (прибл. дан.)

Шекспір. . . . . . . . . . . . . . . . . . .15000 слів

(приблизно, за іншими даними 20 000 слів)

О. Есперсен вказує, що словник Золя, Кіплінга та Джека Лондона значно перевищує словник Мілтона, тобто число 8000 6 9 . Підрахунок словника промов президента США В. Вілсона встановив, що він багатший, ніж у Шекспіра. До цього слід додати дані психологів. Так, Терман на основі спостережень над великою кількістю випадків встановив, що словник середньої дитини складає близько 3600 слів, а в 14 років – вже 9000. Середній дорослий вживає 11700 слів, а людина «підвищеної інтелігентності» до 13500 7 0 . Таким чином, подібні числові дані самі по собі не дають жодних підстав для виявлення стилістичних якостей творів і лише «об'єктивно» кон.<119>статують вживання різної кількості слів різними авторами, що, як свідчать наведені підрахунки, пов'язані з відносної художньої цінністю їх творів.

Дещо по-іншому будуються підрахунки відносної частоти вживання слів в окремих авторів. І тут враховується як загальна сума слів, а й частота вживання окремих слів. Статистична обробка отриманого таким чином матеріалу полягає в тому, що слова з рівною частотою вживання групуються за класами (або рангами), що призводить до встановлення частотної дистрибуції всіх слів, що вживаються даним автором. Приватним випадком таких підрахунків є визначення відносної частотності спеціальних слів (наприклад, романської лексики у творах Чосера, як це було зроблено Мерсандом 7 1). Відносна частотність вживаних авторами слів містить такі ж об'єктивні відомості про стиль окремих авторів, як і наведені вище сумарні підрахунки, з тією різницею, що в результаті виходять більш точні числові дані. Але вона використовується і для датування окремих творів одного і того ж автора на основі попередньо зробленого підрахунку відносної частоти вживання ним слів у різні періоди його життя (за датованим самим автором творами). Іншим видом використання даних подібних підрахунків є встановлення справжності авторства творів, щодо яких це питання є сумнівним 7 2 . У цьому разі все будується на порівнянні статистичних формул частоти вживання в справжніх і спірних творах. Немає потреби говорити про дуже велику відносність і приблизність результатів, отриманих такими методами. Адже відносна частота вживання змінюється не лише з віком автора, а й залежно від жанру, сюжету, а також і історичного середовища дії твору (порівн., наприклад, «Хліб» та «Петро I» А. Толстого).<120>

Поглиблюючи вищеописаний метод, стилостатистика як стильової характеристики стала вдаватися до критерію стабільності відносної частоти найбільш уживаних слів. Метод, що застосовується в даному випадку, можна проілюструвати статистичною обробкою оповідання Пушкіна «Капітанська дочка», виробленої Есселсоном та Епштейном в Інституті слов'янських мов при Детройтському університеті (США) 7 3 . Обстеженню піддав весь текст оповідання (близько 30000 випадків вживання слів), а потім уривки, що містять близько 10000 і 5000 випадків вживання. Далі, з метою визначення стабільності відносної частоти вживання слів, у 102 найбільш уживаних слів (з частотою від 1160 разів до 35) було зроблено порівняння розрахункової відносної частоти (зробленої на основі вибіркових уривків) з дійсною. Наприклад, союз «і» у всьому оповіданні вживався 1160 разів. У уривку, що містить 5 000 випадків вживання всіх слів, слід очікувати, що цей союз буде використовуватися 5 000 x 1 160: 30 000, або округло 193 рази, а у уривку, що містить 10 000 випадків вживання всіх слів, він ймовірно використовується x 1 160: 30 000 або 386 разів. Порівняння отриманих за допомогою таких розрахунків даних з фактичними показує дуже незначне відхилення (в межах 5%). На основі подібних розрахунків було встановлено, що в даному оповіданні Пушкіна прийменник «к» використовується вдвічі частіше, ніж «у», а займенник «ти» втричі частіше, ніж «їх» тощо. попри всі перипетії сюжету, як упродовж всього оповідання, і у окремих його частинах, спостерігається стабільність відносної частоти вживання слів. Те, що спостерігається щодо деяких (найбільш уживаних) слів, імовірно застосовно і стосовно всіх використаних у творі слів. Звідси випливає, що стиль автора можна характеризувати певним співвідношенням мінливості середньої частоти вживання слова до загальної мови.<121>частоті його вживання. Це і розглядається як об'єктивної квантитативної характеристики стилю автора.

Аналогічно досліджуються й інші формальні елементи структури мови. Так, наприклад, В. Фукс піддав порівняльно-статистичному розгляду метричні особливості творів Гете, Рільке, Цезаря, Саллюстія та ін.

Критерій стабільності відносної частоти вживання слів, уточнюючи техніку квантитативної властивості іміджу, нічого важливо нового не вносить проти вище розібраними найпростішими методами. Усі методи стилостатистики дають зрештою однаково безпристрасні, що ковзають поверхнею мови і чіпляються лише за суто зовнішні ознаки «об'єктивні» результати. Квантитативні методи, мабуть, не здатні орієнтуватися на якісні відмінності досліджуваного матеріалу і фактично нівелюють усі об'єкти, що вивчаються.

Там, де потрібна максимальна конкретизація, пропонуються максимально узагальнені критерії; якісні характеристики виражаються мовою кількості. Тут як логічне протиріччя, а й незгоду з природою речей. Справді, що вийде, якщо ми спробуємо отримати порівняльну стилістичну (тобто, отже, якісну) характеристику творів Олександра Герасимова та Рембрандта на підставі кількісного відношення червоної та чорної фарби на їхніх полотнах? Мабуть, абсолютна нісенітниця. Якою мірою цілком «об'єктивні» квантитативні відомості про фізичні дані людини здатні дати нам уявлення про все те, що характеризує людину і становить її справжню сутність? Очевидно, у жодній. Вони можуть бути лише індивідуальною ознакою, що відрізняє одну людину від іншої, на кшталт відбитка звивин на великому пальці руки. Аналогічно і з квантитативними характеристиками літературного стилю. Якщо уважно розібратися, то вони дають настільки ж убогі дані для судження про дійсні стилістичні<122>якості мови автора, як і опис звивин на пальці для вивчення психології людини.

До всього сказаного слід додати, що в так званій формальній школі літературознавства вже робилася спроба квантитативного дослідження стилю письменників, коли проводилися підрахунки епітетів, метафор, ритмо-мелодійних елементів вірша. Однак ця спроба не набула свого подальшого розвитку.

Інший напрямок застосування математичних методів для вивчення мовних явищ можна об'єднати під ім'ям лінгвостатистики. Воно прагне вторгнутися до основних питань теорії мови і таким чином отримати покликання у власне лінгвістичній сфері. Для ознайомлення з цим напрямком найкраще звернутися до вже згадуваної роботи Хердана, за висловом одного з її численних рецензентів, «жахливо претензійної книги» 7 5 , яка отримала, однак, широкий відгук серед мовознавців 7 6 . Зважаючи на те, що Хердан (на що вже вказувалося вище) прагнув зібрати у своїй книзі все найбільш суттєве в галузі застосування математичних методів до лінгвістичної проблематики, у його книзі ми фактично маємо справу не стільки з Херданом, скільки з цілим напрямком. Як показує сама назва книги - «Мова як вибір і ймовірність», - основна її увага спрямована на з'ясування того, що в мові надано вільному вибору мовця і що обумовлено іманентною структурою мови, так само, як і визначення кількісного співвідношення елементів першого і другого порядку. Книга Хердана дає майже вичерпну інформацію про всі роботи в цій галузі, проведені представниками різних спеціальностей<123>(філософами, лінгвістами, математиками, техніками), але не обмежується цим і включає багато оригінальних спостережень, міркувань та висновків самого автора. Як підсумовуючий праці вона дає гарне уявлення про застосовувані квантитативні методи, і про результати, що досягаються з їх допомогою. Питання, які ми умовно поєднуємо в розділ лінгвостатистики, трактуються у другій та четвертій частинах книги.

З багатьох випадків застосування методів математичної статистики до вивчення лінгвістичних питань ми зупинимося на найбільш загальних, які одночасно можна розглядати і як найбільш типові. Використовуючи дані інших авторів - Болдріні 7 7 , Матезіуса 7 8 , Маріотті 7 9 , Ципфа 8 0 , Діуей 8 1 та ін., а також наводячи власні дослідження, що визначають відносну частоту розподілу фонем, літер, довжини слів (вимірювану кількістю літер і складів), граматичних форм і метричних елементів та грецькому гекзаметрі, Хердан встановлює факт стабільності відносної частоти мовних елементів як загальну характеристику всіх лінгвістичних структур. Він виводить таке правило: «Пропорції лінгвістичних елементів, що належать тому чи іншому рівню чи сфері лінгвістичного кодування - фонології, граматиці, метриці, - залишаються більш менш постійними для даної мови, в даний період її розвитку і в межах досить великих і неупереджено проведених спостережень » 8 2 . Це правило, яке Хердан називає основним законом мови, він прагне певним чином витлумачити і розширити. «Він, – пише Хердан про цей закон, – є виразом факту, що навіть тут, де людській волі та свободі вибору надано<124>найширші рамки, де свідомий вибір і безтурботна гра жваво чергуються один з одним, загалом існує значна стабільність... Наші дослідження виявили ще один чинник загального порядку: далекосяжна схожість між членами одного мовного колективу спостерігається не тільки в системі фонем, у словнику та у граматиці, але також і щодо частоти вживання конкретних фонем, лексичних одиниць (слів) та граматичних фонем та конструкцій; інакше кажучи, подібність у тому, що використовується, а й у тому, як часто використовується» 8 3 . Таке становище обумовлюється зрозумілими причинами, але це дає привід нових висновків. При дослідженні різних текстів або відрізків цієї мови, наприклад, виявляється, що відносні частоти використання цієї конкретної фонеми (або інших мовних елементів) різними людьми залишаються в основному одними і тими самими. Це і призводить до тлумачення індивідуальних форм мовлення як деяких коливань постійної ймовірності вживання аналізованої фонеми у цій мові. Таким чином виходить, що у своїй мовній діяльності людина підпорядкована певним законам ймовірності щодо кількості лінгвістичних елементів, що використовуються. А тоді, коли ми спостерігаємо величезну кількість лінгвістичних елементів у великій сукупності текстів або мовних відрізків, у нас складається враження причинної залежності в тому сенсі, що в даному випадку має місце також детермінування щодо використання певних лінгвістичних елементів. Іншими словами, виявляється допустимим стверджувати, що те, що з інтуїтивної точки зору є причинним ставленням, у квантитативному плані є ймовірністю 8 4 . При цьому очевидно, що чим більше сукупність<125>ність обстежуваних текстів чи мовних відрізків, тим виразніше виявлятиметься стабільність відносної частоти вживання мовних елементів й у індивідуальному використанні (закон великих чисел). Звідси робиться новий загальний висновок про те, що мова є масовим явищем і повинна трактуватися як така.

Зазначені висновки, досягнуті на підставі частотних обчислень фонетичних елементів, слів і граматичних форм, які в сукупності складають мову, застосовуються потім до «статистичної інтерпретації» поділу, що проводиться Соссюром, на «мову» (lalangue) і «мова» (laparole). За Соссюр, «мова» є сукупність лінгвістичних звичок, які уможливлюють спілкування між членами даного мовного колективу. Це соціальна реальність, «масове явище», обов'язкове для всього, хто говорить цією мовою народу. Хердан, як вказувалося, доводить, що члени єдиного мовного колективу схожі один з одним не тільки тим, що використовують одні й ті ж фонеми, лексичні одиниці та граматичні форми, а й тим, що всі ці елементи використовуються з однаковою частотою. Таким чином, статистичне визначення «мови» набуває у неї такої форми: «мова» (lalangue) є сукупність загальних лінгвістичних елементів плюс їх відносна ймовірність вживання.

Таке визначення «мови» є вихідним і для відповідного статистичного тлумачення «мови», яка, згідно з Соссюром, є індивідуальним висловом. Протиставляючи «мова» як соціальне «мови» як явище індивідуальному, Соссюр писав: «Мова є індивідуальний акт волі й розуміння, у якому слід розрізняти: 1. комбінації, з яких мовний суб'єкт користується мовним кодексом із єдиною метою висловлювання своєї особистої думки; 2. психофізичний механізм, що дозволяє йому об'єктивувати ці комбінації» 85. Оскільки «мова» в лінгвостатистиці розглядається як сукупність елементів з певною відносною<126>ної ймовірністю їх вживання, остільки він включає в себе як суттєву характеристику статистичну сукупність або ансамбль (популяцію) і може розглядатися в цьому аспекті. Відповідно до цього «мова» перетворюється на окрему вибірку, взяту з «мови» як статистичної сукупності. Імовірність у разі обумовлюється ставленням «мови» до «мови» (у тому «квантитативному» розумінні), а розподіл відносної частоти вживання різних елементів мови тлумачиться як наслідок колективного «вибору» (choice) у певний хронологічний період існування мови. Розуміючи, що таке трактування відмінностей «мови» і «мови» будується все-таки на зовсім інших підставах, ніж у Соссюра, Хердан пише у зв'язку з цим: «Це, мабуть, незначна модифікація концепції Соссюра має те важливе наслідок, що «мова» ( lalangue) нині набуває суттєвої характеристики у вигляді статистичної сукупності (популяції). Ця популяція характеризується певними відносними частотами чи ймовірностями коливань, маючи на увазі, що кожен лінгвістичний елемент відноситься до певного лінгвістичного рівня. У цьому випадку "мова" (laparole) відповідно до свого значення виявляється терміном для визначення статистичних вибірок, взятих з "мови" як статистичної сукупності. Стає очевидним, що вибір (choice) виступає тут як ставлення «мови» до «мови», будучи ставленням взятої навмання вибірки до статистичної сукупності (популяції). Сам порядок розподілу частоти, як відкладення мовної діяльності мовного колективу протягом століть, є елементом вибору (choice), але з індивідуального вибору, як і стилі, а колективного вибору. Використовуючи метафору, ми можемо тут говорити про вибір, зроблений духом мови, якщо розуміємо під цим принципи лінгвістичної комунікації, які у відповідність до комплексом психічних даних членів конкретного мовного колективу. Стабільність серій є результатом ймовірності (chance)» 8 6 .

Приватним випадком застосування викладеного принци<127>па є відмежування у мові нормативних явищ від «виключень» (відхилень). У лінгвостатистиці стверджується, що статистичний метод дозволяє усунути нечіткість, що існує в даному питанні, і встановити ясні критерії для розмежування зазначених явищ. Якщо під нормою розуміється статистична сукупність (у вищезгаданому сенсі), а винятком (або помилкою) - відхилення від частот, що показуються статистичною сукупністю, квантитативне вирішення питання напрошується само собою. Тут усе зводиться до статистичних відносин між «популяцією» та «відхиленням». Якщо частоти, що спостерігаються в окремій вибірці, відхиляються від ймовірностей, зумовлених статистичною сукупністю, більш ніж це визначається серією вибіркових підрахунків, то ми маємо підставу укладати, що демаркаційна лінія між «тим самим» (нормою) і «не тим самим» (Винятком) виявляється порушеною.

Квантитативні відмінності між «мовою» та «мовленню» використовуються і для розмежування мовних елементів двох типів: граматичних та лексичних. Вихідним моментом для вирішення цієї задачі, що представляє з лінгвістичної точки зору часто великі труднощі, є припущення, що рівень величини частотності граматичних елементів інший, ніж у лексичних одиниць. Це нібито пов'язують із «узагальненістю» граматичних елементів, що вони відрізняються від понять, фіксованих лексичними одиницями. Крім того, граматичні елементи нібито, як правило, значно менші за своїм обсягом: як самостійні слова (до них зараховуються займенники, прийменники, спілки та службові слова) вони зазвичай складаються з малої кількості фонем, а у вигляді «пов'язаних форм» - з однієї або двох фонем 8 7 . Чим менший лінгвістичний елемент, тим менш здатна його «довжина» (кількісний момент) служити як визначальна характеристика і тим більше значення набуває для цієї мети «якість» фонем. Які ж методи пропонуються для вирішення проблеми? Вона вирішується через звернення до суто квантитативного поняття граматичної.<128>навантаження, «Припустимо, - пише у зв'язку з цим Хердан, - що нас цікавить порівняння у зазначеному відношенні двох мов. Як ми визначаємо з певним ступенем об'єктивності «граматичне навантаження», яке несе мову? Зрозуміло, що це навантаження залежатиме від положення демаркаційної лінії, що відмежовує граматику від лексики. Перше міркування, яке може спасти при цьому нам на думку, полягає в тому, щоб визначити, наскільки «складна» граматика цієї мови. Адже «складність» – якісна характеристика, а поняття «граматичного навантаження» є кількісною характеристикою. Щоправда, навантаження до певної міри залежить від складності, але не цілком. Мова може бути нагороджена надзвичайно складною граматикою, але в діяльності мови набуває застосування лише порівняно невелика її частина. Ми визначаємо «граматичне навантаження» як сукупність граматики, яку несе мова, коли він перебуває в дії, що зараз переводить нашу проблему в область структуральної лінгвістики в тому сенсі, в якому ця дисципліна була визначена Соссюр. У наступному викладі застосовуються квантитативні методи визначення різниці мов залежно від цього, де проходить кордон, поділяюча граматику від лексики» 8 8 . Іншими словами, відмінності мов у даному випадку мають бути зведені до відмінностей числових відносин між граматичними та лексичними елементами.

Наявні у нашому розпорядженні матеріали малюють таку картину. В англійській мові (враховувалися лише «граматичні слова»: займенники, або, як вони також називаються, «заступники», прийменники, спілки та допоміжні дієслова) у відрізку, що включає 78633 випадки вживання всіх слів (1027 різних слів), було виявлено 53 102 випадку вживання граматичних елементів, або, точніше, «граматичних слів» (149 різних слів), що становить 67,53% при 15,8% різних слів. Такі дані Діуей 8 9 . Інші дані показують інше відсоткове<129>співвідношення: 57,1% при 5,4% різних слів 9 0 . Така значна розбіжність пояснюється різницею письмової та усної мови. Письмові форми мови (перші дані) використовують нібито більше граматичних елементів, ніж усні (другий випадок). У «Божественній комедії» Данте (італійським оригіналом) Маріотті встановив 54,4% випадків вживання «граматичних слів».

Інший і, мабуть, досконаліший спосіб визначення граматичного навантаження мови полягає в підрахунку фонем, що входять до граматичних елементів. У разі враховуються як самостійні граматичні слова, а й пов'язані форми. Тут можливі різні варіанти. Наприклад, визначення відносної частоти вживання окремих приголосних фонем у граматичних елементах та зіставлення їх із частотою сумарного вживання цих же фонем (підсумкові дані такого співвідношення в англійській мові дають пропорцію 99,9% до 100000 - сумарного вживання); або подібне зіставлення згодних за окремими класифікаційними групами (лабіальні, палатальні, велярні та інші фонеми). Підсумкове співвідношення тут набуває форми пропорції 56,47% (у граматичних елементах) до 60,25% (у сумарному вживанні); або таке ж зіставлення початкових приголосних фонем (у разі сталося співвідношення 100,2% у граматичних словах до 99,95 - у сумарному вживанні). Можливі й інші складніші статистичні операції, які, проте, у результаті дають подібні квантитативні висловлювання досліджуваної проблеми.

Наведені квантитативні дані є підставою для загального висновку. Він зводиться до того що, що розподіл фонем у граматичних елементах обумовлює характер розподілу (у числовому, звісно, ​​вираженні) фонем у мові загалом. А це в свою чергу дозволяє зробити висновок, що вживання граматичних елементів найменше залежить від індивідуального вибору і становить ту частину лінгвістичного виразу, яка контролюється ймовірністю<130>ністю. Цей умоглядний висновок підтверджується підрахунком граматичних форм у російській мові, зробленим Есселсоном 9 1 . Дослідженню було піддано 46896 слів, взятих з II джерел (твори Грибоєдова, Достоєвського, Гончарова, Салтикова-Щедріна, Гаршина, Бєлінського, Амфітеатрова, Гусєва-Оренбурзького, Еренбурга, Симонова та Н. Островського). Вони були поділені на розмовні слова (17756 слів, або 37,9%) та нерозмовні (29140 слів, або 62,1%). Потім вся сукупність слів була поділена на 4 групи в залежності від їх граматичного характеру: до 1-ї групи увійшли іменники, прикметники, прикметники до функцій іменників, займенники та схильні числові; у 2-у групу – дієслова; в 3-ю групу - віддієслівні дієприкметники, дієприкметники у функції прикметників і іменників та дієприслівника; в 4-у групу - незмінні форми прислівника, прийменники, спілки та частки. Сумарні результати (наводяться також таблиці з даними щодо окремих авторів) дають таке співвідношення:

1-я група

2-я група

3-я група

4-я група

розмовні.

нерозмовний.

Хердан такими словами характеризує розгляд отриманих таким чином квантитативних даних: «Вони виправдовують висновок, що граматичні елементи слід розглядати як фактор, що зумовлює ймовірність лінгвістичного вираження. Такий висновок дозволяє уникнути обтяжливої ​​кваліфікації кожного слова, що вживається. Цілком очевидно, що оскільки граматика і лексика не зберігаються у водонепроникних оболонках, ні та й інша не є чистим «вибором» (choice) або чистою «імовірністю» (chance). І граматика і лексика містять обидва елементи, хоча й у пропорціях, що значно варіюються» 9 2 .<131>

Великий розділ книги Хердана присвячений дослідженню у мові двоплановості чи двоїстості (duality), причому саме поняття двоїстості ґрунтується на математичних характеристиках.

Так, теореми в проективній геометрії можна розташовувати в два ряди, так що кожна теорема одного ряду може бути отримана з деякої теореми іншого ряду шляхом заміни один на одного слів крапкаі пряма.Наприклад, якщо дано положення: «будь-які різні точки належать одній і тільки одній прямій», то ми можемо з нього вивести співвіднесене йому положення: «будь-які дві різні прямі належать одній і тільки одній точці». Іншим методом визначення двоїстості є нанесення по осі абсцис та осі ординат різних планів досліджуваного явища. Так, як це, наприклад, робить Юл 9 3 , по осі абсцис відлічуються різні частоти вживання, а по осі ординат - кількість лексичних одиниць, у яких визначається частотність і т. д. Так трактується поняття двоїстості, нібито рівною мірою застосовується лінгвістичним дослідженням.

Під певне таким чином поняття двоїстості, яке у всіх випадках фактично має характер бінарного коду і яке також вважається найістотнішою рисою мовної структури, підводяться надзвичайно різноякісні явища, що допускають протилежність за двома планами: розподіл вживання слів відповідно до характеру лексичних одиниць та розподіл лексичних одиниць відповідно до частоти вживання слів; письмову та розмовну форми мови; лексичні та граматичні елементи; синоніми та антоніми; фонема та її графічне зображення; обумовлене та визначальне (соссюрівські signifiantиsignifiй) і т.д.

Після квантитативного дослідження двоїстості тієї чи іншої приватного, мовного явища чи обмеженого «тексту», зазвичай, робиться висновок, якому приписуються якості лінгвістичної універсальності. Характер подібних висновків та спосіб їх обґрунтування можна простежити на прикладі<132>дослідження двоїстості слова та поняття (фактично ж йдеться про співвідношення довжини слова та обсягу поняття - треба мати на увазі, що надзвичайно вільне вживання лінгвістичних та інших термінів у подібних роботах часто дуже ускладнює розуміння). Важливо при цьому відзначити, що як матеріал, що послужив джерелом спостережень даного виду лінгвістичної двоїстості, були використані: міжнародна номенклатура хвороб (близько 1000 назв) та загальний регістр захворювань по Англії та Уеллсу за 1949 р. У цьому випадку робиться наступний загальний висновок: « Кожне поняття, що означає загальну ідею, має те, що можна назвати "сферою" або "обсягом". Воно дозволяє через своє посередництво думати про багато предметів чи інші поняття, що знаходяться всередині його «сфери». З іншого боку, всі предмети, необхідні визначення поняття, становлять те, що називається його «змістом». Обсяг і змістом взаємно співвідносні - що менше зміст і що більш абстрактне поняття, то більше вписувалося його сфера чи обсяг, т. е. тим більше об'єктів підводиться під нього. Це можна як аналогію (в понятійної сфері) принципам кодування, відповідно до яких довжина символу і частота вживання взаємозалежні» 9 4 .

Принцип двоїстості застосовується до приватних проблем. Наприклад, при встановленні еквівалентності значень слів двох різних мов. У результаті вивчення англо-німецького словника Мюре - 3андерса із застосуванням математичного методу ітерацій робиться висновок, що ймовірність вживання англійського слова з одним або більше значенням у німецькому перекладі залишається постійною для кожної початкової літери у всьому словнику 9 5 . Розгляд порядку розташування слів у китайських словниках призводить до висновку, що він носить таксономічний характер, оскільки кількість рис в ієрогліфі вказує його місце (як самостійного радикала чи певного підкласу, що підкоряється радикалу). Таксономія є супідрядний принцип класифікації, що застосовується в зоології та ботаніці. Хердан стверджує, що<133>основи китайської лексикографії також будуються на засадах таксономії 9 6 і т.д.

Роблячи загальну оцінку даного напряму застосування математичних методів до вивчення лінгвістичних проблем (тобто лінгвостатистики), необхідно, мабуть, виходити з того положення, яке було сформульовано Еттінгер: «Математика може бути ефективно використана на службі лінгвістики тільки тоді, коли мовознавцям будуть зрозумілі реальні межі її застосування, як і можливості використовуваних математичних моделей» 9 7 . Іншими словами, про математичну лінгвістику може йтися тоді, коли математичні методи доведуть свою придатність для вирішення тих власне лінгвістичних завдань, які у своїй сукупності становлять науку про мову. Якщо ж цього немає, хоча при цьому, можливо, і відкриваються нові аспекти наукового дослідження, то в такому випадку можна говорити про що завгодно, але тільки не про лінгвістику - в даному випадку маються на увазі різні види прикладної лінгвістики (про неї ще буде мова нижче), а наукове, чи теоретичне, мовознавство. Виходячи з цієї позиції, слід зазначити, що з погляду лінгвіста багато в лінгвостатистиці викликає сумнів і навіть подив.

Звернемося до розбору лише двох прикладів (щоб не захаращувати викладу), обмовившись, що дуже суттєві заперечення можна зробити для кожного з них. Ось перед нами квантитативне розмежування граматичних та лексичних одиниць. Виявляється, для того, щоб зробити таке розмежування, необхідно вже заздалегідь знати, що відноситься до галузі граматики, а що - до лексики, оскільки «граматичне навантаження» мови (тобто сукупність вживаних у мові граматичних елементів), як вказується в наведена вище цитата, «залежить від демаркаційної лінії, що відмежовує лексику від граматики». Не знаючи, де пролягає ця лінія, не можна, отже, провести зазначеного розмежування. У чому тоді сенс квантитативного методу розмежування лексичного від грам<134>матичного? Втім, що стосується Хердана, то він особливо не замислюється над цим питанням і сміливо класифікує мовні елементи, відносячи до граматичних елементів «пов'язані форми», під якими, судячи з викладу, слід розуміти зовнішню флексію, та «граматичні слова», куди ставляться прийменники , Спілки, допоміжні дієслова і займенники - останні тому, що є «заступниками». Але якщо говорити тільки про цю якість займенників і на цій підставі відносити їх до граматичних елементів, то тоді до них, очевидно, слід віднести і такі слова, як «згаданий вище», «названий», «даний» і т. д., так як вони теж виступають як заступники. У зв'язку з застосовуваним у лінгвостатистиці способом виділення граматичних елементів природно виникає питання, як же чинити в цьому випадку з такими «граматичними явищами, що не мають виду», як порядок слів, тони, нульові морфеми, парадигматичні відносини (частина цих явищ, до речі кажучи, знаходить відображення й у мовах, які досліджуються математичними методами)? Як проводити розмежування в мовах з багатою внутрішньою флексією (як, наприклад, у семітських мовах), де вона здійснює не лише граматичну модифікацію кореня (радикала), а й повідомляє йому лексичне існування, оскільки корінь без перегласувань не має реального існування у мові? Що слід розуміти під граматичною складністю мови, яким критерієм вона визначається? Якщо кількісним моментом, який у цьому випадку всіляко підкреслюється, тоді однією з найскладніших у граматичному відношенні мов виявиться англійська, що володіє такими конструкціями, як IshallhavebeencallingабоHewouldhavebeencalling. У цих реченнях тільки call можна віднести до лексичного, а все інше, отже, слід вважати граматичним. Які є підстави пов'язувати частотність вживань граматичних елементів із узагальненістю чи абстрактністю значень граматичних слів? Адже цілком очевидно, що відносно велика частота вживання граматичних елементів визначається їхньою функцією у побудові речень, а щодо абстрактності значень, то дуже просто знайти велике<135>кількість лексичних елементів, які легко в цьому відношенні можуть змагатися з граматичними елементами, багато в чому поступаючись їм частотністю (наприклад, буття, існування, довжина, простір, субстанціяі т.д).

Подібного роду безглуздя постають перед нами і у випадку з визначенням двоїстості (duality) слова і поняття. Треба мати надзвичайно своєрідне розуміння структурної сутності мови, щоб піддавати її дослідженню, користуючись номенклатурою хвороб та лікарняним регістром захворювань, що, як зазначалося вище, послужило вихідним матеріалом для вельми відповідальних лінгвістичних висновків. Не зупиняючись на абсолютно неясному вживанні таких термінів, що не мають лінгвістичного буття, як сфера, обсяг і зміст поняття (до речі кажучи, при цьому грубо плутаються лексичне значення слова і поняття, що позначається науковим терміном), звернемося до висновку, яке в цьому випадку робиться. Як зазначалося вище, ми маємо справу із твердженням, що «обсяг та зміст взаємно співвідносні». Весь хід міркування, який дає підставу для такого висновку, так само як і спосіб математичного оперування мовними фактами, чітко показує, що в цьому випадку зовсім не враховується одна дуже істотна якість мови, яка перекидає всі розрахунки, що проводяться: здатність виражати одне і те ж зміст» лінгвістичними одиницями різного «об'єму», які безперечно володіють до того ж різною відносною частотою вживання. Так, одне й те саме обличчя ми можемо позначити як Петров, мій знайомий, він, москвич, юнак, співробітник університету, брат моєї дружини, людина, яку ми зустріли на мосту, і т. д. У світлі подібних фактів сумніви викликають не лише окремі висновки, яким, проте, як зазначалося, надається універсальне значення, а й доцільність застосування самих квантитативних методів до подібних лінгвістичних проблем.

Але іноді лінгвістам пропонуються висновки, справедливість яких не викликає жодного сумніву. Таким є «основний закон мови», який полягає в тому, що в мові спостерігається певна стабільність її елементів і відносної частоти їх упо<136>вимоги. Біда подібних відкриттів полягає, однак, у тому, що вони давно відомі лінгвістам. Адже цілком очевидно, що якби мова не мала відомої стабільності і кожен член даного мовного колективу вільно варіював елементи мови, то не було б можливо взаємне спілкування і саме існування мови стало б безглуздим. А щодо розподілу відносної частоти вживання окремих елементів мови, то вона знайшла своє вираження в мовознавстві у вигляді виділення категорій пасивної та активної лексики та граматики, чому так багато приділяв уваги Л. В. Щерба. У цьому випадку статистичні методи можуть надати допомогу лінгвістам лише у розподілі конкретних мовних елементів за розрядами відносної частоти їх вживання, але з жодних підстав претендувати на відкриття якихось нових закономірностей, які мають цінність для теоретичної лінгвістики.

З іншого боку, лінгвостатистика пропонує ряд справді «оригінальних» висновків, які є надзвичайно показовими для характеру наукового мислення її адептів. Так, складними статистичними методами досліджується «політична лексика» у працях Черчілля, Бенеша, Халіфакса, Штреземана та інших, причому у підрахунках для неангломовних авторів використовуються переклади їхніх робіт англійською мовою. Результати підрахунків представлені у вигляді численних таблиць, математичних формул та рівнянь. Лінгвістична інтерпретація квантитативних даних у цьому випадку зводиться лише до того, що вживання Черчіллем «політичної лексики» є найбільш типовим (?) для цієї групи авторів і що використання Черчіллем слів у тих випадках, коли він стосується політичних питань, типово для англійського мовного колективу 9 8 .

В іншому випадку після відповідних статистичних маніпуляцій робиться висновок, що Гітлер у слововжитку нацистської Німеччини порушив двоїстість між «мовою» та «мовою» у квантитативному розумінні цих термінів. Приватним випадком знищення цієї двоїстості є буквальне розуміння<137>ня метафоричних оборотів (наприклад, «сипати сіль у відкриті рани»). Нацистська Німеччина затаврувала себе такою кількістю нелюдських вчинків, що навряд чи є потреба викривати її і в цьому лінгвістичному лиходійстві 9 9 . До порушення лінгвістичної двоїстості веде, як стверджує Хердан, і визначення Марксом мови як безпосередньої дійсності думки, а закон діалектики про перехід явища у свою протилежність є, на його думку, неправильно зрозумілий лінгвістичний закон двоїстості мови 100 . Подібні інтерпретації говорять самі за себе.

Нарешті, загальним недоліком, властивим усім наведеним випадкам квантитативного способу вивчення лінгвістичного матеріалу і тим самим набуває методологічного характеру, є підхід до мовних елементів як до механічної сукупності абсолютно незалежних один від одного фактів, відповідно до чого, якщо при цьому і розкриваються які- чи закономірності, всі вони ставляться лише до числовим відносинам розподілу автономних фактів, поза їх системних залежностей. Щоправда, Дж. Уотмоу всіляко прагне запевнити, що саме математика краще, ніж будь-який вид лінгвістичного структурного аналізу, здатна розкрити структурні особливості мови. «Сучасна математика, - пише він, - займається не виміром і обчисленням, точність яких за своєю природою обмежена, але в першу чергу структурою. Ось чому математика найвищою мірою сприяє точності вивчення мови - такою мірою, на яку не здатний роздільний опис, ще більш обмежений за своєю природою... Так само як у фізиці математичні елементи використовуються для опису фізичного світу, оскільки передбачається, що вони відповідають елементам фізичного світу, і у математичної лінгвістиці математичні елементи імовірно повинні відповідати елементам світу промови» 1 01 . Але така постановка питання аж ніяк не рятує положення, тому що в кращому випадку вона може<138>дати аналіз мови або як фізичної структури, що для мови ще далеко не достатньо, і в кінцевому рахунку носить все той же механістичний характер, або як логіко-математичної структури, а це переносить мову в іншу і багато в чому чужу йому площину 102. Не зайве при цьому відзначити, що успіхи математичної лінгвістики Уотмоу передбачає тільки в майбутньому, а щодо їхніх реальних результатів, то він дає їм оцінку в наступних словах: «...майже вся робота, виконана нині Херданом, Ципфом, Юлом, Гіро (Guiraux) та іншими, знаходиться аж ніяк не за межами критики як з боку лінгвістики, так і математики; вона значною мірою віддає любительщиною »103. Таким чином, якщо не намагатися передбачати майбутнє математичних методів у лінгвістичних дослідженнях, а постаратися по заслугах оцінити те, чим ми маємо на сьогоднішній день, то за потребою доведеться визнати, що математика фактично поки що обмежувалася в галузі мовознавства лише «вимірюванням та підрахунком», а якісного аналізу мови, що вникає у його структуру, не змогла дати.<139>

Постараємося все ж таки бути максимально об'єктивними. У відомій своїй частині квантитативні дані, мабуть, можуть бути використані лінгвістикою, але лише як допоміжні переваги в проблемах, що мають практичну спрямованість. Щодо більшої частини квантитативних способів вивчення окремих лінгвістичних явищ, безсумнівно, виправдано загальний висновок Р. Брауна: «Їх можна розглядати так, як їх розглядає Хердан, але який сенс всього цього?». 1 04 . Уявімо, що ми ставимо питання: «Що являють собою дерева в цьому саду?». І у відповідь отримуємо: "У цьому саду сто дерев". Хіба це відповідь на наше запитання і чи справді вона має сенс? Адже щодо багатьох лінгвістичних питань математичні методи дають саме такі відповіді.

Однак існує широка галузь дослідницької діяльності, яка використовує переважно математичні методи і в той же час орієнтує їх на мовний матеріал, де доцільність такого об'єднання не викликає жодного сумніву. «Сенс» цієї дослідницької діяльності, її значущість обумовлюється тими цілями, яких вона прагне. Вона вже апробована практикою. У цьому випадку йдеться про проблеми, пов'язані зі створенням інформаційних машин, конструкцій для машинного перекладу письмових наукових текстів, автоматизацією перекладу мовлення з однієї мови на іншу і з усім тим комплексом завдань, які поєднуються в лінгвістичних питаннях кібернетики. Всій сукупності подібних проблем зазвичай надають загальну назву прикладної лінгвістики. Тим самим вона відмежовується від так званої математичної лінгвістики, що включає ті напрямки роботи, які були позначені як стилостатистика і лінгвостатистика, хоча аж ніяк не уникає статистичної обробки лінгвістичного матеріалу. Мабуть, найбільш важливою рисою прикладної лінгвістики, що відокремлює її від математичної лінгвістики, як вона описувалася вище, є те, що перша має зворотну спрямованість: не математика для лінгвістики, але лінгвістика<140>(формалізована математичними методами) для широкого набору практичних завдань.

Немає потреби розкривати зміст окремих проблем, що включаються нині в надзвичайно широку область прикладної лінгвістики. На противагу математичній лінгвістиці ці проблеми активно обговорюються в радянській лінгвістичній літературі і справедливо починають займати все більш чільне місце в науковій проблематиці дослідних інститутів 105 . Таким чином вони вже досить відомі нашій лінгвістичній громадськості. Ця обставина, однак, не звільняє нас від необхідності їх осмислення, зокрема, з погляду принципів науки про мову. Це, безперечно, допоможе усунення непорозумінь, які все частіше й частіше виникають між представниками дуже далеких один від одного наук, що беруть участь у роботі над проблемами прикладної лінгвістики, і намітить шляхи їх зближення, з одного боку, і розмежування областей дослідження, з іншого боку. Само собою зрозуміло, що нижченаведені міркування будуть представляти точку зору лінгвіста, і необхідно, щоб математики не тільки постаралися її засвоїти, але у зв'язку з питаннями, що піднімаються, дали їм своє трактування.

Лінгвіста-теоретика ніяк не може задовольнити ту обставину, що у всіх випадках дослідження є<141>лень мови у тих цілях, які ставляться прикладною лінгвістикою, основою їх є математична модель. Відповідно до цього спостереження над явищами мови та одержувані при цьому результати виражаються в термінах та поняттях математики, тобто за допомогою математичних рівнянь та формул. Звернемося для наочності наприклад. Кондон 106 і Ципф 107 встановили, що логарифми частоти ( f) Вживання слів у тексті великого обсягу розташовуються майже на прямій лінії, якщо на діаграмі співвіднести їх з логарифмами рангу або розряду ( r) цих слів. Рівняння f = c: r,де зє константою, відбиває це ставлення у тому обмеженому значенні, що c: rдля заданого значення rз великою наближеністю відтворює частоту, що спостерігається. Відношення між fі r,виражене математичною формулою, є моделлю для відносин між значеннями частоти вживання, що спостерігаються, і рангу, або розряду, слів. Такий один із випадків математичного моделювання. 

Вся теорія інформації цілком базується на математичній моделі процесу комунікації, розробленої К. Шенноном 108 . Вона визначається як «математична дисципліна, присвячена способам обчислення та оцінки кількості інформації, що міститься в будь-яких даних, та дослідженню процесів зберігання та передачі інформації» (БСЕ, т. 51, стор 128). Відповідно і основні поняття теорії інформації одержують математичний вираз. -або коду і середньою кількістю переданої ін<142>формації. Надмірність виражається у відсотках до загальної передавальної здатності коду» 1 09 та ін. Так само і для машинного перекладу необхідна алгоритмічна розробка відображення елементів однієї мови в іншій і т. д. 1 10 . Такими є інші випадки моделювання.

Використання моделей поза всяким значенням може надати дуже істотну допомогу, зокрема, ймовірно, при вирішенні тих завдань, які ставить перед собою прикладна лінгвістика. Однак для теоретичного мовознавства дуже суттєвою є та обставина, що абстрактна модель, як правило, не відтворює всіх особливостей дійсного явища, всіх його функціональних якостей. Так, архітектор, перед тим як побудувати будинок, може створити його модель, що відтворює у всіх найдрібніших деталях проектований будинок, і це допомагає йому вирішити низку практичних питань, пов'язаних із будівництвом самого будинку. Але така модель будинку, якою б вона не була точною, позбавлена ​​тієї «функції» і того призначення, заради чого будуються взагалі всі будинки - вона не здатна забезпечити людину житлом. Аналогічно і з мовою, де модель не завжди здатна відтворити всі його якості. У цьому випадку справа ускладнюється ще й тим, що для побудови моделі використовуються не власне лінгвістичні, а математичні мірила. «Математичні моделі...- пише А. Еттінгер, - відіграють надзвичайно важливу роль у всіх галузях техніки, але оскільки вони є знаряддям синтезу, їх значення для лінгвістики, що є насамперед історичною та описовою дисципліною, природно має обмежений характер» 1 11 .<143>

Математичне моделювання мови фактично застосовується тільки до його статичного стану, який для мовознавця є умовним і насправді перебуває у прямому протиріччі з основною якістю мови, самою формою існування якої є розвиток. Само собою зрозуміло, статичне вивчення мови аж ніяк не виключається і з мовознавства і є основою при складанні нормативних граматик та словників, описових граматик, практичних граматик та словників, що є посібником для практичного вивчення іноземних мов, і т. д. Однак у всіх таких роботах, мають переважно прикладний характер, мовознавці йдуть на свідоме обмеження поля дослідження і аж ніяк не заплющують очі на інші аспекти мови 1 12 . При статичному розгляді мови, зокрема, цілком зникають з поля зору дослідника такі якості мови, пов'язані з його динамічним характером, як продуктивність, залежність від форм мислення, широка взаємодія з культурними, соціальними, політичними, історичними та іншими факторами. Тільки в плані синхронічному можна мову розглядати як систему умовних знаків або кодів, що, однак, виявляється абсолютно неправомірним, як тільки ми стаємо більш динамічною для точки зору мови. Саме в процесах розвитку проявляються такі якості мови, як мотивованість, яка не має стабільних кордонів, багатозначність слів, неавтономність значення слова та його звукової оболонки, пов'язані з контекстом творчі потенції слова, а це все знаходиться в різкій суперечності з основними характеристиками коду або знака 1 13 . Очевидно, в прикладній лінгвістиці також можна відмислюватися від усіх цих якостей мови і в практичних цілях задовольнятися, так би мовити, «моментальним знімком» мови, який все ж таки здатний дати досить наближене уявлення про механізм його функції<144>нування. Однак кожен такий «моментальний знімок», якщо його розглядати як факт мови, а не як факт системи умовних кодів, має бути включеним у нескінченний процес руху, в якому мова завжди перебуває 1 14 . Його не можна вивчати поза тими конкретними умовами, які характеризують цей рух, що накладає свій відбиток на стан мови і зумовлює потенції подальшого її розвитку. Тут існує така сама різниця, як між моментальною фотографією людини та її портретом, написаним пензлем справжнього художника. У творі художника маємо узагальнюючий образ людини у всій своєрідності як його фізичного образу, а й внутрішнього духовного змісту. По художньому портрету ми можемо прочитати і минуле відображеної на ньому людини і визначити, на що вона здатна у своїх вчинках. А миттєва фотографія, хоч і здатна дати більш точне зображення зовнішності оригіналу, позбавлена ​​цих якостей і нерідко фіксує і випадковий прищ, що схопився на носі, і<145>абсолютно нехарактерну позу або вираз, що зрештою призводить до спотворення та оригіналу.

Слід зазначити, що спосіб «моментальних знімків» можна, звичайно, застосовувати і до фактів розвитку мови. Але в цьому випадку ми насправді матимемо справу тільки з окремими станами мови, які за квантитативною своєю характеристикою виявляються пов'язаними не більшою мірою, ніж порівняльна квантитативна характеристика різних мов. Подібного роду квантитативна «динаміка» нічого органічного не укладатиме в собі, і зв'язок окремих станів мови буде лежати лише на зіставленні числових відносин. Якщо й у разі вдаватися до аналогії, можна послатися зростання дитини. Його розвиток, зрозуміло, можна у вигляді динаміки числових даних про його вагу, зростання, змінних відносин обсягу частин його тіла, але всі ці дані абсолютно відхилені від усього того, що в першу чергу становить індивідуальну сутність людини - її характеру, нахилів, звичок , смаки і т.д.

Іншою негативною стороною математичного «моделювання» мови є та обставина, що воно не може служити тим загальним принципом, на основі якого можна здійснити всебічний та всеосяжний – систематичний опис мови. Тільки математичний підхід до явищ мови, наприклад, не дасть можливості відповісти навіть на такі корінні питання (без яких немислиме саме існування науки про мову), як: що таке мова, які явища слід відносити до власне мовної, як визначається слово або речення, Які основні поняття та категорії мови та ін. Перш ніж звернутися до математичних методів дослідження мови, необхідно вже заздалегідь мати відповіді (хоча б і у формі робочої гіпотези) на всі ці питання. Немає потреби заплющувати очі на те, що у всіх відомих нам випадках дослідження мовних явищ математичними методами всі зазначені поняття та категорії неминуче доводилося приймати такими, як вони були визначені традиційними або, умовно кажучи, якісними методами.

Цю особливість математичних методів у їхньому лінгвістичному застосуванні відзначив Спанг-Ханссен, коли пі<146>сал: «Слід мати на увазі, що спостережені факти, що отримують квантитативний вираз... не мають цінності, якщо вони не становлять частини опису, а для лінгвістичних цілей це має бути систематичний опис, тісно пов'язаний з якісним лінгвістичним описом та теорією» 1 15 . В іншому виступі Спанг-Ханссена ми зустрічаємо уточнення цієї думки: «Доки не буде доведено можливість побудови квантитативної системи, і доти, доки існує загальноприйнята якісна система для даної галузі дослідження, частотні підрахунки та інші числові характеристики з лінгвістичної точки зору немає сенсу» 1 16 . Подібні ідеї висловлює і Улдалль, дещо несподівано пов'язуючи їх із розробкою, загальнотеоретичних основ глоссематики: «Коли лінгвіст вважає чи вимірює усе те, що вважає і вимірює, саме собою визначається не квантитативно; наприклад, слова, коли вони підраховуються, визначаються, якщо вони взагалі визначаються, в інших термінах» 1 17 .<147>

Таким чином виявляється, що як у теоретичному відношенні, так і в практичному їх застосуванні математичні методи знаходяться у прямій залежності від лінгвістичних понять та категорій, визначених традиційними, філологічними, або, як говорилося вище, якісними методами. У плані прикладного мовознавства важливим є усвідомлення цієї залежності, а отже, і знайомство з усією сукупністю основних категорій традиційної лінгвістики.

Ні, щоправда, жодних підстав дорікати представників точних наук, які працюють у галузі прикладної лінгвістики, у цьому, що де вони використовують даних сучасної лінгвістики. Це не відповідає дійсному стану речей. Вони не тільки добре знають, а й широко використовують у своїй роботі встановлені лінгвістами системи диференціальних ознак, властиві різним мовам, дистрибуцію та аранжування мовних елементів у межах конкретних мовних систем, досягнення акустичної фонетики тощо. Але в цьому випадку необхідне дуже суттєве застереження . Фактично представники точних наук користуються даними лише одного напряму в мовознавстві - так званої дескриптивної лінгвістики, яка свідомо відмежувалася від традиційних проблем теоретичного мовознавства, далеко не покриває собою всього поля лінгвістичного дослідження, з власне лінгвістичної точки зору має суттєві методичні недоліки, що і привело її кризі, що розкрилася останнім часом 1 18 , і, крім того, має суто практичну спрямованість, що відповідає інтересам прикладної лінгвістики. До дескриптивної лінгвістики застосовні всі застереження і закиди, які були зроблені на адресу статичного розгляду мови. Подібний односторонній підхід дескриптивної лінгвістики може, слідчий<148>Проте, виправдовуватися лише тими завданнями, які ставить собі прикладна лінгвістика, але не вичерпує всього змісту науки про мову.

У процесі розробки питань прикладного мовознавства можуть виникнути і вже виникли нові теоретичні проблеми. Деякі з цих проблем тісно пов'язані з конкретними завданнями прикладного мовознавства та спрямовані на подолання тих труднощів, які виникають під час вирішення цих завдань. Інші проблеми мають пряме відношення до теоретичного мовознавства, дозволяючи в новому аспекті поглянути на традиційні уявлення або відкриваючи нові галузі лінгвістичного дослідження, нові поняття та теорії. До цих останніх, наприклад, відноситься проблема створення «машинної» мови (або мови-посередника), яка найтіснішим чином пов'язана зі складним комплексом таких кардинальних питань теоретичного мовознавства, як взаємини понять і лексичних значень, логіки та граматики, діахронії та синхронії, знакової природи мови, сутності лінгвістичного значення, принципів побудови штучних мов тощо. 1 19 . У цьому випадку особливо важливо налагодити взаєморозуміння та співдружність у спільній роботі представників лінгвістичних дисциплін та точних наук. Щодо лінгвістичної сторони, то мова в даному випадку, мабуть, повинна йти не про те, щоб уже заздалегідь обмежувати зусилля, наприклад, конструкторів перекладацьких машин» і намагатися встановити робочі можливості подібних машин віршами М. Грибачова чи прозою В. Кочетова 1 20 . Машина сама знайде межі своїх можливостей, а рентабельність – межі її використання. Але мовознавці як свій внесок у спільну справу повинні внести своє знання особливостей структури мови, її багатогранності, внутрішніх перехрещуваних відносин її елементів, а також широких та багатосторонніх зв'язків мови з фізичними, фізіологічними, психічними та логічно<149>ми явищами, специфічними закономірностями функціонування та розвитку мови. Вся сукупність цих знань необхідна конструкторам відповідних машин, щоб не блукати в неправильних напрямках, але зробити пошуки цілеспрямованими та чітко орієнтованими. Навіть той досить короткий огляд випадків застосування математичних методів до лінгвістичної проблематики, який був зроблений у цьому нарисі, переконує, що такі знання аж ніяк не будуть зайвими для представників точних наук.

На підставі всіх викладених міркувань можна, очевидно, дійти деяких загальних висновків.

Отже, математична лінгвістика? Якщо під цим розуміється застосування математичних методів як універсальної відмички для вирішення всіх лінгвістичних проблем, такі претензії слід визнати абсолютно неправомірними. Все, що було зроблено у цьому напрямі, поки що дуже мало чи навіть зовсім не сприяло вирішенню традиційних проблем науки про мову. У гіршому випадку застосування математичних методів супроводжується очевидними безглуздями або з лінгвістичної точки зору є абсолютно безглуздим. У кращому разі математичні методи можуть бути використані як допоміжні прийоми лінгвістичного дослідження, будучи поставлені на службу конкретним та обмеженим за своїм характером лінгвістичним завданням. Ні про яку «квантитативну філософію мови» при цьому не може бути й мови. На самостійність науки про мову свого часу зазіхали і фізика, і психологія, і фізіологія, і логіка, і соціологія, і етнологія, але не змогли підкорити мовознавства. Сталося протилежне - мовознавство скористалося досягненнями цих наук й у потрібній собі стало користуватися їх допомогою, збагативши цим арсенал своїх дослідницьких прийомів. Тепер, мабуть, настала черга математики. Слід сподіватися, що ця нова співдружність також сприятиме зміцненню науки про мову, удосконаленню її робочих прийомів, збільшенню їх різноманіття. Про математичну лінгвістику, отже, правомірно такою ж мірою говорити, як і про фізичну лінгвістику, фізіологічну лінгвістику, логічну лінгвістику, психологічну лінгвістику та<150>т. д. Таких лінгвістик немає, є тільки одна лінгвістика, яка з користю для себе реалізує дані інших наук як допоміжні дослідницькі засоби. Таким чином, немає жодних підстав відступати перед натиском нової науки і легко поступатися їй завойовані позиції. Тут дуже доречно згадати слова А. Мартіне: «Можливо, це і спокусливо - приєднатися шляхом використання кількох вдало вибраних термінів до того чи іншого великого руху думки, або заявити якоюсь математичною формулою про суворість свого міркування. Однак лінгвістам вже настав час усвідомити самостійність їхньої науки і звільнитися від того комплексу неповноцінності, який змушує їх пов'язувати будь-яку свою дію з тим чи іншим загальнонауковим принципом, внаслідок чого контури дійсності завжди стають лише більш розпливчастими, натомість, щоб стати чіткішими» 1 21 .

Отже, математика сама собою і мовознавство саме собою. Це аж ніяк не виключає їхньої взаємної допомоги чи дружньої зустрічі у спільній роботі над спільними проблемами. Такого роду місцем застосування приголосних зусиль двох наук і є все широке коло проблем, що входять у прикладне мовознавство і мають велику народногосподарську значимість. Слід побажати лише, щоб у своїй спільній роботі обидві науки виявили максимум взаєморозуміння, що, безсумнівно, сприятиме й максимальній плідності їхньої співпраці.<151>

Скільки коштує писати твою роботу?

Оберіть тип роботи Дипломна робота (бакалавр/спеціаліст) Частина дипломної роботи Магістерський диплом Курсова з практикою Курсова теорія Реферат Есе Контрольна робота Завдання Атестаційна робота (ВАР/ВКР) Бізнес-план Питання до екзамену Диплом МВА Дипломна робота (коледж/технікум) Інше Кейси робота, РГР Он-лайн допомога Звіт про практику Пошук інформації Презентація в PowerPoint Реферат для аспірантури Супровідні матеріали до диплому Стаття Тест Креслення далі »

Дякую, вам надіслано листа. Перевірте пошту .

Хочете промокод на знижку 15%?

Отримати смс
з промокодом

Успішно!

?Повідомте промокод під час розмови з менеджером.
Промокод можна застосувати один раз під час першого замовлення.
Тип роботи промокоду - " дипломна робота".

Взаємодія математики та мовознавства


Вступ

Розділ 1. Історія застосування математичних методів у лінгвістиці

1.1. Становлення структурної лінгвістики межі ХІХ – ХХ століть

1.2. Застосування математичних методів у лінгвістиці у другій половині ХХ ст.

Розділ 2. Окремі приклади використання математики у лінгвістиці

2.1. Машинний переклад

2.2.Статистичні методи у вивченні мови

2.3. Вивчення мови методами формальної логіки

2.4. Перспективи застосування математичних методів у лінгвістиці

Висновок

Література

Додаток 1. Ronald Schleifer. Ferdinand de Saussure

Додаток 2. Фердінанд де Соссюр (переклад)

Вступ


У ХХ столітті намітилася тенденція до взаємодії та взаємопроникнення різних областей знань, що триває і донині. Поступово стираються межі між окремими науками; з'являється все більше галузей розумової діяльності, що знаходяться «на стику» гуманітарного, технічного та природничо знання.

Інша очевидна особливість сучасності – прагнення до вивчення структур та складових їх елементів. Тому все більше місце як у науковій теорії, так і на практиці приділяється математиці. Стикаючись, з одного боку, з логікою та філософією, з іншого боку, зі статистикою (а, отже, і з суспільними науками), математика все глибше проникає в ті сфери, які протягом довгого часу було прийнято вважати чисто «гуманітарними», розширюючи їхній евристичний потенціал (відповідь на запитання «скільки» часто допоможе відповісти і на запитання «що» та «як»). Винятком не стало і мовознавство.

Мета моєї курсової роботи – коротко висвітлити зв'язок математики з такою галуззю мовознавства, як лінгвістика. Починаючи з 50-х років минулого століття, математика застосовується в лінгвістиці при створенні теоретичного апарату для опису будови мов (як природних, так і штучних). Однак слід сказати, що вона не відразу знайшла собі подібне практичне застосування. Спочатку математичні методи в лінгвістиці стали використовуватися для того, щоб уточнити основні поняття мовознавства, проте з розвитком комп'ютерної техніки подібна теоретична посилка почала знаходити застосування на практиці. Розв'язання таких завдань, як машинний переклад, машинний пошук інформації, автоматична обробка тексту вимагало нового підходу до мови. Перед лінгвістами назріло питання: як навчитися репрезентувати мовні закономірності в тому вигляді, в якому їх можна подавати безпосередньо на техніку. Популярним у час терміном «математична лінгвістика» називають будь-які лінгвістичні дослідження, у яких застосовуються точні методи (а поняття точних методів у науці завжди тісно пов'язані з математикою). Деякі вчені минулих років вважають, що саме вираз не можна зводити в ранг терміна, оскільки він позначає не якусь особливу «лінгвістику», а лише новий напрямок, орієнтований на вдосконалення, підвищення точності та надійності методів вивчення мови. У лінгвістиці використовуються як кількісні (алгебраїчні), і некількісні методи, що зближує її з математичної логікою, отже, і з філософією, і навіть із психологією. Ще Шлегель наголошував на взаємодії мови і свідомості, а видний лінгвіст початку ХХ століття Фердинанд де Соссюр (про його вплив на становлення математичних методів у лінгвістиці розповім пізніше) пов'язував структуру мови з її приналежністю до народу. Сучасний дослідник Л. Перловський йде далі, ототожнюючи кількісні характеристики мови (наприклад, кількість пологів, відмінків) з особливостями національного менталітету (про це розділ 2.2, «Статистичні методи в лінгвістиці»).

Взаємодія математики та мовознавства – тема багатогранна, і у своїй роботі я зупинюся не на всіх, а насамперед на її прикладних аспектах.

Глава I. Історія застосування математичних методів у лінгвістиці


1.1 Становлення структурної лінгвістики межі ХІХ – ХХ століть


Математичний опис мови заснований на уявленні про мову як механізм, що сходить до відомого швейцарського лінгвіста початку ХХ століття Фердинанду де Соссюру.

Початкова ланка його концепції - теорія мови як системи, що складається з трьох частин (власне мова - langue, мова - parole, і мовну діяльність - langage), в якій кожне слово (член системи) розглядається не саме по собі, а у зв'язку з іншими членами. Як згодом зазначив інший видний лінгвіст, данець Луї Єльмслєв, Соссюр «перший вимагав структурного підходу до мови, тобто наукового опису мови шляхом реєстрації співвідношень між одиницями».

Розуміючи мову як ієрархічну структуру, Соссюр першим поставив проблему цінності, важливості мовних одиниць. Окремі явища та події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не власними силами, а в системі, в якій вони співвіднесені з подібними ж складовими.

Структурною одиницею мови Соссюр вважав слово, «знак», у якому поєднувалися звучання та зміст. Жоден з цих елементів немає один без одного: тому носію мови зрозумілі різні відтінки значення багатозначного слова як окремого елемента в структурному цілому, в мові.

Таким чином, в теорії Ф. де Соссюра можна побачити взаємодію лінгвістики, з одного боку, з соціологією та соціальною психологією (слід зазначити, що в цей же час розвиваються феноменологія Гуссерля, психоаналіз Фрейда, теорія відносності Ейнштейна, відбуваються експерименти над формою та змістом у літературі, музиці та образотворчому мистецтві), з іншого боку – з математикою (поняття системності відповідає концепції алгебри мови). Подібна концепція змінила поняття мовної інтерпретації як такої: явища почали трактуватися не щодо причин їх виникнення, а щодо сьогодення та майбутнього. Тлумачення перестало бути незалежним від намірів людини (не дивлячись на те, що наміри можуть бути безособовими, «несвідомими» у фрейдистському розумінні цього слова).

Функціонування ж мовного механізму проявляється через мовну діяльність носіїв мови. Результатом промови є звані «правильні тексти» – послідовності мовних одиниць, підпорядковуються певним закономірностям, багато з яких допускають математичний опис. Вивченням методів математичного опису правильних текстів (насамперед, пропозицій) займається теорія методів опису синтаксичної структури. У подібній структурі мовні аналогії визначені не за допомогою властивих їм якостей, а за допомогою системних («структурних») відносин.

На Заході сосюрівські ідеї розвивають молодші сучасники великого швейцарського лінгвіста: у Данії – вже згаданий мною Л. Єльмслєв, який дав початок алгебраїчної теорії мови у своїй праці «Основи лінгвістичної теорії», у США – Е. Сепір, Л. Блумфілд у Чехії - російський учений-емігрант Н. Трубецькой.

Статистичними ж закономірностями у вивченні мови став займатися ніхто інший, як основоположник генетики Георг Мендель. Тільки 1968 року філологи виявили, що, виявляється, останні роки життя він був захоплений вивченням лінгвістичних явищ з допомогою методів математики. Цей метод Мендель привніс у лінгвістику з біології; у дев'яності роки дев'ятнадцятого століття лише найсміливіші лінгвісти і біологи заявляли про доцільність такого аналізу. В архіві монастиря св. Томаша в Брно, абатом якого був Мендель, були знайдені листки зі стовпцями прізвищ, що закінчуються на «mann», «bauer», «mayer», і з якимись дробами та обчисленнями. Прагнучи виявити формальні закони походження фамільних імен, Мендель робить складні підрахунки, в яких враховує кількість голосних і приголосних у німецькій мові, загальна кількість слів, кількість прізвищ і т.д.

У нашій країні структурна лінгвістика почала розвиватися приблизно водночас, як і Заході – межі XIX-XX століть. Поруч із Ф. де Соссюром поняття мови як системи розробляли у працях професора Казанського університету Ф.Ф. Фортунатов та І.А. Бодуен де Куртене. Останній упродовж тривалого часу листувався з де Соссюром, відповідно, женевська та казанська школи мовознавства співпрацювали одна з одною. Якщо Соссюра можна назвати ідеологом «точних» методів у лінгвістиці, Бодуен де Куртене заклав практичні основи їх застосування. Він першим відокремив лінгвістику (як точну науку, що використовує статистичні методи та функціональну залежність) від філології (спільності гуманітарних дисциплін, які вивчають духовну культуру через мову та мову). Сам учений вважав, що «мова знання може принести користь у найближчому майбутньому, лише звільнившись від обов'язкового союзу з філологією та історією літератури». «Випробним полігоном» для впровадження математичних методів у лінгвістику стала фонологія – звуки як «атоми» мовної системи, що мають обмежену кількість легко вимірних властивостей, були найзручнішим матеріалом для формальних, строгих методів опису. Фонологія заперечує наявність сенсу у звуку, отже, у дослідженнях усувався «людський» чинник. У цьому сенсі фонеми подібні до фізичних або біологічних об'єктів.

Фонеми, як найдрібніші мовні елементи, прийнятні сприйняття, є окрему сферу, окрему «феноменологічну реальність». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але у всіх випадках людина, яка володіє англійською, сприйматиме її як «т». Головне, що фонема виконуватиме свою головну – сенсорозрізнювальну – функцію. Більше того – відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншій; наприклад "л" і "р" в англійській різні, у той час як в інших мовах це різновиди однієї фонеми (подібно до англійської "т", сказаному з придихом або без). Великий словниковий запас будь-якої природної мови є набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для вимовлення та написання близько мільйона слів використовується лише 40 фонем.

Звуки мови є системно організований набір характеристик. У 1920е –1930е, за Соссюром, Якобсон і Н.С.Трубецкой виділили «відмінні риси» фонем. Ці риси ґрунтуються на будові органів мови – мови, зубів, голосових зв'язок. Скажімо, в англійській різниця між "т" і "д" полягає в наявності або відсутності "голосу" (напрузі голосових зв'язок) і в рівні голосу, що відрізняє одну фонему від іншої. Отже, фонологію вважатимуться прикладом загального мовного правила, описаного Соссюром: «У мові є лише відмінності» . Більш важливо навіть це: відмінність зазвичай має на увазі точні умови, між якими воно й перебуває; але у мові існують лише відмінності без точних умов. Чи розглядаємо ми «позначення» чи «позначається» – у мові немає ні понять, ні звуків, які б до того, як розвинулася мовна система.

Таким чином, в соссюрівському мовознавстві феномен, що вивчається, розуміється як зведення зіставлень і протиставлень мови. Мова - це і вираз значення слів, і засіб спілкування, причому ці дві функції ніколи не збігаються. Ми можемо помітити чергування форми та змісту: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють, щоб створити певний зміст. Оскільки елементи мови випадкові, ні контраст, ні поєднання неможливо знайти основою. Отже, у мові відмітні ознаки формують фонетичний контраст іншому рівні розуміння, фонеми поєднуються в морфеми, морфеми – у слова, слова – у речення тощо. У будь-якому випадку ціла фонема, слово, речення і т.д. є чимось більшим, ніж просто сума складових.

Соссюр запропонував ідею нової науки ХХ століття, окремо від лінгвістики вивчаючої роль знаків у суспільстві. Соссюр назвав цю науку семіологією (від грецького «semeоon» – знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920-1930 і в Парижі в 1950-1960, розширила вивчення мови та лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своєму курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою вивчити в системі проблему «імовірності» у мові. Таке дослідження допомагає зосередитись на «речовій стороні» ймовірності; "ключове слово", анаграму якого шукає Соссюр, як стверджує Жан Старобінський, "інструмент для поета, а не джерело життя вірша". Вірш служить у тому, щоб поміняти місцями звуки ключового слова. За словами Старобинського, у цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, у його роботах помітне бажання уникнути питань, пов'язаних зі свідомістю: «оскільки поезія виражається у словах, а й у тому, що породжують ці слова, вона виходить з-під контролю свідомості залежить тільки від законів мови» (cм . Додаток 1).

Спроба Соссюра вивчити власні імена в пізній римській поезії підкреслює одну зі складових його лінгвістичного аналізу – довільну природу знаків, а також формальну сутність соссюрівської лінгвістики, що виключає можливість аналізу сенсу. Тодоров робить висновок, що у наші дні праці Соссюра виглядають на диво послідовними у небажанні вивчати символи явища, мають чітко певне значення [Додаток 1]. Досліджуючи анаграми, Соссюр звертає увагу лише з повторення, але з попередні варіанти. . . . Вивчаючи «Пісню про Нібелунги», він визначає символи лише для того, щоб привласнити їх хибним читанням: якщо вони ненавмисні, символів не існує. Зрештою, у своїх працях із загальної лінгвістики він припускає існування семіології, описує як лінгвістичні знаки; але це припущення обмежується тим, що семіологія може описувати лише випадкові, довільні знаки.

Якщо це справді так, то тільки тому, що не міг уявити «намір» без предмета; він не міг до кінця подолати прірву між формою та змістом – у його працях це перетворювалося на питання. Натомість він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, заснованими на історії та суб'єктивних здогадах, і методами випадкової інтерпретації, заснованих на цих концепціях, і, з іншого боку, структуралістськими концепціями, що стирають протистояння між формою та змістом (суб'єктом та об'єктом), значенням і походженням у структуралізмі, психоаналізі і навіть квантової механіки - праці Фердинанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Російські вчені були представлені і на Першому міжнародному конгресі лінгвістів у Гаазі у 1928 році. С. Карцевський, Р. Якобсон та Н. Трубецькой виступили з доповіддю, в якій розглядалася ієрархічна структура мови – у дусі найсучасніших для початку минулого століття уявлень. Якобсон у своїх працях розвивав ідеї Соссюра у тому, що базові елементи мови повинні вивчатися, насамперед, у зв'язку зі своїми функціями, а чи не з причинами їх виникнення.

На жаль, після приходу у 1924 році до влади Сталіна вітчизняне мовознавство, як і багато інших наук, відкидає назад. Багато талановитих вчених змушені були емігрувати, були вислані з країни або загинули в таборах. Тільки з середини 1950-х став можливий деякий плюралізм теорій – про це у розділі 1.2.


1.2 Застосування математичних методів у лінгвістиці у другій половині ХХ ст.


До середини ХХ століття сформувалося чотири світові лінгвістичні школи, кожна з яких виявилася родоначальником певного «точного» методу. Ленінградська фонологічна школа (її родоначальником був учень Бодуена де Куртене Л.В. Щерба) використовувала як основний критерій узагальнення звуку у вигляді фонеми психолінгвістичний експеримент, заснований на аналізі мови носіїв мови.

Вчені Празького лінгвістичного гуртка, зокрема його засновник Н.С. Трубецькой, який емігрував із Росії, розробили теорію опозицій – семантична структура мови було описано ними як набір оппозитивно побудованих семантичних одиниць – сем. Ця теорія застосовувалася у вивченні як мови, а й художньої культури.

Ідеологами американського дескриптивізму були мовознавці Л. Блумфілд та Е. Сепір. Мова представлялася дескриптивістам у вигляді сукупності мовних висловлювань, які були головним об'єктом їх дослідження. У центрі їхньої уваги опинилися правила наукового опису (звідси назва) текстів: вивчення організації, аранжування та класифікація їх елементів. Формалізація аналітичних процедур у галузі фонології та морфології (розробка принципів дослідження мови на різних рівнях, дистрибутивного аналізу, методу безпосередньо складових тощо) призвела до постановки загальних питань лінгвістичного моделювання. Неувага до плану змісту мови, а також парадигматичного боку мови не дозволила дескриптивістам досить повно інтерпретувати мову як систему.

У 1960-х роках розвивається теорія формальних граматик, що виникла головним чином завдяки роботам американського філософа та лінгвіста Н. Хомського. Він по праву вважається одним із найвідоміших сучасних вчених та громадських діячів, йому присвячено безліч статей, монографій і навіть повнометражний документальний фільм. На ім'я принципово нового способу опису синтаксичної структури, винайденого Хомським – генеративної (що породжує) граматики – відповідна течія в лінгвістиці одержала назву генеративізму.

Хомський, нащадок вихідців з Росії, з 1945 року вивчав у Пенсільванському університеті лінгвістику, математику та філософію, перебуваючи під сильним впливом свого вчителя Зеліга Харріса – як і Герріс, Хомський вважав і вважає свої політичні погляди близькими до анархізму (досі він відомий критик існуючого політичного устрою США і як один із духовних лідерів антиглобалізму).

Перша велика наукова робота Хомського, магістерська дисертація "Морфологія сучасного івриту" (1951), так і залишилася неопублікованою. Докторський ступінь Хомський отримав у Пенсільванському університеті в 1955 році, проте велика частина досліджень, покладених в основу дисертації (повністю опублікованої лише в 1975 році під назвою «Логічна структура лінгвістичної теорії») та його першої монографії «Синтаксичні структури» (Syntactic Structures, 1975). пров. 1962), була виконана в Гарвардському університеті в 1951-1955. У тому ж 1955 р. вчений перейшов до Массачусетського технологічного інституту, професором якого він став у 1962 році.

У розвитку теорія Хомського пройшла кілька етапів.

У першій монографії «Синтактичні структури» вчений представив мову як механізм породження нескінченного безлічі пропозицій за допомогою кінцевого набору граматичних засобів. Для опису мовних властивостей він запропонував поняття глибинної (прихованої від безпосереднього сприйняття і породжуваної системою рекурсивних, тобто можуть багаторазово застосовуватися, правил) і поверхневої (безпосередньо сприймається) граматичних структур, а також трансформацій, що описують перехід від глибинних структур до поверхневих. Однією глибинною структурою можуть відповідати декілька поверхневих (наприклад, пасивна конструкція Указ підписується президентом виводиться з тієї ж глибинної структури, що і активна конструкція Президент підписує указ) і навпаки (так, неоднозначність Мати любить дочку описується як результат збігу поверхневих структур, що сягають двох різних глибинним, в одній з яких мати – та, хто любить дочку, а в іншій – та, кого любить дочка).

Стандартною теорією Хомського вважається модель Аспектів, викладена в книзі Хомського Аспекти теорії синтаксису. У цій моделі у формальну теорію вперше вводилися правила семантичної інтерпретації, що приписують значення глибинним структурам. В «Аспектах» мовна компетенція протиставлена ​​вживанню мови (performance), прийнята так звана гіпотеза Катца – Постала про збереження сенсу під час трансформації, у зв'язку з чим виключено поняття факультативної трансформації, а також запроваджено апарат синтаксичних ознак, що описують лексичну сполучуваність.

У 1970-ті Хомський працює над теорією управління та зв'язування (GB-теорія – від слів government та binding) – більш загальною, ніж попередня. У ній вчений відмовився від специфічних правил, що описують синтаксичні структури конкретних мов. Усі трансформації замінили однією універсальною трансформацією переміщення. В рамках GB-теорії існують і приватні модулі, кожен із яких відповідає за свою частину граматики.

Вже нещодавно, 1995 року, Хомський висунув мінімалістську програму, де людська мова описується подібно до машинної. Це лише програма – не модель та не теорія. У ній Хомський виділяє дві основні підсистеми мовного апарату людини: лексикон і обчислювальну систему, і навіть два інтерфейси – фонетичний і логічний.

Формальні граматики Хомського стали класичними для опису як природних, а й штучних мов – зокрема, мов програмування. Розвиток структурної лінгвістики у другій половині ХХ століття можна вважати «хомскіанською революцією».

Московська фонологічна школа, представниками якої були А.А. Реформатський, В.М. Сидоров, П.С. Кузнєцов, А.М. Сухотін, Р.І. Аванесов, використовувала таку ж теорію вивчення фонетики. Поступово «точні» методи починають застосовуватися не лише фонетики, а й синтаксису. Структурністю мови починають займатися і лінгвісти, і математики як у нас, так і за кордоном. У 1950-60-ті в СРСР починається новий етап у взаємодії математики та лінгвістики, пов'язаний із розробкою систем машинного перекладу.

Поштовхом до початку цих робіт у нашій країні послужили перші розробки в галузі машинного перекладу в США (хоча перший механізований переказний пристрій П.П. Смирнова-Троянського було винайдено в CCCР ще в 1933 році, воно, будучи примітивним, не набуло поширення). У 1947 році А. Бутт і Д. Бріттен придумали код для послівного перекладу за допомогою ЕОМ, через рік Р. Річенс запропонував правило розбиття слів на основу і закінчення при машинному перекладі. У роки досить сильно відрізнялися від сучасних. Це були дуже великі та дорогі машини, які займали цілі кімнати та вимагали для свого обслуговування великий штат інженерів, операторів та програмістів. В основному ці комп'ютери використовувалися для здійснення математичних розрахунків для потреб військових установ – нове в математиці, фізиці та техніці служило насамперед військовій справі. На ранніх етапах розробка МП активно підтримувалася військовими, причому (за умов «холодної війни») США розвивалося російсько-англійське напрям, а СРСР - англо-русское.

У січні 1954 року в Массачусетському технічному університеті відбувся «Джорджтаунський експеримент» – перша публічна демонстрація перекладу з російської мови на англійську машиною ІБМ-701. Реферат повідомлення про успішне проходження експерименту, зроблений Д.Ю. Пановим, народився РЖ «Математика», 1954, №10: «Переклад з однієї мови іншою з допомогою машини: звіт про перше успішному випробуванні».

До робіт з машинного перекладу Д. Ю. Панов (тоді директор Інституту наукової інформації – ІНІ, пізніше ВІНІТІ) залучив І. К. Бєльську, яка пізніше очолить групу машинного перекладу в Інституті точної математики та обчислювальної техніки АН СРСР. До кінця 1955 відноситься перший досвід перекладу з англійської мови на російську за допомогою машини БЭСМ. Програми для БЕСМ складали Н.П. Трифонов та Л.М. Корольов, кандидатську дисертацію якого було присвячено методам побудови словників для машинного перекладу.

Паралельно роботи з машинного перекладу велися у Відділенні прикладної математики Математичного інституту АН СРСР (зараз Інститут прикладної математики імені М.В. Келдиша РАН). З ініціативи математика А.А. Ляпунова. До робіт з перекладу текстів на машині «Стріла» з французької на російську він залучив аспірантку МІАН О.С. Кулагіну та своїх учениць Т.Д. Вентцель та Н.М. Рікко. Уявлення Ляпунова та Кулагіної про можливість використання техніки для перекладу з однієї мови на іншу були опубліковані в журналі «Природа», 1955 №8. З кінця 1955 року до них приєдналася Т.М. Молошня, потім розпочала самостійну роботу над алгоритмом англо-російського перекладу.

Р.Фрумкіна, яка займалася на той час алогритмом перекладу з іспанської, згадує, що на цьому етапі робіт складно було робити якісь послідовні кроки. Набагато частіше доводилося дотримуватися евристичного досвіду – свого чи колег.

Проте перше покоління систем машинного перекладу було дуже недосконалим. Усі вони базувалися на алгоритмах послідовного перекладу "слово за словом", "фраза за фразою" - смислові зв'язки між словами та реченнями ніяк не враховувалися. Наприклад, можна навести пропозиції: «John was looking for his toy box. Finally he found it. The box was in the pen. John був дуже happy. (Джон шукав свою іграшкову коробку. Нарешті він її знайшов. Коробка була в манежі. Джон був дуже щасливий.)». "Pen" в даному контексті - не "ручка" (інструмент для письма), а "дитячий манеж" (play-pen). Знання синонімів, антоніів та переносних значень складно вводити в комп'ютер. Перспективним напрямом ставала розробка машинних систем, орієнтованих використання людиною-перекладачем.

Згодом зміну системам прямого перекладу прийшли Т-системи (від англійського слова «transfer» – перетворення), у яких переклад здійснювався лише на рівні синтаксичних структур. В алгоритмах Т-систем використовувався механізм, що дозволяє побудувати синтаксичну структуру за правилами граматики мови вхідної речення (подібно до того, як вчать іноземної мови в середній школі), а потім синтезувати вихідну пропозицію, перетворюючи синтаксичну структуру і підставляючи з словника потрібні слова.

Ляпунов говорив про переклад шляхом отримання сенсу тексту, що перекладається, і його подання іншою мовою. Підхід до побудови систем машинного перекладу, заснований на отриманні смислового уявлення вхідного речення шляхом його семантичного аналізу та синтезу вхідної речення за отриманим смисловим уявленням, досі вважається найбільш досконалим. Такі системи називають І-системами (від слова "інтерлінгва"). Однак завдання щодо їх створення, поставлене ще наприкінці 50-х – на початку 60-х, не вирішене повністю досі, незважаючи на зусилля Міжнародної федерації IFIP – світової спільноти вчених у галузі обробки інформації.

Вчені замислилися над тим, як потрібно формалізувати та будувати алгоритми для роботи з текстами, які словники треба вводити в машину, які лінгвістичні закономірності слід використовувати при машинному перекладі. Такими уявленнями традиційна лінгвістика не мала – не тільки в частині семантики, але і в частині синтаксису. Для жодної мови на той час не існувало переліків синтаксичних конструкцій, не були вивчені умови їхньої сполучуваності та взаємозмаєняльності, не були розроблені правила побудови великих одиниць синтаксичної структури з дрібніших складових елементів.

Потреба створення теоретичних основ машинного перекладу і призвела до формування та розвитку математичної лінгвістики. Провідну роль цій справі СРСР зіграли математики А.А. Ляпунов, О.С. Кулагіна, В.А. Успенський, лінгвісти В.Ю. Розенцвейг, П.С. Кузнєцов, Р.М. Фрумкіна, А.А. Реформатський, І.А. Мельчук, В.В. Іванов. Дисертація Кулагіної була присвячена дослідженню формальної теорії граматик (одночасно з Н.Хомським у США), Кузнєцов висунув завдання аксіоматизації лінгвістики, що сходить до робіт Ф.Ф. Фортунатова.

6 травня 1960 року було прийнято Постанову Президії АН СРСР «Про розвиток структурних та математичних методів вивчення мови», в Інституті мовознавства та Інституті російської були створені відповідні підрозділи. З 1960 року у провідних гуманітарних вузах країни – філологічному факультеті МДУ, Ленінрадському, Новосибірському університетах, МДПІІЯ – розпочалася підготовка кадрів у галузі автоматичної обробки тексту.

Проте роботи з машинного перекладу цього періоду, званого «класичним», є швидше теоретичним, ніж практичним інтересом. Економічно ефективні системи машинного перекладу стали створюватися лише у вісімдесяті роки минулого століття. Про це я розповім пізніше, у розділі 2.1 «Машинний переклад».

До 1960-х – 70-х років відносяться глибокі теоретичні розробки, що використовують методи теорії множин та математичної логіки, такі, як теорія поля та теорія нечітких множин.

Автором теорії поля у лінгвістиці був радянський поет, перекладач та лінгвіст В.Г. Адмоні. Свою теорію він розробляв на основі німецької мови. У Адмоні поняття «поле» позначає довільну непорожню безліч мовних елементів (наприклад, «лексичне поле», «семантичне поле»).

Структура поля неоднорідна: воно складається з ядра, елементи якого мають повний набір ознак, що визначають безліч, і периферії, елементи якої можуть мати як ознаки даної множини (не всіма), так і сусідніх. Наведу приклад, що ілюструє цей вислів: скажімо, в англійській мові поле складних слів ("day-dream" - "мріяти" важковідокремлено від поля словосполучень ("tear gas" - "сльозогінний газ")).

З теорією поля тісно пов'язана вже згадана вище теорія нечітких множин. У її обгрунтуванням займалися лінгвісти В.Г. Адмоні, І.П. Іванова, Г.Г. Поченцов, проте її родоначальником був американський математик Л. Заде, який у 1965 році випустив статтю «Fuzzy Logic». Даючи математичне обгрунтування теорії нечітких множин, Заде розглядав їх у лінгвістичному матеріалі.

У цій теорії йдеться вже не стільки про належність елементів до даної множини (АОа), скільки про ступінь цієї приналежності (mАОа), тому що периферійні елементи можуть тією чи іншою мірою належати кільком полям. Заде (Лофті-заде) був вихідцем з Азербайджану, до 12 років мав практику спілкування чотирма мовами - азербайджанською, російською, англійською та перською - і користувався трьома різними алфавітами: кирилицею, латинською, арабською. Коли вченого запитують, що спільного між теорією нечітких множин і лінгвістикою, він не заперечує цього зв'язку, але уточнює: «Я не впевнений, що вивчення цих мов дуже вплинуло на моє мислення. Якщо це й мало місце, то хіба підсвідомо». У юності Заде навчався у Тегерані у пресвітеріанській школі, а після Другої світової війни емігрував до США. «Питання не в тому, чи є я американцем, російським, азербайджанцем чи кимось ще, - сказав він

Схожі реферати:

Мова та мова як одна з фундаментальних проблем у стилістиці. Концепція фонеми та фонологічного рівня. Концепція мова як система та рівні мовної системи. Поняття морфеми та їх види. Пропозиція як синтаксична одиниця тексту. Знаки мовної системи.


Top