Povijest primjene matematičkih metoda u lingvistici. Razmišljanja o interakciji lingvistike i matematike

Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće. Statističke metode u učenju jezika. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća. Učenje jezika metodama formalne logike. Značajke strojnog prevođenja.

UVOD

Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici

1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće

1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1. Strojno prevođenje

2.2. Statističke metode u učenju jezika

2.3. Učenje jezika metodama formalne logike

2.4. Perspektive primjene matematičkih metoda u lingvistici

Zaključak

Književnost

Dodatak 1. Ronald Schleifer. Ferdinand de Saussure

Dodatak 2. Ferdinand de Saussure (prijevod)

UVOD

U 20. stoljeću nastavlja se trend interakcije i prožimanja različitih područja znanja. Granice između pojedinih znanosti postupno se brišu; sve je više grana umne djelatnosti koje su "na spoju" humanitarnih, tehničkih i prirodoslovnih znanja.

Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga se sve veće mjesto, kako u znanstvenoj teoriji tako iu praksi, daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto “humanitarne”, proširujući njihov heuristički potencijal (odgovor na pitanje “koliko” često će pomoći odgovoriti na pitanja “što” i “kako”). Lingvistika nije bila iznimka.

Svrha mog kolegija je ukratko osvijetliti vezu između matematike i takve grane lingvistike kao što je lingvistika. Od 1950-ih, matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (i prirodnih i umjetnih). Istodobno, treba reći da nije odmah pronašao takvu praktičnu primjenu za sebe. U početku su se matematičke metode u lingvistici počele koristiti kako bi se razjasnili temeljni pojmovi lingvistike, no razvojem računalne tehnologije takva teorijska postavka počela je nalaziti primjenu u praksi. Rješavanje takvih zadataka kao što su strojno prevođenje, strojno pronalaženje informacija, automatska obrada teksta zahtijevalo je temeljno novi pristup jeziku. Lingvisti su se suočili s pitanjem: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Pojam “matematička lingvistika”, koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici posljednjih godina smatraju da se sam izraz ne može uzdići u rang pojma, jer ne znači nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika . Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa čak i psihologiji. Čak je i Schlegel uočio interakciju jezika i svijesti, a Ferdinand de Saussure, istaknuti lingvist s početka dvadesetog stoljeća (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije), povezao je strukturu jezika s njegovom pripadnošću. ljudima. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) s osobitostima nacionalnog mentaliteta (više o tome u odjeljku 2.2, "Statističke metode u lingvistici").

Interakcija matematike i lingvistike je višestruka tema, au svom radu se neću zadržati na svim, već prije svega na njezinim primijenjenim aspektima.

Poglavlje IPovijest primjene matematičkih metoda u lingvistici

1.1 Formiranje strukturne lingvistikena prijelazu iz XIX - XX stoljeća

Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do poznatog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.

Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik je Jezik, govor - lozinka, i govorna aktivnost - Jezik), u kojem se svaka riječ (član sustava) ne razmatra sama za sebe, već u vezi s drugim članovima. Kao što je kasnije primijetio još jedan istaknuti lingvist, Danac Louis Hjelmslev, Saussure je "prvi zahtijevao strukturalni pristup jeziku, odnosno znanstveni opis jezika bilježenjem odnosa među jedinicama".

Shvaćajući jezik kao hijerarhijsku strukturu, Saussure je prvi postavio problem vrijednosti i značaja jezičnih jedinica. Zasebne pojave i događaje (recimo, povijest podrijetla pojedinih indoeuropskih riječi) ne treba proučavati same po sebi, već u sustavu u kojem su u korelaciji sa sličnim komponentama.

Saussure je strukturnom jedinicom jezika smatrao riječ "znak" u kojoj su spojeni zvuk i značenje. Nijedan od ovih elemenata ne postoji jedan bez drugoga: dakle, izvorni govornik shvaća različite nijanse značenja višeznačne riječi kao zaseban element u strukturnoj cjelini, u jeziku.

Tako se u teoriji F. de Saussurea može vidjeti interakcija lingvistike, s jedne strane, sa sociologijom i socijalnom psihologijom (treba napomenuti da se u isto vrijeme razvijaju Husserlova fenomenologija, Freudova psihoanaliza, Einsteinova teorija relativnosti). , eksperimentira se s formom i sadržajem u književnosti, glazbi i likovnim umjetnostima), s druge strane s matematikom (pojam sustavnosti odgovara algebarskom pojmu jezika). Takav koncept promijenio je koncept jezične interpretacije kao takve: fenomeni se nisu počeli tumačiti u odnosu na uzroke njihova nastanka, već u odnosu na sadašnjost i budućnost. Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, "nesvjesne" u frojdovskom smislu riječi).

Djelovanje jezičnog mehanizma očituje se kroz govornu aktivnost izvornih govornika. Rezultat govora su takozvani "ispravni tekstovi" - nizovi govornih jedinica koje se pokoravaju određenim obrascima, od kojih mnogi dopuštaju matematički opis. Teorija načina opisivanja sintaktičke strukture bavi se proučavanjem metoda matematičkog opisa ispravnih tekstova (prije svega rečenica). U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih svojstava, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Na Zapadu Saussureove ideje razvijaju mlađi suvremenici velikog švicarskog jezikoslovca: u Danskoj - od mene već spomenuti L. Hjelmslev, koji je dao povoda algebarskoj teoriji jezika u svom djelu "Osnove lingvističke teorije", god. SAD - E. Sapir, L. Bloomfield, C. Harris, u Češkoj - ruski emigrantski znanstvenik N. Trubetskoy.

Statističkim zakonitostima u proučavanju jezika počeo se baviti nitko drugi nego utemeljitelj genetike Georg Mendel. Tek 1968. godine filolozi su otkrili da je u posljednjim godinama života bio fasciniran proučavanjem jezičnih pojava matematičkim metodama. Mendel je ovu metodu donio u lingvistiku iz biologije; u 1990-ima samo su najhrabriji lingvisti i biolozi tvrdili da je takva analiza izvediva. U arhivu samostana sv. Tomasza u Brnu, čiji je opat bio Mendel, pronađeni su listovi sa stupcima prezimena koja su završavala na "mann", "bauer", "mayer", te s nekim razlomcima i izračunima. Nastojeći otkriti formalne zakonitosti nastanka obiteljskih imena, Mendel izvodi složene proračune, u kojima uzima u obzir broj samoglasnika i suglasnika u njemačkom jeziku, ukupan broj riječi koje razmatra, broj prezimena, itd.

Kod nas se strukturalna lingvistika počela razvijati otprilike u isto vrijeme kad i na Zapadu - na prijelazu iz 19. u 20. stoljeće. Istodobno s F. de Saussureom, koncept jezika kao sustava razvili su u svojim radovima profesori Sveučilišta u Kazanu F.F. Fortunatov i I.A. Baudouin de Courtenay. Potonji se dugo dopisivao s de Saussureom, odnosno ženevska i kazanska škola lingvistike surađivale su jedna s drugom. Ako se Saussurea može nazvati ideologom "egzaktnih" metoda u lingvistici, onda je Baudouin de Courtenay postavio praktične temelje za njihovu primjenu. On je prvi odvojio lingvistiku (kao točan znanost pomoću statističkih metoda i funkcionalne ovisnosti) iz filologije (zajednica humanitarnih disciplina koje proučavaju duhovnu kulturu kroz jezik i govor). Sam znanstvenik vjerovao je da "lingvistika može biti korisna u bliskoj budućnosti, samo oslobođena obveznog sjedinjenja s filologijom i književnom poviješću" . Fonologija je postala "poligon" za uvođenje matematičkih metoda u lingvistiku - glasovi kao "atomi" jezičnog sustava, s ograničenim brojem lako mjerljivih svojstava, bili su najprikladniji materijal za formalne, rigorozne metode opisa. Fonologija negira postojanje značenja u zvuku, pa je "ljudski" faktor eliminiran u studijama. U tom smislu, fonemi su poput fizičkih ili bioloških objekata.

Fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu sferu, zasebnu "fenomenološku stvarnost". Na primjer, u engleskom se glas "t" može različito izgovoriti, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Glavna stvar je da će fonem obavljati svoju glavnu - smislenu - funkciju. Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" u engleskom su različiti, dok su u drugim jezicima varijante istog fonema (poput engleskog "t", izgovorenog sa ili bez aspiracije). Ogromni rječnik svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika su sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, nakon Saussurea, Jacobson i N.S. Trubetskoy izdvojili su "odlike" fonema. Ove značajke temelje se na građi govornih organa - jezika, zuba, glasnica. Na primjer, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg jezičnog pravila koje je opisao Saussure: "Postoje samo razlike u jeziku". Još važnije nije ovo: razlika obično implicira točne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da se radi o "označavanju" ili "označenom" - u jeziku nema niti pojmova niti glasova koji bi postojali prije razvoja jezičnog sustava.

Tako se u saussureovskoj lingvistici proučavani fenomen shvaća kao skup usporedbi i opreka jezika. Jezik je i izraz značenja riječi i sredstvo komunikacije, a te se dvije funkcije nikad ne podudaraju. Možemo primijetiti izmjenu oblika i sadržaja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u morfeme, morfemi - u riječi, riječi - u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od pukog zbroja svojih dijelova.

Saussure je predložio ideju nove znanosti dvadesetog stoljeća, odvojene od lingvistike, koja proučava ulogu znakova u društvu. Saussure je ovu znanost nazvao semiologijom (od grčkog "semeion" - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili artikulirana) u terminima tih struktura. Osim toga, Saussure se u sumraku svoje karijere, usporedo s kolegijem opće lingvistike, bavio "semiotičkom" analizom kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bila je to pokušaj da se u sustavu prouči problem "vjerojatnosti" u jeziku. Takvo istraživanje pomaže usredotočiti se na "pravu stranu" vjerojatnosti; "ključna riječ" za koju Saussure traži anagram je, prema Jeanu Starobinskom, "oruđe za pjesnika, a ne izvor života pjesme". Pjesma služi za zamjenu glasova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure se ne upušta u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi pokreću, ona nadilazi kontrolu svijesti i ovisi samo o zakoni jezika” (vidi . Dodatak 1).

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji naglašava jednu od sastavnica njegove jezične analize – proizvoljnu prirodu znakova, kao i formalnu bit Saussureove lingvistike koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas čini da su Saussureovi radovi krajnje dosljedni u svojoj nevoljkosti da proučavaju simbole fenomena koji imaju jasno definirano značenje [Dodatak 1]. Istražujući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne opcije. . . . Proučavajući Nibelungenlied, on definira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerna, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on iznosi pretpostavku o postojanju semiologije koja opisuje ne samo jezične znakove; ali ta je pretpostavka ograničena činjenicom da semiologija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti "namjeru" bez objekta; nije mogao do kraja premostiti jaz između forme i sadržaja – u njegovim se spisima to pretvorilo u pitanje. Umjesto toga, okrenuo se "jezičnom legitimitetu". Između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnim nagađanjima, te metoda nasumičnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koji brišu suprotnost između forme i sadržaja (subjekta i objekta), značenje i podrijetlo u strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici - spisi Ferdinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ruski su znanstvenici također bili zastupljeni na Prvom međunarodnom kongresu lingvista u Haagu 1928. godine. S. Kartsevsky, R. Yakobson i N. Trubetskoy napravili su izvješće u kojem su ispitali hijerarhijsku strukturu jezika - u duhu najsuvremenijih ideja s početka prošlog stoljeća. Jakobson je u svojim spisima razvio Saussureove ideje da osnovne elemente jezika treba proučavati, prije svega, u vezi s njihovim funkcijama, a ne s razlozima njihova nastanka.

Nažalost, nakon što je Staljin došao na vlast 1924., ruska lingvistika je, kao i mnoge druge znanosti, vraćena unatrag. Mnogi talentirani znanstvenici bili su prisiljeni emigrirati, protjerani iz zemlje ili umrli u logorima. Tek od sredine 1950-ih postao je moguć stanoviti pluralizam teorija - više o tome u odjeljku 1.2.

1.2 Primjena matematičkih metoda u lingvistici u drugoj polovici dvadesetog stoljeća

Do sredine dvadesetog stoljeća formirale su se četiri svjetske lingvističke škole, od kojih se svaka pokazala rodonačelnikom određene "egzaktne" metode. Lenjingradska fonološka škola(njegov predak bio je učenik Baudouina de Courtenaya L.V. Shcherba) koristio je psiholingvistički eksperiment temeljen na analizi govora izvornih govornika kao glavni kriterij za generalizaciju zvuka u obliku fonema.

Znanstvenici Praški lingvistički krug, posebno - njegov osnivač N.S. Trubetskoy, koji je emigrirao iz Rusije, razvio je teoriju opozicija - semantičku strukturu jezika opisali su kao skup opozicijski izgrađenih semantičkih jedinica - Sem. Ova je teorija primijenjena u proučavanju ne samo jezika, već i umjetničke kulture.

Ideolozi američki deskriptivizam bili su lingvisti L. Bloomfield i E. Sapir. Jezik je deskriptivistima predstavljen kao skup govornih iskaza, koji su bili glavni predmet njihova proučavanja. Njihov fokus bio je na pravilima znanstvenog opisa (otuda i naziv) tekstova: proučavanje organizacije, rasporeda i klasifikacije njihovih elemenata. Formalizacija analitičkih postupaka u području fonologije i morfologije (razvoj načela za proučavanje jezika na različitim razinama, distributivna analiza, metoda izravnih sastavnica itd.) dovela je do formuliranja općih pitanja jezičnog modeliranja. Nebriga za plan sadržaja jezika, kao i za paradigmatsku stranu jezika, nije dopuštala deskriptivistima da dovoljno cjelovito protumače jezik kao sustav.

Šezdesetih godina prošlog stoljeća razvila se teorija formalnih gramatika, koja je nastala uglavnom zahvaljujući radu američkog filozofa i lingvista N. Chomskog. S pravom se smatra jednim od najpoznatijih modernih znanstvenika i javnih osoba, posvećeni su mu mnogi članci, monografije, pa čak i cjelovečernji dokumentarni film. Po imenu temeljno novog načina opisivanja sintaktičke strukture koji je izumio Chomsky - generativne (generirajuće) gramatike - nazvan je odgovarajući trend u lingvistici generativizam.

Chomsky, potomak imigranata iz Rusije, studirao je lingvistiku, matematiku i filozofiju na Sveučilištu u Pennsylvaniji od 1945. godine, pod jakim utjecajem svog učitelja Zeliga Harrisa - kao i Harris, Chomsky je svoje političke stavove smatrao i još uvijek smatra bliskima anarhizmu (još uvijek je poznat kao kritičar postojećeg američkog političkog sustava i kao jedan od duhovnih vođa antiglobalizma).

Prvo veće znanstveno djelo Chomskog, magistarski rad „Morfologija suvremenog hebrejskog » (1951.) ostao je neobjavljen. Chomsky je doktorirao na Sveučilištu u Pennsylvaniji 1955., no veliki dio istraživanja na kojem se temelji njegova disertacija (objavljena u cijelosti tek 1975. pod naslovom Logička struktura lingvističke teorije) i njegova prva monografija, Sintaktičke strukture (1957., rus. trans. 1962), izvedena je na Sveučilištu Harvard 1951.-1955. Iste 1955. godine znanstvenik se preselio na Tehnološki institut u Massachusettsu, gdje je 1962. godine postao profesor.

Chomskyjeva teorija prošla je kroz nekoliko faza u svom razvoju.

U prvoj monografiji "Sintaktičke strukture" znanstvenik je predstavio jezik kao mehanizam za generiranje beskonačnog niza rečenica pomoću konačnog skupa gramatičkih sredstava. Kako bi opisao jezična svojstva, predložio je koncepte dubinskih (skrivenih od izravne percepcije i generiranih sustavom rekurzivnih, tj. pravila koja se mogu ponavljati) i površinskih (izravno percipiranih) gramatičkih struktura, kao i transformacije koje opisuju prijelaz od dubinskih struktura do površinskih. Nekoliko površinskih struktura može odgovarati jednoj dubinskoj strukturi (na primjer, pasivna struktura Ukaz potpisuje predsjednik izvedeno iz iste dubinske strukture kao i aktivni konstrukt Predsjednik potpisuje ukaz) i obrnuto (dakle, dvosmislenost majka voli kćer opisan kao rezultat podudarnosti površinskih struktura koje sežu u dvije različite dubinske, u jednoj od kojih je majka ona koja voli kćer, a u drugoj ona koju voli kći).

Chomskyjevom standardnom teorijom smatra se model "Aspekti" postavljen u Chomskyjevoj knjizi "Aspekti teorije sintakse". U ovom su modelu po prvi put pravila semantičke interpretacije uvedena u formalnu teoriju, pripisujući značenje dubokim strukturama. U Aspektima se jezična kompetencija suprotstavlja upotrebi jezika (izvedbi), usvaja se tzv. Katz-Postalova hipoteza o očuvanju značenja tijekom transformacije, u vezi s kojom se isključuje koncept neobvezne transformacije, a aparatura uvode se sintaktička obilježja koja opisuju leksičku spojivost.

Sedamdesetih godina prošlog stoljeća Chomsky je radio na teoriji kontrole i vezivanja (GB-teorija - od riječi vlada I vezanje) je općenitiji od prethodnog. U njemu je znanstvenik napustio specifična pravila koja opisuju sintaktičke strukture određenih jezika. Sve transformacije zamijenjene su jednom univerzalnom transformacijom poteza. U okviru GB teorije postoje i privatni moduli od kojih je svaki odgovoran za svoj dio gramatike.

Već nedavno, 1995. godine, Chomsky je iznio minimalistički program, gdje se ljudski jezik opisuje kao strojni jezik. Ovo je samo program - ne model ili teorija. U njemu Chomsky identificira dva glavna podsustava ljudskog jezičnog aparata: leksikon i računalni sustav, kao i dva sučelja - fonetsko i logičko.

Chomskyjeve formalne gramatike postale su klasične za opisivanje ne samo prirodnih već i umjetnih jezika - posebno programskih jezika. Razvoj strukturalne lingvistike u drugoj polovici 20. stoljeća s pravom se može smatrati "Chomskijevskom revolucijom".

Moskovska fonološka škola, čiji su predstavnici bili A.A. Reformatsky, V.N. Sidorov, P.S. Kuznjecov, A.M. Suhotin, R.I. Avanesov, koristio je sličnu teoriju za proučavanje fonetike. Postupno se počinju primjenjivati ​​"egzaktne" metode ne samo u fonetici, već iu sintaksi. I lingvisti i matematičari, kod nas i u inozemstvu, počinju proučavati strukturu jezika. Pedesetih i šezdesetih godina prošlog stoljeća u SSSR-u je započela nova faza u interakciji između matematike i lingvistike, povezana s razvojem sustava za strojno prevođenje.

Poticaj za početak ovih radova u našoj zemlji bila su prva dostignuća u području strojnog prevođenja u Sjedinjenim Državama (iako je prvi uređaj za mehanizirano prevođenje P.P. Smirnov-Troyansky izumljen u SSSR-u 1933., on je, budući da je primitivan, nije postalo široko rasprostranjeno). Godine 1947. A. Butt i D. Britten smislili su kod za prijevod riječ po riječ pomoću računala, a godinu dana kasnije R. Richens predložio je pravilo za dijeljenje riječi na korijene i završetke u strojnom prijevodu. Te su godine bile dosta drugačije od današnjih. Bili su to vrlo veliki i skupi strojevi koji su zauzimali cijele prostorije i zahtijevali veliki broj inženjera, operatera i programera za njihovo održavanje. Uglavnom, ta su računala služila za izvođenje matematičkih proračuna za potrebe vojnih institucija - novosti u matematici, fizici i tehnici služile su, prije svega, vojnim poslovima. U ranim fazama razvoj MP-a aktivno je podržavala vojska, pri čemu se (u uvjetima Hladnog rata) u SAD-u razvio rusko-engleski smjer, a u SSSR-u anglo-ruski.

U siječnju 1954. na Tehničkom sveučilištu Massachusetts održan je "Georgetownski eksperiment" - prva javna demonstracija prijevoda s ruskog na engleski na stroju IBM-701. Sažetak poruke o uspješnom prolazu eksperimenta, napravio D.Yu. Panov, pojavio se u RJ "Matematika", 1954., br. 10: "Prijevod s jednog jezika na drugi pomoću stroja: izvješće o prvom uspješnom ispitu."

D. Yu. Panov (u to vrijeme direktor Instituta za znanstvene informacije - INI, kasnije VINITI) privukao je I. K. Belskaya, koji je kasnije vodio grupu za strojno prevođenje na Institutu za preciznu matematiku i računalno inženjerstvo Akademije znanosti SSSR-a, da rad na strojnom prevođenju. Do kraja 1955. godine datira prvo iskustvo prevođenja s engleskog na ruski uz pomoć stroja BESM. Programe za BESM sastavio je N.P. Trifonov i L.N. Korolev, čija je doktorska disertacija bila posvećena metodama za izradu rječnika za strojno prevođenje.

Paralelno se radilo na strojnom prevođenju na Odjelu za primijenjenu matematiku Matematičkog instituta Akademije znanosti SSSR-a (sada Institut za primijenjenu matematiku M.V. Keldysh Ruske akademije znanosti). Na inicijativu matematičara A.A. Ljapunov. Uključio je O.S. Kulagin i njezini učenici T.D. Wentzel i N.N. Ricco. Ideje Ljapunova i Kulagine o mogućnosti korištenja tehnologije za prevođenje s jednog jezika na drugi objavljene su u časopisu Nature, 1955., br. 8. Od kraja 1955. T.N. Moloshnaya, koji je tada započeo samostalan rad na englesko-ruskom algoritmu prijevoda.

R. Frumkina, koja se u to vrijeme bavila algoritmom prijevoda sa španjolskog, prisjeća se da je u ovoj fazi rada bilo teško poduzeti bilo kakve dosljedne korake. Puno sam češće morao slijediti heurističko iskustvo – svoje ili kolega.

U isto vrijeme, prva generacija sustava za strojno prevođenje bila je vrlo nesavršena. Svi su se temeljili na algoritmima sekvencijalnog prevođenja "riječ po riječ", "fraza po fraza" - semantičke veze između riječi i rečenica nisu ni na koji način uzete u obzir. Na primjer, rečenice su: John je tražio svoju kutiju za igračke.Napokon ga je pronašao. Kutija je bila u olovci.John je bio jako sretan. (John je tražio svoju kutiju za igračke. Napokon ju je našao. Kutija je bila u igralištu. John je bio jako sretan.)” "Olovka" u ovom kontekstu nije "olovka" (alat za pisanje), već "ogradica za igru" ( olovka za igru). Poznavanje sinonima, antonima i figurativnih značenja teško je unijeti u računalo. Obećavajući smjer bio je razvoj računalnih sustava usmjerenih na korištenje ljudskog prevoditelja.

S vremenom su sustavi izravnog prevođenja zamijenjeni T-sustavima (od engleske riječi "transfer" - transformacija), u kojima se prijevod provodio na razini sintaktičkih struktura. Algoritmi T-sustava koristili su mehanizam koji je omogućio izgradnju sintaktičke strukture prema gramatičkim pravilima jezika ulazne rečenice (slično kao što se strani jezik uči u srednjoj školi), a zatim sintetizirati izlaznu rečenicu preoblikovanjem sintaktičke strukture i zamjenom potrebnih riječi iz rječnika.

Ljapunov je govorio o prijevodu tako da izvlači značenje prevedenog teksta i prikazuje ga na drugom jeziku. Pristup izgradnji sustava za strojno prevođenje koji se temelji na dobivanju semantičkog prikaza ulazne rečenice semantičkom analizom i sintezom ulazne rečenice prema dobivenom semantičkom prikazu još uvijek se smatra najsavršenijim. Takvi se sustavi nazivaju I-sustavi (od riječi "interlingua"). Istodobno, zadatak njihovog stvaranja, postavljen kasnih 50-ih i ranih 60-ih, do danas nije u potpunosti riješen, unatoč naporima Međunarodne federacije IFIP-a - svjetske zajednice znanstvenika u području obrade informacija .

Znanstvenici su razmišljali o tome kako formalizirati i izgraditi algoritme za rad s tekstovima, koje rječnike treba unijeti u stroj, koje lingvističke obrasce treba koristiti u strojnom prevođenju. Tradicionalna lingvistika nije imala takve ideje – ne samo u smislu semantike, nego ni u smislu sintakse. U to vrijeme nije bilo popisa sintaktičkih konstrukcija za bilo koji jezik, nisu proučavani uvjeti njihove kompatibilnosti i zamjenjivosti, nisu razvijena pravila za izgradnju velikih jedinica sintaktičke strukture od manjih sastavnih elemenata.

Potreba za stvaranjem teorijskih temelja strojnog prevođenja dovela je do formiranja i razvoja matematičke lingvistike. Vodeću ulogu u ovom pitanju u SSSR-u odigrali su matematičari A.A. Ljapunov, O.S. Kulagina, V.A. Uspenski, lingvisti V.Yu. Rosenzweig, P.S. Kuznjecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina je disertacija bila posvećena proučavanju formalne teorije gramatika (istodobno s N. Khomskim u SAD-u), Kuznjecov je iznio zadatak aksiomatizacije lingvistike, koji seže do radova F.F. Fortunatov.

Dana 6. svibnja 1960. godine donesena je Uredba Prezidija Akademije znanosti SSSR-a "O razvoju strukturnih i matematičkih metoda za proučavanje jezika", au Institutu za lingvistiku i Institutu za lingvistiku stvoreni su odgovarajući odjeli. ruski jezik. Od 1960. godine vodeća humanitarna sveučilišta u zemlji - Filološki fakultet Moskovskog državnog sveučilišta, Lenjinrad, Novosibirska sveučilišta, Moskovski državni institut za strane jezike - započela su obuku osoblja u području automatske obrade teksta.

Istodobno, radovi o strojnom prevođenju ovog razdoblja, nazvani "klasični", više su od teorijskog nego praktičnog interesa. Isplativi sustavi za strojno prevođenje počeli su se stvarati tek osamdesetih godina prošlog stoljeća. O tome ću govoriti kasnije u odjeljku 2.1, Strojno prevođenje.

1960-ih i 70-ih godina uključuje duboki teorijski razvoj koristeći metode teorije skupova i matematičke logike, kao što su teorija polja i teorija neizrazitih skupova.

Autor teorije polja u lingvistici bio je sovjetski pjesnik, prevoditelj i lingvist V.G. Admoni. Svoju je teoriju u početku razvio na temelju njemačkog jezika. Za Admonija, koncept "polja" označava proizvoljan neprazan skup jezičnih elemenata (na primjer, "leksičko polje", "semantičko polje").

Struktura polja je heterogena: sastoji se od jezgre, čiji elementi imaju kompletan skup značajki koje definiraju skup, i periferije, čiji elementi mogu imati obje značajke danog skupa (ne sve) i susjednih. Dat ću primjer koji ilustrira ovu tvrdnju: na primjer, u engleskom jeziku polje složenica ("day-dream" - "dream" teško je odvojiti od polja fraza ("tear gas" - "tear gas")) .

Već spomenuta teorija neizrazitih skupova usko je povezana s teorijom polja. U SSSR-u su lingvisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, međutim, njezin je predak bio američki matematičar L. Zadeh, koji je 1965. objavio članak “Fuzzy Logic”. Dajući matematičko obrazloženje teorije neizrazitih skupova, Zade ih je razmatrao na temelju lingvističke građe.

U ovoj teoriji ne govorimo toliko o pripadnosti elemenata određenom skupu (Aa), koliko o stupnju tog članstva (Aa), budući da periferni elementi mogu pripadati nekoliko polja u jednom ili drugom stupnju. Zade (Lofti-zade) je bio porijeklom iz Azerbejdžana, do svoje 12. godine imao je praksu komuniciranja na četiri jezika - azerbejdžanskom, ruskom, engleskom i perzijskom - i koristio je tri različita pisma: ćirilicu, latinicu, arapski. Kada znanstvenika pitaju što je zajedničko između teorije neizrazitih skupova i lingvistike, on ne poriče tu vezu, ali pojašnjava: “Nisam siguran da je proučavanje ovih jezika imalo velik utjecaj na moje razmišljanje. Ako je to bio slučaj, onda samo podsvjesno. Zadeh je u mladosti studirao u prezbiterijanskoj školi u Teheranu, a nakon Drugog svjetskog rata emigrirao je u SAD. “Nije pitanje jesam li Amerikanac, Rus, Azerbajdžanac ili netko treći”, rekao je u jednom od razgovora, “Mene su oblikovale sve te kulture i narodi i među svakim od njih se osjećam sasvim ugodno.” U tim riječima postoji nešto slično onome što karakterizira teoriju neizrazitih skupova - odmak od jednoznačnih definicija i oštrih kategorija.

Kod nas su se 70-ih godina prevodili i proučavali radovi zapadnih lingvista dvadesetog stoljeća. I.A. Melchuk je preveo djela N. Chomskog na ruski. NA. Slyusareva u svojoj knjizi "Teorija F. de Saussurea u svjetlu moderne lingvistike" povezuje postavke Saussureova učenja s aktualnim problemima lingvistike 70-ih godina. Postoji tendencija daljnje matematizacije lingvistike. Vodeća domaća sveučilišta obrazuju osoblje u specijalnosti "Matematička (teorijska, primijenjena) lingvistika". U isto vrijeme na Zapadu dolazi do naglog skoka u razvoju računalne tehnologije, koja zahtijeva sve više i više novih jezičnih temelja.

U 1980-ima, profesor Instituta za orijentalne studije Akademije znanosti Yu.K. Lekomtsev, dok analizira jezik lingvistike kroz analizu shema, tablica i drugih vrsta zapisa koji se koriste u lingvističkim opisima, razmatra matematičke sustave prikladne za te svrhe (uglavnom sustave matrične algebre).

Tako je kroz dvadeseto stoljeće dolazilo do približavanja egzaktnih i humanističkih znanosti. Interakcija matematike s lingvistikom sve je više nalazila praktične primjene. Više o tome u sljedećem poglavlju.

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1 Strojno prevođenje

Ideja o prevođenju s jednog jezika na drugi uz pomoć univerzalnog mehanizma nastala je nekoliko stoljeća prije nego što su započeli prvi razvoji na ovom području - još 1649. godine Rene Descartes je predložio ideju jezika u kojem bi bile ekvivalentne ideje različiti jezici bili bi izraženi jednim simbolom. Prvi pokušaji provedbe ove ideje u 1930-im i 40-im godinama, početak teorijskih razvoja sredinom stoljeća, poboljšanje prevoditeljskih sustava uz pomoć tehnologije u 1970-im i 80-im godinama, nagli razvoj prevoditeljske tehnologije u posljednjoj desetljeće - to su faze u razvoju strojnog prevođenja kao industrije. Iz radova o strojnom prevođenju izrasla je računalna lingvistika kao znanost.

S razvojem računalne tehnologije kasnih 70-ih i ranih 80-ih, istraživači su sebi postavili realnije i isplativije ciljeve - stroj nije postao konkurent (kao što se ranije pretpostavljalo), već pomoćnik ljudskom prevoditelju. Strojno prevođenje prestaje služiti isključivo vojnim zadaćama (svi sovjetski i američki izumi i istraživanja, usmjerena prvenstveno na ruski i engleski jezik, pridonijeli su Hladnom ratu na ovaj ili onaj način). Godine 1978. riječi prirodnog jezika prenošene su preko međusobno povezane mreže Arpa, a šest godina kasnije u Sjedinjenim Državama pojavili su se prvi mikroračunalni programi za prevođenje.

U 70-ima Komisija europskih zajednica kupuje englesko-francusku verziju računalnog prevoditelja Systran, naručujući i francusko-englesku i talijansko-englesku verziju te sustav prevođenja s ruskog na engleski koji koriste američke oružane snage. Tako su postavljeni temelji projekta EUROTRA.

O oživljavanju strojnog prevođenja 70-80-ih. svjedoče sljedeće činjenice: Komisija europskih zajednica (CEC) kupuje englesko-francusku verziju Systrana, kao i sustav prevođenja s ruskog na engleski (potonji je razvijen nakon izvješća ALPAC-a i nastavio ga je koristiti US Air Force i NASA); osim toga, CEC naređuje izradu francusko-engleske i talijansko-engleske verzije. Istodobno, dolazi do brzog širenja aktivnosti strojnog prevođenja u Japanu; u SAD-u Panamerička zdravstvena organizacija (PAHO) naređuje razvoj španjolsko-engleskog smjera (sustav SPANAM); Zračne snage SAD-a financiraju razvoj sustava za strojno prevođenje u Lingvističkom istraživačkom centru na Sveučilištu Texas u Austinu; Grupa TAUM u Kanadi ostvaruje značajan napredak u razvoju svog sustava METEO (meteorološki prijevod). Brojni projekti započeti su 70-ih i 80-ih godina. kasnije razvijen u potpune komercijalne sustave.

U razdoblju od 1978. do 1993. na istraživanja u području strojnog prevođenja u SAD-u potrošeno je 20 milijuna dolara, u Europi 70 milijuna, au Japanu 200 milijuna dolara.

Jedna od novosti je tehnologija TM (translation memory) koja radi na principu akumulacije: tijekom procesa prevođenja spremaju se izvorni segment (rečenica) i njezin prijevod, što rezultira formiranjem jezične baze podataka; ako se u novoprevedenom tekstu pronađe identičan ili sličan segment, on se prikazuje zajedno s prijevodom i naznakom postotka podudaranja. Prevoditelj zatim donosi odluku (urediti, odbiti ili prihvatiti prijevod), čiji rezultat sustav pohranjuje, tako da nema potrebe dvaput prevoditi istu rečenicu. Poznati komercijalni sustav temeljen na TM tehnologiji trenutno razvija sustav TRADOS (osnovan 1984.).

Trenutačno nekoliko desetaka tvrtki razvija komercijalne sustave strojnog prevođenja, uključujući: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata softver; Linguistica b.v. i dr. Sada možete koristiti usluge automatskih prevoditelja izravno na webu: alphaWorks; PROMT-ov mrežni prevoditelj, LogoMedia.net, AltaVistina usluga prevođenja Babel Fish; InfiniT.com; Prevođenje Interneta.

Komercijalno učinkoviti sustavi prevođenja pojavili su se u drugoj polovici 80-ih i kod nas. Proširio se i sam koncept strojnog prevođenja (počeo je uključivati ​​“stvaranje više automatskih i automatiziranih sustava i uređaja koji automatski ili poluautomatski obavljaju cijeli ciklus prevođenja ili pojedine zadatke u dijalogu s osobom”), te povećana su državna izdvajanja za razvoj ove industrije.

Ruski, engleski, njemački, francuski i japanski postali su glavni jezici domaćih prevoditeljskih sustava. Svesavezni centar za prevođenje (VTsP) razvio je sustav za prevođenje s engleskog i njemačkog na ruski na računalu ES-1035-ANRAP. Sastojao se od tri rječnika - ulaznog engleskog i njemačkog i izlaznog ruskog - pod jednim softverom. Bilo je nekoliko izmjenjivih specijaliziranih rječnika - za računalnu tehnologiju, programiranje, radioelektroniku, strojarstvo, poljoprivredu, metalurgiju. Sustav je mogao raditi u dva načina - automatskom i interaktivnom, kada se na ekranu prikazuje izvorni tekst i prijevod po frazi, koji osoba može uređivati. Brzina prevođenja teksta u ANRAP (od početka tipkanja do kraja ispisa) bila je približno 100 stranica na sat.

Godine 1989. stvorena je obitelj komercijalnih prevoditelja tipa SPRINT koji su radili s ruskim, engleskim, njemačkim i japanskim jezikom. Njihova glavna prednost bila je kompatibilnost s IBM PC računalom - čime su domaći sustavi za strojno prevođenje dostigli međunarodnu razinu kvalitete. Istodobno se razvija sustav strojnog prevođenja s francuskog na ruski FRAP, koji uključuje 4 stupnja analize teksta: grafematski, morfološki, sintaktički i semantički. U LGPI im. Herzena, radilo se na četverojezičnom (engleski, francuski, španjolski, ruski) sustavu SILOD-MP (u industrijskom načinu rada korišteni su englesko-ruski i francusko-ruski rječnici.

Za specijalizirano prevođenje tekstova iz elektrotehnike postojao je sustav ETAP-2. Analiza ulaznog teksta u njoj provedena je na dvije razine - morfološkoj i sintaktičkoj. Rječnik ETAP-2 sadržavao je oko 4 tisuće natuknica; faza transformacije teksta - oko 1000 pravila (96 općih, 342 privatna, ostalo su rječnička). Sve je to osiguralo zadovoljavajuću kvalitetu prijevoda (recimo, naslov patenta "Optical phase grid arrangement and coupling device having an such an arrangement" preveden je kao "An optical phase grid device and a connecting device with such a device" - unatoč tautologija, smisao je sačuvan).

Na Pedagoškom institutu za strane jezike u Minsku, na temelju englesko-ruskog rječnika oblika riječi i fraza, izumljen je sustav za strojno prevođenje naslova, na Institutu za orijentalne studije Akademije znanosti - sustav za prevođenje s japanskog na ruski. Prva automatska vokabularna i terminološka usluga (SLOTHERM) za računalstvo i programiranje, stvorena u Moskovskom istraživačkom institutu za sustave automatizacije, sadržavala je približno 20 000 pojmova u eksplanatornom rječniku i posebnim rječnicima za lingvistička istraživanja.

Sustavi za strojno prevođenje postupno su se počeli koristiti ne samo za namjeravanu svrhu, već i kao važna komponenta sustava za automatsko učenje (za podučavanje prevođenja, provjeru pravopisnog i gramatičkog znanja).

Devedesete su sa sobom donijele brzi razvoj tržišta osobnih računala (od desktopa do džepa) i informacijske tehnologije, raširenu upotrebu Interneta (koji postaje sve internacionalniji i višejezičan). Sve je to učinilo daljnji razvoj sustava za automatizirano prevođenje zahtjevnim. Od ranih 1990-ih Na tržište PC sustava ulaze i domaći programeri.

U srpnju 1990. prvi komercijalni sustav za strojno prevođenje u Rusiji pod nazivom PROMT (PROgramer's Machine Translation) predstavljen je na PC Forumu u Moskvi. 1991. ZAO [!!! U skladu sa Saveznim zakonom-99 od 05. 05. 2014., ovaj oblik je zamijenjena nejavnim dioničkim društvom] "Projekt MT", a već 1992. tvrtka PROMT pobjeđuje na natječaju NASA-e za nabavu MP sustava (PROMT je bio jedina neamerička tvrtka na tom natjecanju). cijela obitelj sustava pod novim imenom STYLUS za prevođenje s engleskog, njemačkog, francuskog, talijanskog i španjolskog na ruski i s ruskog na engleski, a 1993. godine na temelju STYLUS-a nastao je prvi sustav za strojno prevođenje na svijetu za Windows STYLUS 2.0 za Windows 3.X/95/NT, a 1995.-1996. predstavljena je treća generacija sustava za strojno prevođenje, potpuno 32-bitni STYLUS 3.0 za Windows 95/NT, u isto vrijeme, razvoj potpuno novi, prvi na svijetu rusko-njemački i rusko-francuski sustav strojnog prevođenja.

Godine 1997. potpisan je ugovor s francuskom tvrtkom Softissimo o izradi sustava prevođenja s francuskog na njemački i engleski i obrnuto, au prosincu ove godine pušten je u prodaju prvi njemačko-francuski sustav prevođenja u svijetu. Iste godine tvrtka PROMT izdala je sustav implementiran pomoću tehnologije Gigant, koji podržava nekoliko jezičnih smjerova u jednoj ljusci, kao i poseban prevoditelj za rad na Internetu WebTranSite.

Godine 1998. puštena je cijela plejada programa pod novim imenom PROMT 98. Godinu dana kasnije PROMT je izdao dva nova proizvoda: jedinstveni programski paket za rad na Internetu - PROMT Internet i prevoditelj za korporativne mail sustave - PROMT Mail. Prevoditelj. U studenom 1999. PROMT je prepoznat kao najbolji sustav strojnog prevođenja testiran od strane francuskog časopisa PC Expert, nadmašivši svoje konkurente za 30 posto. Za korporativne klijente razvijena su i posebna poslužiteljska rješenja - korporativni prevoditeljski poslužitelj PROMT Translation Server (PTS) i internetsko rješenje PROMT Internet Translation Server (PITS). Godine 2000. PROMT je ažurirao svoju cjelokupnu liniju softverskih proizvoda izdavanjem nove generacije MT sustava: PROMT Translation Office 2000, PROMT Internet 2000 i Magic Gooddy 2000.

Online prijevod uz podršku sustava PROMT koristi se na brojnim domaćim i stranim stranicama: PROMT-ov Online Translator, InfiniT.com, Translate.Ru, Lycos itd., kao iu ustanovama raznih profila za prevođenje poslovne dokumentacije, članci i pisma (postoje sustavi za prevođenje ugrađeni izravno u Outlook Express i druge klijente e-pošte).

U današnje vrijeme pojavljuju se nove tehnologije strojnog prevođenja koje se temelje na korištenju sustava umjetne inteligencije i statističkih metoda. O potonjem - u sljedećem odjeljku.

2.2 Dodatnoičkih metoda u učenju jezika

Znatna se pozornost u suvremenoj lingvistici posvećuje proučavanju jezičnih pojava pomoću metoda kvantitativne matematike. Kvantitativni podaci često pomažu dubljem razumijevanju proučavanih pojava, njihovog mjesta i uloge u sustavu povezanih pojava. Odgovor na pitanje "koliko" pomaže odgovoriti na pitanja "što", "kako", "zašto" - takav je heuristički potencijal kvantitativne karakteristike.

Statističke metode igraju značajnu ulogu u razvoju sustava za strojno prevođenje (vidi odjeljak 2.1). U statističkom pristupu problem prevođenja razmatra se u smislu kanala s šumom. Zamislite da trebamo prevesti rečenicu s engleskog na ruski. Načelo bučnog kanala nudi nam sljedeće objašnjenje odnosa između engleske i ruske rečenice: engleska rečenica nije ništa drugo nego ruska rečenica iskrivljena nekom vrstom šuma. Kako bismo povratili izvornu rusku rečenicu, moramo znati što ljudi obično govore na ruskom i kako se ruske fraze iskrivljuju na engleski. Prijevod se provodi traženjem takve ruske rečenice koja maksimizira umnoške bezuvjetne vjerojatnosti ruske rečenice i vjerojatnosti engleske rečenice (izvornika) s obzirom na danu rusku rečenicu. Prema Bayesovom teoremu, ova je ruska rečenica najvjerojatniji prijevod engleskog:

gdje je e prijevodna rečenica, a f izvorna rečenica

Dakle, trebamo model izvora i model kanala, ili model jezika i model prijevoda. Jezični model mora dodijeliti ocjenu vjerojatnosti bilo kojoj rečenici na ciljnom jeziku (u našem slučaju ruskom), a prevoditeljski model izvornoj rečenici. (vidi tablicu 1)

Općenito, sustav strojnog prevođenja radi na dva načina:

1. Obuka sustava: uzima se korpus za obuku paralelnih tekstova, a pomoću linearnog programiranja traže se takve vrijednosti tablica korespondencije prijevoda koje maksimiziraju vjerojatnost (na primjer) ruskog dijela korpusa s dostupnim engleskim prema na odabrani model prijevoda. Na ruskom dijelu istog korpusa izgrađen je model ruskog jezika.

2. Iskorištavanje: na temelju podataka dobivenih za nepoznatu englesku rečenicu, traži se ruska koja maksimizira umnožak vjerojatnosti dodijeljenih jezičnim modelom i prevoditeljskim modelom. Program koji se koristi za takvu pretragu naziva se dekoder.

Najjednostavniji statistički model prevođenja je model doslovnog prevođenja. Ovaj model pretpostavlja da je za prijevod rečenice s jednog jezika na drugi dovoljno prevesti sve riječi (stvoriti "vreću riječi"), a model će osigurati njihov raspored u ispravnom redoslijedu. Da bi se smanjio P( a, f | e) u P(a | e, f), tj. vjerojatnosti danog poravnanja danog para rečenica, svaka vjerojatnost P(a, f | e) je normalizirana zbrojem vjerojatnosti svih poravnanja danog para rečenica:

Implementacija Viterbijevog algoritma koji se koristi za treniranje Modela #1 je sljedeća:

1. Cijela tablica vjerojatnosti korespondencije prijevoda ispunjena je istim vrijednostima.

2. Za sve moguće varijante parnih veza riječi izračunava se vjerojatnost P(a, f | e):

3. Vrijednosti P(a, f | e) su normalizirane kako bi se dobile vrijednosti P(a | e, f).

4. Izračunava se učestalost svakog para prijevoda, ponderirana vjerojatnošću svake opcije usklađivanja.

5. Dobivene ponderirane frekvencije normaliziraju se i tvore novu tablicu vjerojatnosti korespondencije prijevoda

6. Algoritam se ponavlja od koraka 2.

Razmotrimo, kao primjer, obuku sličnog modela na korpusu od dva para rečenica (slika 2):

bijela kuća

Nakon velikog broja ponavljanja, dobit ćemo tablicu (tablica 2), iz koje je vidljivo da je prijevod izveden s visokom točnošću.

Također, statističke metode naširoko se koriste u proučavanju vokabulara, morfologije, sintakse i stila. Znanstvenici s Permskog državnog sveučilišta proveli su istraživanje temeljeno na tvrdnji da su stereotipne fraze važan "građevni materijal" teksta. Ove se fraze sastoje od "nuklearnih" ponovljenih riječi i zavisnih riječi-specifikatora i imaju izraženu stilsku boju.

U znanstvenom stilu, "nuklearne" riječi mogu se nazvati: istraživanje, studija, zadatak, problem, pitanje, fenomen, činjenica, opažanje, analiza itd. U novinarstvu će druge riječi biti "nuklearne", koje imaju povećanu vrijednost posebno za tekst novina: vrijeme, osoba, moć, posao, radnja, zakon, život, povijest, mjesto itd. (ukupno 29)

Za jezikoslovce je posebno zanimljiva i stručna diferenciranost nacionalnog jezika, izvornost uporabe vokabulara i gramatike, ovisno o vrsti zanimanja. Poznato je da vozači u stručnom govoru koriste oblik w O fer, medicinari kažu k O klub umjesto koktela Yu sh - mogu se dati takvi primjeri. Zadatak statistike je pratiti varijabilnost izgovora i promjenu jezične norme.

Profesionalne razlike dovode do razlika ne samo gramatičkih, već i leksičkih. Jakutsko državno sveučilište nazvano po M.K. Ammosov, analizirano je 50 upitnika s najčešćim reakcijama na pojedine riječi među liječnicima i građevinarima (tablica 3).

Graditelji

ljudski

pacijent (10), osobnost (5)

muškarac (5)

dobro

pomoć (8), pomoć (7)

zlo (16)

život

smrt (10)

lijepo (5)

smrt

leš (8)

život (6)

vatra

toplina (8), spaljivanje (6)

vatra (7)

prst

ruka (14), panaritij (5)

veliki (7), indeks (6)

oči

vid (6), učenik, oftalmolog (po 5)

smeđa (10), velika (6)

glava

um (14), mozak (5)

velik (9), pametan (8), pametan (6)

izgubiti

svijest, život (po 4)

novac (5), pronađi (4)

Može se uočiti da liječnici češće od građevinara daju asocijacije vezane uz svoju profesionalnu djelatnost, budući da riječi-podražaji dani u upitniku imaju više veze s njihovom profesijom nego sa profesijom građevinara.

Statističke zakonitosti u jeziku koriste se za izradu frekvencijskih rječnika - rječnika koji daju numeričke karakteristike učestalosti riječi (oblika riječi, fraza) bilo kojeg jezika - jezika pisca, bilo kojeg djela itd. Obično se učestalost pojavljivanja riječ se koristi kao obilježje uporabe u tekstu određenog volumena

Model percepcije govora nemoguć je bez rječnika kao njegove bitne komponente. U percepciji govora osnovna operativna jedinica je riječ. Iz ovoga posebice slijedi da se svaka riječ percipiranog teksta mora poistovjetiti s odgovarajućom jedinicom unutarnjeg vokabulara slušatelja (ili čitatelja). Prirodno je pretpostaviti da je pretraživanje od samog početka ograničeno na neke poddomene rječnika. Prema većini suvremenih teorija percepcije govora, stvarna fonetska analiza zvučnog teksta u tipičnom slučaju daje samo neke djelomične informacije o mogućem fonološkom izgledu riječi, a ova vrsta informacija ne odgovara jednoj, nego određenom MNOGO riječi rječnika; Stoga se javljaju dva problema:

(a) odabrati odgovarajući skup prema određenim parametrima;

(b) unutar granica zacrtanog skupa (ako je adekvatno raspoređen) "eliminirati" sve riječi, osim one jedine koja najbolje odgovara zadanoj riječi prepoznatog teksta. Jedna od strategija "ispadanja" je isključivanje niskofrekventnih riječi. Iz toga slijedi da je vokabular za percepciju govora frekvencijski rječnik. Upravo je izrada računalne verzije frekvencijskog rječnika ruskog jezika početni zadatak predstavljenog projekta.

Na temelju materijala ruskog jezika postoji 5 frekvencijskih rječnika (ne računajući granske rječnike). Napomenimo samo neke općenite nedostatke postojećih rječnika.

Svi poznati frekvencijski rječnici ruskog jezika temelje se na obradi nizova pisanih (tiskanih) tekstova. Djelomično iz tog razloga, kada se identitet riječi uglavnom temelji na formalnoj, grafičkoj slučajnosti, semantika se ne uzima dovoljno u obzir. Kao rezultat toga, frekvencijske karakteristike su također pomaknute, iskrivljene; na primjer, ako sastavljač frekvencijskog rječnika u opću statistiku uporabe riječi “prijatelj” uključi riječi iz kombinacije “jedni druge”, onda je to teško opravdano: s obzirom na semantiku, moramo priznati da su to već različite riječi, odnosno da je samostalna rječnička jedinica samo kombinacija u cjelini.

Također, u svim postojećim rječnicima riječi se stavljaju samo u osnovnim oblicima: imenice u jednini, nominativu, glagoli u infinitivu itd. Neki rječnici daju podatke o učestalosti oblika riječi, ali obično to ne čine dovoljno dosljedno, ne iscrpno. Frekvencije različitih oblika riječi iste riječi očito se ne poklapaju. Kreator modela percepcije govora mora uzeti u obzir da je u stvarnom perceptivnom procesu upravo specifičan oblik riječi „uronjen“ u tekst predmet prepoznavanja: na temelju analize početnog dijela eksponenta oblika riječi, formira se skup riječi s identičnim početkom, a početni dio oblika riječi nije nužno identičan početnom dijelu rječničkog oblika. Riječ je o obliku riječi koji ima specifičnu ritmičku strukturu, što je također izuzetno važan parametar za percepcijski odabir riječi. Konačno, u konačnom prikazu prepoznatog iskaza, riječi su opet predstavljene odgovarajućim oblicima riječi.

Mnogo je radova koji pokazuju važnost frekvencije u procesu percepcije govora. No nisu nam poznati radovi u kojima bi se koristila učestalost oblika riječi – naprotiv, svi autori praktički zanemaruju učestalost pojedinih oblika riječi, misleći isključivo na lekseme. Ako se njima dobiveni rezultati ne smatraju artefaktima, treba pretpostaviti da izvorni govornik na neki način ima pristup informacijama o omjeru učestalosti oblika riječi i rječničkih oblika, tj. zapravo leksema. Štoviše, takav prijelaz s oblika riječi na leksem, naravno, ne može se objasniti prirodnim poznavanjem odgovarajuće paradigme, budući da se informacija o frekvenciji mora koristiti prije konačne identifikacije riječi, inače jednostavno gubi svoje značenje.

Prema primarnim statističkim karakteristikama moguće je sa zadanom relativnom greškom odrediti onaj dio rječnika koji uključuje riječi s visokom učestalošću pojavljivanja, neovisno o vrsti teksta. Također je moguće, uvođenjem postupnog sređivanja u rječnik, dobiti niz rječnika koji pokriva prvih 100, 1000, 5000 itd. čestih riječi. Statističke karakteristike rječnika zanimljive su u vezi sa semantičkom analizom vokabulara. Proučavanje predmetno-ideoloških skupina i semantičkih polja pokazuje da su leksičke asocijacije poduprte semantičkim vezama koje su koncentrirane oko leksema s najčešćim značenjem. Opis značenja unutar leksičko-semantičkog polja može se provesti identificiranjem riječi s najapstraktnijim leksemima u značenju. Naizgled, "prazne" (sa stajališta nominativne potencije) rječničke jedinice čine statistički homogen sloj.

Ništa manje nisu vrijedni ni rječnici za pojedine žanrove. Proučavanje mjere njihove sličnosti i prirode statističkih distribucija pružit će zanimljive podatke o kvalitativnoj stratifikaciji vokabulara ovisno o sferi govorne uporabe.

Sastavljanje rječnika velike frekvencije zahtijeva korištenje računalne tehnologije. UVOĐENJE djelomične mehanizacije i automatizacije u proces rada na rječniku zanimljivo je kao eksperiment strojne obrade rječnika za različite tekstove. Takav rječnik zahtijeva strožiji sustav obrade i prikupljanja rječničkog materijala. U malom, ovo je sustav za pronalaženje informacija koji može pružiti informacije o različitim aspektima teksta i vokabulara. Neki osnovni zahtjevi prema ovom sustavu planirani su od samog početka: ukupan broj riječi inventara, statističke karakteristike pojedine riječi i čitavih rječnika, redoslijed čestih i rijetkih zona rječnika itd. Datoteka strojne kartice omogućuje vam za automatsku izgradnju obrnutih rječnika za pojedinačne žanrove i izvore. Mnoge druge korisne statističke informacije o jeziku bit će izvučene iz skupljenog niza informacija. Računalni frekvencijski rječnik stvara eksperimentalnu osnovu za prijelaz na opsežniju automatizaciju rada s rječnikom.

Statistički podaci frekvencijskih rječnika također se mogu široko koristiti u rješavanju drugih lingvističkih problema - na primjer, u analizi i određivanju aktivnih sredstava tvorbe riječi suvremenog ruskog jezika, rješavanju pitanja poboljšanja grafike i pravopisa, koji su povezani s uzimanjem u obzir obračun statističkih podataka o vokabularu (uz sve to, važno je uzeti u obzir vjerojatnostna obilježja grafemskih kombinacija, vrste slovnih kombinacija ostvarenih u riječima), praktičnu transkripciju i transliteraciju. Statistički parametri rječnika također će biti korisni u rješavanju problema automatizacije tipkanja, prepoznavanja i automatskog čitanja doslovnog teksta.

Suvremeni rječnici objašnjenja i gramatike ruskog jezika uglavnom su izgrađeni na temelju književnih i umjetničkih tekstova. Postoje frekvencijski rječnici jezika A.S. Puškin, A.S. Griboedova, F.M. Dostojevski, V.V. Vysotsky i mnogi drugi autori. Na Odsjeku za povijest i teoriju književnosti Smolenske drž. Pedagoško sveučilište već niz godina radi na izradi frekvencijskih rječnika poetskih i proznih tekstova. Za ovu studiju odabrani su frekvencijski rječnici svih pjesama Puškina i još dvojice pjesnika zlatnog doba - "Jao od pameti" Gribojedova i sve Ljermontovljeve poezije; Pasternak i pet drugih pjesnika srebrnog doba - Balmont 1894-1903, "Pjesme o lijepoj dami" od Bloka, "Kamen" od Mandeljštama, "Ognjeni stup" od Gumiljova, "Anno Domini MCMXXI" od Ahmatove i "Sestre Moj život" Pasternaka i još četiri pjesnika željeznog doba - "Pjesme Jurija Živaga", "Kad se razvedri", cijeli korpus lirike M. Petrova, "Daleka je cesta", "Vjetrobran", "Zbogom snijegu" i "Potkovice" Mežirova, "Antimirov" Voznesenskog i "Snježnica » Rylenkova.

Valja napomenuti da su ovi rječnici različiti po svojoj prirodi: jedni predstavljaju vokabular jednoga dramskog djela, drugi - zbornike pjesama, ili više knjiga, ili cijeli korpus pjesnikovih pjesama. Rezultate analize prikazane u ovom radu treba uzeti s oprezom, ne mogu se uzeti kao apsolutni. Istodobno, uz pomoć posebnih mjera, razlika u ontološkoj naravi tekstova može se donekle smanjiti.

Posljednjih godina sve se jasnije ostvaruje suprotnost između kolokvijalnog i knjižnog govora. O ovom se pitanju posebno oštro raspravlja među metodičarima koji traže zaokret u nastavi prema govornom jeziku. Pritom, specifičnost kolokvijalnog govora još uvijek ostaje nerazjašnjena.

Rječnici su obrađeni izradom korisničke aplikacije u okruženju uredskog programa EXCEL97. Aplikacija uključuje četiri radna lista EXCEL knjige - "Title Sheet", "Dictionaries" list s početnim podacima, "Proximities" i "Distances" s rezultatima, kao i skup makronaredbi.

Početni podaci upisuju se na listu "Rječnici". Rječnici proučavanih tekstova upisuju se u ćelije EXCEL-a, zadnji stupac S formira se iz dobivenih rezultata i jednak je broju riječi koje se nalaze u drugim rječnicima. Tablice "Blizina" i "Udaljenosti" sadrže izračunate mjere blizine M, korelacije R i udaljenosti D.

Aplikacijske makronaredbe su procedure programiranja temeljene na događajima napisane u Visual Basicu za aplikacije (VBA). Procedure se temelje na objektima VBA biblioteke i njihovim metodama obrade. Dakle, za rad s radnim listovima aplikacije koristi se ključni objekt Worksheet (radni list) i pripadajući način aktiviranja lista Activate (aktiviraj). Postavljanje raspona analiziranih izvornih podataka na Rječničkom listu vrši se metodom Select objekta Range (raspon), a prijenos riječi kao vrijednosti u varijable vrši se kao svojstvo (vrijednost) Value istog tog Raspona. objekt.

Unatoč činjenici da nas analiza korelacije ranga čini opreznima u pogledu ovisnosti tema između različitih tekstova, većina najčešćih riječi u svakom tekstu ima podudaranja u jednom ili više drugih tekstova. U stupcu S prikazan je broj takvih riječi među 15 najčešćih riječi za svakog autora. Podebljane riječi pojavljuju se samo u riječima jednog pjesnika u našoj tablici. Blok, Ahmatova i Petrov uopće nemaju istaknutih riječi, imaju S = 15. Ova tri pjesnika imaju istih 15 najčešćih riječi, razlikuju se samo po mjestu na popisu. Ali čak i Puškin, čiji je vokabular najizvorniji, ima S = 8, a ima 7 istaknutih riječi.

Rezultati pokazuju da postoji određeni sloj vokabulara koji koncentrira glavne teme poezije. U pravilu su te riječi kratke: od ukupnog broja (225) jednosložnih riječi 88, dvosložnih 127, trosložnih 10. Često ove riječi predstavljaju glavne mitologeme i mogu se svrstati u parove: noć - dan, zemlja - nebo (sunce), Bog - čovjek (ljudi), život - smrt, tijelo - duša, Rim - svijet(kod Mandeljštama); mogu se kombinirati u mitologeme više razine: nebo, zvijezda, sunce, zemlja; u osobi se u pravilu ističe tijelo, srce, krv, ruka, noga, obraz, oči. Od ljudskih stanja prednost se daje snu i ljubavi. Kuća i gradovi pripadaju ljudskom svijetu - Moskva, Rim, Pariz. Kreativnost je predstavljena leksemima riječ I pjesma.

Gribojedov i Ljermontov među najčešćim riječima gotovo da nemaju riječi koje označavaju prirodu. Imaju tri puta više riječi koje označavaju osobu, dijelove njenog tijela, elemente njenog duhovnog svijeta. Puškin i pjesnici dvadesetog stoljeća. oznake čovjeka i prirode približno su jednake. U ovom važnom aspektu predmeta možemo reći da je XX. stoljeće. slijedio Puškina.

Minimalna tema slučaj među najčešćim riječima nalazi se samo kod Gribojedova i Puškina. Ljermontov i pjesnici dvadesetog stoljeća. ustupa mjesto minimalnoj temi riječ. Riječ ne isključuje djela (biblijsko tumačenje teme: u Novom zavjetu sva učenja Isusa Krista smatraju se Božjom ili Isusovom riječi, a apostoli se ponekad nazivaju službenicima Riječi). Sveto značenje leksema riječ uvjerljivo se očituje, na primjer, u Pasternakovu stihu "I slika svijeta, otkrivena u Riječi". Sveto značenje leksema riječ u spoju i suprotnosti s ljudskim poslovima, uvjerljivo se očituje u istoimenoj pjesmi Gumiljova.

Leksemi koji se nalaze samo u jednom tekstu obilježavaju izvornost pojedine knjige ili zbirke knjiga. Na primjer, riječ "um" najčešća je u Gribojedovoj komediji "Jao od pameti" - ali se ne pojavljuje među učestalim riječima drugih tekstova. Tema uma daleko je najznačajnija u komediji. Ovaj leksem prati sliku Chatsky, a ime Chatsky je najčešće u komediji. Tako je u djelu organski spojena najčešća opća imenica s najučestalijim vlastitim imenom.

Najveći koeficijent korelacije povezuje teme tragičnih knjiga "Ognjeni stup" Gumiljova i "Anno Domini MCMXXI" Ahmatove. Među 15 najfrekventnijih imenica 10 je uobičajenih, među kojima su krv, srce, duša, ljubav, riječ, nebo. Podsjetimo da je Akhmatova knjiga uključivala minijaturu "Nećeš biti živ ...", napisanu između uhićenja Gumilyova i njegovog pogubljenja.

Teme svijeće i gomile u proučavanom materijalu nalaze se samo u "Pjesmama Jurija Živaga". Tema svijeće u stihovima iz romana ima mnogo kontekstualnih značenja: povezuje se s likom Isusa Krista, s temama vjere, besmrtnosti, kreativnosti, ljubavnog susreta. Svijeća je najvažniji izvor svjetla u središnjim prizorima romana. Tema gomile razvija se u vezi s glavnom idejom romana, u kojoj se privatni život osobe sa svojim nepokolebljivim vrijednostima suprotstavlja nemoralu nove države, izgrađene na načelima ugađanja gomili. .

Rad također uključuje treću fazu, koja se također odražava u programu, - to je izračun razlike u rednim brojevima riječi zajedničkih za dva rječnika i prosječne udaljenosti između istih riječi dvaju rječnika. Ova faza omogućuje prelazak s općih trendova u interakciji rječnika identificiranih uz pomoć statistike na razinu koja se približava tekstu. Na primjer, knjige Gumiljova i Ahmatove statistički značajno koreliraju. Gledamo koje su se riječi pokazale zajedničkim za njihove rječnike, a prije svega biramo one čiji se serijski brojevi razlikuju minimalno ili jednaki nuli. Upravo te riječi imaju isti rang-broj i, prema tome, te su minimalne teme u glavama dvojice pjesnika jednako važne. Zatim biste trebali prijeći na razinu tekstova i konteksta.

Kvantitativne metode također pomažu u proučavanju karakteristika naroda - izvornih govornika. Recimo, u ruskom ima 6 padeža, u engleskom nema padeža, au nekim jezicima naroda Dagestana broj padeža doseže 40. L. Perlovsky u svom članku "Svijest, jezik i kultura" povezuje ove obilježja sa sklonošću naroda individualizmu ili kolektivizmu, sa shvaćanjem stvari i pojava zasebno ili u vezi s drugima. Uostalom, upravo su se u engleskom govornom području (nema slučajeva - stvar se percipira "sama po sebi") pojavili pojmovi kao što su individualna sloboda, liberalizam i demokracija (napominjem da te pojmove koristim samo u vezi s jezik, bez ikakvih evaluativnih karakteristika). Unatoč činjenici da takve pretpostavke još uvijek ostaju samo na razini hrabrih znanstvenih hipoteza, one pomažu da se već poznate pojave pogledaju na novi način.

Kao što vidimo, kvantitativne karakteristike mogu se primijeniti u sasvim različitim područjima lingvistike, što sve više briše granice između "egzaktnih" i "humanitarnih" metoda. Lingvistika u rješavanju svojih problema sve više pribjegava pomoći ne samo matematike, već i računalne tehnologije.

2.3 Učenje Ijezik metodama formalne logike

S nekvantitativnim metodama matematike, posebice s logikom, suvremena teorijska lingvistika ne djeluje ništa manje plodonosno nego s kvantitativnima. Nagli razvoj računalnih tehnologija i porast njihove uloge u suvremenom svijetu zahtijevao je reviziju pristupa interakciji jezika i logike općenito.

Metode logike naširoko se koriste u razvoju formaliziranih jezika, posebice programskih jezika, čiji su elementi neki simboli (slični matematičkim), odabrani (ili konstruirani od prethodno odabranih simbola) i interpretirani na određeni način, povezani bez "tradicionalne" uporabe, razumijevanja i razumijevanja.funkcije istih simbola u drugim kontekstima. Programer se u svom radu stalno bavi logikom. Smisao programiranja je samo naučiti računalo razumu (u najširem smislu riječi). Pritom se metode "rezoniranja" pokazuju vrlo različitima. Svaki programer provodi određeno vrijeme tražeći greške u svojim i tuđim programima. Odnosno, tražiti pogreške u zaključivanju, u logici. I ovo također ostavlja traga. Puno je lakše otkriti logičke pogreške u običnom govoru. Relativna jednostavnost jezika koje proučavaju logičari omogućuje im da jasnije razjasne strukture tih jezika nego što je to moguće postići lingvistima koji analiziraju isključivo složene prirodne jezike. S obzirom na činjenicu da jezici koje proučavaju logičari koriste relacije prepisane iz prirodnih jezika, logičari mogu dati značajan doprinos općoj teoriji jezika. Ovdje je situacija slična onoj koja se događa u fizici: fizičar također formulira teoreme za idealno pojednostavljene slučajeve koji se uopće ne pojavljuju u prirodi - formulira zakone za idealne plinove, idealne tekućine, govori o gibanju bez trenja, itd. Za te idealizirane slučajeve mogu se ustanoviti jednostavni zakoni koji bi uvelike pridonijeli razumijevanju onoga što se događa u stvarnosti i što bi fizici vjerojatno ostalo nepoznato kada bi pokušala promatrati stvarnost izravno, u svoj njezinoj složenosti.

U proučavanju prirodnih jezika koriste se logičke metode kako oni koji uče jezik ne bi mogli glupo "zapamtiti" što više riječi, već bolje razumjeti njegovu strukturu. L. Shcherba je također u svojim predavanjima koristio primjer rečenice izgrađene prema zakonima ruskog jezika: „Sjajna kuzdra šteko bokra bokru i kovrča bokru“, a zatim je pitao studente što to znači. Unatoč činjenici da je značenje riječi u rečenici ostalo nejasno (one jednostavno ne postoje u ruskom), bilo je moguće jasno odgovoriti: "kuzdra" je subjekt, imenica ženskog roda, u jednini, nominativu, " bokr” je animiran i sl. Ispostavilo se da prijevod fraze glasi otprilike ovako: "Nešto ženstveno u jednom je potezu učinilo nešto nad nekom vrstom muškog stvorenja, a zatim je počelo dugo, postupno činiti nešto poput ovoga sa svojim mladunčetom." Sličan primjer teksta (umjetničkog) od nepostojećih riječi, izgrađenog u potpunosti prema zakonima jezika, jest Jabberwock Lewisa Carrolla (u Alisi u zemlji čudesa Carroll kroz svoj lik Humpty Dumptyja objašnjava značenje riječi koje izmišljeno: "kuhano" - osam sati navečer, kada je vrijeme za kuhanje večere, "chlivky" - krhak i spretan, "shorek" - križanac između tvora, jazavca i vadičepa, "roni" - ​​skakući, roniti, vrtjeti se, "nava" - trava ispod sunčanog sata (proteže se malo udesno, malo ulijevo i malo nazad), "groktaj" - groktaj i smij se, "zeljuk" - zeleni ćuran, "mjumzik" - ptica; perje joj je razbarušeno i strši na sve strane, poput metle, "mova" - daleko od kuće) .

Jedan od glavnih koncepata moderne logike i teorijske lingvistike, koji se koristi u proučavanju jezika raznih logičkih i matematičkih računa, prirodnih jezika, za opisivanje odnosa između jezika različitih "razina" i za karakterizaciju odnosa između jezika koji se razmatraju i predmetnih područja opisanih uz njihovu pomoć, koncept je metajezika. Metajezik je jezik koji se koristi za izražavanje sudova o drugom jeziku, jeziku-objektu. Uz pomoć metajezika, oni proučavaju strukturu znakovnih kombinacija (izražaja) jezika-objekta, dokazuju teoreme o njegovim izražajnim svojstvima, o njegovom odnosu prema drugim jezicima itd. Jezik koji se proučava naziva se i predmetni jezik u odnos prema ovom metajeziku. I predmetni jezik i metajezik mogu biti obični (prirodni) jezici. Metajezik se može razlikovati od predmetnog jezika (na primjer, u engleskom udžbeniku za Ruse, ruski je metajezik, a engleski je objektni jezik), ali se također može podudarati s njim ili se samo djelomično razlikovati, na primjer, u posebnoj terminologiji (Rusko lingvističko nazivlje je element metajezika za opisivanje ruskog jezika, tzv. semantički čimbenici dio su metajezika za opisivanje semantike prirodnih jezika).

Koncept "metajezika" postao je vrlo plodan u vezi s proučavanjem formaliziranih jezika koji su izgrađeni u okviru matematičke logike. Za razliku od formaliziranih predmetnih jezika, u ovom slučaju metajezik, pomoću kojeg se formulira metateorija (proučavajući svojstva predmetne teorije formulirane u predmetnom jeziku), u pravilu je običan prirodni jezik, na neki poseban način fragment prirodnog jezika ograničen na poseban način, koji ne sadrži nikakvu vrstu dvosmislenosti, metafore, "metafizički" koncepti itd. elementi običnog jezika koji sprječavaju njegovu upotrebu kao alata za točno znanstveno istraživanje. Pritom se sam metajezik može formalizirati i (bez obzira na to) postati predmetom istraživanja koja se provode pomoću metametajezika, a takav se niz može “misliti” da raste unedogled.

Logika nas uči plodnoj razlici između jezika-objekta i metajezika. Jezik-objekt sam je predmet logičkog istraživanja, a metajezik je onaj neizbježno umjetni jezik na kojem se takva istraživanja provode. Logičko mišljenje sastoji se samo od formuliranja odnosa i strukture stvarnog jezika (jezika predmeta) u jeziku simbola (metajezik).

Metajezik u svakom slučaju ne smije biti “ne siromašniji” od svog objektivnog jezika (tj. za svaki izraz potonjeg u metajeziku mora postojati njegovo ime, “prijevod”) - inače, ako ti zahtjevi nisu ispunjeni (što svakako zahtijeva mjesto u prirodnim jezicima, ako posebnim ugovorima nije drugačije određeno) nastaju semantički paradoksi (antinomije).

Kako se stvaralo sve više i više novih programskih jezika, u vezi s problemom programiranja prevoditelja, pojavila se hitna potreba za stvaranjem metajezika. Trenutno se metajezik oblika Backus-Naur (skraćeno BNF) najčešće koristi za opisivanje sintakse programskih jezika. To je kompaktni oblik u obliku nekih formula sličnih matematičkim. Za svaki koncept jezika postoji jedinstvena metaformula (normalna formula). Sastoji se od lijevog i desnog dijela. Lijeva strana specificira koncept koji se definira, a desna strana specificira skup dopuštenih jezičnih konstrukata koji se kombiniraju u ovaj koncept. Formula koristi posebne metaznakove u obliku uglastih zagrada, koji sadrže pojam koji se definira (na lijevoj strani formule) ili prethodno definirani pojam (na njenoj desnoj strani), a naznačeno je razdvajanje lijevog i desnog dijela metakarakterom "::=", čije je značenje ekvivalentno riječima "po definiciji postoji". Metalingvističke formule su u nekom obliku ugrađene u prevoditelje; uz njihovu pomoć se provjerava formalna usklađenost konstrukcija koje koristi programer s bilo kojom od konstrukcija koje su sintaktički važeće u ovom jeziku. Postoje i zasebni metajezici raznih znanosti - dakle, znanje postoji u obliku raznih metajezika.

Logičke metode poslužile su i kao osnova za stvaranje sustava umjetne inteligencije temeljenih na konceptu konekcionizma. Konekcionizam je posebna struja u filozofskoj znanosti, čiji su predmet pitanja znanja. U okviru ovog trenda pokušavaju se objasniti intelektualne sposobnosti čovjeka pomoću umjetnih neuronskih mreža. Sastavljene od velikog broja strukturnih jedinica sličnih neuronima, s težinom dodijeljenom svakom elementu koja određuje snagu veze s drugim elementima, neuronske mreže su pojednostavljeni modeli ljudskog mozga. Eksperimenti s neuralnim mrežama ove vrste pokazali su njihovu sposobnost da nauče izvršavati zadatke kao što su prepoznavanje uzoraka, čitanje i identificiranje jednostavnih gramatičkih struktura.

Filozofi su se počeli zanimati za konekcionizam, budući da je konekcionistički pristup obećavao pružiti alternativu klasičnoj teoriji uma i ideji široko zastupljenoj unutar te teorije da je rad uma sličan digitalnoj obradi simboličkog jezika. Računalo. Ovaj koncept je vrlo kontroverzan, ali posljednjih godina nalazi sve više pristalica.

Logičko proučavanje jezika nastavlja Saussureov koncept jezika kao sustava. Činjenica da se neprestano nastavlja još jednom potvrđuje smjelost znanstvenih nagađanja s početka prošlog stoljeća. Posljednji dio svog rada posvetit ću izgledima za razvoj matematičkih metoda u lingvistici danas.

2.4 Perspektive primjene matematičkih metoda u lingvistici

U eri računalne tehnologije metode matematičke lingvistike dobile su novu razvojnu perspektivu. Potraga za rješenjima problema lingvističke analize danas se sve više provodi na razini informacijskih sustava. Istodobno, automatizacija procesa obrade jezične građe, pružajući istraživaču značajne mogućnosti i prednosti, neminovno pred njega postavlja nove zahtjeve i zadatke.

Kombinacija "egzaktnog" i "humanitarnog" znanja postala je plodno tlo za nova otkrića na polju lingvistike, informatike i filozofije.

Strojno prevođenje s jednog jezika na drugi ostaje brzorastuća grana informacijske tehnologije. Unatoč činjenici da se računalno potpomognuto prevođenje po kvaliteti nikako ne može usporediti s ljudskim prevođenjem (osobito književnih tekstova), stroj je postao nezamjenjiv pomoćnik čovjeku u prevođenju velikih količina teksta. Vjeruje se da će se u bliskoj budućnosti stvoriti napredniji sustavi prevođenja koji će se prvenstveno temeljiti na semantičkoj analizi teksta.

Jednako obećavajuće područje je interakcija lingvistike i logike, koja služi kao filozofski temelj za razumijevanje informacijske tehnologije i takozvane "virtualne stvarnosti". U bliskoj budućnosti nastavit će se rad na stvaranju sustava umjetne inteligencije – iako ona, opet, po svojim mogućnostima nikada neće biti ravna ljudskoj. Takvo natjecanje je besmisleno: u naše vrijeme stroj bi trebao postati (i postaje) ne suparnik, već pomoćnik čovjeka, ne nešto iz domene fantazije, već dio stvarnog svijeta.

Proučavanje jezika statističkim metodama se nastavlja, što omogućuje točnije određivanje njegovih kvalitativnih svojstava. Važno je da najsmjelije hipoteze o jeziku nađu svoj matematički, a time i logički dokaz.

Najznačajnije je to što su se različite grane primjene matematike u lingvistici, prethodno prilično izolirane, posljednjih godina povezale jedna s drugom povezujući se u koherentan sustav, analogno jezičnom sustavu koji je prije jednog stoljeća otkrio Ferdinand de Saussure i Yvan Baudouin de Courtenay. To je kontinuitet znanstvenih spoznaja.

Lingvistika je u suvremenom svijetu postala temelj razvoja informacijske tehnologije. Sve dok je računalna znanost grana ljudske djelatnosti koja se brzo razvija, spoj matematike i lingvistike i dalje će igrati svoju ulogu u razvoju znanosti.

Zaključak

Tijekom 20. stoljeća računalne su tehnologije prešle dug put - od vojne do miroljubive uporabe, od uskog spektra ciljeva do prodora u sve grane ljudskog života. Matematika kao znanost s razvojem računalne tehnologije dobiva sve novi praktični značaj. Ovaj proces traje i danas.

Dotad nezamisliv "tandem" "fizičara" i "liričara" postao je stvarnost. Za potpunu interakciju matematike i informatike s humanističkim znanostima bili su potrebni kvalificirani stručnjaci s obje strane. Dok informatičarima sve više trebaju sustavna humanitarna znanja (jezična, kulturološka, ​​filozofska) kako bi shvatili promjene u stvarnosti koja ih okružuje, u interakciji čovjeka i tehnologije, razvili sve više novih jezičnih i mentalnih koncepata, pisali programa, onda svaki "Humanist" u našem vremenu za svoj profesionalni razvoj mora savladati barem osnove rada s računalom.

Matematika, koja je usko povezana s informatikom, nastavlja se razvijati i djelovati s prirodnim i humanističkim znanostima. U novom stoljeću trend matematizacije znanosti ne slabi, nego se, naprotiv, pojačava. Na temelju kvantitativnih podataka shvaćaju se zakonitosti razvoja jezika, njegove povijesne i filozofske karakteristike.

Matematički formalizam je najprikladniji za opisivanje obrazaca u lingvistici (kao, uostalom, iu drugim znanostima - kako humanističkim tako i prirodnim). Situacija se ponekad u znanosti razvija na takav način da je bez upotrebe odgovarajućeg matematičkog jezika nemoguće razumjeti prirodu fizikalnih, kemijskih itd. proces nije moguć. Stvaranje planetarnog modela atoma, poznati engleski fizičar XX. stoljeća. E. Rutherford je imao matematičkih poteškoća. Isprva njegova teorija nije bila prihvaćena: nije zvučala uvjerljivo, a razlog tome bilo je Rutherfordovo nepoznavanje teorije vjerojatnosti, na temelju čijeg je mehanizma jedino bilo moguće razumjeti modelski prikaz međudjelovanja atoma. Uvidjevši to, već tada vrsni znanstvenik, dobitnik Nobelove nagrade, upisao je seminar matematičara profesora Lamba i dvije godine zajedno sa studentima pohađao tečaj i radionicu iz teorije vjerojatnosti. . Na temelju njega Rutherford je uspio opisati ponašanje elektrona, dajući svom strukturnom modelu uvjerljivu točnost i stekavši priznanje. Isto je i s lingvistikom.

Postavlja se pitanje što je to toliko matematičko u objektivnim pojavama, zahvaljujući čemu se one mogu opisati jezikom matematike, jezikom kvantitativnih karakteristika? To su homogene jedinice materije raspoređene u prostoru i vremenu. One znanosti koje su otišle dalje od drugih prema izolaciji homogenosti, te se ispostavljaju da su prikladnije za korištenje matematike u njima.

Internet, koji se naglo razvio devedesetih godina prošlog stoljeća, okupio je predstavnike raznih zemalja, naroda i kultura. Unatoč činjenici da je engleski i dalje glavni jezik međunarodne komunikacije, internet je u naše vrijeme postao višejezičan. To je dovelo do razvoja komercijalno uspješnih sustava strojnog prevođenja koji se naširoko koriste u raznim područjima ljudske djelatnosti.

Računalne mreže postale su predmetom filozofskog promišljanja - stvara se sve više novih jezičnih, logičkih, svjetonazorskih koncepata koji pomažu razumijevanju "virtualne stvarnosti". U mnogim umjetničkim djelima stvoreni su scenariji - češće pesimistični - o prevlasti strojeva nad čovjekom, a virtualne stvarnosti - nad vanjskim svijetom. Daleko od toga da su se takve prognoze uvijek pokazale besmislenim. Informacijska tehnologija nije samo obećavajuća industrija za ulaganje ljudskog znanja, ona je i način kontrole informacija, a time i ljudske misli.

Ova pojava ima i negativnu i pozitivnu stranu. Negativno – jer je kontrola nad informacijama u suprotnosti s neotuđivim ljudskim pravom na slobodan pristup istima. Pozitivno – jer nedostatak te kontrole može dovesti do katastrofalnih posljedica za čovječanstvo. Dovoljno je prisjetiti se jednog od najmudrijih filmova prošlog desetljeća - "Kad smak svijeta" Wima Wendersa, čiji su likovi potpuno uronjeni u "virtualnu stvarnost" vlastitih snova snimljenih na računalu. Pritom niti jedan znanstvenik i niti jedan umjetnik ne može dati nedvosmislen odgovor na pitanje: što znanost i tehnologiju čeka u budućnosti.

Fokusiranje na "budućnost", koja se ponekad činila fantastičnom, bila je prepoznatljiva značajka znanosti sredinom dvadesetog stoljeća, kada su izumitelji nastojali stvoriti savršene modele tehnologije koji bi mogli funkcionirati bez ljudske intervencije. Vrijeme je pokazalo utopističnost takvih istraživanja. U isto vrijeme, bilo bi suvišno osuđivati ​​znanstvenike zbog toga - bez njihovog entuzijazma u 1950-im - 60-im godinama, informacijska tehnologija ne bi napravila tako snažan skok u 90-ima, a mi ne bismo imali ovo što imamo sada.

Posljednja desetljeća dvadesetog stoljeća promijenila su prioritete znanosti - istraživanja, inventivni patos ustupio je mjesto komercijalnom interesu. Opet, ovo nije ni dobro ni loše. Ovo je stvarnost u kojoj je znanost sve više integrirana u svakodnevni život.

21. stoljeće nastavilo je taj trend, au naše vrijeme iza izuma ne stoje samo slava i priznanje, već prije svega novac. Zbog toga je također važno osigurati da najnovija dostignuća znanosti i tehnologije ne padnu u ruke terorističkih skupina ili diktatorskih režima. Zadatak je težak do nemogućnosti; ostvariti ga u što većoj mjeri zadatak je cijele svjetske zajednice.

Informacija je oružje, a oružje nije ništa manje opasno od nuklearnog ili kemijskog oružja - samo što ne djeluje fizički, već psihički. Čovječanstvo treba razmisliti što mu je u ovom slučaju važnije - sloboda ili kontrola.

Najnoviji filozofski koncepti vezani uz razvoj informacijskih tehnologija i pokušaj njihova razumijevanja pokazali su ograničenost kako prirodnoznanstvenog materijalizma, koji je dominirao tijekom 19. i početkom 20. stoljeća, tako i ekstremnog idealizma, koji negira značaj materijalnog svijeta. . Za suvremenu misao, posebno za misao Zapada, važno je prevladati taj dualizam u mišljenju, kada se okolni svijet jasno dijeli na materijalni i idealni. Put do toga je dijalog kultura, usporedba različitih gledišta na okolne pojave.

Paradoksalno, informacijska tehnologija može igrati važnu ulogu u ovom procesu. Računalne mreže, a posebice internet, nisu samo izvor zabave i žustre komercijalne aktivnosti, one su i sredstvo sadržajne, kontroverzne komunikacije između predstavnika različitih civilizacija u suvremenom svijetu, kao i za dijalog između prošlosti i sadašnjost. Možemo reći da internet pomiče prostorne i vremenske granice.

A u dijalogu kultura putem informacijske tehnologije i dalje je važna uloga jezika kao najstarijeg univerzalnog sredstva komunikacije. Zato je lingvistika u interakciji s matematikom, filozofijom i informatikom doživjela svoje drugo rođenje i razvija se i danas. Trend sadašnjosti nastavit će se i u budućnosti - "do kraja svijeta", kako je prije 15 godina predvidio isti V. Wenders. Istina, ne zna se kada će taj kraj nastupiti – ali je li to sada važno, jer budućnost će ionako prije ili kasnije postati sadašnjost.

Prilog 1

Ferdinand de Saussure

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) naširoko se smatra utemeljiteljem moderne lingvistike u svojim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i jezičnih oblika. Zapravo, metoda strukturalizma u lingvistici i literarnoj znanosti i značajna grana semiotike nalaze svoje glavno polazište u njegovom radu na prijelazu u dvadeseto stoljeće. Čak se tvrdilo da je kompleks strategija i koncepcija koji je nazvan "poststrukturalizam" - rad Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih - sugeriran Saussureovim radom u lingvistici i anagramskim čitanjima kasne latinske poezije.književnog modernizma do psihoanalize i filozofije u ranom dvadesetom stoljeću. Kao što Algirdas Julien Greimas i Joseph Courtes tvrde u Semiotici i jeziku: Analitički rječnik, pod naslovom "Tumačenje", novi način tumačenja pojavio se početkom dvadesetog stoljeća koji oni poistovjećuju sa Saussureovom lingvistikom, Husserlijevom fenomenologijom i Freudovskom psihoanalizom. U ovom načinu, "interpretacija više nije stvar pripisivanja određenog sadržaja obliku koji bi inače nedostajao; prije je to parafraza koja na drugi način formulira ekvivalentni sadržaj označiteljskog elementa unutar danog semiotičkog sustava" ( 159). u ovom razumijevanju "tumačenja", forma i sadržaj nisu različiti; nego je svaki "forma", alternativno, i semantički "sadržaj", "označni oblik", tako da interpretacija nudi analognu parafrazu nečega što već označava unutar nekog drugog sustava označavanja.

Takva reinterpretacija forme i razumijevanja - koju Claude Levi-Strauss opisuje u jednoj od svojih najprogramskijih artikulacija koncepta strukturalizma, u "Struktura i forma: Razmišljanja o djelu Vladimira Proppa" - implicitna je u Saussureovom posthumnom Tečaju u općoj lingvistici (1916., prijevod, 1959., 1983.). Tijekom svog života, Saussure je objavljivao relativno malo, a njegovo glavno djelo, Tečaj, bio je prijepis nekoliko kolegija iz opće lingvistike koje je držao 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika za razliku od rada u povijesnoj lingvistici koji je obavljen u devetnaestom stoljeću. Taj je rad jedno od velikih postignuća zapadnog intelekta: uzimanje određenih riječi kao građevnih blokova jezika, povijesna (ili "dijakronijska") lingvistika pratila je podrijetlo i razvoj zapadnih jezika iz pretpostavljenog izvora zajedničkog jezika, prvo "indoeuropskog" jezika, a zatim ranijeg "p roto-indoeuropski" jezik.

Saussure je doveo u pitanje upravo to proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mase činjenica o jeziku, koje je povijesna lingvistika tako detaljno proučavala, na podnošljiv broj prijedloga. "Komparativna škola" filologije devetnaestog stoljeća, kaže Saussure u Tečaju, "nije uspjela uspostaviti pravu znanost lingvistike" jer "nije uspjela pronaći prirodu svog predmeta proučavanja" (3). Ta se "priroda", tvrdi on, ne nalazi samo u "elementarnim" riječima koje jezik sadrži - naizgled "pozitivnim" činjenicama (ili "supstancama") jezika - već u formalnim odnosima koji dovode do tih "tvari".

Saussureovo sustavno preispitivanje jezika temelji se na tri pretpostavke. Prva je da znanstveno proučavanje jezika treba razvijati i proučavati sustav, a ne povijest jezičnih pojava. Iz tog razloga on razlikuje posebne pojave jezika - njegove posebne "govorni događaji", koje on označava kao parole - i pravi predmet lingvistike, sustav (ili "kod") koji upravlja tim događajima, a koje on označava kao langue. Takva sustavna studija, štoviše, poziva na "sinkronijsko" koncepcija odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz povijest.

Ova pretpostavka dovela je do onoga što je Roman Jakobson 1929. godine označio kao "strukturalizam", u kojem se "bilo koji skup fenomena koji ispituje suvremena znanost ne tretira kao mehanička aglomeracija, već kao strukturna cjelina, mehanička koncepcija procesa podliježe pitanju njihove funkcije" ("Romantika" 711). U ovom odlomku Jakobson artikulira Saussureovu namjeru da definira lingvistiku kao znanstveni sustav nasuprot jednostavnom, "mehaničkom" obračunu povijesnih nezgoda. Uz to, štoviše, Jakobson također opisuje drugu temeljnu pretpostavku u Saussureanu - možemo sada to nazovimo "strukturnim" - lingvistikom: da se osnovni elementi jezika mogu proučavati samo u odnosu na njihove funkcije, a ne u odnosu na njihove uzroke. europske "riječi"), ti događaji i entiteti moraju biti smješteni unutar sistemskog okvira u kojem su povezani s drugim takozvanim događajima i entitetima. Ovo je radikalna preorijentacija u poimanju iskustva i fenomena, čiju je važnost filozof Ernst Cassirer usporedio s "novom Galileijevom znanošću koja je u sedamnaestom stoljeću promijenila cijelu našu koncept fizičkog svijeta" (citirano u Culler, Pursuit 2 4). Ova promjena, kao što primjećuju Greimas i Courtes, ponovno shvaća "interpretaciju" i tako ponovno shvaća objašnjenje i razumijevanje samih sebe. Umjesto da objašnjenje "postoji u terminima uzroka fenomena, tako da je, kao "posljedica", na neki način podređeno svojim uzrocima, objašnjenje se ovdje sastoji u podređivanju fenomena njegovoj "funkciji" usmjerenoj na budućnost ili "Svrha." Objašnjenje više nije neovisno o ljudskim namjerama ili svrhama (iako te namjere mogu biti neosobne, zajedničke ili, u Freudovim terminima, "nesvjesne").

U svojoj lingvistici Saussure ostvaruje ovu transformaciju posebno u redefiniranju jezične "riječi", koju opisuje kao jezični "znak" i definira funkcionalističkim terminima. Znak je, tvrdi on, spoj "koncepta i zvučne slike", koju je nazvao "označeno i označitelj" (66-67; prijevod Roya Harrisa iz 1983. nudi izraze "označenje" i "signal"). Priroda njihove "kombinacije" je "funkcionalna" utoliko što ni označeno ni označitelj nisu "uzrok" drugoga; radije, "svako svoje vrijednosti iz drugog" (8). element jezika, znak , relacijski i čini temeljnu pretpostavku povijesne lingvistike, naime, identitet elementarnih jedinica jezika i označavanja (tj. "riječi"), predmetom rigorozne analize. Riječ "stablo" kao "ista" riječ nije zato što riječ je definirana inherentnim kvalitetama - to nije "mehanička nakupina" takvih kvaliteta - već zato što je definirana kao element u sustavu, "strukturnoj cjelini" jezika.

Takva relacijska (ili "dijakritička") definicija entiteta upravlja koncepcijom svih elemenata jezika u strukturalnoj lingvistici. To je najjasnije u najdojmljivijem postignuću saussureovske lingvistike, razvoju pojmova "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje artikulirane i označavajuće jedinice jezika. To nisu zvukovi koji se pojavljuju u jeziku, već "zvučne slike" koje spominje Saussure, a koje govornici shvaćaju - fenomenalno shvaćaju - kao prenošenje značenja. (Dakle, Elmar Holenstein opisuje Jakobsonovu lingvistiku, koja na važne načine slijedi Saussurea, kao "fenomenološki strukturalizam".) Iz tog je razloga vodeći glasnogovornik strukturalizma Praške škole, Jan Mukarovsky, primijetio 1937. da je "struktura . . . je fenomenološka a ne empirijska stvarnost; nije djelo samo po sebi, već skup funkcionalnih odnosa koji se nalaze u svijesti kolektiva (generacije, sredine, itd.)" (citirano u Galan 35). Slično, Levi-Strauss, vodeći glasnogovornik francuskog strukturalizma , primijetio je 1960. da "struktura nema poseban sadržaj; on je sam sadržaj, a logična organizacija u kojoj je uhićen zamišljena je kao svojstvo stvarnog" (167; vidi također Jakobson, Fundamentals 27-28).

Fonemi, dakle, najmanji perceptibilni elementi jezika, nisu pozitivni objekti nego "fenomenološka stvarnost". U engleskom jeziku, na primjer, fonem /t/ može se izgovoriti na mnogo različitih načina, ali u svim će slučajevima govornik engleskog prepoznati da funkcionira kao /t/. Aspirirano t (tj. t koje se izgovara s dahom nalik na h nakon njega), visoki ili niski t, produženi t i tako dalje, svi će funkcionirati na isti način u razlikovanju značenja "to" i "do" na engleskom. Štoviše, razlike među jezicima su takve da fonološke varijacije u jednom jeziku mogu činiti različite foneme u drugom; stoga engleski razlikuje /l/ i /r/, dok su drugi jezici tako strukturirani da se te artikulacije smatraju varijacijama istog fonema (poput aspiriranog i neaspiriranog t u engleskom). U svakom prirodnom jeziku, veliki broj mogućih riječi je kombinacija malog broja fonema. Engleski, na primjer, posjeduje manje od 40 fonema koji se kombiniraju u više od milijun različitih riječi.

Fonemi jezika sami su sustavno organizirane strukture obilježja. U 1920-im i 1930-im godinama, slijedeći Saussureovo vodstvo, Jakobson i N. S. Trubetzkoy izolirali su "različite značajke" fonema. Te se značajke temelje na fiziološkoj strukturi govornih organa - jezika, zuba, glasnica i tako dalje - da Saussure spominje u Tečaju i koje Harris opisuje kao "fiziološku fonetiku" (39; Baskinov raniji prijevod koristi izraz "fonologija" [(1959) 38]) - i oni se kombiniraju u "snopove" binarnih opozicija da tvore foneme. Na primjer, u engleskom jeziku razlika između /t/ i /d/ je prisutnost ili odsutnost "glasa" (angažiranja glasnica), a na razini glasanja ovi se fonemi uzajamno definiraju. Na taj je način fonologija specifičan primjer općeg pravila jezika koje je opisao Saussure: U jeziku postoje samo razlike. još važnije: razlika općenito podrazumijeva pozitivne pojmove između kojih se razlika postavlja; ali u jeziku postoje samo razlike bez pozitivnih pojmova. Bilo da uzmemo označeno ili označitelj, jezik nema niti ideje niti zvukove koji su postojali prije jezičnog sustava. ( 120)

U tom okviru, jezični identiteti nisu određeni inherentnim kvalitetama, već sustavnim ("strukturalnim") odnosima.

Rekao sam da je fonologija "sljedila vodstvo" Saussurea, jer iako bi se njegova analiza fiziologije jezične produkcije "danas", kako kaže Harris, "nazvala "fizičkom", za razliku od "psihološke" ili "funkcionalne", "" (Lektira 49), stoga je u Tečaju artikulirao smjer i obrise funkcionalne analize jezika. Slično tome, njegovo jedino prošireno objavljeno djelo, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoari o primitivnom sustavu samoglasnika u indoeuropskim jezicima), koje se pojavilo 1878., bilo je u potpunosti smješteno unutar projekta devetnaestog- stoljeća povijesna lingvistika. Unatoč tome, unutar ovog rada, kao što je tvrdio Jonathan Culler, Saussure je pokazao "plodnost razmišljanja o jeziku kao sustavu čisto relacijskih stavki, čak i kada radi na zadatku povijesne rekonstrukcije" (Saussure 66). Analizirajući sustavne strukturne odnose među fonemima kako bi se objasnili obrasci izmjene samoglasnika u postojećim indoeuropskim jezicima, Saussure je sugerirao da je uz nekoliko različitih fonema /a/ morao postojati još jedan fonem koji se može formalno opisati. "Ono što Saussureov rad čini tako vrlo dojmljivim," zaključuje Culler, "je činjenica da je gotovo pedeset godina kasnije, kada je klinasti hetitski jezik otkriven i dešifriran, pronađeno da sadrži fonem, napisan h, koji se ponašao kako je Saussure predvidio . On je čisto formalnom analizom otkrio ono što je danas poznato kao laringeali Indo-Europljana" (66).

Ova koncepcija relacijske ili dijakritičke determinacije elemenata označavanja, koja je i implicitna i eksplicitna u Tečaju, sugerira treću pretpostavku koja upravlja strukturnom lingvistikom, što Saussure naziva "proizvoljnom prirodom znaka". Time želi reći da odnos između označitelja i označenog u jeziku nikada nije nužan (ili "motiviran"): moglo bi se jednako lako pronaći zvučni označitelj arbre kao i stablo označitelja da se ujedine s pojmom "stablo". Ali više od ovoga, to znači da je označeno također proizvoljno: moglo bi se lako definirati pojam "stablo" njegovom drvenastom kvalitetom (što bi isključilo palme) kao i njegovom veličinom (koja isključuje "nisko drvenaste biljke" grmlje poziva). Ovo bi trebalo razjasniti da numeriranje pretpostavki koje sam predstavio ne predstavlja redoslijed prioriteta: svaka pretpostavka - sustavna priroda označavanja (koju je najbolje shvatiti "sinkronim" proučavanjem jezika), relacijska ili "dijakritička" priroda elemenata značenja, proizvoljna priroda znakova - crpi svoju vrijednost iz drugih.

To jest, saussureovska lingvistika je fenomen koji proučava u sveobuhvatnim odnosima kombinacije i kontrasta u jeziku. U ovoj koncepciji jezik je i proces artikulacije značenja (označavanje) i njegov proizvod (komunikacija), a te dvije funkcije jezika nisu niti identične niti potpuno podudarne (vidi Schleifer, "Deconstruction"). Ovdje možemo vidjeti izmjenu forme i sadržaja koju Greimas i Courtes opisuju u modernističkoj interpretaciji: jezik predstavlja kontraste koji formalno definiraju njegove jedinice, a te se jedinice kombiniraju na sljedećim razinama kako bi stvorile sadržaj označavanja. Budući da su elementi jezika proizvoljni, štoviše, ni kontrast ni kombinacija ne mogu se reći da su osnovni. Dakle, u jeziku se razlikovna obilježja kombiniraju da tvore kontrastne foneme na drugoj razini shvaćanja, fonemi se kombiniraju da tvore kontrastne morfeme, morfemi se kombiniraju da tvore riječi, riječi se kombiniraju da tvore rečenice, i tako dalje. U svakom slučaju, cijeli fonem, ili riječ, ili rečenica, i tako dalje, veći je od zbroja svojih dijelova (baš kao što je voda, H2O, u Saussureovom primjeru [(1959) 103] više od mehaničke aglomeracije vodika i kisika).

Tri pretpostavke Tečaja opće lingvistike navele su Saussurea da pozove na novu znanost dvadesetog stoljeća koja bi nadišla lingvističku znanost kako bi proučavala "život znakova unutar društva". Saussure je ovu znanost nazvao "semiologija (od grčkog semeion "znak")" (16). "Znanost" semiotike, kako se počela prakticirati u istočnoj Europi 1920-ih i 1930-ih i Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književne artefakte sastavljene (ili artikulirane) tim strukturama. Tijekom kasnog dijela svoje karijere, štoviše, čak i dok je držao kolegije iz opće lingvistike, Saussure je slijedio vlastitu "semiotičku" analizu kasne latinske poezije u pokušaju da otkrije namjerno skrivene anagrame vlastitih imena. Metoda proučavanja bila je umnogome suprotna funkcionalnom racionalizmu njegovih lingvističkih analiza: pokušala je, kao što Saussure spominje u jednoj od 99 bilježnica u kojima je nastavio studij, sustavno ispitati problem "slučajnosti", koja " postaje neizbježan temelj svega" (citirano u Starobinski 101). Takva se studija, kako sam Saussure kaže, usredotočuje na "materijalnu činjenicu" slučajnosti i značenja (citirano 101), tako da je "tema-riječ" čiji anagram Saussure traži, kako tvrdi Jean Starobinski, "za pjesnika , instrument, a ne vitalna klica pjesme. Od pjesme se zahtijeva ponovno korištenje foničkih materijala teme-riječi" (45). U ovoj analizi Starobinski kaže: "Saussure se nije izgubio u potrazi za skrivenim značenjima." Umjesto toga, čini se da njegov rad pokazuje želju da izbjegne sve probleme koji proizlaze iz svijesti: "Budući da poezija nije samo ostvarena u riječima nego je nešto rođeno iz riječi, ona izmiče proizvoljnoj kontroli svijesti kako bi ovisila isključivo o vrsti jezične zakonitosti "(121).

To jest, Saussureov pokušaj da otkrije vlastita imena u kasnoj latinskoj poeziji - ono što Tzvetan Todorov naziva redukcijom "riječi". . . svom označitelju" (266) - naglašava jedan od elemenata koji je upravljao njegovom lingvističkom analizom, proizvoljnu prirodu znaka. (Također naglašava formalnu prirodu Saussureove lingvistike - "Jezik", tvrdi on, "je oblik, a ne tvar" - koja učinkovito eliminira semantiku kao glavni predmet analize.) Kao što Todorov zaključuje, Saussureovo djelo danas se čini izrazito homogenim u svom odbijanju prihvaćanja simboličkih fenomena. . . . U svojim istraživanjima anagrama obraća pozornost samo na fenomene ponavljanja, ne i na one evokacije. . . . U svojim studijama o Nibelunzima on prepoznaje simbole samo kako bi ih pripisao pogrešnim čitanjima: budući da nisu namjerni, simboli ne postoje. Konačno, u svojim kolegijima o općoj lingvistici, on razmatra postojanje semiologije, a time i znakova koji nisu lingvistički; ali ta je afirmacija istodobno ograničena činjenicom da je semiologija posvećena jednoj vrsti znakova: onima koji su proizvoljni. (269-70)

Ako je to istina, to je zato što Saussure nije mogao pojmiti "namjeru" bez subjekta; nije mogao posve izbjeći suprotnost između forme i sadržaja koju je njegov rad toliko doveo u pitanje. Umjesto toga, pribjegao je "jezičnoj zakonitosti". Smješten između, s jedne strane, devetnaestostoljetnih koncepcija povijesti, subjektivnosti i načina uzročne interpretacije kojim upravljaju te koncepcije i, s druge strane, dvadesetostoljetnih "strukturalističkih" koncepcija onoga što je Levi-Strauss nazvao "kantijanizmom bez transcendentalni subjekt" (citiran u Connerton 23) - koncepti koji brišu suprotnost između forme i sadržaja (ili subjekta i objekta) i hijerarhije prednjeg i pozadinskog plana u potpunom strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici - Ferdinandovo djelo de Saussure u lingvistici i semiotici opisuje signalni trenutak u proučavanju značenja i kulture.

Ronald Schleifer

Dodatak 2

Ferdinand de Saussure (prijevod)

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) smatra se utemeljiteljem moderne lingvistike - zahvaljujući njegovim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i oblika riječi. Uglavnom, temelji strukturalnih metoda u lingvistici i književnoj kritici, au velikoj mjeri i semiotike, postavljeni su u njegovim radovima na samom početku dvadesetog stoljeća. Dokazano je da metode i koncepti takozvanog "poststrukturalizma", razvijeni u djelima Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih, sežu do lingvističkih radova Saussurea i anagramska čitanja kasnorimske poezije. Valja napomenuti da Saussureov rad na lingvistici i jezičnoj interpretaciji pomaže u povezivanju širokog spektra intelektualnih disciplina – od fizike do književnih inovacija, psihoanalize i filozofije ranog dvadesetog stoljeća. A. J. Greimas i J. Kurte u Semiotici i jeziku pišu: “Početkom 20. stoljeća uz Saussureovu lingvistiku, Husserlovu fenomenologiju i psihoanalizu pojavio se analitički rječnik s naslovom “Tumačenje” kao nova vrsta tumačenja. od Freuda. U takvom slučaju, "interpretacija nije pripisivanje određenog sadržaja obliku koji bi inače nedostajao; radije, to je parafraza koja na drugi način formulira isti sadržaj značajnog elementa unutar danog semiotičkog sustava" (159). ). U ovakvom shvaćanju "tumačenja" forma i sadržaj su neodvojivi; naprotiv, svaki je oblik ispunjen semantičkim značenjem (“smisleni oblik”), pa interpretacija nudi novo, slično prepričavanje nečeg smislenog u drugom znakovnom sustavu.

Slično shvaćanje forme i sadržaja, koje je iznio Claude Lévi-Strauss u jednom od programskih djela strukturalizma, ("Struktura i forma: Razmišljanja o djelima Vladimira Proppa"), može se vidjeti u Saussureovoj posthumnoj knjizi, Tečaj u Opća lingvistika (1916, prev., 1959, 1983). Za života Saussure je malo objavljivao, "Tečaj" - njegovo glavno djelo - sakupljen je iz bilježaka studenata koji su slušali njegova predavanja iz opće lingvistike 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika, suprotstavljajući ga komparativno-povijesnoj lingvistici devetnaestog stoljeća. Ovo se djelo može smatrati jednim od najvećih dostignuća zapadne misli: uzimajući kao temelj pojedinačne riječi kao strukturne elemente jezika, povijesna (ili "dijakronijska") lingvistika dokazala je podrijetlo i razvoj zapadnoeuropskih jezika od zajednički, indoeuropski jezik – i raniji protoindoeuropski.

Saussure je doveo u pitanje upravo ovo proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mnogih činjenica o jeziku koje poredbena lingvistika ležerno proučava na mali broj teorema. Komparativna filološka škola 19. stoljeća, piše Saussure, "nije uspjela stvoriti pravu lingvističku školu" jer "nije shvaćala bit predmeta proučavanja" (3). Ta "bit", tvrdi on, ne leži samo u pojedinačnim riječima - "pozitivnim supstancama" jezika - već iu formalnim vezama koje pomažu tim supstancama da postoje.

Saussureov "test" jezika temelji se na tri pretpostavke. Prvo, znanstveno razumijevanje jezika ne temelji se na povijesnom, već na strukturnom fenomenu. Stoga je razlikovao pojedine jezične pojave - "govorne događaje", koje definira kao "parole" - i pravi, po njegovu mišljenju, predmet proučavanja lingvistike, sustav (kod, struktura) koji upravlja tim događajima ( "jezik"). Takvo sustavno proučavanje, osim toga, zahtijeva "sinkronijsko" poimanje odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz njegovu povijest.

Ta je hipoteza bila preteča onoga što će Roman Jakobson 1929. nazvati "strukturalizmom" - teorijom u kojoj se "svaki skup fenomena koji istražuje moderna znanost ne smatra mehaničkom akumulacijom, već strukturnom cjelinom u kojoj je konstruktivna komponenta u korelaciji s funkcija" ("Romantična" 711). U ovom odlomku Jakobson je formulirao Saussureovu ideju o definiranju jezika kao strukture, nasuprot "mehaničkom" nabrajanju povijesnih događaja. Uz to, Jakobson razvija još jednu Saussureovu pretpostavku, koja je postala preteča strukturne lingvistike: osnovne elemente jezika treba proučavati u vezi ne toliko s njihovim uzrocima, koliko s njihovim funkcijama. Zasebne pojave i događaje (recimo, povijest podrijetla pojedinih indoeuropskih riječi) ne treba proučavati same po sebi, već u sustavu u kojem su u korelaciji sa sličnim komponentama. Bio je to radikalan zaokret u usporedbi pojava s okolnom stvarnošću, čije je značenje filozof Ernst Cassirer usporedio s "znanošću Galileja, koja je u sedamnaestom stoljeću preokrenula ideje o materijalnom svijetu", posljedično, i sama objašnjenja. Pojave su se počele tumačiti ne u odnosu na uzroke njihove pojave, već u odnosu na učinak koji mogu imati u sadašnjosti i budućnosti.Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, “nesvjesno” u frojdovskom smislu riječi).

U svojoj lingvistici Saussure posebno pokazuje taj zaokret u promjeni pojma riječi u lingvistici koju definira kao znak i opisuje u smislu njezinih funkcija. Znak je za njega spoj zvuka i značenja, "označeno i oznaka" (66-67; u engleskom prijevodu Roya Harrisa iz 1983. - "označenje" i "signal"). Priroda ovog spoja je "funkcionalna" (ni jedan ni drugi element ne mogu postojati jedan bez drugog); štoviše, "jedni posuđuju osobine od drugih" (8). Tako Saussure definira glavni strukturni element jezika - znak - i čini osnovom povijesne lingvistike istovjetnost znakova s ​​riječima, što zahtijeva posebno rigoroznu analizu. Stoga možemo razumjeti različita značenja, recimo, iste riječi "drvo" - ne zato što je riječ samo skup određenih kvaliteta, već zato što je definirana kao element u sustavu znakova, u "strukturnoj cjelini", u jeziku.

Takav relativni ("dijakritički") koncept jedinstva je temelj koncepta svih elemenata jezika u strukturnoj lingvistici. To je posebno jasno u najizvornijem otkriću Saussureove lingvistike, u razvoju pojma "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje govorne i smislene jezične jedinice. To nisu samo zvukovi koji se pojavljuju u jeziku, već "zvučne slike", napominje Saussure, koje izvorni govornici percipiraju kao da imaju značenje. (Valja napomenuti da Elmar Holenstein naziva Jakobsonovu lingvistiku, koja u svojim glavnim odredbama nastavlja ideje i koncepte Saussurea, "fenomenološkim strukturalizmom"). Zato je vodeći govornik Praške škole strukturalizma, Jan Mukarowski, 1937. primijetio da je “struktura. . . ne empirijski, nego fenomenološki koncept; nije sam rezultat, već skup značajnih odnosa kolektivne svijesti (generacija, drugi itd.)”. Sličnu misao iznio je 1960. Lévi-Strauss, vođa francuskog strukturalizma: “Struktura nema određeni sadržaj; ona je sama po sebi smislena, a logična konstrukcija u kojoj je zatvorena je otisak stvarnosti.

S druge strane, fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu cjelovitu "fenomenološku stvarnost". Na primjer, u engleskom se glas "t" može različito izgovoriti, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Aspirirani, povišeni ili sniženi, dugi zvuk "t" itd. jednako će razlikovati značenje riječi "to" i "do". Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" u engleskom su različiti, dok su u drugim jezicima varijante istog fonema (poput engleskog "t", izgovorenog sa i bez aspiracije). Ogromni rječnik svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika su sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, nakon Saussurea, Jacobson i N.S. Trubetskoy izdvojili su "odlike" fonema. Te se značajke temelje na građi organa govora – jezika, zuba, glasnica – Saussure to uočava u „Tečaju opće lingvistike“, a Harris to naziva „fiziološkom fonetikom“ (u Baskinovom ranijem prijevodu termin „fonologija“). " se koristi) - povezani su u "čvorove » durg protiv prijatelja da proizvode zvukove. Na primjer, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg jezičnog pravila koje je opisao Saussure: "Postoje samo razlike u jeziku." Još važnije nije ovo: razlika obično implicira točne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da se radi o "označavanju" ili "označenom" - u jeziku nema niti pojmova niti glasova koji bi postojali prije razvoja jezičnog sustava.

U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih svojstava, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Već sam spomenuo da se fonologija u svom razvoju oslanjala na ideje Saussurea. Iako bi se njegova analiza lingvističke fiziologije u moderno doba, kaže Harris, "nazvala 'fizičkom', za razliku od 'psihološke' ili 'funkcionalne', u Tečaju je jasno artikulirao smjer i osnovna načela funkcionalne analize jezika. Njegovo jedino djelo objavljeno za njegova života, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Bilješke o izvornom sustavu samoglasnika u indoeuropskim jezicima), objavljeno 1878., bilo je potpuno u skladu s komparativnom povijesnom lingvistikom 19. stoljeća. Ipak, u ovom je djelu, kaže Jonathan Culler, Saussure pokazao "plodnost ideje o jeziku kao sustavu međusobno povezanih fenomena, čak i uz njegovu povijesnu rekonstrukciju". Analizirajući odnos između fonema, objašnjavajući izmjenu samoglasnika u modernim jezicima indoeuropske skupine, Saussure je sugerirao da osim nekoliko različitih zvukova "a", moraju postojati i drugi fonemi opisani formalno. “Ono što čini poseban dojam u Saussureovom radu,” zaključuje Kaller, “jest da je gotovo 50 godina kasnije, kada je otkriven i dešifriran hetitski klinasti zapis, pronađen fonem, u pisanju označen sa “h”, koji se ponašao kako je Saussure predvidio. Kroz formalnu analizu otkrio je ono što je danas poznato kao grleni zvuk u indoeuropskim jezicima.

U konceptu relativne (dijakritičke) definicije znakova, eksplicitnoj i impliciranoj u Tečaju, postoji treća ključna pretpostavka strukturalne lingvistike, koju je Saussure nazvao "arbitrarna priroda znaka". Time se misli da odnos između zvuka i značenja u jeziku nije ničim motiviran: jednako se lako može povezati riječ "arbre" i riječ "drvo" s pojmom "drvo". Štoviše, to znači da je i zvuk proizvoljan: pojam "stabla" može se definirati prisutnošću kore (osim palmi) i veličinom (osim "niskih drvenastih biljaka" - grmova). Iz ovoga bi trebalo biti jasno da se sve pretpostavke koje iznosim ne dijele na više i manje važne: svaka od njih - sustavna priroda znakova (najrazumljivija u "sinkronom" proučavanju jezika), njihova relativna (dijakritička) bit , proizvoljna priroda znakova - dolazi od ostatka.

Tako se u saussureovskoj lingvistici proučavani fenomen shvaća kao skup usporedbi i opreka jezika. Jezik je i izraz značenja riječi (oznaka) i njihov rezultat (komunikacija) – a te se dvije funkcije nikada ne podudaraju (vidi Shleiferovu "Dekonstrukciju jezika"). Možemo vidjeti izmjenu oblika i sadržaja koju Greimas i Kurte opisuju u posljednjoj verziji tumačenja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju na uzastopnim razinama kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u kontrastne morfeme, morfemi - u riječi, riječi - u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od zbroja svojih dijelova (kao što je voda, u Saussureovom primjeru, više od kombinacije vodika i kisika).

Tri pretpostavke "Tečaja opće lingvistike" dovele su Saussurea do ideje o novoj znanosti dvadesetog stoljeća, odvojenoj od lingvistike, proučavanju "života znakova u društvu". Saussure je ovu znanost nazvao semiologijom (od grčkog "semeion" - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili formulirana) s tim strukturama. Osim toga, u zalasku svoje karijere, paralelno s tečajem opće lingvistike, Saussure se bavio "semiotičkom" analizom kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bio je to pokušaj, kako Saussure piše u jednoj od 99 bilježnica, da se u sustavu proučava problem "vjerojatnosti", koji "postaje temeljem svega. " Takvo istraživanje, sam Saussure tvrdi, pomaže usredotočiti se na "pravu stranu" vjerojatnosti; “Ključna riječ” za koju Saussure traži anagram je, prema Jeanu Starobinskom, “oruđe za pjesnika, a ne izvor života za pjesmu. Pjesma služi za preokretanje zvukova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure se ne upušta u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi pokreću, ona nadilazi kontrolu svijesti i ovisi samo o zakoni jezika."

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji (Tsvetan Todorov je ovo nazvao skraćenicom od "riječ ... samo prije nego što je napisana") naglašava jednu od komponenti njegove lingvističke analize - proizvoljnu prirodu znakova, kao i formalna bit saussureovske lingvistike ("Jezik", tvrdi on, "bit oblika, a ne fenomena"), koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas Saussureovi spisi čine nevjerojatno dosljednima u svojoj nevoljkosti proučavanju simbola [fenomena koji ima dobro definirano značenje]. . . . Istražujući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne opcije. . . . Proučavajući Nibelungenlied, on definira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerna, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on iznosi pretpostavku o postojanju semiologije koja opisuje ne samo jezične znakove; ali ta je pretpostavka ograničena činjenicom da semilogija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti "namjeru" bez objekta; nije mogao do kraja premostiti jaz između forme i sadržaja – u njegovim se spisima to pretvorilo u pitanje. Umjesto toga, okrenuo se "jezičnom legitimitetu". Između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnim pretpostavkama, te metoda slučajnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koje je Lévi-Strauss nazvao "kantijanizam bez transcendenta". glumac" - brisanje konfrontacije između forme i sadržaja (subjekta i objekta), značenja i podrijetla u strukturalizmu, psihoanalizi pa čak i kvantnoj mehanici - radovi Ferlinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i Kultura.

Ronald Shleifer

Književnost

1. Admoni V.G. Osnove teorije gramatike / V.G. Admoni; Akademija znanosti SSSR-a.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematičke metode u lingvistici. M., 1974.

4. Arnold I.V. Semantička struktura riječi u suvremenom engleskom jeziku i metodologija njezina proučavanja. /I.V. Arnold-L .: Obrazovanje, 1966. - 187 str.

6.Bashlykov A.M. Sustav za automatsko prevođenje. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 str.

7.Baudouin de Courtenay: Teorijska baština i suvremenost: Sažeci priopćenja s međunarodnog znanstvenog skupa / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 str.

8. A. V. Gladkiy, Elementi matematičke lingvistike. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 str.

9. Golovin, B.N. Jezik i statistika. /B.N. Golovin - M., 1971. - 210 str.

10. Zvegincev, V.A. Teorijska i primijenjena lingvistika. / V.A. Zvegincev - M., 1969. - 143 str.

11. Kasevich, V.B. Semantika. Sintaksa. Morfologija. // V.B. Kasevich - M., 1988. - 292 str.

12. Lekomtsev Yu.K. UVOD u formalni jezik lingvistike / Yu.K. Lekomcev. - M.: Nauka, 1983, 204 str., ilustr.

13. Jezična baština Baudouina de Courtenaya na kraju 20. stoljeća: Sažeci međunarodnog znanstveno-praktičnog skupa 15.-18.3.2000. - Krasnojarsk, 2000. - 125 str.

Matveeva G.G. Skrivena gramatička značenja i identifikacija društvene osobe (“portret”) govornika / G.G. Matveev. - Rostov, 1999. - 174 str.

14. Melchuk, I.A. Iskustvo u izgradnji jezičnih modela „Značenje<-->Tekst". / I.A. Melchuk. - M., 1974. - 145 str.

15. Nelyubin L.L. Prevođenje i primijenjena lingvistika / L.L. Nelyubin. - M.: Viša škola, 1983. - 207 str.

16. O egzaktnim metodama istraživanja jezika: o takozvanoj "matematičkoj lingvistici" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva i drugi - M., 1961. - 162 str.

17. Piotrovsky L.G. Matematička lingvistika: udžbenik / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaja. - M.: Viša škola, 1977. - 160 str.

18. On je. Tekst, stroj, osoba. - L., 1975. - 213 str.

19. On je. Primijenjena lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 str.

20. Revzin, I.I. jezični modeli. M., 1963. Revzin, I.I. Moderna strukturalna lingvistika. Problemi i metode. M., 1977. - 239 str.

21. Revzin, I.I., Rozentsveig, V.Yu. Osnove općeg i strojnog prevođenja / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 str.

22. Slyusareva N.A. Teorija F. de Saussurea u svjetlu moderne lingvistike / N.A. Sljusareva. - M.: Nauka, 1975. - 156 str.

23. Sova, L.Z. Analitička lingvistika / L.Z. Sova - M., 1970. - 192 str.

24. Saussure F. de. Bilješke o općoj lingvistici / F. de Saussure; Po. od fr. - M.: Napredak, 2000. - 187 str.

25. On je. Tečaj opće lingvistike / Per. od fr. - Jekaterinburg, 1999. -426 str.

26. Statistika govora i automatska analiza teksta / Ed. izd. R.G. Piotrovski. L., 1980. - 223 str.

27. Stoll, P. Setovi. Logika. Aksiomatske teorije / R. Stoll; Po. s engleskog. - M., 1968. - 180 str.

28. Tenier, L. Osnove strukturne sintakse. M., 1988.

29. Ubin I.I. Automatizacija prevoditeljskih aktivnosti u SSSR-u / I.I. Ubin, L.Yu. Korostelev, B.D. Tihomirov. - M., 1989. - 28 str.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderna matematika. M., 1966.

31. Shenk, R. Obrada konceptualnih informacija. M., 1980.

32. Shikhanovich, Yu.A. UVOD u suvremenu matematiku (početni pojmovi). M., 1965

33. Shcherba L.V. Ruski samoglasnici u kvalitativnom i kvantitativnom smislu / L.V. Shcherba - L.: Nauka, 1983. - 159 str.

34. Abdullah-zade F. Građanin svijeta // Iskra - 1996. - br.5. - str.13

35. V.A. Uspenski. Preliminarno za čitatelje "Nove književne revije" na semiotičke poruke Andreja Nikolajeviča Kolmogorova. - Nova književna smotra. -1997. - Broj 24. - S. 18-23

36. Perlovsky L. Svijest, jezik i kultura. - Znanje je moć. -2000. №4 - S. 20-33

Uvod? Teorija prijevoda predavanja

2.4 Perspektive primjene matematičkih metoda u lingvistici

U eri računalne tehnologije metode matematičke lingvistike dobile su novu razvojnu perspektivu. Potraga za rješenjima problema lingvističke analize danas se sve više provodi na razini informacijskih sustava. Istodobno, automatizacija procesa obrade jezične građe, pružajući istraživaču značajne mogućnosti i prednosti, neminovno pred njega postavlja nove zahtjeve i zadatke.

Kombinacija "egzaktnog" i "humanitarnog" znanja postala je plodno tlo za nova otkrića na polju lingvistike, informatike i filozofije.

Strojno prevođenje s jednog jezika na drugi ostaje brzorastuća grana informacijske tehnologije. Unatoč činjenici da se računalno potpomognuto prevođenje po kvaliteti nikako ne može usporediti s ljudskim prevođenjem (osobito književnih tekstova), stroj je postao nezamjenjiv pomoćnik čovjeku u prevođenju velikih količina teksta. Vjeruje se da će se u bliskoj budućnosti stvoriti napredniji sustavi prevođenja koji će se prvenstveno temeljiti na semantičkoj analizi teksta.

Jednako obećavajuće područje je interakcija lingvistike i logike, koja služi kao filozofski temelj za razumijevanje informacijske tehnologije i takozvane "virtualne stvarnosti". U bliskoj budućnosti nastavit će se rad na stvaranju sustava umjetne inteligencije – iako ona, opet, po svojim mogućnostima nikada neće biti ravna ljudskoj. Takvo natjecanje je besmisleno: u naše vrijeme stroj bi trebao postati (i postaje) ne suparnik, već pomoćnik čovjeka, ne nešto iz domene fantazije, već dio stvarnog svijeta.

Proučavanje jezika statističkim metodama se nastavlja, što omogućuje točnije određivanje njegovih kvalitativnih svojstava. Važno je da najsmjelije hipoteze o jeziku nađu svoj matematički, a time i logički dokaz.

Najznačajnije je to što su se različite grane primjene matematike u lingvistici, prethodno prilično izolirane, posljednjih godina povezale jedna s drugom povezujući se u koherentan sustav, analogno jezičnom sustavu koji je prije jednog stoljeća otkrio Ferdinand de Saussure i Yvan Baudouin de Courtenay. To je kontinuitet znanstvenih spoznaja.

Lingvistika je u suvremenom svijetu postala temelj razvoja informacijske tehnologije. Sve dok je računalna znanost grana ljudske djelatnosti koja se brzo razvija, spoj matematike i lingvistike i dalje će igrati svoju ulogu u razvoju znanosti.


Zaključak

Tijekom 20. stoljeća računalne su tehnologije prešle dug put - od vojne do miroljubive uporabe, od uskog spektra ciljeva do prodora u sva područja ljudskog života. Matematika kao znanost s razvojem računalne tehnologije dobiva sve novi praktični značaj. Ovaj proces traje i danas.

Dotad nezamisliv "tandem" "fizičara" i "liričara" postao je stvarnost. Za potpunu interakciju matematike i informatike s humanističkim znanostima bili su potrebni kvalificirani stručnjaci s obje strane. Dok informatičarima sve više trebaju sustavna humanitarna znanja (jezična, kulturološka, ​​filozofska) kako bi shvatili promjene u stvarnosti koja ih okružuje, u interakciji čovjeka i tehnologije, razvili sve više novih jezičnih i mentalnih koncepata, pisali programa, onda svaki "Humanist" u našem vremenu za svoj profesionalni razvoj mora savladati barem osnove rada s računalom.

Matematika, koja je usko povezana s informatikom, nastavlja se razvijati i djelovati s prirodnim i humanističkim znanostima. U novom stoljeću trend matematizacije znanosti ne slabi, nego se, naprotiv, pojačava. Na temelju kvantitativnih podataka shvaćaju se zakonitosti razvoja jezika, njegove povijesne i filozofske karakteristike.

Matematički formalizam je najprikladniji za opisivanje obrazaca u lingvistici (kao, uostalom, iu drugim znanostima, kako humanističkim tako i prirodnim). Situacija se ponekad u znanosti razvija na takav način da je bez upotrebe odgovarajućeg matematičkog jezika nemoguće razumjeti prirodu fizikalnih, kemijskih itd. proces nije moguć. Stvaranje planetarnog modela atoma, poznati engleski fizičar XX. stoljeća. E. Rutherford je imao matematičkih poteškoća. Isprva njegova teorija nije bila prihvaćena: nije zvučala uvjerljivo, a razlog tome bilo je Rutherfordovo nepoznavanje teorije vjerojatnosti, na temelju čijeg je mehanizma jedino bilo moguće razumjeti modelski prikaz međudjelovanja atoma. Uvidjevši to, već tada vrsni znanstvenik, dobitnik Nobelove nagrade, upisao je seminar matematičara profesora Lamba i dvije godine zajedno sa studentima pohađao tečaj i radionicu iz teorije vjerojatnosti. . Na temelju njega Rutherford je uspio opisati ponašanje elektrona, dajući svom strukturnom modelu uvjerljivu točnost i stekavši priznanje. Isto je i s lingvistikom.

Postavlja se pitanje što je to toliko matematičko u objektivnim pojavama, zahvaljujući čemu se one mogu opisati jezikom matematike, jezikom kvantitativnih karakteristika? To su homogene jedinice materije raspoređene u prostoru i vremenu. One znanosti koje su otišle dalje od drugih prema izolaciji homogenosti, te se ispostavljaju da su prikladnije za korištenje matematike u njima.

Internet, koji se naglo razvio devedesetih godina prošlog stoljeća, okupio je predstavnike raznih zemalja, naroda i kultura. Unatoč činjenici da je engleski i dalje glavni jezik međunarodne komunikacije, internet je u naše vrijeme postao višejezičan. To je dovelo do razvoja komercijalno uspješnih sustava strojnog prevođenja koji se naširoko koriste u raznim područjima ljudske djelatnosti.

Računalne mreže postale su predmetom filozofskog promišljanja - stvara se sve više novih jezičnih, logičkih, svjetonazorskih koncepata koji pomažu razumijevanju "virtualne stvarnosti". U mnogim umjetničkim djelima stvoreni su scenariji - češće pesimistični - o prevlasti strojeva nad čovjekom, a virtualne stvarnosti - nad vanjskim svijetom. Daleko od toga da su se takve prognoze uvijek pokazale besmislenim. Informacijska tehnologija nije samo obećavajuća industrija za ulaganje ljudskog znanja, ona je i način kontrole informacija, a time i ljudske misli.

Ova pojava ima i negativnu i pozitivnu stranu. Negativno – jer je kontrola nad informacijama u suprotnosti s neotuđivim ljudskim pravom na slobodan pristup istima. Pozitivno – jer nedostatak te kontrole može dovesti do katastrofalnih posljedica za čovječanstvo. Dovoljno je prisjetiti se jednog od najmudrijih filmova prošlog desetljeća - "Kad smak svijeta" Wima Wendersa, čiji su likovi potpuno uronjeni u "virtualnu stvarnost" vlastitih snova snimljenih na računalu. Međutim, niti jedan znanstvenik i niti jedan umjetnik ne može dati jednoznačan odgovor na pitanje: što čeka znanost i tehnologiju u budućnosti.

Fokusiranje na "budućnost", koja se ponekad činila fantastičnom, bila je prepoznatljiva značajka znanosti sredinom dvadesetog stoljeća, kada su izumitelji nastojali stvoriti savršene modele tehnologije koji bi mogli funkcionirati bez ljudske intervencije. Vrijeme je pokazalo utopističnost takvih istraživanja. No, bilo bi suvišno osuđivati ​​znanstvenike zbog toga - bez njihovog entuzijazma u 1950-ima - informacijska tehnologija 60-ih ne bi napravila tako snažan iskorak u 90-ima, a mi ne bismo imali ovo što imamo sada.

Posljednja desetljeća dvadesetog stoljeća promijenila su prioritete znanosti – istraživanja, inventivni patos ustupio je mjesto komercijalnom interesu. Opet, ovo nije ni dobro ni loše. Ovo je stvarnost u kojoj je znanost sve više integrirana u svakodnevni život.

21. stoljeće nastavilo je taj trend, au naše vrijeme iza izuma ne stoje samo slava i priznanje, već prije svega novac. Zbog toga je također važno osigurati da najnovija dostignuća znanosti i tehnologije ne padnu u ruke terorističkih skupina ili diktatorskih režima. Zadatak je težak do nemogućnosti; ostvariti ga maksimalno zadatak je cijele svjetske zajednice.

Informacija je oružje, a oružje nije ništa manje opasno od nuklearnog ili kemijskog - samo što ne djeluje fizički, nego psihički. Čovječanstvo treba razmisliti što mu je u ovom slučaju važnije - sloboda ili kontrola.

Najnoviji filozofski koncepti vezani uz razvoj informacijskih tehnologija i pokušaj njihova razumijevanja pokazali su ograničenost kako prirodnoznanstvenog materijalizma, koji je dominirao tijekom 19. i početkom 20. stoljeća, tako i ekstremnog idealizma, koji negira značaj materijalnog svijeta. . Za suvremenu misao, posebno za misao Zapada, važno je prevladati taj dualizam u mišljenju, kada se okolni svijet jasno dijeli na materijalni i idealni. Put do toga je dijalog kultura, usporedba različitih gledišta na okolne pojave.

Paradoksalno, informacijska tehnologija može igrati važnu ulogu u ovom procesu. Računalne mreže, a posebice internet, nisu samo izvor zabave i žustre komercijalne aktivnosti, one su i sredstvo sadržajne, kontroverzne komunikacije između predstavnika različitih civilizacija u suvremenom svijetu, kao i za dijalog između prošlosti i sadašnjost. Možemo reći da internet pomiče prostorne i vremenske granice.

A u dijalogu kultura putem informacijske tehnologije i dalje je važna uloga jezika kao najstarijeg univerzalnog sredstva komunikacije. Zato je lingvistika u interakciji s matematikom, filozofijom i informatikom doživjela svoje drugo rođenje i razvija se i danas. Trend sadašnjosti nastavit će se i u budućnosti - "do kraja svijeta", kako je prije 15 godina predvidio isti V. Wenders. Istina, ne zna se kada će nastupiti taj kraj – ali zar je to sada bitno, jer budućnost će ionako prije ili kasnije postati sadašnjost.


Prilog 1

Ferdinand de Saussure

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) naširoko se smatra utemeljiteljem moderne lingvistike u svojim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i jezičnih oblika. Zapravo, metoda strukturalizma u lingvistici i literarnoj znanosti i značajna grana semiotike nalaze svoje glavno polazište u njegovom radu na prijelazu u dvadeseto stoljeće. Čak se tvrdilo da je kompleks strategija i koncepcija koji je nazvan "poststrukturalizam" – rad Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih – sugeriran Saussureovim radom u lingvistici i anagramskim čitanjima kasne latinske poezije.književnog modernizma do psihoanalize i filozofije u ranom dvadesetom stoljeću. Kao što Algirdas Julien Greimas i Joseph Courtés tvrde u Semiotici i jeziku: Analitički rječnik, pod naslovom "Tumačenje", novi način tumačenja pojavio se početkom dvadesetog stoljeća koji poistovjećuju sa Saussureovom lingvistikom, Husserlijevom fenomenologijom i Freudovskom psihoanalizom. U ovom načinu, "interpretacija više nije stvar pripisivanja određenog sadržaja obliku koji bi inače nedostajao; prije je to parafraza koja na drugi način formulira ekvivalentni sadržaj označiteljskog elementa unutar danog semiotičkog sustava" ( 159). u ovom razumijevanju "tumačenja", forma i sadržaj nisu različiti; nego je svaki "forma", alternativno, i semantički "sadržaj", "označni oblik", tako da interpretacija nudi analognu parafrazu nečega što već označava unutar nekog drugog sustava označavanja.

Takva reinterpretacija forme i razumijevanja – koju Claude Lévi-Strauss opisuje u jednoj od svojih najprogramskijih artikulacija koncepta strukturalizma, u "Struktura i forma: Razmišljanja o djelu Vladimira Proppa" – implicitna je u Saussureovom posthumnom Tečaju u općoj lingvistici (1916., prijevod, 1959., 1983.). Tijekom svog života, Saussure je objavljivao relativno malo, a njegovo glavno djelo, Tečaj, bio je prijepis nekoliko kolegija iz opće lingvistike koje je držao 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika za razliku od rada u povijesnoj lingvistici koji je obavljen u devetnaestom stoljeću. Taj je rad jedno od velikih postignuća zapadnog intelekta: uzimanje određenih riječi kao građevnih blokova jezika, povijesna (ili "dijakronijska") lingvistika pratila je podrijetlo i razvoj zapadnih jezika iz pretpostavljenog izvora zajedničkog jezika, prvo "indoeuropskog" jezika, a zatim ranijeg "p roto-indoeuropski" jezik.

Saussure je doveo u pitanje upravo to proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mase činjenica o jeziku, koje je povijesna lingvistika tako detaljno proučavala, na podnošljiv broj prijedloga. "Komparativna škola" filologije devetnaestog stoljeća, kaže Saussure u Tečaju, "nije uspjela uspostaviti pravu znanost lingvistike" jer "nije uspjela pronaći prirodu svog predmeta proučavanja" (3). Ta se "priroda", tvrdi on, ne nalazi samo u "elementarnim" riječima koje jezik sadrži – naizgled "pozitivnim" činjenicama (ili "supstancama") jezika – već u formalnim odnosima koji dovode do tih "tvari".

Saussureovo sustavno preispitivanje jezika temelji se na tri pretpostavke. Prva je da znanstveno proučavanje jezika treba razvijati i proučavati sustav, a ne povijest jezičnih pojava. Iz tog razloga, on razlikuje posebne pojave jezika - njegove posebne "govorne događaje", koje on označava kao parole – i pravi predmet lingvistike, sustav (ili "kod") koji upravlja tim događajima, a koje on označava kao langue. Takvo sustavno proučavanje, štoviše, poziva na " sinkronijsko" poimanje odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz povijest.

Ova pretpostavka dovela je do onoga što je Roman Jakobson 1929. godine označio kao "strukturalizam", u kojem se "bilo koji skup fenomena koji ispituje suvremena znanost ne tretira kao mehanička aglomeracija, već kao strukturna cjelina, mehanička koncepcija procesa podliježe pitanju njihove funkcije" ("Romantika" 711). U ovom odlomku Jakobson artikulira Saussureovu namjeru da definira lingvistiku kao znanstveni sustav nasuprot jednostavnom, "mehaničkom" obračunu povijesnih nesreća. Uz to, štoviše, Jakobson također opisuje drugu temeljnu pretpostavku u Saussureu – možemo sada to nazovimo "strukturnim" – lingvistika: da se osnovni elementi jezika mogu proučavati samo u odnosu na njihove funkcije, a ne u odnosu na njihove uzroke. europske "riječi"), ti događaji i entiteti moraju biti smješteni unutar sistemskog okvira u kojem su povezani s drugim takozvanim događajima i entitetima. Ovo je radikalna preorijentacija u poimanju iskustva i fenomena, čiju je važnost filozof Ernst Cassirer usporedio s "novom Galileijevom znanošću koja je u sedamnaestom stoljeću promijenila cijelu našu koncept fizičkog svijeta" (citirano u Culler, Pursuit 2 4). Ova promjena, kao što Greimas i Courtés primjećuju, ponovno shvaća "interpretaciju" i tako ponovno shvaća objašnjenje i razumijevanje samih sebe. Umjesto da objašnjenje "postoji u terminima uzroka fenomena, tako da je, kao "posljedica", na neki način podređeno svojim uzrocima, objašnjenje se ovdje sastoji u podređivanju fenomena njegovoj "funkciji" usmjerenoj na budućnost ili "Svrha." Objašnjenje više nije neovisno o ljudskim namjerama ili svrhama (iako te namjere mogu biti neosobne, zajedničke ili, u Freudovim terminima, "nesvjesne").

U svojoj lingvistici Saussure ostvaruje ovu transformaciju posebno u redefiniranju jezične "riječi", koju opisuje kao jezični "znak" i definira funkcionalističkim terminima. Znak je, tvrdi on, spoj "koncepta i zvučne slike", koju je nazvao "označeno i označitelj" (66-67; prijevod Roya Harrisa iz 1983. nudi izraze "označenje" i "signal"). Priroda njihove "kombinacije" je "funkcionalna" utoliko što ni označeno ni označitelj nisu "uzrok" drugoga; radije, "svako svoje vrijednosti iz drugog" (8). element jezika, znak , relacijski i čini temeljnu pretpostavku povijesne lingvistike, naime, identitet elementarnih jedinica jezika i označavanja (tj. "riječi"), predmetom rigorozne analize. Riječ "stablo" kao "ista" riječ nije zato što riječ je definirana inherentnim kvalitetama – to nije "mehanička nakupina" takvih kvaliteta - već zato što je definirana kao element u sustavu, "strukturnoj cjelini" jezika.

Takva relacijska (ili "dijakritička") definicija entiteta upravlja koncepcijom svih elemenata jezika u strukturalnoj lingvistici. To je najjasnije u najdojmljivijem postignuću saussureovske lingvistike, razvoju pojmova "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje artikulirane i označavajuće jedinice jezika. To nisu zvukovi koji se pojavljuju u jeziku, već "zvučne slike" koje spominje Saussure, a koje govornici shvaćaju – fenomenalno shvaćaju – kao one koje prenose značenje. (Dakle, Elmar Holenstein opisuje Jakobsonovu lingvistiku, koja na važne načine slijedi Saussurea, kao "fenomenološki strukturalizam".) Iz tog je razloga vodeći glasnogovornik strukturalizma Praške škole, Jan Mukarovsky, primijetio 1937. da je "struktura . . . je fenomenološka a ne empirijska stvarnost; nije djelo samo po sebi, već skup funkcionalnih odnosa koji se nalaze u svijesti kolektiva (generacije, sredine, itd.)" (citirano u Galan 35). Isto tako, Lévi-Strauss, vodeći glasnogovornik francuskog strukturalizma , primijetio je 1960. da "struktura nema poseban sadržaj; on je sam sadržaj, a logična organizacija u kojoj je uhićen zamišljena je kao svojstvo stvarnog" (167; vidi također Jakobson, Fundamentals 27-28).

Fonemi, dakle, najmanji perceptibilni elementi jezika, nisu pozitivni objekti nego "fenomenološka stvarnost". U engleskom jeziku, na primjer, fonem /t/ može se izgovoriti na mnogo različitih načina, ali u svim će slučajevima govornik engleskog prepoznati da funkcionira kao /t/. Aspirirano t (tj. t koje se izgovara s dahom nalik na h nakon njega), visoki ili niski t, produženi t i tako dalje, svi će funkcionirati na isti način u razlikovanju značenja "to" i "do" na engleskom. Štoviše, razlike među jezicima su takve da fonološke varijacije u jednom jeziku mogu činiti različite foneme u drugom; stoga engleski razlikuje /l/ i /r/, dok su drugi jezici tako strukturirani da se te artikulacije smatraju varijacijama istog fonema (poput aspiriranog i neaspiriranog t u engleskom). U svakom prirodnom jeziku, veliki broj mogućih riječi je kombinacija malog broja fonema. Engleski, na primjer, posjeduje manje od 40 fonema koji se kombiniraju u više od milijun različitih riječi.

Fonemi jezika sami su sustavno organizirane strukture obilježja. U 1920-im i 1930-im godinama, slijedeći Saussureovo vodstvo, Jakobson i N. S. Trubetzkoy izolirali su "različite značajke" fonema. Te se značajke temelje na fiziološkoj strukturi govornih organa - jezika, zuba, glasnica i tako dalje - da Saussure spominje u Tečaju i koje Harris opisuje kao "fiziološku fonetiku" (39; Baskinov raniji prijevod koristi pojam "fonologija" [(1959) 38]) – i oni se kombiniraju u "snopove" binarnih opozicija kako bi formirali foneme. Na primjer, u engleskom jeziku razlika između /t/ i /d/ je prisutnost ili odsutnost "glasa" (angažiranja glasnica), a na razini glasanja ovi se fonemi uzajamno definiraju. Na taj je način fonologija specifičan primjer općeg pravila jezika koje je opisao Saussure: U jeziku postoje samo razlike. još važnije: razlika općenito podrazumijeva pozitivne pojmove između kojih se razlika postavlja; ali u jeziku postoje samo razlike bez pozitivnih pojmova. Bilo da uzmemo označeno ili označitelj, jezik nema niti ideje niti zvukove koji su postojali prije jezičnog sustava. ( 120)

U tom okviru, jezični identiteti nisu određeni inherentnim kvalitetama, već sustavnim ("strukturalnim") odnosima.

Rekao sam da je fonologija "sljedila vodstvo" Saussurea, jer iako bi se njegova analiza fiziologije jezične produkcije "danas", kako kaže Harris, "nazvala "fizičkom", za razliku od "psihološke" ili "funkcionalne", "" (Lektira 49), stoga je u Tečaju artikulirao smjer i obrise funkcionalne analize jezika. Slično tome, njegovo jedino prošireno objavljeno djelo, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoari o primitivnom sustavu samoglasnika u indoeuropskim jezicima), koje se pojavilo 1878., bilo je u potpunosti smješteno unutar projekta devetnaestog- stoljeća povijesna lingvistika. Unatoč tome, unutar ovog rada, kao što je tvrdio Jonathan Culler, Saussure je pokazao "plodnost razmišljanja o jeziku kao sustavu čisto relacijskih stavki, čak i kada radi na zadatku povijesne rekonstrukcije" (Saussure 66). Analizirajući sustavne strukturne odnose među fonemima kako bi se objasnili obrasci izmjene samoglasnika u postojećim indoeuropskim jezicima, Saussure je sugerirao da je uz nekoliko različitih fonema /a/ morao postojati još jedan fonem koji se može formalno opisati. "Ono što Saussureov rad čini tako vrlo dojmljivim," zaključuje Culler, "je činjenica da je gotovo pedeset godina kasnije, kada je klinasti hetitski jezik otkriven i dešifriran, pronađeno da sadrži fonem, napisan h, koji se ponašao kako je Saussure predvidio . On je čisto formalnom analizom otkrio ono što je danas poznato kao laringeali Indo-Europljana" (66).

Ova koncepcija relacijske ili dijakritičke determinacije elemenata označavanja, koja je i implicitna i eksplicitna u Tečaju, sugerira treću pretpostavku koja upravlja strukturnom lingvistikom, što Saussure naziva "proizvoljnom prirodom znaka". Time želi reći da odnos između označitelja i označenog u jeziku nikada nije nužan (ili "motiviran"): moglo bi se jednako lako pronaći zvučni označitelj arbre kao i stablo označitelja da se ujedine s pojmom "stablo". Ali više od ovoga, to znači da je označeno također proizvoljno: moglo bi se lako definirati pojam "stablo" njegovom drvenastom kvalitetom (što bi isključilo palme) kao i njegovom veličinom (koja isključuje "nisko drvenaste biljke" grmlje poziva). Ovo bi trebalo razjasniti da numeriranje pretpostavki koje sam predstavio ne predstavlja redoslijed prioriteta: svaka pretpostavka – sustavna priroda označavanja (koju je najbolje shvatiti proučavanjem jezika "sinkrono"), relacijska ili "dijakritička" priroda elemenata označavanja, proizvoljna priroda znakova – svoju vrijednost crpi iz drugih.

To jest, saussureovska lingvistika je fenomen koji proučava u sveobuhvatnim odnosima kombinacije i kontrasta u jeziku. U ovoj koncepciji jezik je i proces artikulacije značenja (označavanje) i njegov proizvod (komunikacija), a te dvije funkcije jezika nisu niti identične niti potpuno podudarne (vidi Schleifer, "Deconstruction"). Ovdje možemo vidjeti izmjenu između forme i sadržaja koju Greimas i Courtés opisuju u modernističkoj interpretaciji: jezik predstavlja kontraste koji formalno definiraju njegove jedinice, a te se jedinice kombiniraju na sljedećim razinama kako bi stvorile sadržaj označavanja. Budući da su elementi jezika proizvoljni, štoviše, ni kontrast ni kombinacija ne mogu se reći da su osnovni. Dakle, u jeziku se razlikovna obilježja kombiniraju da tvore kontrastne foneme na drugoj razini shvaćanja, fonemi se kombiniraju da tvore kontrastne morfeme, morfemi se kombiniraju da tvore riječi, riječi se kombiniraju da tvore rečenice, i tako dalje. U svakom slučaju, cijeli fonem, ili riječ, ili rečenica, i tako dalje, veći je od zbroja svojih dijelova (baš kao što je voda, H2O, u Saussureovom primjeru [(1959) 103] više od mehaničke aglomeracije vodika i kisika).

Tri pretpostavke Tečaja opće lingvistike navele su Saussurea da pozove na novu znanost dvadesetog stoljeća koja bi nadišla lingvističku znanost kako bi proučavala "život znakova unutar društva". Saussure je ovu znanost nazvao "semiologija (od grčkog semeîon "znak")" (16). "Znanost" semiotike, kako se počela prakticirati u istočnoj Europi 1920-ih i 1930-ih i Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književne artefakte sastavljene (ili artikulirane) tim strukturama. Tijekom kasnog dijela svoje karijere, štoviše, čak i dok je držao kolegije iz opće lingvistike, Saussure je slijedio vlastitu "semiotičku" analizu kasne latinske poezije u pokušaju da otkrije namjerno skrivene anagrame vlastitih imena. Metoda proučavanja bila je umnogome suprotna funkcionalnom racionalizmu njegovih lingvističkih analiza: pokušala je, kao što Saussure spominje u jednoj od 99 bilježnica u kojima je nastavio studij, sustavno ispitati problem "slučajnosti", koja " postaje neizbježan temelj svega" (citirano u Starobinski 101). Takva se studija, kako sam Saussure kaže, usredotočuje na "materijalnu činjenicu" slučajnosti i značenja (citirano 101), tako da je "tema-riječ" čiji anagram Saussure traži, kako tvrdi Jean Starobinski, "za pjesnika , instrument, a ne vitalna klica pjesme. Od pjesme se zahtijeva ponovno korištenje foničkih materijala teme-riječi" (45). U ovoj analizi Starobinski kaže: "Saussure se nije izgubio u potrazi za skrivenim značenjima." Umjesto toga, čini se da njegov rad pokazuje želju da izbjegne sve probleme koji proizlaze iz svijesti: "Budući da poezija nije samo ostvarena u riječima nego je nešto rođeno iz riječi, ona izmiče proizvoljnoj kontroli svijesti kako bi ovisila isključivo o vrsti jezične zakonitosti "(121).

Odnosno, Saussureov pokušaj otkrivanja vlastitih imena u kasnoj latinskoj poeziji - ono što Tzvetan Todorov naziva redukcijom "riječi". . . svom označitelju" (266) – naglašava jedan od elemenata koji je upravljao njegovom lingvističkom analizom, arbitrarnu prirodu znaka. (Također naglašava formalnu prirodu Saussureove lingvistike – "Jezik", tvrdi on, "je oblik, a ne tvar" – što učinkovito eliminira semantiku kao glavni predmet analize.) Kao što Todorov zaključuje, Saussureovo djelo danas se čini izrazito homogenim u svom odbijanju prihvaćanja simboličkih fenomena. . . . U svojim istraživanjima anagrama obraća pozornost samo na fenomene ponavljanja, ne i na one evokacije. . . . U svojim studijama o Nibelunzima on prepoznaje simbole samo kako bi ih pripisao pogrešnim čitanjima: budući da nisu namjerni, simboli ne postoje. Konačno, u svojim kolegijima o općoj lingvistici, on razmatra postojanje semiologije, a time i znakova koji nisu lingvistički; ali ta je afirmacija istodobno ograničena činjenicom da je semiologija posvećena jednoj vrsti znakova: onima koji su proizvoljni. (269-70)

Ako je to istina, to je zato što Saussure nije mogao pojmiti "namjeru" bez subjekta; nije mogao posve izbjeći suprotnost između forme i sadržaja koju je njegov rad toliko doveo u pitanje. Umjesto toga, pribjegao je "jezičnoj zakonitosti". Smješten između, s jedne strane, devetnaestostoljetnih koncepcija povijesti, subjektivnosti i načina kauzalne interpretacije kojim upravljaju te koncepcije i, s druge strane, dvadesetostoljetnih "strukturalističkih" koncepcija onoga što je Lévi-Strauss nazvao "kantijanizmom bez transcendentalni subjekt" (citirano u Connerton 23) – koncepti koji brišu suprotnost između forme i sadržaja (ili subjekta i objekta) i hijerarhije prednjeg i pozadinskog plana u potpunom strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici – Ferdinandovo djelo de Saussure u lingvistici i semiotici opisuje signalni trenutak u proučavanju značenja i kulture.

Ronald Schleifer


Dodatak 2

Ferdinand de Saussure (prijevod)

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) smatra se utemeljiteljem moderne lingvistike, zahvaljujući njegovim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i oblika riječi. Uglavnom, temelji strukturalnih metoda u lingvistici i književnoj kritici, au velikoj mjeri i semiotike, postavljeni su u njegovim radovima na samom početku dvadesetog stoljeća. Dokazano je da metode i koncepti takozvanog "poststrukturalizma", razvijeni u djelima Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih, sežu do lingvističkih radova Saussurea i anagramska čitanja kasnorimske poezije. Treba napomenuti da Saussureov rad na lingvistici i lingvističkom tumačenju pomaže u povezivanju širokog spektra intelektualnih disciplina, od fizike do književnih inovacija, psihoanalize i filozofije ranog dvadesetog stoljeća. A. J. Greimas i J. Kurte u Semiotici i jeziku pišu: “Početkom 20. stoljeća uz Saussureovu lingvistiku, Husserlovu fenomenologiju i psihoanalizu pojavio se analitički rječnik s naslovom “Tumačenje” kao nova vrsta tumačenja. od Freuda. U takvom slučaju, "interpretacija nije pripisivanje određenog sadržaja obliku koji bi inače nedostajao; radije, to je parafraza koja na drugi način formulira isti sadržaj značajnog elementa unutar danog semiotičkog sustava" (159). ). U ovakvom shvaćanju "tumačenja" forma i sadržaj su neodvojivi; naprotiv, svaki je oblik ispunjen semantičkim značenjem (“smisleni oblik”), pa interpretacija nudi novo, slično prepričavanje nečeg smislenog u drugom znakovnom sustavu.

Slično shvaćanje forme i sadržaja, koje je iznio Claude Lévi-Strauss u jednom od ključnih djela strukturalizma, ("Struktura i forma: Razmišljanja o djelima Vladimira Proppa"), može se vidjeti u posthumno objavljenoj Saussureovoj knjizi Tečaj u Opća lingvistika (1916, prev., 1959, 1983). Za života Saussure je malo objavljivao, "Tečaj" - njegovo glavno djelo - sakupljen je iz bilježaka studenata koji su slušali njegova predavanja iz opće lingvistike 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika, suprotstavljajući ga komparativno-povijesnoj lingvistici devetnaestog stoljeća. Ovo se djelo može smatrati jednim od najvećih dostignuća zapadne misli: uzimajući pojedinačne riječi kao strukturne elemente jezika kao osnovu, povijesna (ili "dijakronijska") lingvistika dokazala je podrijetlo i razvoj zapadnoeuropskih jezika iz zajednički, indoeuropski jezik - i raniji protoindoeuropski.

Saussure je doveo u pitanje upravo ovo proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mnogih činjenica o jeziku koje poredbena lingvistika ležerno proučava na mali broj teorema. Komparativna filološka škola 19. stoljeća, piše Saussure, "nije uspjela stvoriti pravu lingvističku školu" jer "nije shvaćala bit predmeta proučavanja" (3). Ta "bit", tvrdi on, ne leži samo u pojedinačnim riječima - "pozitivnim supstancama" jezika - već iu formalnim vezama koje pomažu tim supstancama da postoje.

Saussureov "test" jezika temelji se na tri pretpostavke. Prvo, znanstveno razumijevanje jezika ne temelji se na povijesnom, već na strukturnom fenomenu. Stoga je razlikovao pojedine jezične pojave - "govorne događaje", koje definira kao "parole" - i pravi, po njegovu mišljenju, predmet proučavanja lingvistike, sustav (kod, struktura) koji upravlja tim događajima ( "jezik"). Takvo sustavno proučavanje, osim toga, zahtijeva "sinkronijsko" poimanje odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz njegovu povijest.

Ta je hipoteza bila preteča onoga što će Roman Jakobson 1929. nazvati "strukturalizmom" - teorijom u kojoj se "svaki skup fenomena koji istražuje moderna znanost ne smatra mehaničkom akumulacijom, već strukturnom cjelinom u kojoj je konstruktivna komponenta u korelaciji s funkcija" ("Romantična" 711). U ovom odlomku Jakobson je formulirao Saussureovu ideju o definiranju jezika kao strukture, nasuprot "mehaničkom" nabrajanju povijesnih događaja. Uz to, Jakobson razvija još jednu Saussureovu pretpostavku, koja je postala preteča strukturne lingvistike: osnovne elemente jezika treba proučavati u vezi ne toliko s njihovim uzrocima, koliko s njihovim funkcijama. Zasebne pojave i događaje (recimo, povijest podrijetla pojedinih indoeuropskih riječi) ne treba proučavati same po sebi, već u sustavu u kojem su u korelaciji sa sličnim komponentama. Bio je to radikalan zaokret u usporedbi pojava s okolnom stvarnošću, čije je značenje filozof Ernst Cassirer usporedio s "znanošću Galileja, koja je u sedamnaestom stoljeću preokrenula ideje o materijalnom svijetu", posljedično, i sama objašnjenja. Pojave su se počele tumačiti ne u odnosu na uzroke njihove pojave, već u odnosu na učinak koji mogu imati u sadašnjosti i budućnosti.Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, “nesvjesno” u frojdovskom smislu riječi).

U svojoj lingvistici Saussure posebno pokazuje taj zaokret u promjeni pojma riječi u lingvistici koju definira kao znak i opisuje u smislu njezinih funkcija. Znak je za njega spoj zvuka i značenja, "označeno i oznaka" (66-67; u engleskom prijevodu Roya Harrisa iz 1983. - "označenje" i "signal"). Priroda ovog spoja je "funkcionalna" (ni jedan ni drugi element ne mogu postojati jedan bez drugog); štoviše, "jedni posuđuju osobine od drugih" (8). Tako Saussure definira glavni strukturni element jezika - znak - i čini osnovom povijesne lingvistike istovjetnost znakova s ​​riječima, što zahtijeva posebno rigoroznu analizu. Stoga možemo razumjeti različita značenja, recimo, iste riječi "drvo" - ne zato što je riječ samo skup određenih kvaliteta, već zato što je definirana kao element u sustavu znakova, u "strukturnoj cjelini", u jeziku.

Takav relativni ("dijakritički") koncept jedinstva je temelj koncepta svih elemenata jezika u strukturnoj lingvistici. To je posebno jasno u najizvornijem otkriću Saussureove lingvistike, u razvoju pojma "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje govorne i smislene jezične jedinice. To nisu samo zvukovi koji se pojavljuju u jeziku, već "zvučne slike", napominje Saussure, koje izvorni govornici percipiraju kao da imaju značenje. (Valja napomenuti da Elmar Holenstein naziva Jakobsonovu lingvistiku, koja u svojim glavnim odredbama nastavlja ideje i koncepte Saussurea, "fenomenološkim strukturalizmom"). Zato je vodeći govornik Praške škole strukturalizma, Jan Mukarowski, 1937. primijetio da je “struktura. . . ne empirijski, nego fenomenološki koncept; nije sam rezultat, već skup značajnih odnosa kolektivne svijesti (generacija, drugi itd.)”. Sličnu misao iznio je 1960. Lévi-Strauss, vođa francuskog strukturalizma: “Struktura nema određeni sadržaj; ona je sama po sebi smislena, a logična konstrukcija u kojoj je zatvorena je otisak stvarnosti.

S druge strane, fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu cjelovitu "fenomenološku stvarnost". Na primjer, u engleskom se glas "t" može različito izgovoriti, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Aspirirani, povišeni ili sniženi, dugi zvuk "t" itd. jednako će razlikovati značenje riječi "to" i "do". Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" u engleskom su različiti, dok su u drugim jezicima varijante istog fonema (poput engleskog "t", izgovorenog sa i bez aspiracije). Ogromni rječnik svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika su sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, nakon Saussurea, Jacobson i N.S. Trubetskoy izdvojili su "odlike" fonema. Te se značajke temelje na strukturi organa govora – jezika, zuba, glasnica – Saussure to bilježi u „Tečaju opće lingvistike“, a Harris to naziva „fiziološkom fonetikom“ (u Baskinovom ranijem prijevodu izraz „fonologija“ " se koristi) - povezani su u "čvorove » durg protiv prijatelja da proizvode zvukove. Na primjer, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg jezičnog pravila koje je opisao Saussure: "Postoje samo razlike u jeziku." Još važnije nije ovo: razlika obično implicira točne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da se radi o "označavanju" ili "označenom" - u jeziku nema niti pojmova niti glasova koji bi postojali prije razvoja jezičnog sustava.

U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih svojstava, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Već sam spomenuo da se fonologija u svom razvoju oslanjala na ideje Saussurea. Iako bi se njegova analiza lingvističke fiziologije u moderno doba, kaže Harris, "nazvala 'fizičkom', za razliku od 'psihološke' ili 'funkcionalne', u Tečaju je jasno artikulirao smjer i osnovna načela funkcionalne analize jezika. Njegovo jedino objavljeno djelo za života, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Bilješke o izvornom samoglasničkom sustavu u indoeuropskim jezicima), objavljeno 1878., bilo je potpuno u skladu s komparativnom povijesnom lingvistikom 19. stoljeća. Ipak, u ovom je djelu, kaže Jonathan Culler, Saussure pokazao "plodnost ideje o jeziku kao sustavu međusobno povezanih fenomena, čak i uz njegovu povijesnu rekonstrukciju". Analizirajući odnos između fonema, objašnjavajući izmjenu samoglasnika u modernim jezicima indoeuropske skupine, Saussure je sugerirao da osim nekoliko različitih zvukova "a", moraju postojati i drugi fonemi opisani formalno. “Ono što čini Saussureov rad posebno dojmljivim,” zaključuje Kaller, “je to što je gotovo 50 godina kasnije, kada je hetitski klinasti list otkriven i dešifriran, pronađen fonem, u pisanom obliku označen sa “h”, koji se ponašao kao što je Saussure predvidio. Kroz formalnu analizu otkrio je ono što je danas poznato kao grleni zvuk u indoeuropskim jezicima.

U konceptu relativne (dijakritičke) definicije znakova, eksplicitnoj i impliciranoj u Tečaju, postoji treća ključna pretpostavka strukturalne lingvistike, koju je Saussure nazvao "arbitrarna priroda znaka". Time se misli da odnos između zvuka i značenja u jeziku nije ničim motiviran: jednako se lako može povezati riječ "arbre" i riječ "drvo" s pojmom "drvo". Štoviše, to znači da je i zvuk proizvoljan: pojam "stabla" može se definirati prisutnošću kore (osim palmi) i veličinom (osim "niskih drvenastih biljaka" - grmova). Iz ovoga bi trebalo biti jasno da sve pretpostavke koje iznosim nisu podijeljene na više i manje važne: svaka od njih - sustavna priroda znakova (najrazumljivija u "sinkronom" proučavanju jezika), njihova relativna (dijakritička) bit, proizvoljna priroda znakova - dolazi od ostatka.

Tako se u saussureovskoj lingvistici proučavani fenomen shvaća kao skup usporedbi i opreka jezika. Jezik je i izraz značenja riječi (oznaka) i njihov rezultat (komunikacija) – a te se dvije funkcije nikada ne podudaraju (vidi Shleiferovu "Dekonstrukciju jezika"). Možemo vidjeti izmjenu oblika i sadržaja koju Greimas i Kurte opisuju u posljednjoj verziji tumačenja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju na uzastopnim razinama kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u kontrastne morfeme, morfemi u riječi, riječi u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od zbroja svojih dijelova (kao što je voda, u Saussureovom primjeru, više od kombinacije vodika i kisika).

Tri pretpostavke "Tečaja opće lingvistike" dovele su Saussurea do ideje o novoj znanosti dvadesetog stoljeća, odvojenoj od lingvistike, proučavanju "života znakova u društvu". Saussure je ovu znanost nazvao semiologija (od grčkog "semeîon" - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna saznanja sastavljena (ili formulirana) uz pomoć tih struktura. Osim toga, u zalasku svoje karijere, paralelno s tečajem opće lingvistike, Saussure se bavio "semiotičkom" analizom kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bio je to pokušaj, kako Saussure piše u jednoj od 99 bilježnica, da se u sustavu proučava problem "vjerojatnosti", koji "postaje temeljem svega. " Takvo istraživanje, sam Saussure tvrdi, pomaže usredotočiti se na "pravu stranu" vjerojatnosti; “Ključna riječ” za koju Saussure traži anagram je, prema Jeanu Starobinskom, “oruđe za pjesnika, a ne izvor života za pjesmu. Pjesma služi za preokretanje zvukova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure se ne upušta u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi pokreću, ona nadilazi kontrolu svijesti i ovisi samo o zakoni jezika."

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji (Tsvetan Todorov je ovo nazvao skraćenicom od "riječ ... samo prije nego što je napisana") naglašava jednu od komponenti njegove lingvističke analize - proizvoljnu prirodu znakova, kao i formalna bit saussureovske lingvistike ("Jezik", tvrdi on, "bit oblika, a ne fenomena"), koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas Saussureovi spisi čine nevjerojatno dosljednima u svojoj nevoljkosti proučavanju simbola [fenomena koji ima dobro definirano značenje]. . . . Istražujući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne opcije. . . . Proučavajući Nibelungenlied, on definira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerna, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on iznosi pretpostavku o postojanju semiologije koja opisuje ne samo jezične znakove; ali ta je pretpostavka ograničena činjenicom da semilogija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti "namjeru" bez objekta; nije mogao do kraja premostiti jaz između forme i sadržaja – u njegovim se spisima to pretvorilo u pitanje. Umjesto toga, okrenuo se "jezičnom legitimitetu". Između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnim pretpostavkama, te metoda slučajnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koje je Lévi-Strauss nazvao "kantijanizam bez transcendenta". glumac" - brišući suprotnost između forme i sadržaja (subjekta i objekta), značenja i podrijetla u strukturalizmu, psihoanalizi pa čak i kvantnoj mehanici, spisi Ferlinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ronald Shleifer

Književnost

1. Admoni V.G. Osnove teorije gramatike / V.G. Admoni; Akademija znanosti SSSR-a.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematičke metode u lingvistici. M., 1974.

4. Arnold I.V. Semantička struktura riječi u suvremenom engleskom jeziku i metodologija njezina proučavanja. /I.V. Arnold - L .: Obrazovanje, 1966. - 187 str.

6.Bashlykov A.M. Sustav za automatsko prevođenje. / A.M. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 str.

7.Baudouin de Courtenay: Teorijska baština i suvremenost: Sažeci priopćenja s međunarodnog znanstvenog skupa / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 str.

8. A. V. Gladkiy, Elementi matematičke lingvistike. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 str.

9. Golovin, B.N. Jezik i statistika. /B.N. Golovin - M., 1971. - 210 str.

10. Zvegincev, V.A. Teorijska i primijenjena lingvistika. / V.A. Zvegincev - M., 1969. - 143 str.

11. Kasevich, V.B. Semantika. Sintaksa. Morfologija. // V.B. Kasevich -M., 1988. - 292 str.

12. Lekomtsev Yu.K. Uvod u formalni jezik lingvistike / Yu.K. Lekomcev. – M.: Nauka, 1983., 204 str., ilustr.

13. Jezična baština Baudouina de Courtenaya na kraju 20. stoljeća: Sažeci međunarodnog znanstveno-praktičnog skupa 15.-18.3.2000. - Krasnojarsk, 2000. - 125 str.

Matveeva G.G. Skrivena gramatička značenja i identifikacija društvene osobe (“portret”) govornika / G.G. Matveev. - Rostov, 1999. - 174 str.

14. Melchuk, I.A. Iskustvo u izgradnji jezičnih modela „Značenje<-->Tekst". / I.A. Melchuk. - M., 1974. - 145 str.

15. Nelyubin L.L. Prevođenje i primijenjena lingvistika / L.L. Nelyubin. - M. : Viša škola, 1983. - 207 str.

16. O egzaktnim metodama istraživanja jezika: o takozvanoj "matematičkoj lingvistici" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva i drugi - M., 1961. - 162 str.

17. Piotrovsky L.G. Matematička lingvistika: udžbenik / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaja. - M.: Viša škola, 1977. - 160 str.

18. On je. Tekst, stroj, osoba. - L., 1975. - 213 str.

19. On je. Primijenjena lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 str.

20. Revzin, I.I. jezični modeli. M., 1963. Revzin, I.I. Moderna strukturalna lingvistika. Problemi i metode. M., 1977. - 239 str.

21. Revzin, I.I., Rozentsveig, V.Yu. Osnove općeg i strojnog prevođenja / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 str.

22. Slyusareva N.A. Teorija F. de Saussurea u svjetlu moderne lingvistike / N.A. Sljusareva. - M.: Nauka, 1975. - 156 str.

23. Sova, L.Z. Analitička lingvistika / L.Z. Sova - M., 1970. - 192 str.

24. Saussure F. de. Bilješke o općoj lingvistici / F. de Saussure; Po. od fr. – M.: Napredak, 2000. – 187 str.

25. On je. Tečaj opće lingvistike / Per. od fr. - Jekaterinburg, 1999. -426 str.

26. Statistika govora i automatska analiza teksta / Ed. izd. R.G. Piotrovski. L., 1980. - 223 str.

27. Stoll, P. Setovi. Logika. Aksiomatske teorije / R. Stoll; Po. s engleskog. - M., 1968. - 180 str.

28. Tenier, L. Osnove strukturne sintakse. M., 1988.

29. Ubin I.I. Automatizacija prevoditeljskih aktivnosti u SSSR-u / I.I. Ubin, L.Yu. Korostelev, B.D. Tihomirov. - M., 1989. - 28 str.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderna matematika. M., 1966.

31. Shenk, R. Obrada konceptualnih informacija. M., 1980.

32. Shikhanovich, Yu.A. Uvod u suvremenu matematiku (početni pojmovi). M., 1965

33. Shcherba L.V. Ruski samoglasnici u kvalitativnom i kvantitativnom smislu / L.V. Shcherba - L.: Nauka, 1983. - 159 str.

34. Abdullah-zade F. Građanin svijeta // Ogonyok - 1996. - br. 5. – str.13

35. V.A. Uspenski. Preliminarno za čitatelje "Nove književne revije" na semiotičke poruke Andreja Nikolajeviča Kolmogorova. - Nova književna revija. –1997. - Broj 24. - S. 18-23

36. Perlovsky L. Svijest, jezik i kultura. - Znanje je moć. –2000. broj 4 - S. 20-33

37. Frumkina R.M. O nama - iskosa. // Ruski časopis. - 2000. - br.1. – str. 12

38. Fitialov, S.Ya. O modeliranju sintakse u strukturalnoj lingvistici // Problems of Structural Linguistics. M., 1962.

39. On je. O ekvivalentnosti NN gramatike i gramatike ovisnosti // Problemi strukturne lingvistike. M., 1967.

40. Chomsky, N. Logički temelji lingvističke teorije // Novo u lingvistici. Problem. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. pritisnite. jhu.ru

46. ​​​​hr.wikipedia.org

47. www.smolensk.ru


Kriptoanaliza je znanost (i praksa njezine primjene) o metodama i načinima razbijanja šifri. Kriptografija i kriptoanaliza čine jedinstveno polje znanja - kriptologiju, koja je trenutno područje suvremene matematike koja ima značajnu primjenu u suvremenoj informacijskoj tehnologiji. Pojam "kriptografija" uveo je D. Vallis. Potreba za šifriranjem poruka pojavila se davno. V-...

Je najbliže, a ne daljnje značenje riječi. Tako je psihološki pravac, a posebno mladogramatika, odgovorila na mnoga pitanja koja su se postavljala pred lingvistiku sredinom 19. stoljeća. Razjašnjena je metodologija poredbenopovijesne lingvistike, postavljeni glavni problemi semasiologije i funkcionalno-semantičke gramatike, analiziran odnos jezika i govora, ...

Kontakti", "Višejezičnost u sociološkom aspektu". Njihovim proučavanjem bavi se sociolingvistika (društvena lingvistika), koja je nastala na razmeđu lingvistike i sociologije, te etnolingvistika, etnografija govora, stilistika, retorika, pragmatika, teor. jezičnog komuniciranja, teorije masovnog komuniciranja i dr. Jezik u društvu obavlja sljedeće društvene funkcije: komunikacijsku/informativnu (...

O odsjecima i sastavu jezikoslovlja. Empirijski oblikovani dijelovi lingvistike, koji se djelomično presijecaju i stoga ne tvore logički jedinstven sustav, mogu se prikazati međusobno korelirajući prema nekim različitim parametrima. Opća lingvistika i djelomične znanosti o jeziku. Razlikuju se najopćenitiji i najposebniji dijelovi lingvistike. Jedan od glavnih dijelova lingvistike je teorija ...

Uvod

Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici

1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće

1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1. Strojno prevođenje

2.2. Statističke metode u učenju jezika

2.3. Učenje jezika metodama formalne logike

2.4. Perspektive primjene matematičkih metoda u lingvistici

Zaključak

Književnost

Dodatak 1. Ronald Schleifer. Ferdinand de Saussure

Dodatak 2. Ferdinand de Saussure (prijevod)

Uvod

U 20. stoljeću nastavlja se trend interakcije i prožimanja različitih područja znanja. Granice između pojedinih znanosti postupno se brišu; sve je više grana umne djelatnosti koje su "na spoju" humanitarnih, tehničkih i prirodoslovnih znanja.

Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga se sve veće mjesto, kako u znanstvenoj teoriji tako iu praksi, daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto “humanitarne”, proširujući njihov heuristički potencijal (odgovor na pitanje “koliko” često će pomoći odgovoriti na pitanja “što” i “kako”). Lingvistika nije bila iznimka.

Svrha mog kolegija je ukratko osvijetliti vezu između matematike i takve grane lingvistike kao što je lingvistika. Od 1950-ih, matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (i prirodnih i umjetnih). Međutim, treba reći da nije odmah pronašao takvu praktičnu primjenu za sebe. U početku su se matematičke metode u lingvistici počele koristiti kako bi se razjasnili temeljni pojmovi lingvistike, no razvojem računalne tehnologije takva teorijska postavka počela je nalaziti primjenu u praksi. Rješavanje takvih zadataka kao što su strojno prevođenje, strojno pronalaženje informacija, automatska obrada teksta zahtijevalo je temeljno novi pristup jeziku. Lingvisti su se suočili s pitanjem: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Pojam “matematička lingvistika”, koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici posljednjih godina smatraju da se sam izraz ne može uzdići u rang pojma, jer ne znači nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika . Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa čak i psihologiji. Čak je i Schlegel uočio interakciju jezika i svijesti, a Ferdinand de Saussure, istaknuti lingvist s početka dvadesetog stoljeća (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije), povezao je strukturu jezika s njegovom pripadnošću. ljudima. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) s osobitostima nacionalnog mentaliteta (više o tome u odjeljku 2.2, "Statističke metode u lingvistici").

Interakcija matematike i lingvistike je višestruka tema, au svom radu se neću zadržati na svim, već prije svega na njezinim primijenjenim aspektima.

Poglavlje I. Povijest primjene matematičkih metoda u lingvistici

1.1 Formiranje strukturne lingvistike na prijelazu iz XIX. u XX. stoljeće

Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do poznatog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.

Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik je Jezik, govor - lozinka, i govorna aktivnost - Jezik), u kojem se svaka riječ (član sustava) ne razmatra sama za sebe, već u vezi s drugim članovima. Kao što je kasnije primijetio još jedan istaknuti lingvist, Danac Louis Hjelmslev, Saussure je "prvi zahtijevao strukturalni pristup jeziku, odnosno znanstveni opis jezika bilježenjem odnosa među jedinicama".

Shvaćajući jezik kao hijerarhijsku strukturu, Saussure je prvi postavio problem vrijednosti i značaja jezičnih jedinica. Zasebne pojave i događaje (recimo, povijest podrijetla pojedinih indoeuropskih riječi) ne treba proučavati same po sebi, već u sustavu u kojem su u korelaciji sa sličnim komponentama.

Saussure je strukturnom jedinicom jezika smatrao riječ "znak" u kojoj su spojeni zvuk i značenje. Nijedan od ovih elemenata ne postoji jedan bez drugoga: dakle, izvorni govornik shvaća različite nijanse značenja višeznačne riječi kao zaseban element u strukturnoj cjelini, u jeziku.

Tako se u teoriji F. de Saussurea može vidjeti interakcija lingvistike, s jedne strane, sa sociologijom i socijalnom psihologijom (treba napomenuti da se u isto vrijeme razvijaju Husserlova fenomenologija, Freudova psihoanaliza, Einsteinova teorija relativnosti). , eksperimentira se s formom i sadržajem u književnosti, glazbi i likovnim umjetnostima), s druge strane s matematikom (pojam sustavnosti odgovara algebarskom pojmu jezika). Takav koncept promijenio je koncept jezične interpretacije kao takve: fenomeni se nisu počeli tumačiti u odnosu na uzroke njihova nastanka, već u odnosu na sadašnjost i budućnost. Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, "nesvjesne" u frojdovskom smislu riječi).

Djelovanje jezičnog mehanizma očituje se kroz govornu aktivnost izvornih govornika. Rezultat govora su takozvani "ispravni tekstovi" - nizovi govornih jedinica koje se pokoravaju određenim obrascima, od kojih mnogi dopuštaju matematički opis. Teorija načina opisivanja sintaktičke strukture bavi se proučavanjem metoda matematičkog opisa ispravnih tekstova (prije svega rečenica). U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih svojstava, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Na Zapadu Saussureove ideje razvijaju mlađi suvremenici velikog švicarskog jezikoslovca: u Danskoj - od mene već spomenuti L. Hjelmslev, koji je dao povoda algebarskoj teoriji jezika u svom djelu "Osnove lingvističke teorije", god. SAD - E. Sapir, L. Bloomfield, C. Harris, u Češkoj - ruski emigrantski znanstvenik N. Trubetskoy.

Statističkim zakonitostima u proučavanju jezika počeo se baviti nitko drugi nego utemeljitelj genetike Georg Mendel. Tek 1968. godine filolozi su otkrili da je u posljednjim godinama života bio fasciniran proučavanjem jezičnih pojava matematičkim metodama. Mendel je ovu metodu donio u lingvistiku iz biologije; u 1990-ima samo su najhrabriji lingvisti i biolozi tvrdili da je takva analiza izvediva. U arhivu samostana sv. Tomasza u Brnu, čiji je opat bio Mendel, pronađeni su listovi sa stupcima prezimena koja su završavala na "mann", "bauer", "mayer", te s nekim razlomcima i izračunima. Nastojeći otkriti formalne zakonitosti nastanka obiteljskih imena, Mendel izvodi složene proračune, u kojima uzima u obzir broj samoglasnika i suglasnika u njemačkom jeziku, ukupan broj riječi koje razmatra, broj prezimena, itd.

Kod nas se strukturalna lingvistika počela razvijati otprilike u isto vrijeme kad i na Zapadu - na prijelazu iz 19. u 20. stoljeće. Istodobno s F. de Saussureom, koncept jezika kao sustava razvili su u svojim radovima profesori Sveučilišta u Kazanu F.F. Fortunatov i I.A. Baudouin de Courtenay. Potonji se dugo dopisivao s de Saussureom, odnosno ženevska i kazanska škola lingvistike surađivale su jedna s drugom. Ako se Saussurea može nazvati ideologom "egzaktnih" metoda u lingvistici, onda je Baudouin de Courtenay postavio praktične temelje za njihovu primjenu. On je prvi odvojio lingvistiku (kao točan znanost pomoću statističkih metoda i funkcionalne ovisnosti) iz filologije (zajednica humanitarnih disciplina koje proučavaju duhovnu kulturu kroz jezik i govor). Sam znanstvenik vjerovao je da "lingvistika može biti korisna u bliskoj budućnosti, samo oslobođena obveznog sjedinjenja s filologijom i književnom poviješću" . Fonologija je postala "poligon" za uvođenje matematičkih metoda u lingvistiku - glasovi kao "atomi" jezičnog sustava, s ograničenim brojem lako mjerljivih svojstava, bili su najprikladniji materijal za formalne, rigorozne metode opisa. Fonologija negira postojanje značenja u zvuku, pa je "ljudski" faktor eliminiran u studijama. U tom smislu, fonemi su poput fizičkih ili bioloških objekata.

Fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu sferu, zasebnu "fenomenološku stvarnost". Na primjer, u engleskom se glas "t" može različito izgovoriti, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Glavna stvar je da će fonem obavljati svoju glavnu - smislenu - funkciju. Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" u engleskom su različiti, dok su u drugim jezicima varijante istog fonema (poput engleskog "t", izgovorenog sa ili bez aspiracije). Ogromni rječnik svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika su sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, nakon Saussurea, Jacobson i N.S. Trubetskoy izdvojili su "odlike" fonema. Ove značajke temelje se na građi govornih organa - jezika, zuba, glasnica. Na primjer, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg jezičnog pravila koje je opisao Saussure: "Postoje samo razlike u jeziku". Još važnije nije ovo: razlika obično implicira točne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da se radi o "označavanju" ili "označenom" - u jeziku nema niti pojmova niti glasova koji bi postojali prije razvoja jezičnog sustava.

Tako se u saussureovskoj lingvistici proučavani fenomen shvaća kao skup usporedbi i opreka jezika. Jezik je i izraz značenja riječi i sredstvo komunikacije, a te se dvije funkcije nikad ne podudaraju. Možemo primijetiti izmjenu oblika i sadržaja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u morfeme, morfemi - u riječi, riječi - u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od pukog zbroja svojih dijelova.

Saussure je predložio ideju nove znanosti dvadesetog stoljeća, odvojene od lingvistike, koja proučava ulogu znakova u društvu. Saussure je ovu znanost nazvao semiologija (od grčkog "semeîon" - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili artikulirana) u terminima tih struktura. Osim toga, Saussure se u sumraku svoje karijere, usporedo s kolegijem opće lingvistike, bavio "semiotičkom" analizom kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bila je to pokušaj da se u sustavu prouči problem "vjerojatnosti" u jeziku. Takvo istraživanje pomaže usredotočiti se na "pravu stranu" vjerojatnosti; "ključna riječ" za koju Saussure traži anagram je, prema Jeanu Starobinskom, "oruđe za pjesnika, a ne izvor života pjesme". Pjesma služi za zamjenu glasova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure se ne upušta u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi pokreću, ona nadilazi kontrolu svijesti i ovisi samo o zakoni jezika” (vidi . Dodatak 1).

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji naglašava jednu od sastavnica njegove jezične analize – proizvoljnu prirodu znakova, kao i formalnu bit Saussureove lingvistike koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas čini da su Saussureovi radovi krajnje dosljedni u svojoj nevoljkosti da proučavaju simbole fenomena koji imaju jasno definirano značenje [Dodatak 1]. Istražujući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne opcije. . . . Proučavajući Nibelungenlied, on definira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerna, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on iznosi pretpostavku o postojanju semiologije koja opisuje ne samo jezične znakove; ali ta je pretpostavka ograničena činjenicom da semiologija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti "namjeru" bez objekta; nije mogao do kraja premostiti jaz između forme i sadržaja – u njegovim se spisima to pretvorilo u pitanje. Umjesto toga, okrenuo se "jezičnom legitimitetu". Između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnim nagađanjima, te metoda nasumičnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koji brišu suprotnost između forme i sadržaja (subjekta i objekta), značenje i podrijetlo u strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici - spisi Ferdinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ruski su znanstvenici također bili zastupljeni na Prvom međunarodnom kongresu lingvista u Haagu 1928. godine. S. Kartsevsky, R. Yakobson i N. Trubetskoy napravili su izvješće u kojem su ispitali hijerarhijsku strukturu jezika - u duhu najsuvremenijih ideja s početka prošlog stoljeća. Jakobson je u svojim spisima razvio Saussureove ideje da osnovne elemente jezika treba proučavati, prije svega, u vezi s njihovim funkcijama, a ne s razlozima njihova nastanka.

Nažalost, nakon što je Staljin došao na vlast 1924., ruska lingvistika je, kao i mnoge druge znanosti, vraćena unatrag. Mnogi talentirani znanstvenici bili su prisiljeni emigrirati, protjerani iz zemlje ili umrli u logorima. Tek od sredine 1950-ih postao je moguć stanoviti pluralizam teorija - više o tome u odjeljku 1.2.

1.2 Primjena matematičkih metoda u lingvistici u drugoj polovici dvadesetog stoljeća

Do sredine dvadesetog stoljeća formirale su se četiri svjetske lingvističke škole, od kojih se svaka pokazala rodonačelnikom određene "egzaktne" metode. Lenjingradska fonološka škola(njegov predak bio je učenik Baudouina de Courtenaya L.V. Shcherba) koristio je psiholingvistički eksperiment temeljen na analizi govora izvornih govornika kao glavni kriterij za generalizaciju zvuka u obliku fonema.

Znanstvenici Praški lingvistički krug, posebno - njegov osnivač N.S. Trubetskoy, koji je emigrirao iz Rusije, razvio je teoriju opozicija - semantičku strukturu jezika opisali su kao skup opozicijski izgrađenih semantičkih jedinica - Sem. Ova je teorija primijenjena u proučavanju ne samo jezika, već i umjetničke kulture.

Ideolozi američki deskriptivizam bili su lingvisti L. Bloomfield i E. Sapir. Jezik je deskriptivistima predstavljen kao skup govornih iskaza, koji su bili glavni predmet njihova proučavanja. Njihov fokus bio je na pravilima znanstvenog opisa (otuda i naziv) tekstova: proučavanje organizacije, rasporeda i klasifikacije njihovih elemenata. Formalizacija analitičkih postupaka u području fonologije i morfologije (razvoj načela za proučavanje jezika na različitim razinama, distributivna analiza, metoda izravnih sastavnica itd.) dovela je do formuliranja općih pitanja jezičnog modeliranja. Nebriga za plan sadržaja jezika, kao i za paradigmatsku stranu jezika, nije dopuštala deskriptivistima da dovoljno cjelovito protumače jezik kao sustav.

Šezdesetih godina prošlog stoljeća razvila se teorija formalnih gramatika, koja je nastala uglavnom zahvaljujući radu američkog filozofa i lingvista N. Chomskog. S pravom se smatra jednim od najpoznatijih modernih znanstvenika i javnih osoba, posvećeni su mu mnogi članci, monografije, pa čak i cjelovečernji dokumentarni film. Po imenu temeljno novog načina opisivanja sintaktičke strukture koji je izumio Chomsky - generativne (generirajuće) gramatike - nazvan je odgovarajući trend u lingvistici generativizam.

Chomsky, potomak imigranata iz Rusije, studirao je lingvistiku, matematiku i filozofiju na Sveučilištu u Pennsylvaniji od 1945. godine, pod jakim utjecajem svog učitelja Zeliga Harrisa - kao i Harris, Chomsky je svoje političke stavove smatrao i još uvijek smatra bliskima anarhizmu (još uvijek je poznat kao kritičar postojećeg američkog političkog sustava i kao jedan od duhovnih vođa antiglobalizma).

Prvo veće znanstveno djelo Chomskog, magistarski rad „Morfologija suvremenog hebrejskog » (1951.) ostao je neobjavljen. Chomsky je doktorirao na Sveučilištu u Pennsylvaniji 1955., no veliki dio istraživanja na kojem se temelji njegova disertacija (objavljena u cijelosti tek 1975. pod naslovom Logička struktura lingvističke teorije) i njegova prva monografija, Sintaktičke strukture (1957., rus. trans. 1962), izvedena je na Sveučilištu Harvard 1951.-1955. Iste 1955. godine znanstvenik se preselio na Tehnološki institut u Massachusettsu, gdje je 1962. godine postao profesor.

Chomskyjeva teorija prošla je kroz nekoliko faza u svom razvoju.

U prvoj monografiji "Sintaktičke strukture" znanstvenik je predstavio jezik kao mehanizam za generiranje beskonačnog niza rečenica pomoću konačnog skupa gramatičkih sredstava. Kako bi opisao jezična svojstva, predložio je koncepte dubinskih (skrivenih od izravne percepcije i generiranih sustavom rekurzivnih, tj. pravila koja se mogu ponavljati) i površinskih (izravno percipiranih) gramatičkih struktura, kao i transformacije koje opisuju prijelaz od dubinskih struktura do površinskih. Nekoliko površinskih struktura može odgovarati jednoj dubinskoj strukturi (na primjer, pasivna struktura Ukaz potpisuje predsjednik izvedeno iz iste dubinske strukture kao i aktivni konstrukt Predsjednik potpisuje ukaz) i obrnuto (dakle, dvosmislenost majka voli kćer opisan kao rezultat podudarnosti površinskih struktura koje sežu u dvije različite dubinske, u jednoj od kojih je majka ona koja voli kćer, a u drugoj ona koju voli kći).

Chomskyjevom standardnom teorijom smatra se model "Aspekti" postavljen u Chomskyjevoj knjizi "Aspekti teorije sintakse". U ovom su modelu po prvi put pravila semantičke interpretacije uvedena u formalnu teoriju, pripisujući značenje dubokim strukturama. U Aspektima se jezična kompetencija suprotstavlja upotrebi jezika (izvedbi), usvaja se tzv. Katz-Postalova hipoteza o očuvanju značenja tijekom transformacije, u vezi s kojom se isključuje koncept neobvezne transformacije, a aparatura uvode se sintaktička obilježja koja opisuju leksičku spojivost.

Sedamdesetih godina prošlog stoljeća Chomsky je radio na teoriji kontrole i vezivanja (GB-teorija - od riječi vlada I vezanje) je općenitiji od prethodnog. U njemu je znanstvenik napustio specifična pravila koja opisuju sintaktičke strukture određenih jezika. Sve transformacije zamijenjene su jednom univerzalnom transformacijom poteza. U okviru GB teorije postoje i privatni moduli od kojih je svaki odgovoran za svoj dio gramatike.

Već nedavno, 1995. godine, Chomsky je iznio minimalistički program, gdje se ljudski jezik opisuje kao strojni jezik. Ovo je samo program - ne model ili teorija. U njemu Chomsky identificira dva glavna podsustava ljudskog jezičnog aparata: leksikon i računalni sustav, kao i dva sučelja - fonetsko i logičko.

Chomskyjeve formalne gramatike postale su klasične za opisivanje ne samo prirodnih već i umjetnih jezika - posebno programskih jezika. Razvoj strukturalne lingvistike u drugoj polovici 20. stoljeća s pravom se može smatrati "Chomskijevskom revolucijom".

Moskovska fonološka škola, čiji su predstavnici bili A.A. Reformatsky, V.N. Sidorov, P.S. Kuznjecov, A.M. Suhotin, R.I. Avanesov, koristio je sličnu teoriju za proučavanje fonetike. Postupno se počinju primjenjivati ​​"egzaktne" metode ne samo u fonetici, već iu sintaksi. I lingvisti i matematičari, kod nas i u inozemstvu, počinju proučavati strukturu jezika. Pedesetih i šezdesetih godina prošlog stoljeća u SSSR-u je započela nova faza u interakciji između matematike i lingvistike, povezana s razvojem sustava za strojno prevođenje.

Poticaj za početak ovih radova u našoj zemlji bila su prva dostignuća u području strojnog prevođenja u Sjedinjenim Državama (iako je prvi uređaj za mehanizirano prevođenje P.P. Smirnov-Troyansky izumljen u SSSR-u 1933., on je, budući da je primitivan, nije postalo široko rasprostranjeno). Godine 1947. A. Butt i D. Britten smislili su kod za prijevod riječ po riječ pomoću računala, a godinu dana kasnije R. Richens predložio je pravilo za dijeljenje riječi na korijene i završetke u strojnom prijevodu. Te su godine bile dosta drugačije od današnjih. Bili su to vrlo veliki i skupi strojevi koji su zauzimali cijele prostorije i zahtijevali veliki broj inženjera, operatera i programera za njihovo održavanje. Uglavnom, ta su računala služila za izvođenje matematičkih proračuna za potrebe vojnih institucija - novosti u matematici, fizici i tehnici služile su, prije svega, vojnim poslovima. U ranim fazama razvoj MP-a aktivno je podržavala vojska, dok se (u uvjetima hladnog rata) u SAD-u razvijao rusko-engleski, a u SSSR-u anglo-ruski smjer.

U siječnju 1954. na Tehničkom sveučilištu Massachusetts održan je "Georgetownski eksperiment" - prva javna demonstracija prijevoda s ruskog na engleski na stroju IBM-701. Sažetak poruke o uspješnom prolazu eksperimenta, napravio D.Yu. Panov, pojavio se u RJ "Matematika", 1954., br. 10: "Prijevod s jednog jezika na drugi pomoću stroja: izvješće o prvom uspješnom ispitu."

D. Yu. Panov (u to vrijeme direktor Instituta za znanstvene informacije - INI, kasnije VINITI) privukao je I. K. Belskaya, koji je kasnije vodio grupu za strojno prevođenje na Institutu za preciznu matematiku i računalno inženjerstvo Akademije znanosti SSSR-a, da rad na strojnom prevođenju. Do kraja 1955. godine datira prvo iskustvo prevođenja s engleskog na ruski uz pomoć stroja BESM. Programe za BESM sastavio je N.P. Trifonov i L.N. Korolev, čija je doktorska disertacija bila posvećena metodama za izradu rječnika za strojno prevođenje.

Paralelno se radilo na strojnom prevođenju na Odjelu za primijenjenu matematiku Matematičkog instituta Akademije znanosti SSSR-a (sada Institut za primijenjenu matematiku M.V. Keldysh Ruske akademije znanosti). Na inicijativu matematičara A.A. Ljapunov. Uključio je O.S. Kulagin i njezini učenici T.D. Wentzel i N.N. Ricco. Ideje Ljapunova i Kulagine o mogućnosti korištenja tehnologije za prevođenje s jednog jezika na drugi objavljene su u časopisu Nature, 1955., br. 8. Od kraja 1955. T.N. Moloshnaya, koji je tada započeo samostalan rad na englesko-ruskom algoritmu prijevoda.

R. Frumkina, koja se u to vrijeme bavila algoritmom prijevoda sa španjolskog, prisjeća se da je u ovoj fazi rada bilo teško poduzeti bilo kakve dosljedne korake. Puno sam češće morao slijediti heurističko iskustvo – svoje ili kolega.

Međutim, prva generacija sustava strojnog prevođenja bila je vrlo nesavršena. Svi su se temeljili na algoritmima sekvencijalnog prevođenja "riječ po riječ", "fraza po fraza" - semantičke veze između riječi i rečenica nisu ni na koji način uzete u obzir. Na primjer, rečenice su: John je tražio svoju kutiju za igračke.Napokon ga je pronašao. Kutija je bila u olovci.John je bio jako sretan. (John je tražio svoju kutiju za igračke. Napokon ju je našao. Kutija je bila u igralištu. John je bio jako sretan.)” "Olovka" u ovom kontekstu nije "olovka" (alat za pisanje), već "ogradica za igru" ( olovka za igru). Poznavanje sinonima, antonima i figurativnih značenja teško je unijeti u računalo. Obećavajući smjer bio je razvoj računalnih sustava usmjerenih na korištenje ljudskog prevoditelja.

S vremenom su sustavi izravnog prevođenja zamijenjeni T-sustavima (od engleske riječi "transfer" - transformacija), u kojima se prijevod provodio na razini sintaktičkih struktura. Algoritmi T-sustava koristili su mehanizam koji je omogućio izgradnju sintaktičke strukture prema gramatičkim pravilima jezika ulazne rečenice (slično kao što se strani jezik uči u srednjoj školi), a zatim sintetizirati izlaznu rečenicu preoblikovanjem sintaktičke strukture i zamjenom potrebnih riječi iz rječnika.

Ljapunov je govorio o prijevodu tako da izvlači značenje prevedenog teksta i prikazuje ga na drugom jeziku. Pristup izgradnji sustava za strojno prevođenje koji se temelji na dobivanju semantičkog prikaza ulazne rečenice semantičkom analizom i sintezom ulazne rečenice prema dobivenom semantičkom prikazu još uvijek se smatra najsavršenijim. Takvi se sustavi nazivaju I-sustavi (od riječi "interlingua"). No, zadatak njihovog stvaranja, postavljen kasnih 50-ih i ranih 60-ih, do danas nije u potpunosti riješen, unatoč naporima Međunarodne federacije IFIP-a - svjetske zajednice znanstvenika u području obrade informacija.

Znanstvenici su razmišljali o tome kako formalizirati i izgraditi algoritme za rad s tekstovima, koje rječnike treba unijeti u stroj, koje lingvističke obrasce treba koristiti u strojnom prevođenju. Tradicionalna lingvistika nije imala takve ideje – ne samo u smislu semantike, nego ni u smislu sintakse. U to vrijeme nije bilo popisa sintaktičkih konstrukcija za bilo koji jezik, nisu proučavani uvjeti njihove kompatibilnosti i zamjenjivosti, nisu razvijena pravila za izgradnju velikih jedinica sintaktičke strukture od manjih sastavnih elemenata.

Potreba za stvaranjem teorijskih temelja strojnog prevođenja dovela je do formiranja i razvoja matematičke lingvistike. Vodeću ulogu u ovom pitanju u SSSR-u odigrali su matematičari A.A. Ljapunov, O.S. Kulagina, V.A. Uspenski, lingvisti V.Yu. Rosenzweig, P.S. Kuznjecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina je disertacija bila posvećena proučavanju formalne teorije gramatika (istodobno s N. Khomskim u SAD-u), Kuznjecov je iznio zadatak aksiomatizacije lingvistike, koji seže do radova F.F. Fortunatov.

Dana 6. svibnja 1960. godine donesena je Uredba Prezidija Akademije znanosti SSSR-a "O razvoju strukturnih i matematičkih metoda za proučavanje jezika", au Institutu za lingvistiku i Institutu za lingvistiku stvoreni su odgovarajući odjeli. ruski jezik. Od 1960. godine vodeća humanitarna sveučilišta u zemlji - Filološki fakultet Moskovskog državnog sveučilišta, Lenjinrad, Novosibirska sveučilišta, Moskovski državni institut za strane jezike - započela su obuku osoblja u području automatske obrade teksta.

Međutim, radovi strojnog prevođenja iz ovog razdoblja, nazvani "klasični", više su od teorijskog nego praktičnog interesa. Isplativi sustavi za strojno prevođenje počeli su se stvarati tek osamdesetih godina prošlog stoljeća. O tome ću govoriti kasnije u odjeljku 2.1, Strojno prevođenje.

1960-ih i 70-ih godina uključuje duboki teorijski razvoj koristeći metode teorije skupova i matematičke logike, kao što su teorija polja i teorija neizrazitih skupova.

Autor teorije polja u lingvistici bio je sovjetski pjesnik, prevoditelj i lingvist V.G. Admoni. Svoju je teoriju u početku razvio na temelju njemačkog jezika. Za Admonija, koncept "polja" označava proizvoljan neprazan skup jezičnih elemenata (na primjer, "leksičko polje", "semantičko polje").

Struktura polja je heterogena: sastoji se od jezgre, čiji elementi imaju kompletan skup značajki koje definiraju skup, i periferije, čiji elementi mogu imati obje značajke danog skupa (ne sve) i susjednih. Dat ću primjer koji ilustrira ovu tvrdnju: na primjer, u engleskom jeziku polje složenica ("day-dream" - "dream" teško je odvojiti od polja fraza ("tear gas" - "tear gas")) .

Već spomenuta teorija neizrazitih skupova usko je povezana s teorijom polja. U SSSR-u su lingvisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, međutim, njezin je predak bio američki matematičar L. Zadeh, koji je 1965. objavio članak “Fuzzy Logic”. Dajući matematičko obrazloženje teorije neizrazitih skupova, Zade ih je razmatrao na temelju lingvističke građe.

U ovoj teoriji ne govorimo toliko o pripadnosti elemenata određenom skupu (AOa), koliko o stupnju tog članstva (mAOa), budući da periferni elementi mogu pripadati nekoliko polja u jednom ili drugom stupnju. Zade (Lofti-zade) je bio porijeklom iz Azerbejdžana, do svoje 12. godine imao je praksu komuniciranja na četiri jezika - azerbejdžanskom, ruskom, engleskom i perzijskom - i koristio je tri različita pisma: ćirilicu, latinicu, arapski. Kada znanstvenika pitaju što je zajedničko između teorije neizrazitih skupova i lingvistike, on ne poriče tu vezu, ali pojašnjava: “Nisam siguran da je proučavanje ovih jezika imalo velik utjecaj na moje razmišljanje. Ako je to bio slučaj, onda samo podsvjesno. Zadeh je u mladosti studirao u prezbiterijanskoj školi u Teheranu, a nakon Drugog svjetskog rata emigrirao je u SAD. “Nije pitanje jesam li Amerikanac, Rus, Azerbajdžanac ili netko treći”, rekao je u jednom od razgovora, “Mene su oblikovale sve te kulture i narodi i među svakim od njih se osjećam sasvim ugodno.” U tim riječima postoji nešto slično onome što karakterizira teoriju neizrazitih skupova - odmak od jednoznačnih definicija i oštrih kategorija.

Kod nas su se 70-ih godina prevodili i proučavali radovi zapadnih lingvista dvadesetog stoljeća. I.A. Melchuk je preveo djela N. Chomskog na ruski. NA. Slyusareva u svojoj knjizi "Teorija F. de Saussurea u svjetlu moderne lingvistike" povezuje postavke Saussureova učenja s aktualnim problemima lingvistike 70-ih godina. Postoji tendencija daljnje matematizacije lingvistike. Vodeća domaća sveučilišta obrazuju osoblje u specijalnosti "Matematička (teorijska, primijenjena) lingvistika". U isto vrijeme na Zapadu dolazi do naglog skoka u razvoju računalne tehnologije, koja zahtijeva sve više i više novih jezičnih temelja.

U 1980-ima, profesor Instituta za orijentalne studije Akademije znanosti Yu.K. Lekomtsev, dok analizira jezik lingvistike kroz analizu shema, tablica i drugih vrsta zapisa koji se koriste u lingvističkim opisima, razmatra matematičke sustave prikladne za te svrhe (uglavnom sustave matrične algebre).

Tako je kroz dvadeseto stoljeće dolazilo do približavanja egzaktnih i humanističkih znanosti. Interakcija matematike s lingvistikom sve je više nalazila praktične primjene. Više o tome u sljedećem poglavlju.

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1 Strojno prevođenje

Ideja o prevođenju s jednog jezika na drugi uz pomoć univerzalnog mehanizma nastala je nekoliko stoljeća prije nego što su započeli prvi razvoji na ovom području - još 1649. godine Rene Descartes je predložio ideju jezika u kojem bi bile ekvivalentne ideje različiti jezici bili bi izraženi jednim simbolom. Prvi pokušaji provedbe ove ideje u 1930-im i 40-im godinama, početak teorijskih razvoja sredinom stoljeća, poboljšanje prevoditeljskih sustava uz pomoć tehnologije u 1970-im i 80-im godinama, nagli razvoj prevoditeljske tehnologije u posljednjoj desetljeće - to su faze u razvoju strojnog prevođenja kao industrije. Iz radova o strojnom prevođenju izrasla je računalna lingvistika kao znanost.

S razvojem računalne tehnologije kasnih 70-ih i ranih 80-ih, istraživači su sebi postavili realnije i isplativije ciljeve - stroj nije postao konkurent (kao što se ranije pretpostavljalo), već pomoćnik ljudskom prevoditelju. Strojno prevođenje prestaje služiti isključivo vojnim zadaćama (svi sovjetski i američki izumi i istraživanja, usmjerena prvenstveno na ruski i engleski jezik, pridonijeli su Hladnom ratu na ovaj ili onaj način). Godine 1978. riječi prirodnog jezika prenošene su preko međusobno povezane mreže Arpa, a šest godina kasnije u Sjedinjenim Državama pojavili su se prvi mikroračunalni programi za prevođenje.

U 70-ima Komisija europskih zajednica kupuje englesko-francusku verziju računalnog prevoditelja Systran, naručujući i francusko-englesku i talijansko-englesku verziju te sustav prevođenja s ruskog na engleski koji koriste američke oružane snage. Tako su postavljeni temelji projekta EUROTRA.

O oživljavanju strojnog prevođenja 70-80-ih. svjedoče sljedeće činjenice: Komisija europskih zajednica (CEC) kupuje englesko-francusku verziju Systrana, kao i sustav prevođenja s ruskog na engleski (potonji je razvijen nakon izvješća ALPAC-a i nastavio ga je koristiti US Air Force i NASA); osim toga, CEC naređuje izradu francusko-engleske i talijansko-engleske verzije. Istodobno, dolazi do brzog širenja aktivnosti strojnog prevođenja u Japanu; u SAD-u Panamerička zdravstvena organizacija (PAHO) naređuje razvoj španjolsko-engleskog smjera (sustav SPANAM); Zračne snage SAD-a financiraju razvoj sustava za strojno prevođenje u Lingvističkom istraživačkom centru na Sveučilištu Texas u Austinu; Grupa TAUM u Kanadi ostvaruje značajan napredak u razvoju svog sustava METEO (meteorološki prijevod). Brojni projekti započeti su 70-ih i 80-ih godina. kasnije razvijen u potpune komercijalne sustave.

U razdoblju od 1978. do 1993. na istraživanja u području strojnog prevođenja u SAD-u potrošeno je 20 milijuna dolara, u Europi 70 milijuna, au Japanu 200 milijuna dolara.

Jedna od novosti je tehnologija TM (translation memory) koja radi na principu akumulacije: tijekom procesa prevođenja spremaju se izvorni segment (rečenica) i njezin prijevod, što rezultira formiranjem jezične baze podataka; ako se u novoprevedenom tekstu pronađe identičan ili sličan segment, on se prikazuje zajedno s prijevodom i naznakom postotka podudaranja. Prevoditelj zatim donosi odluku (urediti, odbiti ili prihvatiti prijevod), čiji rezultat sustav pohranjuje, tako da nema potrebe dvaput prevoditi istu rečenicu. Poznati komercijalni sustav temeljen na TM tehnologiji trenutno razvija sustav TRADOS (osnovan 1984.).

Trenutačno nekoliko desetaka tvrtki razvija komercijalne sustave strojnog prevođenja, uključujući: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata softver; Linguistica b.v. i dr. Sada možete koristiti usluge automatskih prevoditelja izravno na webu: alphaWorks; PROMT-ov mrežni prevoditelj, LogoMedia.net, AltaVistina usluga prevođenja Babel Fish; InfiniT.com; Prevođenje Interneta.

Komercijalno učinkoviti sustavi prevođenja pojavili su se u drugoj polovici 80-ih i kod nas. Proširio se i sam koncept strojnog prevođenja (počeo je uključivati ​​“stvaranje više automatskih i automatiziranih sustava i uređaja koji automatski ili poluautomatski obavljaju cijeli ciklus prevođenja ili pojedine zadatke u dijalogu s osobom”), te povećana su državna izdvajanja za razvoj ove industrije.

Ruski, engleski, njemački, francuski i japanski postali su glavni jezici domaćih prevoditeljskih sustava. Svesavezni centar za prevođenje (VTsP) razvio je sustav za prevođenje s engleskog i njemačkog na ruski na računalu ES-1035-ANRAP. Sastojao se od tri rječnika - ulaznog engleskog i njemačkog i izlaznog ruskog - pod jednim softverom. Bilo je nekoliko izmjenjivih specijaliziranih rječnika - za računalnu tehnologiju, programiranje, radioelektroniku, strojarstvo, poljoprivredu, metalurgiju. Sustav je mogao raditi u dva načina - automatskom i interaktivnom, kada se na ekranu prikazuje izvorni tekst i prijevod po frazi, koji osoba može uređivati. Brzina prevođenja teksta u ANRAP (od početka tipkanja do kraja ispisa) bila je približno 100 stranica na sat.

Godine 1989. stvorena je obitelj komercijalnih prevoditelja tipa SPRINT koji su radili s ruskim, engleskim, njemačkim i japanskim jezikom. Njihova glavna prednost bila je kompatibilnost s IBM PC računalom - čime su domaći sustavi za strojno prevođenje dostigli međunarodnu razinu kvalitete. Istodobno se razvija sustav strojnog prevođenja s francuskog na ruski FRAP, koji uključuje 4 stupnja analize teksta: grafematski, morfološki, sintaktički i semantički. U LGPI im. Herzena, radilo se na četverojezičnom (engleski, francuski, španjolski, ruski) sustavu SILOD-MP (u industrijskom načinu rada korišteni su englesko-ruski i francusko-ruski rječnici.

Za specijalizirano prevođenje tekstova iz elektrotehnike postojao je sustav ETAP-2. Analiza ulaznog teksta u njoj provedena je na dvije razine - morfološkoj i sintaktičkoj. Rječnik ETAP-2 sadržavao je oko 4 tisuće natuknica; faza transformacije teksta - oko 1000 pravila (96 općih, 342 privatna, ostalo su rječnička). Sve je to osiguralo zadovoljavajuću kvalitetu prijevoda (recimo, naslov patenta "Optical phase grid arrangement and coupling device having an such an arrangement" preveden je kao "An optical phase grid device and a connecting device with such a device" - unatoč tautologija, smisao je sačuvan).

Na Pedagoškom institutu za strane jezike u Minsku, na temelju englesko-ruskog rječnika oblika riječi i fraza, izumljen je sustav za strojno prevođenje naslova, na Institutu za orijentalne studije Akademije znanosti - sustav za prevođenje s japanskog na ruski. Prva automatska vokabularna i terminološka usluga (SLOTHERM) za računalstvo i programiranje, stvorena u Moskovskom istraživačkom institutu za sustave automatizacije, sadržavala je približno 20 000 pojmova u eksplanatornom rječniku i posebnim rječnicima za lingvistička istraživanja.

Sustavi za strojno prevođenje postupno su se počeli koristiti ne samo za namjeravanu svrhu, već i kao važna komponenta sustava za automatsko učenje (za podučavanje prevođenja, provjeru pravopisnog i gramatičkog znanja).

Devedesete su sa sobom donijele brzi razvoj tržišta osobnih računala (od desktopa do džepa) i informacijske tehnologije, raširenu upotrebu Interneta (koji postaje sve internacionalniji i višejezičan). Sve je to učinilo daljnji razvoj sustava za automatizirano prevođenje zahtjevnim. Od ranih 1990-ih Na tržište PC sustava ulaze i domaći programeri.

U srpnju 1990. na PC Forumu u Moskvi predstavljen je prvi komercijalni sustav za strojno prevođenje u Rusiji PROMT (PROgrammer's Machine Translation). PROMT je pobijedio na NASA-inom natječaju za nabavu MP sustava (PROMT je bio jedina neamerička tvrtka u ovom PROMT je 1992. izdao cijelu obitelj sustava pod novim imenom STYLUS za prijevod s engleskog, njemačkog, francuskog, talijanskog i španjolskog na ruski i s ruskog na engleski, a prvi svjetski sustav za strojno prevođenje za Windows nastao je na osnova STYLUS-a 1993. Godine 1994. objavljen je STYLUS 2.0 za Windows 3.X/95/NT, a 1995.-1996. treća generacija sustava za strojno prevođenje, potpuno 32-bitni STYLUS 3.0 za Windows 95/NT, dok uspješno je završen razvoj potpuno novih, prvih u svijetu rusko-njemačkih i rusko-francuskih sustava strojnog prevođenja.

Godine 1997. potpisan je ugovor s francuskom tvrtkom Softissimo o izradi sustava prevođenja s francuskog na njemački i engleski i obrnuto, au prosincu ove godine pušten je u prodaju prvi njemačko-francuski sustav prevođenja u svijetu. Iste godine tvrtka PROMT izdala je sustav implementiran pomoću tehnologije Gigant, koji podržava nekoliko jezičnih smjerova u jednoj ljusci, kao i poseban prevoditelj za rad na Internetu WebTranSite.

Godine 1998. puštena je cijela plejada programa pod novim imenom PROMT 98. Godinu dana kasnije PROMT je izdao dva nova proizvoda: jedinstveni programski paket za rad na Internetu - PROMT Internet i prevoditelj za korporativne mail sustave - PROMT Mail. Prevoditelj. U studenom 1999. PROMT je prepoznat kao najbolji sustav strojnog prevođenja testiran od strane francuskog časopisa PC Expert, nadmašivši svoje konkurente za 30 posto. Za korporativne klijente razvijena su i posebna poslužiteljska rješenja - korporativni prevoditeljski poslužitelj PROMT Translation Server (PTS) i internetsko rješenje PROMT Internet Translation Server (PITS). Godine 2000. PROMT je ažurirao svoju cjelokupnu liniju softverskih proizvoda izdavanjem nove generacije MT sustava: PROMT Translation Office 2000, PROMT Internet 2000 i Magic Gooddy 2000.

Online prijevod uz podršku sustava PROMT koristi se na brojnim domaćim i stranim stranicama: PROMT-ov Online Translator, InfiniT.com, Translate.Ru, Lycos itd., kao iu ustanovama raznih profila za prevođenje poslovne dokumentacije, članci i pisma (postoje sustavi za prevođenje ugrađeni izravno u Outlook Express i druge klijente e-pošte).

U današnje vrijeme pojavljuju se nove tehnologije strojnog prevođenja koje se temelje na korištenju sustava umjetne inteligencije i statističkih metoda. O potonjem - u sljedećem odjeljku.

2.2 Statističke metode u učenju jezika

Znatna se pozornost u suvremenoj lingvistici posvećuje proučavanju jezičnih pojava pomoću metoda kvantitativne matematike. Kvantitativni podaci često pomažu dubljem razumijevanju proučavanih pojava, njihovog mjesta i uloge u sustavu povezanih pojava. Odgovor na pitanje "koliko" pomaže odgovoriti na pitanja "što", "kako", "zašto" - takav je heuristički potencijal kvantitativne karakteristike.

Statističke metode igraju značajnu ulogu u razvoju sustava za strojno prevođenje (vidi odjeljak 2.1). U statističkom pristupu problem prevođenja razmatra se u smislu kanala s šumom. Zamislite da trebamo prevesti rečenicu s engleskog na ruski. Načelo bučnog kanala nudi nam sljedeće objašnjenje odnosa između engleske i ruske rečenice: engleska rečenica nije ništa drugo nego ruska rečenica iskrivljena nekom vrstom šuma. Kako bismo povratili izvornu rusku rečenicu, moramo znati što ljudi obično govore na ruskom i kako se ruske fraze iskrivljuju na engleski. Prijevod se provodi traženjem takve ruske rečenice koja maksimizira umnoške bezuvjetne vjerojatnosti ruske rečenice i vjerojatnosti engleske rečenice (izvornika) s obzirom na danu rusku rečenicu. Prema Bayesovom teoremu, ova je ruska rečenica najvjerojatniji prijevod engleskog:

gdje je e prijevodna rečenica, a f izvorna rečenica

Dakle, trebamo model izvora i model kanala, ili model jezika i model prijevoda. Jezični model mora dodijeliti ocjenu vjerojatnosti bilo kojoj rečenici na ciljnom jeziku (u našem slučaju ruskom), a prevoditeljski model izvornoj rečenici. (vidi tablicu 1)

Općenito, sustav strojnog prevođenja radi na dva načina:

1. Obuka sustava: uzima se korpus za obuku paralelnih tekstova, a pomoću linearnog programiranja traže se takve vrijednosti tablica korespondencije prijevoda koje maksimiziraju vjerojatnost (na primjer) ruskog dijela korpusa s dostupnim engleskim prema na odabrani model prijevoda. Na ruskom dijelu istog korpusa izgrađen je model ruskog jezika.

2. Iskorištavanje: na temelju podataka dobivenih za nepoznatu englesku rečenicu, traži se ruska koja maksimizira umnožak vjerojatnosti dodijeljenih jezičnim modelom i prevoditeljskim modelom. Program koji se koristi za takvu pretragu naziva se dekoder.

Najjednostavniji statistički model prevođenja je model doslovnog prevođenja. Ovaj model pretpostavlja da je za prijevod rečenice s jednog jezika na drugi dovoljno prevesti sve riječi (stvoriti "vreću riječi"), a model će osigurati njihov raspored u ispravnom redoslijedu. Da bi se smanjio P( a, f | e) u P(a | e, f), tj. vjerojatnosti danog poravnanja danog para rečenica, svaka vjerojatnost P(a, f | e) je normalizirana zbrojem vjerojatnosti svih poravnanja danog para rečenica:

Implementacija Viterbijevog algoritma koji se koristi za treniranje Modela #1 je sljedeća:

1. Cijela tablica vjerojatnosti korespondencije prijevoda ispunjena je istim vrijednostima.

2. Za sve moguće varijante parnih veza riječi izračunava se vjerojatnost P(a, f | e):

3. Vrijednosti P(a, f | e) su normalizirane kako bi se dobile vrijednosti P(a | e, f).

4. Izračunava se učestalost svakog para prijevoda, ponderirana vjerojatnošću svake opcije usklađivanja.

5. Dobivene ponderirane frekvencije normaliziraju se i tvore novu tablicu vjerojatnosti korespondencije prijevoda

6. Algoritam se ponavlja od koraka 2.

Razmotrimo, kao primjer, obuku sličnog modela na korpusu od dva para rečenica (slika 2):

bijela kuća

  • Kuća/Kuća

Nakon velikog broja ponavljanja, dobit ćemo tablicu (tablica 2), iz koje je vidljivo da je prijevod izveden s visokom točnošću.

Također, statističke metode naširoko se koriste u proučavanju vokabulara, morfologije, sintakse i stila. Znanstvenici s Permskog državnog sveučilišta proveli su istraživanje temeljeno na tvrdnji da su stereotipne fraze važan "građevni materijal" teksta. Ove se fraze sastoje od "nuklearnih" ponovljenih riječi i zavisnih riječi-specifikatora i imaju izraženu stilsku boju.

U znanstvenom stilu, "nuklearne" riječi mogu se nazvati: istraživanje, studija, zadatak, problem, pitanje, fenomen, činjenica, opažanje, analiza itd. U novinarstvu će druge riječi biti "nuklearne", koje imaju povećanu vrijednost posebno za tekst novina: vrijeme, osoba, moć, posao, radnja, zakon, život, povijest, mjesto itd. (ukupno 29)

Za jezikoslovce je posebno zanimljiva i stručna diferenciranost nacionalnog jezika, izvornost uporabe vokabulara i gramatike, ovisno o vrsti zanimanja. Poznato je da vozači u stručnom govoru koriste oblik w O fer, medicinari kažu k O klub umjesto koktela Yu sh - mogu se dati takvi primjeri. Zadatak statistike je pratiti varijabilnost izgovora i promjenu jezične norme.

Profesionalne razlike dovode do razlika ne samo gramatičkih, već i leksičkih. Jakutsko državno sveučilište nazvano po M.K. Ammosov, analizirano je 50 upitnika s najčešćim reakcijama na pojedine riječi među liječnicima i građevinarima (tablica 3).

Graditelji

ljudski

pacijent (10), osobnost (5)

muškarac (5)

dobro

pomoć (8), pomoć (7)

zlo (16)

život

smrt (10)

lijepo (5)

smrt

leš (8)

život (6)

vatra

toplina (8), spaljivanje (6)

vatra (7)

prst

ruka (14), panaritij (5)

veliki (7), indeks (6)

oči

vid (6), učenik, oftalmolog (po 5)

smeđa (10), velika (6)

glava

um (14), mozak (5)

velik (9), pametan (8), pametan (6)

izgubiti

svijest, život (po 4)

novac (5), pronađi (4)

Može se uočiti da liječnici češće od građevinara daju asocijacije vezane uz svoju profesionalnu djelatnost, budući da riječi-podražaji dani u upitniku imaju više veze s njihovom profesijom nego sa profesijom građevinara.

Statističke zakonitosti u jeziku koriste se za izradu frekvencijskih rječnika - rječnika koji daju numeričke karakteristike učestalosti riječi (oblika riječi, fraza) bilo kojeg jezika - jezika pisca, bilo kojeg djela itd. Obično se učestalost pojavljivanja riječ se koristi kao obilježje uporabe u tekstu određenog volumena

Model percepcije govora nemoguć je bez rječnika kao njegove bitne komponente. U percepciji govora osnovna operativna jedinica je riječ. Iz ovoga posebice slijedi da se svaka riječ percipiranog teksta mora poistovjetiti s odgovarajućom jedinicom unutarnjeg vokabulara slušatelja (ili čitatelja). Prirodno je pretpostaviti da je pretraživanje od samog početka ograničeno na neke poddomene rječnika. Prema većini suvremenih teorija percepcije govora, stvarna fonetska analiza zvučnog teksta u tipičnom slučaju daje samo neke djelomične informacije o mogućem fonološkom izgledu riječi, a ova vrsta informacija ne odgovara jednoj, nego određenom MNOGO riječi rječnika; Stoga se javljaju dva problema:

(a) odabrati odgovarajući skup prema određenim parametrima;

(b) unutar granica zacrtanog skupa (ako je adekvatno raspoređen) "eliminirati" sve riječi, osim one jedine koja najbolje odgovara zadanoj riječi prepoznatog teksta. Jedna od strategija "ispadanja" je isključivanje niskofrekventnih riječi. Iz toga slijedi da je vokabular za percepciju govora frekvencijski rječnik. Upravo je izrada računalne verzije frekvencijskog rječnika ruskog jezika početni zadatak predstavljenog projekta.

Na temelju materijala ruskog jezika postoji 5 frekvencijskih rječnika (ne računajući granske rječnike). Napomenimo samo neke općenite nedostatke postojećih rječnika.

Svi poznati frekvencijski rječnici ruskog jezika temelje se na obradi nizova pisanih (tiskanih) tekstova. Djelomično iz tog razloga, kada se identitet riječi uglavnom temelji na formalnoj, grafičkoj slučajnosti, semantika se ne uzima dovoljno u obzir. Kao rezultat toga, frekvencijske karakteristike su također pomaknute, iskrivljene; na primjer, ako sastavljač frekvencijskog rječnika u opću statistiku uporabe riječi “prijatelj” uključi riječi iz kombinacije “jedni druge”, onda je to teško opravdano: s obzirom na semantiku, moramo priznati da su to već različite riječi, odnosno da je samostalna rječnička jedinica samo kombinacija u cjelini.

Također, u svim postojećim rječnicima riječi se stavljaju samo u osnovnim oblicima: imenice u jednini, nominativu, glagoli u infinitivu itd. Neki rječnici daju podatke o učestalosti oblika riječi, ali obično to ne čine dovoljno dosljedno, ne iscrpno. Frekvencije različitih oblika riječi iste riječi očito se ne poklapaju. Kreator modela percepcije govora mora uzeti u obzir da je u stvarnom perceptivnom procesu upravo specifičan oblik riječi „uronjen“ u tekst predmet prepoznavanja: na temelju analize početnog dijela eksponenta oblika riječi, formira se skup riječi s identičnim početkom, a početni dio oblika riječi nije nužno identičan početnom dijelu rječničkog oblika. Riječ je o obliku riječi koji ima specifičnu ritmičku strukturu, što je također izuzetno važan parametar za percepcijski odabir riječi. Konačno, u konačnom prikazu prepoznatog iskaza, riječi su opet predstavljene odgovarajućim oblicima riječi.

Mnogo je radova koji pokazuju važnost frekvencije u procesu percepcije govora. No nisu nam poznati radovi u kojima bi se koristila učestalost oblika riječi – naprotiv, svi autori praktički zanemaruju učestalost pojedinih oblika riječi, misleći isključivo na lekseme. Ako se njima dobiveni rezultati ne smatraju artefaktima, treba pretpostaviti da izvorni govornik na neki način ima pristup informacijama o omjeru učestalosti oblika riječi i rječničkih oblika, tj. zapravo leksema. Štoviše, takav prijelaz s oblika riječi na leksem, naravno, ne može se objasniti prirodnim poznavanjem odgovarajuće paradigme, budući da se informacija o frekvenciji mora koristiti prije konačne identifikacije riječi, inače jednostavno gubi svoje značenje.

Prema primarnim statističkim karakteristikama moguće je sa zadanom relativnom greškom odrediti onaj dio rječnika koji uključuje riječi s visokom učestalošću pojavljivanja, neovisno o vrsti teksta. Također je moguće, uvođenjem postupnog sređivanja u rječnik, dobiti niz rječnika koji pokriva prvih 100, 1000, 5000 itd. čestih riječi. Statističke karakteristike rječnika zanimljive su u vezi sa semantičkom analizom vokabulara. Proučavanje predmetno-ideoloških skupina i semantičkih polja pokazuje da su leksičke asocijacije poduprte semantičkim vezama koje su koncentrirane oko leksema s najčešćim značenjem. Opis značenja unutar leksičko-semantičkog polja može se provesti identificiranjem riječi s najapstraktnijim leksemima u značenju. Naizgled, "prazne" (sa stajališta nominativne potencije) rječničke jedinice čine statistički homogen sloj.

Ništa manje nisu vrijedni ni rječnici za pojedine žanrove. Proučavanje mjere njihove sličnosti i prirode statističkih distribucija pružit će zanimljive podatke o kvalitativnoj stratifikaciji vokabulara ovisno o sferi govorne uporabe.

Sastavljanje rječnika velike frekvencije zahtijeva korištenje računalne tehnologije. Uvođenje djelomične mehanizacije i automatizacije u procesu rada na rječniku zanimljivo je kao eksperiment strojne obrade rječnika za različite tekstove. Takav rječnik zahtijeva strožiji sustav obrade i prikupljanja rječničkog materijala. U malom, ovo je sustav za pronalaženje informacija koji može pružiti informacije o različitim aspektima teksta i vokabulara. Neki osnovni zahtjevi prema ovom sustavu planirani su od samog početka: ukupan broj riječi inventara, statističke karakteristike pojedine riječi i čitavih rječnika, redoslijed čestih i rijetkih zona rječnika itd. Datoteka strojne kartice omogućuje vam za automatsku izgradnju obrnutih rječnika za pojedinačne žanrove i izvore. Mnoge druge korisne statističke informacije o jeziku bit će izvučene iz skupljenog niza informacija. Računalni frekvencijski rječnik stvara eksperimentalnu osnovu za prijelaz na opsežniju automatizaciju rada s rječnikom.

Statistički podaci frekvencijskih rječnika također se mogu široko koristiti u rješavanju drugih jezičnih problema - na primjer, u analizi i određivanju aktivnih sredstava za tvorbu riječi suvremenog ruskog jezika, rješavanju pitanja poboljšanja grafike i pravopisa, koja su povezana s uzimanjem u obzir obračun statističkih podataka o vokabularu (važno je uzeti u obzir vjerojatnostna obilježja grafemskih kombinacija, vrste slovnih kombinacija ostvarenih u riječima), praktična transkripcija i transliteracija. Statistički parametri rječnika također će biti korisni u rješavanju problema automatizacije tipkanja, prepoznavanja i automatskog čitanja doslovnog teksta.

Suvremeni rječnici objašnjenja i gramatike ruskog jezika uglavnom su izgrađeni na temelju književnih i umjetničkih tekstova. Postoje frekvencijski rječnici jezika A.S. Puškin, A.S. Griboedova, F.M. Dostojevski, V.V. Vysotsky i mnogi drugi autori. Na Odsjeku za povijest i teoriju književnosti Smolenske drž. Pedagoško sveučilište već niz godina radi na izradi frekvencijskih rječnika poetskih i proznih tekstova. Za ovu studiju odabrani su frekvencijski rječnici svih pjesama Puškina i još dvojice pjesnika zlatnog doba - "Jao od pameti" Gribojedova i sve Ljermontovljeve poezije; Pasternak i pet drugih pjesnika srebrnog doba - Balmont 1894-1903, "Pjesme o lijepoj dami" od Bloka, "Kamen" od Mandeljštama, "Ognjeni stup" od Gumiljova, "Anno Domini MCMXXI" od Ahmatove i "Sestre Moj život" Pasternaka i još četiri pjesnika željeznog doba - "Pjesme Jurija Živaga", "Kad se razvedri", cijeli korpus lirike M. Petrova, "Daleka je cesta", "Vjetrobran", "Zbogom snijegu" i "Potkovice" Mežirova, "Antimirov" Voznesenskog i "Snježnica » Rylenkova.

Valja napomenuti da su ovi rječnici različiti po svojoj prirodi: jedni predstavljaju vokabular jednoga dramskog djela, drugi - zbornike pjesama, ili više knjiga, ili cijeli korpus pjesnikovih pjesama. Rezultate analize prikazane u ovom radu treba uzeti s oprezom, ne mogu se uzeti kao apsolutni. Međutim, uz pomoć posebnih mjera razlika u ontološkoj naravi tekstova može se donekle smanjiti.

Posljednjih godina sve se jasnije ostvaruje suprotnost između kolokvijalnog i knjižnog govora. O ovom se pitanju posebno oštro raspravlja među metodičarima koji traže zaokret u nastavi prema govornom jeziku. Međutim, specifičnost kolokvijalnog govora još uvijek ostaje nerazjašnjena.

Rječnici su obrađeni izradom korisničke aplikacije u okruženju uredskog programa EXCEL97. Aplikacija uključuje četiri radna lista EXCEL knjige - "Title Sheet", "Dictionaries" list s početnim podacima, "Proximities" i "Distances" s rezultatima, kao i skup makronaredbi.

Početni podaci upisuju se na listu "Rječnici". Rječnici proučavanih tekstova upisuju se u ćelije EXCEL-a, zadnji stupac S formira se iz dobivenih rezultata i jednak je broju riječi koje se nalaze u drugim rječnicima. Tablice "Blizina" i "Udaljenosti" sadrže izračunate mjere blizine M, korelacije R i udaljenosti D.

Aplikacijske makronaredbe su procedure programiranja temeljene na događajima napisane u Visual Basicu za aplikacije (VBA). Procedure se temelje na objektima VBA biblioteke i njihovim metodama obrade. Dakle, za rad s radnim listovima aplikacije koristi se ključni objekt Worksheet (radni list) i pripadajući način aktiviranja lista Activate (aktiviraj). Postavljanje raspona analiziranih izvornih podataka na Rječničkom listu vrši se metodom Select objekta Range (raspon), a prijenos riječi kao vrijednosti u varijable vrši se kao svojstvo (vrijednost) Value istog tog Raspona. objekt.

Unatoč činjenici da nas analiza korelacije ranga čini opreznima u pogledu ovisnosti tema između različitih tekstova, većina najčešćih riječi u svakom tekstu ima podudaranja u jednom ili više drugih tekstova. U stupcu S prikazan je broj takvih riječi među 15 najčešćih riječi za svakog autora. Podebljane riječi pojavljuju se samo u riječima jednog pjesnika u našoj tablici. Blok, Ahmatova i Petrov uopće nemaju istaknutih riječi, imaju S = 15. Ova tri pjesnika imaju istih 15 najčešćih riječi, razlikuju se samo po mjestu na popisu. Ali čak i Puškin, čiji je vokabular najizvorniji, ima S = 8, a ima 7 istaknutih riječi.

Rezultati pokazuju da postoji određeni sloj vokabulara koji koncentrira glavne teme poezije. U pravilu su te riječi kratke: od ukupnog broja (225) jednosložnih riječi 88, dvosložnih 127, trosložnih 10. Često ove riječi predstavljaju glavne mitologeme i mogu se svrstati u parove: noć - dan, zemlja - nebo (sunce), Bog - čovjek (ljudi), život - smrt, tijelo - duša, Rim - svijet(kod Mandeljštama); mogu se kombinirati u mitologeme više razine: nebo, zvijezda, sunce, zemlja; u osobi se u pravilu ističe tijelo, srce, krv, ruka, noga, obraz, oči. Od ljudskih stanja prednost se daje snu i ljubavi. Kuća i gradovi pripadaju ljudskom svijetu - Moskva, Rim, Pariz. Kreativnost je predstavljena leksemima riječ I pjesma.

Gribojedov i Ljermontov među najčešćim riječima gotovo da nemaju riječi koje označavaju prirodu. Imaju tri puta više riječi koje označavaju osobu, dijelove njenog tijela, elemente njenog duhovnog svijeta. Puškin i pjesnici dvadesetog stoljeća. oznake čovjeka i prirode približno su jednake. U ovom važnom aspektu predmeta možemo reći da je XX. stoljeće. slijedio Puškina.

Minimalna tema slučaj među najčešćim riječima nalazi se samo kod Gribojedova i Puškina. Ljermontov i pjesnici dvadesetog stoljeća. ustupa mjesto minimalnoj temi riječ. Riječ ne isključuje djela (biblijsko tumačenje teme: u Novom zavjetu sva učenja Isusa Krista smatraju se Božjom ili Isusovom riječi, a apostoli se ponekad nazivaju službenicima Riječi). Sveto značenje leksema riječ uvjerljivo se očituje, na primjer, u Pasternakovu stihu "I slika svijeta, otkrivena u Riječi". Sveto značenje leksema riječ u spoju i suprotnosti s ljudskim poslovima, uvjerljivo se očituje u istoimenoj pjesmi Gumiljova.

Leksemi koji se nalaze samo u jednom tekstu obilježavaju izvornost pojedine knjige ili zbirke knjiga. Na primjer, riječ "um" najčešća je u Gribojedovoj komediji "Jao od pameti" - ali se ne pojavljuje među učestalim riječima drugih tekstova. Tema uma daleko je najznačajnija u komediji. Ovaj leksem prati sliku Chatsky, a ime Chatsky je najčešće u komediji. Tako je u djelu organski spojena najčešća opća imenica s najučestalijim vlastitim imenom.

Najveći koeficijent korelacije povezuje teme tragičnih knjiga "Ognjeni stup" Gumiljova i "Anno Domini MCMXXI" Ahmatove. Među 15 najfrekventnijih imenica 10 je uobičajenih, među kojima su krv, srce, duša, ljubav, riječ, nebo. Podsjetimo da je Akhmatova knjiga uključivala minijaturu "Nećeš biti živ ...", napisanu između uhićenja Gumilyova i njegovog pogubljenja.

Teme svijeće i gomile u proučavanom materijalu nalaze se samo u "Pjesmama Jurija Živaga". Tema svijeće u stihovima iz romana ima mnogo kontekstualnih značenja: povezuje se s likom Isusa Krista, s temama vjere, besmrtnosti, kreativnosti, ljubavnog susreta. Svijeća je najvažniji izvor svjetla u središnjim prizorima romana. Tema gomile razvija se u vezi s glavnom idejom romana, u kojoj se privatni život osobe sa svojim nepokolebljivim vrijednostima suprotstavlja nemoralu nove države, izgrađene na načelima ugađanja gomili. .

Rad također uključuje treću fazu, koja se također odražava u programu, - to je izračun razlike u rednim brojevima riječi zajedničkih za dva rječnika i prosječne udaljenosti između istih riječi dvaju rječnika. Ova faza omogućuje prelazak s općih trendova u interakciji rječnika identificiranih uz pomoć statistike na razinu koja se približava tekstu. Na primjer, knjige Gumiljova i Ahmatove statistički značajno koreliraju. Gledamo koje su se riječi pokazale zajedničkim za njihove rječnike, a prije svega biramo one čiji se serijski brojevi razlikuju minimalno ili jednaki nuli. Upravo te riječi imaju isti rang-broj i, prema tome, te su minimalne teme u glavama dvojice pjesnika jednako važne. Zatim biste trebali prijeći na razinu tekstova i konteksta.

Kvantitativne metode također pomažu u proučavanju karakteristika naroda - izvornih govornika. Recimo, u ruskom ima 6 padeža, u engleskom nema padeža, au nekim jezicima naroda Dagestana broj padeža doseže 40. L. Perlovsky u svom članku "Svijest, jezik i kultura" povezuje ove obilježja sa sklonošću naroda individualizmu ili kolektivizmu, sa shvaćanjem stvari i pojava zasebno ili u vezi s drugima. Uostalom, upravo su se u engleskom govornom području (nema slučajeva - stvar se percipira "sama po sebi") pojavili pojmovi kao što su individualna sloboda, liberalizam i demokracija (napominjem da te pojmove koristim samo u vezi s jezik, bez ikakvih evaluativnih karakteristika). Unatoč činjenici da takve pretpostavke još uvijek ostaju samo na razini hrabrih znanstvenih hipoteza, one pomažu da se već poznate pojave pogledaju na novi način.

Kao što vidimo, kvantitativne karakteristike mogu se primijeniti u sasvim različitim područjima lingvistike, što sve više briše granice između "egzaktnih" i "humanitarnih" metoda. Lingvistika u rješavanju svojih problema sve više pribjegava pomoći ne samo matematike, već i računalne tehnologije.

2.3 Učenje jezika metodama formalne logike

S nekvantitativnim metodama matematike, posebice s logikom, suvremena teorijska lingvistika ne djeluje ništa manje plodonosno nego s kvantitativnima. Nagli razvoj računalnih tehnologija i porast njihove uloge u suvremenom svijetu zahtijevao je reviziju pristupa interakciji jezika i logike općenito.

Metode logike naširoko se koriste u razvoju formaliziranih jezika, posebice programskih jezika, čiji su elementi neki simboli (slični matematičkim), odabrani (ili konstruirani od prethodno odabranih simbola) i interpretirani na određeni način, povezani bez "tradicionalne" uporabe, razumijevanja i razumijevanja.funkcije istih simbola u drugim kontekstima. Programer se u svom radu stalno bavi logikom. Smisao programiranja je samo naučiti računalo razumu (u najširem smislu riječi). Pritom se metode "rezoniranja" pokazuju vrlo različitima. Svaki programer provodi određeno vrijeme tražeći greške u svojim i tuđim programima. Odnosno, tražiti pogreške u zaključivanju, u logici. I ovo također ostavlja traga. Puno je lakše otkriti logičke pogreške u običnom govoru. Relativna jednostavnost jezika koje proučavaju logičari omogućuje im da jasnije razjasne strukture tih jezika nego što je to moguće postići lingvistima koji analiziraju isključivo složene prirodne jezike. S obzirom na činjenicu da jezici koje proučavaju logičari koriste relacije prepisane iz prirodnih jezika, logičari mogu dati značajan doprinos općoj teoriji jezika. Ovdje je situacija slična onoj koja se događa u fizici: fizičar također formulira teoreme za idealno pojednostavljene slučajeve koji se uopće ne pojavljuju u prirodi - formulira zakone za idealne plinove, idealne tekućine, govori o gibanju bez trenja, itd. Za te idealizirane slučajeve mogu se ustanoviti jednostavni zakoni koji bi uvelike pridonijeli razumijevanju onoga što se događa u stvarnosti i što bi fizici vjerojatno ostalo nepoznato kada bi pokušala promatrati stvarnost izravno, u svoj njezinoj složenosti.

U proučavanju prirodnih jezika koriste se logičke metode kako oni koji uče jezik ne bi mogli glupo "zapamtiti" što više riječi, već bolje razumjeti njegovu strukturu. L. Shcherba je također u svojim predavanjima koristio primjer rečenice izgrađene prema zakonima ruskog jezika: „Sjajna kuzdra šteko bokra bokru i kovrča bokru“, a zatim je pitao studente što to znači. Unatoč činjenici da je značenje riječi u rečenici ostalo nejasno (one jednostavno ne postoje u ruskom), bilo je moguće jasno odgovoriti: "kuzdra" je subjekt, imenica ženskog roda, u jednini, nominativu, " bokr” je animiran i sl. Ispostavilo se da prijevod fraze glasi otprilike ovako: "Nešto ženstveno u jednom je potezu učinilo nešto nad nekom vrstom muškog stvorenja, a zatim je počelo dugo, postupno činiti nešto poput ovoga sa svojim mladunčetom." Sličan primjer teksta (umjetničkog) od nepostojećih riječi, izgrađenog u potpunosti prema zakonima jezika, jest Jabberwock Lewisa Carrolla (u Alisi u zemlji čudesa Carroll kroz svoj lik Humpty Dumptyja objašnjava značenje riječi koje izmišljeno: "kuhano" - osam sati navečer, kada je vrijeme za kuhanje večere, "chlivky" - krhak i spretan, "shorek" - križanac između tvora, jazavca i vadičepa, "roni" - ​​skakući, roniti, vrtjeti se, "nava" - trava ispod sunčanog sata (proteže se malo udesno, malo ulijevo i malo nazad), "groktaj" - groktaj i smij se, "zeljuk" - zeleni ćuran, "mjumzik" - ptica; perje joj je razbarušeno i strši na sve strane, poput metle, "mova" - daleko od kuće) .

Jedan od glavnih koncepata moderne logike i teorijske lingvistike, koji se koristi u proučavanju jezika raznih logičkih i matematičkih računa, prirodnih jezika, za opisivanje odnosa između jezika različitih "razina" i za karakterizaciju odnosa između jezika koji se razmatraju i predmetnih područja opisanih uz njihovu pomoć, koncept je metajezika. Metajezik je jezik koji se koristi za izražavanje sudova o drugom jeziku, jeziku-objektu. Uz pomoć metajezika, oni proučavaju strukturu znakovnih kombinacija (izražaja) jezika-objekta, dokazuju teoreme o njegovim izražajnim svojstvima, o njegovom odnosu prema drugim jezicima itd. Jezik koji se proučava naziva se i predmetni jezik u odnos prema ovom metajeziku. I predmetni jezik i metajezik mogu biti obični (prirodni) jezici. Metajezik se može razlikovati od predmetnog jezika (na primjer, u engleskom udžbeniku za Ruse, ruski je metajezik, a engleski je objektni jezik), ali se također može podudarati s njim ili se samo djelomično razlikovati, na primjer, u posebnoj terminologiji (Rusko lingvističko nazivlje je element metajezika za opisivanje ruskog jezika, tzv. semantički čimbenici dio su metajezika za opisivanje semantike prirodnih jezika).

Koncept "metajezika" postao je vrlo plodan u vezi s proučavanjem formaliziranih jezika koji su izgrađeni u okviru matematičke logike. Za razliku od formaliziranih predmetnih jezika, u ovom slučaju metajezik, pomoću kojeg se formulira metateorija (proučavajući svojstva predmetne teorije formulirane u predmetnom jeziku), u pravilu je običan prirodni jezik, na neki poseban način fragment prirodnog jezika ograničen na poseban način, koji ne sadrži nikakvu vrstu dvosmislenosti, metafore, "metafizički" koncepti itd. elementi običnog jezika koji sprječavaju njegovu upotrebu kao alata za točno znanstveno istraživanje. Pritom se sam metajezik može formalizirati i (bez obzira na to) postati predmetom istraživanja koja se provode pomoću metametajezika, a takav se niz može “misliti” da raste unedogled.

Logika nas uči plodnoj razlici između jezika-objekta i metajezika. Jezik-objekt sam je predmet logičkog istraživanja, a metajezik je onaj neizbježno umjetni jezik na kojem se takva istraživanja provode. Logičko mišljenje sastoji se samo od formuliranja odnosa i strukture stvarnog jezika (jezika predmeta) u jeziku simbola (metajezik).

Metajezik u svakom slučaju ne smije biti “ne siromašniji” od svog objektivnog jezika (tj. za svaki izraz potonjeg u metajeziku mora postojati njegovo ime, “prijevod”) - inače, ako ti zahtjevi nisu ispunjeni (što svakako zahtijeva mjesto u prirodnim jezicima, ako posebnim ugovorima nije drugačije određeno) nastaju semantički paradoksi (antinomije).

Kako se stvaralo sve više i više novih programskih jezika, u vezi s problemom programiranja prevoditelja, pojavila se hitna potreba za stvaranjem metajezika. Trenutno se metajezik oblika Backus-Naur (skraćeno BNF) najčešće koristi za opisivanje sintakse programskih jezika. To je kompaktni oblik u obliku nekih formula sličnih matematičkim. Za svaki koncept jezika postoji jedinstvena metaformula (normalna formula). Sastoji se od lijevog i desnog dijela. Lijeva strana specificira koncept koji se definira, a desna strana specificira skup dopuštenih jezičnih konstrukata koji se kombiniraju u ovaj koncept. Formula koristi posebne metaznakove u obliku uglastih zagrada, koji sadrže pojam koji se definira (na lijevoj strani formule) ili prethodno definirani pojam (na njenoj desnoj strani), a naznačeno je razdvajanje lijevog i desnog dijela metakarakterom "::=", čije je značenje ekvivalentno riječima "po definiciji postoji". Metalingvističke formule su u nekom obliku ugrađene u prevoditelje; uz njihovu pomoć se provjerava formalna usklađenost konstrukcija koje koristi programer s bilo kojom od konstrukcija koje su sintaktički važeće u ovom jeziku. Postoje i zasebni metajezici raznih znanosti - dakle, znanje postoji u obliku raznih metajezika.

Logičke metode poslužile su i kao osnova za stvaranje sustava umjetne inteligencije temeljenih na konceptu konekcionizma. Konekcionizam je posebna struja u filozofskoj znanosti, čiji su predmet pitanja znanja. U okviru ovog trenda pokušavaju se objasniti intelektualne sposobnosti čovjeka pomoću umjetnih neuronskih mreža. Sastavljene od velikog broja strukturnih jedinica sličnih neuronima, s težinom dodijeljenom svakom elementu koja određuje snagu veze s drugim elementima, neuronske mreže su pojednostavljeni modeli ljudskog mozga. Eksperimenti s neuralnim mrežama ove vrste pokazali su njihovu sposobnost da nauče izvršavati zadatke kao što su prepoznavanje uzoraka, čitanje i identificiranje jednostavnih gramatičkih struktura.

Filozofi su se počeli zanimati za konekcionizam, budući da je konekcionistički pristup obećavao pružiti alternativu klasičnoj teoriji uma i ideji široko zastupljenoj unutar te teorije da je rad uma sličan digitalnoj obradi simboličkog jezika. Računalo. Ovaj koncept je vrlo kontroverzan, ali posljednjih godina nalazi sve više pristalica.

Logičko proučavanje jezika nastavlja Saussureov koncept jezika kao sustava. Činjenica da se neprestano nastavlja još jednom potvrđuje smjelost znanstvenih nagađanja s početka prošlog stoljeća. Posljednji dio svog rada posvetit ću izgledima za razvoj matematičkih metoda u lingvistici danas.

2.4 Perspektive primjene matematičkih metoda u lingvistici

U eri računalne tehnologije metode matematičke lingvistike dobile su novu razvojnu perspektivu. Potraga za rješenjima problema lingvističke analize danas se sve više provodi na razini informacijskih sustava. Istodobno, automatizacija procesa obrade jezične građe, pružajući istraživaču značajne mogućnosti i prednosti, neminovno pred njega postavlja nove zahtjeve i zadatke.

Kombinacija "egzaktnog" i "humanitarnog" znanja postala je plodno tlo za nova otkrića na polju lingvistike, informatike i filozofije.

Strojno prevođenje s jednog jezika na drugi ostaje brzorastuća grana informacijske tehnologije. Unatoč činjenici da se računalno potpomognuto prevođenje po kvaliteti nikako ne može usporediti s ljudskim prevođenjem (osobito književnih tekstova), stroj je postao nezamjenjiv pomoćnik čovjeku u prevođenju velikih količina teksta. Vjeruje se da će se u bliskoj budućnosti stvoriti napredniji sustavi prevođenja koji će se prvenstveno temeljiti na semantičkoj analizi teksta.

Jednako obećavajuće područje je interakcija lingvistike i logike, koja služi kao filozofski temelj za razumijevanje informacijske tehnologije i takozvane "virtualne stvarnosti". U bliskoj budućnosti nastavit će se rad na stvaranju sustava umjetne inteligencije – iako ona, opet, po svojim mogućnostima nikada neće biti ravna ljudskoj. Takvo natjecanje je besmisleno: u naše vrijeme stroj bi trebao postati (i postaje) ne suparnik, već pomoćnik čovjeka, ne nešto iz domene fantazije, već dio stvarnog svijeta.

Proučavanje jezika statističkim metodama se nastavlja, što omogućuje točnije određivanje njegovih kvalitativnih svojstava. Važno je da najsmjelije hipoteze o jeziku nađu svoj matematički, a time i logički dokaz.

Najznačajnije je to što su se različite grane primjene matematike u lingvistici, prethodno prilično izolirane, posljednjih godina povezale jedna s drugom povezujući se u koherentan sustav, analogno jezičnom sustavu koji je prije jednog stoljeća otkrio Ferdinand de Saussure i Yvan Baudouin de Courtenay. To je kontinuitet znanstvenih spoznaja.

Lingvistika je u suvremenom svijetu postala temelj razvoja informacijske tehnologije. Sve dok je računalna znanost grana ljudske djelatnosti koja se brzo razvija, spoj matematike i lingvistike i dalje će igrati svoju ulogu u razvoju znanosti.

Zaključak

Tijekom 20. stoljeća računalne su tehnologije prešle dug put - od vojne do miroljubive uporabe, od uskog spektra ciljeva do prodora u sve grane ljudskog života. Matematika kao znanost s razvojem računalne tehnologije dobiva sve novi praktični značaj. Ovaj proces traje i danas.

Dotad nezamisliv "tandem" "fizičara" i "liričara" postao je stvarnost. Za potpunu interakciju matematike i informatike s humanističkim znanostima bili su potrebni kvalificirani stručnjaci s obje strane. Dok informatičarima sve više trebaju sustavna humanitarna znanja (jezična, kulturološka, ​​filozofska) kako bi shvatili promjene u stvarnosti koja ih okružuje, u interakciji čovjeka i tehnologije, razvili sve više novih jezičnih i mentalnih koncepata, pisali programa, onda svaki "Humanist" u našem vremenu za svoj profesionalni razvoj mora savladati barem osnove rada s računalom.

Matematika, koja je usko povezana s informatikom, nastavlja se razvijati i djelovati s prirodnim i humanističkim znanostima. U novom stoljeću trend matematizacije znanosti ne slabi, nego se, naprotiv, pojačava. Na temelju kvantitativnih podataka shvaćaju se zakonitosti razvoja jezika, njegove povijesne i filozofske karakteristike.

Matematički formalizam je najprikladniji za opisivanje obrazaca u lingvistici (kao, uostalom, iu drugim znanostima - kako humanističkim tako i prirodnim). Situacija se ponekad u znanosti razvija na takav način da je bez upotrebe odgovarajućeg matematičkog jezika nemoguće razumjeti prirodu fizikalnih, kemijskih itd. proces nije moguć. Stvaranje planetarnog modela atoma, poznati engleski fizičar XX. stoljeća. E. Rutherford je imao matematičkih poteškoća. Isprva njegova teorija nije bila prihvaćena: nije zvučala uvjerljivo, a razlog tome bilo je Rutherfordovo nepoznavanje teorije vjerojatnosti, na temelju čijeg je mehanizma jedino bilo moguće razumjeti modelski prikaz međudjelovanja atoma. Uvidjevši to, već tada vrsni znanstvenik, dobitnik Nobelove nagrade, upisao je seminar matematičara profesora Lamba i dvije godine zajedno sa studentima pohađao tečaj i radionicu iz teorije vjerojatnosti. . Na temelju njega Rutherford je uspio opisati ponašanje elektrona, dajući svom strukturnom modelu uvjerljivu točnost i stekavši priznanje. Isto je i s lingvistikom.

Postavlja se pitanje što je to toliko matematičko u objektivnim pojavama, zahvaljujući čemu se one mogu opisati jezikom matematike, jezikom kvantitativnih karakteristika? To su homogene jedinice materije raspoređene u prostoru i vremenu. One znanosti koje su otišle dalje od drugih prema izolaciji homogenosti, te se ispostavljaju da su prikladnije za korištenje matematike u njima.

Internet, koji se naglo razvio devedesetih godina prošlog stoljeća, okupio je predstavnike raznih zemalja, naroda i kultura. Unatoč činjenici da je engleski i dalje glavni jezik međunarodne komunikacije, internet je u naše vrijeme postao višejezičan. To je dovelo do razvoja komercijalno uspješnih sustava strojnog prevođenja koji se naširoko koriste u raznim područjima ljudske djelatnosti.

Računalne mreže postale su predmetom filozofskog promišljanja - stvara se sve više novih jezičnih, logičkih, svjetonazorskih koncepata koji pomažu razumijevanju "virtualne stvarnosti". U mnogim umjetničkim djelima stvoreni su scenariji - češće pesimistični - o prevlasti strojeva nad čovjekom, a virtualne stvarnosti - nad vanjskim svijetom. Daleko od toga da su se takve prognoze uvijek pokazale besmislenim. Informacijska tehnologija nije samo obećavajuća industrija za ulaganje ljudskog znanja, ona je i način kontrole informacija, a time i ljudske misli.

Ova pojava ima i negativnu i pozitivnu stranu. Negativno – jer je kontrola nad informacijama u suprotnosti s neotuđivim ljudskim pravom na slobodan pristup istima. Pozitivno – jer nedostatak te kontrole može dovesti do katastrofalnih posljedica za čovječanstvo. Dovoljno je prisjetiti se jednog od najmudrijih filmova prošlog desetljeća - "Kad smak svijeta" Wima Wendersa, čiji su likovi potpuno uronjeni u "virtualnu stvarnost" vlastitih snova snimljenih na računalu. Međutim, niti jedan znanstvenik i niti jedan umjetnik ne može dati jednoznačan odgovor na pitanje: što čeka znanost i tehnologiju u budućnosti.

Fokusiranje na "budućnost", koja se ponekad činila fantastičnom, bila je prepoznatljiva značajka znanosti sredinom dvadesetog stoljeća, kada su izumitelji nastojali stvoriti savršene modele tehnologije koji bi mogli funkcionirati bez ljudske intervencije. Vrijeme je pokazalo utopističnost takvih istraživanja. Međutim, bilo bi suvišno osuđivati ​​znanstvenike zbog toga - bez njihovog entuzijazma u 1950-im i 60-im godinama, informacijska tehnologija ne bi napravila tako snažan skok u 90-ima, a mi ne bismo imali ovo što imamo sada.

Posljednja desetljeća dvadesetog stoljeća promijenila su prioritete znanosti - istraživanja, inventivni patos ustupio je mjesto komercijalnom interesu. Opet, ovo nije ni dobro ni loše. Ovo je stvarnost u kojoj je znanost sve više integrirana u svakodnevni život.

21. stoljeće nastavilo je taj trend, au naše vrijeme iza izuma ne stoje samo slava i priznanje, već prije svega novac. Zbog toga je također važno osigurati da najnovija dostignuća znanosti i tehnologije ne padnu u ruke terorističkih skupina ili diktatorskih režima. Zadatak je težak do nemogućnosti; ostvariti ga u što većoj mjeri zadatak je cijele svjetske zajednice.

Informacija je oružje, a oružje nije ništa manje opasno od nuklearnog ili kemijskog oružja - samo što ne djeluje fizički, već psihički. Čovječanstvo treba razmisliti što mu je u ovom slučaju važnije - sloboda ili kontrola.

Najnoviji filozofski koncepti vezani uz razvoj informacijskih tehnologija i pokušaj njihova razumijevanja pokazali su ograničenost kako prirodnoznanstvenog materijalizma, koji je dominirao tijekom 19. i početkom 20. stoljeća, tako i ekstremnog idealizma, koji negira značaj materijalnog svijeta. . Za suvremenu misao, posebno za misao Zapada, važno je prevladati taj dualizam u mišljenju, kada se okolni svijet jasno dijeli na materijalni i idealni. Put do toga je dijalog kultura, usporedba različitih gledišta na okolne pojave.

Paradoksalno, informacijska tehnologija može igrati važnu ulogu u ovom procesu. Računalne mreže, a posebice internet, nisu samo izvor zabave i žustre komercijalne aktivnosti, one su i sredstvo sadržajne, kontroverzne komunikacije između predstavnika različitih civilizacija u suvremenom svijetu, kao i za dijalog između prošlosti i sadašnjost. Možemo reći da internet pomiče prostorne i vremenske granice.

A u dijalogu kultura putem informacijske tehnologije i dalje je važna uloga jezika kao najstarijeg univerzalnog sredstva komunikacije. Zato je lingvistika u interakciji s matematikom, filozofijom i informatikom doživjela svoje drugo rođenje i razvija se i danas. Trend sadašnjosti nastavit će se i u budućnosti - "do kraja svijeta", kako je prije 15 godina predvidio isti V. Wenders. Istina, ne zna se kada će taj kraj nastupiti – ali je li to sada važno, jer budućnost će ionako prije ili kasnije postati sadašnjost.

Prilog 1

Ferdinand de Saussure

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) naširoko se smatra utemeljiteljem moderne lingvistike u svojim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i jezičnih oblika. Zapravo, metoda strukturalizma u lingvistici i literarnoj znanosti i značajna grana semiotike nalaze svoje glavno polazište u njegovom radu na prijelazu u dvadeseto stoljeće. Čak se tvrdilo da je kompleks strategija i koncepcija koji je nazvan "poststrukturalizam" - rad Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih - sugeriran Saussureovim radom u lingvistici i anagramskim čitanjima kasne latinske poezije.književnog modernizma do psihoanalize i filozofije u ranom dvadesetom stoljeću. Kao što Algirdas Julien Greimas i Joseph Courtés tvrde u Semiotici i jeziku: Analitički rječnik, pod naslovom "Tumačenje", novi način tumačenja pojavio se početkom dvadesetog stoljeća koji poistovjećuju sa Saussureovom lingvistikom, Husserlijevom fenomenologijom i Freudovskom psihoanalizom. U ovom načinu, "interpretacija više nije stvar pripisivanja određenog sadržaja obliku koji bi inače nedostajao; prije je to parafraza koja na drugi način formulira ekvivalentni sadržaj označiteljskog elementa unutar danog semiotičkog sustava" ( 159). u ovom razumijevanju "tumačenja", forma i sadržaj nisu različiti; nego je svaki "forma", alternativno, i semantički "sadržaj", "označni oblik", tako da interpretacija nudi analognu parafrazu nečega što već označava unutar nekog drugog sustava označavanja.

Takva reinterpretacija forme i razumijevanja - koju Claude Lévi-Strauss opisuje u jednoj od svojih najprogramskijih artikulacija koncepta strukturalizma, u "Struktura i forma: Razmišljanja o djelu Vladimira Proppa" - implicitna je u Saussureovom posthumnom Tečaju u općoj lingvistici (1916., prijevod, 1959., 1983.). Tijekom svog života, Saussure je objavljivao relativno malo, a njegovo glavno djelo, Tečaj, bio je prijepis nekoliko kolegija iz opće lingvistike koje je držao 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika za razliku od rada u povijesnoj lingvistici koji je obavljen u devetnaestom stoljeću. Taj je rad jedno od velikih postignuća zapadnog intelekta: uzimanje određenih riječi kao građevnih blokova jezika, povijesna (ili "dijakronijska") lingvistika pratila je podrijetlo i razvoj zapadnih jezika iz pretpostavljenog izvora zajedničkog jezika, prvo "indoeuropskog" jezika, a zatim ranijeg "p roto-indoeuropski" jezik.

Saussure je doveo u pitanje upravo to proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mase činjenica o jeziku, koje je povijesna lingvistika tako detaljno proučavala, na podnošljiv broj prijedloga. "Komparativna škola" filologije devetnaestog stoljeća, kaže Saussure u Tečaju, "nije uspjela uspostaviti pravu znanost lingvistike" jer "nije uspjela pronaći prirodu svog predmeta proučavanja" (3). Ta se "priroda", tvrdi on, ne nalazi samo u "elementarnim" riječima koje jezik sadrži - naizgled "pozitivnim" činjenicama (ili "supstancama") jezika - već u formalnim odnosima koji dovode do tih "tvari".

Saussureovo sustavno preispitivanje jezika temelji se na tri pretpostavke. Prva je da znanstveno proučavanje jezika treba razvijati i proučavati sustav, a ne povijest jezičnih pojava. Iz tog razloga on razlikuje posebne pojave jezika - njegove posebne "govorni događaji", koje on označava kao parole - i pravi predmet lingvistike, sustav (ili "kod") koji upravlja tim događajima, a koje on označava kao langue. Takva sustavna studija, štoviše, poziva na "sinkronijsko" koncepcija odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz povijest.

Ova pretpostavka dovela je do onoga što je Roman Jakobson 1929. godine označio kao "strukturalizam", u kojem se "bilo koji skup fenomena koji ispituje suvremena znanost ne tretira kao mehanička aglomeracija, već kao strukturna cjelina, mehanička koncepcija procesa podliježe pitanju njihove funkcije" ("Romantika" 711). U ovom odlomku Jakobson artikulira Saussureovu namjeru da definira lingvistiku kao znanstveni sustav nasuprot jednostavnom, "mehaničkom" obračunu povijesnih nezgoda. Uz to, štoviše, Jakobson također opisuje drugu temeljnu pretpostavku u Saussureanu - možemo sada to nazovimo "strukturnim" - lingvistikom: da se osnovni elementi jezika mogu proučavati samo u odnosu na njihove funkcije, a ne u odnosu na njihove uzroke. europske "riječi"), ti događaji i entiteti moraju biti smješteni unutar sistemskog okvira u kojem su povezani s drugim takozvanim događajima i entitetima. Ovo je radikalna preorijentacija u poimanju iskustva i fenomena, čiju je važnost filozof Ernst Cassirer usporedio s "novom Galileijevom znanošću koja je u sedamnaestom stoljeću promijenila cijelu našu koncept fizičkog svijeta" (citirano u Culler, Pursuit 2 4). Ova promjena, kao što Greimas i Courtés primjećuju, ponovno shvaća "interpretaciju" i tako ponovno shvaća objašnjenje i razumijevanje samih sebe. Umjesto da objašnjenje "postoji u terminima uzroka fenomena, tako da je, kao "posljedica", na neki način podređeno svojim uzrocima, objašnjenje se ovdje sastoji u podređivanju fenomena njegovoj "funkciji" usmjerenoj na budućnost ili "Svrha." Objašnjenje više nije neovisno o ljudskim namjerama ili svrhama (iako te namjere mogu biti neosobne, zajedničke ili, u Freudovim terminima, "nesvjesne").

U svojoj lingvistici Saussure ostvaruje ovu transformaciju posebno u redefiniranju jezične "riječi", koju opisuje kao jezični "znak" i definira funkcionalističkim terminima. Znak je, tvrdi on, spoj "koncepta i zvučne slike", koju je nazvao "označeno i označitelj" (66-67; prijevod Roya Harrisa iz 1983. nudi izraze "označenje" i "signal"). Priroda njihove "kombinacije" je "funkcionalna" utoliko što ni označeno ni označitelj nisu "uzrok" drugoga; radije, "svako svoje vrijednosti iz drugog" (8). element jezika, znak , relacijski i čini temeljnu pretpostavku povijesne lingvistike, naime, identitet elementarnih jedinica jezika i označavanja (tj. "riječi"), predmetom rigorozne analize. Riječ "stablo" kao "ista" riječ nije zato što riječ je definirana inherentnim kvalitetama - to nije "mehanička nakupina" takvih kvaliteta - već zato što je definirana kao element u sustavu, "strukturnoj cjelini" jezika.

Takva relacijska (ili "dijakritička") definicija entiteta upravlja koncepcijom svih elemenata jezika u strukturalnoj lingvistici. To je najjasnije u najdojmljivijem postignuću saussureovske lingvistike, razvoju pojmova "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje artikulirane i označavajuće jedinice jezika. To nisu zvukovi koji se pojavljuju u jeziku, već "zvučne slike" koje spominje Saussure, a koje govornici shvaćaju - fenomenalno shvaćaju - kao prenošenje značenja. (Dakle, Elmar Holenstein opisuje Jakobsonovu lingvistiku, koja na važne načine slijedi Saussurea, kao "fenomenološki strukturalizam".) Iz tog je razloga vodeći glasnogovornik strukturalizma Praške škole, Jan Mukarovsky, primijetio 1937. da je "struktura . . . je fenomenološka a ne empirijska stvarnost; nije djelo samo po sebi, već skup funkcionalnih odnosa koji se nalaze u svijesti kolektiva (generacije, sredine, itd.)" (citirano u Galan 35). Isto tako, Lévi-Strauss, vodeći glasnogovornik francuskog strukturalizma , primijetio je 1960. da "struktura nema poseban sadržaj; on je sam sadržaj, a logična organizacija u kojoj je uhićen zamišljena je kao svojstvo stvarnog" (167; vidi također Jakobson, Fundamentals 27-28).

Fonemi, dakle, najmanji perceptibilni elementi jezika, nisu pozitivni objekti nego "fenomenološka stvarnost". U engleskom jeziku, na primjer, fonem /t/ može se izgovoriti na mnogo različitih načina, ali u svim će slučajevima govornik engleskog prepoznati da funkcionira kao /t/. Aspirirano t (tj. t koje se izgovara s dahom nalik na h nakon njega), visoki ili niski t, produženi t i tako dalje, svi će funkcionirati na isti način u razlikovanju značenja "to" i "do" na engleskom. Štoviše, razlike među jezicima su takve da fonološke varijacije u jednom jeziku mogu činiti različite foneme u drugom; stoga engleski razlikuje /l/ i /r/, dok su drugi jezici tako strukturirani da se te artikulacije smatraju varijacijama istog fonema (poput aspiriranog i neaspiriranog t u engleskom). U svakom prirodnom jeziku, veliki broj mogućih riječi je kombinacija malog broja fonema. Engleski, na primjer, posjeduje manje od 40 fonema koji se kombiniraju u više od milijun različitih riječi.

Fonemi jezika sami su sustavno organizirane strukture obilježja. U 1920-im i 1930-im godinama, slijedeći Saussureovo vodstvo, Jakobson i N. S. Trubetzkoy izolirali su "različite značajke" fonema. Te se značajke temelje na fiziološkoj strukturi govornih organa - jezika, zuba, glasnica i tako dalje - da Saussure spominje u Tečaju i koje Harris opisuje kao "fiziološku fonetiku" (39; Baskinov raniji prijevod koristi izraz "fonologija" [(1959) 38]) - i oni se kombiniraju u "snopove" binarnih opozicija da tvore foneme. Na primjer, u engleskom jeziku razlika između /t/ i /d/ je prisutnost ili odsutnost "glasa" (angažiranja glasnica), a na razini glasanja ovi se fonemi uzajamno definiraju. Na taj je način fonologija specifičan primjer općeg pravila jezika koje je opisao Saussure: U jeziku postoje samo razlike. još važnije: razlika općenito podrazumijeva pozitivne pojmove između kojih se razlika postavlja; ali u jeziku postoje samo razlike bez pozitivnih pojmova. Bilo da uzmemo označeno ili označitelj, jezik nema niti ideje niti zvukove koji su postojali prije jezičnog sustava. ( 120)

U tom okviru, jezični identiteti nisu određeni inherentnim kvalitetama, već sustavnim ("strukturalnim") odnosima.

Rekao sam da je fonologija "sljedila vodstvo" Saussurea, jer iako bi se njegova analiza fiziologije jezične produkcije "danas", kako kaže Harris, "nazvala "fizičkom", za razliku od "psihološke" ili "funkcionalne", "" (Lektira 49), stoga je u Tečaju artikulirao smjer i obrise funkcionalne analize jezika. Slično tome, njegovo jedino prošireno objavljeno djelo, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoari o primitivnom sustavu samoglasnika u indoeuropskim jezicima), koje se pojavilo 1878., bilo je u potpunosti smješteno unutar projekta devetnaestog- stoljeća povijesna lingvistika. Unatoč tome, unutar ovog rada, kao što je tvrdio Jonathan Culler, Saussure je pokazao "plodnost razmišljanja o jeziku kao sustavu čisto relacijskih stavki, čak i kada radi na zadatku povijesne rekonstrukcije" (Saussure 66). Analizirajući sustavne strukturne odnose među fonemima kako bi se objasnili obrasci izmjene samoglasnika u postojećim indoeuropskim jezicima, Saussure je sugerirao da je uz nekoliko različitih fonema /a/ morao postojati još jedan fonem koji se može formalno opisati. "Ono što Saussureov rad čini tako vrlo dojmljivim," zaključuje Culler, "je činjenica da je gotovo pedeset godina kasnije, kada je klinasti hetitski jezik otkriven i dešifriran, pronađeno da sadrži fonem, napisan h, koji se ponašao kako je Saussure predvidio . On je čisto formalnom analizom otkrio ono što je danas poznato kao laringeali Indo-Europljana" (66).

Ova koncepcija relacijske ili dijakritičke determinacije elemenata označavanja, koja je i implicitna i eksplicitna u Tečaju, sugerira treću pretpostavku koja upravlja strukturnom lingvistikom, što Saussure naziva "proizvoljnom prirodom znaka". Time želi reći da odnos između označitelja i označenog u jeziku nikada nije nužan (ili "motiviran"): moglo bi se jednako lako pronaći zvučni označitelj arbre kao i stablo označitelja da se ujedine s pojmom "stablo". Ali više od ovoga, to znači da je označeno također proizvoljno: moglo bi se lako definirati pojam "stablo" njegovom drvenastom kvalitetom (što bi isključilo palme) kao i njegovom veličinom (koja isključuje "nisko drvenaste biljke" grmlje poziva). Ovo bi trebalo razjasniti da numeriranje pretpostavki koje sam predstavio ne predstavlja redoslijed prioriteta: svaka pretpostavka - sustavna priroda označavanja (koju je najbolje shvatiti "sinkronim" proučavanjem jezika), relacijska ili "dijakritička" priroda elemenata značenja, proizvoljna priroda znakova - crpi svoju vrijednost iz drugih.

To jest, saussureovska lingvistika je fenomen koji proučava u sveobuhvatnim odnosima kombinacije i kontrasta u jeziku. U ovoj koncepciji jezik je i proces artikulacije značenja (označavanje) i njegov proizvod (komunikacija), a te dvije funkcije jezika nisu niti identične niti potpuno podudarne (vidi Schleifer, "Deconstruction"). Ovdje možemo vidjeti izmjenu između forme i sadržaja koju Greimas i Courtés opisuju u modernističkoj interpretaciji: jezik predstavlja kontraste koji formalno definiraju njegove jedinice, a te se jedinice kombiniraju na sljedećim razinama kako bi stvorile sadržaj označavanja. Budući da su elementi jezika proizvoljni, štoviše, ni kontrast ni kombinacija ne mogu se reći da su osnovni. Dakle, u jeziku se razlikovna obilježja kombiniraju da tvore kontrastne foneme na drugoj razini shvaćanja, fonemi se kombiniraju da tvore kontrastne morfeme, morfemi se kombiniraju da tvore riječi, riječi se kombiniraju da tvore rečenice, i tako dalje. U svakom slučaju, cijeli fonem, ili riječ, ili rečenica, i tako dalje, veći je od zbroja svojih dijelova (baš kao što je voda, H2O, u Saussureovom primjeru [(1959) 103] više od mehaničke aglomeracije vodika i kisika).

Tri pretpostavke Tečaja opće lingvistike navele su Saussurea da pozove na novu znanost dvadesetog stoljeća koja bi nadišla lingvističku znanost kako bi proučavala "život znakova unutar društva". Saussure je ovu znanost nazvao "semiologija (od grčkog semeîon "znak")" (16). "Znanost" semiotike, kako se počela prakticirati u istočnoj Europi 1920-ih i 1930-ih i Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književne artefakte sastavljene (ili artikulirane) tim strukturama. Tijekom kasnog dijela svoje karijere, štoviše, čak i dok je držao kolegije iz opće lingvistike, Saussure je slijedio vlastitu "semiotičku" analizu kasne latinske poezije u pokušaju da otkrije namjerno skrivene anagrame vlastitih imena. Metoda proučavanja bila je umnogome suprotna funkcionalnom racionalizmu njegovih lingvističkih analiza: pokušala je, kao što Saussure spominje u jednoj od 99 bilježnica u kojima je nastavio studij, sustavno ispitati problem "slučajnosti", koja " postaje neizbježan temelj svega" (citirano u Starobinski 101). Takva se studija, kako sam Saussure kaže, usredotočuje na "materijalnu činjenicu" slučajnosti i značenja (citirano 101), tako da je "tema-riječ" čiji anagram Saussure traži, kako tvrdi Jean Starobinski, "za pjesnika , instrument, a ne vitalna klica pjesme. Od pjesme se zahtijeva ponovno korištenje foničkih materijala teme-riječi" (45). U ovoj analizi Starobinski kaže: "Saussure se nije izgubio u potrazi za skrivenim značenjima." Umjesto toga, čini se da njegov rad pokazuje želju da izbjegne sve probleme koji proizlaze iz svijesti: "Budući da poezija nije samo ostvarena u riječima nego je nešto rođeno iz riječi, ona izmiče proizvoljnoj kontroli svijesti kako bi ovisila isključivo o vrsti jezične zakonitosti "(121).

To jest, Saussureov pokušaj da otkrije vlastita imena u kasnoj latinskoj poeziji - ono što Tzvetan Todorov naziva redukcijom "riječi". . . svom označitelju" (266) - naglašava jedan od elemenata koji je upravljao njegovom lingvističkom analizom, proizvoljnu prirodu znaka. (Također naglašava formalnu prirodu Saussureove lingvistike - "Jezik", tvrdi on, "je oblik, a ne tvar" - koja učinkovito eliminira semantiku kao glavni predmet analize.) Kao što Todorov zaključuje, Saussureovo djelo danas se čini izrazito homogenim u svom odbijanju prihvaćanja simboličkih fenomena. . . . U svojim istraživanjima anagrama obraća pozornost samo na fenomene ponavljanja, ne i na one evokacije. . . . U svojim studijama o Nibelunzima on prepoznaje simbole samo kako bi ih pripisao pogrešnim čitanjima: budući da nisu namjerni, simboli ne postoje. Konačno, u svojim kolegijima o općoj lingvistici, on razmatra postojanje semiologije, a time i znakova koji nisu lingvistički; ali ta je afirmacija istodobno ograničena činjenicom da je semiologija posvećena jednoj vrsti znakova: onima koji su proizvoljni. (269-70)

Ako je to istina, to je zato što Saussure nije mogao pojmiti "namjeru" bez subjekta; nije mogao posve izbjeći suprotnost između forme i sadržaja koju je njegov rad toliko doveo u pitanje. Umjesto toga, pribjegao je "jezičnoj zakonitosti". Smješten između, s jedne strane, devetnaestostoljetnih koncepcija povijesti, subjektivnosti i načina kauzalne interpretacije kojim upravljaju te koncepcije i, s druge strane, dvadesetostoljetnih "strukturalističkih" koncepcija onoga što je Lévi-Strauss nazvao "kantijanizmom bez transcendentalni subjekt" (citiran u Connerton 23) - koncepti koji brišu suprotnost između forme i sadržaja (ili subjekta i objekta) i hijerarhije prednjeg i pozadinskog plana u potpunom strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici - Ferdinandovo djelo de Saussure u lingvistici i semiotici opisuje signalni trenutak u proučavanju značenja i kulture.

Ronald Schleifer

Dodatak 2

Ferdinand de Saussure (prijevod)

Švicarski lingvist Ferdinand de Saussure (1857.-1913.) smatra se utemeljiteljem moderne lingvistike - zahvaljujući njegovim pokušajima da opiše strukturu jezika, a ne povijest pojedinih jezika i oblika riječi. Uglavnom, temelji strukturalnih metoda u lingvistici i književnoj kritici, au velikoj mjeri i semiotike, postavljeni su u njegovim radovima na samom početku dvadesetog stoljeća. Dokazano je da metode i koncepti takozvanog "poststrukturalizma", razvijeni u djelima Jacquesa Derridae, Michela Foucaulta, Jacquesa Lacana, Julije Kristeve, Rolanda Barthesa i drugih, sežu do lingvističkih radova Saussurea i anagramska čitanja kasnorimske poezije. Valja napomenuti da Saussureov rad na lingvistici i jezičnoj interpretaciji pomaže u povezivanju širokog spektra intelektualnih disciplina – od fizike do književnih inovacija, psihoanalize i filozofije ranog dvadesetog stoljeća. A. J. Greimas i J. Kurte u Semiotici i jeziku pišu: “Početkom 20. stoljeća uz Saussureovu lingvistiku, Husserlovu fenomenologiju i psihoanalizu pojavio se analitički rječnik s naslovom “Tumačenje” kao nova vrsta tumačenja. od Freuda. U takvom slučaju, "interpretacija nije pripisivanje određenog sadržaja obliku koji bi inače nedostajao; radije, to je parafraza koja na drugi način formulira isti sadržaj značajnog elementa unutar danog semiotičkog sustava" (159). ). U ovakvom shvaćanju "tumačenja" forma i sadržaj su neodvojivi; naprotiv, svaki je oblik ispunjen semantičkim značenjem (“smisleni oblik”), pa interpretacija nudi novo, slično prepričavanje nečeg smislenog u drugom znakovnom sustavu.

Slično shvaćanje forme i sadržaja, koje je iznio Claude Lévi-Strauss u jednom od programskih djela strukturalizma, ("Struktura i forma: Razmišljanja o djelima Vladimira Proppa"), može se vidjeti u Saussureovoj posthumnoj knjizi, Tečaj u Opća lingvistika (1916, prev., 1959, 1983). Za života Saussure je malo objavljivao, "Tečaj" - njegovo glavno djelo - sakupljen je iz bilježaka studenata koji su slušali njegova predavanja iz opće lingvistike 1907.-11. U Tečaju Saussure je pozvao na "znanstveno" proučavanje jezika, suprotstavljajući ga komparativno-povijesnoj lingvistici devetnaestog stoljeća. Ovo se djelo može smatrati jednim od najvećih dostignuća zapadne misli: uzimajući kao temelj pojedinačne riječi kao strukturne elemente jezika, povijesna (ili "dijakronijska") lingvistika dokazala je podrijetlo i razvoj zapadnoeuropskih jezika od zajednički, indoeuropski jezik – i raniji protoindoeuropski.

Saussure je doveo u pitanje upravo ovo proučavanje jedinstvenih pojavljivanja riječi, uz popratnu pretpostavku da je osnovna "jedinica" jezika, zapravo, pozitivno postojanje tih "elemenata riječi". Njegov je rad bio pokušaj reduciranja mnogih činjenica o jeziku koje poredbena lingvistika ležerno proučava na mali broj teorema. Komparativna filološka škola 19. stoljeća, piše Saussure, "nije uspjela stvoriti pravu lingvističku školu" jer "nije shvaćala bit predmeta proučavanja" (3). Ta "bit", tvrdi on, ne leži samo u pojedinačnim riječima - "pozitivnim supstancama" jezika - već iu formalnim vezama koje pomažu tim supstancama da postoje.

Saussureov "test" jezika temelji se na tri pretpostavke. Prvo, znanstveno razumijevanje jezika ne temelji se na povijesnom, već na strukturnom fenomenu. Stoga je razlikovao pojedine jezične pojave - "govorne događaje", koje definira kao "parole" - i pravi, po njegovu mišljenju, predmet proučavanja lingvistike, sustav (kod, struktura) koji upravlja tim događajima ( "jezik"). Takvo sustavno proučavanje, osim toga, zahtijeva "sinkronijsko" poimanje odnosa među elementima jezika u određenom trenutku, a ne "dijakronijsko" proučavanje razvoja jezika kroz njegovu povijest.

Ta je hipoteza bila preteča onoga što će Roman Jakobson 1929. nazvati "strukturalizmom" - teorijom u kojoj se "svaki skup fenomena koji istražuje moderna znanost ne smatra mehaničkom akumulacijom, već strukturnom cjelinom u kojoj je konstruktivna komponenta u korelaciji s funkcija" ("Romantična" 711). U ovom odlomku Jakobson je formulirao Saussureovu ideju o definiranju jezika kao strukture, nasuprot "mehaničkom" nabrajanju povijesnih događaja. Uz to, Jakobson razvija još jednu Saussureovu pretpostavku, koja je postala preteča strukturne lingvistike: osnovne elemente jezika treba proučavati u vezi ne toliko s njihovim uzrocima, koliko s njihovim funkcijama. Zasebne pojave i događaje (recimo, povijest podrijetla pojedinih indoeuropskih riječi) ne treba proučavati same po sebi, već u sustavu u kojem su u korelaciji sa sličnim komponentama. Bio je to radikalan zaokret u usporedbi pojava s okolnom stvarnošću, čije je značenje filozof Ernst Cassirer usporedio s "znanošću Galileja, koja je u sedamnaestom stoljeću preokrenula ideje o materijalnom svijetu", posljedično, i sama objašnjenja. Pojave su se počele tumačiti ne u odnosu na uzroke njihove pojave, već u odnosu na učinak koji mogu imati u sadašnjosti i budućnosti.Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, “nesvjesno” u frojdovskom smislu riječi).

U svojoj lingvistici Saussure posebno pokazuje taj zaokret u promjeni pojma riječi u lingvistici koju definira kao znak i opisuje u smislu njezinih funkcija. Znak je za njega spoj zvuka i značenja, "označeno i oznaka" (66-67; u engleskom prijevodu Roya Harrisa iz 1983. - "označenje" i "signal"). Priroda ovog spoja je "funkcionalna" (ni jedan ni drugi element ne mogu postojati jedan bez drugog); štoviše, "jedni posuđuju osobine od drugih" (8). Tako Saussure definira glavni strukturni element jezika - znak - i čini osnovom povijesne lingvistike istovjetnost znakova s ​​riječima, što zahtijeva posebno rigoroznu analizu. Stoga možemo razumjeti različita značenja, recimo, iste riječi "drvo" - ne zato što je riječ samo skup određenih kvaliteta, već zato što je definirana kao element u sustavu znakova, u "strukturnoj cjelini", u jeziku.

Takav relativni ("dijakritički") koncept jedinstva je temelj koncepta svih elemenata jezika u strukturnoj lingvistici. To je posebno jasno u najizvornijem otkriću Saussureove lingvistike, u razvoju pojma "fonema" i "različitnih obilježja" jezika. Fonemi su najmanje govorne i smislene jezične jedinice. To nisu samo zvukovi koji se pojavljuju u jeziku, već "zvučne slike", napominje Saussure, koje izvorni govornici percipiraju kao da imaju značenje. (Valja napomenuti da Elmar Holenstein naziva Jakobsonovu lingvistiku, koja u svojim glavnim odredbama nastavlja ideje i koncepte Saussurea, "fenomenološkim strukturalizmom"). Zato je vodeći govornik Praške škole strukturalizma, Jan Mukarowski, 1937. primijetio da je “struktura. . . ne empirijski, nego fenomenološki koncept; nije sam rezultat, već skup značajnih odnosa kolektivne svijesti (generacija, drugi itd.)”. Sličnu misao iznio je 1960. Lévi-Strauss, vođa francuskog strukturalizma: “Struktura nema određeni sadržaj; ona je sama po sebi smislena, a logična konstrukcija u kojoj je zatvorena je otisak stvarnosti.

S druge strane, fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu cjelovitu "fenomenološku stvarnost". Na primjer, u engleskom se glas "t" može različito izgovoriti, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Aspirirani, povišeni ili sniženi, dugi zvuk "t" itd. jednako će razlikovati značenje riječi "to" i "do". Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" u engleskom su različiti, dok su u drugim jezicima varijante istog fonema (poput engleskog "t", izgovorenog sa i bez aspiracije). Ogromni rječnik svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika su sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, nakon Saussurea, Jacobson i N.S. Trubetskoy izdvojili su "odlike" fonema. Te se značajke temelje na građi organa govora – jezika, zuba, glasnica – Saussure to uočava u „Tečaju opće lingvistike“, a Harris to naziva „fiziološkom fonetikom“ (u Baskinovom ranijem prijevodu termin „fonologija“). " se koristi) - povezani su u "čvorove » durg protiv prijatelja da proizvode zvukove. Na primjer, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg jezičnog pravila koje je opisao Saussure: "Postoje samo razlike u jeziku." Još važnije nije ovo: razlika obično implicira točne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da se radi o "označavanju" ili "označenom" - u jeziku nema niti pojmova niti glasova koji bi postojali prije razvoja jezičnog sustava.

U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih svojstava, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Već sam spomenuo da se fonologija u svom razvoju oslanjala na ideje Saussurea. Iako bi se njegova analiza lingvističke fiziologije u moderno doba, kaže Harris, "nazvala 'fizičkom', za razliku od 'psihološke' ili 'funkcionalne', u Tečaju je jasno artikulirao smjer i osnovna načela funkcionalne analize jezika. Njegovo jedino objavljeno djelo za života, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Bilješke o izvornom samoglasničkom sustavu u indoeuropskim jezicima), objavljeno 1878., bilo je potpuno u skladu s komparativnom povijesnom lingvistikom 19. stoljeća. Ipak, u ovom je djelu, kaže Jonathan Culler, Saussure pokazao "plodnost ideje o jeziku kao sustavu međusobno povezanih fenomena, čak i uz njegovu povijesnu rekonstrukciju". Analizirajući odnos između fonema, objašnjavajući izmjenu samoglasnika u modernim jezicima indoeuropske skupine, Saussure je sugerirao da osim nekoliko različitih zvukova "a", moraju postojati i drugi fonemi opisani formalno. “Ono što čini poseban dojam u Saussureovom radu,” zaključuje Kaller, “jest da je gotovo 50 godina kasnije, kada je otkriven i dešifriran hetitski klinasti zapis, pronađen fonem, u pisanju označen sa “h”, koji se ponašao kako je Saussure predvidio. Kroz formalnu analizu otkrio je ono što je danas poznato kao grleni zvuk u indoeuropskim jezicima.

U konceptu relativne (dijakritičke) definicije znakova, eksplicitnoj i impliciranoj u Tečaju, postoji treća ključna pretpostavka strukturalne lingvistike, koju je Saussure nazvao "arbitrarna priroda znaka". Time se misli da odnos između zvuka i značenja u jeziku nije ničim motiviran: jednako se lako može povezati riječ "arbre" i riječ "drvo" s pojmom "drvo". Štoviše, to znači da je i zvuk proizvoljan: pojam "stabla" može se definirati prisutnošću kore (osim palmi) i veličinom (osim "niskih drvenastih biljaka" - grmova). Iz ovoga bi trebalo biti jasno da se sve pretpostavke koje iznosim ne dijele na više i manje važne: svaka od njih - sustavna priroda znakova (najrazumljivija u "sinkronom" proučavanju jezika), njihova relativna (dijakritička) bit , proizvoljna priroda znakova - dolazi od ostatka.

Tako se u saussureovskoj lingvistici proučavani fenomen shvaća kao skup usporedbi i opreka jezika. Jezik je i izraz značenja riječi (oznaka) i njihov rezultat (komunikacija) – a te se dvije funkcije nikada ne podudaraju (vidi Shleiferovu "Dekonstrukciju jezika"). Možemo vidjeti izmjenu oblika i sadržaja koju Greimas i Kurte opisuju u posljednjoj verziji tumačenja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju na uzastopnim razinama kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u kontrastne morfeme, morfemi - u riječi, riječi - u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od zbroja svojih dijelova (kao što je voda, u Saussureovom primjeru, više od kombinacije vodika i kisika).

Tri pretpostavke "Tečaja opće lingvistike" dovele su Saussurea do ideje o novoj znanosti dvadesetog stoljeća, odvojenoj od lingvistike, proučavanju "života znakova u društvu". Saussure je ovu znanost nazvao semiologija (od grčkog "semeîon" - znak). "Znanost" semiotike, koja se razvila u istočnoj Europi 1920-ih i 1930-ih te u Parizu 1950-ih i 1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili formulirana) s tim strukturama. Osim toga, u zalasku svoje karijere, paralelno s tečajem opće lingvistike, Saussure se bavio "semiotičkom" analizom kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bio je to pokušaj, kako Saussure piše u jednoj od 99 bilježnica, da se u sustavu proučava problem "vjerojatnosti", koji "postaje temeljem svega. " Takvo istraživanje, sam Saussure tvrdi, pomaže usredotočiti se na "pravu stranu" vjerojatnosti; “Ključna riječ” za koju Saussure traži anagram je, prema Jeanu Starobinskom, “oruđe za pjesnika, a ne izvor života za pjesmu. Pjesma služi za preokretanje zvukova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure se ne upušta u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi pokreću, ona nadilazi kontrolu svijesti i ovisi samo o zakoni jezika."

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji (Tsvetan Todorov je ovo nazvao skraćenicom od "riječ ... samo prije nego što je napisana") naglašava jednu od komponenti njegove lingvističke analize - proizvoljnu prirodu znakova, kao i formalna bit saussureovske lingvistike ("Jezik", tvrdi on, "bit oblika, a ne fenomena"), koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas Saussureovi spisi čine nevjerojatno dosljednima u svojoj nevoljkosti proučavanju simbola [fenomena koji ima dobro definirano značenje]. . . . Istražujući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne opcije. . . . Proučavajući Nibelungenlied, on definira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerna, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on iznosi pretpostavku o postojanju semiologije koja opisuje ne samo jezične znakove; ali ta je pretpostavka ograničena činjenicom da semilogija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti "namjeru" bez objekta; nije mogao do kraja premostiti jaz između forme i sadržaja – u njegovim se spisima to pretvorilo u pitanje. Umjesto toga, okrenuo se "jezičnom legitimitetu". Između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnim pretpostavkama, te metoda slučajnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koje je Lévi-Strauss nazvao "kantijanizam bez transcendenta". glumac" - brisanje konfrontacije između forme i sadržaja (subjekta i objekta), značenja i podrijetla u strukturalizmu, psihoanalizi pa čak i kvantnoj mehanici - radovi Ferlinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i Kultura.

Ronald Shleifer

Književnost

1. Admoni V.G. Osnove teorije gramatike / V.G. Admoni; Akademija znanosti SSSR-a.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematičke metode u lingvistici. M., 1974.

4. Arnold I.V. Semantička struktura riječi u suvremenom engleskom jeziku i metodologija njezina proučavanja. /I.V. Arnold-L .: Obrazovanje, 1966. - 187 str.

6.Bashlykov A.M. Sustav za automatsko prevođenje. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 str.

7.Baudouin de Courtenay: Teorijska baština i suvremenost: Sažeci priopćenja s međunarodnog znanstvenog skupa / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 str.

8. A. V. Gladkiy, Elementi matematičke lingvistike. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 str.

9. Golovin, B.N. Jezik i statistika. /B.N. Golovin - M., 1971. - 210 str.

10. Zvegincev, V.A. Teorijska i primijenjena lingvistika. / V.A. Zvegincev - M., 1969. - 143 str.

11. Kasevich, V.B. Semantika. Sintaksa. Morfologija. // V.B. Kasevich - M., 1988. - 292 str.

12. Lekomtsev Yu.K. Uvod u formalni jezik lingvistike / Yu.K. Lekomcev. - M.: Nauka, 1983, 204 str., ilustr.

13. Jezična baština Baudouina de Courtenaya na kraju 20. stoljeća: Sažeci međunarodnog znanstveno-praktičnog skupa 15.-18.3.2000. - Krasnojarsk, 2000. - 125 str.

Matveeva G.G. Skrivena gramatička značenja i identifikacija društvene osobe (“portret”) govornika / G.G. Matveev. - Rostov, 1999. - 174 str.

14. Melchuk, I.A. Iskustvo u izgradnji jezičnih modela "Smisao teksta"./ I.A. Melchuk. - M., 1974. - 145 str.

15. Nelyubin L.L. Prevođenje i primijenjena lingvistika / L.L. Nelyubin. - M.: Viša škola, 1983. - 207 str.

16. O egzaktnim metodama istraživanja jezika: o takozvanoj "matematičkoj lingvistici" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva i drugi - M., 1961. - 162 str.

17. Piotrovsky L.G. Matematička lingvistika: udžbenik / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaja. - M.: Viša škola, 1977. - 160 str.

18. On je. Tekst, stroj, osoba. - L., 1975. - 213 str.

19. On je. Primijenjena lingvistika / Ed. A.S. Gerda. - L., 1986. - 176 str.

20. Revzin, I.I. jezični modeli. M., 1963. Revzin, I.I. Moderna strukturalna lingvistika. Problemi i metode. M., 1977. - 239 str.

21. Revzin, I.I., Rozentsveig, V.Yu. Osnove općeg i strojnog prevođenja / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 str.

22. Slyusareva N.A. Teorija F. de Saussurea u svjetlu moderne lingvistike / N.A. Sljusareva. - M.: Nauka, 1975. - 156 str.

23. Sova, L.Z. Analitička lingvistika / L.Z. Sova - M., 1970. - 192 str.

24. Saussure F. de. Bilješke o općoj lingvistici / F. de Saussure; Po. od fr. - M.: Napredak, 2000. - 187 str.

25. On je. Tečaj opće lingvistike / Per. od fr. - Jekaterinburg, 1999. -426 str.

26. Statistika govora i automatska analiza teksta / Ed. izd. R.G. Piotrovski. L., 1980. - 223 str.

27. Stoll, P. Setovi. Logika. Aksiomatske teorije / R. Stoll; Po. s engleskog. - M., 1968. - 180 str.

28. Tenier, L. Osnove strukturne sintakse. M., 1988.

29. Ubin I.I. Automatizacija prevoditeljskih aktivnosti u SSSR-u / I.I. Ubin, L.Yu. Korostelev, B.D. Tihomirov. - M., 1989. - 28 str.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderna matematika. M., 1966.

31. Shenk, R. Obrada konceptualnih informacija. M., 1980.

32. Shikhanovich, Yu.A. Uvod u suvremenu matematiku (početni pojmovi). M., 1965

33. Shcherba L.V. Ruski samoglasnici u kvalitativnom i kvantitativnom smislu / L.V. Shcherba - L.: Nauka, 1983. - 159 str.

34. Abdullah-zade F. Građanin svijeta // Iskra - 1996. - br.5. - str.13

35. V.A. Uspenski. Preliminarno za čitatelje "Nove književne revije" na semiotičke poruke Andreja Nikolajeviča Kolmogorova. - Nova književna smotra. -1997. - Broj 24. - S. 18-23

36. Perlovsky L. Svijest, jezik i kultura. - Znanje je moć. -2000. №4 - S. 20-33

37. Frumkina R.M. O nama - iskosa. // Ruski časopis. - 2000. - br.1. - str. 12

38. Fitialov, S.Ya. O modeliranju sintakse u strukturalnoj lingvistici // Problems of Structural Linguistics. M., 1962.

39. On je. O ekvivalentnosti NN gramatike i gramatike ovisnosti // Problemi strukturne lingvistike. M., 1967.

40. Chomsky, N. Logički temelji lingvističke teorije // Novo u lingvistici. Problem. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. pritisnite. jhu.ru

46. ​​​​hr.wikipedia.org

Tijekom prošlog stoljeća lingvistika se uvijek navodila kao primjer znanosti koja se ubrzano razvijala i vrlo brzo dostigla metodološku zrelost. Već sredinom prošlog stoljeća mlada je znanost samouvjereno zauzela svoje mjesto u krugu znanosti s tisućljetnom tradicijom, a jedan od njezinih najistaknutijih predstavnika - A. Schleicher - imao je hrabrosti vjerovati da svojim radovima već je sažimao konačnu crtu.<113>Povijest lingvistike je, međutim, pokazala da je takvo mišljenje bilo prenagljeno i neopravdano. Krajem stoljeća lingvistika je doživjela prvi veliki šok vezan uz kritiku neogramatičkih načela, a potom i druge. Valja napomenuti da sve krize koje možemo otkriti u povijesti znanosti o jeziku, u pravilu, nisu uzdrmale njezine temelje, nego su, naprotiv, pridonijele jačanju i u konačnici sa sobom donijele oplemenjivanje i usavršavanje. metoda lingvističkog istraživanja, proširujući se uz teme i znanstvenu problematiku.

Ali uz lingvistiku živjele su i razvijale se i druge znanosti, među kojima i veliki broj novih. Fizičke, kemijske i tehničke (tzv. "egzaktne") znanosti dobile su u naše vrijeme posebno brz razvoj, a nad svima njima je zavladala njihova teorijska osnova, matematika. Egzaktne znanosti ne samo da su jako pritisnule sve humanističke znanosti, nego ih sada nastoje "uvesti u svoju vjeru", podrediti svojim običajima, nametnuti im svoje metode istraživanja. U sadašnjoj situaciji, japanskim izrazom, može se reći da sada lingvisti-filolozi prljaju sam rub otirača, gdje se egzaktne znanosti, na čelu s matematikom, trijumfalno i slobodno nalaze.

Ne bi li s gledišta općih znanstvenih interesa bilo svrsishodnije kapitulirati pred matematikom, potpuno se prepustiti vlasti njezinih metoda, na koje neki glasovi otvoreno pozivaju 59 , i time, možda, dobiti novu snagu? Da bismo odgovorili na ova pitanja, prvo moramo pogledati što matematika tvrdi u ovom slučaju, u kojem području lingvistike matematičke metode nalaze svoju primjenu, u kojoj su mjeri usklađene sa specifičnostima jezičnog materijala i mogu li dati ili čak samo sugerirati odgovore na ta pitanja.postavlja znanost o jeziku.

Od samog početka treba napomenuti da među entuzijastima novog, matematičkog pravca u lingvistici<114>U statičkim istraživanjima ne postoji jedinstveno mišljenje o ciljevima i ciljevima. Akad. A. A. Markov, koji je prvi primijenio matematičke metode na jezik, Boldrini, Yul, Mariotti jezične elemente smatraju prikladnim ilustrativnim materijalom za konstruiranje kvantitativnih metoda ili za statističke teoreme, uopće se ne pitajući jesu li rezultati takvog proučavanja od interesa. jezikoslovcima 6 0 . Ross vjeruje da teorija vjerojatnosti i matematička statistika pružaju alat ili, kako sada radije kažu, matematički model za testiranje i potvrđivanje onih lingvističkih zaključaka koji dopuštaju numeričku interpretaciju. Stoga su matematičke metode zamišljene samo kao pomoćna sredstva jezičnih istraživanja 6 1 . Puno više tvrdi Herdan, koji je u svojoj knjizi ne samo sažeo i sistematizirao sve pokušaje matematičkog proučavanja jezičnih problema, nego ih je pokušao i jasno orijentirati u odnosu na daljnji rad. Izlaganje cjelokupne građe svoje knjige usmjerava na “razumijevanje književne statistike (kako on naziva proučavanje tekstova metodama matematičke statistike. - NA 3.) kao sastavni dio lingvistike” 6 2 , a bit i zadaće tog novog odjeljka u lingvistici formulira sljedećim riječima: „Književna statistika kao kvantitativna filozofija jezika primjenjiva je na sve grane lingvistike. Prema našem mišljenju, književna je statistika strukturalna lingvistika uzdignuta na razinu kvantitativne znanosti ili kvantitativne filozofije. Stoga je jednako pogrešno definirati njegove rezultate kao izvan dosega<115>lingvistike ili ga tretirati kao pomoćno sredstvo za istraživanje” 6 3 .

Teško je uputno ulaziti u teoretiziranje o tome je li u ovom slučaju legitimno govoriti o nastanku nove grane lingvistike i razriješiti pitanje njezinih tvrdnji, a da se prije toga ne osvrnemo na razmatranje onoga što je zapravo učinjeno u ovom slučaju. području, te razjašnjenju u kojem smjeru ide primjena novih metoda 6 4 . To će nam pomoći da razumijemo razlike u mišljenjima.

Korištenje matematičkih (ili, točnije, statističkih) kriterija za rješavanje lingvističkih problema nije nipošto novost u znanosti o jeziku i, u ovoj ili onoj mjeri, već se dugo koriste od strane jezikoslovaca. Uostalom, zapravo, takvi tradicionalni koncepti lingvistike kao što je fonetski zakon (i srodni<116>nee s njim - iznimka od zakona), produktivnost gramatičkih elemenata (na primjer, derivacijski sufiksi), ili čak kriteriji za srodne odnose među jezicima, u određenoj mjeri, temelje se na relativnim statističkim značajkama. Uostalom, što je oštrija i izrazitija statistička suprotnost promatranih slučajeva, to više razloga imamo za govoriti o produktivnim i neproduktivnim sufiksima, o fonetskom zakonu i iznimkama od njega, o prisutnosti ili odsutnosti srodnosti među jezicima. Ali ako se u takvim slučajevima statističko načelo koristilo više ili manje spontano, onda se u budućnosti počelo primjenjivati ​​svjesno i već s određenim postavljanjem cilja. Tako su u naše vrijeme postali rašireni takozvani frekvencijski rječnici vokabulara i izraza pojedinih jezika 6 5 ili čak značenja višejezičnih riječi s "općim fokusom na stvarnost" 6 6. Podaci iz ovih rječnika koriste se za izradu udžbenika stranih jezika (čiji su tekstovi izgrađeni na najčešće korištenom vokabularu) i minimalnih rječnika. Statistička računica našla je posebnu lingvističku upotrebu u metodi leksikostatistike ili glotokronologije M. Swadesha, gdje se na temelju statističkih formula koje uzimaju u obzir slučajeve nestanka riječi iz jezika glavnog fonda, može utvrditi apsolutnu kronologiju podjele jezičnih obitelji 6 7 .

Posljednjih godina znatno su se povećali slučajevi primjene matematičkih metoda na jezičnu građu, au masi takvih pokušaja ocrtavaju se više ili manje određeni pravci. Skrenimo<117>na njihovo uzastopno razmatranje, ne ulazeći u detalje.

Počnimo s smjerom koji je dobio naziv stilostatistika. U ovom slučaju riječ je o definiranju i karakterizaciji stilskih obilježja pojedinih djela ili autora kroz kvantitativne odnose upotrijebljenih jezičnih elemenata. Statistički pristup proučavanju stilskih pojava temelji se na shvaćanju književnog stila kao individualnog načina ovladavanja jezičnim sredstvima. Istraživač je pritom potpuno odvučen od pitanja kvalitativnog značenja prebrojivih jezičnih elemenata, usredotočujući svu svoju pozornost samo na kvantitativnu stranu; semantička strana proučavanih jezičnih jedinica, njihova emocionalna i ekspresivna opterećenost, kao i njihov udio u tkivu umjetničkog djela - sve to ostaje izvan računa, odnosi se na takozvane redundantne pojave. Tako se umjetničko djelo pojavljuje u obliku mehaničkog agregata čija specifičnost konstrukcije dolazi do izražaja tek kroz brojčane odnose njegovih elemenata. Predstavnici stilostatistike ne zatvaraju oči pred svim navedenim okolnostima, suprotstavljajući metode tradicionalne stilistike, koje nedvojbeno sadrže elemente subjektivnosti, jednu jedinu kvalitetu matematičke metode, koja, po njihovom mišljenju, nadoknađuje sve njezine nedostatke – objektivnost postignutih rezultata. “Nastojimo”, piše npr. V. Fuchs, “... matematičkim sredstvima karakterizirati stil jezičnog izražavanja. U tu svrhu treba stvoriti metode čiji rezultati trebaju imati istu objektivnost kao i rezultati egzaktnih znanosti ... To sugerira da ćemo se, barem u početku, baviti samo formalnim strukturnim kvalitetama, a ne semantičkim sadržaj jezičnih izraza . Na taj ćemo način dobiti sustav rednih odnosa, koji će u svojoj ukupnosti biti temelj i polazište matematičke teorije stila” 6 8 .<118>

Najjednostavniji statistički pristup proučavanju jezika pisaca ili pojedinih djela jest prebrojavanje upotrijebljenih riječi, budući da bi bogatstvo rječnika, po svemu sudeći, trebalo na određeni način karakterizirati i samog autora. No, rezultati takvih izračuna u tom pogledu daju pomalo neočekivane rezultate i nimalo ne pridonose estetskom poznavanju i vrednovanju književnog djela, što je ne samo jedna od zadaća stilistike. Evo nekih podataka o ukupnom broju riječi korištenih u nizu djela:

Biblija (latinski). . . . . . . . . . 5649 riječi

Biblija (hebrejski). . . . 5642 riječi

Demosten (govor). . . . . . . . . . . . 4972 riječi

Salustije. . . . . . . . . . . . . . . . . 3394 riječi

Horacije. . . . . . . . . . . . . . . . . . . .6084 riječi

Dante (Božanstvena komedija) 5860 riječi

(ovo uključuje 1615 vlastitih imena i zemljopisnih naziva)

Tasso (Bijesni Orland). . . . 8474 riječi

Milton. . . . . . . . . . . . . . . . . . . . .8000 riječi (približno dano)

Shakespearea. . . . . . . . . . . . . . . . . . .15000 riječi

(otprilike, prema drugim izvorima 20 000 riječi)

O. Jespersen ističe da rječnik Zole, Kiplinga i Jacka Londona znatno nadmašuje rječnik Miltona, tj. broj je 8000 6 9 . Izračunom rječnika govora američkog predsjednika W. Wilsona utvrđeno je da je bogatiji od onog Shakespeareova. Tome treba dodati i podatke psihologa. Tako je Terman, na temelju promatranja velikog broja slučajeva, utvrdio da vokabular prosječnog djeteta iznosi oko 3600 riječi, a u dobi od 14 godina - već 9000. Prosječna odrasla osoba koristi 11700 riječi, a osoba "povećanog inteligencija" do 13500 7 0 . Dakle, takvi brojčani podaci sami po sebi ne daju nikakvu osnovu za identifikaciju stilskih kvaliteta djela i samo "objektivno" konz.<119>navode korištenje različitog broja riječi kod različitih autora, što, kako pokazuju gornji izračuni, nije povezano s relativnom umjetničkom vrijednošću njihovih djela.

Izračuni relativne učestalosti uporabe riječi pojedinih autora izgrađeni su nešto drugačije. U ovom slučaju ne uzima se u obzir samo ukupna količina riječi, već i učestalost upotrebe pojedinih riječi. Statistička obrada ovako dobivenog materijala sastoji se u tome da se riječi s jednakom učestalošću upotrebe grupiraju u razrede (odnosno rangove), čime se utvrđuje raspodjela učestalosti svih riječi koje koristi određeni autor. Poseban slučaj ove vrste izračuna je određivanje relativne učestalosti posebnih riječi (primjerice, romanski vokabular u Chaucerovim djelima, kao što je to učinio Mersand 7 1). Relativna učestalost riječi koje autori koriste sadrži iste objektivne informacije o stilu pojedinih autora kao i gornji ukupni izračuni, s tom razlikom što su rezultat točniji brojčani podaci. No, koristi se i za datiranje pojedinih djela istog autora na temelju preliminarnog izračuna relativne učestalosti njegove uporabe riječi u različitim razdobljima njegova života (prema djelima koja je datirao sam autor). Druga vrsta korištenja podataka iz takvih izračuna je utvrđivanje autentičnosti autorstva djela za koja se ovo pitanje čini dvojbenim 7 2 . U ovom posljednjem slučaju sve se temelji na usporedbi statističkih formula za učestalost korištenja u izvornim i kontroverznim djelima. O vrlo velikoj relativnosti i približnosti rezultata dobivenih takvim metodama ne treba govoriti. Uostalom, relativna učestalost uporabe mijenja se ne samo s godinama autora, već i ovisno o žanru, zapletu, ali i povijesnom okruženju radnje djela (usporedi, na primjer, "Kruh" i "Petar" I" A. Tolstoja).<120>

Produbljujući gore opisanu metodu, stilostatistika kao stilska karakteristika počela je posezati za kriterijem stabilnosti relativne učestalosti najčešće korištenih riječi. Metoda korištena u ovom slučaju može se ilustrirati statističkom obradom Puškinove priče "Kapetanova kći" Esselsona i Epsteina na Institutu za slavenske jezike Sveučilišta u Detroitu (SAD) 7 3 . Anketiranju je podvrgnut cijeli tekst priče (oko 30.000 pojavljivanja riječi), a potom i odlomci koji sadrže oko 10.000 i 5.000 pojavljivanja. Nadalje, kako bi se utvrdila stabilnost relativne učestalosti uporabe riječi, 102 najčešće korištene riječi (s učestalošću od 1160 puta do 35) uspoređeno je s izračunatom relativnom učestalošću (izrađenom na temelju selektivnih odlomaka) sa stvarnim. Na primjer, sindikat "i" korišten je 1160 puta u cijeloj priči. U odlomku koji sadrži 5 000 pojavljivanja svih riječi, očekuje se da će ovaj veznik biti korišten 5 000 x 1 160:30 000, ili zaokružen 193 puta, a u odlomku koji sadrži 10 000 pojavljivanja svih riječi, očekuje se da će biti korišten 10 000 x 1 160 : 30 000, ili 386 puta. Usporedba podataka dobivenih ovakvom vrstom izračuna sa stvarnim podacima pokazuje vrlo malo odstupanje (unutar 5%). Na temelju takvih izračuna utvrđeno je da se u ovoj Puškinovoj priči prijedlog "k" koristi dvostruko češće od "y", a zamjenica "ti" se koristi tri puta češće od "njih" itd. , unatoč svim peripetijama radnje, kako u cijeloj priči, tako iu njenim pojedinim dijelovima, postoji stabilnost u relativnoj učestalosti upotrebe riječi. Ono što se opaža u odnosu na neke (najčešće) riječi vjerojatno je primjenjivo na sve riječi korištene u djelu. Iz toga slijedi da se stil autora može okarakterizirati određenim omjerom varijabilnosti prosječne učestalosti uporabe riječi prema općoj učestalosti za određeni jezik.<121>učestalost njegove upotrebe. Taj se omjer smatra objektivnom kvantitativnom karakteristikom autorova stila.

Na sličan način proučavaju se i drugi formalni elementi jezične strukture. Tako je npr. V. Fuchs komparativno-statističkom razmatranju podvrgao metričke značajke djela Goethea, Rilkea, Cezara, Salustija i dr. 7 4

Kriterij stabilnosti relativne učestalosti uporabe riječi, dok pojašnjava tehniku ​​kvantitativne karakterizacije stila, ne unosi ništa bitno novo u usporedbi s gore analiziranim primitivnijim metodama. Sve metode stilostatistike u konačnici daju jednako nepristrasne "objektivne" rezultate, klizeći po površini jezika i držeći se samo čisto vanjskih znakova. Kvantitativne metode, očito, nisu u stanju usredotočiti se na kvalitativne razlike u materijalu koji se proučava i zapravo izjednačiti sve objekte koji se proučavaju.

Gdje je potrebna maksimalna specifikacija, nude se najopćenitiji kriteriji; kvalitativne karakteristike izražavaju se jezikom količine. To nije samo logička kontradikcija, već i neslaganje s prirodom stvari. Doista, što se događa ako na temelju kvantitativnog omjera crvene i crne boje na njihovim platnima pokušamo dobiti usporednu stilsku (dakle, kvalitativnu) karakteristiku djela Aleksandra Gerasimova i Rembrandta? Čini se da je to apsolutna besmislica. U kojoj mjeri nam potpuno “objektivne” kvantitativne informacije o fizičkim podacima osobe mogu dati predodžbu o svemu što karakterizira osobu i čini njezinu pravu bit? Očito nijedan. Oni mogu poslužiti samo kao pojedinačni znak koji razlikuje jednu osobu od druge, poput otiska vijuga na palcu. Slično je i s kvantitativnim obilježjima književnoga stila. Ako bolje pogledate, oni pružaju jednako oskudne podatke za procjenu stvarnog stila<122>kvalitete autorova jezika, kao i opis vijuga na prstu za proučavanje ljudske psihologije.

Svemu rečenome treba dodati da se u prošlosti, u tzv. formalnoj školi književne kritike, već pokušalo kvantitativno proučavati stil pisaca, kada su epiteti, metafore i ritmičko-melodijski elementi stihova su izbrojani. Međutim, ovaj pokušaj nije dobio daljnji razvoj.

Drugo područje primjene matematičkih metoda za proučavanje jezičnih pojava može se grupirati pod nazivom lingvistička statistika. Ona nastoji prodrijeti u temeljna pitanja teorije jezika i tako dobiti zvanje u pravoj lingvističkoj sferi. Za upoznavanje s tim smjerom najbolje je okrenuti se već spomenutom Herdanovom djelu, po riječima jednog od njegovih brojnih recenzenata, "monstruozno pretencioznoj knjizi" 7 5 , dobio je, međutim, širok odjek među jezikoslovcima 7 6 . S obzirom na to da je Kherdan (kao što je već spomenuto) u svojoj knjizi nastojao prikupiti sve najznačajnije u području primjene matematičkih metoda na lingvističke probleme, u njegovoj se knjizi zapravo ne bavimo toliko Kherdanom koliko cjelinom trend. Kao što i sam naslov knjige “Jezik kao izbor i vjerojatnost” pokazuje, njezin glavni fokus je na razjašnjenju što je u jeziku prepušteno slobodnom izboru govornika, a što je posljedica imanentne strukture jezika, baš kao o određivanju kvantitativnog odnosa elemenata prvog i drugog reda. Kherdanova knjiga pruža gotovo iscrpne informacije o svim radovima na ovom području koje provode predstavnici raznih specijalnosti.<123>(filozofi, lingvisti, matematičari, tehničari), ali nije ograničen na ovo i uključuje mnoga izvorna zapažanja, razmatranja i zaključke samog autora. Kao sažetak, daje dobru predodžbu o korištenim kvantitativnim metodama i rezultatima postignutim uz njihovu pomoć. Pitanja koja uvjetno objedinjujemo u dio lingvističke statistike obrađena su u drugom i četvrtom dijelu knjige.

Od mnogih slučajeva primjene metoda matematičke statistike u proučavanju lingvističkih pitanja, usredotočit ćemo se na one najopćenitije, koji se ujedno mogu smatrati i najtipičnijima. Korištenje podataka drugih autora - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 i drugi, kao i citirajući vlastita istraživanja koja određuju relativnu učestalost distribucije fonema, slova, duljine riječi (mjerene brojem slova i slogova) , gramatičkih oblika i metričkih elemenata u latinskom i grčkom heksametru, Herdan utvrđuje činjenicu postojanosti relativne učestalosti jezičnih elemenata kao zajedničke karakteristike svih jezičnih struktura. On izvodi sljedeće pravilo: “Omjeri jezičnih elemenata koji pripadaju jednoj ili drugoj razini ili sferi jezičnog kodiranja - fonologija, gramatika, metrika - ostaju manje-više konstantni za dati jezik, u određenom razdoblju njegova razvoja i unutar granicama dovoljno opsežnih i nepristrano provedenih promatranja.» 8 2 . Ovo pravilo, koje Herdan naziva osnovnim zakonom jezika, on nastoji na stanovit način protumačiti i proširiti. “On je”, piše Herdan o ovom zakonu, “izraz činjenice da i ovdje, gdje je ljudska volja i sloboda izbora zajamčena.<124>najširem okviru, gdje se svjestan izbor i bezbrižna igra živo izmjenjuju, općenito postoji znatna stabilnost... u gramatici, ali iu odnosu na učestalost uporabe pojedinih fonema, leksičkih jedinica (riječi) i gramatičkih fonema i konstrukcije; drugim riječima, sličnost nije samo u tome što se koristi, nego iu tome koliko se često koristi” 8 3 . Ovakvo stanje je iz razumljivih razloga, ali to daje povoda novim zaključcima. Prilikom ispitivanja različitih tekstova ili segmenata određenog jezika, na primjer, otkriva se da relativne učestalosti upotrebe određenog fonema (ili drugih govornih elemenata) od strane različitih ljudi ostaju u osnovi iste. To dovodi do tumačenja pojedinih oblika govora kao nekih fluktuacija u stalnoj vjerojatnosti uporabe razmatranog fonema u određenom jeziku. Dakle, ispada da je osoba u svojoj govornoj aktivnosti podložna određenim zakonima vjerojatnosti u odnosu na broj korištenih jezičnih elemenata. I onda, kada promatramo ogroman broj jezičnih elemenata u velikom skupu tekstova ili govornih segmenata, stječe se dojam uzročne ovisnosti u smislu da u ovom slučaju postoji i determinacija u odnosu na upotrebu pojedinih jezičnih elemenata. Drugim riječima, pokazuje se prihvatljivim tvrditi da je ono što se s intuitivnog stajališta čini uzročnom vezom kvantitativno vjerojatnost 8 4 . Jasno je da što je veći ukupni<125>specifičnosti ispitivanih tekstova ili govornih segmenata to će se jasnije očitovati stabilnost relativne učestalosti uporabe jezičnih elemenata iu pojedinačnoj uporabi (zakon velikih brojeva). Iz toga proizlazi novi opći zaključak da je jezik masovna pojava i da ga kao takvog treba i tretirati.

Ovi zaključci, doneseni na temelju proračuna učestalosti fonetskih elemenata, riječi i gramatičkih oblika, koji zajedno čine jezik, zatim se primjenjuju na "statističku interpretaciju" Saussureove podjele na "jezik" (lalangue) i "govor" (laparole ). Prema Saussureu, "jezik" je skup jezičnih navika koje omogućuju komunikaciju između članova određene jezične zajednice. To je društvena stvarnost, "masovna pojava", obavezna za sve ljude koji govore ovim jezikom. Herdan, kao što je navedeno, dokazuje da su pripadnici jedne jezične zajednice slični jedni drugima ne samo po tome što koriste iste foneme, leksičke jedinice i gramatičke oblike, već i po tome što se svi ti elementi koriste s istom učestalošću. Stoga njegova statistička definicija "jezika" ima sljedeći oblik: "jezik" (lalangue) je ukupnost uobičajenih jezičnih elemenata plus njihova relativna vjerojatnost da će biti korišteni.

Ova definicija "jezika" također je polazište za odgovarajuću statističku interpretaciju "govora", koji je, prema Saussureu, individualni iskaz. Suprotstavljajući “jezik” kao društveni fenomen “govoru” kao individualnom fenomenu, Saussure je napisao: “Govor je individualni čin volje i razumijevanja, u kojem je potrebno razlikovati: 1. kombinacije s kojima subjekt koji govori koristi jezik; kod kako bi izrazio svoju osobnu misao; 2. psihofizički mehanizam koji mu omogućuje da te kombinacije objektivizira” 8 5 . Budući da se "jezik" u lingvističkoj statistici smatra skupom elemenata s određenim relativnim<126>određena vjerojatnost njihove uporabe, utoliko što uključuje statističku ukupnost ili ansambl (populaciju) kao najbitniju karakteristiku i može se razmatrati u tom aspektu. U skladu s tim, "govor" se pretvara u zaseban uzorak uzet iz "jezika" kao statističkog agregata. Vjerojatnost je u ovom slučaju određena odnosom "govora" prema "jeziku" (u njihovom "kvantitativnom" razumijevanju), a distribucija relativne učestalosti uporabe različitih elemenata jezika tumači se kao rezultat skupni »izbor« (izbor) u određenom kronološkom razdoblju postojanja jezika. Shvaćajući da je takvo tumačenje razlika između “jezika” i “govora” ipak izgrađeno na potpuno drugačijim osnovama od Saussureovih, Herdan u tom pogledu piše: “Ova naizgled neznatna modifikacija Saussureova koncepta ima važnu posljedicu da je “jezik” ( lalangue ) sada dobiva bitno obilježje u obliku statističkog agregata (populacije). Tu populaciju karakteriziraju određene relativne učestalosti ili vjerojatnosti fluktuacije, što znači da svaki jezični element pripada određenoj jezičnoj razini. U ovom slučaju, "govor" (laparole) se, u skladu sa svojim značenjem, ispostavlja kao termin za definiranje statističkih uzoraka uzetih iz "jezika" kao statističke populacije. Postaje očito da se izbor (izbor) ovdje pojavljuje u obliku omjera "govora" i "jezika", što je omjer nasumično uzetog uzorka prema statističkom agregatu (populaciji). Sam redoslijed raspodjele frekvencija, kao talog stoljetne govorne djelatnosti jedne jezične zajednice, element je izbora (izbora), ali ne individualnog izbora, kao u stilu, nego kolektivnog izbora. Metaforički se ovdje može govoriti o izboru duha jezika, ako pod tim razumijemo načela jezične komunikacije koja su u skladu sa sklopom mentalnih podataka pripadnika pojedine jezične zajednice. Stabilnost niza je rezultat vjerojatnosti (slučajnosti)» 8 6 .

Poseban slučaj primjene navedenog načela<127>pa je razgraničenje u jeziku normativnih pojava od »iznimki« (odstupanja). Lingvistička statistika navodi da statistička metoda omogućuje uklanjanje nejasnoća koje postoje u ovom pitanju i uspostavljanje jasnih kriterija za razlikovanje ovih pojava. Ako se pod normom podrazumijeva statistička populacija (u gore navedenom smislu), a iznimka (ili pogreška) je odstupanje od frekvencija koje pokazuje statistička populacija, tada se kvantitativno rješenje pitanja nameće samo po sebi. Sve se svodi na statistički odnos između "populacije" i "outliera". Ako učestalosti opažene u pojedinačnom uzorku odstupaju od vjerojatnosti zbog statističke populacije za više nego što je određeno nizom prebrojavanja uzoraka, tada imamo razloga zaključiti da je linija razgraničenja između "isto" (norma) i "nije isti" (izuzetak) je prekršen.

Kvantitativne razlike između "jezika" i "govora" također se koriste za razlikovanje dviju vrsta jezičnih elemenata: gramatičkih i leksičkih. Polazište za rješavanje ovog problema, koji s lingvističkog gledišta često predstavlja velike poteškoće, jest pretpostavka da je stupanj učestalosti gramatičkih elemenata različit od onog leksičkih jedinica. To je navodno povezano s "generalizacijom" gramatičkih elemenata, koliko se oni razlikuju od pojmova fiksiranih leksičkim jedinicama. Osim toga, gramatički elementi navodno su u pravilu znatno manjeg obujma: kao samostalne riječi (obuhvaćaju zamjenice, prijedloge, veznike i pomoćne riječi) obično se sastoje od malog broja fonema, a u obliku "vezanih oblika" " - od jednog ili dva fonema 8 7 . Što je manji jezični element, to je njegova "duljina" (kvantitativni moment) manje sposobna da posluži kao određujuća karakteristika, a "kvaliteta" fonema postaje važnija za tu svrhu. Koje su metode predložene za rješavanje problema koji se razmatra? Rješava se pozivanjem na čisto kvantitativni koncept gramatičkog<128>load, “Pretpostavimo,” piše Herdan u vezi s tim, “da smo zainteresirani za usporedbu dva jezika u tom smislu. Kako s određenim stupnjem objektivnosti odrediti "gramatičko opterećenje" koje jezik nosi? Jasno je da će ovo opterećenje ovisiti o položaju demarkacijske crte koja odvaja gramatiku od vokabulara. Prvo što bi nam moglo pasti na pamet jest odrediti koliko je "složena" gramatika određenog jezika. Uostalom, "složenost" je kvalitativna karakteristika, a koncept "gramatičkog opterećenja" je kvantitativna karakteristika. Istina, opterećenje u određenoj mjeri ovisi o složenosti, ali ne u potpunosti. Jezik može biti nagrađen izuzetno složenom gramatikom, ali samo se relativno mali dio nje koristi u jezičnoj aktivnosti. "Gramatičko opterećenje" definiramo kao ukupnost gramatike koju jezik nosi dok je u akciji, što odmah dovodi naš problem u područje strukturne lingvistike u smislu u kojem je disciplinu definirao Saussure. U sljedećoj prezentaciji, kvantitativne metode se koriste za određivanje razlike između jezika, ovisno o tome gdje je granica, odvajajući gramatiku od vokabulara” 8 8 . Drugim riječima, jezične razlike u ovom slučaju treba svesti na razlike u brojčanim odnosima između gramatičkih i leksičkih elemenata.

Materijali koji su nam na raspolaganju daju sljedeću sliku. U engleskom jeziku (u obzir su uzete samo “gramatičke riječi”: zamjenice, ili, kako ih još nazivaju, “zamjene”, prijedlozi, veznici i pomoćni glagoli), u segmentu koji uključuje 78633 slučajeva uporabe svih riječi (1027 različite riječi), 53.102 slučaja uporabe gramatičkih elemenata, točnije „gramatičkih riječi“ (149 različitih riječi), što je 67,53% s 15,8% različitih riječi. Takvi su podaci Dewaya 8 9 . Ostali podaci pokazuju drugačiji postotak<129>omjer: 57,1% s 5,4% različitih riječi 9 0 . Ovo značajno odstupanje objašnjava se razlikom između pisanog i govornog jezika. Pisani oblici jezika (prvi podatak) navodno koriste više gramatičkih elemenata nego usmeni (drugi slučaj). U Danteovoj Božanstvenoj komediji (prema talijanskom izvorniku) Mariotti je utvrdio 54,4% pojavljivanja "gramatičkih riječi".

Drugi i, očito, savršeniji način za određivanje gramatičkog opterećenja jezika je brojanje fonema uključenih u gramatičke elemente. U ovom slučaju ne uzimaju se u obzir samo neovisne gramatičke riječi, već i srodni oblici. Ovdje postoje razne opcije. Na primjer, određivanje relativne učestalosti uporabe pojedinih suglasničkih fonema u gramatičkim elementima i njihova usporedba s učestalošću ukupne uporabe tih istih fonema (konačni podatak takvog omjera u engleskom jeziku daje omjer od 99,9% prema 100 000 - ukupna upotreba); ili slično uspoređivanje suglasnika prema posebnim klasifikacijskim skupinama (labijalni, palatalni, velarni i drugi fonemi). Konačni omjer ovdje ima oblik omjera od 56,47% (u gramatičkim elementima) prema 60,25% (u ukupnoj upotrebi); ili ista usporedba početnih suglasničkih fonema (u ovom slučaju omjer je bio 100,2% u gramatičkim riječima prema 99,95 u ukupnoj upotrebi). Moguće su i druge složenije statističke operacije, koje, međutim, rezultiraju sličnim kvantitativnim izrazima proučavanog problema.

Navedeni kvantitativni podaci služe kao temelj za opći zaključak. Svodi se na činjenicu da distribucija fonema u gramatičkim elementima određuje prirodu distribucije (u numeričkom smislu, naravno) fonema u jeziku kao cjelini. A to nam pak omogućuje da zaključimo da uporaba gramatičkih elemenata u najmanjoj mjeri ovisi o individualnom izboru i čini onaj dio jezičnog izraza koji je kontroliran vjerojatnostima.<130>nost. Ovaj spekulativni zaključak potvrđuje izračunavanje gramatičkih oblika u ruskom jeziku, koje je napravio Esselson 9 1 . Studiji je podvrgnuto 46896 riječi preuzetih iz II izvora (djela Gribojedova, Dostojevskog, Gončarova, Saltikova-Ščedrina, Garšina, Belinskog, Amfiteatrova, Guseva-Orenburškog, Erenburga, Simonova i N. Ostrovskog). Podijeljeni su na kolokvijalne riječi (17 756 riječi ili 37,9%) i nekolokvijalne (29 140 riječi ili 62,1%). Potom je cjelokupni skup riječi podijeljen u 4 skupine ovisno o njihovoj gramatičkoj prirodi: u 1. skupini su imenice, pridjevi, pridjevi u funkciji imenica, zamjenice i sklonjeni brojevi; u 2. skupini - glagoli; u 3. skupini - glagolski participi, participi u funkciji pridjeva i imenica i gerundija; u 4. skupini - nepromjenljivi oblici priloga, prijedloga, veznika i čestica. Sumarni rezultati (date su i tablice s podacima za pojedine autore) daju sljedeći omjer:

1. skupina

2. skupina

3. skupina

4. skupina

kolokvijalni

šutljiv

Promatranje tako dobivenih kvantitativnih podataka Herdan karakterizira sljedećim riječima: „Oni opravdavaju zaključak da gramatičke elemente treba promatrati kao faktor koji određuje vjerojatnost jezičnog izraza. Ovakvim zaključkom izbjegava se opterećujuća kvalifikacija svake upotrijebljene riječi. Jasno je da, budući da gramatika i vokabular nisu pohranjeni u vodonepropusnim ljuskama, niti je čisti "izbor" ili čista "slučajnost". I gramatika i vokabular sadrže oba elementa, iako u značajno različitim omjerima” 9 2 .<131>

Velik dio Herdanove knjige posvećen je proučavanju dualnosti ili dualnosti u jeziku, a sam koncept dualnosti temelji se na matematičkim karakteristikama.

Dakle, teoreme u projektivnoj geometriji možemo rasporediti u dva niza, tako da se svaki teorem jednog niza može dobiti iz nekog teorema drugog niza zamjenom riječi točka I ravno. Na primjer, ako je dana izjava: "bilo koja različita točka pripada jednom i samo jednom pravcu," tada iz nje možemo izvesti odgovarajuću izjavu: "bilo koja dva različita pravca pripadaju jednoj i samo jednoj točki." Druga metoda za određivanje dualnosti je iscrtavanje različitih ravnina fenomena koji se proučava duž apscise i ordinate. Tako se, kao što to čini npr. Yul 9 3, po apscisnoj osi broje različite učestalosti upotrebe, a po ordinatnoj osi broj leksičkih jedinica čija se učestalost utvrđuje itd. .lingvistička istraživanja.

Pod ovako definiran pojam dvojine, koji u svim slučajevima zapravo ima karakter binarnog koda i koji se ujedno smatra i najbitnijim obilježjem jezične strukture, dovode se fenomeni krajnje različitih kvaliteta koji dopuštaju suprotstavljanje na dva plana. : raspodjela uporabe riječi prema prirodi leksičkih jedinica i raspodjela leksičkih jedinica prema učestalosti uporaba riječi; pisani i govorni oblici govora; leksički i gramatički elementi; sinonimi i antonimi; fonem i njegov grafički prikaz; odredivi i određujući (Saussureov signifiant i signifiy) itd.

Nakon kvantitativnog proučavanja dvojnosti jedne ili druge pojedine, jezične pojave ili ograničenog »teksta« u pravilu se izvodi zaključak kojemu se pripisuju svojstva jezične univerzalnosti. Priroda takvih zaključaka i način na koji su oni opravdani može se vidjeti na primjeru<132>proučavanja dvojnosti riječi i pojma (riječ je zapravo o odnosu duljine riječi i obujma pojma – valja imati na umu da je krajnje slobodna uporaba jezičnih i drugih pojmova u takva djela često otežavaju razumijevanje). Važno je napomenuti da su kao materijal koji je poslužio kao izvor zapažanja ove vrste jezičnog dvojstva korišteni: međunarodna nomenklatura bolesti (oko 1000 naziva) i opći registar bolesti u Engleskoj i Wellsu za 1949. godinu. U ovom slučaju dolazi se do sljedećeg općeg zaključka: “Svaki koncept koji označava opću ideju ima ono što se može nazvati "sfera" ili "volumen". Kroz svoj medij omogućuje razmišljanje o mnogim predmetima ili drugim pojmovima koji su unutar njegove "sfere". S druge strane, sve stavke potrebne za definiranje koncepta čine ono što se naziva njegovim "sadržajem". Volumen i sadržaj su u međusobnoj korelaciji – što je sadržaj manji i, shodno tome, što je pojam apstraktniji, to mu je opseg ili obujam veći, odnosno podvodi se više predmeta. To se može promatrati kao analogija (u konceptualnoj sferi) s načelima kodiranja, prema kojima su duljina simbola i učestalost uporabe međuovisne” 9 4 .

Načelo dualnosti vrijedi i za određene probleme. Na primjer, kada se utvrđuje istovjetnost značenja riječi u dva različita jezika. Kao rezultat proučavanja englesko-njemačkog rječnika Muret-Zandersa korištenjem metode matematičke iteracije, zaključuje se da vjerojatnost korištenja engleske riječi s jednim ili više značenja u njemačkom prijevodu ostaje konstantna za svako početno slovo u cijelom rječniku 9 5 . Razmatranje reda riječi u kineskim rječnicima dovodi do zaključka da je on taksonomske prirode, budući da broj poteza u znaku ukazuje na njegovo mjesto (kao samostalnog radikala ili određenog podrazreda podređenog radikalu). Taksonomija je podređeno načelo klasifikacije koje se koristi u zoologiji i botanici. Kherdan tvrdi da<133>temelji kineske leksikografije izgrađeni su i na načelima taksonomije 9 6 itd.

Dajući opću ocjenu ovog područja primjene matematičkih metoda u proučavanju jezičnih problema (tj. jezične statistike), potrebno je, očito, poći od stava koji je formulirao Ettinger: "Matematika se može učinkovito koristiti u službi lingvistike samo onda kada su lingvistima jasne stvarne granice njegove primjene, kao i mogućnosti korištenih matematičkih modela” 9 7 . Drugim riječima, o matematičkoj lingvistici možemo govoriti kada matematičke metode pokažu svoju prikladnost za rješavanje onih pravih jezičnih problema koji u svojoj ukupnosti čine znanost o jeziku. Ako to nije slučaj, iako to može otvoriti nove aspekte znanstvenog istraživanja, onda u ovom slučaju možemo govoriti o bilo čemu, ali ne o lingvistici - u ovom slučaju ne mislimo na različite vrste primijenjene lingvistike (govorit ćemo o to kasnije).govor dolje), već znanstvena, ili teorijska, lingvistika. Na temelju ovog stajališta treba primijetiti da je s gledišta jezikoslovca mnogo toga u lingvističkoj statistici dvojbeno, pa čak i zbunjujuće.

Prijeđimo na analizu samo dva primjera (kako ne bismo zatrpavali izlaganje), uz uvjet da se svakom od njih mogu dati vrlo značajne primjedbe. Ovdje imamo kvantitativnu razliku između gramatičkih i leksičkih jedinica. Ispada da je za takvo razlikovanje potrebno već unaprijed znati što spada u područje gramatike, a što u vokabular, budući da je “gramatičko opterećenje” jezika (tj. ukupnost gramatičkih elemenata) koji se koristi u govoru), kao što je gore citirano, "ovisi o liniji razgraničenja koja odvaja vokabular od gramatike." Ne znajući gdje leži ta linija, nemoguće je povući naznačenu razliku. Koje je onda značenje kvantitativne metode razlikovanja leksičkog od gramatičkog?<134>matic? No, što se tiče Herdana, on se posebno ne bavi ovim pitanjem i hrabro klasificira jezične elemente, misleći na gramatičke elemente "vezane oblike", koje, sudeći po prikazu, treba shvatiti kao vanjsku fleksiju, i "gramatičke riječi", koji uključuju prijedloge, veznike, pomoćne glagole i zamjenice - potonje na temelju činjenice da su "zamjene". Ali ako govorimo samo o ovoj kvaliteti zamjenica i na temelju toga ih povezujemo s gramatičkim elementima, onda im, očito, treba pripisati i riječi kao što su "gore spomenuto", "nazvano", "dano" itd. kako i oni djeluju kao poslanici. U vezi s metodom odvajanja gramatičkih elemenata koja se koristi u lingvističkoj statistici, prirodno se postavlja pitanje kako u ovom slučaju postupati s takvim "neformalnim" gramatičkim fenomenima kao što su red riječi, tonovi, nulti morfemi, paradigmatski odnosi (neki od ovih fenomena , usput, pronaći odraz u onim jezicima koji se proučavaju matematičkim metodama)? Kako povući razliku u jezicima s bogatom unutarnjom fleksijom (kao, na primjer, u semitskim jezicima), gdje ne samo da gramatički modificira korijen (radikal), već mu daje i leksičko postojanje, budući da korijen bez permutacija ima nema stvarnog postojanja u jeziku? Što treba razumjeti pod gramatičkom složenošću jezika, po kojem se kriteriju ona određuje? Ako je kvantitativna točka, koja se u ovom slučaju naglašava na sve moguće načine, onda će jedan od gramatički najtežih jezika biti engleski, koji ima takve konstrukcije kao što su Ishallhavebeencalling ili Hewouldhavebeencalling. U tim se rečenicama samo poziv može klasificirati kao leksički, a sve ostalo, dakle, mora se smatrati gramatičkim. Koje osnove postoje za povezivanje učestalosti uporabe gramatičkih elemenata s općenitošću ili apstraktnošću značenja gramatičkih riječi? Uostalom, posve je očito da je relativno velika učestalost uporabe gramatičkih elemenata određena njihovom funkcijom u konstrukciji rečenice, a što se tiče apstraktnosti značenja, vrlo je lako pronaći veliku<135>broj leksičkih elemenata koji se u tom pogledu lako mogu natjecati s gramatičkim elementima, uvelike im inferiorni u učestalosti (npr. bitak, postojanje, proširenje, prostor, supstancija itd).

Slična vrsta apsurda javlja se pred nas u slučaju definicije dualnosti (dvojstva) riječi i pojma. Potrebno je izuzetno osebujno razumijevanje strukturalne biti jezika da bi se podvrgnuo istraživanju pomoću nomenklature bolesti i bolničkog registra bolesti, koji su, kako je gore navedeno, poslužili kao izvorni materijal za vrlo važne lingvističke zaključke. Ne zadržavajući se na posve opskurnoj uporabi takvih pojmova koji nemaju jezičnu egzistenciju, poput sfere, obujma i sadržaja pojma (usput rečeno, leksičko značenje riječi i pojma označenog znanstvenim pojmom su grubo razriješeni). zbunjen), okrenimo se zaključku koji se donosi u ovom slučaju. Kao što je gore navedeno, bavimo se tvrdnjom da su "opseg i sadržaj međusobno povezani". Cjelokupni tijek rezoniranja koji daje temelje takvom zaključku, kao i metoda matematičkog operiranja jezičnih činjenica, jasno pokazuje da se u ovom slučaju potpuno zanemaruje jedna vrlo bitna kvaliteta jezika, koja remeti sve proračune koji se provode. : sposobnost da se isti "sadržaj" izrazi jezičnim jedinicama različitog "volumena", koje nedvojbeno imaju, štoviše, različitu relativnu učestalost uporabe. Dakle, istu osobu možemo označiti kao Petrov, moj poznanik, on, Moskovljanin, mladić, zaposlenik sveučilišta, brat moje žene, čovjek kojeg smo sreli na mostu itd. U svjetlu takvih činjenica, postoji nedvojbeno su samo privatni zaključci, kojima se, međutim, kako je istaknuto, pridaje univerzalno značenje, ali i svrhovitost primjene samih kvantitativnih metoda na takve jezične probleme.

Ali ponekad se jezikoslovcima nude zaključci u čiju valjanost nema sumnje. To je "osnovni zakon jezika", koji se sastoji u tome da u jeziku postoji određena stabilnost njegovih elemenata i relativna učestalost njihova spominjanja.<136>potrošnja. Nevolja s ovakvim otkrićima je, međutim, što su lingvistima odavno poznata. Uostalom, sasvim je očito da jezik ne bi imao određenu postojanost i da svaki član određene jezične zajednice slobodno mijenja elemente jezika, tada međusobna komunikacija ne bi bila moguća, a samo postojanje jezika postalo bi besmisleno. . Što se tiče raspodjele relativne učestalosti upotrebe pojedinih elemenata jezika, ona je u lingvistici našla svoj izraz u obliku izdvajanja kategorija pasivnog i aktivnog vokabulara i gramatike, čemu je L. V. Shcherba posvetio toliko pažnje. U ovom slučaju statističke metode mogu samo pomoći lingvistima u raspodjeli pojedinih jezičnih elemenata prema kategorijama relativne učestalosti njihove uporabe, ali nemaju razloga tvrditi da otkrivaju bilo kakve nove obrasce od vrijednosti za teorijsku lingvistiku.

S druge strane, lingvistička statistika nudi niz doista "originalnih" zaključaka koji su izrazito indikativni za prirodu znanstvenog mišljenja njezinih pristaša. Tako se složenim statističkim metodama proučava „politički vokabular“ u djelima Churchilla, Benesa, Halifaxa, Stresemanna i drugih, au izračunima za autore koji ne govore engleski koriste se prijevodi njihovih djela na engleski. Rezultati proračuna prikazani su u obliku brojnih tablica, matematičkih formula i jednadžbi. Lingvistička interpretacija kvantitativnih podataka u ovom slučaju svodi se na činjenicu da je Churchillova uporaba "političkog vokabulara" najtipičnija (?) za ovu skupinu autora te da je Churchillova uporaba riječi u slučajevima kada se bavi političkim temama tipična. engleske skupine govora.. 9 8 .

U drugom slučaju, nakon odgovarajućih statističkih manipulacija, zaključuje se da je Hitler prekršio dualitet između "jezika" i "govora" u kvantitativnom smislu ovih pojmova u uporabi nacističke Njemačke. Poseban slučaj razaranja ove dvojnosti je doslovno razumijevanje<137>metaforički obrati (na primjer, "sipati sol u otvorene rane"). Nacistička Njemačka se žigosala s toliko neljudskih djela da jedva da ima potrebe osuđivati ​​je za ovu jezičnu grozotu 9 9 . Prema Kherdanu, Marxova definicija jezika kao neposredne zbilje mišljenja također dovodi do narušavanja jezične dvojnosti, a zakon dijalektike o prijelazu fenomena u svoju suprotnost je, po njemu, krivo shvaćen jezični zakon dvojnosti. jezika. Takva tumačenja govore sama za sebe.

Naposljetku, zajednički nedostatak svojstven svim navedenim slučajevima kvantitativne metode proučavanja jezičnog materijala i time dobivanja metodološkog karaktera jest pristup jezičnim elementima kao mehaničkom skupu činjenica apsolutno neovisnih jedna o drugoj, u skladu s kojim, ako uopće postoji, ili obrasci, oni se odnose samo na numeričke odnose raspodjele autonomnih činjenica, izvan njihovih sistemskih ovisnosti. Istina, J. Watmou na sve moguće načine pokušava uvjeriti da je upravo matematika bolja od bilo koje jezične strukturne analize, sposobna otkriti strukturne značajke jezika. “Moderna matematika”, piše on, “ne bavi se mjerenjem i računom, čija je točnost ograničena samom njihovom prirodom, već prvenstveno strukturom. Zbog toga je matematika vrlo pogodna za točnost učenja jezika - do te mjere da zaseban opis, čak i ograničenije prirode, to nije u stanju ... Baš kao u fizici, matematički elementi se koriste za opisivanje fizičkog svijeta, budući da se pretpostavlja da odgovaraju elementima fizičkog svijeta, tako se u matematičkoj lingvistici pretpostavlja da matematički elementi odgovaraju elementima svijeta govora” 101 . Ali takva formulacija pitanja nikako ne spašava situaciju, jer u najboljem slučaju može<138>analizirati jezik ili kao fizičku strukturu, koja je još daleko od dovoljne za jezik, a u konačnici je još uvijek istog mehaničkog karaktera, ili kao logičko-matematičku strukturu, a to prenosi jezik na drugu ravan, i u mnogočemu tuđa. Nije suvišno primijetiti da Watmow uspjehe matematičke lingvistike predviđa tek u budućnosti, a što se tiče njihovih stvarnih rezultata, ocjenjuje ih sljedećim riječima: “... gotovo sav dosadašnji rad Herdana, Zipfa, Yul, Giro (Guiraux) i drugi, nipošto nije izvan dosega kritike kako lingvistike tako i matematike; ona u velikoj mjeri miriše na amaterizam” 103 . Stoga, ako ne pokušavamo predvidjeti budućnost matematičkih metoda u lingvističkim istraživanjima, nego pokušamo cijeniti ono što imamo danas, tada ćemo morati priznati da je matematika zapravo bila ograničena u polju lingvistike samo na "mjerenje i brojanje ”, a nisam mogao dati kvalitativnu analizu jezika, zalazeći u njegovu strukturu.<139>

Pokušajmo biti što objektivniji. U određenom dijelu kvantitativne podatke, čini se, može koristiti lingvistika, ali samo kao pomoćne i uglavnom u problemima koji imaju praktičnu orijentaciju. Što se tiče većine kvantitativnih metoda proučavanja pojedinih jezičnih pojava, nedvojbeno je opravdan opći zaključak R. Browna: “Mogu se smatrati onako kako ih Kherdan smatra, ali koji je smisao svega toga?” 104 . Zamislimo da postavimo pitanje: "Koja su stabla u ovom vrtu?". A kao odgovor dobivamo: "U ovom vrtu ima stotinu stabala." Je li to odgovor na naše pitanje i ima li doista smisla? Ali na mnoga lingvistička pitanja matematičke metode daju upravo takve odgovore.

Međutim, postoji široko polje istraživačke djelatnosti, koristeći se uglavnom matematičkim metodama i istodobno ih usmjeravajući na jezičnu građu, gdje je svrsishodnost takve kombinacije nedvojbena. "Smisao" ove istraživačke djelatnosti, njezin značaj određen je ciljevima kojima ona teži. To je već provjereno u praksi. U ovom slučaju govorimo o problemima povezanim sa stvaranjem informacijskih strojeva, strukturama za strojno prevođenje pisanih znanstvenih tekstova, automatizacijom prevođenja usmenog govora s jednog jezika na drugi te s čitavim nizom zadataka koji se kombiniraju. u lingvističkim pitanjima kibernetike. Cijeli skup takvih problema obično se naziva opći naziv primijenjena lingvistika. Time se razlikuje od tzv. matematičke lingvistike, koja obuhvaća ona područja rada koja su gore označena kao stilostatistika i lingvistička statistika, iako nipošto ne zaobilazi statističku obradu jezične građe. Možda je najvažnija značajka primijenjene lingvistike, koja je odvaja od matematičke lingvistike, kao što je gore navedeno, da prva ima suprotan smjer: ne matematika za lingvistiku, već lingvistika.<140>(formaliziran matematičkim metodama) za širok raspon praktičnih problema.

Nema potrebe otkrivati ​​sadržaj pojedinih problema koji su danas uključeni u iznimno široko područje primijenjene lingvistike. Za razliku od matematičke lingvistike, ti se problemi aktivno raspravljaju u sovjetskoj lingvističkoj literaturi i s pravom počinju zauzimati sve istaknutije mjesto u znanstvenim problemima istraživačkih instituta 105 . Dakle, već su dobro poznati našoj jezičnoj zajednici. Ta nas okolnost, međutim, ne oslobađa potrebe da ih podvrgnemo promišljanju, osobito s gledišta načela znanosti o jeziku. To će nedvojbeno pridonijeti otklanjanju nesporazuma koji sve češće nastaju između predstavnika znanosti koje su međusobno vrlo udaljene, a sudjeluju u radu na problemima primijenjene lingvistike, te će nacrtati načine njihova približavanja, s jedne strane. , te razgraničenje područja istraživanja, s druge strane. Razumije se da će sljedeća razmatranja predstavljati gledište jezikoslovca, te je potrebno da ga matematičari ne samo pokušaju asimilirati, već da im, u vezi s postavljenim pitanjima, daju i svoje tumačenje.

Lingvist-teoretičar nikako ne može biti zadovoljan činjenicom da u svim slučajevima<141>jezika u svrhe koje postavlja primijenjena lingvistika, temelj im je matematički model. U skladu s tim, zapažanja o fenomenima jezika i rezultati dobiveni na taj način izražavaju se terminima i pojmovima matematike, odnosno matematičkim jednadžbama i formulama. Pogledajmo primjer radi jasnoće. Condon 1 06 i Zipf 1 07 utvrdili su da su logaritmi frekvencije ( f) pojavljivanja riječi u velikom tekstu nalaze se gotovo u ravnoj liniji, ako su u dijagramu korelirani s logaritmima ranga ili ranga ( r) ovih riječi. Jednadžba f=c:r, Gdje S je konstanta odražava ovaj odnos u ograničenom smislu da c:r za postavljenu vrijednost r reproducira promatranu frekvenciju s velikom aproksimacijom. Veza između f I r, izražena matematičkom formulom, model je odnosa između opaženih vrijednosti učestalosti uporabe i ranga, odnosno ranga, riječi. Ovo je jedan od slučajeva matematičkog modeliranja. 

Cjelokupna teorija informacija u potpunosti se temelji na matematičkom modelu komunikacijskog procesa koji je razvio C. Shannon 108 . Definira se kao "matematička disciplina posvećena metodama izračunavanja i procjene količine informacija sadržanih u bilo kojem podatku, te proučavanju procesa pohranjivanja i prijenosa informacija" (TSB, sv. 51, str. 128). Sukladno tome osnovni pojmovi informacijske teorije dobivaju matematički izraz.Informacija se mjeri u binitima ili binarnim jedinicama (kod, koji se uspoređuje s jezikom, s dva uvjetna jednako vjerojatna signala prenosi jednu binarnu jedinicu informacije tijekom prijenosa svakog znaka ).-ili kod i prosječna količina prenesene informacije<142>formacije. Redundancija se izražava kao postotak ukupne sposobnosti prijenosa koda”, 1 09 itd. Na isti način, strojno prevođenje zahtijeva algoritamski razvoj preslikavanja elemenata jednog jezika u drugi itd. 1 10 . Ovo su drugi slučajevi modeliranja.

Upotreba besmislenih modela može biti od vrlo značajne pomoći, po svoj prilici, osobito u rješavanju problema koje primijenjena lingvistika postavlja pred sebe. Međutim, za teorijsku lingvistiku vrlo je važno da apstraktni model u pravilu ne reproducira sva obilježja stvarne pojave, sve njezine funkcionalne kvalitete. Dakle, arhitekt prije gradnje kuće može izraditi svoj model koji do najsitnijih detalja reproducira kuću koja se projektira, a to mu pomaže u rješavanju brojnih praktičnih pitanja vezanih uz izgradnju same kuće. Ali takav model kuće, ma koliko točan bio, lišen je te "funkcije" i one svrhe za koju su sve kuće općenito građene - nije u stanju pružiti čovjeku stan. Slična je situacija i s jezikom, gdje model nije uvijek u stanju reproducirati sve njegove kvalitete. U ovom slučaju stvar je dodatno komplicirana činjenicom da se za izradu modela ne koriste lingvistički, već matematički kriteriji. “Matematički modeli... - piše A. Ettinger, - igraju iznimno važnu ulogu u svim područjima tehnologije, ali budući da su alat za sintezu, njihovo je značenje za lingvistiku, koja je primarno povijesna i deskriptivna disciplina, prirodno ograničeno. ” 1 11 .<143>

Matematičko modeliranje jezika zapravo je primjenjivo samo na njegovo statično stanje, koje je za jezikoslovca uvjetovano i zapravo je u izravnoj suprotnosti s osnovnom kvalitetom jezika, čiji je sam oblik postojanja razvoj. Razumije se da statično proučavanje jezika nipošto nije isključeno iz lingvistike i da je temelj za izradu normativnih gramatika i rječnika, deskriptivnih gramatika, praktičnih gramatika i rječnika koji služe kao vodič za praktično učenje stranih jezika itd. Međutim, u svim takvim radovima, koji su pretežno primijenjene naravi, jezikoslovci svjesno ograničavaju područje istraživanja i nipošto ne zatvaraju oči pred drugim aspektima jezika 1 12 . Osobito statičkim ispitivanjem jezika posve nestaju takve kvalitete jezika povezane s njegovom dinamičkom prirodom, kao što su produktivnost, ovisnost o oblicima mišljenja i opsežna interakcija s kulturnim, društvenim, političkim, povijesnim i drugim čimbenicima. vidno polje istraživača. Samo na sinkronijskom planu jezik se može smatrati sustavom konvencionalnih znakova ili kodova, što se, međutim, pokazuje posve neopravdanim čim zauzmemo dinamičko gledište prikladnije za jezik. U procesu razvoja dolazi do jezičnih kvaliteta kao što su motiviranost, višeznačnost riječi koje nemaju stabilne granice, neautonomnost značenja riječi i njezine zvučne ljuske te tvorbeni potencijal riječi povezan s kontekstom. očituje se, a sve je to u oštroj suprotnosti s glavnim karakteristikama koda ili znaka 1 13 . Očito, u primijenjenoj lingvistici također se može razmišljati o svim tim kvalitetama jezika i, u praktične svrhe, zadovoljiti se, da tako kažemo, "snimkom" jezika, koja još uvijek može dati prilično približnu ideju o mehanizam njegovog funkcioniranja.<144>nirovaniya. Međutim, svaki takav "snimak", ako se smatra činjenicom jezika, a ne činjenicom sustava konvencionalnih kodova, mora biti uključen u beskrajni proces kretanja u kojem jezik uvijek postoji 1 14 . Ne može se proučavati izvan onih specifičnih uvjeta koji karakteriziraju ovo kretanje, što ostavlja traga na danom stanju jezika i određuje potencijal za njegov daljnji razvoj. Ovdje postoji ista razlika kao između trenutne fotografije osobe i njenog portreta naslikanog kistom pravog umjetnika. U umjetnikovu djelu pred sobom imamo generalizirajuću sliku čovjeka u svoj originalnosti ne samo njegova tjelesnog izgleda, već i njegova unutarnjeg duhovnog sadržaja. Iz umjetničkog portreta možemo iščitati i prošlost osobe koja je na njemu prikazana i utvrditi za što je sposoban u svojim postupcima. A snimka, iako može dati točniju sliku izgleda originala, lišena je tih svojstava i često bilježi i slučajni prištić koji je skočio na nosu i<145>potpuno nesvojstvenu pozu ili izraz, što u konačnici dovodi do iskrivljavanja izvornika.

Valja napomenuti da se metoda "snimki" može, naravno, primijeniti na činjenice razvoja jezika. Ali u ovom slučaju, zapravo ćemo se baviti samo odvojenim stanjima jezika, koja se u svojoj kvantitativnoj karakterizaciji ispostavljaju ne više povezanim od usporedne kvantitativne karakterizacije različitih jezika. Ovakva kvantitativna "dinamika" neće sadržavati ništa organsko, a veza između pojedinih stanja jezika počivat će samo na usporedbi brojčanih odnosa. Ako iu ovom slučaju pribjegnemo analogiji, onda se možemo pozvati na rast djeteta. Njegov se razvoj, naravno, može prikazati u obliku dinamike brojčanih podataka o njegovoj težini, visini, promjenjivim omjerima volumena dijelova njegova tijela, ali svi su ti podaci apsolutno odvojeni od svega onoga što primarno čini individualnu bit. osobe - njezin karakter, sklonosti, navike. , okusi itd.

Druga negativna strana matematičkog "modeliranja" jezika jest činjenica da ono ne može poslužiti kao opće načelo na temelju kojega je moguće izvršiti cjelovit i obuhvatan - sustavan opis jezika. Samo matematički pristup pojavama jezika, na primjer, neće omogućiti odgovor ni na tako temeljna pitanja (bez kojih je nezamislivo postojanje znanosti o jeziku), kao što su: što je jezik, što bi fenomeni trebali biti klasificiran kao pravi lingvistički, kako se definira riječ ili rečenica, koji su osnovni pojmovi i kategorije jezika, itd. Prije nego što se okrenemo matematičkim metodama proučavanja jezika, potrebno je već imati odgovore (čak iu obliku radnog hipoteza) na sva ta pitanja unaprijed. Ne treba zatvarati oči pred činjenicom da su u svim nama poznatim slučajevima proučavanja jezičnih pojava matematičkim metodama svi ti pojmovi i kategorije neizbježno morali biti prihvaćeni onako kako su definirani tradicionalnim ili, relativno rečeno, kvalitativne metode.

Ovu značajku matematičkih metoda u njihovoj lingvističkoj primjeni primijetio je Spang-Hanssen kada je pi<146>sal: “Treba imati na umu da promatrane činjenice koje dobivaju kvantitativni izraz ... nemaju nikakvu vrijednost ako ne čine dio opisa, a za lingvističke svrhe to bi trebao biti sustavni opis, usko povezan s kvalitativnim jezičnim opis i teorija” 1 15 . U drugom Spang-Hanssenovom govoru nalazimo pojašnjenje ove ideje: “Sve dok se ne dokaže mogućnost konstruiranja kvantitativnog sustava, i sve dok postoji općeprihvaćeni kvalitativni sustav za dano područje proučavanja, izračuni učestalosti i drugi numeričke karakteristike s lingvističkog gledišta vizije nemaju nikakvog smisla" 1 16 . Slične ideje iznosi i Uldall, pomalo neočekivano povezujući ih s razvojem općih teorijskih temelja glosematike: “Kad lingvist razmatra ili mjeri sve što razmatra i mjeri, ono samo po sebi nije kvantitativno određeno; na primjer, riječi, kada se broje, definirane su, ako su uopće definirane, sasvim različitim terminima.<147>

Tako se ispostavlja da su matematičke metode iu teoretskom smislu iu svojoj praktičnoj primjeni izravno ovisne o lingvističkim pojmovima i kategorijama definiranim tradicionalnim, filološkim ili, kako je gore navedeno, kvalitativnim metodama. U smislu primijenjene lingvistike važno je uvidjeti tu ovisnost, a samim tim i upoznati se s ukupnošću glavnih kategorija tradicionalne lingvistike.

Istina, nema razloga zamjeriti predstavnicima egzaktnih znanosti koji rade na području primijenjene lingvistike što se ne koriste podacima suvremene lingvistike. To ne odgovara stvarnom stanju stvari. Oni ne samo da savršeno dobro poznaju, nego i naširoko koriste u svom radu sustave razlikovnih obilježja koje su uspostavili jezikoslovci, a koji su karakteristični za različite jezike, distribuciju i raspored jezičnih elemenata unutar pojedinih jezičnih sustava, dostignuća akustičke fonetike itd. Ali u ovom slučaju potrebna je vrlo značajna rezerva. Naime, predstavnici egzaktnih znanosti koriste se podacima samo jednog pravca u lingvistici - tzv. deskriptivne lingvistike, koja se namjerno odvojila od tradicionalnih problema teorijske lingvistike, daleko od toga da zahvati cjelokupno područje lingvističkog istraživanja, od pravog s lingvističkoga gledišta, ono ima znatne metodološke nedostatke, koji su ga doveli do nedavno otkrivene krize 1 18 , a štoviše, ima čisto praktičnu usmjerenost, koja odgovara interesima primijenjene lingvistike. Sve rezerve i prijekori koji su gore izneseni protiv statičkog razmatranja jezika primjenjivi su na deskriptivnu lingvistiku. Takav jednostran pristup deskriptivne lingvistike može, istraživač<148>No, to se može opravdati samo zadaćama koje si postavlja primijenjena lingvistika, ali ni izdaleka ne iscrpljuje cjelokupni sadržaj znanosti o jeziku.

U procesu razvoja pitanja primijenjene lingvistike mogu se pojaviti novi teorijski problemi, koji su se zapravo već pojavili. Neki od tih problema usko su povezani sa specifičnim zadaćama primijenjene lingvistike i usmjereni su na prevladavanje poteškoća koje se javljaju pri rješavanju tih problema. Ostali problemi izravno su povezani s teoretskom lingvistikom, omogućujući novu perspektivu tradicionalnih ideja ili otvarajući nova područja lingvističkih istraživanja, nove koncepte i teorije. Među ovim posljednjima, na primjer, problem je stvaranja "strojnog" jezika (ili jezika posrednika), koji je najuže povezan sa složenim skupom tako kardinalnih pitanja teorijske lingvistike kao što su odnos pojmova i leksičkih značenja, logika i gramatika, dijakronija i sinkronija, znakovna priroda jezika, bit jezičnog značenja, principi konstruiranja umjetnih jezika itd. 1 19 . U ovom slučaju posebno je važno uspostaviti međusobno razumijevanje i zajedništvo u zajedničkom radu predstavnika lingvističkih disciplina i egzaktnih znanosti. Što se tiče lingvističke strane, u ovom slučaju, po svemu sudeći, ne treba govoriti o tome da već unaprijed ograničavamo napore npr. dizajnera prevoditeljskih strojeva” i pokušavamo utvrditi radnu sposobnost takvih strojeva stihovima N. Gribačov ili proza ​​V. Kočetova 1 20 . Stroj će sam pronaći granice svojih mogućnosti, a isplativost - granice svoje upotrebe. Ali lingvisti, kao svoj doprinos zajedničkoj stvari, moraju unijeti svoje znanje o značajkama strukture jezika, njegovoj mnogostranosti, unutarnjim međusobnim odnosima njegovih elemenata, kao i širokim i višestranim vezama jezika s fizičkim, fiziološkim , mentalno i logično<149>mi fenomeni, specifični obrasci funkcioniranja i razvoja jezika. Cjelokupnost ovih znanja je neophodna dizajnerima odgovarajućih strojeva kako ne bi lutali u pogrešnim smjerovima, već kako bi potraga bila svrhovita i jasno usmjerena. Čak i vrlo kratki pregled slučajeva primjene matematičkih metoda na lingvističke probleme, koji je napravljen u ovom eseju, uvjerava da takvo znanje nipošto neće biti suvišno predstavnicima egzaktnih znanosti.

Na temelju svih navedenih razmatranja očito se može doći do nekih općih zaključaka.

Dakle, matematička lingvistika? Ako to znači korištenje matematičkih metoda kao univerzalnog ključa za rješavanje svih lingvističkih problema, onda takve tvrdnje treba priznati kao apsolutno neopravdane. Sve što je u tom smjeru učinjeno do sada je vrlo malo ili čak nimalo doprinijelo rješavanju tradicionalnih problema znanosti o jeziku. U najgorem slučaju, primjena matematičkih metoda je popraćena očitim apsurdima ili je, s jezičnog gledišta, apsolutno besmislena. U najboljem slučaju, matematičke metode mogu se koristiti kao pomoćne metode jezičnog istraživanja, stavljajući se u službu specifičnih i ograničenih jezičnih problema. Ni o kakvoj "kvantitativnoj filozofiji jezika" u ovom slučaju ne može biti riječi. Fizika, psihologija, fiziologija, logika, sociologija i etnologija u svoje su vrijeme zadirale u samostalnost znanosti o jeziku, ali nisu mogle podjarmiti lingvistiku. Dogodilo se upravo suprotno – lingvistika je iskoristila dostignuća tih znanosti i, u mjeri u kojoj je sebi bila potrebna, počela koristiti njihovu pomoć, obogaćujući tako arsenal svojih istraživačkih metoda. Sada je, očito, na red došla matematika. Za nadati se da će ova nova zajednica pridonijeti i jačanju znanosti o jeziku, poboljšanju njezinih metoda rada i povećanju njihove raznolikosti. Stoga je jednako legitimno govoriti o matematičkoj lingvistici kao o fizičkoj lingvistici, fiziološkoj lingvistici, logičkoj lingvistici, psihološkoj lingvistici i<150>itd. Takve lingvistike nema, postoji samo jedna lingvistika, koja se korisno služi podacima drugih znanosti kao pomoćnim istraživačkim oruđem. Dakle, nema razloga uzmicati pred naletom nove znanosti i olako joj prepuštati osvojene pozicije. Ovdje je vrlo prikladno prisjetiti se riječi A. Martineta: „Možda je primamljivo pridružiti se jednom ili drugom velikom pokretu misli korištenjem nekoliko dobro odabranih izraza ili nekom matematičkom formulom deklarirati strogost svog razmišljanja. No, došlo je vrijeme da lingvisti shvate neovisnost svoje znanosti i oslobode se tog kompleksa manje vrijednosti koji ih tjera da svako svoje djelovanje povezuju s ovim ili onim općim znanstvenim načelom, uslijed čega obrisi stvarnosti uvijek postaju samo nejasniji, umjesto da postane jasniji 21 .

Dakle, matematika po sebi i lingvistika po sebi. To nikako ne isključuje njihovu međusobnu pomoć ili prijateljski susret u zajedničkom radu na zajedničkim problemima. Ovakvo mjesto primjene zajedničkih napora dviju znanosti cijeli je široki spektar problema koji su dio primijenjene lingvistike i od velike su nacionalne gospodarske važnosti. Treba samo poželjeti da u zajedničkom radu obje znanosti pokažu maksimalno međusobno razumijevanje, što bi nedvojbeno pridonijelo i što većoj plodonosnosti njihove suradnje.<151>

Koliko košta pisanje vašeg rada?

Odaberite vrstu rada Diplomski rad (prvostupnik / specijalistički) Dio rada Magistarski rad Predmetni rad s vježbom Teorija predmeta Esej Esej Ispitni zadaci Atestni rad (VAR / WQR) Poslovni plan Ispitna pitanja MBA diplomski rad (fakultet / tehnička škola) Ostali predmeti Laboratorijski rad , RGR On-line pomoć Izvještaj s prakse Pretraživanje informacija Prezentacija u PowerPointu Sažetak poslijediplomskog studija Popratni materijali uz diplomu Članak Test Crteži više »

Hvala, poslana vam je e-pošta. Provjerite svoju poštu.

Želite li promotivni kod od 15% popusta?

Primi SMS
s promo kodom

Uspješno!

?Recite promotivni kod tijekom razgovora s upraviteljem.
Promo kod se može iskoristiti samo jednom pri prvoj narudžbi.
Vrsta promotivnog koda - " diplomski rad".

Interakcija matematike i lingvistike


Uvod

Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici

1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće

1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća

Poglavlje 2. Odabrani primjeri uporabe matematike u lingvistici

2.1. Strojno prevođenje

2.2. Statističke metode u učenju jezika

2.3. Učenje jezika metodama formalne logike

2.4. Perspektive primjene matematičkih metoda u lingvistici

Zaključak

Književnost

Dodatak 1. Ronald Schleifer. Ferdinand de Saussure

Dodatak 2. Ferdinand de Saussure (prijevod)

Uvod


U 20. stoljeću nastavlja se trend interakcije i prožimanja različitih područja znanja. Granice između pojedinih znanosti postupno se brišu; sve je više grana umne djelatnosti koje su "na spoju" humanitarnih, tehničkih i prirodoslovnih znanja.

Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga se sve veće mjesto, kako u znanstvenoj teoriji tako iu praksi, daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto “humanitarne”, proširujući njihov heuristički potencijal (odgovor na pitanje “koliko” često će pomoći odgovoriti na pitanja “što” i “kako”). Lingvistika nije bila iznimka.

Svrha mog kolegija je ukratko osvijetliti vezu između matematike i takve grane lingvistike kao što je lingvistika. Od 1950-ih, matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (i prirodnih i umjetnih). Međutim, treba reći da nije odmah pronašao takvu praktičnu primjenu za sebe. U početku su se matematičke metode u lingvistici počele koristiti kako bi se razjasnili temeljni pojmovi lingvistike, no razvojem računalne tehnologije takva teorijska postavka počela je nalaziti primjenu u praksi. Rješavanje takvih zadataka kao što su strojno prevođenje, strojno pronalaženje informacija, automatska obrada teksta zahtijevalo je temeljno novi pristup jeziku. Lingvisti su se suočili s pitanjem: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Pojam “matematička lingvistika”, koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici posljednjih godina smatraju da se sam izraz ne može uzdići u rang pojma, jer ne znači nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika . Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa čak i psihologiji. Čak je i Schlegel uočio interakciju jezika i svijesti, a Ferdinand de Saussure, istaknuti lingvist s početka dvadesetog stoljeća (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije), povezao je strukturu jezika s njegovom pripadnošću. ljudima. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) s osobitostima nacionalnog mentaliteta (više o tome u odjeljku 2.2, "Statističke metode u lingvistici").

Interakcija matematike i lingvistike je višestruka tema, au svom radu se neću zadržati na svim, već prije svega na njezinim primijenjenim aspektima.

Poglavlje I. Povijest primjene matematičkih metoda u lingvistici


1.1 Formiranje strukturne lingvistike na prijelazu iz XIX. u XX. stoljeće


Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja seže do poznatog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.

Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik - langue, govor - parole i govorna aktivnost - langage), u kojem se svaka riječ (član sustava) ne promatra sama za sebe. , ali u vezi s drugim članovima. Kao što je kasnije primijetio još jedan istaknuti lingvist, Danac Louis Hjelmslev, Saussure je "prvi zahtijevao strukturalni pristup jeziku, odnosno znanstveni opis jezika bilježenjem odnosa među jedinicama".

Shvaćajući jezik kao hijerarhijsku strukturu, Saussure je prvi postavio problem vrijednosti i značaja jezičnih jedinica. Zasebne pojave i događaje (recimo, povijest podrijetla pojedinih indoeuropskih riječi) ne treba proučavati same po sebi, već u sustavu u kojem su u korelaciji sa sličnim komponentama.

Saussure je strukturnom jedinicom jezika smatrao riječ "znak" u kojoj su spojeni zvuk i značenje. Nijedan od ovih elemenata ne postoji jedan bez drugoga: dakle, izvorni govornik shvaća različite nijanse značenja višeznačne riječi kao zaseban element u strukturnoj cjelini, u jeziku.

Tako se u teoriji F. de Saussurea može vidjeti interakcija lingvistike, s jedne strane, sa sociologijom i socijalnom psihologijom (treba napomenuti da se u isto vrijeme razvijaju Husserlova fenomenologija, Freudova psihoanaliza, Einsteinova teorija relativnosti). , odvijaju se eksperimenti s formom i sadržajem u književnosti, glazbi i likovnim umjetnostima), s druge strane s matematikom (pojam dosljednosti odgovara algebarskom pojmu jezika). Takav koncept promijenio je koncept jezične interpretacije kao takve: fenomeni se nisu počeli tumačiti u odnosu na uzroke njihova nastanka, već u odnosu na sadašnjost i budućnost. Tumačenje je prestalo biti neovisno o namjerama osobe (unatoč činjenici da namjere mogu biti neosobne, "nesvjesne" u frojdovskom smislu riječi).

Djelovanje jezičnog mehanizma očituje se kroz govornu aktivnost izvornih govornika. Rezultat govora su takozvani "ispravni tekstovi" - nizovi govornih jedinica koje se pokoravaju određenim obrascima, od kojih mnogi dopuštaju matematički opis. Teorija načina opisivanja sintaktičke strukture bavi se proučavanjem metoda matematičkog opisa ispravnih tekstova (prije svega rečenica). U takvoj se strukturi jezične analogije definiraju ne uz pomoć svojih inherentnih svojstava, već uz pomoć sustavnih (“strukturalnih”) odnosa.

Na Zapadu Saussureove ideje razvijaju mlađi suvremenici velikog švicarskog jezikoslovca: u Danskoj - od mene već spomenuti L. Hjelmslev, koji je dao povoda algebarskoj teoriji jezika u svom djelu "Osnove lingvističke teorije", god. SAD - E. Sapir, L. Bloomfield, C. Harris, u Češkoj - ruski znanstvenik-emigrant N. Trubetskoy.

Statističkim zakonitostima u proučavanju jezika počeo se baviti nitko drugi nego utemeljitelj genetike Georg Mendel. Tek 1968. godine filolozi su otkrili da je u posljednjim godinama života bio fasciniran proučavanjem jezičnih pojava matematičkim metodama. Mendel je ovu metodu donio u lingvistiku iz biologije; u 1990-ima samo su najhrabriji lingvisti i biolozi tvrdili da je takva analiza izvediva. U arhivu samostana sv. Tomasza u Brnu, čiji je opat bio Mendel, pronađeni su listovi sa stupcima prezimena koja su završavala na "mann", "bauer", "mayer", te s nekim razlomcima i izračunima. Nastojeći otkriti formalne zakonitosti nastanka obiteljskih imena, Mendel izvodi složene proračune, u kojima uzima u obzir broj samoglasnika i suglasnika u njemačkom jeziku, ukupan broj riječi koje razmatra, broj prezimena, itd.

Kod nas se strukturalna lingvistika počela razvijati otprilike u isto vrijeme kad i na Zapadu - na prijelazu iz 19. u 20. stoljeće. Istodobno s F. de Saussureom, koncept jezika kao sustava razvili su u svojim radovima profesori Sveučilišta u Kazanu F.F. Fortunatov i I.A. Baudouin de Courtenay. Potonji se dugo dopisivao s de Saussureom, odnosno ženevska i kazanska škola lingvistike surađivale su jedna s drugom. Ako se Saussurea može nazvati ideologom "egzaktnih" metoda u lingvistici, onda je Baudouin de Courtenay postavio praktične temelje za njihovu primjenu. Prvi je odvojio lingvistiku (kao egzaktnu znanost koja se koristi statističkim metodama i funkcionalnom ovisnošću) od filologije (zajednice humanitarnih disciplina koje proučavaju duhovnu kulturu kroz jezik i govor). Sam znanstvenik vjerovao je da "lingvistika može biti korisna u bliskoj budućnosti, samo oslobođena obveznog sjedinjenja s filologijom i književnom poviješću" . Fonologija je postala "poligon" za uvođenje matematičkih metoda u lingvistiku - glasovi kao "atomi" jezičnog sustava, s ograničenim brojem lako mjerljivih svojstava, bili su najprikladniji materijal za formalne, rigorozne metode opisa. Fonologija negira postojanje značenja u zvuku, pa je "ljudski" faktor eliminiran u studijama. U tom smislu, fonemi su poput fizičkih ili bioloških objekata.

Fonemi, kao najmanji jezični elementi prihvatljivi za percepciju, predstavljaju zasebnu sferu, zasebnu "fenomenološku stvarnost". Na primjer, u engleskom se glas "t" može različito izgovoriti, ali u svim slučajevima osoba koja govori engleski će ga percipirati kao "t". Glavna stvar je da će fonem obavljati svoju glavnu - smislenu - funkciju. Štoviše, razlike među jezicima su takve da varijante jednog glasa u jednom jeziku mogu odgovarati različitim fonemima u drugom; na primjer, "l" i "r" u engleskom su različiti, dok su u drugim jezicima varijante istog fonema (poput engleskog "t", izgovorenog sa ili bez aspiracije). Ogromni rječnik svakog prirodnog jezika skup je kombinacija mnogo manjeg broja fonema. U engleskom se, primjerice, samo 40 fonema koristi za izgovor i pisanje oko milijun riječi.

Zvukovi jezika su sustavno organiziran skup značajki. U 1920-im i 1930-im godinama, nakon Saussurea, Jacobson i N.S. Trubetskoy izdvojili su "odlike" fonema. Ove značajke temelje se na strukturi organa govora - jezika, zuba, glasnica. Na primjer, u engleskom jeziku razlika između "t" i "d" je prisutnost ili odsutnost "glasa" (napetost glasnica) i razina glasa koja razlikuje jedan fonem od drugog. Stoga se fonologija može smatrati primjerom općeg jezičnog pravila koje je opisao Saussure: "Postoje samo razlike u jeziku". Još važnije nije ovo: razlika obično implicira točne uvjete između kojih se nalazi; ali u jeziku postoje samo razlike bez preciznih uvjeta. Bilo da se radi o "označavanju" ili "označenom" - u jeziku nema niti pojmova niti glasova koji bi postojali prije razvoja jezičnog sustava.

Tako se u saussureovskoj lingvistici proučavani fenomen shvaća kao skup usporedbi i opreka jezika. Jezik je i izraz značenja riječi i sredstvo komunikacije, a te se dvije funkcije nikad ne podudaraju. Možemo primijetiti izmjenu oblika i sadržaja: jezični kontrasti definiraju njegove strukturne jedinice, a te jedinice međusobno djeluju kako bi stvorile određeni smisleni sadržaj. Budući da su elementi jezika slučajni, ni kontrast ni kombinacija ne mogu biti osnova. To znači da u jeziku razlikovna obilježja tvore fonetski kontrast na različitoj razini razumijevanja, fonemi se spajaju u morfeme, morfemi u riječi, riječi u rečenice itd. U svakom slučaju cijeli fonem, riječ, rečenica itd. je više od pukog zbroja svojih dijelova.

Saussure je predložio ideju nove znanosti dvadesetog stoljeća, odvojene od lingvistike, koja proučava ulogu znakova u društvu. Saussure je ovu znanost nazvao semiologijom (od grčkog "semeon" - znak). "Znanost" semiotike, koja se razvila u Istočnoj Europi 1920-ih-1930-ih iu Parizu 1950-1960-ih, proširila je proučavanje jezika i jezičnih struktura na književna otkrića sastavljena (ili artikulirana) u terminima tih struktura. Osim toga, Saussure se u sumraku svoje karijere, usporedo s kolegijem opće lingvistike, bavio "semiotičkom" analizom kasnorimske poezije, pokušavajući otkriti namjerno sastavljene anagrame vlastitih imena. Ta je metoda u mnogočemu bila suprotna racionalizmu u svojoj lingvističkoj analizi: bila je to pokušaj da se u sustavu prouči problem "vjerojatnosti" u jeziku. Takvo istraživanje pomaže usredotočiti se na "pravu stranu" vjerojatnosti; "ključna riječ" za koju Saussure traži anagram je, prema Jeanu Starobinskom, "oruđe za pjesnika, a ne izvor života pjesme". Pjesma služi za zamjenu glasova ključne riječi. Prema Starobinskom, u ovoj analizi "Saussure se ne upušta u potragu za skrivenim značenjima". Naprotiv, u njegovim je djelima primjetna težnja za izbjegavanjem pitanja vezanih uz svijest: “budući da se poezija ne izražava samo riječima, nego i onim što te riječi pokreću, ona nadilazi kontrolu svijesti i ovisi samo o zakoni jezika” (vidi . Dodatak 1).

Saussureov pokušaj proučavanja vlastitih imena u kasnorimskoj poeziji naglašava jednu od sastavnica njegove jezične analize – proizvoljnu prirodu znakova, kao i formalnu bit Saussureove lingvistike koja isključuje mogućnost analize značenja. Todorov zaključuje da se danas čini da su Saussureovi radovi krajnje dosljedni u svojoj nevoljkosti da proučavaju simbole fenomena koji imaju jasno definirano značenje [Dodatak 1]. Istražujući anagrame, Saussure obraća pažnju samo na ponavljanje, ali ne i na prethodne opcije. . . . Proučavajući Nibelungenlied, on definira simbole samo da bi ih pripisao pogrešnim čitanjima: ako su nenamjerna, simboli ne postoje. Uostalom, u svojim spisima o općoj lingvistici, on iznosi pretpostavku o postojanju semiologije koja opisuje ne samo jezične znakove; ali ta je pretpostavka ograničena činjenicom da semiologija može opisati samo slučajne, proizvoljne znakove.

Ako je to doista tako, to je samo zato što nije mogao zamisliti "namjeru" bez objekta; nije mogao do kraja premostiti jaz između forme i sadržaja – u njegovim se spisima to pretvorilo u pitanje. Umjesto toga, okrenuo se "jezičnom legitimitetu". Između, s jedne strane, devetnaestostoljetnih koncepata temeljenih na povijesti i subjektivnim nagađanjima, te metoda nasumičnog tumačenja temeljenih na tim konceptima, i, s druge strane, strukturalističkih koncepata koji brišu suprotnost između forme i sadržaja (subjekta i objekta), značenja i podrijetla u strukturalizmu, psihoanalizi, pa čak i kvantnoj mehanici, spisi Ferdinanda de Saussurea o lingvistici i semiotici označavaju prekretnicu u proučavanju značenja u jeziku i kulturi.

Ruski su znanstvenici također bili zastupljeni na Prvom međunarodnom kongresu lingvista u Haagu 1928. godine. S. Kartsevsky, R. Yakobson i N. Trubetskoy napravili su izvješće u kojem su ispitali hijerarhijsku strukturu jezika - u duhu najsuvremenijih ideja s početka prošlog stoljeća. Jakobson je u svojim spisima razvio Saussureove ideje da osnovne elemente jezika treba proučavati, prije svega, u vezi s njihovim funkcijama, a ne s razlozima njihova nastanka.

Nažalost, nakon što je Staljin došao na vlast 1924., ruska lingvistika je, kao i mnoge druge znanosti, vraćena unatrag. Mnogi talentirani znanstvenici bili su prisiljeni emigrirati, protjerani iz zemlje ili umrli u logorima. Tek sredinom 1950-ih postao je moguć određeni pluralizam teorija — više o tome u odjeljku 1.2.


1.2 Primjena matematičkih metoda u lingvistici u drugoj polovici dvadesetog stoljeća


Do sredine dvadesetog stoljeća formirale su se četiri svjetske lingvističke škole, od kojih se svaka pokazala rodonačelnikom određene "egzaktne" metode. Lenjingradska fonološka škola (njezin je predak bio učenik Baudouina de Courtenaya L.V. Shcherba) koristila je psiholingvistički eksperiment temeljen na analizi govora izvornih govornika kao glavni kriterij za generalizaciju zvuka u obliku fonema.

Znanstvenici Praškog lingvističkog kruga, posebno njegov osnivač N.S. Trubetskoy, koji je emigrirao iz Rusije, razvio je teoriju opozicija - semantičku strukturu jezika opisali su kao skup opozicijski izgrađenih semantičkih jedinica - Sem. Ova je teorija primijenjena u proučavanju ne samo jezika, već i umjetničke kulture.

Ideolozi američkog deskriptivizma bili su lingvisti L. Bloomfield i E. Sapir. Jezik je deskriptivistima predstavljen kao skup govornih iskaza, koji su bili glavni predmet njihova proučavanja. Njihov fokus bio je na pravilima znanstvenog opisa (otuda i naziv) tekstova: proučavanje organizacije, rasporeda i klasifikacije njihovih elemenata. Formalizacija analitičkih postupaka u području fonologije i morfologije (razvoj načela za proučavanje jezika na različitim razinama, distributivna analiza, metoda izravnih sastavnica itd.) dovela je do formuliranja općih pitanja jezičnog modeliranja. Nebriga za plan sadržaja jezika, kao i za paradigmatsku stranu jezika, nije dopuštala deskriptivistima da dovoljno cjelovito protumače jezik kao sustav.

Šezdesetih godina prošlog stoljeća razvila se teorija formalnih gramatika, koja je nastala uglavnom zahvaljujući radu američkog filozofa i lingvista N. Chomskog. S pravom se smatra jednim od najpoznatijih modernih znanstvenika i javnih osoba, posvećeni su mu mnogi članci, monografije, pa čak i cjelovečernji dokumentarni film. Po imenu temeljno novog načina opisivanja sintaktičke strukture koju je izumio Chomsky - generativne (generativne) gramatike - odgovarajući trend u lingvistici nazvan je generativizam.

Chomsky, potomak imigranata iz Rusije, studirao je lingvistiku, matematiku i filozofiju na Sveučilištu u Pennsylvaniji od 1945. godine, pod jakim utjecajem svog učitelja Zeliga Harrisa - kao i Harris, Chomsky je svoje političke stavove smatrao i još uvijek smatra bliskima anarhizmu (još uvijek je poznat kao kritičar postojećeg američkog političkog sustava i kao jedan od duhovnih vođa antiglobalizma).

Chomskyjev prvi veliki znanstveni rad, njegov magistarski rad Morfologija modernog hebrejskog (1951.), ostao je neobjavljen. Chomsky je doktorirao na Sveučilištu u Pennsylvaniji 1955., no veliki dio istraživanja na kojem se temelji njegova disertacija (objavljena u cijelosti tek 1975. pod naslovom Logička struktura lingvističke teorije) i njegova prva monografija, Sintaktičke strukture (1957., rus. trans. 1962), izvedena je na Sveučilištu Harvard 1951.-1955. Iste 1955. godine znanstvenik se preselio na Tehnološki institut u Massachusettsu, gdje je 1962. godine postao profesor.

Chomskyjeva teorija prošla je kroz nekoliko faza u svom razvoju.

U prvoj monografiji "Sintaktičke strukture" znanstvenik je predstavio jezik kao mehanizam za generiranje beskonačnog niza rečenica pomoću konačnog skupa gramatičkih sredstava. Kako bi opisao jezična svojstva, predložio je koncepte dubinskih (skrivenih od izravne percepcije i generiranih sustavom rekurzivnih, tj. pravila koja se mogu ponavljati) i površinskih (izravno percipiranih) gramatičkih struktura, kao i transformacije koje opisuju prijelaz od dubinskih struktura do površinskih. Nekoliko površinskih struktura može odgovarati jednoj dubinskoj strukturi (primjerice, pasivna konstrukcija Ukaz potpisuje predsjednik proizlazi iz iste duboke strukture kao i aktivna konstrukcija predsjednik potpisuje dekret) i obrnuto (primjerice, višeznačnost Majka voli kći opisuje se kao rezultat podudarnosti površinskih struktura koje sežu u dvije različite dubine, u jednoj od kojih je majka ona koja voli kćer, a u drugoj ona koju kći voli).

Chomskyjevom standardnom teorijom smatra se model "Aspekti" postavljen u Chomskyjevoj knjizi "Aspekti teorije sintakse". U ovom su modelu po prvi put pravila semantičke interpretacije uvedena u formalnu teoriju, pripisujući značenje dubokim strukturama. U Aspektima se jezična kompetencija suprotstavlja upotrebi jezika (izvedbi), usvaja se tzv. Katz-Postalova hipoteza o očuvanju značenja tijekom transformacije, u vezi s kojom se isključuje koncept neobvezne transformacije, a aparatura uvode se sintaktička obilježja koja opisuju leksičku spojivost.

Sedamdesetih godina prošlog stoljeća Chomsky je radio na teoriji upravljanja i obvezivanja (GB-teorija – od riječi vlada i obvezujući) – općenitijoj od prethodne. U njemu je znanstvenik napustio specifična pravila koja opisuju sintaktičke strukture određenih jezika. Sve transformacije zamijenjene su jednom univerzalnom transformacijom poteza. U okviru GB teorije postoje i privatni moduli od kojih je svaki odgovoran za svoj dio gramatike.

Već nedavno, 1995. godine, Chomsky je iznio minimalistički program, gdje se ljudski jezik opisuje kao strojni jezik. To je samo program, a ne model ili teorija. U njemu Chomsky identificira dva glavna podsustava ljudskog jezičnog aparata: leksikon i računalni sustav, kao i dva sučelja - fonetsko i logičko.

Chomskyjeve formalne gramatike postale su klasične za opisivanje ne samo prirodnih već i umjetnih jezika - posebno programskih jezika. Razvoj strukturalne lingvistike u drugoj polovici 20. stoljeća s pravom se može smatrati "Chomskijevskom revolucijom".

Moskovska fonološka škola, čiji su predstavnici bili A.A. Reformatsky, V.N. Sidorov, P.S. Kuznjecov, A.M. Suhotin, R.I. Avanesov, koristio je sličnu teoriju za proučavanje fonetike. Postupno se počinju primjenjivati ​​"egzaktne" metode ne samo u fonetici, već iu sintaksi. I lingvisti i matematičari, kod nas i u inozemstvu, počinju proučavati strukturu jezika. Pedesetih i šezdesetih godina prošlog stoljeća u SSSR-u je započela nova faza u interakciji između matematike i lingvistike, povezana s razvojem sustava za strojno prevođenje.

Poticaj za početak ovih radova u našoj zemlji bila su prva dostignuća u području strojnog prevođenja u Sjedinjenim Državama (iako je prvi uređaj za mehanizirano prevođenje P.P. Smirnov-Troyansky izumljen u SSSR-u 1933., on je, budući da je primitivan, nije postalo široko rasprostranjeno). Godine 1947. A. Butt i D. Britten smislili su kod za prijevod riječ po riječ pomoću računala, a godinu dana kasnije R. Richens predložio je pravilo za dijeljenje riječi na korijene i završetke u strojnom prijevodu. Te su godine bile dosta drugačije od današnjih. Bili su to vrlo veliki i skupi strojevi koji su zauzimali cijele prostorije i zahtijevali veliki broj inženjera, operatera i programera za njihovo održavanje. Uglavnom, ta su računala služila za izvođenje matematičkih proračuna za potrebe vojnih institucija - novosti u matematici, fizici i tehnici služile su, prije svega, vojnim poslovima. U ranim fazama razvoj MP-a aktivno je podržavala vojska, dok se (u uvjetima hladnog rata) u SAD-u razvijao rusko-engleski, a u SSSR-u anglo-ruski smjer.

U siječnju 1954. na Tehničkom sveučilištu Massachusetts održan je eksperiment Georgetown, prva javna demonstracija prijevoda s ruskog na engleski na stroju IBM-701. Sažetak poruke o uspješnom prolazu eksperimenta, napravio D.Yu. Panov, pojavio se u RJ "Matematika", 1954., br. 10: "Prijevod s jednog jezika na drugi pomoću stroja: izvješće o prvom uspješnom ispitu."

Da bi rad na strojnom prevođenju. Do kraja 1955. godine datira prvo iskustvo prevođenja s engleskog na ruski uz pomoć stroja BESM. Programe za BESM sastavio je N.P. Trifonov i L.N. Korolev, čija je doktorska disertacija bila posvećena metodama za izradu rječnika za strojno prevođenje.

Paralelno se radilo na strojnom prevođenju na Odjelu za primijenjenu matematiku Matematičkog instituta Akademije znanosti SSSR-a (sada Institut za primijenjenu matematiku M.V. Keldysh Ruske akademije znanosti). Na inicijativu matematičara A.A. Ljapunov. Uključio je O.S. Kulagin i njezini učenici T.D. Wentzel i N.N. Ricco. Ideje Ljapunova i Kulagine o mogućnosti korištenja tehnologije za prevođenje s jednog jezika na drugi objavljene su u časopisu Nature, 1955., br. 8. Od kraja 1955. T.N. Moloshnaya, koji je tada započeo samostalan rad na englesko-ruskom algoritmu prijevoda.

R. Frumkina, koja se u to vrijeme bavila algoritmom prijevoda sa španjolskog, prisjeća se da je u ovoj fazi rada bilo teško poduzeti bilo kakve dosljedne korake. Puno sam češće morao slijediti heurističko iskustvo – svoje ili kolega.

Međutim, prva generacija sustava strojnog prevođenja bila je vrlo nesavršena. Svi su se temeljili na algoritmima sekvencijalnog prevođenja "riječ po riječ", "fraza po fraza" - semantičke veze između riječi i rečenica nisu uzete u obzir ni na koji način. Na primjer, možemo navesti rečenice: “John je tražio svoju kutiju za igračke. Napokon ga je pronašao. Kutija je bila u olovci. John je bio jako sretan. (John je tražio svoju kutiju za igračke. Napokon ju je našao. Kutija je bila u igralištu. John je bio jako sretan.)” "Olovka" u ovom kontekstu nije "olovka" (alat za pisanje), već "olovka" (olovka za igru). Poznavanje sinonima, antonima i figurativnih značenja teško je unijeti u računalo. Obećavajući smjer bio je razvoj računalnih sustava usmjerenih na korištenje ljudskog prevoditelja.

S vremenom su sustavi izravnog prevođenja zamijenjeni T-sustavima (od engleske riječi "transfer" - transformacija), u kojima se prijevod provodio na razini sintaktičkih struktura. Algoritmi T-sustava koristili su mehanizam koji je omogućio izgradnju sintaktičke strukture prema gramatičkim pravilima jezika ulazne rečenice (slično kao što se strani jezik uči u srednjoj školi), a zatim sintetizirati izlaznu rečenicu preoblikovanjem sintaktičke strukture i zamjenom potrebnih riječi iz rječnika.

Ljapunov je govorio o prijevodu tako da izvlači značenje prevedenog teksta i prikazuje ga na drugom jeziku. Pristup izgradnji sustava za strojno prevođenje koji se temelji na dobivanju semantičkog prikaza ulazne rečenice semantičkom analizom i sintezom ulazne rečenice prema dobivenom semantičkom prikazu još uvijek se smatra najsavršenijim. Takvi se sustavi nazivaju I-sustavi (od riječi "interlingua"). No, zadatak njihova stvaranja, postavljen kasnih 50-ih i ranih 60-ih, do danas nije u potpunosti riješen, unatoč naporima Međunarodne federacije IFIP-a, svjetske zajednice znanstvenika u području obrade informacija.

Znanstvenici su razmišljali o tome kako formalizirati i izgraditi algoritme za rad s tekstovima, koje rječnike treba unijeti u stroj, koje lingvističke obrasce treba koristiti u strojnom prevođenju. Tradicionalna lingvistika nije imala takve ideje – ne samo u smislu semantike, nego ni u smislu sintakse. U to vrijeme nije bilo popisa sintaktičkih konstrukcija za bilo koji jezik, nisu proučavani uvjeti njihove kompatibilnosti i zamjenjivosti, nisu razvijena pravila za izgradnju velikih jedinica sintaktičke strukture od manjih sastavnih elemenata.

Potreba za stvaranjem teorijskih temelja strojnog prevođenja dovela je do formiranja i razvoja matematičke lingvistike. Vodeću ulogu u ovom pitanju u SSSR-u odigrali su matematičari A.A. Ljapunov, O.S. Kulagina, V.A. Uspenski, lingvisti V.Yu. Rosenzweig, P.S. Kuznjecov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulagina je disertacija bila posvećena proučavanju formalne teorije gramatika (istodobno s N. Khomskim u SAD-u), Kuznjecov je iznio zadatak aksiomatizacije lingvistike, koji seže do radova F.F. Fortunatov.

Dana 6. svibnja 1960. godine donesena je Uredba Prezidija Akademije znanosti SSSR-a "O razvoju strukturnih i matematičkih metoda za proučavanje jezika", au Institutu za lingvistiku i Institutu za lingvistiku stvoreni su odgovarajući odjeli. ruski jezik. Od 1960. godine, na vodećim humanitarnim sveučilištima u zemlji - filološkom fakultetu Moskovskog državnog sveučilišta, Lenjinrad, sveučilištima u Novosibirsku, Moskovskom državnom institutu za strane jezike - započela je obuka u području automatske obrade teksta.

Međutim, radovi strojnog prevođenja iz ovog razdoblja, nazvani "klasični", više su od teorijskog nego praktičnog interesa. Isplativi sustavi za strojno prevođenje počeli su se stvarati tek osamdesetih godina prošlog stoljeća. O tome ću govoriti kasnije u odjeljku 2.1, Strojno prevođenje.

1960-ih i 70-ih godina uključuje duboki teorijski razvoj koristeći metode teorije skupova i matematičke logike, kao što su teorija polja i teorija neizrazitih skupova.

Autor teorije polja u lingvistici bio je sovjetski pjesnik, prevoditelj i lingvist V.G. Admoni. Svoju je teoriju u početku razvio na temelju njemačkog jezika. Za Admonija, koncept "polja" označava proizvoljan neprazan skup jezičnih elemenata (na primjer, "leksičko polje", "semantičko polje").

Struktura polja je heterogena: sastoji se od jezgre, čiji elementi imaju kompletan skup značajki koje definiraju skup, i periferije, čiji elementi mogu imati obje značajke danog skupa (ne sve) i susjednih. Dat ću primjer koji ilustrira ovu tvrdnju: na primjer, u engleskom jeziku polje složenica ("day-dream" - "dream" teško je odvojiti od polja fraza ("tear gas" - "tear gas")) .

Već spomenuta teorija neizrazitih skupova usko je povezana s teorijom polja. U SSSR-u su lingvisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, međutim, njezin je predak bio američki matematičar L. Zadeh, koji je 1965. objavio članak “Fuzzy Logic”. Dajući matematičko obrazloženje teorije neizrazitih skupova, Zade ih je razmatrao na temelju lingvističke građe.

U ovoj teoriji ne govorimo toliko o pripadnosti elemenata danom skupu (AOa), koliko o stupnju te pripadnosti (mAOa), budući da periferni elementi mogu pripadati nekoliko polja u jednom ili drugom stupnju. Zade (Lofti-zade) je bio porijeklom iz Azerbejdžana, do svoje 12. godine imao je praksu komuniciranja na četiri jezika - azerbejdžanskom, ruskom, engleskom i perzijskom - i koristio je tri različita pisma: ćirilicu, latinicu, arapski. Kada znanstvenika pitaju što je zajedničko između teorije neizrazitih skupova i lingvistike, on ne poriče tu vezu, ali pojašnjava: “Nisam siguran da je proučavanje ovih jezika imalo velik utjecaj na moje razmišljanje. Ako je to bio slučaj, onda samo podsvjesno. Zadeh je u mladosti studirao u prezbiterijanskoj školi u Teheranu, a nakon Drugog svjetskog rata emigrirao je u SAD. “Nije pitanje jesam li ja Amerikanac, Rus, Azerbajdžanac ili što već”, rekao je.

Slični sažeci:

Jezik i govor kao jedan od temeljnih problema stilistike. Pojam fonema i fonološke razine. Pojam jezika kao sustava i razine jezičnog sustava. Pojam morfema i njihove vrste. Rečenica kao sintaktička jedinica teksta. Znakovi jezičnog sustava.


Vrh