Povijest primjene matematičkih metoda u lingvistici. Perspektive primjene matematičkih metoda u lingvistici

Prodor u lingvistiku matematičke metode a »matematički duh« pridonio je razvoju lingvistike u smjeru točnosti i objektivnosti. Međutim, na svom putu daljnji razvoj postoje ozbiljne prepreke u tom pravcu. Autor promišlja o razlozima konvergencije lingvistike i matematike, o granicama primjenjivosti matematičkih metoda u lingvistici te o prirodi čimbenika koji sprječavaju međusobno razumijevanje matematičara i lingvista.

Kada su u drugoj polovici 1950-ih neki mladi lingvisti razmišljali o primjeni matematičkih metoda za proučavanje strukture jezika i počeli surađivati ​​s matematičarima, to je izazvalo iznenađenje, pa čak i šok kod mnogih njihovih kolega - uostalom, bili su uvjereni iz djetinjstva koje humanitarne znanosti, od kojih je jedna lingvistika, nemaju i ne mogu imati ništa zajedničko s matematikom i ostalim "egzaktnim" znanostima.

U međuvremenu, postojanje bliske veze između prirodnog jezika i matematike nije bilo uopće novo otkriće u to vrijeme. L. S. Vigotski je u svojoj knjizi “Mišljenje i govor” objavljenoj 1934. napisao: “Prvi koji je u matematici vidio mišljenje koje potječe iz jezika, ali ga nadilazi, bio je, po svemu sudeći, Descartes” i nastavio: “Naša uobičajena kolokvijalni zbog svojih inherentnih fluktuacija i nedosljednosti gramatike i psihologije, ona je u stanju pokretne ravnoteže između ideala matematičke i fantastične harmonije iu neprekidnom kretanju, koje nazivamo evolucija.

Nastajanje u Drevna grčka nauk o gramatičkim kategorijama već je bio opis niza najvažnijih aspekata strukture jezika uz pomoć apstraktnih modela bliskih stilom onim modelima koje su stvorili starogrčki matematičari za opisivanje prostornih oblika; samo poznavanje pojmova kao što su padež, rod itd., koji su postali, kako je zapisao H. Steinthal, “naša druga priroda”, sprječava nas da shvatimo koliku je visoku razinu apstraktnog mišljenja zahtijevalo njihovo stvaranje. Stoga biste se trebali iznenaditi rađe nego da su prvi pokušaji da se stvarnim matematičkim sredstvima opiše jezični “ideal matematičke harmonije” učinjeni tek sredinom dvadesetog stoljeća.

Dva su razloga za ovo "kašnjenje". Prvo, znanost o jeziku, nakon što su poduzeti značajni koraci antičko doba, počeo se ponovno stvarno razvijati tek u 19. stoljeću, ali je kroz ovo stoljeće glavna pažnja jezikoslovaca bila usmjerena na povijest jezika, a tek u sljedećem stoljeću, koje je općenito bilo doba strukturalizma za humanističke znanosti, lingvistika se prvi put nakon antičkog razdoblja okrenula proučavanju jezičnih struktura, ali na novoj razini. Kad su lingvisti shvatili da je jezik, riječima F. de Saussurea, “sustav čistih odnosa”, tj. sustav znakova čija je fizička priroda beznačajna, a značajni su samo odnosi među njima, pojavila se paralela između jezik i matematičke konstrukcije postale su sasvim očite, koje su također "sustavi čistih odnosa", a već početkom dvadesetog stoljeća isti de Saussure sanjao je o proučavanju jezika matematičkim sredstvima.

Drugo, kvantitativne metode u matematici dolaze do izražaja početkom novoga vijeka, a tek u 19. stoljeću matematičari ponovno počinju graditi nekvantitativne apstraktne modele koji se više razlikuju od antičkih. visoka razina apstrakcije, ali i - što je posebno važno za našu temu - time što bi se njima mogao opisati puno širi spektar pojava od prostornih oblika; često su se takvi modeli pokazali prikladnim i ravnomjernim potrebna sredstva proučavati pojave o kojima matematičari koji su ih izgradili uopće nisu razmišljali i nisu ni znali za njihovo postojanje. Među tim modelima bilo je i onih koji su kasnije dobili primjenu u lingvistici; Posebno intenzivan razvoj matematičkih disciplina, čiji je sadržaj bila njihova izgradnja, dogodio se u prvoj polovici dvadesetog stoljeća. Stoga je susret matematike i lingvistike sredinom ovog stoljeća bio sasvim prirodan.

Jedan od rezultata ovog skupa bila je i pojava nove matematičke discipline - matematičke lingvistike, čiji je predmet razvoj matematičkog aparata za lingvistička istraživanja. Središnje mjesto u matematičkoj lingvistici zauzima teorija formalnih gramatika, koja je po prirodi aparata koji se u njoj koristi povezana s matematičkom logikom, a posebno s teorijom algoritama. Pruža formalne metode za opisivanje točnih jezičnih jedinica. razne razine, a također, što je posebno važno, formalne metode za opisivanje transformacija jezičnih jedinica - kako na istoj razini tako i među razinama. Teorija sintaktičkih struktura nadovezuje se na teoriju formalnih gramatika, koja je mnogo jednostavnija u smislu aparata, ali ne manje važna za lingvističke primjene. U matematičkoj lingvistici također se razvijaju analitički modeli jezika u kojima se na temelju određenih - koji se smatraju poznatim - podataka o “ispravnim tekstovima” izrađuju formalne konstrukcije čiji je rezultat opis nekih “ sastavni dijelovi»jezični mehanizam. Na taj način se može dobiti formalni opis nekih tradicionalnih gramatičkih pojmova. To također treba uključiti opis značenja rečenice pomoću aparata intenzionalne logike („Montagu semantika“).

Naravno, uz pomoć matematičkog aparata može se opisati samo jedan od dva ideala jezika o kojima je govorio Vygotsky; stoga često čujni prigovori korištenju jednog ili drugog matematičkog modela (ili matematičkih modela općenito) s obrazloženjem da ne pokriva te i takve posebne slučajeve nemaju smisla: opisati "fluktuacije i nedosljednosti" svojstvene jezika, potrebna su sasvim druga, nematematička sredstva, a upravo bi jasan opis "matematičkog ideala" mogao pomoći u njihovom pronalaženju, jer bi omogućio jasno razgraničenje "fantastičnog" od "matematičkog" u Jezik. Ali to je ipak stvar budućnosti.

Ništa manje, a možda i važnije od nastanka matematičke lingvistike, bio je izravan prodor u lingvistiku temeljnih matematičkih ideja i pojmova - kao što su skup, funkcija, izomorfizam. U suvremenoj lingvističkoj semantici važnu ulogu imaju pojmovi predikata i kvantifikatora koji su došli iz matematičke logike. (Prva je nastala u logici i onda kada se nije razlikovala od lingvistike, a sada se vratila u lingvistiku u općenitom i matematički obrađenom obliku.)

I na kraju, vrlo veliki značaj ima profinjenost jezika lingvističkog istraživanja, do koje dolazi zbog prodora “matematičkog duha” u lingvistiku, ne samo u ona područja gdje je moguće koristiti matematičke ideje i metode. Sve se to može ukratko sažeti na sljedeći način: lingvistika postaje sve točnija i objektivnija znanost – ne prestajući, dakako, biti znanost humanističkih znanosti.

Međutim, na ovome prirodan način Razvoj lingvistike nailazi na ozbiljne prepreke koje ga mogu usporiti na dulje vrijeme. Glavni je “razdvajanje fakulteta” koje je nastalo početkom novog vijeka: prirodoslovci i matematičari, s jedne strane, i humanitarci, s druge strane, nisu zainteresirani za rad kolega “na drugom fakultetu”. ” i, štoviše, duboko u sebi, a često ih i otvoreno preziru. Matematičari i prirodoslovci (a još više “tehničari”) skloni su humanistička istraživanja vidjeti samo kao neku vrstu “ukrasa” ili čak “praznog brbljanja”, dok su “humanističari” spremni tolerirati matematiku i prirodne znanosti samo radi praktičnosti. korist i uvjereni su da su ništa ne može pomoći u razumijevanju prirode ljudskog duha.

Samo u sredini 19. stoljeća u ovom, prema riječima velikog biologa i velikog mislioca Konrada Lorenza, "zlom zidu između prirodnih i humanističkih znanosti (die böse Mauer zwischen Natur- und Geistwissenschaften)" napravljen je prvi proboj na najtanjem mjestu razdvajajući logiku od matematika. U 20. stoljeću pojavile su se i druge praznine – među njima i ona koju su s obje strane bušili matematičari i lingvisti – ali ih je još uvijek malo, zid je još čvrst, a ne manjka napora s obje strane da se on dodatno ojača i pokrpati rupe. Često su ti napori prilično uspješni; najnovije "dostignuće" u tom smjeru je "profilno obrazovanje" u Srednja škola koja već u djetinjstvu sposobne i zainteresirane ljude dijeli na "fakultete" i uči ih da se ponose neznanjem u "stranim" znanostima - može uvelike omesti daljnju konvergenciju prirodnih i humanističkih znanosti, koja je prijeko potrebna za normalan razvoj i jedne i druge. . Jedna od posljedica podizanja zida je da "humanisti", uključujući i veliku većinu lingvista, ne znaju ništa čak ni o osnovama upravo onih dijelova matematike koji su najveća vrijednost za humanističke znanosti (a zamislite matematičara kao osobu koja se isključivo bavi proračunima).

Još jedna prepreka je bjesomučna trka karakteristična za trenutno stanje znanosti, neprestana potraga za sve novim i novim "rezultatima", sužavajući horizont i ne ostavljajući vremena za razmišljanje o dubljim problemima ili za ozbiljno proučavanje srodnih i, štoviše, ne sasvim povezano znanstvena disciplina. To se podjednako odnosi na jezikoslovce i matematičare – kao, uostalom, i na sve one koji se profesionalno bave znanošću.

I treće je inertnost, ili, jednostavnije, lijenost. Na prvi pogled, lijenost i bjesomučna trka su nespojivi, ali u stvarnosti se dobro slažu i, štoviše, podržavaju i stimuliraju jedno drugo. Kad je čovjek lijen prihvatiti se teškog zadatka, on se uhvati lakšeg i "pouzdanijeg" zadatka, uspjeh u kojem opravdava i potiče njegovu inertnost. arogantan odnos prema manja braća, roji se s onu stranu zida, također potiče lijenost i njome se potiče. Kada, na primjer, matematičar predlaže preispitivanje svih ideja o drevna povijest, ne dajući sebi truda da se barem malo upozna sa starim jezicima, za to je u velikoj mjeri zaslužna ista ta lijena majka.

Opasnost za razvoj znanosti koju predstavljaju te prepreke puno je ozbiljnija nego što se na prvi pogled čini. Kada neznanje u "stranim" znanostima postane predmet ponosa, to naravno dovodi do površnosti i neznanja iu "svojim" znanostima. “Fakulteta” odavno ima puno više od dva, njihov broj iz godine u godinu raste, a svaki je zidom ograđen od ostalih; zidovi se pojavljuju i unutar fakulteta. Obzori istraživača postupno se sužavaju; Istina je da aparatura istraživanja postaje sve suptilnija i profinjenija, ali gotovo isključivo male predmete, te se učvršćuje mišljenje da su oni jedini vrijedni proučavanja. S razlogom se može govoriti o krizi u znanosti, a lingvistika nije iznimka. Sada je, čini mi se, vrijeme da se osvrnem i razmislim.

Ovdje su se okupili lingvisti smjera koji je povezan s modelom "Značenje - tekst". Ovaj model, nastao 60-ih godina prošlog stoljeća, bio je jedan od prvih i najbolje rezultate susret lingvistike i matematike, nakon kojeg su stasale dvije generacije jezikoslovaca, naviknutih na precizno razmišljanje još od studentskih godina. Ali oni, nažalost, nisu oslobođeni inercije koja ih sprječava da shvate postojanje krize i razmišljaju o načinima kako je prevladati. U međuvremenu, među svim lingvistima - a možda čak i među svim onima koji se bave humanističkim znanostima - oni imaju najobjektivnije mogućnosti za takvo razumijevanje, i želio bih se nadati da će te mogućnosti iskoristiti.

Tekst izvješća ljubazno su ustupili A.V. Gladkiy i izdavačka kuća

Povijest primjene matematičkih metoda u lingvistici PREDAVANJE br

plan

Formiranje
strukturalna lingvistika
na prijelom XIX- XX. stoljeća.
Primjena matematičkih metoda
u lingvistici u drugoj polovici XX
stoljeća.
izgledi
aplikacije
matematičke metode u
lingvistika.

Ferdinand de Saussure (1857-1913) jezik kao sustav

pravi jezik
govor – parole
govorna aktivnost
- Jezik

I.A. Baudouin de Courtenay (1845. - 1929.)

“Zvukovi su “atomi” jezika
sustavi koji imaju
ograničen broj
lako mjerljiva svojstva.
Ovo je najprikladnije
materijal za svečanost,
stroge metode
opisi."

Strukturna lingvistika -

to je skup pogleda na jezik i
metode njegovog istraživanja, temeljene na
koji leži shvaćanje jezika kao
sustav znakova s ​​jasno razlučivim
strukturni elementi (jedinice
jezik, njihova nastava itd.) i želju za
strog (približava se točnom
znanosti) formalni opis jezika.

Lenjingradskaja
fonološka škola
(L.V. Shcherba) koristi se kao
glavni kriterij za generalizaciju zvuka u
kao fonem psiholingvistički
eksperiment temeljen na analizi
govor izvornih govornika.
Praški lingvistički krug
(N.S. Trubetskoy) razvio je teoriju
opreke – semantička struktura
jezik su opisali kao skup
oporbeno izgrađen
semantičke jedinice – fam.

Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća

američki
deskriptivizam
(L. Bloomfield i E. Sapir). Jezik
deskriptivistima predstavljen kao
zbirka govornih iskaza.
Formalna gramatika N. Chomskog.
Moskva
fonološka škola,
čiji su predstavnici bili A.A.
Reformatsky, V.N. Sidorov, P.S.
Kuznjecov, A.M. Suhotin, R.I. Avanesov.

sustavi za strojno prevođenje

Algoritam
konsekutivni prijevod
riječ po riječ, izraz po izraz.
T-sustavi (od engleska riječ prijenos
- transformacija), u kojoj je prijevod
provedeno na razini sintaktičke
strukture.
I-sustavi (od riječi "interlingua") dobivanje semantičke reprezentacije
ulazna rečenica kroz svoj
semantička analiza i sinteza
ulazna ponuda na primljeno
semantička prezentacija.

10. Praktična lingvistika

studije
nije jezik u svom stanju (tj.
sustav) i jezik u akciji (tj
komunikacija);
rješava problem specifične aplikacije,
stvaranje jezičnih modela bez
tvrdi da objašnjava činjenice jezika
(kao teorijska lingvistika);
ciljajući na određene podjezike
(tj. selektivno poznavanje jezika), a ne
za cijeli jezik.

11. kvantitativna lingvistika

- interdisciplinarni smjer u
primijenjena istraživanja, koja
kao glavno sredstvo proučavanja
koriste se jezik i govor
kvantitativni ili statistički
metode analize.

12. računalna lingvistika

– razvoj metoda, tehnologija i
specifični sustavi koji pružaju
komunikacija između osobe i računala na prirodnom
ili ograničeni prirodni jezik.

13. računalna lingvistika

stvaranje sustava za preradu prirodnih
jezik (na primjer, komunikacijski sustavi za obradu
tekst);
razvoj sustava za pretraživanje informacija
(dokumentarni, odnosno u kojem
tekstovi, i faktografski, t.j. u kojem
činjenice su pohranjene, predstavljene ne samo u
tekstualnom obliku, kao iu obliku tabela,
formule, itd.);
stvaranje hipertekstualnih sustava (tj.
skup tekstova s ​​njihovim povezivanjem
odnosi);
razvoj računalnih tehnologija
sastavljanje i korištenje rječnika.

14. Hvala na pažnji!

15. Izvješća:

Zakoni
prirode i "humanitarnih" zakona.
Matematička revolucija u lingvistici.
Kopenhaška strukturna škola
lingvistika.
Formiranje primijenjene lingvistike kao
znanstvena disciplina.

16. Praktični dio:

Opis povijesti primjene matematičkih
metode u lingvistici od antike do naše
dana.
Manifestacija integracijskih trendova
matematičkih, lingvističkih i drugih znanja u
povijest razvoja znanosti o jeziku.
Usporedne karakteristike primijenjenih i
teorijska lingvistika (ispunite tablicu
Usporedne karakteristike primijenjenih i
teorijska lingvistika).
Korpusna lingvistika kao primijenjena sekcija
lingvistika.
Primijenjeni aspekti kvantitativne lingvistike.
Računalna lingvistika i njezini alati.

Tijekom prošlog stoljeća lingvistika se uvijek navodila kao primjer znanosti koja se ubrzano razvijala i vrlo brzo dostigla metodološku zrelost. Već sredinom prošlog stoljeća mlada je znanost samouvjereno zauzela svoje mjesto u krugu znanosti s tisućljetnom tradicijom, a jedan od njezinih najistaknutijih predstavnika - A. Schleicher - imao je hrabrosti vjerovati da svojim radovima već je sažimao konačnu crtu.<113>Povijest lingvistike je, međutim, pokazala da je takvo mišljenje bilo prenagljeno i neopravdano. Krajem stoljeća lingvistika je doživjela prvi veliki šok vezan uz kritiku neogramatičkih načela, a potom i druge. Valja napomenuti da sve krize koje možemo otkriti u povijesti znanosti o jeziku, u pravilu, nisu uzdrmale njezine temelje, nego su, naprotiv, pridonijele jačanju i u konačnici sa sobom donijele oplemenjivanje i usavršavanje. metoda lingvističkog istraživanja, proširujući se uz teme i znanstvenu problematiku.

No uz lingvistiku živjele su i razvijale se i druge znanosti, među kojima i veliki broj novih. Fizičke, kemijske i tehničke (tzv. "egzaktne") znanosti dobile su u naše vrijeme posebno brz razvoj, a nad svima njima je zavladala njihova teorijska osnova, matematika. Egzaktne znanosti ne samo da su jako pritisnule sve humanističke znanosti, nego ih sada nastoje "uvesti u svoju vjeru", podrediti svojim običajima, nametnuti im svoje metode istraživanja. U sadašnjoj situaciji, japanskim izrazom, može se reći da sada lingvisti-filolozi prljaju sam rub otirača, gdje se egzaktne znanosti, na čelu s matematikom, trijumfalno i slobodno nalaze.

Ne bi li s gledišta općih znanstvenih interesa bilo svrsishodnije kapitulirati pred matematikom, potpuno se prepustiti vlasti njezinih metoda, na koje neki glasovi otvoreno pozivaju 59 , i time, možda, dobiti novu snagu? Da bismo odgovorili na ova pitanja, prvo moramo pogledati što matematika tvrdi ovaj slučaj u kojem području lingvistike matematičke metode nalaze svoju primjenu, koliko su u skladu sa specifičnostima jezične građe i mogu li dati ili čak samo sugerirati odgovore na pitanja koja znanost o jeziku postavlja.

Od samog početka treba napomenuti da među entuzijastima novog, matematičkog pravca u lingvistici<114>U statičkim istraživanjima ne postoji jedinstveno mišljenje o ciljevima i ciljevima. Akad. A. A. Markov, koji je prvi primijenio matematičke metode na jezik, Boldrini, Yul, Mariotti jezične elemente smatraju prikladnim ilustrativnim materijalom za konstruiranje kvantitativnih metoda ili za statističke teoreme, uopće se ne pitajući jesu li rezultati takvog proučavanja od interesa. jezikoslovcima 6 0 . Ross vjeruje da teorija vjerojatnosti i matematička statistika pružaju alat ili, kako sada radije kažu, matematički model za testiranje i potvrđivanje onih lingvističkih zaključaka koji dopuštaju numeričku interpretaciju. Stoga su matematičke metode zamišljene samo kao pomoćna sredstva jezičnih istraživanja 6 1 . Puno više tvrdi Herdan, koji je u svojoj knjizi ne samo sažeo i sistematizirao sve pokušaje matematičkog proučavanja jezičnih problema, nego ih je pokušao i jasno orijentirati u odnosu na daljnji rad. Izlaganje cjelokupne građe svoje knjige usmjerava na “razumijevanje književne statistike (kako on naziva proučavanje tekstova metodama matematičke statistike. - NA 3.) kao sastavni dio lingvistike” 6 2 , a bit i zadaće tog novog odjeljka u lingvistici formulira sljedećim riječima: „Književna statistika kao kvantitativna filozofija jezika primjenjiva je na sve grane lingvistike. Prema našem mišljenju, književna je statistika strukturalna lingvistika uzdignuta na razinu kvantitativne znanosti ili kvantitativne filozofije. Stoga je jednako pogrešno definirati njegove rezultate kao izvan dosega<115>lingvistike ili ga tretirati kao pomoćno sredstvo za istraživanje” 6 3 .

Teško je uputno ulaziti u teoretiziranje o tome je li u ovom slučaju legitimno govoriti o nastanku nove grane lingvistike i razriješiti pitanje njezinih tvrdnji, a da se prije toga ne osvrnemo na razmatranje onoga što je zapravo učinjeno u ovom slučaju. području, te razjašnjenju u kojem smjeru ide primjena novih metoda 6 4 . To će nam pomoći da razumijemo razlike u mišljenjima.

Korištenje matematičkih (ili, točnije, statističkih) kriterija za rješavanje lingvističkih problema nije nipošto novost u znanosti o jeziku i, u ovoj ili onoj mjeri, već se dugo koriste od strane jezikoslovaca. Uostalom, zapravo, takvi tradicionalni koncepti lingvistike kao što je fonetski zakon (i srodni<116>nee s njim - iznimka od zakona), produktivnost gramatičkih elemenata (na primjer, derivacijski sufiksi), ili čak kriteriji za srodne odnose među jezicima, u određenoj mjeri, temelje se na relativnim statističkim značajkama. Uostalom, što je oštrija i izrazitija statistička suprotnost promatranih slučajeva, to više razloga imamo za govoriti o produktivnim i neproduktivnim sufiksima, o fonetskom zakonu i iznimkama od njega, o prisutnosti ili odsutnosti srodnosti među jezicima. Ali ako se u takvim slučajevima statističko načelo koristilo više ili manje spontano, onda se u budućnosti počelo primjenjivati ​​svjesno i već s određenim postavljanjem cilja. Tako su u naše vrijeme postali rašireni takozvani frekvencijski rječnici vokabulara i izraza pojedinih jezika 6 5 ili čak značenja višejezičnih riječi s "općim fokusom na stvarnost" 6 6. Podaci iz ovih rječnika koriste se za izradu udžbenika stranih jezika (čiji su tekstovi izgrađeni na najčešće korištenom vokabularu) i minimalnih rječnika. Statistička računica našla je posebnu lingvističku upotrebu u metodi leksikostatistike ili glotokronologije M. Swadesha, gdje se na temelju statističkih formula koje uzimaju u obzir slučajeve nestanka riječi iz jezika glavnog fonda, može utvrditi apsolutnu kronologiju podjele jezičnih obitelji 6 7 .

U posljednjih godina slučajevi primjene matematičkih metoda na jezičnu građu znatno su se umnožili, au masi takvih pokušaja zacrtali su se više ili manje određeni pravci. Skrenimo<117>na njihovo uzastopno razmatranje, ne ulazeći u detalje.

Počnimo s smjerom koji je dobio naziv stilostatistika. U ovom slučaju riječ je o definiranju i karakterizaciji stilskih obilježja pojedinih djela ili autora kroz kvantitativne odnose upotrijebljenih jezičnih elemenata. Statistički pristup proučavanju stilskih pojava temelji se na shvaćanju književnog stila kao individualnog načina ovladavanja jezičnim sredstvima. Istraživač je pritom potpuno odvučen od pitanja kvalitativnog značenja prebrojivih jezičnih elemenata, usredotočujući svu svoju pozornost samo na kvantitativnu stranu; semantička strana proučavanih jezičnih jedinica, njihova emocionalna i ekspresivna opterećenost, kao i njihov udio u tkivu umjetničkog djela - sve to ostaje izvan računa, odnosi se na takozvane redundantne pojave. Tako se umjetničko djelo pojavljuje u obliku mehaničkog agregata čija specifičnost konstrukcije dolazi do izražaja tek kroz brojčane odnose njegovih elemenata. Predstavnici stilostatistike ne zatvaraju oči pred svim navedenim okolnostima, suprotstavljajući metode tradicionalne stilistike, koje nedvojbeno sadrže elemente subjektivnosti, jednu jedinu kvalitetu matematičke metode, koja, po njihovom mišljenju, nadoknađuje sve njezine nedostatke – objektivnost postignutih rezultata. “Nastojimo”, piše npr. V. Fuchs, “... matematičkim sredstvima karakterizirati stil jezičnog izražavanja. U tu svrhu treba stvoriti metode čiji rezultati trebaju imati istu objektivnost kao i rezultati egzaktnih znanosti ... To sugerira da ćemo se, barem u početku, baviti samo formalnim strukturnim kvalitetama, a ne semantičkim sadržaj jezičnih izraza . Na taj ćemo način dobiti sustav rednih odnosa, koji će u svojoj ukupnosti biti temelj i polazište matematičke teorije stila” 6 8 .<118>

Najjednostavniji statistički pristup proučavanju jezika pisaca ili pojedinih djela jest prebrojavanje upotrijebljenih riječi, budući da bi bogatstvo rječnika, po svemu sudeći, trebalo na određeni način karakterizirati i samog autora. No, rezultati takvih izračuna u tom pogledu daju pomalo neočekivane rezultate i nimalo ne pridonose estetskom poznavanju i vrednovanju književnog djela, što je ne samo jedna od zadaća stilistike. Evo nekih podataka o ukupnom broju riječi korištenih u nizu djela:

Biblija (latinski). . . . . . . . . . 5649 riječi

Biblija (hebrejski). . . . 5642 riječi

Demosten (govor). . . . . . . . . . . . 4972 riječi

Salustije. . . . . . . . . . . . . . . . . 3394 riječi

Horacije. . . . . . . . . . . . . . . . . . . .6084 riječi

Dante (Božanstvena komedija) 5860 riječi

(ovo uključuje 1615 vlastitih imena i zemljopisnih naziva)

Tasso (Bijesni Orland). . . . 8474 riječi

Milton. . . . . . . . . . . . . . . . . . . . .8000 riječi (približno dano)

Shakespearea. . . . . . . . . . . . . . . . . . .15000 riječi

(otprilike, prema drugim izvorima 20 000 riječi)

O. Jespersen ističe da rječnik Zole, Kiplinga i Jacka Londona znatno nadmašuje rječnik Miltona, tj. broj je 8000 6 9 . Izračunom rječnika govora američkog predsjednika W. Wilsona utvrđeno je da je bogatiji od onog Shakespeareova. Tome treba dodati i podatke psihologa. Tako je Terman, na temelju promatranja velikog broja slučajeva, utvrdio da vokabular prosječnog djeteta iznosi oko 3600 riječi, a u dobi od 14 godina - već 9000. Prosječna odrasla osoba koristi 11700 riječi, a osoba "povećanog inteligencija" do 13500 7 0 . Dakle, takvi brojčani podaci sami po sebi ne daju nikakvu osnovu za identifikaciju stilskih kvaliteta djela i samo "objektivno" konz.<119>navode korištenje različitog broja riječi kod različitih autora, što, kako pokazuju gornji izračuni, nije povezano s relativnom umjetničkom vrijednošću njihovih djela.

Izračuni relativne učestalosti uporabe riječi pojedinih autora izgrađeni su nešto drugačije. U ovom slučaju ne uzima se u obzir samo ukupna količina riječi, već i učestalost upotrebe pojedinih riječi. Statistička obrada ovako dobivenog materijala sastoji se u tome da se riječi s jednakom učestalošću upotrebe grupiraju u razrede (odnosno rangove), čime se utvrđuje raspodjela učestalosti svih riječi koje koristi određeni autor. Poseban slučaj ove vrste izračuna je određivanje relativne učestalosti posebnih riječi (primjerice, romanski vokabular u Chaucerovim djelima, kao što je to učinio Mersand 7 1). Relativna učestalost riječi koje autori koriste sadrži iste objektivne informacije o stilu pojedinih autora kao i gornji ukupni izračuni, s tom razlikom što su rezultat točniji brojčani podaci. No, koristi se i za datiranje pojedinih djela istog autora na temelju preliminarnog izračuna relativne učestalosti njegove uporabe riječi u različitim razdobljima njegova života (prema djelima koja je datirao sam autor). Druga vrsta korištenja podataka iz takvih izračuna je utvrđivanje autentičnosti autorstva djela za koja se ovo pitanje čini dvojbenim 7 2 . U ovom posljednjem slučaju sve se temelji na usporedbi statističkih formula za učestalost korištenja u izvornim i kontroverznim djelima. O vrlo velikoj relativnosti i približnosti rezultata dobivenih takvim metodama ne treba govoriti. Uostalom, relativna učestalost uporabe mijenja se ne samo s godinama autora, već i ovisno o žanru, zapletu, ali i povijesnom okruženju radnje djela (usporedi, na primjer, "Kruh" i "Petar" I" A. Tolstoja).<120>

Produbljujući gore opisanu metodu, stilostatistika kao stilska karakteristika počela je posezati za kriterijem stabilnosti relativne učestalosti najčešće korištenih riječi. Metoda korištena u ovom slučaju može se ilustrirati statističkom obradom Puškinove priče "Kapetanova kći" Esselsona i Epsteina na Institutu za slavenske jezike Sveučilišta u Detroitu (SAD) 7 3 . Anketiranju je podvrgnut cijeli tekst priče (oko 30.000 pojavljivanja riječi), a potom i odlomci koji sadrže oko 10.000 i 5.000 pojavljivanja. Nadalje, kako bi se utvrdila stabilnost relativne učestalosti uporabe riječi, 102 najčešće korištene riječi (s učestalošću od 1160 puta do 35) uspoređeno je s izračunatom relativnom učestalošću (izrađenom na temelju selektivnih odlomaka) sa stvarnim. Na primjer, sindikat "i" korišten je 1160 puta u cijeloj priči. U odlomku koji sadrži 5 000 pojavljivanja svih riječi, očekuje se da će ovaj veznik biti korišten 5 000 x 1 160:30 000, ili zaokružen 193 puta, a u odlomku koji sadrži 10 000 pojavljivanja svih riječi, očekuje se da će biti korišten 10 000 x 1 160 : 30 000, ili 386 puta. Usporedba podataka dobivenih ovakvom vrstom izračuna sa stvarnim podacima pokazuje vrlo malo odstupanje (unutar 5%). Na temelju takvih izračuna utvrđeno je da se u ovoj Puškinovoj priči prijedlog "k" koristi dvostruko češće od "y", a zamjenica "ti" se koristi tri puta češće od "njih" itd. , unatoč svim peripetijama radnje, kako u cijeloj priči, tako iu njenim pojedinim dijelovima, postoji stabilnost u relativnoj učestalosti upotrebe riječi. Ono što se opaža u odnosu na neke (najčešće) riječi vjerojatno je primjenjivo na sve riječi korištene u djelu. Iz toga slijedi da se stil autora može okarakterizirati određenim omjerom varijabilnosti prosječne učestalosti uporabe riječi prema općoj učestalosti za određeni jezik.<121>učestalost njegove upotrebe. Taj se omjer smatra objektivnom kvantitativnom karakteristikom autorova stila.

Na sličan način proučavaju se i drugi formalni elementi jezične strukture. Tako je npr. V. Fuchs komparativno-statističkom razmatranju podvrgao metričke značajke djela Goethea, Rilkea, Cezara, Salustija i dr. 7 4

Kriterij stabilnosti relativne učestalosti uporabe riječi, dok pojašnjava tehniku ​​kvantitativne karakterizacije stila, ne unosi ništa bitno novo u usporedbi s gore analiziranim primitivnijim metodama. Sve metode stilostatistike u konačnici daju jednako nepristrasne "objektivne" rezultate, klizeći po površini jezika i držeći se samo čisto vanjskih znakova. Kvantitativne metode, očito, nisu u stanju usredotočiti se na kvalitativne razlike u materijalu koji se proučava i zapravo izjednačiti sve objekte koji se proučavaju.

Gdje je potrebna maksimalna specifikacija, nude se najopćenitiji kriteriji; kvalitativne karakteristike izražavaju se jezikom količine. To nije samo logička kontradikcija, već i neslaganje s prirodom stvari. Doista, što se događa ako na temelju kvantitativnog omjera crvene i crne boje na njihovim platnima pokušamo dobiti usporednu stilsku (dakle, kvalitativnu) karakteristiku djela Aleksandra Gerasimova i Rembrandta? Čini se da je to apsolutna besmislica. U kojoj su mjeri potpuno “objektivni” kvantitativni podaci o tjelesnim podacima osobe sposobni dati predodžbu o svemu što osobu karakterizira i čini prava suština? Očito nijedan. Oni mogu poslužiti samo kao pojedinačni znak koji razlikuje jednu osobu od druge, poput otiska vijuga na palcu. Slično je i s kvantitativnim obilježjima književnoga stila. Ako bolje pogledate, oni pružaju jednako oskudne podatke za procjenu stvarnog stila<122>kvalitete autorova jezika, kao i opis vijuga na prstu za proučavanje ljudske psihologije.

Svemu rečenome treba dodati da se u prošlosti, u tzv. formalnoj školi književne kritike, već pokušalo kvantitativno proučavati stil pisaca, kada su epiteti, metafore i ritmičko-melodijski elementi stihova su izbrojani. Međutim, ovaj pokušaj nije dobio daljnji razvoj.

Drugo područje primjene matematičkih metoda za proučavanje jezičnih pojava može se grupirati pod nazivom lingvistička statistika. Ona nastoji prodrijeti u temeljna pitanja teorije jezika i tako dobiti zvanje u pravoj lingvističkoj sferi. Za upoznavanje s tim smjerom najbolje je okrenuti se već spomenutom Herdanovom djelu, po riječima jednog od njegovih brojnih recenzenata, "monstruozno pretencioznoj knjizi" 7 5 , dobio je, međutim, širok odjek među jezikoslovcima 7 6 . S obzirom na to da je Kherdan (kao što je već spomenuto) u svojoj knjizi nastojao prikupiti sve najznačajnije u području primjene matematičkih metoda na lingvističke probleme, u njegovoj se knjizi zapravo ne bavimo toliko Kherdanom koliko cjelinom trend. Kao što i sam naslov knjige “Jezik kao izbor i vjerojatnost” pokazuje, njezin glavni fokus je na razjašnjenju što je u jeziku prepušteno slobodnom izboru govornika, a što je posljedica imanentne strukture jezika, baš kao o određivanju kvantitativnog odnosa elemenata prvog i drugog reda. Kherdanova knjiga pruža gotovo iscrpne informacije o svim radovima na ovom području koje provode predstavnici raznih specijalnosti.<123>(filozofi, lingvisti, matematičari, tehničari), ali nije ograničen na ovo i uključuje mnoga izvorna zapažanja, razmatranja i zaključke samog autora. Kao sažetak, daje dobru predodžbu o korištenim kvantitativnim metodama i rezultatima postignutim uz njihovu pomoć. Pitanja koja uvjetno objedinjujemo u dio lingvističke statistike obrađena su u drugom i četvrtom dijelu knjige.

Od mnogih slučajeva primjene metoda matematičke statistike u proučavanju lingvističkih pitanja, usredotočit ćemo se na one najopćenitije, koji se ujedno mogu smatrati i najtipičnijima. Korištenje podataka drugih autora - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 i drugi, kao i citirajući vlastita istraživanja koja određuju relativnu učestalost distribucije fonema, slova, duljine riječi (mjerene brojem slova i slogova) , gramatičkih oblika i metričkih elemenata u latinskom i grčkom heksametru, Herdan utvrđuje činjenicu postojanosti relativne učestalosti jezičnih elemenata kao zajedničke karakteristike svih jezičnih struktura. On izvodi sljedeće pravilo: “Omjeri jezičnih elemenata koji pripadaju jednoj ili drugoj razini ili sferi jezičnog kodiranja - fonologija, gramatika, metrika - ostaju manje-više konstantni za dati jezik, u određenom razdoblju njegova razvoja i unutar granicama dovoljno opsežnih i nepristrano provedenih promatranja.» 8 2 . Ovo pravilo, koje Herdan naziva osnovnim zakonom jezika, on nastoji na stanovit način protumačiti i proširiti. “On je”, piše Herdan o ovom zakonu, “izraz činjenice da i ovdje, gdje je ljudska volja i sloboda izbora zajamčena.<124>najširem okviru, gdje se svjestan izbor i bezbrižna igra živo izmjenjuju, općenito postoji znatna stabilnost... u gramatici, ali iu odnosu na učestalost uporabe pojedinih fonema, leksičkih jedinica (riječi) i gramatičkih fonema i konstrukcije; drugim riječima, sličnost nije samo u tome što se koristi, nego iu tome koliko se često koristi” 8 3 . Ovakvo stanje je iz razumljivih razloga, ali to daje povoda novim zaključcima. Prilikom ispitivanja različitih tekstova ili segmenata određenog jezika, na primjer, otkriva se da relativne učestalosti upotrebe određenog fonema (ili drugih govornih elemenata) od strane različitih ljudi ostaju u osnovi iste. To dovodi do tumačenja pojedinih oblika govora kao nekih fluktuacija u stalnoj vjerojatnosti uporabe razmatranog fonema u određenom jeziku. Dakle, ispada da je osoba u svojoj govornoj aktivnosti podložna određenim zakonima vjerojatnosti u odnosu na broj korištenih jezičnih elemenata. I onda, kada promatramo ogroman broj jezičnih elemenata u velikom skupu tekstova ili govornih segmenata, stječe se dojam uzročne ovisnosti u smislu da u ovom slučaju postoji i determinacija u odnosu na upotrebu pojedinih jezičnih elemenata. Drugim riječima, pokazuje se prihvatljivim tvrditi da je ono što se s intuitivnog stajališta čini uzročnom vezom kvantitativno vjerojatnost 8 4 . Jasno je da što je veći ukupni<125>specifičnosti ispitivanih tekstova ili govornih segmenata to će se jasnije očitovati stabilnost relativne učestalosti uporabe jezičnih elemenata iu pojedinačnoj uporabi (zakon velikih brojeva). Odavde se pravi novi opći zaključak da je jezik masovna pojava i da ga tako treba i tretirati.

Ovi zaključci, doneseni na temelju proračuna učestalosti fonetskih elemenata, riječi i gramatičkih oblika, koji zajedno čine jezik, zatim se primjenjuju na "statističku interpretaciju" Saussureove podjele na "jezik" (lalangue) i "govor" (laparole ). Prema Saussureu, "jezik" je skup jezičnih navika koje omogućuju komunikaciju između članova određene jezične zajednice. To je društvena stvarnost, "masovna pojava", obavezna za sve ljude koji govore ovim jezikom. Herdan, kao što je navedeno, dokazuje da su pripadnici jedne jezične zajednice slični jedni drugima ne samo po tome što koriste iste foneme, leksičke jedinice i gramatičke oblike, već i po tome što se svi ti elementi koriste s istom učestalošću. Stoga njegova statistička definicija "jezika" ima sljedeći oblik: "jezik" (lalangue) je ukupnost uobičajenih jezičnih elemenata plus njihova relativna vjerojatnost da će biti korišteni.

Ova definicija "jezika" također je polazište za odgovarajuću statističku interpretaciju "govora", koji je, prema Saussureu, individualni iskaz. Suprotstavljajući “jezik” kao društveni fenomen “govoru” kao individualnom fenomenu, Saussure je napisao: “Govor je individualni čin volje i razumijevanja, u kojem je potrebno razlikovati: 1. kombinacije s kojima subjekt koji govori koristi jezik; kod kako bi izrazio svoju osobnu misao; 2. psihofizički mehanizam koji mu omogućuje da te kombinacije objektivizira” 8 5 . Budući da se "jezik" u lingvističkoj statistici smatra skupom elemenata s određenim relativnim<126>određena vjerojatnost njihove uporabe, utoliko što uključuje statističku ukupnost ili ansambl (populaciju) kao najbitniju karakteristiku i može se razmatrati u tom aspektu. U skladu s tim, "govor" se pretvara u zaseban uzorak uzet iz "jezika" kao statističkog agregata. Vjerojatnost je u ovom slučaju određena odnosom "govora" prema "jeziku" (u njihovom "kvantitativnom" razumijevanju), a distribucija relativne učestalosti uporabe različitih elemenata jezika tumači se kao rezultat skupni »izbor« (izbor) u određenom kronološkom razdoblju postojanja jezika. Shvaćajući da je takvo tumačenje razlika između “jezika” i “govora” ipak izgrađeno na potpuno drugačijim osnovama od Saussureovih, Herdan u tom pogledu piše: “Ova naizgled neznatna modifikacija Saussureova koncepta ima važnu posljedicu da je “jezik” ( lalangue ) sada dobiva bitno obilježje u obliku statističkog agregata (populacije). Tu populaciju karakteriziraju određene relativne učestalosti ili vjerojatnosti fluktuacije, što znači da svaki jezični element pripada određenoj jezičnoj razini. U ovom slučaju, "govor" (laparole) se, u skladu sa svojim značenjem, ispostavlja kao termin za definiranje statističkih uzoraka uzetih iz "jezika" kao statističke populacije. Postaje očito da se izbor (izbor) ovdje pojavljuje u obliku omjera "govora" i "jezika", što je omjer nasumično uzetog uzorka prema statističkom agregatu (populaciji). Sam redoslijed raspodjele frekvencija, kao talog stoljetne govorne djelatnosti jedne jezične zajednice, element je izbora (izbora), ali ne individualnog izbora, kao u stilu, nego kolektivnog izbora. Metaforički se ovdje može govoriti o izboru duha jezika, ako pod tim razumijemo načela jezične komunikacije koja su u skladu sa sklopom mentalnih podataka pripadnika pojedine jezične zajednice. Stabilnost niza je rezultat vjerojatnosti (slučajnosti)» 8 6 .

Poseban slučaj primjene navedenog načela<127>pa je razgraničenje u jeziku normativnih pojava od »iznimki« (odstupanja). U lingvističkoj statistici tvrdi se da vam statistička metoda omogućuje uklanjanje postojećeg ovo pitanje nejasnoće i uspostaviti jasne kriterije za razlikovanje tih pojava. Ako se pod normom podrazumijeva statistička populacija (u gore navedenom smislu), a iznimka (ili pogreška) je odstupanje od frekvencija koje pokazuje statistička populacija, tada se kvantitativno rješenje pitanja nameće samo po sebi. Sve se svodi na statistički odnos između "populacije" i "outliera". Ako učestalosti opažene u pojedinačnom uzorku odstupaju od vjerojatnosti zbog statističke populacije za više nego što je određeno nizom prebrojavanja uzoraka, tada imamo razloga zaključiti da je linija razgraničenja između "isto" (norma) i "nije isti" (izuzetak) je prekršen.

Kvantitativne razlike između "jezika" i "govora" također se koriste za razlikovanje dviju vrsta jezičnih elemenata: gramatičkih i leksičkih. Polazište za rješavanje ovog problema, koji s lingvističkog gledišta često predstavlja velike poteškoće, jest pretpostavka da je stupanj učestalosti gramatičkih elemenata različit od onog leksičkih jedinica. To je navodno povezano s "generalizacijom" gramatičkih elemenata, koliko se oni razlikuju od pojmova fiksiranih leksičkim jedinicama. Osim toga, gramatički elementi su navodno u pravilu znatno manjeg obujma: kao samostalne riječi (oni uključuju zamjenice, prijedloge, veznike i službene riječi) obično se sastoje od malog broja fonema, a u obliku "srodnih oblika" - od jednog ili dva fonema 8 7 . Što je manji jezični element, to je njegova "duljina" (kvantitativni moment) manje sposobna da posluži kao određujuća karakteristika, a "kvaliteta" fonema postaje važnija za tu svrhu. Koje su metode predložene za rješavanje problema koji se razmatra? Rješava se pozivanjem na čisto kvantitativni koncept gramatičkog<128>load, “Pretpostavimo,” piše Herdan u vezi s tim, “da smo zainteresirani za usporedbu dva jezika u tom smislu. Kako s određenim stupnjem objektivnosti odrediti "gramatičko opterećenje" koje jezik nosi? Jasno je da će ovo opterećenje ovisiti o položaju demarkacijske crte koja odvaja gramatiku od vokabulara. Prvo što bi nam moglo pasti na pamet jest odrediti koliko je "složena" gramatika određenog jezika. Uostalom, "složenost" je kvalitativna karakteristika, a koncept "gramatičkog opterećenja" je kvantitativna karakteristika. Istina, opterećenje u određenoj mjeri ovisi o složenosti, ali ne u potpunosti. Jezik može biti nagrađen izuzetno složenom gramatikom, ali samo se relativno mali dio nje koristi u jezičnoj aktivnosti. "Gramatičko opterećenje" definiramo kao ukupnost gramatike koju jezik nosi dok je u akciji, što odmah dovodi naš problem u područje strukturne lingvistike u smislu u kojem je disciplinu definirao Saussure. U sljedećoj prezentaciji, kvantitativne metode se koriste za određivanje razlike između jezika, ovisno o tome gdje je granica, odvajajući gramatiku od vokabulara” 8 8 . Drugim riječima, jezične razlike u ovom slučaju treba svesti na razlike u brojčanim odnosima između gramatičkih i leksičkih elemenata.

Materijali koji su nam na raspolaganju daju sljedeću sliku. U Engleski jezik(u obzir su uzete samo „gramatičke riječi“: zamjenice, ili kako ih još nazivaju „zamjene“, prijedlozi, veznici i pomoćni glagoli) u segmentu koji obuhvaća 78.633 slučaja uporabe svih riječi (1027 različitih riječi), pronađena su 53.102 slučaja uporabe gramatičkih elemenata, točnije „gramatičkih riječi“ (149 različitih riječi), što je 67,53 % kod 15,8 % različitih riječi. Takvi su podaci Dewaya 8 9 . Ostali podaci pokazuju drugačiji postotak<129>omjer: 57,1% s 5,4% različitih riječi 9 0 . Ovo značajno odstupanje objašnjava se razlikom između pisanog i govornog jezika. Pisani obrasci jezici (prvi podatak) navodno koriste više gramatičkih elemenata od usmenih (drugi slučaj). U Danteovoj Božanstvenoj komediji (prema talijanskom izvorniku) Mariotti je utvrdio 54,4% pojavljivanja "gramatičkih riječi".

Drugi i, očito, savršeniji način za određivanje gramatičkog opterećenja jezika je brojanje fonema uključenih u gramatičke elemente. U ovom slučaju ne uzimaju se u obzir samo neovisne gramatičke riječi, već i srodni oblici. Ovdje su mogući razne opcije. Na primjer, određivanje relativne učestalosti uporabe pojedinih suglasničkih fonema u gramatičkim elementima i njihova usporedba s učestalošću ukupne uporabe tih istih fonema (konačni podatak takvog omjera u engleskom jeziku daje omjer od 99,9% prema 100 000 - ukupna upotreba); ili slično uspoređivanje suglasnika prema posebnim klasifikacijskim skupinama (labijalni, palatalni, velarni i drugi fonemi). Konačni omjer ovdje ima oblik omjera od 56,47% (u gramatičkim elementima) prema 60,25% (u ukupnoj upotrebi); ili ista usporedba početnih suglasničkih fonema (u ovom slučaju omjer je bio 100,2% u gramatičkim riječima prema 99,95 u ukupnoj upotrebi). Moguće su i druge složenije statističke operacije, koje, međutim, rezultiraju sličnim kvantitativnim izrazima proučavanog problema.

Navedeni kvantitativni podaci služe kao temelj za opći zaključak. Svodi se na činjenicu da distribucija fonema u gramatičkim elementima određuje prirodu distribucije (u numeričkom smislu, naravno) fonema u jeziku kao cjelini. A to nam pak omogućuje da zaključimo da uporaba gramatičkih elemenata u najmanjoj mjeri ovisi o individualnom izboru i čini onaj dio jezičnog izraza koji je kontroliran vjerojatnostima.<130>nost. Ovaj spekulativni zaključak potvrđuje izračunavanje gramatičkih oblika u ruskom jeziku, koje je napravio Esselson 9 1 . Studiji je podvrgnuto 46896 riječi preuzetih iz II izvora (djela Gribojedova, Dostojevskog, Gončarova, Saltikova-Ščedrina, Garšina, Belinskog, Amfiteatrova, Guseva-Orenburškog, Erenburga, Simonova i N. Ostrovskog). Podijeljeni su na kolokvijalne riječi (17 756 riječi ili 37,9%) i nekolokvijalne (29 140 riječi ili 62,1%). Potom je cjelokupni skup riječi podijeljen u 4 skupine ovisno o njihovoj gramatičkoj prirodi: u 1. skupini su imenice, pridjevi, pridjevi u funkciji imenica, zamjenice i sklonjeni brojevi; u 2. skupini - glagoli; u 3. skupini - glagolski participi, participi u funkciji pridjeva i imenica i gerundija; u 4. skupini - nepromjenljivi oblici priloga, prijedloga, veznika i čestica. Sumarni rezultati (date su i tablice s podacima za pojedine autore) daju sljedeći omjer:

1. skupina

2. skupina

3. skupina

4. skupina

kolokvijalni

šutljiv

Promatranje tako dobivenih kvantitativnih podataka Herdan karakterizira sljedećim riječima: „Oni opravdavaju zaključak da gramatičke elemente treba promatrati kao faktor koji određuje vjerojatnost jezičnog izraza. Ovakvim zaključkom izbjegava se opterećujuća kvalifikacija svake upotrijebljene riječi. Jasno je da, budući da gramatika i vokabular nisu pohranjeni u vodonepropusnim ljuskama, niti je čisti "izbor" ili čista "slučajnost". I gramatika i vokabular sadrže oba elementa, iako u značajno različitim omjerima” 9 2 .<131>

Velik dio Herdanove knjige posvećen je proučavanju dualnosti ili dualnosti u jeziku, a sam koncept dualnosti temelji se na matematičkim karakteristikama.

Dakle, teoreme u projektivnoj geometriji možemo rasporediti u dva niza, tako da se svaki teorem jednog niza može dobiti iz nekog teorema drugog niza zamjenom riječi točka I ravno. Na primjer, ako je dana izjava: "bilo koja različita točka pripada jednom i samo jednom pravcu," tada iz nje možemo izvesti odgovarajuću izjavu: "bilo koja dva različita pravca pripadaju jednoj i samo jednoj točki." Druga metoda za određivanje dualnosti je crtanje duž apscise i y-osi različite planove fenomen koji se proučava. Dakle, kao što to čini npr. Yul 9 3, na apscisi se broje različite učestalosti uporabe, a na ordinati broj leksičkih jedinica čija je učestalost određena itd. Tako se pojam dvojine računa. protumačeno, navodno jednako primjenjiv na lingvistička istraživanja.

Pod ovako definiran pojam dvojine, koji u svim slučajevima zapravo ima karakter binarnog koda i koji se ujedno smatra i najbitnijim obilježjem jezične strukture, dovode se fenomeni krajnje različitih kvaliteta koji dopuštaju suprotstavljanje na dva plana. : raspodjela uporabe riječi prema prirodi leksičkih jedinica i raspodjela leksičkih jedinica prema učestalosti uporaba riječi; pisani i govorni oblici govora; leksički i gramatički elementi; sinonimi i antonimi; fonem i njegov grafički prikaz; odredivi i određujući (Saussureov signifiant i signifiy) itd.

Nakon kvantitativnog proučavanja dvojnosti jedne ili druge pojedine, jezične pojave ili ograničenog »teksta« u pravilu se izvodi zaključak kojemu se pripisuju svojstva jezične univerzalnosti. Priroda takvih zaključaka i način na koji su oni opravdani može se vidjeti na primjeru<132>proučavanja dvojnosti riječi i pojma (riječ je zapravo o odnosu duljine riječi i obujma pojma – valja imati na umu da je krajnje slobodna uporaba jezičnih i drugih pojmova u takva djela često otežavaju razumijevanje). Važno je napomenuti da su kao materijal koji je poslužio kao izvor zapažanja ove vrste jezičnog dvojstva korišteni: međunarodna nomenklatura bolesti (oko 1000 naziva) i opći registar bolesti u Engleskoj i Wellsu za 1949. godinu. U ovom slučaju dolazi se do sljedećeg općeg zaključka: “Svaki koncept koji označava opću ideju ima ono što se može nazvati "sfera" ili "volumen". Kroz svoj medij omogućuje razmišljanje o mnogim predmetima ili drugim pojmovima koji su unutar njegove "sfere". S druge strane, sve stavke potrebne za definiranje koncepta čine ono što se naziva njegovim "sadržajem". Volumen i sadržaj su u međusobnoj korelaciji – što je sadržaj manji i, shodno tome, što je pojam apstraktniji, to mu je opseg ili obujam veći, odnosno podvodi se više predmeta. To se može promatrati kao analogija (u konceptualnoj sferi) s načelima kodiranja, prema kojima su duljina simbola i učestalost uporabe međuovisne” 9 4 .

Načelo dualnosti vrijedi i za određene probleme. Na primjer, pri utvrđivanju istovjetnosti značenja dviju riječi različiti jezici. Kao rezultat proučavanja englesko-njemačkog rječnika Muret-Zandersa korištenjem metode matematičke iteracije, zaključuje se da vjerojatnost korištenja engleske riječi s jednim ili više značenja u njemačkom prijevodu ostaje konstantna za svako početno slovo u cijelom rječniku 9 5 . Razmatranje reda riječi u kineskim rječnicima dovodi do zaključka da je on taksonomske prirode, budući da broj poteza u znaku ukazuje na njegovo mjesto (kao samostalnog radikala ili određenog podrazreda podređenog radikalu). Taksonomija je podređeno načelo klasifikacije koje se koristi u zoologiji i botanici. Kherdan tvrdi da<133>temelji kineske leksikografije izgrađeni su i na načelima taksonomije 9 6 itd.

Dajući opću ocjenu ovog područja primjene matematičkih metoda u proučavanju jezičnih problema (tj. jezične statistike), potrebno je, očito, poći od stava koji je formulirao Ettinger: "Matematika se može učinkovito koristiti u službi lingvistike samo onda kada su lingvistima jasne stvarne granice njegove primjene, kao i mogućnosti korištenih matematičkih modela” 9 7 . Drugim riječima, o matematičkoj lingvistici možemo govoriti kada matematičke metode pokažu svoju prikladnost za rješavanje onih pravih jezičnih problema koji u svojoj ukupnosti čine znanost o jeziku. Ako to nije slučaj, iako to može otvoriti nove aspekte znanstvenog istraživanja, onda se u ovom slučaju može govoriti o bilo čemu, samo ne o lingvistici - u ovom slučaju ne mislimo različiti tipovi primijenjena lingvistika (o njoj će biti riječi u nastavku), te znanstvena, odnosno teorijska lingvistika. Na temelju ovog stajališta treba primijetiti da je s gledišta jezikoslovca mnogo toga u lingvističkoj statistici dvojbeno, pa čak i zbunjujuće.

Prijeđimo na analizu samo dva primjera (kako ne bismo zatrpavali izlaganje), uz uvjet da se svakom od njih mogu dati vrlo značajne primjedbe. Ovdje imamo kvantitativnu razliku između gramatičkih i leksičkih jedinica. Ispada da je za takvo razlikovanje potrebno već unaprijed znati što spada u područje gramatike, a što u vokabular, budući da je “gramatičko opterećenje” jezika (tj. ukupnost gramatičkih elemenata) koji se koristi u govoru), kao što je gore citirano, "ovisi o liniji razgraničenja koja odvaja vokabular od gramatike." Ne znajući gdje leži ta linija, nemoguće je povući naznačenu razliku. Koje je onda značenje kvantitativne metode razlikovanja leksičkog od gramatičkog?<134>matic? No, što se tiče Herdana, on se posebno ne bavi ovim pitanjem i hrabro klasificira jezične elemente, misleći na gramatičke elemente "vezane oblike", koje, sudeći po prikazu, treba shvatiti kao vanjsku fleksiju, i "gramatičke riječi", koji uključuju prijedloge, veznike, pomoćne glagole i zamjenice - potonje na temelju činjenice da su "zamjene". Ali ako govorimo samo o ovoj kvaliteti zamjenica i na temelju toga ih povezujemo s gramatičkim elementima, onda im, očito, treba pripisati i riječi kao što su "gore spomenuto", "nazvano", "dano" itd. kako i oni djeluju kao poslanici. U vezi s metodom odvajanja gramatičkih elemenata koja se koristi u lingvističkoj statistici, prirodno se postavlja pitanje kako u ovom slučaju postupati s takvim "neformalnim" gramatičkim fenomenima kao što su red riječi, tonovi, nulti morfemi, paradigmatski odnosi (neki od ovih fenomena , usput, pronaći odraz u onim jezicima koji se proučavaju matematičkim metodama)? Kako povući razliku u jezicima s bogatom unutarnjom fleksijom (kao, na primjer, u semitskim jezicima), gdje ne samo da gramatički modificira korijen (radikal), već mu daje i leksičko postojanje, budući da korijen bez permutacija ima nema stvarnog postojanja u jeziku? Što treba razumjeti pod gramatičkom složenošću jezika, po kojem se kriteriju ona određuje? Ako je kvantitativna točka, koja se u ovom slučaju naglašava na sve moguće načine, onda će jedan od gramatički najtežih jezika biti engleski, koji ima takve konstrukcije kao što su Ishallhavebeencalling ili Hewouldhavebeencalling. U tim se rečenicama samo poziv može klasificirati kao leksički, a sve ostalo, dakle, mora se smatrati gramatičkim. Koje osnove postoje za povezivanje učestalosti uporabe gramatičkih elemenata s općenitošću ili apstraktnošću značenja gramatičkih riječi? Uostalom, posve je očito da je relativno velika učestalost uporabe gramatičkih elemenata određena njihovom funkcijom u konstrukciji rečenice, a što se tiče apstraktnosti značenja, vrlo je lako pronaći veliku<135>broj leksičkih elemenata koji se u tom pogledu lako mogu natjecati s gramatičkim elementima, uvelike im inferiorni u učestalosti (npr. bitak, postojanje, proširenje, prostor, supstancija itd).

Slična vrsta apsurda javlja se pred nas u slučaju definicije dualnosti (dvojstva) riječi i pojma. Potrebno je izuzetno osebujno razumijevanje strukturalne biti jezika da bi se podvrgnuo istraživanju pomoću nomenklature bolesti i bolničkog registra bolesti, koji su, kako je gore navedeno, poslužili kao izvorni materijal za vrlo važne lingvističke zaključke. Ne zadržavajući se na posve opskurnoj uporabi takvih pojmova koji nemaju jezičnu egzistenciju, poput sfere, obujma i sadržaja pojma (usput rečeno, leksičko značenje riječi i pojma označenog znanstvenim pojmom su grubo razriješeni). zbunjen), okrenimo se zaključku koji se donosi u ovom slučaju. Kao što je gore navedeno, bavimo se tvrdnjom da su "opseg i sadržaj međusobno povezani". Cjelokupni tijek rezoniranja koji daje temelje takvom zaključku, kao i metoda matematičkog operiranja jezičnih činjenica, jasno pokazuje da se u ovom slučaju potpuno zanemaruje jedna vrlo bitna kvaliteta jezika, koja remeti sve proračune koji se provode. : sposobnost da se isti "sadržaj" izrazi jezičnim jedinicama različitog "volumena", koje nedvojbeno imaju, štoviše, različitu relativnu učestalost uporabe. Dakle, istu osobu možemo označiti kao Petrov, moj poznanik, on, Moskovljanin, mladić, zaposlenik sveučilišta, brat moje žene, čovjek kojeg smo sreli na mostu itd. U svjetlu takvih činjenica, postoji nedvojbeno su samo privatni zaključci, kojima se, međutim, kako je istaknuto, pridaje univerzalno značenje, ali i svrhovitost primjene samih kvantitativnih metoda na takve jezične probleme.

Ali ponekad se jezikoslovcima nude zaključci u čiju valjanost nema sumnje. To je "osnovni zakon jezika", koji se sastoji u tome da u jeziku postoji određena stabilnost njegovih elemenata i relativna učestalost njihova spominjanja.<136>potrošnja. Nevolja s ovakvim otkrićima je, međutim, što su lingvistima odavno poznata. Uostalom, sasvim je očito da jezik ne bi imao određenu postojanost i da svaki član određene jezične zajednice slobodno mijenja elemente jezika, tada međusobna komunikacija ne bi bila moguća, a samo postojanje jezika postalo bi besmisleno. . Što se tiče raspodjele relativne učestalosti upotrebe pojedinih elemenata jezika, ona je u lingvistici našla svoj izraz u obliku izdvajanja kategorija pasivnog i aktivnog vokabulara i gramatike, čemu je L. V. Shcherba posvetio toliko pažnje. U ovom slučaju statističke metode mogu samo pomoći lingvistima u raspodjeli pojedinih jezičnih elemenata prema kategorijama relativne učestalosti njihove uporabe, ali nemaju razloga tvrditi da otkrivaju bilo kakve nove obrasce od vrijednosti za teorijsku lingvistiku.

S druge strane, lingvistička statistika nudi niz doista "originalnih" zaključaka koji su izrazito indikativni za prirodu znanstvenog mišljenja njezinih pristaša. Tako se složenim statističkim metodama proučava „politički vokabular“ u djelima Churchilla, Benesa, Halifaxa, Stresemanna i drugih, au izračunima za autore koji ne govore engleski koriste se prijevodi njihovih djela na engleski. Rezultati proračuna prikazani su u obliku brojnih tablica, matematičkih formula i jednadžbi. Lingvistička interpretacija kvantitativnih podataka u ovom slučaju svodi se na činjenicu da je Churchillova uporaba "političkog vokabulara" najtipičnija (?) za ovu skupinu autora te da je Churchillova uporaba riječi u slučajevima kada se bavi političkim temama tipična. engleske skupine govora.. 9 8 .

U drugom slučaju, nakon odgovarajućih statističkih manipulacija, zaključuje se da je Hitler prekršio dualitet između "jezika" i "govora" u kvantitativnom smislu ovih pojmova u uporabi nacističke Njemačke. Poseban slučaj razaranja ove dvojnosti je doslovno razumijevanje<137>metaforički obrati (na primjer, "sipati sol u otvorene rane"). Nacistička Njemačka se žigosala s toliko neljudskih djela da jedva da ima potrebe osuđivati ​​je za ovu jezičnu grozotu 9 9 . Prema Kherdanu, Marxova definicija jezika kao neposredne zbilje mišljenja također dovodi do narušavanja jezične dvojnosti, a zakon dijalektike o prijelazu fenomena u svoju suprotnost je, po njemu, krivo shvaćen jezični zakon dvojnosti. jezika. Takva tumačenja govore sama za sebe.

Naposljetku, zajednički nedostatak svojstven svim navedenim slučajevima kvantitativne metode proučavanja jezičnog materijala i time dobivanja metodološkog karaktera jest pristup jezičnim elementima kao mehaničkom skupu činjenica apsolutno neovisnih jedna o drugoj, u skladu s kojim, ako uopće postoji, ili obrasci, oni se odnose samo na numeričke odnose raspodjele autonomnih činjenica, izvan njihovih sistemskih ovisnosti. Istina, J. Watmou na sve moguće načine pokušava uvjeriti da je upravo matematika bolja od bilo koje jezične strukturne analize, sposobna otkriti strukturne značajke jezika. “Moderna matematika”, piše on, “ne bavi se mjerenjem i računom, čija je točnost ograničena samom njihovom prirodom, već prvenstveno strukturom. Zbog toga je matematika vrlo pogodna za točnost učenja jezika - do te mjere da zaseban opis, čak i ograničenije prirode, to nije u stanju ... Baš kao u fizici, matematički elementi se koriste za opisivanje fizičkog svijeta, budući da se pretpostavlja da odgovaraju elementima fizičkog svijeta, tako se u matematičkoj lingvistici pretpostavlja da matematički elementi odgovaraju elementima svijeta govora” 101 . Ali takva formulacija pitanja nikako ne spašava situaciju, jer u najboljem slučaju može<138>analizirati jezik ili kao fizičku strukturu, koja je još daleko od dovoljne za jezik, a u konačnici je još uvijek istog mehaničkog karaktera, ili kao logičko-matematičku strukturu, a to prenosi jezik na drugu ravan, i u mnogočemu tuđa. Nije suvišno primijetiti da Watmow uspjehe matematičke lingvistike predviđa tek u budućnosti, a što se tiče njihovih stvarnih rezultata, ocjenjuje ih sljedećim riječima: “... gotovo sav dosadašnji rad Herdana, Zipfa, Yul, Giro (Guiraux) i drugi, nipošto nije izvan dosega kritike kako lingvistike tako i matematike; ona u velikoj mjeri miriše na amaterizam” 103 . Stoga, ako ne pokušavamo predvidjeti budućnost matematičkih metoda u lingvističkim istraživanjima, nego pokušamo cijeniti ono što imamo danas, tada ćemo morati priznati da je matematika zapravo bila ograničena u polju lingvistike samo na "mjerenje i brojanje ”, a nisam mogao dati kvalitativnu analizu jezika, zalazeći u njegovu strukturu.<139>

Pokušajmo biti što objektivniji. U određenom dijelu kvantitativne podatke, čini se, može koristiti lingvistika, ali samo kao pomoćne i uglavnom u problemima koji imaju praktičnu orijentaciju. Što se tiče većine kvantitativnih metoda proučavanja pojedinih jezičnih pojava, nedvojbeno je opravdan opći zaključak R. Browna: “Mogu se smatrati onako kako ih Kherdan smatra, ali koji je smisao svega toga?” 104 . Zamislimo da postavimo pitanje: "Koja su stabla u ovom vrtu?". A kao odgovor dobivamo: "U ovom vrtu ima stotinu stabala." Je li to odgovor na naše pitanje i ima li doista smisla? Ali na mnoga lingvistička pitanja matematičke metode daju upravo takve odgovore.

Međutim, postoji široko polje istraživačke djelatnosti, koristeći se uglavnom matematičkim metodama i istodobno ih usmjeravajući na jezičnu građu, gdje je svrsishodnost takve kombinacije nedvojbena. "Smisao" ove istraživačke djelatnosti, njezin značaj određen je ciljevima kojima ona teži. To je već provjereno u praksi. U ovom slučaju, govorimo o problemima povezanim sa stvaranjem informacijskih strojeva, struktura za strojno prevođenje pisanog znanstvenih tekstova, automatizacija prevođenja usmenog govora s jednog jezika na drugi i sa svim kompleksom zadataka koji su objedinjeni u lingvističkoj problematici kibernetike. Cijeli skup takvih problema obično se naziva opći naziv primijenjena lingvistika. Time se razlikuje od tzv. matematičke lingvistike, koja obuhvaća ona područja rada koja su gore označena kao stilostatistika i lingvistička statistika, iako nipošto ne zaobilazi statističku obradu jezične građe. Možda je najvažnija značajka primijenjene lingvistike, koja je odvaja od matematičke lingvistike, kao što je gore navedeno, da prva ima suprotan smjer: ne matematika za lingvistiku, već lingvistika.<140>(formaliziran matematičkim metodama) za širok raspon praktičnih problema.

Nema potrebe otkrivati ​​sadržaj pojedinih problema koji su danas uključeni u iznimno široko područje primijenjene lingvistike. Za razliku od matematičke lingvistike, ti se problemi aktivno raspravljaju u sovjetskoj lingvističkoj literaturi i s pravom počinju zauzimati sve istaknutije mjesto u znanstvenim problemima istraživačkih instituta 105 . Dakle, već su dobro poznati našoj jezičnoj zajednici. Ta nas okolnost, međutim, ne oslobađa potrebe da ih podvrgnemo promišljanju, osobito s gledišta načela znanosti o jeziku. To će nedvojbeno pridonijeti otklanjanju nesporazuma koji sve češće nastaju između predstavnika znanosti koje su međusobno vrlo udaljene, a sudjeluju u radu na problemima primijenjene lingvistike, te će nacrtati načine njihova približavanja, s jedne strane. , te razgraničenje područja istraživanja, s druge strane. Razumije se da će sljedeća razmatranja predstavljati gledište jezikoslovca, te je potrebno da ga matematičari ne samo pokušaju asimilirati, već da im, u vezi s postavljenim pitanjima, daju i svoje tumačenje.

Lingvist-teoretičar nikako ne može biti zadovoljan činjenicom da u svim slučajevima<141>jezika u svrhe koje postavlja primijenjena lingvistika, temelj im je matematički model. U skladu s tim, zapažanja o fenomenima jezika i rezultati dobiveni na taj način izražavaju se terminima i pojmovima matematike, odnosno matematičkim jednadžbama i formulama. Pogledajmo primjer radi jasnoće. Condon 1 06 i Zipf 1 07 utvrdili su da su logaritmi frekvencije ( f) pojavljivanja riječi u velikom tekstu nalaze se gotovo u ravnoj liniji, ako su u dijagramu korelirani s logaritmima ranga ili ranga ( r) ovih riječi. Jednadžba f=c:r, Gdje S je konstanta odražava ovaj odnos u ograničenom smislu da c:r za postavljenu vrijednost r reproducira promatranu frekvenciju s velikom aproksimacijom. Veza između f I r, izražena matematičkom formulom, model je odnosa između opaženih vrijednosti učestalosti uporabe i ranga, odnosno ranga, riječi. Ovo je jedan od slučajeva matematičkog modeliranja. 

Cjelokupna teorija informacija u potpunosti se temelji na matematičkom modelu komunikacijskog procesa koji je razvio C. Shannon 108 . Definira se kao "matematička disciplina posvećena metodama izračunavanja i procjene količine informacija sadržanih u bilo kojem podatku, te proučavanju procesa pohranjivanja i prijenosa informacija" (TSB, sv. 51, str. 128). Sukladno tome osnovni pojmovi informacijske teorije dobivaju matematički izraz.Informacija se mjeri u binitima ili binarnim jedinicama (kod, koji se uspoređuje s jezikom, s dva uvjetna jednako vjerojatna signala prenosi jednu binarnu jedinicu informacije tijekom prijenosa svakog znaka ).-ili kod i prosječna količina prenesene informacije<142>formacije. Redundancija se izražava kao postotak ukupne sposobnosti prijenosa koda”, 1 09 itd. Na isti način, strojno prevođenje zahtijeva algoritamski razvoj preslikavanja elemenata jednog jezika u drugi itd. 1 10 . Ovo su drugi slučajevi modeliranja.

Upotreba besmislenih modela može biti od vrlo značajne pomoći, po svoj prilici, osobito u rješavanju problema koje primijenjena lingvistika postavlja pred sebe. Međutim, za teorijsku lingvistiku vrlo je važno da apstraktni model u pravilu ne reproducira sva obilježja stvarne pojave, sve njezine funkcionalne kvalitete. Dakle, arhitekt prije gradnje kuće može izraditi svoj model koji do najsitnijih detalja reproducira kuću koja se projektira, a to mu pomaže u rješavanju brojnih praktičnih pitanja vezanih uz izgradnju same kuće. Ali takav model kuće, ma koliko točan bio, lišen je te "funkcije" i one svrhe za koju su sve kuće općenito građene - nije u stanju pružiti čovjeku stan. Slična je situacija i s jezikom, gdje model nije uvijek u stanju reproducirati sve njegove kvalitete. U ovom slučaju stvar je dodatno komplicirana činjenicom da se za izradu modela ne koriste lingvistički, već matematički kriteriji. “Matematički modeli... - piše A. Ettinger, - igraju iznimno važnu ulogu u svim područjima tehnologije, ali budući da su alat za sintezu, njihovo je značenje za lingvistiku, koja je primarno povijesna i deskriptivna disciplina, prirodno ograničeno. ” 1 11 .<143>

Matematičko modeliranje jezika zapravo je primjenjivo samo na njegovo statično stanje, koje je za jezikoslovca uvjetovano i zapravo je u izravnoj suprotnosti s osnovnom kvalitetom jezika, čiji je sam oblik postojanja razvoj. Razumije se da statično proučavanje jezika nipošto nije isključeno iz lingvistike i da je temelj za izradu normativnih gramatika i rječnika, deskriptivnih gramatika, praktičnih gramatika i rječnika koji služe kao vodič za praktično učenje stranih jezika itd. Međutim, u svim takvim radovima, koji su pretežno primijenjene naravi, jezikoslovci svjesno ograničavaju područje istraživanja i nipošto ne zatvaraju oči pred drugim aspektima jezika 1 12 . Osobito statičkim ispitivanjem jezika posve nestaju takve kvalitete jezika povezane s njegovom dinamičkom prirodom, kao što su produktivnost, ovisnost o oblicima mišljenja i opsežna interakcija s kulturnim, društvenim, političkim, povijesnim i drugim čimbenicima. vidno polje istraživača. Samo na sinkronijskom planu jezik se može smatrati sustavom konvencionalnih znakova ili kodova, što se, međutim, pokazuje posve neopravdanim čim zauzmemo dinamičko gledište prikladnije za jezik. U procesu razvoja dolazi do jezičnih kvaliteta kao što su motiviranost, višeznačnost riječi koje nemaju stabilne granice, neautonomnost značenja riječi i njezine zvučne ljuske te tvorbeni potencijal riječi povezan s kontekstom. očituje se, a sve je to u oštroj suprotnosti s glavnim karakteristikama koda ili znaka 1 13 . Očito, u primijenjenoj lingvistici također se može razmišljati o svim tim kvalitetama jezika i, u praktične svrhe, zadovoljiti se, da tako kažemo, "snimkom" jezika, koja još uvijek može dati prilično približnu ideju o mehanizam njegovog funkcioniranja.<144>nirovaniya. Međutim, svaki takav "snimak", ako se smatra činjenicom jezika, a ne činjenicom sustava konvencionalnih kodova, mora biti uključen u beskrajni proces kretanja u kojem jezik uvijek postoji 1 14 . Ne može se proučavati izvan konkretnih uvjeta koji obilježavaju ovaj pokret, koji ostavlja traga na njemu dato stanje jezika i uvjetovanje potencije njegova daljnjeg razvoja. Ovdje postoji ista razlika kao između trenutne fotografije osobe i njenog portreta naslikanog kistom. pravi umjetnik. U umjetnikovu djelu pred sobom imamo generalizirajuću sliku čovjeka u svoj originalnosti ne samo njegova tjelesnog izgleda, već i njegova unutarnjeg duhovnog sadržaja. Iz umjetničkog portreta možemo iščitati i prošlost osobe koja je na njemu prikazana i utvrditi za što je sposoban u svojim postupcima. A snimka, iako može dati točniju sliku izgleda originala, lišena je tih svojstava i često bilježi i slučajni prištić koji je skočio na nosu i<145>potpuno nesvojstvenu pozu ili izraz, što u konačnici dovodi do iskrivljavanja izvornika.

Valja napomenuti da se metoda "snimki" može, naravno, primijeniti na činjenice razvoja jezika. Ali u ovom slučaju, zapravo ćemo se baviti samo odvojenim stanjima jezika, koja se u svojoj kvantitativnoj karakterizaciji ispostavljaju ne više povezanim od usporedne kvantitativne karakterizacije različitih jezika. Ovakva kvantitativna "dinamika" neće sadržavati ništa organsko, a veza između pojedinih stanja jezika počivat će samo na usporedbi brojčanih odnosa. Ako iu ovom slučaju pribjegnemo analogiji, onda se možemo pozvati na rast djeteta. Njegov se razvoj, naravno, može prikazati u obliku dinamike brojčanih podataka o njegovoj težini, visini, promjenjivim omjerima volumena dijelova njegova tijela, ali svi su ti podaci apsolutno odvojeni od svega onoga što primarno čini individualnu bit. osobe - njezin karakter, sklonosti, navike. , okusi itd.

Druga negativna strana matematičkog "modeliranja" jezika jest činjenica da ono ne može poslužiti kao opće načelo na temelju kojega je moguće izvršiti cjelovit i obuhvatan - sustavan opis jezika. Samo matematički pristup pojavama jezika, na primjer, neće omogućiti odgovor ni na tako temeljna pitanja (bez kojih je nezamislivo postojanje znanosti o jeziku), kao što su: što je jezik, što bi fenomeni trebali biti klasificiran kao pravi lingvistički, kako se definira riječ ili rečenica, koji su osnovni pojmovi i kategorije jezika, itd. Prije nego što se okrenemo matematičkim metodama proučavanja jezika, potrebno je već imati odgovore (čak iu obliku radnog hipoteza) na sva ta pitanja unaprijed. Ne treba zatvarati oči pred činjenicom da su u svim nama poznatim slučajevima proučavanja jezičnih pojava matematičkim metodama svi ti pojmovi i kategorije neizbježno morali biti prihvaćeni onako kako su definirani tradicionalnim ili, relativno rečeno, kvalitativne metode.

Ovu značajku matematičkih metoda u njihovoj lingvističkoj primjeni primijetio je Spang-Hanssen kada je pi<146>sal: “Treba imati na umu da promatrane činjenice koje dobivaju kvantitativni izraz ... nemaju nikakvu vrijednost ako ne čine dio opisa, a za lingvističke svrhe to bi trebao biti sustavni opis, usko povezan s kvalitativnim jezičnim opis i teorija” 1 15 . U drugom Spang-Hanssenovom govoru nalazimo pojašnjenje ove ideje: “Sve dok se ne dokaže mogućnost konstruiranja kvantitativnog sustava, i sve dok postoji općeprihvaćeni kvalitativni sustav za dano područje proučavanja, izračuni učestalosti i drugi numeričke karakteristike s lingvističkog gledišta vizije nemaju nikakvog smisla" 1 16 . Slične ideje iznosi i Uldall, pomalo neočekivano povezujući ih s razvojem općih teorijskih temelja glosematike: “Kad lingvist razmatra ili mjeri sve što razmatra i mjeri, ono samo po sebi nije kvantitativno određeno; na primjer, riječi, kada se broje, definirane su, ako su uopće definirane, sasvim različitim terminima.<147>

Tako se ispostavlja da su matematičke metode iu teoretskom smislu iu svojoj praktičnoj primjeni izravno ovisne o lingvističkim pojmovima i kategorijama definiranim tradicionalnim, filološkim ili, kako je gore navedeno, kvalitativnim metodama. U smislu primijenjene lingvistike važno je uvidjeti tu ovisnost, a samim tim i upoznati se s ukupnošću glavnih kategorija tradicionalne lingvistike.

Istina, nema razloga zamjeriti predstavnicima egzaktnih znanosti koji rade na području primijenjene lingvistike što se ne koriste podacima suvremene lingvistike. To ne odgovara stvarnom stanju stvari. Oni ne samo da savršeno dobro poznaju, nego i naširoko koriste u svom radu sustave razlikovnih obilježja koje su uspostavili jezikoslovci, a koji su karakteristični za različite jezike, distribuciju i raspored jezičnih elemenata unutar pojedinih jezičnih sustava, dostignuća akustičke fonetike itd. Ali u ovom slučaju potrebna je vrlo značajna rezerva. Naime, predstavnici egzaktnih znanosti koriste se podacima samo jednog pravca u lingvistici - tzv. deskriptivne lingvistike, koja se namjerno odvojila od tradicionalnih problema teorijske lingvistike, daleko od toga da zahvati cjelokupno područje lingvističkog istraživanja, od pravog s lingvističkoga gledišta, ono ima znatne metodološke nedostatke, koji su ga doveli do nedavno otkrivene krize 1 18 , a štoviše, ima čisto praktičnu usmjerenost, koja odgovara interesima primijenjene lingvistike. Sve rezerve i prijekori koji su gore izneseni protiv statičkog razmatranja jezika primjenjivi su na deskriptivnu lingvistiku. Takav jednostran pristup deskriptivne lingvistike može, istraživač<148>No, to se može opravdati samo zadaćama koje si postavlja primijenjena lingvistika, ali ni izdaleka ne iscrpljuje cjelokupni sadržaj znanosti o jeziku.

U procesu razvoja pitanja primijenjene lingvistike mogu se pojaviti novi teorijski problemi, koji su se zapravo već pojavili. Neki od tih problema usko su povezani sa specifičnim zadaćama primijenjene lingvistike i usmjereni su na prevladavanje poteškoća koje se javljaju pri rješavanju tih problema. Ostali problemi izravno su povezani s teoretskom lingvistikom, omogućujući novu perspektivu tradicionalnih ideja ili otvarajući nova područja lingvističkih istraživanja, nove koncepte i teorije. Među ovim posljednjima, na primjer, problem je stvaranja "strojnog" jezika (ili jezika posrednika), koji je najuže povezan sa složenim skupom tako kardinalnih pitanja teorijske lingvistike kao što su odnos pojmova i leksičkih značenja, logika i gramatika, dijakronija i sinkronija, znakovna priroda jezika, bit jezičnog značenja, principi konstruiranja umjetnih jezika itd. 1 19 . U ovom slučaju posebno je važno uspostaviti međusobno razumijevanje i zajedništvo u zajedničkom radu predstavnika lingvističkih disciplina i egzaktnih znanosti. Što se tiče lingvističke strane, u ovom slučaju, po svemu sudeći, ne treba govoriti o tome da već unaprijed ograničavamo napore npr. dizajnera prevoditeljskih strojeva” i pokušavamo utvrditi radnu sposobnost takvih strojeva stihovima N. Gribačov ili proza ​​V. Kočetova 1 20 . Stroj će sam pronaći granice svojih mogućnosti, a isplativost - granice svoje upotrebe. Ali lingvisti, kao svoj doprinos zajedničkoj stvari, moraju unijeti svoje znanje o značajkama strukture jezika, njegovoj mnogostranosti, unutarnjim međusobnim odnosima njegovih elemenata, kao i širokim i višestranim vezama jezika s fizičkim, fiziološkim , mentalno i logično<149>mi fenomeni, specifični obrasci funkcioniranja i razvoja jezika. Cjelokupnost ovih znanja je neophodna dizajnerima odgovarajućih strojeva kako ne bi lutali u pogrešnim smjerovima, već kako bi potraga bila svrhovita i jasno usmjerena. Čak je i taj vrlo kratki osvrt Slučajevi primjene matematičkih metoda na lingvističke probleme, koji su navedeni u ovom eseju, uvjeravaju da takvo znanje nipošto neće biti suvišno za predstavnike egzaktnih znanosti.

Na temelju svih navedenih razmatranja očito se može doći do nekih općih zaključaka.

Dakle, matematička lingvistika? Ako to znači korištenje matematičkih metoda kao univerzalnog ključa za rješavanje svih lingvističkih problema, onda takve tvrdnje treba priznati kao apsolutno neopravdane. Sve što je u tom smjeru učinjeno do sada je vrlo malo ili čak nimalo doprinijelo rješavanju tradicionalnih problema znanosti o jeziku. U najgorem slučaju, primjena matematičkih metoda je popraćena očitim apsurdima ili je, s jezičnog gledišta, apsolutno besmislena. U najboljem slučaju, matematičke metode mogu se koristiti kao pomoćne metode jezičnog istraživanja, stavljajući se u službu specifičnih i ograničenih jezičnih problema. Ni o kakvoj "kvantitativnoj filozofiji jezika" u ovom slučaju ne može biti riječi. Fizika, psihologija, fiziologija, logika, sociologija i etnologija u svoje su vrijeme zadirale u samostalnost znanosti o jeziku, ali nisu mogle podjarmiti lingvistiku. Dogodilo se upravo suprotno – lingvistika je iskoristila dostignuća tih znanosti i, u mjeri u kojoj je sebi bila potrebna, počela koristiti njihovu pomoć, obogaćujući tako arsenal svojih istraživačkih metoda. Sada je, očito, na red došla matematika. Za nadati se da će ova nova zajednica pridonijeti i jačanju znanosti o jeziku, poboljšanju njezinih metoda rada i povećanju njihove raznolikosti. Stoga je jednako legitimno govoriti o matematičkoj lingvistici kao o fizičkoj lingvistici, fiziološkoj lingvistici, logičkoj lingvistici, psihološkoj lingvistici i<150>itd. Takve lingvistike nema, postoji samo jedna lingvistika, koja se korisno služi podacima drugih znanosti kao pomoćnim istraživačkim oruđem. Dakle, nema razloga uzmicati pred naletom nove znanosti i olako joj prepuštati osvojene pozicije. Ovdje je vrlo prikladno prisjetiti se riječi A. Martineta: “Možda je primamljivo pridružiti se jednom ili drugom velikom pokretu misli korištenjem nekoliko dobro odabranih izraza ili nekom matematičkom formulom deklarirati strogost nečijeg razmišljanja. No, došlo je vrijeme da lingvisti shvate neovisnost svoje znanosti i da se oslobode tog kompleksa manje vrijednosti koji ih tjera da svako svoje djelovanje povezuju s ovim ili onim općim znanstvenim načelom, uslijed čega obrisi stvarnosti uvijek postaju samo nejasniji, umjesto da postane jasniji 21 .

Dakle, matematika po sebi i lingvistika po sebi. To nikako ne isključuje njihovu međusobnu pomoć ili prijateljski susret u zajedničkom radu na zajedničkim problemima. Ovakvo mjesto primjene zajedničkih napora dviju znanosti cijeli je široki spektar problema koji su dio primijenjene lingvistike i od velikog su nacionalnog gospodarskog značaja. Treba samo poželjeti da u zajedničkom radu obje znanosti pokažu maksimalno međusobno razumijevanje, što bi nedvojbeno pridonijelo i što većoj plodonosnosti njihove suradnje.<151>

Sadržaj
Uvod
Poglavlje 1. Povijest primjene matematičkih metoda u lingvistici
1.1. Formiranje strukturne lingvistike na prijelazu iz 19. u 20. stoljeće
1.2. Primjena matematičkih metoda u lingvistici u drugoj polovici 20. stoljeća
Zaključak
Književnost
Uvod
U 20. stoljeću nastavlja se trend interakcije i prožimanja različitih područja znanja, granice između pojedinih znanosti postupno se brišu; sve je više grana umne djelatnosti koje su "na spoju" humanitarnih, tehničkih i prirodoslovnih znanja.
Još jedna očita značajka modernosti je želja za proučavanjem struktura i njihovih sastavnih elemenata. Stoga, sve više mjesta u znanstvena teorija a u praksi se daje matematici. Dolazeći u dodir, s jedne strane, s logikom i filozofijom, s druge strane, sa statistikom (a time i s društvenim znanostima), matematika zadire sve dublje u ona područja koja su se dugo vremena smatrala čisto "humanitarne", proširujući njihov heuristički potencijal (odgovor na pitanje "koliko" često će pomoći odgovoriti na pitanja "što" i "kako"). Lingvistika nije bila iznimka.Moj cilj seminarski rad- ukratko osvijetliti vezu matematike i takve grane lingvistike kao što je lingvistika. Od 1950-ih, matematika se koristi u lingvistici za stvaranje teorijskog aparata za opisivanje strukture jezika (i prirodnih i umjetnih). Međutim, treba reći da nije odmah pronašla svoju vrstu. praktičnu upotrebu. U početku su se matematičke metode u lingvistici počele koristiti za pojašnjenje temeljnih pojmova lingvistike, međutim razvojem računalne tehnologije takva se teorijska postavka počela primjenjivati ​​u praksi. Rješavanje takvih zadataka kao što su strojno prevođenje, strojno pronalaženje informacija, automatska obrada teksta zahtijevalo je temeljno novi pristup jeziku. Pred lingvistima se postavilo pitanje: kako naučiti predstavljati jezične obrasce u obliku u kojem se mogu izravno primijeniti na tehnologiju. Pojam “matematička lingvistika”, koji je popularan u naše vrijeme, odnosi se na svako lingvističko istraživanje koje koristi egzaktne metode (a pojam egzaktnih metoda u znanosti uvijek je usko povezan s matematikom). Neki znanstvenici prošlih godina smatraju da se sam izraz ne može uzdići u rang pojma, jer ne znači nikakvu posebnu "lingvistiku", već samo novi smjer usmjeren na poboljšanje, povećanje točnosti i pouzdanosti metoda istraživanja jezika. Lingvistika koristi i kvantitativne (algebarske) i nekvantitativne metode, čime se približava matematičkoj logici, a posljedično i filozofiji, pa čak i psihologiji. Čak je i Schlegel uočio međudjelovanje jezika i svijesti, a istaknuti lingvist s početka dvadesetog stoljeća Ferdinand de Saussure (o njegovom utjecaju na razvoj matematičkih metoda u lingvistici govorit ću kasnije) povezuje strukturu jezika s njegovom pripadnošću. ljudima. Suvremeni istraživač L. Perlovsky ide dalje, poistovjećujući kvantitativne karakteristike jezika (na primjer, broj rodova, padeža) s osobitostima nacionalnog mentaliteta (više o tome u odjeljku 2.2, "Statističke metode u lingvistici").
Interakcija matematike i lingvistike je višestruka tema, au svom radu se neću zadržati na svim, već prije svega na njezinim primijenjenim aspektima.
Poglavlje I. Povijest primjene matematičkih metoda u lingvistici
1.1 Formiranje strukturne lingvistike na prijelazu iz XIX. u XX. stoljeće
Matematički opis jezika temelji se na ideji jezika kao mehanizma, koja datira još od slavnog švicarskog lingvista s početka dvadesetog stoljeća, Ferdinanda de Saussurea.
Početna poveznica njegovog koncepta je teorija jezika kao sustava koji se sastoji od tri dijela (sam jezik - langue, govor - parole i govorna aktivnost - langage), u kojem se svaka riječ (član sustava) ne razmatra sama za sebe. , ali u vezi s drugima....


Vrh