Historien om anvendelsen av matematiske metoder i lingvistikk. Utsikter for anvendelse av matematiske metoder i lingvistikk

Penetrasjon i lingvistikk matematiske metoder og "matematisk ånd" bidro til utviklingen av lingvistikk i retning av nøyaktighet og objektivitet. Men på vei videre utvikling det er alvorlige hindringer i denne retningen. Forfatteren reflekterer over årsakene til konvergensen mellom lingvistikk og matematikk, over grensene for anvendelighet av matematiske metoder i lingvistikk, og over arten av faktorer som hindrer gjensidig forståelse mellom matematikere og lingvister.

Da noen unge lingvister på andre halvdel av 1950-tallet tenkte på å bruke matematiske metoder for å studere språkets struktur og begynte å samarbeide med matematikere, skapte dette overraskelse og til og med sjokk blant svært mange av deres kolleger - de var tross alt overbevist om fra barndommen det humanitære vitenskaper, hvorav en er lingvistikk, har ikke og kan ikke ha noe til felles med matematikk og andre "eksakte" vitenskaper.

I mellomtiden var eksistensen av en nær forbindelse mellom naturlig språk og matematikk slett ikke en ny oppdagelse på den tiden. L. S. Vygotsky skrev i sin bok "Thinking and Speech" utgitt i 1934: "Den første som så i matematikk tenkning som stammer fra språket, men overvinner det, var tilsynelatende Descartes" og fortsatte: "Vår vanlige dagligdagse på grunn av dens iboende svingninger og inkonsekvenser av grammatisk og psykologisk, er den i en tilstand av mobil likevekt mellom idealene om matematisk og fantastisk harmoni og i en uopphørlig bevegelse, som vi kaller evolusjon.

Står opp i Antikkens Hellas læren om grammatiske kategorier var allerede en beskrivelse av en rekke av de viktigste aspektene ved strukturen til språket ved hjelp av abstrakte modeller i stil med de modellene som ble skapt av gamle greske matematikere for å beskrive romlige former; bare kjennskapen til slike begreper som kasus, kjønn, etc., som har blitt, som H. Steinthal skrev, "vår andre natur", hindrer oss i å forstå hvilket høyt nivå av abstrakt tenkning deres skapelse krevde. Så du bør bli overrasket heller enn at de første forsøkene på å bruke ekte matematiske virkemidler for å beskrive det språklige «idealet om matematisk harmoni» ble gjort først på midten av det tjuende århundre.

Det er to grunner til denne "forsinkelsen". For det første vitenskapen om språk, etter betydelige skritt tatt inn eldgamle tid, begynte virkelig å utvikle seg igjen først på 1800-tallet, men gjennom dette århundret ble hovedoppmerksomheten til språkforskerne rettet mot språkets historie, og først i det neste århundre, som generelt var strukturalismens tidsalder for humaniora, lingvistikk for første gang etter antikken vendte seg til studiet av språkstrukturer, men på et nytt nivå. Da lingvister innså at språk er, med F. de Saussures ord, et "system av rene relasjoner", dvs. et system av tegn, hvis fysiske natur er ubetydelig, og bare relasjonene mellom dem er signifikante, parallellen mellom språk og matematiske konstruksjoner ble ganske åpenbare , som også er "systemer av rene relasjoner", og allerede på begynnelsen av det tjuende århundre drømte den samme de Saussure om å studere språket med matematiske midler.

For det andre kom kvantitative metoder frem i matematikken på begynnelsen av New Age, og først på 1800-tallet begynte matematikere igjen å bygge ikke-kvantitative abstrakte modeller som skilte seg mer fra de gamle. høy level abstraksjoner, og også - som er spesielt viktig for vårt emne - ved at de kunne brukes til å beskrive et mye bredere spekter av fenomener enn romlige former; ofte viste slike modeller seg å være praktiske og jevne nødvendige midlerå studere fenomener som matematikerne som bygde dem ikke trodde i det hele tatt og ikke engang visste om deres eksistens. Blant disse modellene var de som senere fikk anvendelse i lingvistikk; spesielt intensiv utvikling av matematiske disipliner, hvis innhold var deres konstruksjon, skjedde i første halvdel av det tjuende århundre. Derfor var møtet mellom matematikk og lingvistikk i midten av dette århundret ganske naturlig.

Et av resultatene av dette møtet var fremveksten av en ny matematisk disiplin - matematisk lingvistikk, hvis emne er utviklingen av et matematisk apparat for lingvistisk forskning. Den sentrale plassen i matematisk lingvistikk er okkupert av teorien om formell grammatikk, som, på grunn av arten av apparatet som brukes i den, er relatert til matematisk logikk og spesielt til teorien om algoritmer. Den gir formelle metoder for å beskrive de riktige språkenhetene. ulike nivåer, og også, som er spesielt viktig, formelle metoder for å beskrive transformasjonene av språkenheter - både på samme nivå og mellom nivåer. Teorien om syntaktiske strukturer grenser til teorien om formell grammatikk, som er mye enklere når det gjelder apparat, men ikke mindre viktig for språklige anvendelser. I matematisk lingvistikk utvikles det også analytiske modeller av språket, der det, på grunnlag av visse - ansett kjente - data om "riktige tekster", lages formelle konstruksjoner, resultatet av disse er en beskrivelse av noen " bestanddeler» språkmekanisme. På denne måten kan man få en formell beskrivelse av noen tradisjonelle grammatiske begreper. Dette bør også inkludere beskrivelsen av betydningen av setningen ved å bruke apparatet for intensjonell logikk ("Montagu-semantikk").

Ved hjelp av det matematiske apparatet kan selvsagt bare ett av de to språkidealene som Vygotsky snakket om, beskrives; derfor gir de ofte hørte innvendingene mot bruken av en eller annen matematisk modell (eller matematiske modeller generelt) med den begrunnelse at den ikke dekker slike og slike spesielle tilfeller ikke fornuftig: å beskrive "svingningene og inkonsekvensene" som ligger i språket trenger man absolutt andre, ikke-matematiske virkemidler, og bare en klar beskrivelse av det "matematiske idealet" kan hjelpe å finne dem, siden det ville gjøre det mulig å tydelig avgrense det "fantastiske" fra det "matematiske" i Språk. Men dette er fortsatt en sak for fremtiden.

Ikke mindre, og kanskje viktigere enn fremveksten av matematisk lingvistikk, var den direkte penetrasjonen inn i lingvistikken av grunnleggende matematiske ideer og begreper - som sett, funksjon, isomorfisme. I moderne lingvistisk semantikk spiller begrepene predikat og kvantifisering, som kom fra matematisk logikk, en viktig rolle. (Den første av dem oppsto i logikken selv når den ikke ble skilt fra lingvistikk, og nå har den gått tilbake til lingvistikk i en generalisert og matematisk bearbeidet form.)

Og til slutt, veldig veldig viktig har en foredling av språkforskningens språk, som oppstår på grunn av den "matematiske åndens" penetrasjon i lingvistikken, ikke bare på de områdene hvor det er mulig å bruke matematiske ideer og metoder. Alt dette kan kort oppsummeres slik: lingvistikk blir mer og mer nøyaktig og mer objektiv vitenskap – uten at det selvfølgelig slutter å være en humanioravitenskap.

Imidlertid på dette naturlig måte Utviklingen av lingvistikk møter alvorlige hindringer som kan bremse den i lang tid. Den viktigste er "separasjonen av fakulteter" som oppsto i begynnelsen av New Age: naturvitere og matematikere, på den ene siden, og humanitære forskere, på den andre, er ikke interessert i arbeidet til kolleger "i et annet fakultet ” og dessuten innerst inne, og ofte åpenlyst forakter dem. . Matematikere og naturvitere (og enda flere "teknikere") har en tendens til å se humanistisk forskning som bare en slags "pynt" eller til og med "tomtprat", mens "humaniora" er klare til å tolerere matematikk og naturvitenskap bare for praktiske skyld. nytte og er overbevist om at de er ingenting kan hjelpe til å forstå naturen til den menneskelige ånd.

Bare i midten 1800-tallet i dette, med ordene til den store biologen og store tenkeren Konrad Lorenz, «den onde muren mellom naturvitenskap og humaniora (die böse Mauer zwischen Natur- und Geistwissenschaften)» ble det første bruddet gjort på det tynneste sted som skiller logikk fra matematikk. På 1900-tallet dukket det opp andre hull - blant dem den som ble stanset fra begge sider av matematikere og lingvister - men de er fortsatt få, muren er fortsatt sterk, og det mangler ikke på innsats fra begge sider for å styrke den ytterligere og lapp hullene. Ofte er disse forsøkene ganske vellykkede; den siste "prestasjonen" i denne retningen er "profilutdanning" i videregående skole som allerede i barndommen deler dyktige og interesserte mennesker inn i "fakulteter" og lærer dem å være stolte av uvitenhet i "fremmede" vitenskaper - kan i stor grad hindre den videre konvergensen mellom natur- og humanvitenskapene, som er tvingende nødvendig for den normale utviklingen av begge. . En av konsekvensene av å reise muren er at «humaniora», inkludert de aller fleste lingvister, ikke vet noe om det grunnleggende i nettopp de delene av matematikken som har høyeste verdi for humaniora (og se for deg en matematiker som en person som utelukkende er opptatt av beregninger).

En annen hindring er det frenetiske raset som er karakteristisk for den nåværende vitenskapens tilstand, den ustanselige jakten på flere og flere nye "resultater", innsnevrer horisonten og gir ingen tid til å tenke på dypere problemer eller engasjere seg i en seriøs studie av relaterte og, dessuten ikke helt relatert vitenskapelig disiplin. Dette gjelder like mye for lingvister og matematikere - som faktisk alle de som er profesjonelt engasjert i naturvitenskap.

Og den tredje er treghet, eller rett og slett latskap. Ved første øyekast er latskap og et frenetisk løp uforenlige, men i virkeligheten kommer de godt overens med hverandre og støtter og stimulerer hverandre dessuten. Når en person er for lat til å ta på seg en vanskelig oppgave, tar han tak i en enklere og mer "pålitelig" en, suksess som rettferdiggjør og oppmuntrer treghet hans. arrogant holdning til mindre brødre, som svermer på den andre siden av veggen, oppmuntrer også til latskap og oppmuntres av det. Når for eksempel en matematiker foreslår å revurdere alle ideer om eldgamle historie, uten å gi seg selv bryet med å bli i det minste litt kjent med de eldgamle språkene, er det den samme late moren som i svært stor grad er ansvarlig for dette.

Faren for utviklingen av vitenskapen som disse hindringene utgjør, er mye mer alvorlig enn det kan virke ved første øyekast. Når uvitenhet i «fremmede» vitenskaper blir et spørsmål om stolthet, fører dette naturligvis til overfladiskhet og uvitenhet også hos «våre egne». Det har lenge vært mange flere enn to "fakulteter", antallet vokser fra år til år, og hver av dem er inngjerdet av en mur fra de andre; vegger vises også inne på fakultetene. Forskernes horisont smalner gradvis inn; det er sant at forskningsapparatet blir mer og mer subtilt og raffinert, men nesten utelukkende små gjenstander, og forestillingen om at de er de eneste som er verdt å studere, forsterkes. Det er all grunn til å snakke om en krise i vitenskapen, og lingvistikk er intet unntak. Nå synes det jeg er på tide å se tilbake og tenke.

Her samlet lingvister av retningen, som er knyttet til modellen "Meaning - Text". Denne modellen, opprettet på 60-tallet av forrige århundre, var en av de første og beste resultater møte for lingvistikk og matematikk, hvoretter to generasjoner lingvister har vokst opp, vant til presis tenkning fra studietiden. Men de er dessverre ikke fri for treghet, noe som hindrer dem i å innse eksistensen av en krise og tenke på måter å overvinne den på. I mellomtiden har de blant alle lingvister – og kanskje til og med blant alle som er involvert i humaniora – de mest objektive mulighetene for en slik forståelse, og jeg vil gjerne håpe at de vil bruke disse mulighetene.

Teksten til rapporten ble vennlig levert av A.V. Gladkiy og forlaget

Historien om anvendelsen av matematiske metoder i lingvistikk FOREDRAG nr. 1

plan

Formasjon
strukturell lingvistikk
omgang XIX- XX århundrer.
Anvendelse av matematiske metoder
i lingvistikk i andre halvdel av det tjuende
århundre.
prospekter
applikasjoner
matematiske metoder i
lingvistikk.

Ferdinand de Saussure (1857-1913) språk som system

riktig språk
tale - prøveløslatelse
taleaktivitet
- Språk

I.A. Baudouin de Courtenay (1845–1929)

"Lyder er språkets "atomer".
systemer som har
begrenset antall
lett målbare egenskaper.
Dette er det mest praktiske
materiale for formelle,
strenge metoder
beskrivelser."

Strukturell lingvistikk -

det er et sett med syn på språk og
metoder for sin forskning, basert på
som ligger forståelsen av språket som
skiltsystem med tydelig forskjellig
strukturelle elementer (enheter
språk, deres klasser osv.) og ønsket om
streng (nærmer seg nøyaktig
vitenskaper) formell beskrivelse av språket.

Leningradskaya
fonologisk skole
(L.V. Shcherba) brukt som
hovedkriteriet for generalisering av lyd i
som fonem psykolingvistisk
analysebasert eksperiment
tale fra morsmål.
Praha språksirkel
(N.S. Trubetskoy) utviklet teorien
motsetninger - semantisk struktur
språk ble beskrevet av dem som et sett
opposisjonelt konstruert
semantiske enheter - fam.

Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre

amerikansk
deskriptivisme
(L. Bloomfield og E. Sapir). Språk
presentert for deskriptivister som
samling av taleytringer.
Formell grammatikk til N. Chomsky.
Moskva
fonologisk skole,
hvis representanter var A.A.
Reformatsky, V.N. Sidorov, P.S.
Kuznetsov, A.M. Sukhotin, R.I. Avanesov.

maskinoversettelsessystemer

Algoritme
fortløpende oversettelse
ord for ord, frase for frase.
T-systemer (fra engelsk ord overføre
- transformasjon), der oversettelsen
utført på syntaktisk nivå
strukturer.
I-systemer (fra ordet "interlingua") som oppnår en semantisk representasjon
skriv inn setning gjennom sin
semantisk analyse og syntese
innspill tilbud på mottatt
semantisk presentasjon.

10. Praktisk lingvistikk

studier
ikke et språk i sin tilstand (dvs.
system), og språket i aksjon (dvs. i
kommunikasjon);
løser et spesifikt applikasjonsproblem,
lage språkmodeller uten
hevder å forklare språkets fakta
(som teoretisk lingvistikk);
retter seg mot spesifikke underspråk
(dvs. selektiv kunnskap om språket), og ikke
for hele språket.

11. kvantitativ lingvistikk

- tverrfaglig retning i
anvendt forskning, som
som det viktigste studieverktøyet
språk og tale brukes
kvantitativ eller statistisk
analysemetoder.

12. datalingvistikk

– utvikling av metoder, teknologier og
spesifikke systemer som gir
kommunikasjon mellom en person og en datamaskin på en naturlig
eller begrenset naturlig språk.

13. datalingvistikk

opprettelse av systemer for behandling av naturlig
språk (for eksempel k
tekst);
utvikling av informasjonsinnhentingssystemer
(dokumentar, det vil si hvor
tekster, og fakta, dvs. i hvilken
fakta er lagret, presentert ikke bare i
tekstform, så vel som i form av tabeller,
formler osv.);
opprettelse av hypertekstsystemer (dvs.
sett med tekster med koblinger til dem
forhold);
utvikling av datateknologi
sammenstilling og bruk av ordbøker.

14. Takk for oppmerksomheten!

15. Rapporter:

Lover
natur og "humanitære" lover.
Matematisk revolusjon i lingvistikk.
Københavns strukturskole
lingvistikk.
Dannelsen av anvendt lingvistikk som
vitenskapelig disiplin.

16. Praktisk økt:

Beskrivelse av historien til bruken av matematisk
metoder i lingvistikk fra antikken til vår
dager.
Manifestasjon av integreringstrender
matematisk, språklig og annen kunnskap i
historien om utviklingen av språkvitenskapen.
Sammenlignende egenskaper av anvendt og
teoretisk lingvistikk (fyll ut tabellen
Sammenlignende egenskaper av anvendt og
teoretisk lingvistikk).
Korpuslingvistikk som anvendt seksjon
lingvistikk.
Anvendte aspekter ved kvantitativ lingvistikk.
Beregningslingvistikk og dens verktøy.

I løpet av det siste århundret har lingvistikk alltid blitt trukket frem som et eksempel på en vitenskap som utviklet seg raskt og svært raskt nådde metodisk modenhet. Allerede i midten av forrige århundre tok ung vitenskap trygt sin plass i kretsen av vitenskaper som hadde en tusenårig tradisjon, og en av dens mest fremtredende representanter - A. Schleicher - hadde mot til å tro at han med sine verker oppsummerte allerede den siste linjen.<113>Språkvitenskapens historie har imidlertid vist at en slik mening var for forhastet og uberettiget. På slutten av århundret gjennomgikk språkvitenskapen sitt første store sjokk knyttet til kritikken av nygrammatiske prinsipper, fulgt av andre. Det skal bemerkes at alle krisene som vi kan avdekke i språkvitenskapens historie, som regel ikke rokket ved grunnlaget, men tvert imot bidro til styrkingen og til slutt brakte med seg en foredling og forbedring av metodene for språklig forskning, utvidet sammen med temaer og vitenskapelige problemstillinger.

Men ved siden av lingvistikken levde og utviklet også andre vitenskaper seg, inkludert en lang rekke nye. De fysiske, kjemiske og tekniske (såkalte «eksakte») vitenskapene har fått en særlig rivende utvikling i vår tid, og deres teoretiske grunnlag, matematikken, har regjert over dem alle. De eksakte vitenskapene har ikke bare presset alle humaniora sterkt, men for tiden streber de etter å "bringe dem inn i deres tro", å underordne dem deres skikker, å påtvinge dem sine forskningsmetoder. I dagens situasjon, ved å bruke et japansk uttrykk, kan man si at nå sudler lingvister-filologer selve kanten av matten, der de eksakte vitenskapene, ledet av matematikk, triumferende og fritt befinner seg.

Ville det ikke vært mer hensiktsmessig fra et synspunkt av generelle vitenskapelige interesser å kapitulere for matematikken, å overgi seg helt til kraften i dens metoder, som noen stemmer åpenlyst kaller til 59, og derved kanskje få ny styrke? For å svare på disse spørsmålene må vi først se på hva matematikken hevder i denne saken innen hvilket område av lingvistikk matematiske metoder finner sin anvendelse, i hvilken grad de er i samsvar med spesifikasjonene til språklig materiale og om de er i stand til å gi eller bare foreslå svar på spørsmålene som språkvitenskapen stiller.

Helt fra begynnelsen bør det bemerkes at blant entusiastene av den nye, matematiske trenden i lingvistikk<114>Det er ingen enstemmighet om dets mål og mål innen statisk forskning. Acad. A. A. Markov, som var den første som brukte matematiske metoder på språk, Boldrini, Yul, Mariotti anser språkelementer som egnet illustrerende materiale for å konstruere kvantitative metoder, eller for statistiske teoremer, uten i det hele tatt å lure på om resultatene av en slik studie er av interesse. til lingvister 6 0 . Ross mener at sannsynlighetsteori og matematisk statistikk gir et verktøy eller, som de nå foretrekker å si, en matematisk modell for å teste og bekrefte de språklige konklusjonene som tillater numerisk tolkning. Matematiske metoder er derfor kun tenkt som hjelpemidler for språkforskning 6 1 . Mye mer hevdes av Herdan, som i sin bok ikke bare oppsummerte og systematiserte alle forsøk på matematisk studie av språkproblemer, men også forsøkte å gi dem en klar orientering i forhold til videre arbeid. Han fokuserer presentasjonen av hele materialet i boken sin på "å forstå litterær statistikk (som han kaller studiet av tekster ved metoder for matematisk statistikk. - AT 3.) som en integrert del av lingvistikken» 6 2, og formulerer essensen og oppgavene til denne nye delen i lingvistikk med følgende ord: «Litterær statistikk som en kvantitativ språkfilosofi er anvendelig for alle grener av lingvistikk. Litterær statistikk er etter vår mening strukturell lingvistikk hevet til nivået av en kvantitativ vitenskap eller en kvantitativ filosofi. Derfor er det like feil å definere resultatene som å være utenfor scope<115>lingvistikk eller behandle det som et hjelpeverktøy for forskning» 6 3 .

Det er neppe tilrådelig å gå inn på teoretisering om hvorvidt det er legitimt i dette tilfellet å snakke om fremveksten av en ny gren av lingvistikken og løse spørsmålet om dens påstander, uten først å referere til vurderingen av hva som faktisk har blitt gjort i denne. område, og til å avklare i hvilken retning anvendelsen av nye metoder 6 4 . Dette vil hjelpe oss å forstå meningsforskjellene.

Bruken av matematiske (eller, mer presist, statistiske) kriterier for å løse språklige problemer er på ingen måte nytt for språkvitenskapen og har i en eller annen grad lenge vært brukt av språkforskere. Tross alt, faktisk, slike tradisjonelle begreper om lingvistikk som fonetisk lov (og relaterte<116>nee med det - et unntak fra loven), produktiviteten til grammatiske elementer (for eksempel avledningssuffikser), eller til og med kriteriene for relaterte forhold mellom språk, til en viss grad, er basert på relative statistiske trekk. Jo skarpere og mer distinkt den statistiske motsetningen til de observerte tilfellene er, jo mer grunn har vi til å snakke om produktive og uproduktive suffikser, om den fonetiske loven og unntak fra den, om tilstedeværelse eller fravær av slektskap mellom språk. Men hvis det statistiske prinsippet i slike tilfeller ble brukt mer eller mindre spontant, begynte det i fremtiden å bli brukt bevisst og allerede med en viss målsetting. Så i vår tid har de såkalte frekvensordbøkene for vokabular og uttrykk for individuelle språk 6 5 eller til og med betydningen av flerspråklige ord med et "generelt fokus på virkeligheten" 6 6 blitt utbredt. Dataene til disse ordbøkene brukes til å kompilere fremmedspråklige lærebøker (hvis tekstene er bygget på det mest brukte ordforrådet) og minimumsordbøker. Statistisk kalkulus fant en spesiell språklig bruk i metoden for leksikostatistikk eller glottokronologi av M. Swadesh, der det, på grunnlag av statistiske formler som tar hensyn til tilfellene av forsvinning av ord fra hovedfondets språk, er mulig å etablere den absolutte kronologien for inndelingen av språkfamilier 6 7 .

I i fjor tilfeller av bruk av matematiske metoder på språklig materiale har mangedoblet seg betydelig, og i mengden av slike forsøk har mer eller mindre bestemte retninger blitt skissert. La oss snu<117>til deres sekvensielle vurdering, uten å gå i detaljer.

La oss starte med retningen som har fått navnet stilostatistikk. I dette tilfellet snakker vi om definisjonen og karakteriseringen av stiltrekkene til individuelle verk eller forfattere gjennom de kvantitative relasjonene til de språklige elementene som brukes. Den statistiske tilnærmingen til studiet av stilistiske fenomener er basert på forståelsen av litterær stil som en individuell måte å mestre språkets virkemidler på. Samtidig er forskeren fullstendig distrahert fra spørsmålet om den kvalitative betydningen av de tellbare språklige elementene, og fokuserer hele sin oppmerksomhet kun på den kvantitative siden; den semantiske siden av de studerte språkenhetene, deres emosjonelle og uttrykksfulle belastning, så vel som deres andel i stoffet til et kunstverk - alt dette forblir utenfor, refererer til de såkalte overflødige fenomenene. Dermed fremstår et kunstverk i form av et mekanisk aggregat, hvis spesifisitet til konstruksjonen finner sitt uttrykk bare gjennom de numeriske relasjonene til elementene. Representanter for stylostatistikk lukker ikke øynene for alle omstendighetene som er nevnt, og motsetter seg metodene til tradisjonell stilistikk, som utvilsomt inkluderer elementer av subjektivitet, med en enkelt kvalitet ved den matematiske metoden, som etter deres mening kompenserer for alle dens mangler - objektiviteten til de oppnådde resultatene. «Vi streber», skriver for eksempel V. Fuchs, «... å karakterisere stilen til språklige uttrykk med matematiske midler. For dette formålet bør det lages metoder, hvis resultater bør ha samme objektivitet som resultatene fra de eksakte vitenskapene ... Dette antyder at vi, i det minste til å begynne med, kun vil beskjeftige oss med formelle strukturelle kvaliteter, og ikke med det semantiske. innhold i språklige uttrykk . På denne måten vil vi få et system av ordinalrelasjoner, som i sin helhet vil være grunnlaget og utgangspunktet for den matematiske stilteorien» 6 8 .<118>

Den enkleste typen statistisk tilnærming til studiet av språket til forfattere eller individuelle verk er å telle ordene som brukes, siden rikdommen til ordboken tilsynelatende skal karakterisere forfatteren selv på en bestemt måte. Resultatene av slike beregninger gir imidlertid noe uventede resultater i denne forbindelse og bidrar ikke på noen måte til estetisk kunnskap og vurdering av et litterært verk, som ikke minst er en av stilistikkens oppgaver. Her er noen data om det totale antallet ord brukt i en rekke verk:

Bibelen (latinsk). . . . . . . . . . 5649 ord

Bibelen (hebraisk). . . . 5642 ord

Demosthenes (tale). . . . . . . . . . . . 4972 ord

Sallust. . . . . . . . . . . . . . . . . 3394 ord

Horace. . . . . . . . . . . . . . . . . . . .6084 ord

Dante (guddommelig komedie) 5860 ord

(dette inkluderer 1615 egennavn og geografiske navn)

Tasso (Furious Orland). . . . 8474 ord

Milton. . . . . . . . . . . . . . . . . . . . .8000 ord (ca. gitt)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 ord

(omtrent, ifølge andre kilder 20 000 ord)

O. Jespersen påpeker at ordboken til Zola, Kipling og Jack London betydelig overgår ordboken til Milton, det vil si at tallet er 8000 6 9 . Beregningen av ordboken over taler til USAs president W. Wilson fant at den er rikere enn Shakespeares. Til dette skal legges data fra psykologer. Dermed fant Terman, basert på observasjoner av et stort antall tilfeller, at ordforrådet til et gjennomsnittlig barn er omtrent 3600 ord, og i en alder av 14 - allerede 9000. Den gjennomsnittlige voksen bruker 11700 ord, og en person på "økt intelligens" opp til 13500 7 0 . Slike numeriske data gir derfor ikke i seg selv grunnlag for å identifisere verkens stilistiske kvaliteter og kun "objektivt"<119>de oppgir bruken av et forskjellig antall ord av forskjellige forfattere, som, som beregningene ovenfor viser, ikke er relatert til den relative kunstneriske verdien av deres verk.

Beregninger av den relative hyppigheten av bruken av ord hos individuelle forfattere er bygget noe annerledes. I dette tilfellet blir ikke bare den totale mengden ord tatt i betraktning, men også bruksfrekvensen av individuelle ord. Statistisk bearbeiding av materialet som er oppnådd på denne måten består i at ord med lik bruksfrekvens er gruppert i klasser (eller rekker), noe som fører til etablering av frekvensfordelingen av alle ord brukt av en gitt forfatter. Et spesielt tilfelle av denne typen beregning er bestemmelsen av den relative frekvensen av spesielle ord (for eksempel romansk vokabular i Chaucers verk, som ble gjort av Mersand 7 1). Den relative frekvensen av ordene brukt av forfatterne inneholder den samme objektive informasjonen om stilen til individuelle forfattere som de ovennevnte totalberegningene, med den eneste forskjellen at resultatet er mer nøyaktige numeriske data. Men det brukes også til å datere individuelle verk av samme forfatter på grunnlag av en foreløpig beregning av den relative hyppigheten av hans bruk av ord i ulike perioder av livet hans (i henhold til verk datert av forfatteren selv). En annen type bruk av data fra slike beregninger er å fastslå ektheten av forfatterskapet til verk som dette spørsmålet virker tvilsomt for 7 2 . I dette siste tilfellet er alt basert på en sammenligning av statistiske formler for bruksfrekvensen i ekte og kontroversielle verk. Det er ikke nødvendig å snakke om den veldig store relativiteten og omtrentligheten til resultatene oppnådd med slike metoder. Tross alt endres den relative bruksfrekvensen ikke bare med forfatterens alder, men også avhengig av sjangeren, plottet og også det historiske miljøet for handlingen til verket (sammenlign for eksempel "Brød" og "Peter" I" av A. Tolstoy).<120>

Ved å utdype metoden beskrevet ovenfor, begynte stilostatistikk som stilkarakteristikk å ty til kriteriet om stabilitet for den relative frekvensen til de mest brukte ordene. Metoden som brukes i dette tilfellet kan illustreres ved den statistiske behandlingen av Pushkins historie "Kapteinens datter" av Esselson og Epstein ved Institute of Slavic Languages ​​ved University of Detroit (USA) 7 3 . Hele teksten i historien (omtrent 30 000 forekomster av ord) ble gjenstand for undersøkelsen, og deretter passasjer som inneholdt rundt 10 000 og 5000 forekomster. Videre, for å bestemme stabiliteten til den relative frekvensen av bruken av ord, ble de 102 mest brukte ordene (med en frekvens på 1160 ganger til 35) sammenlignet med den beregnede relative frekvensen (laget på grunnlag av selektive passasjer) med den faktiske. For eksempel ble fagforeningen "og" brukt 1160 ganger gjennom historien. I en passasje som inneholder 5 000 forekomster av alle ord, bør denne konjunksjonen forventes å bli brukt 5 000 x 1 160:30 000, eller rundet opp 193 ganger, og i en passasje som inneholder 10 000 forekomster av alle ord, forventes den å bli brukt 1,1060 x 10,060 : 30 000, eller 386 ganger. Sammenligning av data oppnådd ved bruk av denne typen beregninger med faktiske data viser et svært lite avvik (innenfor 5%). Basert på slike beregninger ble det funnet at i denne historien av Pushkin brukes preposisjonen "k" dobbelt så ofte som "y", og pronomenet "du" brukes tre ganger oftere enn "dem", osv. Dermed , til tross for i det hele tatt omskiftelser i handlingen, både gjennom historien og i dens enkelte deler, er det en stabilitet i den relative hyppigheten av bruken av ord. Det som observeres i forhold til noen (vanligste) ord er antagelig gjeldende for alle ord som brukes i verket. Det følger at stilen til forfatteren kan karakteriseres av et visst forhold mellom variasjonen av den gjennomsnittlige frekvensen for bruk av et ord og den generelle frekvensen for et gitt språk.<121>hyppigheten av bruken. Dette forholdet betraktes som en objektiv kvantitativ karakteristikk av forfatterens stil.

Andre formelle elementer i språkstrukturen studeres på lignende måte. Så for eksempel underkastet V. Fuchs de metriske trekkene i verkene til Goethe, Rilke, Caesar, Sallust, etc. for en komparativ-statistisk vurdering.

Kriteriet om stabiliteten til den relative hyppigheten av bruken av ord, mens det tydeliggjør teknikken for kvantitativ karakterisering av stil, introduserer ikke noe fundamentalt nytt sammenlignet med de mer primitive metodene analysert ovenfor. Alle metoder for stylostatistikk gir til syvende og sist like lidenskapelige "objektive" resultater, og glir over overflaten av tungen og klamrer seg bare til rent ytre tegn. Kvantitative metoder er tilsynelatende ikke i stand til å fokusere på de kvalitative forskjellene i materialet som studeres og faktisk utjevne alle objektene som studeres.

Der maksimal spesifikasjon er nødvendig, tilbys de mest generaliserte kriteriene; kvalitative egenskaper uttrykkes i kvantitetsspråket. Dette er ikke bare en logisk motsetning, men også en uenighet med tingenes natur. Faktisk, hva skjer hvis vi prøver å få en komparativ stilistisk (dvs. derfor kvalitativ) karakteristikk av verkene til Alexander Gerasimov og Rembrandt basert på det kvantitative forholdet mellom rød og svart maling på lerretene deres? Det ser ut til å være et absolutt tull. I hvilken grad er fullstendig "objektiv" kvantitativ informasjon om en persons fysiske data i stand til å gi oss en idé om alt som kjennetegner en person og gjør ham til sann essens? Tydeligvis ingen. De kan bare tjene som et individuelt tegn som skiller en person fra en annen, som et avtrykk av viklinger på tommelen. Situasjonen er lik med de kvantitative egenskapene til litterær stil. Hvis du ser nøye etter, gir de like magre data for å bedømme den faktiske stilistiske<122>kvaliteter ved forfatterens språk, samt en beskrivelse av viklingene på fingeren for studiet av menneskelig psykologi.

Til alt som er sagt, skal det legges til at det tidligere, i den såkalte formelle skolen for litteraturkritikk, allerede ble gjort et forsøk på å kvantitativt studere forfatterstilen, når epitet, metaforer og rytmisk-melodiske elementer. av vers ble talt. Dette forsøket ble imidlertid ikke videreutviklet.

Et annet anvendelsesområde for matematiske metoder for studiet av språklige fenomener kan grupperes under navnet språkstatistikk. Den søker å trenge inn i språkteoriens grunnleggende spørsmål og dermed oppnå et kall i den egentlige språklige sfæren. For å bli kjent med denne retningen, er det best å vende seg til det allerede nevnte arbeidet til Herdan, med ordene til en av dens mange anmeldere, "en monstrøst pretensiøs bok" 7 5 , fikk imidlertid bred respons blant lingvister 7 6 . I lys av det faktum at Kherdan (som allerede nevnt ovenfor) forsøkte å samle i sin bok alt det viktigste innen anvendelsen av matematiske metoder på språklige problemer, i boken hans har vi faktisk ikke så mye å gjøre med Kherdan som med en helhet. trend. Som selve tittelen på boken, «Språk som valg og sannsynlighet» viser, er hovedfokuset på å klargjøre hva i språket som er overlatt til talerens frie valg og hva som skyldes språkets immanente struktur, akkurat som på å bestemme det kvantitative forholdet mellom elementene i første og andre orden. Kherdans bok gir nesten uttømmende informasjon om alt arbeidet på dette området utført av representanter for ulike spesialiteter.<123>(filosofer, lingvister, matematikere, teknikere), men er ikke begrenset til dette og inkluderer mange originale observasjoner, betraktninger og konklusjoner fra forfatteren selv. Som et oppsummerende arbeid gir det en god idé om de kvantitative metodene som brukes, og om resultatene som er oppnådd med deres hjelp. Spørsmålene som vi betinget kombinerer til delen av språkstatistikken, behandles i bokens andre og fjerde del.

Av de mange tilfellene med å bruke metodene for matematisk statistikk til studiet av språklige spørsmål, vil vi fokusere på de mest generelle, som samtidig kan betraktes som de mest typiske. Bruke data fra andre forfattere - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 og andre, i tillegg til å sitere hans egne studier som bestemmer den relative frekvensen av fordelingen av fonemer, bokstaver, ordlengde (målt ved antall bokstaver og stavelser) , grammatiske former og metriske elementer i latinsk og gresk heksameter, fastslår Herdan faktumet om stabiliteten til den relative frekvensen av språklige elementer som en felles egenskap for alle språklige strukturer. Han utleder følgende regel: "Andelene av språklige elementer som tilhører et eller annet nivå eller sfære av språklig koding - fonologi, grammatikk, metrikk - forblir mer eller mindre konstant for et gitt språk, i en gitt periode av dets utvikling og innenfor grenser for tilstrekkelig omfattende og upartisk utførte observasjoner.» 8 2 . Denne regelen, som Herdan kaller språkets grunnleggende lov, søker han å tolke og utvide på en bestemt måte. «Han», skriver Herdan om denne loven, «er et uttrykk for at selv her, hvor menneskets vilje og valgfrihet er gitt<124>den bredeste rammen, hvor bevisste valg og bekymringsløs lek veksler levende med hverandre, generelt er det betydelig stabilitet... i grammatikk, men også i forhold til bruksfrekvensen av spesifikke fonemer, leksikale enheter (ord) og grammatiske fonemer og konstruksjoner; med andre ord, likheten er ikke bare i hva som brukes, men også i hvor ofte det brukes» 8 3 . Denne situasjonen skyldes forståelige årsaker, men dette gir opphav til nye konklusjoner. Når man for eksempel undersøker forskjellige tekster eller segmenter av et gitt språk, finner man at de relative frekvensene for bruk av et gitt bestemt fonem (eller andre taleelementer) av forskjellige personer forblir stort sett de samme. Dette fører til tolkningen av individuelle taleformer som noen fluktuasjoner i den konstante sannsynligheten for å bruke det betraktede fonemet på et gitt språk. Dermed viser det seg at en person i sin taleaktivitet er underlagt visse sannsynlighetslover i forhold til antall språklige elementer som brukes. Og så, når vi observerer et stort antall språklige elementer i et stort sett med tekster eller talesegmenter, får vi inntrykk av årsaksavhengighet i den forstand at det i dette tilfellet også er bestemmelse i forhold til bruken av visse språklige elementer. Det viser seg med andre ord å være tillatt å påstå at det som ser ut til å være en årsakssammenheng fra et intuitivt synspunkt, er kvantitativt en sannsynlighet 8 4 . Det er klart at jo større totalsummen er<125>spesifisiteten til de undersøkte tekstene eller talesegmentene, jo tydeligere vil stabiliteten til den relative frekvensen av bruken av språklige elementer manifesteres også i individuell bruk (loven om store tall). Herfra lages en ny generell konklusjon at språk er et massefenomen og bør behandles som det.

Disse konklusjonene, oppnådd på grunnlag av frekvensberegninger av fonetiske elementer, ord og grammatiske former, som til sammen utgjør et språk, brukes deretter på den "statistiske tolkningen" av Saussures inndeling i "språk" (lalangue) og "tale" (laparole). ). I følge Saussure er «språk» et sett av språklige vaner som gjør kommunikasjon mulig mellom medlemmer av et gitt språklig fellesskap. Dette er en sosial realitet, et «massefenomen», obligatorisk for alle mennesker som snakker dette språket. Herdan, som antydet, beviser at medlemmene av et enkelt språksamfunn ligner hverandre, ikke bare ved at de bruker samme fonemer, leksikale enheter og grammatiske former, men også ved at alle disse elementene brukes med samme frekvens. Dermed har hans statistiske definisjon av "språk" følgende form: "språk" (lalangue) er helheten av vanlige språklige elementer pluss deres relative sannsynlighet for å bli brukt.

Denne definisjonen av «språk» er også utgangspunktet for den tilsvarende statistiske tolkningen av «tale», som ifølge Saussure er en individuell ytring. Ved å kontrastere "språk" som et sosialt fenomen av "tale" som et individuelt fenomen, skrev Saussure: "Tale er en individuell handling av vilje og forståelse, der det er nødvendig å skille: 1. kombinasjoner som det talende subjektet bruker språket med. kode for å uttrykke sin personlige tanke; 2. en psykofysisk mekanisme som lar ham objektivisere disse kombinasjonene» 8 5 . Siden "språk" i språkstatistikk betraktes som et sett med elementer med en viss slektning<126>viss sannsynlighet for deres bruk, i den grad det inkluderer den statistiske helheten eller ensemblet (populasjonen) som den viktigste egenskapen og kan vurderes i dette aspektet. I samsvar med dette blir "tale" til et eget utvalg tatt fra "språk" som et statistisk aggregat. Sannsynligheten i dette tilfellet bestemmes av forholdet mellom "tale" og "språk" (i deres "kvantitative" forståelse), og fordelingen av den relative hyppigheten av bruken av forskjellige elementer i språket tolkes som et resultat av en kollektivt "valg" (valg) i en viss kronologisk periode av språkets eksistens. Når han innser at en slik tolkning av forskjellene mellom «språk» og «tale» likevel er bygget på helt andre grunnlag enn Saussures, skriver Herdan i denne forbindelse: «Denne tilsynelatende mindre modifikasjonen av Saussures konsept har den viktige konsekvensen at «språk» ( lalangue ) får nå en vesentlig egenskap i form av et statistisk aggregat (populasjon). Denne populasjonen er preget av visse relative frekvenser eller fluktuasjonssannsynligheter, noe som betyr at hvert språklig element tilhører et visst språklig nivå. I dette tilfellet viser "tale" (laparole), i samsvar med dens betydning, seg å være et begrep for å definere statistiske utvalg tatt fra "språk" som en statistisk populasjon. Det blir åpenbart at valget (valget) dukker opp her i form av forholdet mellom "tale" og "språk", som er forholdet mellom et utvalg tatt tilfeldig og et statistisk aggregat (populasjon). Selve rekkefølgen av frekvensfordeling, som en forekomst av taleaktiviteten til et språklig fellesskap gjennom århundrene, er et element av valg (valg), men ikke av individuelle valg, som i stil, men av kollektive valg. Ved å bruke en metafor kan vi her snakke om valget som er tatt av språkets ånd, hvis vi ved dette forstår prinsippene for språklig kommunikasjon, som er i samsvar med komplekset av mentale data til medlemmene i et bestemt språklig fellesskap. Stabiliteten til serier er resultatet av sannsynlighet (sjans)» 8 6 .

Et spesielt tilfelle av anvendelsen av det oppgitte prinsippet<127>pa er avgrensningen i språket for normative fenomener fra «unntak» (avvik). I språkstatistikken hevdes det at den statistiske metoden lar deg eliminere det eksisterende dette problemet uklarhet og etablere klare kriterier for å skille mellom disse fenomenene. Hvis normen forstås som en statistisk populasjon (i ovennevnte betydning), og unntaket (eller feilen) er et avvik fra frekvensene vist av den statistiske populasjonen, foreslår en kvantitativ løsning av spørsmålet seg selv. Det hele koker ned til en statistisk sammenheng mellom "befolkning" og "uteligger". Hvis frekvensene som er observert i et enkelt utvalg avviker fra sannsynlighetene på grunn av den statistiske populasjonen med mer enn det som er bestemt av en rekke utvalgstellinger, så har vi grunn til å konkludere med at skillelinjen mellom "det samme" (norm) og "ikke" det samme" (unntak) brytes.

Kvantitative forskjeller mellom "språk" og "tale" brukes også for å skille mellom to typer språklige elementer: grammatisk og leksikalsk. Utgangspunktet for å løse dette problemet, som ofte byr på store vanskeligheter fra et språklig synspunkt, er antakelsen om at frekvensgraden til grammatiske elementer er annerledes enn leksikalske enheter. Dette er angivelig assosiert med "generalisering" av grammatiske elementer, hvordan de skiller seg fra konsepter fastsatt av leksikale enheter. I tillegg er angivelig grammatiske elementer som regel mye mindre i volum: som uavhengige ord (de inkluderer pronomen, preposisjoner, konjunksjoner og offisielle ord) de består vanligvis av et lite antall fonemer, og i form av "relaterte former" - av ett eller to fonemer 8 7 . Jo mindre det språklige elementet er, jo mindre er dets "lengde" (kvantitative øyeblikk) i stand til å tjene som en definerende egenskap, og jo viktigere får "kvaliteten" til fonemer for dette formålet. Hvilke metoder foreslås for å løse problemet under vurdering? Det løses ved å referere til det rent kvantitative begrepet grammatisk<128>load, "Anta," skriver Herdan i denne forbindelse, "at vi er interessert i å sammenligne to språk i denne forbindelse. Hvordan bestemmer vi med en viss grad av objektivitet den «grammatiske belastningen» som et språk bærer? Det er klart at denne belastningen vil avhenge av plasseringen av avgrensningslinjen som skiller grammatikk fra ordforråd. Den første vurderingen som kan komme til oss er å bestemme hvor "kompleks" grammatikken til et gitt språk er. Tross alt er "kompleksitet" en kvalitativ egenskap, og konseptet "grammatisk belastning" er en kvantitativ egenskap. Riktignok avhenger belastningen til en viss grad av kompleksiteten, men ikke helt. Et språk kan bli belønnet med en ekstremt kompleks grammatikk, men bare en relativt liten del av den brukes i språkets aktivitet. Vi definerer "grammatisk belastning" som helheten av grammatikk som et språk bærer når det er i aksjon, som umiddelbart bringer problemet vårt inn i strukturell lingvistikk i den forstand disiplinen ble definert av Saussure. I den følgende presentasjonen brukes kvantitative metoder for å bestemme forskjellen mellom språk, avhengig av hvor grensen går, og skille grammatikk fra vokabular” 8 8 . Med andre ord bør språkforskjeller i dette tilfellet reduseres til forskjeller i numeriske relasjoner mellom grammatiske og leksikalske elementer.

Materialene vi har til rådighet tegner følgende bilde. I engelske språk(bare "grammatiske ord" ble tatt i betraktning: pronomen, eller, som de også kalles, "erstatninger", preposisjoner, konjunksjoner og hjelpeverb) i et segment som inkluderer 78 633 tilfeller av bruk av alle ord (1027 forskjellige ord), ble det funnet 53 102 tilfeller av bruk av grammatiske elementer, eller mer presist "grammatiske ord" (149 forskjellige ord), som er 67,53 % ved 15,8 % forskjellige ord. Slik er dataene til Deway 8 9 . Andre data viser en annen prosentandel<129>forhold: 57,1 % med 5,4 % forskjellige ord 9 0 . Dette betydelige avviket forklares av forskjellen mellom skriftspråk og talespråk. Skriftlige skjemaer språk (første data) bruker visstnok flere grammatiske elementer enn muntlige (andre kasus). I Dantes guddommelige komedie (etter den italienske originalen) etablerte Mariotti 54,4% av forekomstene av "grammatiske ord".

En annen og, tilsynelatende, en mer perfekt måte å bestemme den grammatiske belastningen til et språk er å telle fonemene som er inkludert i de grammatiske elementene. I dette tilfellet tas ikke bare uavhengige grammatiske ord i betraktning, men også relaterte former. Her er mulig ulike alternativer. For eksempel å bestemme den relative frekvensen av bruken av individuelle konsonantfonem i grammatiske elementer og sammenligne dem med frekvensen av den totale bruken av de samme fonemerene (de endelige dataene for et slikt forhold på engelsk gir en andel på 99,9% til 100 000 - total bruk); eller en lignende sammenligning av konsonanter i henhold til separate klassifikasjonsgrupper (labial, palatal, velar og andre fonemer). Det endelige forholdet her tar form av en andel på 56,47 % (i grammatiske elementer) til 60,25 % (i total bruk); eller samme sammenligning av de første konsonantfonemene (i dette tilfellet var forholdet 100,2 % i grammatiske ord til 99,95 i total bruk). Andre mer komplekse statistiske operasjoner er også mulige, som imidlertid resulterer i lignende kvantitative uttrykk for problemet som studeres.

De gitte kvantitative dataene tjener som grunnlag for en generell konklusjon. Det koker ned til at fordelingen av fonemer i grammatiske elementer bestemmer arten av fordelingen (i numeriske termer, selvfølgelig) av fonemer i språket som helhet. Og dette lar oss igjen konkludere med at bruken av grammatiske elementer i minst grad avhenger av individuelle valg og utgjør den delen av det språklige uttrykket som styres av sannsynligheter.<130>ness. Denne spekulative konklusjonen bekreftes av beregningen av grammatiske former i det russiske språket, laget av Esselson 9 1 . Studien ble utsatt for 46896 ord hentet fra II-kilder (verk av Griboedov, Dostojevskij, Goncharov, Saltykov-Sjchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov og N. Ostrovsky). De ble delt inn i samtaleord (17 756 ord eller 37,9 %) og ikke-samtaler (29 140 ord eller 62,1 %). Deretter ble hele ordsettet delt inn i 4 grupper avhengig av deres grammatiske natur: 1. gruppe inkluderte substantiver, adjektiver, adjektiver i funksjonen av substantiver, pronomen og bøyde tall; i den andre gruppen - verb; i den tredje gruppen - verbale partisipp, partisipp i funksjonen til adjektiver og substantiv og gerundier; i 4. gruppe - ufravikelige former for adverb, preposisjoner, konjunksjoner og partikler. Oppsummeringsresultatene (også tabeller med data for individuelle forfattere er gitt) gir følgende forhold:

1. gruppe

2. gruppe

3. gruppe

4. gruppe

dagligdagse

stilltiende

Herdan karakteriserer betraktningen av de kvantitative dataene som dermed er oppnådd med følgende ord: «De begrunner konklusjonen om at grammatiske elementer bør betraktes som en faktor som bestemmer sannsynligheten for et språklig uttrykk. En slik konklusjon unngår den tyngende kvalifiseringen av hvert ord som brukes. Det er klart at siden grammatikk og vokabular ikke er lagret i vanntette skall, er det heller ikke rent "valg" eller ren "tilfeldighet". Både grammatikk og vokabular inneholder begge elementene, men i betydelig varierende proporsjoner» 9 2 .<131>

En stor del av Herdans bok er viet studiet av dualitet eller dualitet i språk, og selve begrepet dualitet er basert på matematiske egenskaper.

Dermed kan teoremer i projektiv geometri ordnes i to serier, slik at hver teorem i en serie kan hentes fra et teorem i en annen serie ved å erstatte ordene punktum Og rett. For eksempel, hvis et utsagn er gitt: "hvilke som helst forskjellige punkter tilhører én og bare én linje," så kan vi utlede den tilsvarende utsagn fra den: "hvilken som helst to forskjellige linjer tilhører ett og bare ett punkt." En annen metode for å bestemme dualitet er å plotte langs abscissen og y-aksen ulike planer fenomen som studeres. Så, som for eksempel Yul 9 3, telles forskjellige bruksfrekvenser langs abscissen, og antall leksikale enheter hvis frekvens bestemmes osv. telles langs ordinaten. Slik er begrepet dualitet. tolket, visstnok likt gjelder for språkforskning.

Under begrepet dualitet definert på denne måten, som i alle tilfeller faktisk har karakteren av en binær kode og som også anses som det mest essensielle trekk ved den språklige strukturen, bringes fenomener med ekstremt forskjellige kvaliteter inn, som tillater opposisjon langs to plan : fordeling av bruken av ord i henhold til leksikalske enheters natur og fordeling av leksikalske enheter etter frekvens bruken av ord; skriftlige og muntlige former for tale; leksikalske og grammatiske elementer; synonymer og antonymer; fonem og dets grafiske representasjon; definerbare og definerende (Saussures signifiant og signifiy), etc.

Etter en kvantitativ studie av dualiteten til et eller annet spesielt, språklig fenomen eller begrenset «tekst», trekkes som regel en konklusjon, som kvalitetene til språklig universalitet tilskrives. Arten av slike konklusjoner og måten de er begrunnet på kan sees i eksemplet<132>studier av dualiteten til ordet og begrepet (faktisk snakker vi om forholdet mellom lengden på ordet og volumet av begrepet - det må tas i betraktning at den ekstremt frie bruken av språklige og andre termer i slike arbeider gjør ofte forståelse svært vanskelig). Det er viktig å merke seg at som materialet som fungerte som kilde for observasjoner av denne typen språklig dualitet, ble følgende brukt: den internasjonale nomenklaturen for sykdommer (omtrent 1000 navn) og det generelle registeret over sykdommer i England og Wells for 1949 I dette tilfellet gjøres følgende generelle konklusjon: "Hvert konsept som betegner en generell idé har det som kan kalles en "sfære" eller "volum." Den tillater gjennom sitt medium å tenke på mange objekter eller andre konsepter som er innenfor dens "sfære". På den annen side utgjør alle elementene som trengs for å definere et konsept det som kalles dets "innhold". Volum og innhold er gjensidig korrelert - jo mindre innholdet er, og følgelig jo mer abstrakt konseptet er, desto større omfang eller volum, det vil si, jo flere objekter bringes inn under det. Dette kan sees på som en analogi (i den konseptuelle sfæren) til prinsippene for koding, ifølge hvilke lengden på et symbol og bruksfrekvensen er gjensidig avhengige av hverandre» 9 4 .

Dualitetsprinsippet gjelder også for spesielle problemer. For eksempel når du etablerer ekvivalensen av betydningen av to ord forskjellige språk. Som et resultat av å studere den engelsk-tyske ordboken av Muret-Zanders ved bruk av matematisk iterasjonsmetode, konkluderes det med at sannsynligheten for å bruke et engelsk ord med en eller flere betydninger i tysk oversettelse forblir konstant for hver forbokstav i hele ordboken 9 5 . Betraktning av ordrekkefølgen i kinesiske ordbøker fører til konklusjonen at den er av taksonomisk karakter, siden antall streker i tegnet indikerer dens plass (som en uavhengig radikal eller en viss underklasse underordnet radikalen). Taksonomi er et underordnet klassifiseringsprinsipp som brukes i zoologi og botanikk. Kherdan hevder det<133>grunnlaget for kinesisk leksikografi er også bygget på prinsippene for taksonomi 9 6, etc.

For å gjøre en generell vurdering av dette området for anvendelse av matematiske metoder for studiet av språklige problemer (dvs. språkstatistikk), er det tilsynelatende nødvendig å gå ut fra posisjonen som ble formulert av Ettinger: "Matematikk kan brukes effektivt. i lingvistikkens tjeneste bare når lingvistene er klare over de reelle grensene for dens anvendelse, så vel som mulighetene til de matematiske modellene som brukes» 9 7 . Med andre ord kan vi snakke om matematisk lingvistikk når matematiske metoder beviser deres egnethet til å løse de egentlige språklige problemene, som i sin helhet utgjør språkvitenskapen. Hvis dette ikke er tilfelle, selv om dette kan åpne for nye aspekter ved vitenskapelig forskning, så kan du i dette tilfellet snakke om hva som helst, men ikke om lingvistikk - i dette tilfellet mener vi ikke forskjellige typer anvendt lingvistikk (det vil bli diskutert nedenfor), og vitenskapelig, eller teoretisk, lingvistikk. Basert på denne posisjonen bør det bemerkes at fra en språkforskers synspunkt er mye i språkstatistikken tvilsomt og til og med forvirrende.

La oss gå til analysen av bare to eksempler (for ikke å rote opp presentasjonen), og fastslå at det kan gjøres svært betydelige innvendinger mot hvert av dem. Her har vi et kvantitativt skille mellom grammatiske og leksikale enheter. Det viser seg at for å gjøre et slikt skille, er det nødvendig å allerede vite på forhånd hva som hører til grammatikkfeltet, og hva man skal ha ordforråd, siden den "grammatiske belastningen" av språket (dvs. helheten av grammatiske elementer) brukt i tale), som angitt i sitert ovenfor, "avhenger av grenselinjen som skiller ordforråd fra grammatikk." Uten å vite hvor denne linjen går, er det derfor umulig å trekke det angitte skillet. Hva er da meningen med den kvantitative metoden for å skille det leksikale fra grammatikken?<134>matic? Men når det gjelder Herdan, tenker han ikke spesielt på dette spørsmålet og klassifiserer dristig språklige elementer, og refererer til de grammatiske elementene "sammenkoblede former", som etter presentasjonen å dømme skal forstås som ytre bøyning, og "grammatiske ord", som inkluderer preposisjoner , konjunksjoner, hjelpeverb og pronomen - sistnevnte i kraft av at de er "erstattere". Men hvis vi bare snakker om denne kvaliteten på pronomen og på dette grunnlaget relaterer dem til grammatiske elementer, bør slike ord som "førnevnte", "navngitt", "gitt" etc. også tilskrives dem, så hvordan de også opptrer som varamedlemmer. I forbindelse med metoden for å skille grammatiske elementer som brukes i språkstatistikk, oppstår naturligvis spørsmålet om hvordan man i dette tilfellet skal forholde seg til slike "ikke-formelle" grammatiske fenomener som ordstilling, toner, nullmorfemer, paradigmatiske relasjoner (noen av disse fenomenene). , forresten, finne refleksjon i de språkene som studeres med matematiske metoder)? Hvordan skille mellom språk med rik indre bøyning (som for eksempel i semittiske språk), der den ikke bare grammatisk modifiserer roten (radikal), men også gir den leksikalsk eksistens, siden roten uten permutasjoner har ingen reell eksistens i språket? Hva skal forstås med den grammatiske kompleksiteten til et språk, etter hvilket kriterium bestemmes det? Hvis det kvantitative poenget, som i dette tilfellet er fremhevet på alle mulige måter, så vil et av de grammatisk vanskeligste språkene være engelsk, som har slike konstruksjoner som Ishallhavebeencalling eller Hewouldhavebeencalling. I disse setningene er det kun kall som kan klassifiseres som leksikalsk, og alt annet må derfor betraktes som grammatisk. Hvilket grunnlag er det for å koble hyppigheten av bruk av grammatiske elementer med det generelle eller abstrakte i betydningen av grammatiske ord? Tross alt er det ganske åpenbart at den relativt store bruksfrekvensen av grammatiske elementer bestemmes av deres funksjon i konstruksjonen av setninger, og når det gjelder abstraktheten til betydninger, er det veldig enkelt å finne en stor<135>antallet leksikale elementer som lett kan konkurrere med grammatiske elementer i denne forbindelse, og er stort sett underordnet dem i frekvens (f.eks. væren, eksistens, utvidelse, rom, substans etc).

En lignende form for absurditet dukker opp foran oss når det gjelder definisjonen av dualitet (dualitet) av ordet og konseptet. Det er nødvendig å ha en ekstremt særegen forståelse av den strukturelle essensen av språket for å underkaste det forskning ved bruk av sykdommers nomenklatur og sykehusregisteret over sykdommer, som, som angitt ovenfor, fungerte som kildemateriale for svært viktig språklig konklusjoner. Uten å dvele ved den fullstendig obskure bruken av slike begreper som ikke har en språklig eksistens, som sfære, volum og innhold av et begrep (forresten, den leksikalske betydningen av ordet og begrepet betegnet med det vitenskapelige begrepet er grovt sett forvirret), la oss gå til konklusjonen som er gjort i denne saken. Som nevnt ovenfor har vi å gjøre med påstanden om at «omfang og innhold er gjensidig korrelert». Hele resonnementsforløpet som gir grunnlag for en slik konklusjon, så vel som metoden for matematisk operasjon av språklige fakta, viser tydelig at i dette tilfellet blir en svært essensiell kvalitet ved språket fullstendig ignorert, noe som forstyrrer alle beregningene som utføres : evnen til å uttrykke det samme "innholdet" ved hjelp av språklige enheter med forskjellig "volum", som utvilsomt dessuten har ulik relativ bruksfrekvens. Så vi kan utpeke samme person som Petrov, min bekjent, han, en muskovitt, en ung mann, en universitetsansatt, min kones bror, en mann som vi møtte på broen osv. I lys av slike fakta, er uten tvil bare private konklusjoner, som det imidlertid, som det ble påpekt, tillegges universell betydning, men også hensiktsmessigheten av å anvende de kvantitative metodene i seg selv på slike språklige problemer.

Men noen ganger blir lingvister tilbudt konklusjoner, hvis gyldighet ikke er i tvil. Dette er "språkets grunnleggende lov", som består i det faktum at det i språket er en viss stabilitet av dets elementer og den relative hyppigheten av deres omtale.<136>forbruk. Problemet med denne typen oppdagelser er imidlertid at de lenge har vært kjent for lingvister. Tross alt er det ganske åpenbart at hvis språket ikke hadde en viss stabilitet og hvert medlem av et gitt språksamfunn fritt varierte elementene i språket, ville gjensidig kommunikasjon ikke være mulig og selve eksistensen av språket ville bli meningsløs . Når det gjelder fordelingen av den relative hyppigheten av bruken av individuelle elementer i språket, har den funnet sitt uttrykk i lingvistikk i form av tildeling av kategorier av passivt og aktivt ordforråd og grammatikk, som L. V. Shcherba ga så mye oppmerksomhet. I dette tilfellet kan statistiske metoder bare hjelpe lingvister i fordelingen av spesifikke lingvistiske elementer i henhold til kategoriene for den relative hyppigheten av bruken, men de har ingen grunn til å hevde å oppdage nye mønstre som er av verdi for teoretisk lingvistikk.

På den annen side tilbyr språkstatistikk en rekke virkelig "originale" konklusjoner som er ekstremt indikative for arten av den vitenskapelige tenkningen til dens tilhengere. Dermed blir det "politiske vokabularet" i verkene til Churchill, Benes, Halifax, Stresemann og andre studert med komplekse statistiske metoder, og oversettelser av deres verk til engelsk brukes i beregningene for ikke-engelsktalende forfattere. Beregningsresultatene presenteres i form av en rekke tabeller, matematiske formler og ligninger. Den språklige tolkningen av kvantitative data er i dette tilfellet redusert til at Churchills bruk av «politisk vokabular» er den mest typiske (?) for denne forfattergruppen og at Churchills bruk av ord i saker hvor han behandler politiske spørsmål er typisk. av den engelske talegruppen 9 8 .

I et annet tilfelle, etter passende statistiske manipulasjoner, konkluderes det med at Hitler brøt dualiteten mellom "språk" og "tale" i den kvantitative betydningen av disse begrepene i bruken av Nazi-Tyskland. Et spesielt tilfelle av ødeleggelsen av denne dualiteten er den bokstavelige forståelsen<137>metaforiske vendinger (for eksempel "hell salt i åpne sår"). Nazi-Tyskland stemplet seg selv med så mange umenneskelige handlinger at det knapt er behov for å dømme det for denne språklige grusomheten 9 9 . I følge Kherdan fører Marx sin definisjon av språk som tankens umiddelbare virkelighet også til brudd på språklig dualitet, og dialektikkens lov om overgangen av et fenomen til det motsatte er etter hans mening den misforståtte språklige loven om dualiteten. av språk. Slike tolkninger taler for seg selv.

Til slutt, en vanlig mangel som er iboende i alle de ovennevnte tilfellene av den kvantitative metoden for å studere språklig materiale og dermed tilegne seg en metodisk karakter, er tilnærmingen til språklige elementer som et mekanisk sett av fakta som er helt uavhengig av hverandre, i samsvar med hvilke, om noen, eller mønstre, de refererer bare til de numeriske relasjonene til fordelingen av autonome fakta, utenfor deres systemiske avhengigheter. Riktignok prøver J. Watmou på alle mulige måter å forsikre seg om at det er matematikk som er bedre enn noen form for språklig strukturell analyse, i stand til å avsløre de strukturelle egenskapene til et språk. "Moderne matematikk," skriver han, "omhandler ikke måling og kalkulus, hvis nøyaktighet er begrenset av deres natur, men først og fremst med struktur. Dette er grunnen til at matematikk er svært befordrende for nøyaktigheten av språklæring - i den grad en separat beskrivelse, enda mer begrenset i naturen, ikke er i stand til ... Akkurat som i fysikk, brukes matematiske elementer for å beskrive den fysiske verden, siden de antas å korrespondere med elementer i den fysiske verden, så i matematisk lingvistikk antas de matematiske elementene å svare til elementene i taleverdenen» 101 . Men en slik formulering av spørsmålet redder på ingen måte situasjonen, siden den i beste fall kan<138>gi en analyse av språket enten som en fysisk struktur, som fortsatt er langt fra tilstrekkelig for språk, og i siste instans fortsatt er av samme mekanistiske karakter, eller som en logisk-matematisk struktur, og dette overfører språket til et annet plan, og på mange måter fremmed for det. Det er ikke overflødig å merke seg at Watmow forutser suksessene til matematisk lingvistikk bare i fremtiden, og når det gjelder deres virkelige resultater, vurderer han dem med følgende ord: "... nesten alt arbeidet gjort til dags dato av Herdan, Zipf, Yul, Giro (Guiraux) og andre, er på ingen måte utenfor rekkevidden av kritikk fra både lingvistikk og matematikk; hun lukter i stor grad av amatørmessighet» 103 . Så hvis vi ikke prøver å forutsi fremtiden for matematiske metoder innen språkforskning, men prøver å sette pris på det vi har i dag, så må vi innrømme at matematikken faktisk har vært begrenset innen språkvitenskapen bare til å "måling og telling" ”, og jeg kunne ikke gi en kvalitativ analyse av språket, fordype meg i strukturen.<139>

La oss prøve å være så objektive som mulig. I en viss del kan kvantitative data, tilsynelatende, brukes av lingvistikk, men bare som hjelpemiddel og hovedsakelig i problemer som har en praktisk orientering. Når det gjelder de fleste av de kvantitative metodene for å studere individuelle språklige fenomener, er den generelle konklusjonen til R. Brown utvilsomt berettiget: "De kan betraktes slik Kherdan anser dem, men hva er meningen med alt dette?" 104. La oss forestille oss at vi stiller spørsmålet: "Hva er trærne i denne hagen?". Og som svar får vi: «Det er hundre trær i denne hagen». Er dette svaret på spørsmålet vårt, og gir det virkelig mening? Men når det gjelder mange språklige spørsmål, gir matematiske metoder nettopp slike svar.

Det er imidlertid et bredt felt av forskningsaktivitet, hvor man hovedsakelig bruker matematiske metoder og samtidig orienterer dem mot språklig materiale, hvor hensiktsmessigheten av en slik kombinasjon er hevet over tvil. "Betydningen" av denne forskningsaktiviteten, dens betydning bestemmes av målene den streber etter. Det er allerede testet i praksis. I dette tilfellet snakker vi om problemene knyttet til opprettelsen av informasjonsmaskiner, strukturer for maskinoversettelse av skriftlig vitenskapelige tekster, automatisering av oversettelse av muntlig tale fra ett språk til et annet og med alt komplekset av oppgaver som er kombinert i de språklige spørsmålene om kybernetikk. Hele settet med slike problemer får vanligvis det generelle navnet på anvendt lingvistikk. Dermed skiller den seg fra den såkalte matematiske lingvistikken, som inkluderer de arbeidsområdene som ovenfor er utpekt som stilstatistikk og språkstatistikk, selv om den på ingen måte unngår statistisk behandling av språklig materiale. Den kanskje viktigste egenskapen ved anvendt lingvistikk, som skiller den fra matematisk lingvistikk, som skissert ovenfor, er at førstnevnte har motsatt retning: ikke matematikk for lingvistikk, men lingvistikk.<140>(formalisert ved matematiske metoder) for et bredt spekter av praktiske problemer.

Det er ikke nødvendig å avsløre innholdet i individuelle problemer som nå er inkludert i det ekstremt brede området av anvendt lingvistikk. I motsetning til matematisk lingvistikk, diskuteres disse problemene aktivt i sovjetisk lingvistisk litteratur og begynner med rette å innta en stadig mer fremtredende plass i forskningsinstituttenes vitenskapelige problemer 105 . Dermed er de allerede godt kjent for vårt språklige fellesskap. Denne omstendigheten fritar oss imidlertid ikke for behovet for å utsette dem for refleksjon, spesielt fra synspunktet til prinsippene for språkvitenskapen. Dette vil utvilsomt bidra til å eliminere misforståelser som oftere og oftere oppstår mellom representanter for vitenskaper som er svært fjernt fra hverandre og som deltar i arbeidet med problemene med anvendt lingvistikk, og vil skissere måter for deres konvergens på den ene siden , og avgrensning av forskningsområder derimot. Det sier seg selv at følgende betraktninger vil representere lingvistens synspunkt, og det er nødvendig at matematikere ikke bare prøver å assimilere det, men i forbindelse med spørsmålene som reises, gir dem sin tolkning.

Lingvist-teoretikeren kan ikke på noen måte være fornøyd med at det i alle tilfeller<141>språk for formålene satt av anvendt lingvistikk, er deres grunnlag en matematisk modell. I samsvar med dette uttrykkes observasjoner av språkets fenomener og resultatene oppnådd på denne måten i termer og begreper om matematikk, det vil si gjennom matematiske ligninger og formler. La oss se på et eksempel for klarhet. Condon 1 06 og Zipf 1 07 fastslo at logaritmene til frekvensen ( f) forekomsten av ord i en stor tekst er plassert nesten i en rett linje, hvis de er korrelert i diagrammet med logaritmene for rang eller rang ( r) av disse ordene. Ligningen f=c:r, Hvor Med er en konstant gjenspeiler dette forholdet i begrenset forstand at c:r for innstilt verdi r gjengir den observerte frekvensen med stor tilnærming. Forholdet mellom f Og r, uttrykt med en matematisk formel, er en modell for forholdet mellom de observerte verdiene for bruksfrekvensen og rangeringen, eller rangeringen, av ord. Dette er et av tilfellene med matematisk modellering. 

Hele teorien om informasjon er helt og holdent basert på den matematiske modellen for kommunikasjonsprosessen utviklet av C. Shannon 108 . Det er definert som "en matematisk disiplin viet til metodene for å beregne og estimere mengden informasjon som finnes i alle data, og studiet av prosessene for lagring og overføring av informasjon" (TSB, vol. 51, s. 128). Følgelig mottar de grunnleggende konseptene for informasjonsteori et matematisk uttrykk.Informasjon måles i binitter eller binære enheter (en kode, som sammenlignes med et språk, med to betingede like sannsynlige signaler sender en binær enhet med informasjon under overføringen av hvert tegn -enten kode og gjennomsnittlig mengde informasjon som overføres<142>formasjoner. Redundans uttrykkes som en prosentandel av kodens totale overføringsevne”, 1 09 osv. På samme måte krever maskinoversettelse algoritmisk utvikling av kartlegging av elementer fra ett språk til et annet osv. 1 10 . Dette er andre tilfeller av modellering.

Bruken av modeller uten noen mening kan være til svært betydelig hjelp, spesielt, etter all sannsynlighet, for å løse problemene som anvendt lingvistikk setter seg selv. For teoretisk lingvistikk er det imidlertid veldig viktig at en abstrakt modell som regel ikke reproduserer alle funksjonene til et reelt fenomen, alle dets funksjonelle kvaliteter. Så en arkitekt kan, før han bygger et hus, lage sin modell, som gjengir huset som blir designet i alle de minste detaljene, og dette hjelper ham med å løse en rekke praktiske problemer knyttet til konstruksjonen av selve huset. Men en slik modell av et hus, uansett hvor nøyaktig den kan være, er blottet for den "funksjonen" og det formålet som alle hus er bygget for generelt - den er ikke i stand til å gi en person bolig. Situasjonen er lik med språket, hvor modellen ikke alltid er i stand til å gjengi alle sine kvaliteter. I dette tilfellet kompliseres saken ytterligere av at det ikke brukes språklige, men matematiske kriterier for å bygge modellen. "Matematiske modeller ... - skriver A. Ettinger, - spiller en ekstremt viktig rolle innen alle teknologiområder, men siden de er et verktøy for syntese, er deres betydning for lingvistikken, som først og fremst er en historisk og beskrivende disiplin, naturlig nok begrenset. " 1 11 .<143>

Matematisk modellering av et språk er faktisk kun anvendelig for dets statiske tilstand, som er betinget for en lingvist og faktisk er i direkte konflikt med den grunnleggende kvaliteten til et språk, hvis eksistensform er utvikling. Det sier seg selv at det statiske studiet av et språk på ingen måte er utelukket fra lingvistikken og er grunnlaget for å sette sammen normative grammatikker og ordbøker, beskrivende grammatikker, praktiske grammatikker og ordbøker som fungerer som en veiledning for praktisk studie av fremmedspråk osv. Men i alle slike verk, som hovedsakelig brukes i naturen, begrenser lingvister bevisst forskningsfeltet og lukker på ingen måte øynene for andre sider ved språket 1 12 . Med en statisk undersøkelse av språket, spesielt, forsvinner slike kvaliteter ved språket knyttet til dets dynamiske natur, som produktivitet, avhengighet av tankeformer og omfattende interaksjon med kulturelle, sosiale, politiske, historiske og andre faktorer. forskerens synsfelt. Bare på det synkrone planet kan språk betraktes som et system av konvensjonelle tegn eller koder, som imidlertid viser seg å være fullstendig uberettiget så snart vi inntar et dynamisk synspunkt mer egnet for språk. Det er i utviklingsprosessene at språkkvaliteter som motivasjon, polysemi av ord som ikke har stabile grenser, ikke-autonomi av betydningen av et ord og dets lydskall, og det kreative potensialet til et ord knyttet til konteksten er manifestert, og alt dette er i skarp motsetning til hovedkarakteristikkene til en kode eller et tegn 1 13 . Det er klart at man i anvendt lingvistikk også kan tenke på alle disse kvalitetene ved språket og for praktiske formål nøye seg med så å si et «øyeblikksbilde» av språket, som fortsatt er i stand til å gi en ganske omtrentlig idé om mekanismen for dens funksjon.<144>nirovaniya. Imidlertid må hvert slikt "øyeblikksbilde", hvis det betraktes som et språkfaktum, og ikke som et faktum i et system av konvensjonelle koder, inkluderes i den endeløse bevegelsesprosessen der språk alltid eksisterer 1 14 . Det kan ikke studeres utenfor de konkrete forholdene som kjennetegner denne bevegelsen, som setter sitt preg på gitt tilstand språk og betinge styrken av dens videre utvikling. Her er det samme forskjell som mellom et øyeblikksfotografi av en person og portrettet hans malt med en pensel. ekte kunstner. I kunstnerens arbeid har vi foran oss et generaliserende bilde av en person i all originaliteten til ikke bare hans fysiske utseende, men også hans indre åndelige innhold. Fra et kunstnerisk portrett kan vi også lese fortiden til personen som er avbildet på det og finne ut hva han er i stand til i sine handlinger. Og et øyeblikksbilde, selv om det er i stand til å gi et mer nøyaktig bilde av utseendet til originalen, er blottet for disse egenskapene og fanger ofte både en tilfeldig kvise som hoppet opp på nesen og<145>en helt ukarakteristisk positur eller uttrykk, som til slutt fører til en forvrengning av originalen.

Det skal bemerkes at metoden med "øyeblikksbilder" selvfølgelig kan brukes på fakta om språkutvikling. Men i dette tilfellet vil vi faktisk bare forholde oss til separate tilstander av språket, som i sin kvantitative karakterisering ikke viser seg å henge sammen mer enn en komparativ kvantitativ karakterisering av forskjellige språk. Denne typen kvantitativ "dynamikk" vil ikke inneholde noe organisk, og forbindelsen mellom språkets individuelle tilstander vil kun hvile på sammenligningen av numeriske relasjoner. Hvis du også i dette tilfellet skal ty til en analogi, kan vi referere til barnets vekst. Hans utvikling kan selvfølgelig representeres i form av dynamikken til numeriske data om hans vekt, høyde, skiftende forhold mellom volumet av deler av kroppen hans, men alle disse dataene er absolutt løsrevet fra alt som først og fremst utgjør den individuelle essensen av en person - hans karakter, tilbøyeligheter, vaner. , smaker, etc.

En annen negativ side ved den matematiske «modelleringen» av språket er det faktum at det ikke kan tjene som det generelle prinsippet som det er mulig å gjennomføre en omfattende og omfattende – systematisk beskrivelse av språket på. Bare en matematisk tilnærming til fenomenene språk, for eksempel, vil ikke gjøre det mulig å besvare selv slike grunnleggende spørsmål (uten hvilke selve eksistensen av språkvitenskapen er utenkelig), som: hva er språk, hvilke fenomener bør være klassifisert som riktig lingvistisk, hvordan et ord eller en setning er definert, hva er de grunnleggende begrepene og kategoriene av språk, etc. Før du går over til de matematiske metodene for å studere språk, er det nødvendig å allerede ha svar (selv i form av en arbeidsform hypotese) på alle disse spørsmålene på forhånd. Det er ingen grunn til å lukke øynene for det faktum at i alle tilfeller vi kjenner til studiet av språklige fenomener med matematiske metoder, måtte alle disse konseptene og kategoriene uunngåelig aksepteres slik de ble definert av tradisjonelle eller, relativt sett, kvalitative metoder.

Dette trekket ved matematiske metoder i deres språklige anvendelse ble bemerket av Spang-Hanssen da pi<146>sal: «Man bør huske på at observerte fakta som får et kvantitativt uttrykk ... ikke har noen verdi dersom de ikke inngår i beskrivelsen, og for språklige formål bør det være en systematisk beskrivelse, nært knyttet til en kvalitativ språklig beskrivelse og teori» 1 15 . I en annen tale av Spang-Hanssen finner vi en presisering av denne tanken: «Inntil muligheten for å konstruere et kvantitativt system er bevist, og så lenge det finnes et allment akseptert kvalitativt system for et gitt fagområde, skal frekvensberegninger m.fl. numeriske egenskaper fra et språklig synspunkt gir ingen mening» 1 16 . Lignende ideer uttrykkes av Uldall, noe som uventet forbinder dem med utviklingen av det generelle teoretiske grunnlaget for glossematikk: «Når en lingvist vurderer eller måler alt han anser og måler, er det ikke selv bestemt kvantitativt; for eksempel blir ord, når de telles, definert, hvis de i det hele tatt er definert, i ganske forskjellige termer.<147>

Dermed viser det seg at både i teoretiske termer og i deres praktiske anvendelse er matematiske metoder direkte avhengige av språklige begreper og kategorier definert av tradisjonelle, filologiske eller, som nevnt ovenfor, kvalitative metoder. Når det gjelder anvendt lingvistikk, er det viktig å innse denne avhengigheten, og følgelig å bli kjent med helheten av hovedkategoriene for tradisjonell lingvistikk.

Riktignok er det ingen grunn til å bebreide representanter for de eksakte vitenskapene som arbeider innen anvendt lingvistikk for ikke å bruke dataene til moderne lingvistikk. Dette samsvarer ikke med tingenes faktiske tilstand. De kjenner ikke bare godt, men bruker også i sitt arbeid i stor utstrekning systemene med differensielle trekk etablert av lingvister som er karakteristiske for forskjellige språk, distribusjonen og arrangementet av lingvistiske elementer innenfor spesifikke språksystemer, prestasjonene til akustisk fonetikk, etc. Men i dette tilfellet er det nødvendig med et meget betydelig forbehold. Faktisk bruker representanter for de eksakte vitenskapene dataene fra kun én retning i lingvistikken - den såkalte beskrivende lingvistikken, som bevisst skilte seg fra de tradisjonelle problemene innen teoretisk lingvistikk, langt fra å dekke hele feltet av lingvistisk forskning, fra et egentlig språklig synspunkt har den betydelige metodiske mangler, som førte til nylig avslørt krise 1 18 , og har dessuten en rent praktisk orientering, tilsvarende interessene til anvendt lingvistikk. Alle forbeholdene og bebreidelsene som ble gjort ovenfor mot den statiske betraktningen av språket, gjelder for beskrivende lingvistikk. En slik ensidig tilnærming av deskriptiv lingvistikk kan, etterforskeren<148>Det kan imidlertid bare rettferdiggjøres med oppgavene som anvendt lingvistikk setter seg selv, men det uttømmer langt fra hele innholdet i språkvitenskapen.

I prosessen med å utvikle spørsmål om anvendt lingvistikk kan det oppstå nye teoretiske problemer, og de har faktisk allerede oppstått. Noen av disse problemene er nært knyttet til de spesifikke oppgavene til anvendt lingvistikk og er rettet mot å overvinne vanskelighetene som oppstår med å løse disse problemene. Andre problemer er direkte relatert til teoretisk lingvistikk, som tillater et nytt perspektiv på tradisjonelle ideer eller åpner for nye områder innen språkforskning, nye konsepter og teorier. Blant disse sistnevnte er for eksempel problemet med å skape et "maskinspråk" (eller mellomspråk), som er nærmest knyttet til et komplekst sett av slike kardinalspørsmål innen teoretisk lingvistikk som forholdet mellom begreper og leksikalske betydninger, logikk og grammatikk, diakroni og synkroni, språkets tegnnatur, essensen av språklig mening, prinsippene for å konstruere kunstige språk, etc. 1 19 . I dette tilfellet er det spesielt viktig å etablere gjensidig forståelse og fellesskap i det felles arbeidet til representanter for språklige disipliner og eksakte vitenskaper. Når det gjelder den språklige siden, i dette tilfellet bør vi tilsynelatende ikke snakke om allerede å begrense innsatsen til for eksempel designere av oversettelsesmaskiner på forhånd" og prøve å etablere arbeidsevnen til slike maskiner med versene til N. Gribatsjov eller prosaen til V. Kochetov 1 20 . Maskinen selv vil finne grensene for dens evner, og lønnsomhet - grensene for bruken. Men lingvister, som deres bidrag til den felles sak, må bringe sin kunnskap om funksjonene i språkets struktur, dets allsidighet, de interne kryssende relasjonene mellom dets elementer, så vel som de brede og multilaterale forbindelsene mellom språk og fysiske, fysiologiske , mentalt og logisk<149>mi-fenomener, spesifikke funksjonsmønstre og utvikling av språket. Helheten av denne kunnskapen er nødvendig for designere av de tilsvarende maskinene for ikke å vandre i feil retninger, men for å gjøre søket målrettet og tydelig orientert. Selv den er veldig kort anmeldelse tilfeller av anvendelse av matematiske metoder på språklige problemer, som ble laget i dette essayet, overbeviser om at slik kunnskap på ingen måte vil være overflødig for representanter for de eksakte vitenskapene.

På grunnlag av alle de ovennevnte betraktningene kan man åpenbart komme til noen generelle konklusjoner.

Så, matematisk lingvistikk? Hvis dette betyr bruk av matematiske metoder som en universell hovednøkkel for å løse alle språklige problemer, bør slike påstander anerkjennes som absolutt uberettigede. Alt som har blitt gjort i denne retningen har så langt gjort svært lite eller ikke i det hele tatt for å løse de tradisjonelle problemene i språkvitenskapen. I verste fall er bruken av matematiske metoder ledsaget av åpenbare absurditeter eller, fra et språklig synspunkt, absolutt meningsløst. I beste fall kan matematiske metoder brukes som hjelpemetoder for lingvistisk forskning, og stilles til tjeneste for spesifikke og begrensede språklige problemer. Det kan ikke være snakk om noen «kvantitativ språkfilosofi» i dette tilfellet. Fysikk, psykologi, fysiologi, logikk, sosiologi og etnologi grep i sin tid inn på uavhengigheten til språkvitenskapen, men de kunne ikke underlegge språkvitenskapen. Det motsatte skjedde - lingvistikken utnyttet prestasjonene til disse vitenskapene og, i den grad det var nødvendig for seg selv, begynte å bruke deres hjelp, og beriket dermed arsenalet av forskningsmetoder. Nå er det tydeligvis matematikkens tur. Det er å håpe at dette nye fellesskapet også vil bidra til å styrke språkvitenskapen, forbedre dens arbeidsmetoder og øke deres mangfold. Det er derfor like legitimt å snakke om matematisk lingvistikk som om fysisk lingvistikk, fysiologisk lingvistikk, logisk lingvistikk, psykologisk lingvistikk og<150>osv. Det er ingen slik lingvistikk, det er bare en lingvistikk, som lønnsomt bruker data fra andre vitenskaper som hjelpeforskningsverktøy. Dermed er det ingen grunn til å trekke seg tilbake før angrepet av den nye vitenskapen og lett gi den posisjonene den har vunnet. Her er det veldig passende å minne om ordene til A. Martinet: «Kanskje det er fristende å slutte seg til en eller annen større tankebevegelse ved å bruke noen få velvalgte termer, eller å erklære med en eller annen matematisk formel strengheten i ens resonnement. Tiden er imidlertid inne for lingvister til å innse uavhengigheten til sin vitenskap og å frigjøre seg fra det mindreverdighetskomplekset som får dem til å assosiere enhver av sine handlinger med et eller annet generelt vitenskapelig prinsipp, som et resultat av at virkelighetens konturer alltid blir bare mer vagt, i stedet for å bli klarere 21 .

Derfor matematikk i seg selv og lingvistikk i seg selv. Dette utelukker på ingen måte deres gjensidige hjelp eller et vennlig møte i felles arbeid med vanlige problemer. Denne typen anvendelsessted for den samordnede innsatsen til de to vitenskapene er hele det brede spekteret av problemer som er en del av anvendt lingvistikk og er av stor nasjonal økonomisk betydning. Man skulle bare ønske at begge vitenskapene i deres felles arbeid viste maksimal gjensidig forståelse, noe som utvilsomt også ville bidra til maksimal fruktbarhet av deres samarbeid.<151>

Innholdsfortegnelse
Introduksjon
Kapittel 1. Historien om anvendelsen av matematiske metoder i lingvistikk
1.1. Dannelsen av strukturell lingvistikk ved overgangen til 1800- og 1900-tallet
1.2. Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre
Konklusjon
Litteratur
Introduksjon
På 1900-tallet har det vært en kontinuerlig trend mot samspill og gjensidig gjennomtrenging av ulike kunnskapsfelt.Grensene mellom individuelle vitenskaper utviskes gradvis; det er flere og flere grener av mental aktivitet som er "i krysset" av humanitær, teknisk og naturvitenskapelig kunnskap.
Et annet åpenbart trekk ved moderniteten er ønsket om å studere strukturer og deres bestanddeler. Derfor, mer og mer plass i vitenskapelig teori og i praksis er gitt til matematikk. Ved å komme i kontakt på den ene siden med logikk og filosofi, på den andre siden med statistikk (og følgelig med samfunnsvitenskapene), trenger matematikken dypere og dypere inn i de områdene som lenge ble ansett for å være rent. "humanitær", utvide deres heuristiske potensiale (svaret på spørsmålet "hvor mye" vil ofte bidra til å svare på spørsmålene "hva" og "hvordan"). Lingvistikk var intet unntak, målet mitt semesteroppgave- kort fremheve sammenhengen mellom matematikk og en slik gren av lingvistikk som lingvistikk. Siden 1950-tallet har matematikk blitt brukt i lingvistikk for å lage et teoretisk apparat for å beskrive strukturen til språk (både naturlige og kunstige). Det skal imidlertid sies at hun ikke umiddelbart fant sin egen type. praktisk bruk. Til å begynne med begynte matematiske metoder i lingvistikk å bli brukt for å klargjøre de grunnleggende begrepene i lingvistikk, men med utviklingen av datateknologi begynte et slikt teoretisk premiss å bli brukt i praksis. Løsningen av oppgaver som maskinoversettelse, innhenting av maskininformasjon, automatisk tekstbehandling krevde en fundamentalt ny tilnærming til språket. Et spørsmål har dukket opp før lingvister: hvordan lære å representere språklige mønstre i den formen de kan brukes direkte på teknologi. Begrepet "matematisk lingvistikk", som er populært i vår tid, refererer til all lingvistisk forskning som bruker eksakte metoder (og begrepet eksakte metoder i vitenskap er alltid nært knyttet til matematikk). Noen forskere fra tidligere år mener at selve uttrykket ikke kan heves til rangering av et begrep, siden det ikke betyr noen spesiell "lingvistikk", men bare en ny retning fokusert på å forbedre, øke nøyaktigheten og påliteligheten til språkforskningsmetoder. Lingvistikk bruker både kvantitative (algebraiske) og ikke-kvantitative metoder, noe som bringer den nærmere matematisk logikk, og følgelig til filosofi, og til og med til psykologi. Til og med Schlegel bemerket samspillet mellom språk og bevissthet, og den fremtredende lingvisten på begynnelsen av det tjuende århundre, Ferdinand de Saussure (jeg vil fortelle om hans innflytelse på utviklingen av matematiske metoder i lingvistikken senere), koblet strukturen til språket med dets tilhørighet. til folket. Den moderne forskeren L. Perlovsky går videre, og identifiserer de kvantitative egenskapene til språket (for eksempel antall kjønn, tilfeller) med særegenhetene ved den nasjonale mentaliteten (mer om dette i avsnitt 2.2, "Statistiske metoder i lingvistikk").
Samspillet mellom matematikk og lingvistikk er et mangefasettert tema, og i mitt arbeid vil jeg ikke dvele ved alle, men først og fremst ved de anvendte aspektene.
Kapittel I. Historie om anvendelsen av matematiske metoder i lingvistikk
1.1 Dannelsen av strukturell lingvistikk ved begynnelsen av XIX - XX århundrer
Den matematiske beskrivelsen av språket er basert på ideen om språk som en mekanisme, som dateres tilbake til den berømte sveitsiske lingvisten fra det tidlige tjuende århundre, Ferdinand de Saussure.
Den første koblingen til konseptet hans er teorien om språk som et system som består av tre deler (språket selv - språket, tale - prøveløslatelse og taleaktivitet - språk), der hvert ord (medlem av systemet) anses som ikke i seg selv , men i forbindelse med andre ....


Topp