Historien om anvendelsen av matematiske metoder i lingvistikk. Refleksjoner over samspillet mellom lingvistikk og matematikk

Dannelsen av strukturell lingvistikk ved overgangen til 1800- og 1900-tallet. Statistiske metoder i språkopplæring. Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre. Å lære språket ved hjelp av metoder for formell logikk. Funksjoner ved maskinoversettelse.

INTRODUKSJON

Kapittel 1. Historien om anvendelsen av matematiske metoder i lingvistikk

1.1. Dannelsen av strukturell lingvistikk ved overgangen til 1800- og 1900-tallet

1.2. Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre

Kapittel 2. Utvalgte eksempler på bruk av matematikk i lingvistikk

2.1. Maskinoversettelse

2.2.Statistiske metoder i språklæring

2.3. Å lære et språk ved hjelp av metoder for formell logikk

2.4. Utsikter for anvendelse av matematiske metoder i lingvistikk

Konklusjon

Litteratur

Vedlegg 1. Ronald Schleifer. Ferdinand de Saussure

Vedlegg 2. Ferdinand de Saussure (oversettelse)

INTRODUKSJON

På 1900-tallet har det vært en kontinuerlig trend mot samspill og gjensidig gjennomtrenging av ulike kunnskapsfelt. Grensene mellom de enkelte vitenskapene viskes gradvis ut; det er flere og flere grener av mental aktivitet som er "i krysset" av humanitær, teknisk og naturvitenskapelig kunnskap.

Et annet åpenbart trekk ved moderniteten er ønsket om å studere strukturer og deres bestanddeler. Derfor får matematikken en økende plass, både i vitenskapsteori og i praksis. Ved å komme i kontakt på den ene siden med logikk og filosofi, på den andre siden med statistikk (og følgelig med samfunnsvitenskapene), trenger matematikken dypere og dypere inn i de områdene som lenge ble ansett for å være rent. "humanitær", utvider deres heuristiske potensiale (svaret på spørsmålet "hvor mye" vil ofte bidra til å svare på spørsmålene "hva" og "hvordan"). Lingvistikk var intet unntak.

Hensikten med kursarbeidet mitt er å kort belyse sammenhengen mellom matematikk og en slik gren av lingvistikk som lingvistikk. Siden 1950-tallet har matematikk blitt brukt i lingvistikk for å lage et teoretisk apparat for å beskrive strukturen til språk (både naturlige og kunstige). Samtidig skal det sies at den ikke umiddelbart fant en slik praktisk anvendelse for seg selv. Opprinnelig begynte matematiske metoder i lingvistikk å bli brukt for å klargjøre de grunnleggende begrepene i lingvistikk, men med utviklingen av datateknologi begynte et slikt teoretisk premiss å finne anvendelse i praksis. Løsningen av oppgaver som maskinoversettelse, innhenting av maskininformasjon, automatisk tekstbehandling krevde en fundamentalt ny tilnærming til språket. Språkforskerne sto overfor spørsmålet: hvordan lære å representere språklige mønstre i den formen de kan brukes direkte på teknologi. Begrepet "matematisk lingvistikk", som er populært i vår tid, refererer til all lingvistisk forskning som bruker eksakte metoder (og begrepet eksakte metoder i vitenskap er alltid nært knyttet til matematikk). Noen forskere fra de siste årene mener at selve uttrykket ikke kan heves til rangering av et begrep, siden det ikke betyr noen spesiell "lingvistikk", men bare en ny retning fokusert på å forbedre, øke nøyaktigheten og påliteligheten til språkforskningsmetoder . Lingvistikk bruker både kvantitative (algebraiske) og ikke-kvantitative metoder, noe som bringer den nærmere matematisk logikk, og følgelig til filosofi, og til og med til psykologi. Til og med Schlegel bemerket samspillet mellom språk og bevissthet, og Ferdinand de Saussure, en fremtredende lingvist fra det tidlige tjuende århundre (jeg vil fortelle om hans innflytelse på utviklingen av matematiske metoder i lingvistikk senere), koblet strukturen til språket med dets tilhørighet. til folket. Den moderne forskeren L. Perlovsky går videre, og identifiserer de kvantitative egenskapene til språket (for eksempel antall kjønn, tilfeller) med særegenhetene ved den nasjonale mentaliteten (mer om dette i avsnitt 2.2, "Statistiske metoder i lingvistikk").

Samspillet mellom matematikk og lingvistikk er et mangefasettert tema, og i mitt arbeid vil jeg ikke dvele ved alle, men først og fremst ved de anvendte aspektene.

Kapittel IHistorie om anvendelse av matematiske metoder i lingvistikk

1.1 Dannelse av strukturell lingvistikkved begynnelsen av XIX - XX århundrer

Den matematiske beskrivelsen av språket er basert på ideen om språk som en mekanisme, som går tilbake til den berømte sveitsiske lingvisten fra det tidlige tjuende århundre, Ferdinand de Saussure.

Den første koblingen til konseptet hans er teorien om språk som et system som består av tre deler (språket i seg selv er Språk, tale - passord, og taleaktivitet - Språk), der hvert ord (medlem av systemet) ikke anses i seg selv, men i forbindelse med andre medlemmer. Som en annen fremtredende lingvist, dansken Louis Hjelmslev, senere bemerket, var Saussure "den første som krevde en strukturell tilnærming til språket, det vil si en vitenskapelig beskrivelse av språket ved å registrere relasjonene mellom enheter."

Etter å ha forstått språk som en hierarkisk struktur, var Saussure den første som stilte problemet med verdien og betydningen av språkenheter. Separate fenomener og hendelser (for eksempel historien om opprinnelsen til individuelle indoeuropeiske ord) bør studeres ikke av seg selv, men i et system der de er korrelert med lignende komponenter.

Den strukturelle enheten til Saussure-språket betraktet ordet "tegn", der lyd og mening ble kombinert. Ingen av disse elementene eksisterer uten hverandre: derfor forstår morsmålet de ulike nyansene av betydningen av et polysemantisk ord som et separat element i den strukturelle helheten, i språket.

I teorien til F. de Saussure kan man således se samspillet mellom lingvistikk, på den ene siden, med sosiologi og sosialpsykologi (det bør bemerkes at samtidig utvikler Husserls fenomenologi, Freuds psykoanalyse, Einsteins relativitetsteori seg , pågår det eksperimenter med form og innhold i litteratur, musikk og kunst), på den annen side med matematikk (systemisitetsbegrepet tilsvarer det algebraiske språkbegrepet). Et slikt konsept endret begrepet språklig tolkning som sådan: Fenomener begynte å bli tolket ikke i forhold til årsakene til deres forekomst, men i forhold til nåtid og fremtid. Tolkning sluttet å være uavhengig av en persons intensjoner (til tross for at intensjoner kan være upersonlige, «ubevisste» i freudiansk betydning av ordet).

Funksjonen til den språklige mekanismen manifesteres gjennom taleaktiviteten til morsmål. Resultatet av talen er de såkalte "korrekte tekstene" - sekvenser av taleenheter som adlyder visse mønstre, hvorav mange tillater en matematisk beskrivelse. Teorien om måter å beskrive den syntaktiske strukturen på omhandler studiet av metoder for matematisk beskrivelse av korrekte tekster (primært setninger). I en slik struktur defineres språklige analogier ikke ved hjelp av deres iboende kvaliteter, men ved hjelp av systemmessige ("strukturelle") relasjoner.

I Vesten er Saussures ideer utviklet av de yngre samtidige til den store sveitsiske lingvisten: i Danmark - L. Hjelmslev, allerede nevnt av meg, som ga opphav til den algebraiske språkteorien i sitt arbeid "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tsjekkia - den russiske emigrantforskeren N. Trubetskoy.

Statistiske regelmessigheter i studiet av språk begynte å bli behandlet av ingen ringere enn grunnleggeren av genetikk, Georg Mendel. Det var først i 1968 at filologer oppdaget at han i de siste årene av sitt liv var fascinert av studiet av språklige fenomener ved hjelp av matematiske metoder. Mendel brakte denne metoden til lingvistikk fra biologien; på 1990-tallet var det bare de mest vågale lingvistene og biologene som hevdet gjennomførbarheten av en slik analyse. I arkivene til klosteret St. Tomasz i Brno, hvis abbed var Mendel, ble funnet ark med kolonner med etternavn som sluttet på "mann", "bauer", "mayer", og med noen brøker og beregninger. I et forsøk på å oppdage de formelle lovene for opprinnelsen til slektsnavn, gjør Mendel komplekse beregninger, der han tar hensyn til antall vokaler og konsonanter i det tyske språket, det totale antallet ord han vurderer, antall etternavn, etc.

I vårt land begynte den strukturelle lingvistikken å utvikle seg omtrent samtidig som i Vesten - ved overgangen til 1800- og 1900-tallet. Samtidig med F. de Saussure ble konseptet språk som et system utviklet i deres arbeider av professorer ved Kazan University F.F. Fortunatov og I.A. Baudouin de Courtenay. Sistnevnte korresponderte lenge med de Saussure, henholdsvis Genève- og Kazan-skolene for lingvistikk samarbeidet med hverandre. Hvis Saussure kan kalles ideologen for "eksakte" metoder innen lingvistikk, så la Baudouin de Courtenay det praktiske grunnlaget for deres anvendelse. Han var den første som skilte lingvistikk (som korrekt en vitenskap som bruker statistiske metoder og funksjonell avhengighet) fra filologi (et fellesskap av humanitære disipliner som studerer åndelig kultur gjennom språk og tale). Forskeren selv mente at "lingvistikk kan være nyttig i nær fremtid, bare frigjort fra den obligatoriske foreningen med filologi og litteraturhistorie". Fonologi ble "prøvegrunnen" for introduksjonen av matematiske metoder i lingvistikk - lyder som "atomer" i språksystemet, med et begrenset antall lett målbare egenskaper, var det mest hensiktsmessige materialet for formelle, strenge beskrivelsesmetoder. Fonologi benekter eksistensen av mening i lyd, så den "menneskelige" faktoren ble eliminert i studiene. I denne forstand er fonemer som fysiske eller biologiske objekter.

Fonemer, som de minste språklige elementene som er akseptable for persepsjon, representerer en egen sfære, en egen "fenomenologisk virkelighet". For eksempel på engelsk kan lyden "t" uttales annerledes, men i alle tilfeller vil en person som snakker engelsk oppfatte den som "t". Hovedsaken er at fonemet vil utføre sin viktigste - meningsfulle - funksjon. Dessuten er forskjellene mellom språk slik at varianter av en lyd på ett språk kan svare til forskjellige fonemer på et annet; for eksempel er "l" og "r" på engelsk forskjellige, mens de på andre språk er varianter av samme fonem (som det engelske "t", uttalt med eller uten aspirasjon). Det enorme vokabularet til ethvert naturlig språk er et sett med kombinasjoner av et mye mindre antall fonemer. På engelsk, for eksempel, brukes bare 40 fonemer til å uttale og skrive omtrent en million ord.

Lydene til et språk er et systematisk organisert sett med funksjoner. På 1920-1930-tallet, etter Saussure, pekte Jacobson og N.S. Trubetskoy ut de "særeegenskapene" til fonemer. Disse funksjonene er basert på strukturen til taleorganene - tunge, tenner, stemmebånd. For eksempel på engelsk er forskjellen mellom "t" og "d" tilstedeværelsen eller fraværet av en "stemme" (spenningen i stemmebåndene) og stemmenivået som skiller ett fonem fra et annet. Dermed kan fonologi betraktes som et eksempel på den generelle språkregelen beskrevet av Saussure: «Det er bare forskjeller i språk». Enda viktigere er ikke dette: forskjellen innebærer vanligvis de nøyaktige forholdene den befinner seg mellom; men i språket er det bare forskjeller uten presise betingelser. Enten vi vurderer «betegnelse» eller «betegnet» – i språket er det verken begreper eller lyder som ville eksistert før utviklingen av språksystemet.

I saussureansk lingvistikk blir det studerte fenomenet forstått som et sett med sammenligninger og motsetninger av språk. Språk er både et uttrykk for ordenes betydning og et kommunikasjonsmiddel, og disse to funksjonene faller aldri sammen. Vi kan legge merke til vekslingen mellom form og innhold: språklige kontraster definerer dens strukturelle enheter, og disse enhetene samhandler for å skape et visst meningsfullt innhold. Siden elementene i språket er tilfeldige, kan verken kontrast eller kombinasjon være grunnlaget. Dette betyr at i et språk danner særtrekk en fonetisk kontrast på et annet forståelsesnivå, fonemer kombineres til morfemer, morfemer - til ord, ord - til setninger osv. I alle fall et helt fonem, ord, setning osv. er mer enn bare summen av delene.

Saussure foreslo ideen om en ny vitenskap fra det tjuende århundre, atskilt fra lingvistikk, og studerte rollen til tegn i samfunnet. Saussure kalte denne vitenskapen semiologi (fra det greske "semeion" - et tegn). "Vitenskapen" om semiotikk, som utviklet seg i Øst-Europa på 1920- og 1930-tallet og i Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære funn sammensatt (eller artikulert) i form av disse strukturene. I tillegg, i skumringen av karrieren, parallelt med kurset i generell lingvistikk, engasjerte Saussure seg i en "semiotisk" analyse av senromersk poesi, og prøvde å oppdage bevisst komponerte anagrammer av egennavn. Denne metoden var på mange måter det motsatte av rasjonalisme i dens språklige analyse: den var et forsøk på å studere i et system problemet med "sannsynlighet" i språk. Slik forskning bidrar til å fokusere på den «virkelige siden» av sannsynlighet; «stikkordet» som Saussure leter etter et anagram for, er ifølge Jean Starobinsky «et verktøy for poeten, ikke kilden til diktets liv». Diktet tjener til å bytte ut lydene til nøkkelordet. I følge Starobinsky fordyper ikke Saussure i denne analysen søket etter skjulte betydninger. Tvert imot, i hans verk er et ønske om å unngå spørsmål knyttet til bevissthet merkbart: «siden poesi ikke bare uttrykkes i ord, men også i det disse ordene gir opphav til, går den utenfor bevissthetens kontroll og avhenger kun av språkets lover» (se . Vedlegg 1).

Saussures forsøk på å studere egennavn i senromersk poesi understreker en av komponentene i hans språklige analyse – tegnenes vilkårlige natur, samt den formelle essensen av Saussures språkvitenskap, som utelukker muligheten for å analysere mening. Todorov konkluderer med at verkene til Saussure i dag ser ut til å være ekstremt konsistente i deres motvilje mot å studere symbolene på et fenomen som har en klart definert betydning [vedlegg 1]. Ved å utforske anagrammer, legger Saussure kun hensyn til repetisjon, men ikke til tidligere alternativer. . . . Ved å studere Nibelungenlied, definerer han symbolene bare for å tilordne dem til feilavlesninger: hvis de er utilsiktede, eksisterer ikke symbolene. Tross alt, i sine skrifter om generell lingvistikk, gjør han antagelsen om eksistensen av en semiologi som ikke bare beskriver språklige tegn; men denne antakelsen er begrenset av det faktum at semiologi bare kan beskrive tilfeldige, vilkårlige tegn.

Hvis dette virkelig er slik, er det bare fordi han ikke kunne forestille seg "intensjon" uten et objekt; han klarte ikke helt å bygge bro mellom form og innhold – i hans forfatterskap ble dette til et spørsmål. I stedet vendte han seg mot «språklig legitimitet». Mellom på den ene siden nittende århundres begreper basert på historie og subjektive formodninger, og metoder for tilfeldig tolkning basert på disse begrepene, og på den annen side strukturalistiske begreper som sletter motsetningen mellom form og innhold (subjekt og objekt), mening og opprinnelse i strukturalisme, psykoanalyse og til og med kvantemekanikk - skriftene til Ferdinand de Saussure om lingvistikk og semiotikk markerer et vendepunkt i studiet av betydninger i språk og kultur.

Russiske forskere var også representert på den første internasjonale kongressen for lingvister i Haag i 1928. S. Kartsevsky, R. Yakobson og N. Trubetskoy laget en rapport som undersøkte den hierarkiske strukturen til språket - i ånden til de mest moderne ideene for begynnelsen av forrige århundre. Jakobson utviklet i sine skrifter Saussures ideer om at de grunnleggende elementene i et språk først og fremst bør studeres i forbindelse med deres funksjoner, og ikke med årsakene til deres forekomst.

Dessverre, etter at Stalin kom til makten i 1924, blir russisk lingvistikk, som mange andre vitenskaper, kastet tilbake. Mange talentfulle vitenskapsmenn ble tvunget til å emigrere, ble utvist fra landet eller døde i leire. Først siden midten av 1950-tallet har en viss pluralisme av teorier blitt mulig – mer om dette i avsnitt 1.2.

1.2 Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre

Ved midten av det tjuende århundre hadde fire verdensspråklige skoler dannet seg, som hver viste seg å være stamfaren til en viss "nøyaktig" metode. Leningrad fonologiske skole(forfaderen var en student av Baudouin de Courtenay L.V. Shcherba) brukte et psykolingvistisk eksperiment basert på analysen av talen til morsmål som hovedkriteriet for å generalisere lyd i form av et fonem.

Forskere Praha språksirkel, spesielt - grunnleggeren N.S. Trubetskoy, som emigrerte fra Russland, utviklet teorien om opposisjoner - den semantiske strukturen til språket ble beskrevet av dem som et sett med opposisjonelt konstruerte semantiske enheter - Sem. Denne teorien ble brukt i studiet av ikke bare språk, men også kunstnerisk kultur.

Ideologer Amerikansk deskriptivisme var lingvistene L. Bloomfield og E. Sapir. Språk ble presentert for deskriptivister som et sett med taleutsagn, som var hovedobjektet for deres studie. Deres fokus var på reglene for vitenskapelig beskrivelse (derav navnet) av tekster: studiet av organisering, arrangement og klassifisering av elementene deres. Formalisering av analytiske prosedyrer innen fonologi og morfologi (utvikling av prinsipper for studiet av språk på forskjellige nivåer, distributiv analyse, metoden for direkte bestanddeler, etc.) førte til utformingen av generelle spørsmål om språklig modellering. Uoppmerksomhet på planen for språkets innhold, så vel som den paradigmatiske siden av språket, tillot ikke deskriptivister å tolke språket som et system fullt nok.

På 1960-tallet utviklet teorien om formell grammatikk seg, som hovedsakelig oppsto på grunn av arbeidet til den amerikanske filosofen og språkforskeren N. Chomsky. Han regnes med rette som en av de mest kjente moderne vitenskapsmenn og offentlige personer, mange artikler, monografier og til og med en dokumentar i full lengde er viet til ham. Med navnet på en fundamentalt ny måte å beskrive den syntaktiske strukturen oppfunnet av Chomsky - generativ (genererende) grammatikk - ble den tilsvarende trenden i lingvistikk kalt generativisme.

Chomsky, en etterkommer av innvandrere fra Russland, studerte lingvistikk, matematikk og filosofi ved University of Pennsylvania siden 1945, og ble sterkt påvirket av sin lærer Zelig Harris - i likhet med Harris, betraktet Chomsky og anser fortsatt sine politiske synspunkter nær anarkisme (han er fortsatt kjent som kritiker av det eksisterende amerikanske politiske systemet og som en av anti-globalismens åndelige ledere).

Chomskys første store vitenskapelige arbeid, masteroppgave "Morphology of Modern Hebrew » (1951) har forblitt upublisert. Chomsky tok doktorgraden fra University of Pennsylvania i 1955, men mye av forskningen som lå til grunn for avhandlingen hans (publisert i sin helhet først i 1975 under tittelen The Logical Structure of Linguistic Theory) og hans første monografi, Syntactic Structures (1957, Rus. trans. . 1962), ble fremført ved Harvard University i 1951-1955. I samme 1955 flyttet forskeren til Massachusetts Institute of Technology, hvor han ble professor i 1962.

Chomskys teori har gått gjennom flere stadier i utviklingen.

I den første monografien "Syntactic Structures" presenterte forskeren språket som en mekanisme for å generere et uendelig sett med setninger ved å bruke et begrenset sett med grammatiske virkemidler. For å beskrive språklige egenskaper foreslo han begrepene dype (skjult fra direkte persepsjon og generert av et system med rekursive, dvs. kan brukes gjentatte ganger, regler) og overflate (direkte oppfattet) grammatiske strukturer, samt transformasjoner som beskriver overgangen fra dype strukturer til overflatestrukturer. Flere overflatestrukturer kan tilsvare en dyp struktur (for eksempel en passiv struktur Dekretet er signert av presidenten avledet fra den samme dype strukturen som den aktive konstruksjonen Presidenten undertegner dekretet) og omvendt (dermed tvetydigheten mor elsker datter beskrevet som et resultat av et sammentreff av overflatestrukturer som går tilbake til to forskjellige dype, hvor den ene er den som elsker datteren, og i den andre den som er elsket av datteren).

Chomskys standardteori anses å være "Aspects"-modellen som er fremsatt i Chomskys bok "Aspects of the Theory of Syntax". I denne modellen ble for første gang regler for semantisk tolkning introdusert i formell teori, som tilskrev mening til dype strukturer. I Aspects står språklig kompetanse i motsetning til bruk av språk (performance), den såkalte Katz-Postal-hypotesen om bevaring av mening under transformasjon tas i bruk, i forbindelse med hvilken begrepet valgfri transformasjon er utelukket, og et apparat av syntaktiske funksjoner som beskriver leksikalsk kompatibilitet introduseres.

På 1970-tallet arbeidet Chomsky med teorien om kontroll og binding (GB-teori - fra ordene Myndighetene Og bindende) er mer generell enn den forrige. I den forlot forskeren de spesifikke reglene som beskriver de syntaktiske strukturene til spesifikke språk. Alle transformasjoner er erstattet med én universell bevegelsestransformasjon. Innenfor rammen av GB-teorien finnes det også private moduler som hver står for sin del av grammatikken.

Allerede nylig, i 1995, la Chomsky frem et minimalistisk program, der menneskelig språk beskrives som maskinspråk. Dette er bare et program - ikke en modell eller en teori. I den identifiserer Chomsky to hovedundersystemer av det menneskelige språkapparatet: leksikonet og datasystemet, samt to grensesnitt - fonetisk og logisk.

Chomskys formelle grammatikker har blitt klassiske for å beskrive ikke bare naturlige, men også kunstige språk - spesielt programmeringsspråk. Utviklingen av strukturell lingvistikk i andre halvdel av 1900-tallet kan med rette betraktes som en "chomskisk revolusjon".

Moskva fonologiske skole, hvis representanter var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, brukte en lignende teori for å studere fonetikk. Gradvis begynner "eksakte" metoder å bli brukt med hensyn til ikke bare fonetikk, men også syntaks. Både lingvister og matematikere, både her og i utlandet, begynner å studere språkets struktur. På 1950- og 60-tallet begynte et nytt stadium i samspillet mellom matematikk og lingvistikk i USSR, assosiert med utviklingen av maskinoversettelsessystemer.

Drivkraften for begynnelsen av disse verkene i vårt land var den første utviklingen innen maskinoversettelse i USA (selv om den første mekaniserte oversettelsesenheten av P.P. Smirnov-Troyansky ble oppfunnet i USSR i 1933, den var primitiv, ble ikke utbredt). I 1947 kom A. Butt og D. Britten med en kode for ord-for-ord-oversettelse ved hjelp av en datamaskin, et år senere foreslo R. Richens en regel for å dele ord i stammer og endelser i maskinoversettelse. Disse årene var ganske annerledes enn i dag. Dette var veldig store og dyre maskiner som tok opp hele rom og krevde en stor stab av ingeniører, operatører og programmerere for å vedlikeholde dem. I utgangspunktet ble disse datamaskinene brukt til å utføre matematiske beregninger for behovene til militære institusjoner - det nye innen matematikk, fysikk og teknologi tjente først og fremst militære anliggender. I de tidlige stadiene ble utviklingen av MP aktivt støttet av militæret, med alt dette (under forholdene under den kalde krigen), den russisk-engelske retningen utviklet seg i USA og den anglo-russiske retningen i USSR.

I januar 1954 fant "Georgetown-eksperimentet" sted ved Massachusetts Technical University - den første offentlige demonstrasjonen av oversettelse fra russisk til engelsk på IBM-701-maskinen. Sammendrag av meldingen om den vellykkede gjennomgangen av eksperimentet, laget av D.Yu. Panov, dukket opp i RJ "Mathematics", 1954, nr. 10: "Oversettelse fra ett språk til et annet ved hjelp av en maskin: en rapport om den første vellykkede testen."

D. Yu. Panov (den gang direktør for Institute of Scientific Information - INI, senere VINITI) tiltrakk seg I. K. Belskaya, som senere ledet maskinoversettelsesgruppen ved Institute of Precise Mathematics and Computer Engineering ved USSR Academy of Sciences, til å arbeid med maskinoversettelse. Ved slutten av 1955 dateres den første erfaringen med å oversette fra engelsk til russisk ved hjelp av BESM-maskinen tilbake. Programmer for BESM ble satt sammen av N.P. Trifonov og L.N. Korolev, hvis doktorgradsavhandling var viet metoder for å konstruere ordbøker for maskinoversettelse.

Parallelt ble det utført arbeid med maskinoversettelse ved Institutt for anvendt matematikk ved Mathematical Institute of USSR Academy of Sciences (nå M.V. Keldysh Institute of Applied Mathematics ved det russiske vitenskapsakademiet). Etter initiativ fra matematikeren A.A. Lyapunov. Han involverte O.S. Kulagin og hennes studenter T.D. Wentzel og N.N. Ricco. Ideene til Lyapunov og Kulagina om muligheten for å bruke teknologi til å oversette fra ett språk til et annet ble publisert i tidsskriftet Nature, 1955, nr. 8. Fra slutten av 1955 ble T.N. Moloshnaya, som deretter begynte uavhengig arbeid med den engelsk-russiske oversettelsesalgoritmen.

R. Frumkina, som på den tiden var engasjert i oversettelsesalgoritmen fra spansk, husker at det på dette stadiet av arbeidet var vanskelig å ta noen konsekvente skritt. Mye oftere måtte jeg følge den heuristiske opplevelsen - min egen eller kolleger.

Samtidig var den første generasjonen av maskinoversettelsessystemer svært ufullkommen. Alle var basert på sekvensielle oversettelsesalgoritmer "ord for ord", "frase for frase" - semantiske sammenhenger mellom ord og setninger ble ikke tatt i betraktning på noen måte. For eksempel er setningene: John lette etter lekeboksen sin.Til slutt fant han det. Boksen lå i pennen.John var veldig glad. (John lette etter lekeboksen sin. Til slutt fant han den. Boksen lå i lekegrind. John var veldig fornøyd.) "Penn" i denne sammenhengen er ikke en "penn" (skriveverktøy), men en "lekegrind" ( leke-penn). Kunnskap om synonymer, antonymer og figurative betydninger er vanskelig å legge inn i en datamaskin. En lovende retning var utviklingen av datasystemer fokusert på bruk av en menneskelig oversetter.

Over tid ble direkte oversettelsessystemer erstattet av T-systemer (fra det engelske ordet "transfer" - transformasjon), der oversettelse ble utført på nivå med syntaktiske strukturer. Algoritmene til T-systemer brukte en mekanisme som gjorde det mulig å bygge en syntaktisk struktur i henhold til grammatikkreglene for språket i inngangssetningen (ligner på hvordan et fremmedspråk undervises på videregående), og deretter syntetisere utgangssetningen ved å transformere den syntaktiske strukturen og erstatte de nødvendige ordene fra ordboken.

Lyapunov snakket om oversettelse ved å trekke ut betydningen av den oversatte teksten og presentere den på et annet språk. Tilnærmingen til å bygge maskinoversettelsessystemer basert på å oppnå den semantiske representasjonen av inngangssetningen ved semantisk analyse og syntese av inngangssetningen i henhold til den oppnådde semantiske representasjonen anses fortsatt som den mest perfekte. Slike systemer kalles I-systemer (fra ordet "interlingua"). Samtidig er oppgaven med å skape dem, satt tilbake på slutten av 50- og begynnelsen av 60-tallet, ikke fullt ut løst så langt, til tross for innsatsen fra International Federation of IFIP - verdenssamfunnet av forskere innen informasjonsbehandling. .

Forskere tenkte på hvordan man formaliserer og bygger algoritmer for å jobbe med tekster, hvilke ordbøker som skal legges inn i maskinen, hvilke språklige mønstre som skal brukes i maskinoversettelse. Tradisjonell lingvistikk hadde ikke slike ideer – ikke bare når det gjelder semantikk, men også når det gjelder syntaks. På den tiden var det ingen lister over syntaktiske konstruksjoner for noe språk, betingelsene for deres kompatibilitet og utskiftbarhet ble ikke studert, reglene for å konstruere store enheter av syntaktisk struktur fra mindre bestanddeler ble ikke utviklet.

Behovet for å skape det teoretiske grunnlaget for maskinoversettelse førte til dannelsen og utviklingen av matematisk lingvistikk. Den ledende rollen i denne saken i USSR ble spilt av matematikerne A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ble viet studiet av den formelle teorien om grammatikk (samtidig med N. Khomsky i USA), Kuznetsov la frem oppgaven med aksiomatisering av lingvistikk, som går tilbake til verkene til F.F. Fortunatov.

mai 1960 ble dekretet fra presidiet til USSR Academy of Sciences "Om utvikling av strukturelle og matematiske metoder for studiet av språk" vedtatt, og de tilsvarende avdelingene ble opprettet ved Institute of Linguistics og Institute of det russiske språket. Siden 1960 begynte landets ledende humanitære universiteter - Fakultet for filologi ved Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​- å trene personell innen automatisk tekstbehandling.

Samtidig er arbeider med maskinoversettelse av denne perioden, kalt "klassisk", av mer teoretisk enn praktisk interesse. Kostnadseffektive maskinoversettelsessystemer begynte å bli opprettet først på åttitallet av forrige århundre. Jeg vil snakke om dette senere i avsnitt 2.1, Maskinoversettelse.

1960-70-tallet inkluderer dyp teoretisk utvikling ved bruk av metodene for settteori og matematisk logikk, som feltteori og fuzzy set-teori.

Forfatteren av feltteori i lingvistikk var den sovjetiske poeten, oversetteren og lingvisten V.G. Admoni. Han utviklet først teorien sin på grunnlag av det tyske språket. For Admoni betegner konseptet "felt" et vilkårlig ikke-tomt sett med språklige elementer (for eksempel "leksikalsk felt", "semantisk felt").

Strukturen til feltet er heterogen: den består av en kjerne, hvis elementer har et komplett sett med funksjoner som definerer et sett, og en periferi, hvis elementer kan ha begge egenskapene til et gitt sett (ikke alle) og naboene. Jeg vil gi et eksempel som illustrerer denne påstanden: for eksempel, på engelsk, er feltet med sammensatte ord ("dagdrøm" - "drøm" vanskelig å skille fra feltet med uttrykk ("tåregass" - "tåregass"). .

Teorien om uklare sett som allerede er nevnt ovenfor er nært knyttet til feltteori. I USSR har lingvister V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dens stamfar var den amerikanske matematikeren L. Zadeh, som i 1965 publiserte artikkelen "Fuzzy Logic". Zade ga en matematisk begrunnelse for teorien om uklare sett, og vurderte dem på grunnlag av språklig materiale.

I denne teorien snakker vi ikke så mye om elementers tilhørighet til et gitt sett (Aa), men om graden av dette medlemskapet (Aa), siden perifere elementer kan tilhøre flere felt i en eller annen grad. Zade (Lofti-zade) var opprinnelig fra Aserbajdsjan, frem til han var 12 år hadde han praksisen med å kommunisere på fire språk - aserbajdsjansk, russisk, engelsk og persisk - og brukte tre forskjellige alfabeter: kyrillisk, latin, arabisk. Når en vitenskapsmann blir spurt om hva som er felles mellom teorien om uklare sett og lingvistikk, benekter han ikke denne sammenhengen, men presiserer: «Jeg er ikke sikker på at studiet av disse språkene hadde stor innflytelse på min tenkning. Hvis dette var tilfelle, så bare ubevisst. I sin ungdom studerte Zadeh ved en presbyteriansk skole i Teheran, og etter andre verdenskrig emigrerte han til USA. "Spørsmålet er ikke om jeg er en amerikaner, russer, aserbajdsjan eller noen andre," sa han i en av samtalene, "jeg er formet av alle disse kulturene og folkene og føler meg ganske komfortabel blant hver av dem." I disse ordene er det noe som ligner på det som kjennetegner teorien om fuzzy sets - et avvik fra entydige definisjoner og skarpe kategorier.

I vårt land, på 70-tallet, ble verkene til vestlige lingvister fra det tjuende århundre oversatt og studert. I.A. Melchuk oversatte verkene til N. Chomsky til russisk. PÅ. Slyusareva i sin bok "The Theory of F. de Saussure in the Light of Modern Linguistics" kobler postulatene til Saussures lære med de faktiske problemene innen lingvistikk på 70-tallet. Det er en tendens til ytterligere matematisering av lingvistikk. De ledende innenlandske universitetene trener personell i spesialiteten "Matematisk (teoretisk, anvendt) lingvistikk". Samtidig er det i Vesten et kraftig sprang i utviklingen av datateknologi, som krever stadig flere nye språklige grunnlag.

På 1980-tallet ble professor ved Institute of Oriental Studies ved Academy of Sciences Yu.K. Lekomtsev, mens han analyserer språket i lingvistikk gjennom analyse av skjemaer, tabeller og andre typer notasjon som brukes i språklige beskrivelser, vurderer matematiske systemer som egner seg for disse formålene (hovedsakelig systemer av matrisealgebra).

Således, gjennom det tjuende århundre, var det en konvergens mellom det eksakte og humaniora. Samspillet mellom matematikk og lingvistikk fikk i økende grad praktiske anvendelser. Mer om dette i neste kapittel.

Kapittel 2. Utvalgte eksempler på bruk av matematikk i lingvistikk

2.1 Maskinoversettelse

Ideen om å oversette fra ett språk til et annet ved hjelp av en universell mekanisme oppsto flere århundrer før den første utviklingen på dette området begynte - tilbake i 1649 foreslo Rene Descartes ideen om et språk der de tilsvarende ideene til forskjellige språk vil bli uttrykt med ett symbol. De første forsøkene på å implementere denne ideen på 1930-40-tallet, begynnelsen av den teoretiske utviklingen i midten av århundret, forbedringen av oversettelsessystemer ved hjelp av teknologi på 1970-80-tallet, den raske utviklingen av oversettelsesteknologi i det siste tiår - dette er stadiene i utviklingen av maskinoversettelse som industri. Det er fra arbeidet med maskinoversettelse at datalingvistikk som vitenskap har vokst.

Med utviklingen av datateknologi på slutten av 70-tallet og begynnelsen av 80-tallet satte forskere seg mer realistiske og kostnadseffektive mål – maskinen ble ikke en konkurrent (som tidligere antatt), men en assistent for en menneskelig oversetter. Maskinoversettelse slutter å tjene utelukkende militære oppgaver (alle sovjetiske og amerikanske oppfinnelser og forskning, primært fokusert på russisk og engelsk, bidro til den kalde krigen på en eller annen måte). I 1978 ble ord over naturlig språk overført over det sammenkoblede Arpa-nettverket, og seks år senere dukket de første mikrodaopp i USA.

På 70-tallet kjøpte EU-kommisjonen den engelsk-franske versjonen av Systran-dataoversetteren, og bestiller også den fransk-engelske og italiensk-engelske versjonen, og det russisk-til-engelsk oversettelsessystemet som brukes av de amerikanske væpnede styrker. Slik ble grunnlaget for EUROTRA-prosjektet lagt.

Om gjenopplivingen av maskinoversettelse på 70-80-tallet. følgende fakta vitner: Kommisjonen for De europeiske fellesskap (CEC) kjøper den engelsk-franske versjonen av Systran, samt oversettelsessystemet fra russisk til engelsk (sistnevnte utviklet etter ALPAC-rapporten og fortsatte å bli brukt av US Air Force og NASA); i tillegg beordrer CEC utviklingen av de fransk-engelske og italiensk-engelske versjonene. Samtidig er det en rask utvidelse av maskinoversettelsesaktiviteter i Japan; i USA beordrer Pan American Health Organization (PAHO) utviklingen av en spansk-engelsk retning (SPANAM-system); US Air Force finansierer utviklingen av et maskinoversettelsessystem ved Linguistic Research Center ved University of Texas i Austin; TAUM-gruppen i Canada gjør bemerkelsesverdige fremskritt i utviklingen av deres METEO-system (meteorologisk oversettelse). En rekke prosjekter startet på 70- og 80-tallet. senere utviklet til fullverdige kommersielle systemer.

I perioden 1978-93 ble det brukt 20 millioner dollar på forskning innen maskinoversettelse i USA, 70 millioner i Europa og 200 millioner i Japan.

En av de nye utviklingene er TM-teknologien (oversettelsesminne), som fungerer etter akkumuleringsprinsippet: under oversettelsesprosessen lagres det originale segmentet (setningen) og oversettelsen, noe som resulterer i dannelsen av en språklig database; hvis et identisk eller lignende segment blir funnet i den nylig oversatte teksten, vises det sammen med oversettelsen og en indikasjon på prosentandelen. Oversetteren tar deretter en beslutning (om å redigere, avvise eller godta oversettelsen), hvis resultat lagres av systemet, så det er ikke nødvendig å oversette den samme setningen to ganger. Et velkjent kommersielt system basert på TM-teknologi er for tiden utviklet av TRADOS-systemet (grunnlagt i 1984).

For tiden utvikler flere dusin selskaper kommersielle maskinoversettelsessystemer, inkludert: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata programvare; Linguistica b.v. og andre Nå kan du bruke tjenestene til automatiske oversettere direkte på nettet: alphaWorks; PROMTs onlineoversetter; LogoMedia.net; AltaVistas Babel Fish-oversettelsestjeneste; InfiniT.com; Oversettelse av Internett.

Kommersielt effektive oversettelsessystemer dukket opp i andre halvdel av 80-tallet også i vårt land. Selve konseptet med maskinoversettelse har utvidet seg (det begynte å inkludere "opprettelsen av en rekke automatiske og automatiserte systemer og enheter som automatisk eller halvautomatisk utfører hele oversettelsessyklusen eller individuelle oppgaver i en dialog med en person"), og statlige bevilgninger til utvikling av denne næringen har økt.

Russisk, engelsk, tysk, fransk og japansk ble hovedspråkene i innenlandske oversettelsessystemer. All-Union Translation Center (VTsP) utviklet et system for å oversette fra engelsk og tysk til russisk på en datamaskin ES-1035-ANRAP. Den besto av tre ordbøker - input engelsk og tysk og utgang russisk - under en enkelt programvare. Det var flere utskiftbare spesialiserte ordbøker - for datateknologi, programmering, radioelektronikk, maskinteknikk, landbruk, metallurgi. Systemet kunne fungere i to moduser - automatisk og interaktivt, når skjermen viste kildeteksten og oversettelsen per setning, som en person kunne redigere. Hastigheten på å oversette tekst til ANRAP (fra begynnelsen av skrivingen til slutten av utskriften) var omtrent 100 sider per time.

I 1989 ble det opprettet en familie av kommersielle oversettere av typen SPRINT, som jobbet med russisk, engelsk, tysk og japansk. Deres største fordel var deres kompatibilitet med IBM PC - dermed nådde innenlandske maskinoversettelsessystemer det internasjonale kvalitetsnivået. Samtidig utvikles et system for maskinoversettelse fra fransk til russisk FRAP, som inkluderer 4 stadier av tekstanalyse: grafematisk, morfologisk, syntaktisk og semantisk. I LGPI dem. Herzen, arbeidet var i gang med et firespråklig (engelsk, fransk, spansk, russisk) SILOD-MP-system (engelsk-russiske og fransk-russiske ordbøker ble brukt i industriell modus.

For spesialisert oversettelse av tekster om elektroteknikk eksisterte ETAP-2-systemet. Analysen av inputteksten i den ble utført på to nivåer - morfologisk og syntaktisk. ETAP-2-ordboken inneholdt omtrent 4 tusen oppføringer; stadiet for teksttransformasjon - omtrent 1000 regler (96 generelle, 342 private, resten er ordbok). Alt dette sikret en tilfredsstillende kvalitet på oversettelsen (f.eks. ble tittelen på patentet "Optical phase grid arrangement and coupling device having an such arrangement" oversatt til "En optisk fasenettanordning og en tilkoblingsanordning med en slik enhet" - til tross for tautologi, betydningen er bevart).

Ved Minsk Pedagogical Institute of Foreign Languages, på grunnlag av den engelsk-russiske ordboken for ordformer og fraser, ble et system for maskinoversettelse av titler oppfunnet, ved Institute of Oriental Studies of the Academy of Sciences - et system for oversettelse fra japansk til russisk. Den første automatiske vokabular- og terminologitjenesten (SLOTHERM) for databehandling og programmering, opprettet ved Moscow Research Institute of Automation Systems, inneholdt omtrent 20 000 termer i en forklarende ordbok og spesielle ordbøker for språklig forskning.

Maskinoversettelsessystemer begynte gradvis å bli brukt, ikke bare til det tiltenkte formålet, men også som en viktig komponent i automatiske læringssystemer (for undervisning i oversettelse, stavekontroll og grammatisk kunnskap).

90-tallet førte med seg den raske utviklingen av PC-markedet (fra desktop til lomme) og informasjonsteknologi, den utbredte bruken av Internett (som blir mer internasjonal og flerspråklig). Alt dette gjorde videreutvikling av automatiserte oversettelsessystemer etterspurt. Siden tidlig på 1990-tallet Innenlandske utviklere går også inn på PC-systemmarkedet.

I juli 1990 ble det første kommersielle maskinoversettelsessystemet i Russland kalt PROMT (PROgrammer's Machine Translation) presentert på PC Forum i Moskva. I 1991, ZAO [!!! I samsvar med føderal lov-99 av 05.05.2014, dette skjemaet ble erstattet av et ikke-offentlig aksjeselskap] "Project MT", og allerede i 1992 vant PROMT-selskapet NASA-konkurransen om levering av MP-systemer (PROMT var det eneste ikke-amerikanske selskapet i denne konkurransen). hele familien av systemer under det nye navnet STYLUS for å oversette fra engelsk, tysk, fransk, italiensk og spansk til russisk og fra russisk til engelsk, og i 1993 ble verdens første maskinoversettelsessystem for Windows laget på grunnlag av STYLUS. STYLUS 2.0 for Windows 3.X/95/NT ble utgitt, og i 1995-1996 ble tredje generasjons maskinoversettelsessystemer, fullt 32-bits STYLUS 3.0 for Windows 95/NT, introdusert, samtidig med utviklingen av en fullstendig nye, verdens første russisk-tyske og russisk-franske maskinoversettelsessystemer.

I 1997 ble det signert en avtale med det franske selskapet Softissimo om opprettelse av oversettelsessystemer fra fransk til tysk og engelsk og omvendt, og i desember i år ble verdens første tysk-franske oversettelsessystem utgitt. Samme år ga PROMT-selskapet ut et system implementert ved hjelp av Gigant-teknologien, som støtter flere språkretninger i ett skall, samt en spesiell oversetter for å jobbe på Internett WebTranSite.

I 1998 ble en hel konstellasjon av programmer utgitt under det nye navnet PROMT 98. Et år senere ga PROMT ut to nye produkter: en unik programvarepakke for arbeid på Internett - PROMT Internet, og en oversetter for bedriftspostsystemer - PROMT Mail Oversetter. I november 1999 ble PROMT anerkjent som det beste maskinoversettelsessystemet testet av det franske magasinet PC Expert, og utkonkurrerte sine konkurrenter med 30 prosent. Det er også utviklet spesielle serverløsninger for bedriftskunder - bedriftens oversettelsesserver PROMT Translation Server (PTS) og Internett-løsningen PROMT Internet Translation Server (PITS). I 2000 oppdaterte PROMT hele serien med programvareprodukter ved å gi ut en ny generasjon MT-systemer: PROMT Translation Office 2000, PROMT Internet 2000 og Magic Gooddy 2000.

Online oversettelse med støtte fra PROMT-systemet brukes på en rekke innenlandske og utenlandske nettsteder: PROMTs Online Translator, InfiniT.com, Translate.Ru, Lycos, etc., samt i institusjoner med forskjellige profiler for å oversette forretningsdokumenter, artikler og brev (det er oversettelsessystemer bygget direkte inn i Outlook Express og andre e-postklienter).

I dag dukker det opp nye maskinoversettelsesteknologier basert på bruk av kunstige intelligenssystemer og statistiske metoder. Om sistnevnte - i neste avsnitt.

2.2 Ekstraiske metoder for språklæring

Betydelig oppmerksomhet i moderne lingvistikk er gitt til studiet av språklige fenomener ved bruk av metodene for kvantitativ matematikk. Kvantitative data bidrar ofte til en dypere forståelse av fenomenene som studeres, deres plass og rolle i systemet av relaterte fenomener. Svaret på spørsmålet "hvor mye" hjelper til med å svare på spørsmålene "hva", "hvordan", "hvorfor" - slik er det heuristiske potensialet til en kvantitativ egenskap.

Statistiske metoder spiller en betydelig rolle i utviklingen av maskinoversettelsessystemer (se avsnitt 2.1). I den statistiske tilnærmingen vurderes oversettelsesproblemet i form av en støyende kanal. Tenk deg at vi må oversette en setning fra engelsk til russisk. Noisy channel-prinsippet gir oss følgende forklaring på forholdet mellom en engelsk og en russisk setning: en engelsk setning er ikke annet enn en russisk setning forvrengt av en slags støy. For å gjenopprette den opprinnelige russiske setningen, må vi vite hva folk vanligvis sier på russisk og hvordan russiske setninger forvrenges til engelsk. Oversettelsen utføres ved å søke etter en slik russisk setning som maksimerer produktene av den ubetingede sannsynligheten for den russiske setningen og sannsynligheten for den engelske setningen (original) gitt den gitte russiske setningen. I følge Bayes' teorem er denne russiske setningen den mest sannsynlige oversettelsen av engelsk:

der e er oversettelsessetningen og f er den opprinnelige setningen

Så vi trenger en kildemodell og en kanalmodell, eller en språkmodell og en oversettelsesmodell. Språkmodellen må tildele en sannsynlighetsscore til enhver setning på målspråket (i vårt tilfelle russisk), og oversettelsesmodellen til den opprinnelige setningen. (se tabell 1)

Generelt fungerer et maskinoversettelsessystem i to moduser:

1. Systemtrening: et opplæringskorpus av parallelle tekster tas, og ved hjelp av lineær programmering søkes det etter slike verdier av ovesom maksimerer sannsynligheten for (for eksempel) den russiske delen av korpuset med tilgjengelig engelsk iht. til den valgte oversettelsesmodellen. En modell av det russiske språket er bygget på den russiske delen av samme korpus.

2. Utnyttelse: basert på dataene innhentet for en ukjent engelsk setning, søkes det etter en russisk som maksimerer produktet av sannsynlighetene tildelt av språkmodellen og oversettelsesmodellen. Programmet som brukes for et slikt søk kalles en dekoder.

Den enkleste statistiske oversettelsesmodellen er den bokstavelige oversettelsesmodellen. Denne modellen forutsetter at for å oversette en setning fra ett språk til et annet, er det nok å oversette alle ordene (lag en "pose med ord"), og modellen vil gi deres plassering i riktig rekkefølge. For å redusere P( a, f | e) til P(a | e, f), dvs. sannsynligheter for en gitt justering gitt et par setninger, er hver sannsynlighet P(a, f | e) normalisert med summen av sannsynlighetene for alle justeringer av et gitt setningspar:

Implementeringen av Viterbi-algoritmen som brukes til å trene modell #1 er som følger:

1. Hele tabellen over oversettelseskorrespondanse er fylt med de samme verdiene.

2. For alle mulige varianter av parvise koblinger av ord, beregnes sannsynligheten P(a, f | e):

3. Verdiene til P(a, f | e) normaliseres for å oppnå verdiene til P(a | e, f).

4. Frekvensen til hvert translasjonspar beregnes, vektet av sannsynligheten for hvert justeringsalternativ.

5. De resulterende vektede frekvensene normaliseres og danner en ny tabell overynligheter

6. Algoritmen gjentas fra trinn 2.

Tenk på, som et eksempel, trening av en lignende modell på et korpus av to setningspar (fig. 2):

hvite hus

Etter et stort antall iterasjoner vil vi få en tabell (tabell 2), som viser at oversettelsen er utført med høy nøyaktighet.

Statistiske metoder er også mye brukt i studiet av ordforråd, morfologi, syntaks og stil. Forskere fra Perm State University utførte en studie basert på påstanden om at stereotype fraser er et viktig "byggemateriale" i teksten. Disse frasene består av "kjernefysiske" gjentatte ord og avhengige ordspesifikasjoner og har en uttalt stilistisk farge.

I vitenskapelig stil kan "kjernefysiske" ord kalles: forskning, studie, oppgave, problem, spørsmål, fenomen, fakta, observasjon, analyse osv. I journalistikken vil andre ord være «atomkraft», som har en økt verdi spesifikt for avisens tekst: tid, person, makt, virksomhet, handling, lov, liv, historie, sted etc. (totalt 29)

Av spesiell interesse for lingvister er også den faglige differensieringen av nasjonalspråket, originaliteten til bruken av ordforråd og grammatikk, avhengig av type yrke. Det er kjent at sjåfører i faglig tale bruker skjemaet sh O fer, sier legene k O klubb i stedet for cocktail Yu sh - slike eksempler kan gis. Statistikkens oppgave er å spore variasjonen i uttalen og endringen i språknormen.

Faglige forskjeller fører til forskjeller ikke bare grammatiske, men også leksikalske. Yakut State University oppkalt etter M.K. Ammosov ble 50 spørreskjemaer analysert med de vanligste reaksjonene på visse ord blant leger og byggherrer (tabell 3).

Utbyggere

Menneskelig

pasient (10), personlighet (5)

mann (5)

flink

hjelp (8), hjelp (7)

ond (16)

liv

død (10)

nydelig (5)

død

lik (8)

livet (6)

Brann

varme (8), brenne (6)

brann (7)

finger

hånd (14), panaritium (5)

stor (7), indeks (6)

øyne

syn (6), pupill, øyelege (5 hver)

brun (10), stor (6)

hode

sinn (14), hjerner (5)

stor (9), smart (8), smart (6)

å tape

bevissthet, liv (4 hver)

penger (5), finn (4)

Det kan bemerkes at leger oftere enn byggherrer gir assosiasjoner knyttet til deres faglige virksomhet, siden ordstimuliene gitt i spørreskjemaet har mer med deres yrke å gjøre enn med yrket som byggmester.

Statistiske regelmessigheter i et språk brukes til å lage frekvensordbøker - ordbøker som gir numeriske kjennetegn på frekvensen av ord (ordformer, fraser) til ethvert språk - språket til forfatteren, ethvert arbeid, etc. Vanligvis er hyppigheten av forekomst av et ord brukes som en karakteristikk av bruk i teksten til et bestemt bind

Modellen for taleoppfatning er umulig uten en ordbok som sin essensielle komponent. I oppfatningen av tale er den grunnleggende operasjonelle enheten ordet. Av dette følger det spesielt at hvert ord i den oppfattede teksten må identifiseres med den tilsvarende enheten i lytterens (eller leserens) interne vokabular. Det er naturlig å anta at søket helt fra begynnelsen er begrenset til noen underdomener av ordboken. I følge de fleste moderne teorier om taleoppfatning gir den faktiske fonetiske analysen av den klingende teksten i et typisk tilfelle bare noe delvis informasjon om ordets mulige fonologiske utseende, og denne typen informasjon tilsvarer ikke ett, men en viss MANGE ord av ordboken; Derfor oppstår to problemer:

(a) velge passende sett i henhold til visse parametere;

(b) innenfor rammen av det skisserte settet (hvis det er tildelt tilstrekkelig) å "eliminere" alle ord, bortsett fra det eneste som best samsvarer med det gitte ordet i den anerkjente teksten. En av "frafall"-strategiene er å ekskludere lavfrekvente ord. Det følger at vokabularet for taleoppfatning er en frekvensordbok. Det er opprettelsen av en datamaskinversjon av frekvensordboken til det russiske språket som er den første oppgaven til det presenterte prosjektet.

Basert på materialet til det russiske språket er det 5 frekvensordbøker (ikke medregnet grenordbøker). La oss bare merke noen generelle mangler ved de eksisterende ordbøkene.

Alle kjente frekvensordbøker for det russiske språket er basert på behandling av matriser av skrevne (trykte) tekster. Delvis av denne grunn, når identiteten til et ord i stor grad er basert på formell, grafisk tilfeldighet, blir det ikke tatt tilstrekkelig hensyn til semantikk. Som et resultat blir frekvenskarakteristikkene også forskjøvet, forvrengt; for eksempel, hvis kompilatoren av frekvensordboken inkluderer ord fra kombinasjonen "hverandre" i den generelle statistikken over bruken av ordet "venn", så er dette neppe berettiget: gitt semantikken, må vi innrømme at disse allerede er forskjellige ord, eller rettere sagt, at en uavhengig ordbokenhet bare er kombinasjonen som en helhet.

I alle eksisterende ordbøker er ord bare plassert i sine grunnleggende former: substantiv i entallsform, nominativ kasus, verb i infinitivform, etc. Noen av ordbøkene gir informasjon om hyppigheten av ordformer, men vanligvis gjør de det ikke konsekvent nok, ikke på en uttømmende måte. Frekvensene til forskjellige ordformer av samme ord stemmer tydeligvis ikke. Utvikleren av taleoppfatningsmodellen må ta i betraktning at i en reell persepsjonsprosess er det nettopp en spesifikk ordform som er «nedsenket» i teksten som er gjenstand for gjenkjennelse: basert på analysen av den innledende delen av eksponenten for ordformen dannes et sett med ord med identisk begynnelse, og den første delen av ordformen er ikke nødvendigvis identisk med den første delen av ordbokformen . Det er ordformen som har en bestemt rytmisk struktur, som også er en ekstremt viktig parameter for det perseptuelle utvalget av ord. Til slutt, i den endelige representasjonen av den anerkjente ytringen, igjen, blir ordene representert av de tilsvarende ordformene.

Det er mange verk som demonstrerer viktigheten av frekvens i prosessen med taleoppfatning. Men vi er ikke klar over verk der frekvensen av ordformer ville bli brukt - tvert imot ignorerer alle forfattere praktisk talt frekvensen av individuelle ordformer, og refererer utelukkende til leksemer. Hvis resultatene oppnådd av dem ikke anses som artefakter, må man anta at morsmålet på en eller annen måte har tilgang til informasjon om forholdet mellom frekvensene til ordformer og ordbokformer, dvs. faktisk leksemer. Dessuten kan en slik overgang fra en ordform til et leksem selvfølgelig ikke forklares med naturlig kunnskap om det tilsvarende paradigmet, siden frekvensinformasjon må brukes før den endelige identifiseringen av ordet, ellers mister den ganske enkelt sin betydning.

I henhold til de primære statistiske kjennetegnene er det mulig å bestemme med en gitt relativ feil den delen av ordboken, som inkluderer ord med høy forekomstfrekvens, uavhengig av teksttype. Det er også mulig, ved å innføre trinnvis rekkefølge i ordboken, å få en rekke ordbøker som dekker de første 100, 1000, 5000 osv. med hyppige ord. De statistiske egenskapene til ordboken er av interesse i forbindelse med den semantiske analysen av vokabular. Studiet av fagideologiske grupper og semantiske felt viser at leksikalske assosiasjoner støttes av semantiske lenker som er konsentrert rundt leksemer med den vanligste betydningen. Beskrivelsen av betydninger innenfor det leksiko-semantiske feltet kan utføres ved å identifisere ord med de mest abstrakte leksemene i betydning. Tilsynelatende utgjør "tomme" (fra nominative potenser) ordbokenheter et statistisk homogent lag.

Ordforråd for individuelle sjangere er ikke mindre verdifulle. Å studere målet for deres likhet og arten av statistiske fordelinger vil gi interessant informasjon om den kvalitative stratifiseringen av ordforråd avhengig av talebrukssfæren.

Sammenstilling av store frekvensordbøker krever bruk av datateknologi. Å INTRODUSERE delvis mekanisering og automatisering i prosessen med å arbeide med en ordbok er av interesse som et eksperiment i maskinell behandling av ordbøker for ulike tekster. En slik ordbok krever et mer strengt system for å behandle og samle vokabularmateriale. I miniatyr er dette et informasjonsinnhentingssystem som er i stand til å gi informasjon om ulike sider ved teksten og vokabularet. Noen grunnleggende forespørsler til dette systemet er planlagt helt fra begynnelsen: det totale antallet inventarord, de statistiske egenskapene til et enkelt ord og hele ordbøker, rekkefølgen av hyppige og sjeldne soner i ordboken, etc. Maskinkortfilen lar deg å automatisk bygge omvendte ordbøker for individuelle sjangere og kilder. Mange andre nyttige statistiske opplysninger om språket vil bli hentet ut fra den akkumulerte informasjonsmengden. Datafrekvensordboken skaper et forsøksgrunnlag for overgangen til en mer omfattende automatisering av vokabulararbeidet.

De statistiske dataene til frekvensordbøker kan også brukes mye til å løse andre språklige problemer - for eksempel ved å analysere og bestemme de aktive virkemidlene for orddannelse av det moderne russiske språket, løse problemer med å forbedre grafikk og stavemåte, som er relatert til å ta inn over seg ta hensyn til statistisk informasjon om vokabularet (med alt dette er det viktig å ta hensyn til sannsynlige egenskaper ved grafemkombinasjoner, typer bokstavkombinasjoner realisert i ord), praktisk transkripsjon og translitterasjon. De statistiske parameterne til ordboken vil også være nyttige for å løse problemer med automatisering av skriving, gjenkjenning og automatisk lesing av bokstavelig tekst.

Moderne forklarende ordbøker og grammatikk for det russiske språket er hovedsakelig bygget på grunnlag av litterære og kunstneriske tekster. Det finnes frekvensordbøker for språket til A.S. Pushkin, A.S. Griboedova, F.M. Dostojevskij, V.V. Vysotsky og mange andre forfattere. Ved Institutt for historie og litteraturteori i Smolensk-staten. Pedagogisk universitet har i en årrekke jobbet med å lage frekvensordbøker over poetiske og prosatekster. For denne studien ble frekvensordbøker med alle tekstene til Pushkin og ytterligere to poeter fra gullalderen - "Ve fra vit" av Griboyedov og hele Lermontovs poesi valgt ut; Pasternak og fem andre diktere fra sølvalderen - Balmont 1894-1903, "Dikt om den vakre damen" av Blok, "Steen" av Mandelstam, "Ildstøtten" av Gumilyov, "Anno Domini MCMXXI" av Akhmatova og "Sisters of Mitt liv" av Pasternak og ytterligere fire diktere fra jernalderen - "Dikt av Yuri Zhivago", "Når det klarner opp", hele korpuset av tekster av M. Petrovs, "Veien er langt borte", "Vindskjerm", "Farvel til snøen" og "Horseshoes" av Mezhirov, "Antimirov" av Voznesensky og "Snezhnitsa » Rylenkova.

Det skal bemerkes at disse ordbøkene er forskjellige i natur: noen representerer ordforrådet til ett dramatisk verk, andre - bøker med tekster, eller flere bøker, eller hele korpuset til dikterens dikt. Resultatene av analysen presentert i denne artikkelen bør tas med forsiktighet, de kan ikke tas som absolutte. Samtidig kan forskjellen i teksters ontologiske natur ved hjelp av spesielle tiltak reduseres til en viss grad.

De siste årene har motsetningen mellom samtale- og boktale blitt mer og tydeligere realisert. Denne problemstillingen diskuteres spesielt skarpt blant metodologer som krever en vending i undervisningen mot talespråket. Samtidig forblir spesifisiteten til dagligtale fortsatt uforklarlig.

Ordbøker ble behandlet ved å opprette en brukerapplikasjon i miljøet til kontorprogrammet EXCEL97. Applikasjonen inkluderer fire regneark av EXCEL-boken - "Tittelark", "Ordbøker" -ark med innledende data, "Nærheter" og "Avstander" med resultater, samt et sett med makroer.

Den første informasjonen legges inn på arket "Ordbøker". Ordbøker av de studerte tekstene er skrevet inn i EXCEL-celler, den siste kolonnen S er dannet fra resultatene som er oppnådd og er lik antall ord som finnes i andre ordbøker. Tabellene "Nærhet" og "Avstander" inneholder beregnede mål for nærhet M, korrelasjon R og avstand D.

Applikasjonsmakroer er hendelsesbaserte programmeringsprosedyrer skrevet i Visual Basic for Application (VBA). Prosedyrer er basert på VBA-bibliotekobjekter og deres behandlingsmetoder. Så, for operasjoner med regneark i applikasjonen, brukes nøkkelobjektet Regneark (regneark) og den tilsvarende metoden for å aktivere arket Aktiver (aktiver). Innstilling av rekkevidden til de analyserte kildedataene på ordbokarket utføres ved hjelp av Select-metoden til Range-objektet (område), og overføringen av ord som verdier til variabler utføres som Value-egenskapen (verdi) i samme område gjenstand.

Til tross for at rangkorrelasjonsanalyse gjør oss forsiktige med avhengigheten av emner mellom ulike tekster, har de fleste av de hyppigste ordene i hver tekst treff i en eller flere andre tekster. Kolonne S viser antall slike ord blant de 15 mest hyppige ordene for hver forfatter. Ord med fet skrift vises bare i en dikters ord i tabellen vår. Blok, Akhmatova og Petrovs har ingen uthevede ord i det hele tatt, de har S = 15. Disse tre dikterne har de samme 15 mest hyppige ordene, de skiller seg bare på plass i listen. Men selv Pushkin, hvis ordforråd er det mest originale, har S = 8, og det er 7 uthevede ord.

Resultatene viser at det er et visst lag med ordforråd som konsentrerer poesiens hovedtemaer. Som regel er disse ordene korte: av det totale antallet (225) ordbruk av én stavelse 88, to stavelser 127, tre stavelser 10. Ofte representerer disse ordene hovedmytologene og kan falle inn i par: natt - dag, jord - himmel (sol), Gud - menneske (mennesker), liv - død, kropp - sjel, Roma - verden(på Mandelstam); kan kombineres til mytologer på et høyere nivå: himmel, stjerne, sol, jord; i en person, som regel, skiller kroppen, hjertet, blodet, armen, beinet, kinnet, øynene seg ut. Av de menneskelige tilstander gis preferanse til søvn og kjærlighet. Huset og byene tilhører den menneskelige verden - Moskva, Roma, Paris. Kreativitet er representert av leksemer ord Og sang.

Griboedov og Lermontov har nesten ingen ord som betegner naturen blant de vanligste ordene. De har tre ganger så mange ord som betegner en person, deler av kroppen hans, elementer av hans åndelige verden. Pushkin og diktere fra det tjuende århundre. betegnelser på menneske og natur er omtrent like. I dette viktige aspektet av emnet kan vi si at det tjuende århundre. fulgte Pushkin.

Minimalt tema sak blant de vanligste ordene finnes det bare i Griboyedov og Pushkin. Lermontov og diktere fra det tjuende århundre. det gir plass til et minimalt tema ord. Ordet utelukker ikke gjerninger (den bibelske tolkningen av emnet: i Det nye testamente blir all Jesu Kristi lære betraktet som Guds ord eller Jesu ord, og apostlene kaller seg noen ganger Ordets tjenere). Den hellige betydningen av leksemordet er overbevisende manifestert, for eksempel i Pasternaks vers «Og verdens bilde, åpenbart i Ordet». Den hellige betydningen av leksemet ord i forbindelse med og kontrast til menneskelige anliggender, manifesteres det overbevisende i diktet med samme navn av Gumilyov.

Tokens som bare finnes i én tekst karakteriserer originaliteten til en gitt bok eller en samling bøker. Ordet «sinn» er for eksempel det hyppigste i Griboedovs komedie «Ve fra vidd» – men det forekommer ikke blant frekvensordene i andre tekster. Temaet for sinnet er uten tvil det mest betydningsfulle i komedie. Dette leksemet følger bildet av Chatsky, og navnet på Chatsky er det hyppigste i komedie. Dermed kombinerer verket organisk det hyppigste fellessubstantivet med det hyppigste egennavnet.

Den høyeste korrelasjonskoeffisienten forbinder temaene til de tragiske bøkene "The Pillar of Fire" av Gumilyov og "Anno Domini MCMXXI" av Akhmatova. Blant de 15 vanligste substantivene er det 10 vanlige, inkludert blod, hjerte, sjel, kjærlighet, ord, himmel. Husk at Akhmatovas bok inkluderte en miniatyr "Du vil ikke være i live ...", skrevet mellom arrestasjonen av Gumilyov og henrettelsen hans.

Temaene til lyset og mengden i det studerte materialet finnes bare i "Diktene til Yuri Zhivago". Temaet for lyset i versene fra romanen har mange kontekstuelle betydninger: det er assosiert med bildet av Jesus Kristus, med temaene tro, udødelighet, kreativitet, kjærlighetsdato. Stearinlyset er den viktigste lyskilden i de sentrale scenene i romanen. Temaet for mengden utvikler seg i forbindelse med hovedideen til romanen, der privatlivet til en person med dets urokkelige verdier er i motsetning til den nye statens umoral, bygget på prinsippene om å behage mengden .

Arbeidet involverer også det tredje trinnet, også reflektert i programmet, - dette er beregningen av forskjellen i ordenstallene til ord som er felles for to ordbøker og gjennomsnittlig avstand mellom de samme ordene i to ordbøker. Dette stadiet gjør det mulig å gå fra de generelle trendene i samspillet mellom ordbøker identifisert ved hjelp av statistikk til et nivå som nærmer seg teksten. For eksempel korrelerer bøkene til Gumilyov og Akhmatova statistisk signifikant. Vi ser på hvilke ord som viste seg å være vanlige for ordbøkene deres, og først av alt velger vi de hvis serienummer avviker minimalt eller lik null. Det er disse ordene som har samme rangeringsnummer, og følgelig er det disse minimale temaene i hodet til de to dikterne som er like viktige. Deretter bør du gå til nivået av tekster og kontekster.

Kvantitative metoder bidrar også til å studere egenskapene til folk - morsmål. Si, det er 6 tilfeller på russisk, det er ingen tilfeller på engelsk, og på noen språk av folket i Dagestan når antallet tilfeller 40. L. Perlovsky i sin artikkel "Bevissthet, språk og kultur" korrelerer disse kjennetegn med folkeslags tendens til individualisme eller kollektivisme, med oppfatning av ting og fenomener hver for seg eller i forbindelse med andre. Tross alt var det i den engelsktalende verden (det er ingen tilfeller - tingen oppfattes "av seg selv") at slike begreper som individuell frihet, liberalisme og demokrati dukket opp (jeg merker at jeg bruker disse konseptene bare i forbindelse med språk, uten noen evaluerende egenskaper). Til tross for at slike gjetninger fortsatt bare forblir på nivået av dristige vitenskapelige hypoteser, hjelper de å se på allerede kjente fenomener på en ny måte.

Som vi kan se, kan kvantitative egenskaper brukes på helt andre områder av lingvistikken, noe som i økende grad visker ut grensene mellom «eksakte» og «humanitære» metoder. Lingvistikk tyr i økende grad til hjelp av ikke bare matematikk, men også datateknologi for å løse sine problemer.

2.3 Læring Ispråk ved hjelp av metoder for formell logikk

Med ikke-kvantitative metoder for matematikk, spesielt med logikk, samhandler moderne teoretisk lingvistikk ikke mindre fruktbart enn med kvantitative. Den raske utviklingen av datateknologi og veksten av deres rolle i den moderne verden krevde en revisjon av tilnærmingen til samspillet mellom språk og logikk generelt.

Metodene for logikk er mye brukt i utviklingen av formaliserte språk, spesielt programmeringsspråk, hvis elementer er noen symboler (i likhet med matematiske), valgt (eller konstruert fra tidligere valgte symboler) og tolket på en bestemt måte, assosiert uten "tradisjonell" bruk, forståelse og forståelse funksjoner av de samme symbolene i andre sammenhenger. En programmerer arbeider konstant med logikk i arbeidet sitt. Meningen med programmering er bare å lære datamaskinen å resonnere (i ordets videste forstand). Samtidig viser metodene for "resonnering" seg å være svært forskjellige. Hver programmerer bruker en viss tid på å lete etter feil i sine egne og andres programmer. Det vil si å søke etter feil i resonnement, i logikk. Og dette setter også sine spor. Det er mye lettere å oppdage logiske feil i vanlig tale. Den relative enkelheten til språkene studert av logikere lar dem belyse strukturene til disse språkene tydeligere enn det er oppnåelig av lingvister som analyserer utelukkende komplekse naturlige språk. I lys av det faktum at språkene studert av logikere bruker relasjoner kopiert fra naturlige språk, er logikere i stand til å gi betydelige bidrag til den generelle teorien om språk. Situasjonen her er lik den som finner sted i fysikk: fysikeren formulerer også teoremer for ideelt forenklede tilfeller som ikke forekommer i naturen i det hele tatt - han formulerer lover for ideelle gasser, ideelle væsker, snakker om bevegelse i fravær av friksjon, etc. For disse idealiserte tilfellene kan det etableres enkle lover som i stor grad vil bidra til forståelsen av hva som skjer i virkeligheten og hva som sannsynligvis ville forbli ukjent for fysikken hvis den forsøkte å vurdere virkeligheten direkte, i all dens kompleksitet.

I studiet av naturlige språk brukes logiske metoder slik at språkelever ikke dumt kan "memorere" så mange ord som mulig, men bedre forstå strukturen. L. Shcherba brukte også i sine forelesninger et eksempel på en setning bygget i henhold til lovene i det russiske språket: «Den glitrende kuzdra shteko bokra bokra og krøller bokra», og spurte deretter elevene hva dette betydde. Til tross for at betydningen av ordene i setningen forble uklar (de eksisterer ganske enkelt ikke på russisk), var det mulig å svare tydelig: "kuzdra" er subjektet, et feminint substantiv, i entall, nominativ kasus, " bokr" er animert og så videre. Oversettelsen av uttrykket viser seg å være noe sånt som dette: "Noe feminint på en gang gjorde noe over en slags mannlig skapning, og begynte så å gjøre noe slikt for en lang, gradvis en med ungen sin." Et lignende eksempel på en tekst (kunstnerisk) fra ikke-eksisterende ord, bygget helt i henhold til språkets lover, er Lewis Carrolls Jabberwock (i Alice in Wonderland forklarer Carroll, gjennom sin karakter Humpty Dumpty, betydningen av ordene han oppfunnet: "kokt" - klokken åtte om kvelden, når det er på tide å lage middag, "chlivky" - spinkel og fingernem, "shorek" - en krysning mellom en ilder, en grevling og en korketrekker, "dykk" - ​​hopp, dykk, spinn, "nava" - gress under soluret (strekker seg litt til høyre, litt til venstre og litt bakover), "grynt" - grynt og ler, "zelyuk" - en grønn kalkun, "myumzik" - en fugl; fjærene hennes er rufsete og stikker ut i alle retninger, som en kost, "mova" - langt hjemmefra) .

Et av hovedbegrepene i moderne logikk og teoretisk lingvistikk, brukt i studiet av språk med forskjellige logiske og matematiske beregninger, naturlige språk, for å beskrive forholdet mellom språk på forskjellige "nivåer" og for å karakterisere forholdet mellom språk under vurdering og fagområdene beskrevet med deres hjelp, er begrepet metaspråk. Et metaspråk er et språk som brukes til å uttrykke vurderinger om et annet språk, språkobjektet. Ved hjelp av et metaspråk studerer de strukturen til tegnkombinasjoner (uttrykk) til språkobjektet, beviser teoremer om dets uttrykksegenskaper, om dets forhold til andre språk osv. Språket som studeres kalles også fagspråket i forhold til dette metaspråket. Både fagspråket og metaspråket kan være vanlige (naturlige) språk. Metaspråket kan avvike fra objektspråket (for eksempel i en engelsk lærebok for russere er russisk metaspråket, og engelsk er objektspråket), men det kan også falle sammen med det eller avvike bare delvis, for eksempel i spesiell terminologi (Russisk lingvistisk terminologi er et element i metaspråket for å beskrive det russiske språket, de såkalte semantiske faktorene er en del av metaspråket for å beskrive semantikken til naturlige språk).

Konseptet "metalinguage" har blitt svært fruktbart i forbindelse med studiet av formaliserte språk som er bygget innenfor rammen av matematisk logikk. I motsetning til formaliserte fagspråk, er i dette tilfellet metaspråket, som metateorien er formulert ved hjelp av (studere egenskapene til fagteorien formulert på fagspråket), som regel et vanlig naturlig språk, på en spesiell måte et fragment av et naturlig språk begrenset på en spesiell måte, som ikke inneholder noen form for tvetydighet, metaforer, "metafysiske" begreper, etc. elementer av vanlig språk som hindrer dets bruk som et verktøy for nøyaktig vitenskapelig forskning. Samtidig kan selve metaspråket formaliseres og (uavhengig av dette) bli gjenstand for forskning utført ved hjelp av metaspråket, og en slik serie kan «tenkes» vokse i det uendelige.

Logikken lærer oss et fruktbart skille mellom språkobjektet og metaspråket. Språkobjektet er selve gjenstanden for logisk forskning, og metaspråket er det uunngåelig kunstige språket som slik forskning utføres på. Logisk tenkning består bare i å formulere relasjonene og strukturen til et ekte språk (objektspråk) på symbolspråket (metaspråk).

Metaspråket må i alle fall være "ikke fattigere" enn dets objektive språk (dvs. for hvert uttrykk av sistnevnte i metaspråket må det være navnet, "oversettelse") - ellers, hvis disse kravene ikke er oppfylt (som absolutt tar plass i naturlige språk, dersom særavtaler ikke gir noe annet) oppstår semantiske paradokser (antinomier).

Etter hvert som flere og flere nye programmeringsspråk ble opprettet, i forbindelse med problemet med programmeringsoversettere, var det et presserende behov for å lage metaspråk. For tiden er Backus-Naur-formen metalanguage (forkortet til BNF) den mest brukte for å beskrive syntaksen til programmeringsspråk. Det er en kompakt form i form av noen formler som ligner på matematiske. For hvert konsept av språket er det en unik metaformel (normal formel). Den består av venstre og høyre deler. Venstre side spesifiserer konseptet som defineres, og høyre side spesifiserer settet med tillatte språkkonstruksjoner som er kombinert i dette konseptet. Formelen bruker spesielle metategn i form av vinkelparenteser, som inneholder konseptet som defineres (på venstre side av formelen) eller et tidligere definert konsept (på høyre side), og separasjonen mellom venstre og høyre del er indikert med "::="-metategn, hvis betydning tilsvarer ordene "per definisjon er det". Metalingvistiske formler er innebygd i oversettere i en eller annen form; med deres hjelp blir konstruksjonene som brukes av programmereren sjekket for formell samsvar med noen av konstruksjonene som er syntaktisk gyldige på dette språket. Det er også separate metaspråk fra ulike vitenskaper - dermed eksisterer kunnskap i form av ulike metaspråk.

Logiske metoder fungerte også som grunnlag for opprettelsen av kunstige intelligenssystemer basert på begrepet konneksjonisme. Konneksjonisme er en spesiell trend innen filosofisk vitenskap, hvis emne er spørsmål om kunnskap. Innenfor rammen av denne trenden gjøres det forsøk på å forklare de intellektuelle evnene til en person som bruker kunstige nevrale nettverk. Sammensatt av et stort antall strukturelle enheter som ligner på nevroner, med en vekt tildelt hvert element som bestemmer styrken til forbindelsen med andre elementer, er nevrale nettverk forenklede modeller av den menneskelige hjernen. Eksperimenter med nevrale nettverk av denne typen har vist deres evne til å lære å utføre oppgaver som mønstergjenkjenning, lesing og identifisering av enkle grammatiske strukturer.

Filosofer begynte å interessere seg for konneksjonisme, da den konneksjonistiske tilnærmingen lovet å gi et alternativ til den klassiske teorien om sinnet og ideen som er utbredt innenfor denne teorien om at sinnets virkemåte ligner på behandlingen av symbolsk språk av en digital datamaskin. Dette konseptet er svært kontroversielt, men de siste årene har det funnet flere og flere støttespillere.

Det logiske studiet av språk viderefører Saussures konsept om språk som et system. Det faktum at det hele tiden fortsetter bekrefter nok en gang dristigheten til vitenskapelige formodninger fra begynnelsen av forrige århundre. Jeg vil vie den siste delen av arbeidet mitt til utsiktene for utvikling av matematiske metoder i lingvistikk i dag.

2.4 Utsikter for anvendelse av matematiske metoder i lingvistikk

I datateknologiens tid har metodene for matematisk lingvistikk fått et nytt utviklingsperspektiv. Søket etter løsninger på problemene med språklig analyse blir nå i økende grad implementert på informasjonssystemnivå. Samtidig setter automatisering av prosessen med å behandle språklig materiale, som gir forskeren betydelige muligheter og fordeler, uunngåelig nye krav og oppgaver for ham.

Kombinasjonen av «eksakt» og «humanitær» kunnskap har blitt grobunn for nye oppdagelser innen lingvistikk, informatikk og filosofi.

Maskinoversettelse fra ett språk til et annet er fortsatt en raskt voksende gren av informasjonsteknologi. Til tross for at dataassistert oversettelse aldri kan sammenlignes i kvalitet med menneskelig oversettelse (spesielt for litterære tekster), har maskinen blitt en uunnværlig assistent for en person i å oversette store tekstvolumer. Det antas at det i nær fremtid vil bli laget mer avanserte oversettelsessystemer, hovedsakelig basert på semantisk analyse av teksten.

Et like lovende område er samspillet mellom lingvistikk og logikk, som fungerer som et filosofisk grunnlag for å forstå informasjonsteknologi og den såkalte "virtuelle virkeligheten". I nær fremtid vil arbeidet fortsette med å lage kunstige intelligenssystemer - selv om det igjen aldri vil være lik mennesket i sine evner. Slik konkurranse er meningsløs: i vår tid bør maskinen ikke bli (og bli) en rival, men en assistent for mennesket, ikke noe fra fantasiens rike, men en del av den virkelige verden.

Studiet av språket med statistiske metoder fortsetter, noe som gjør det mulig å mer nøyaktig bestemme dets kvalitative egenskaper. Det er viktig at de mest vågale hypotesene om språk finner sitt matematiske, og derfor logiske, bevis.

Det mest betydningsfulle er at ulike grener av bruken av matematikk i lingvistikk, tidligere ganske isolert, de siste årene har blitt korrelert med hverandre, koblet til et sammenhengende system, analogt med språksystemet oppdaget for et århundre siden av Ferdinand de Saussure og Yvan Baudouin de Courtenay. Dette er kontinuiteten til vitenskapelig kunnskap.

Lingvistikk i den moderne verden har blitt grunnlaget for utviklingen av informasjonsteknologi. Så lenge informatikk forblir en gren av menneskelig aktivitet i rask utvikling, vil foreningen av matematikk og lingvistikk fortsette å spille sin rolle i utviklingen av vitenskap.

Konklusjon

I løpet av det 20. århundre har datateknologier kommet langt – fra militær til fredelig bruk, fra et smalt spekter av mål til penetrering i alle grener av menneskelivet. Matematikk som vitenskap fikk stadig ny praktisk betydning med utviklingen av datateknologi. Denne prosessen fortsetter i dag.

Det tidligere utenkelige «tandemet» av «fysikere» og «lyrikere» er blitt en realitet. For det fulle samspillet mellom matematikk og informatikk med humaniora, var det nødvendig med kvalifiserte spesialister fra begge sider. Mens informatikere i økende grad har behov for systematisk humanitær kunnskap (språklig, kulturell, filosofisk) for å forstå endringer i virkeligheten rundt dem, i samspillet mellom menneske og teknologi, for å utvikle flere og flere nye språklige og mentale konsepter, for å skrive programmer, så må enhver "humaniora" i vår tid for deres profesjonelle vekst mestre minst det grunnleggende om å jobbe med en datamaskin.

Matematikk, som er nært forbundet med informatikk, fortsetter å utvikle seg og samhandle med naturvitenskap og humaniora. I det nye århundret svekkes ikke trenden mot matematisering av vitenskap, men tvert imot økende. På grunnlag av kvantitative data blir lovene for utviklingen av språket, dets historiske og filosofiske egenskaper forstått.

Matematisk formalisme er best egnet for å beskrive mønstre i lingvistikk (som faktisk i andre vitenskaper - både humaniora og naturvitenskap). Situasjonen utvikler seg noen ganger i vitenskapen på en slik måte at uten bruk av et passende matematisk språk, er det umulig å forstå naturen til fysisk, kjemisk osv. prosessen er ikke mulig. Å lage en planetarisk modell av atomet, den berømte engelske fysikeren fra XX århundre. E. Rutherford opplevde matematiske vanskeligheter. Til å begynne med ble teorien hans ikke akseptert: den hørtes ikke overbevisende ut, og grunnen til dette var Rutherfords uvitenhet om sannsynlighetsteorien, på grunnlag av mekanismen som det bare var mulig å forstå modellrepresentasjonen av atomære interaksjoner. Da han innså dette, meldte en fremragende vitenskapsmann seg allerede på det tidspunktet, eieren av Nobelprisen, seg på seminaret til matematikeren Professor Lamb og i to år, sammen med studentene, deltok på et kurs og utarbeidet en workshop om sannsynlighetsteorien. . Basert på det var Rutherford i stand til å beskrive elektronets oppførsel, og ga hans strukturelle modell overbevisende nøyaktighet og oppnå anerkjennelse. Det samme er med lingvistikk.

Dette reiser spørsmålet, hva er så matematisk i objektive fenomener, takket være at de kan beskrives på matematikkspråket, på språket med kvantitative egenskaper? Dette er homogene enheter av materie fordelt i rom og tid. De vitenskapene som har gått lenger enn andre mot isolasjonen av homogenitet, og viser seg å være bedre egnet for bruk av matematikk i dem.

Internett, som utviklet seg raskt på 1990-tallet, samlet representanter for ulike land, folk og kulturer. Til tross for at engelsk fortsetter å være hovedspråket for internasjonal kommunikasjon, har Internett blitt flerspråklig i vår tid. Dette førte til utviklingen av kommersielt vellykkede maskinoversettelsessystemer som er mye brukt i ulike felt av menneskelig aktivitet.

Datanettverk har blitt et objekt for filosofisk refleksjon – det er skapt flere og flere nye språklige, logiske, verdensbildebegreper som bidrar til å forstå «virtuell virkelighet». I mange kunstverk ble det skapt scenarier - oftere pessimistiske - om maskinenes dominans over en person, og virtuell virkelighet - over omverdenen. Slike prognoser viste seg langt fra alltid å være meningsløse. Informasjonsteknologi er ikke bare en lovende industri for å investere menneskelig kunnskap, det er også en måte å kontrollere informasjon på, og følgelig over menneskelig tanke.

Dette fenomenet har både en negativ og en positiv side. Negativt – fordi kontroll over informasjon er i strid med den umistelige menneskerettigheten til fri tilgang til den. Positivt - fordi mangelen på denne kontrollen kan føre til katastrofale konsekvenser for menneskeheten. Det er nok å minne om en av de klokeste filmene det siste tiåret - "When the World Ends" av Wim Wenders, hvis karakterer er fullstendig nedsenket i den "virtuelle virkeligheten" til sine egne drømmer spilt inn på en datamaskin. Samtidig kan ikke en eneste vitenskapsmann og ikke en eneste kunstner gi et entydig svar på spørsmålet: hva venter vitenskap og teknologi i fremtiden.

Å fokusere på "fremtiden", som noen ganger virket fantastisk, var et særtrekk ved vitenskapen på midten av det tjuende århundre, da oppfinnere søkte å lage perfekte modeller av teknologi som kunne fungere uten menneskelig innblanding. Tiden har vist den utopiske naturen til slik forskning. Samtidig ville det vært overflødig å fordømme forskere for dette – uten deres entusiasme på 1950 – 60-tallet ville ikke informasjonsteknologien ha gjort et så kraftig sprang på 90-tallet, og vi ville ikke hatt det vi har nå.

De siste tiårene av det tjuende århundre endret vitenskapens prioriteringer - forskning, oppfinnsom patos ga plass for kommersiell interesse. Igjen, dette er verken bra eller dårlig. Dette er en realitet der vitenskapen i økende grad integreres i hverdagen.

Det 21. århundre har fortsatt denne trenden, og i vår tid bak oppfinnelser ligger ikke bare berømmelse og anerkjennelse, men først og fremst penger. Dette er også grunnen til at det er viktig å sikre at de siste prestasjonene innen vitenskap og teknologi ikke faller i hendene på terrorgrupper eller diktatoriske regimer. Oppgaven er vanskelig til det er umulig; å realisere det så mye som mulig er hele verdenssamfunnets oppgave.

Informasjon er et våpen, og våpen er ikke mindre farlige enn atomvåpen eller kjemiske våpen – bare den virker ikke fysisk, men heller psykologisk. Menneskeheten må tenke på hva som er viktigere for den i dette tilfellet – frihet eller kontroll.

De siste filosofiske konseptene knyttet til utviklingen av informasjonsteknologi og et forsøk på å forstå dem har vist begrensningene til både naturvitenskapelig materialisme, som dominerte på 1800- og begynnelsen av 1900-tallet, og ekstrem idealisme, som benekter betydningen av den materielle verden. . Det er viktig for moderne tankegang, spesielt vestens tankegang, å overvinne denne dualismen i tenkningen, når omverdenen er tydelig delt inn i materiell og ideal. Veien til dette er en dialog mellom kulturer, en sammenligning av ulike synspunkter på fenomenene rundt.

Paradoksalt nok kan informasjonsteknologi spille en viktig rolle i denne prosessen. Datanettverk, og spesielt Internett, er ikke bare en ressurs for underholdning og kraftig kommersiell aktivitet, de er også et middel for meningsfull, kontroversiell kommunikasjon mellom representanter for ulike sivilisasjoner i den moderne verden, samt for en dialog mellom fortiden og nåtiden. Vi kan si at Internett flytter de romlige og tidsmessige grensene.

Og i dialogen mellom kulturer gjennom informasjonsteknologi er språkets rolle som det eldste universelle kommunikasjonsmidlet fortsatt viktig. Det er derfor lingvistikk, i samspill med matematikk, filosofi og informatikk, har opplevd sin andre fødsel og fortsetter å utvikle seg i dag. Trenden til nåtiden vil fortsette i fremtiden – «til verdens ende», som for 15 år siden, spådde den samme V. Wenders. Riktignok er det ikke kjent når denne slutten vil inntreffe – men er den viktig nå, for fremtiden vil før eller siden uansett bli nåtid.

Vedlegg 1

Ferdinand de Saussure

Den sveitsiske lingvisten Ferdinand de Saussure (1857-1913) er ansett for å være grunnleggeren av moderne lingvistikk i sine forsøk på å beskrive språkets struktur i stedet for historien til bestemte språk og språkformer. Faktisk finner metoden for strukturalisme i lingvistikk og litteraturvitenskap og en betydelig gren av semiotikk sitt viktigste utgangspunkt i hans arbeid ved begynnelsen av det tjuende århundre. Det har til og med blitt hevdet at komplekset av strategier og forestillinger som har blitt kalt "poststrukturalisme" - arbeidet til Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes og andre - antydes av Saussures arbeid. i lingvistikk og anagrammatiske lesninger av sen latinsk poesi, litterær modernisme til psykoanalyse og filosofi tidlig på det tjuende århundre. Som Algirdas Julien Greimas og Joseph Courtes argumenterer for i Semiotics and Language: An Analytic Dictionary, under overskriften "Interpretation", oppsto en ny tolkningsmåte på begynnelsen av det tjuende århundre som de identifiserer med Saussurean-lingvistikk, Husserlian Phenomenology og Freudiansk psykoanalyse. I denne modusen er "tolkning ikke lenger et spørsmål om å tilskrive et gitt innhold til en form som ellers ville mangle en; snarere er det en parafrase som på en annen måte formulerer det ekvivalente innholdet til et betegnende element i et gitt semiotisk system" ( 159). i denne forståelsen av «tolkning» er form og innhold ikke forskjellige; snarere er hver "form" alternativt også et semantisk "innhold", en "signifiserende form", slik at tolkningen tilbyr en analogisk parafrase av noe som allerede betyr innenfor et annet system av signifikans.

En slik nytolkning av form og forståelse - som Claude Levi-Strauss beskriver i en av sine mest programmatiske artikulasjoner av strukturalismebegrepet, i "Structure and Form: Reflections on a Work by Vladimir Propp" - er implisitt i Saussures posthume kurs. i General Linguistics (1916, trans., 1959, 1983). I sin levetid publiserte Saussure relativt lite, og hans hovedverk, Kurset, var transkripsjonen av studentene hans av flere kurs i generell lingvistikk han tilbød i 1907-11. I kurset etterlyste Saussure det "vitenskapelige" studiet av språk i motsetning til arbeidet i historisk lingvistikk som ble gjort på 1800-tallet. Dette arbeidet er en av de store prestasjonene til vestlig intellekt: å ta bestemte ord som byggesteinene i språk, historisk (eller "diakronisk") lingvistikk sporet opprinnelsen og utviklingen til vestlige språk fra en antatt felles språkkilde, først et "indoeuropeisk" språk og deretter et tidligere "p roto-indoeuropeisk" språk.

Det er nettopp denne studien av den unike forekomsten av ord, med den samtidige antakelsen om at språkets grunnleggende "enhet" faktisk er den positive eksistensen av disse "ordelementene", som Saussure stilte spørsmål ved. Arbeidet hans var et forsøk på å redusere mengden av fakta om språk, studert så nøye av historisk lingvistikk, til et håndterlig antall påstander. Den "sammenlignende skolen" for filologi fra det nittende århundre, sier Saussure i kurset, "lyktes ikke i å sette opp den sanne vitenskapen om lingvistikk" fordi "den ikke klarte å oppsøke naturen til sitt studieobjekt" ( 3). Denne "naturen," hevder han, finnes ikke bare i de "elementære" ordene som et språk omfatter - de tilsynelatende "positive" faktaene (eller "stoffene") i språket - men i de formelle relasjonene som gir opphav til de "stoffer."

Saussures systematiske reundersøkelse av språk er basert på tre antakelser. Den første er at den vitenskapelige studien av språk må utvikle og studere systemet i stedet for historien til språklige fenomener. Av denne grunn skiller han mellom de spesielle forekomstene av språket - dets spesielle. "tale-hendelser," som han betegner som prøveløslatelse - og det egentlige objektet for lingvistikk, systemet (eller "koden") som styrer de hendelsene, som han betegner som langue. En slik systematisk studie krever dessuten en "synkron" oppfatning av forholdet mellom elementene i språket på et bestemt øyeblikk snarere enn den "diakroniske" studien av språkets utvikling gjennom historien.

Denne antagelsen ga opphav til det Roman Jakobson i 1929 kom til å betegne som "strukturalisme", der "ethvert sett med fenomener som undersøkes av samtidsvitenskap, behandles ikke som en mekanisk agglomerasjon, men som en strukturell helhet, den mekaniske oppfatningen av prosesser gir etter for spørsmålet. av deres funksjon" ("Romantic" 711). I denne passasjen artikulerer Jakobson Saussures intensjon om å definere lingvistikk som et vitenskapelig system i motsetning til en enkel, "mekanisk" regnskapsføring av historiske ulykker. Sammen med dette beskriver Jakobson også den andre grunnleggende antakelsen i Saussurean - vi kan kaller det nå "strukturell" - lingvistikk: at de grunnleggende elementene i språket bare kan studeres i forhold til deres funksjoner i stedet for i forhold til deres årsaker. Europeiske "ord"), disse hendelsene og enhetene må plasseres innenfor et systemisk rammeverk. der de er relatert til andre såkalte hendelser og entiteter. Dette er en radikal reorientering når det gjelder oppfatning av erfaring og fenomener, en hvis betydning filosofen Ernst Cassirer har sammenlignet med "den nye vitenskapen om Galileo som i det syttende århundre forandret hele vår konseptet om den fysiske verden" (sitert i Culler, Pursuit 2 4). Denne endringen, som Greimas og Courtes bemerker, gjenoppfatter "tolkning" og gjenoppfatter dermed forklaring og forståelse selv. I stedet for at forklaring "er i form av et fenomens årsaker, slik at det som en "effekt" på noen måter er underordnet dets årsaker, består forklaringen her i å underordne et fenomen til dets fremtidsorienterte "funksjon" eller "hensikt." Forklaring er ikke lenger uavhengig av menneskelige intensjoner eller hensikter (selv om disse intensjonene kan være upersonlige, felles eller, i freudianske termer, "ubevisste").

I sin lingvistikk oppnår Saussure denne transformasjonen spesifikt i redefinisjonen av det lingvistiske "ordet", som han beskriver som det lingvistiske "tegnet" og definerer i funksjonalistiske termer. Tegnet, hevder han, er foreningen av "et konsept og et lydbilde", som han kalte "signified and signifier" (66-67; Roy Harris' oversettelse fra 1983 tilbyr begrepene "signification" og "signal"). Naturen til deres "kombinasjon" er "funksjonell" ved at verken den betegnede eller betegneren er "årsaken" til den andre; snarere, "hver sine verdier fra den andre" (8). språkelementet, tegnet , relasjonelt og gjør den grunnleggende antagelsen om historisk lingvistikk, nemlig identiteten til de elementære enhetene av språk og betydning (dvs. "ord"), gjenstand for streng analyse. Ordet "tre" som det "samme" ordet er ikke fordi ordet er definert av iboende kvaliteter - det er ikke en "mekanisk agglomerasjon" av slike kvaliteter - men fordi det er definert som et element i et system, språkets "strukturelle helhet".

En slik relasjonell (eller "diakritisk") definisjon av en enhet styrer oppfatningen av alle elementene i språket i strukturell lingvistikk. Dette er tydeligst i den mest imponerende prestasjonen til saussureansk lingvistikk, utviklingen av begrepene "fonemene" og "særtrekkene" til språket. Fonemer er de minste artikulerte og betegnende enhetene i et språk. Det er ikke lydene som forekommer i språket, men "lydbildene" Saussure nevner, som blir oppfattet av høyttalere - fenomenalt oppfattet - som meningsformidler. (Dermed beskriver Elmar Holenstein Jakobsons lingvistikk, som følger Saussure på viktige måter, som «fenomenologisk strukturalisme.») Det er av denne grunn at den ledende talspersonen for Praha skolestrukturalisme, Jan Mukarovsky, i 1937 bemerket at «struktur . . . er en fenomenologisk og ikke en empirisk virkelighet; det er ikke selve verket, men et sett av funksjonelle relasjoner som er lokalisert i bevisstheten til et kollektiv (generasjon, miljø, etc.)» (sitert i Galan 35). På samme måte, Levi-Strauss, den ledende talspersonen for fransk strukturalisme , bemerket i 1960 at "struktur ikke har noe distinkt innhold; den er tilfreds med seg selv, og den logiske organisasjonen den er arrestert i, er tenkt som en eiendom til det virkelige» (167; se også Jakobson, Fundamentals 27-28).

Fonemer, altså de minste merkbare elementene i språket, er ikke positive objekter, men en «fenomenologisk virkelighet». På engelsk, for eksempel, kan fonemet /t/ uttales på mange forskjellige måter, men i alle tilfeller vil en engelsktalende gjenkjenne at det fungerer som en /t/. En aspirert t (dvs. en t uttalt med en h-lignende pust etter seg), en høy eller lav t-lyd, en utvidet t-lyd, og så videre, vil alle fungere på samme måte for å skille betydningen av "to" og "do" på engelsk. Dessuten er forskjellene mellom språk slik at fonologiske variasjoner i ett språk kan utgjøre distinkte fonemer i et annet; dermed skiller engelsk mellom /l/ og /r/, mens andre språk er så strukturert at disse artikulasjonene betraktes som varianter av samme fonem (som aspirert og uaspirert t på engelsk). I hvert naturlig språk er det store antallet mulige ord en kombinasjon av et lite antall fonemer. Engelsk, for eksempel, har mindre enn 40 fonemer som til sammen danner over en million forskjellige ord.

Språkets fonem er i seg selv systematisk organiserte strukturer av funksjoner. På 1920- og 1930-tallet, etter Saussures ledelse, isolerte Jakobson og N. S. Trubetzkoy de "egenartede trekkene" til fonemer. Disse trekkene er basert på den fysiologiske strukturen til taleorganene - tunge, tenner, stemmebånd og så videre - som Saussure nevner i Kurset og som Harris beskriver som "fysiologisk fonetikk" (39; Baskins tidligere oversettelse bruker begrepet "fonologi" [(1959) 38]) - og de kombineres i "bunter" av binære motsetninger for å danne fonemer. For eksempel, på engelsk er forskjellen mellom /t/ og /d/ tilstedeværelsen eller fraværet av "stemme" (engasjementet til stemmebåndene), og på stemmenivået definerer disse fonemene hverandre gjensidig. På denne måten er fonologi et konkret eksempel på en generell språkregel beskrevet av Saussure: I språket er det bare forskjeller. enda viktigere: en forskjell innebærer generelt positive termer som forskjellen er satt opp mellom; men i språket er det bare forskjeller uten positive termer. Enten vi tar det betegnede eller det betegnende, har språket verken ideer eller lyder som eksisterte før det språklige systemet. ( 120)

I dette rammeverket bestemmes språklige identiteter ikke av iboende kvaliteter, men av systemiske ("strukturelle") forhold.

Jeg har sagt at fonologien "fulgte ledetråden" til Saussure, for selv om analysen hans av fysiologien til språkproduksjon "i dag ville," som Harris sier, "bli kalt "fysisk", i motsetning til enten "psykologisk" eller "funksjonell". "" (lesing 49), følgelig artikulerte han i kurset retningen og konturene til en funksjonell analyse av språk. Tilsvarende var hans eneste utvidede publiserte verk, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir om det primitive systemet med vokaler i indoeuropeiske språk), som dukket opp i 1878, fullt ut plassert innenfor prosjektet til det nittende- århundres historisk lingvistikk. Likevel, innenfor dette arbeidet, som Jonathan Culler har hevdet, demonstrerte Saussure "fruktbarheten ved å tenke på språk som et system av rent relasjonelle elementer, selv når han jobbet med oppgaven med historisk rekonstruksjon" (Saussure 66). Ved å analysere de systematiske strukturelle relasjonene mellom fonemer for å redegjøre for mønstre av vokalveksling i eksisterende indoeuropeiske språk, antydet Saussure at i tillegg til flere forskjellige fonemer /a/, må det ha vært et annet fonem som kunne beskrives formelt. "Det som gjør Saussures arbeid så veldig imponerende," konkluderer Culler, "er det faktum at nesten femti år senere, da kileskriftet Hittite ble oppdaget og dechiffrert, ble det funnet å inneholde et fonem, skrevet h, som oppførte seg slik Saussure hadde spådd. . Han hadde oppdaget, ved en rent formell analyse, det som nå er kjent som strupehodene til indoeuropeisk» (66).

Denne oppfatningen av den relasjonelle eller diakritiske bestemmelsen av betydningselementene, som er både implisitt og eksplisitt i kurset, antyder en tredje antakelse som styrer strukturell lingvistikk, det Saussure kaller "tegnets vilkårlige natur." Med dette mener han at forholdet mellom betegneren og betegnet i språket aldri er nødvendig (eller "motivert"): man kunne like gjerne finne lydbetegneren arbre som betegnelsestreet for å forene seg med begrepet "tre". Men mer enn dette betyr det at det betegnede også er vilkårlig: man kan like gjerne definere begrepet "tre" ut fra dens treaktige kvalitet (som vil ekskludere palmer) som ved størrelsen (som ekskluderer de "lave treplantene" vi kalle busker). Dette bør gjøre det klart at nummereringen av forutsetningene jeg har presentert ikke representerer en prioriteringsrekkefølge: hver antakelse - den systemiske karakteren av betydning (best oppfattet ved å studere språket "synkront"), den relasjonelle eller "diakritiske" naturen til elementene av betydning, tegnenes vilkårlige natur - henter sin verdi fra de andre.

Det vil si saussureansk lingvistikk fenomenene den studerer i overordnede forhold mellom kombinasjon og kontrast i språk. I denne oppfatningen er språk både prosessen med å artikulere mening (betydelse) og dets produkt (kommunikasjon), og disse to funksjonene til språket er verken identiske eller fullstendig kongruente (se Schleifer, "Dekonstruksjon"). Her kan vi se vekslingen mellom form og innhold som Greimas og Courtes beskriver i modernistisk tolkning: språket presenterer kontraster som formelt definerer dets enheter, og disse enhetene kombineres på etterfølgende nivåer for å skape det betydningsfulle innholdet. Siden språkets elementer er vilkårlige, kan dessuten verken kontrast eller kombinasjon sies å være grunnleggende. I språk kombineres således karakteristiske trekk for å danne kontrasterende fonemer på et annet nivå av forståelse, fonemer kombineres for å danne kontrasterende morfemer, morfemer kombineres for å danne ord, ord kombineres for å danne setninger, og så videre. I hvert tilfelle er hele fonemet, eller ordet, eller setningen, og så videre, større enn summen av delene (akkurat som vann, H2O, i Saussures eksempel [(1959) 103] er mer enn den mekaniske agglomerasjonen av hydrogen og oksygen).

De tre forutsetningene for kurset i generell lingvistikk førte til at Saussure etterlyste en ny vitenskap fra det tjuende århundre som ville gå utover lingvistisk vitenskap for å studere «tegns liv i samfunnet». Saussure kalte denne vitenskapen "semiologi (fra gresk semeion "tegn")" (16). "Vitenskapen" om semiotikk, slik den kom til å bli praktisert i Øst-Europa på 1920- og 1930-tallet og Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære artefakter utgjort (eller artikulert) av disse strukturene. Gjennom den sene delen av karrieren, selv mens han tilbød kursene i generell lingvistikk, forfulgte Saussure sin egen "semiotiske" analyse av sen latinsk poesi i et forsøk på å oppdage bevisst skjulte anagrammer av egennavn. Studiemetoden var på mange måter det motsatte av den funksjonelle rasjonalismen i hans språklige analyser: den forsøkte, som Saussure nevner i en av de 99 notatbøkene der han forfulgte denne studien, å systematisk undersøke problemet med "tilfeldighet", som " blir det uunngåelige grunnlaget for alt" (sitert i Starobinski 101). En slik studie, som Saussure selv sier, fokuserer på "det materielle faktum" om tilfeldigheter og mening (sitert 101), slik at "temaordet" hvis anagram Saussure søker, som Jean Starobinski hevder, "er, for poeten , et instrument, og ikke en livsviktig kime til diktet. Diktet kreves for å gjenbruke lydmaterialet til temaordet" (45). I denne analysen sier Starobinski: "Saussure mistet seg ikke i et søk etter skjulte betydninger." I stedet ser hans arbeid ut til å demonstrere et ønske om å unndra alle problemene som oppstår fra bevissthet: "Siden poesi ikke bare realiseres i ord, men er noe født av ord, unnslipper den bevissthetens vilkårlige kontroll for å avhenge utelukkende av en slags språklig lovlighet. "(121).

Det vil si Saussures forsøk på å oppdage egennavn i sen latinsk poesi - det Tzvetan Todorov kaller reduksjonen av et "ord . . . til dets signifier" (266) - understreker et av elementene som styrte hans språklige analyse, tegnets vilkårlige natur. (Det understreker også den formelle naturen til saussureansk lingvistikk - "Språk," hevder han, "er en form og ikke en substans" - som effektivt eliminerer semantikk som et hovedobjekt for analyse.) Som Todorov konkluderer, fremstår Saussures arbeid bemerkelsesverdig homogent i dag i sin avvisning av å akseptere symbolske fenomener. . . . I sin forskning på anagrammer tar han kun hensyn til fenomenene repetisjon, ikke til evokasjon. . . . I sine studier av Nibelungen gjenkjenner han symboler bare for å tilskrive dem feillesninger: siden de ikke er tilsiktet, eksisterer ikke symboler. Til slutt i sine kurs om generell lingvistikk tenker han på eksistensen av semiologi, og dermed av andre tegn enn lingvistiske; men denne bekreftelsen er umiddelbart begrenset av det faktum at semiologi er viet til en enkelt type tegn: de som er vilkårlige. (269–70)

Hvis dette er sant, er det fordi Saussure ikke kunne tenke seg "intensjon" uten et subjekt; han kunne ikke helt unnslippe motsetningen mellom form og innhold, arbeidet hans gjorde så mye for å stille spørsmål. I stedet tyr han til «språklig lovlighet». Plassert mellom på den ene siden 1800-tallets forestillinger om historie, subjektivitet og den kausale tolkningsmåten styrt av disse forestillingene, og på den andre siden 1900-tallets "strukturalistiske" forestillinger om det Levi-Strauss kalte "Kantianisme uten et transcendentalt subjekt" (sitert i Connerton 23) - begreper som sletter motsetningen mellom form og innhold (eller subjekt og objekt) og hierarkiet av forgrunn og bakgrunn i fullverdig strukturalisme, psykoanalyse og til og med kvantemekanikk - arbeidet til Ferdinand de Saussure i lingvistikk og semiotikk avgrenser et signalmoment i studiet av mening og kultur.

Ronald Schleifer

Vedlegg 2

Ferdinand de Saussure (oversettelse)

Den sveitsiske lingvisten Ferdinand de Saussure (1857-1913) regnes som grunnleggeren av moderne lingvistikk - takket være hans forsøk på å beskrive språkets struktur, snarere enn historien til individuelle språk og ordformer. I det store og hele ble grunnlaget for strukturelle metoder innen lingvistikk og litteraturkritikk og i stor grad semiotikk lagt i verkene hans helt på begynnelsen av det tjuende århundre. Det er bevist at metodene og konseptene for den såkalte "poststrukturalismen", utviklet i verkene til Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes og andre, går tilbake til de språklige verkene til Saussure og anagrammatiske lesninger av senromersk poesi. Det bør bemerkes at Saussures arbeid med lingvistikk og lingvistisk tolkning bidrar til å koble sammen et bredt spekter av intellektuelle disipliner - fra fysikk til litterære nyvinninger, psykoanalyse og filosofi fra det tidlige tjuende århundre. A. J. Greimas og J. Kurte skriver i Semiotics and Language: «En analytisk ordbok med tittelen «Interpretation» som en ny type tolkning dukket opp på begynnelsen av 1900-tallet sammen med lingvistikken til Saussure, fenomenologien til Husserl og psykoanalysen. av Freud. I et slikt tilfelle er "tolkning ikke å tilskrive et gitt innhold til en form som ellers ville mangle en; snarere er det en parafrase som på en annen måte formulerer det samme innholdet i et betydelig element i et gitt semiotisk system" (159 ). I denne forståelsen av «tolkning» er form og innhold uadskillelige; tvert imot er hver form fylt med semantisk mening ("meningsfull form"), så tolkningen tilbyr en ny, lignende gjenfortelling av noe meningsfylt i et annet tegnsystem.

En lignende forståelse av form og innhold, presentert av Claude Lévi-Strauss i et av strukturalismens programmatiske verk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan sees i Saussures posthume bok, A Course in Generell lingvistikk (1916, overs., 1959, 1983). I løpet av hans levetid publiserte Saussure lite, "Course" - hans hovedverk - ble samlet fra notatene til studenter som deltok på forelesningene hans om generell språkvitenskap i 1907-11. I kurset ba Saussure om en "vitenskapelig" studie av språk, og kontrasterte det med komparativ-historisk lingvistikk fra det nittende århundre. Dette verket kan betraktes som en av de største prestasjoner av vestlig tankegang: å ta utgangspunkt i individuelle ord som de strukturelle elementene i språket, beviste historisk (eller "diakronisk") lingvistikk opprinnelsen og utviklingen av vesteuropeiske språk fra et felles, indoeuropeisk språk – og et tidligere proto-indoeuropeisk.

Det er nettopp denne studien av den unike forekomsten av ord, med den samtidige antakelsen om at språkets grunnleggende "enhet" faktisk er den positive eksistensen av disse "ordelementene" som Saussure stilte spørsmål ved. Arbeidet hans var et forsøk på å redusere de mange fakta om språk som tilfeldig ble studert av komparativ lingvistikk til et lite antall teoremer. Den komparative filologiske skolen på 1800-tallet, skriver Saussure, "lyktes ikke i å skape en virkelig skole for lingvistikk" fordi "den ikke forsto essensen av studieobjektet" (3). Denne «essensen», hevder han, ligger ikke bare i enkeltord – språkets «positive substanser» – men også i de formelle forbindelsene som hjelper disse substansene til å eksistere.

Saussures «test» av språk er basert på tre forutsetninger. For det første er den vitenskapelige forståelsen av språk ikke basert på et historisk, men på et strukturelt fenomen. Derfor skilte han mellom individuelle språkfenomener - "talehendelser", som han definerer som "parole" - og det riktige, etter hans mening, studieobjektet for lingvistikk, systemet (kode, struktur) som kontrollerer disse hendelsene ( "langue"). En slik systematisk studie krever dessuten en «synkron» oppfatning av forholdet mellom språkets elementer i et gitt øyeblikk, snarere enn en «diakron» studie av språkets utvikling gjennom dets historie.

Denne hypotesen var forløperen til det Roman Jakobson i 1929 ville kalle "strukturalisme" - en teori der "ethvert sett av fenomener som er undersøkt av moderne vitenskap betraktes ikke som en mekanisk akkumulering, men som en strukturell helhet der den konstruktive komponenten er korrelert med funksjonen" ("Romantisk "711). I denne passasjen formulerte Jakobson Saussures idé om å definere språk som en struktur, i motsetning til den "mekaniske" oppregningen av historiske hendelser. I tillegg utvikler Jakobson en annen saussureansk antagelse, som ble forløperen til strukturell lingvistikk: de grunnleggende elementene i språket bør studeres ikke så mye med deres årsaker, men med deres funksjoner. Separate fenomener og hendelser (for eksempel historien om opprinnelsen til individuelle indoeuropeiske ord) bør studeres ikke av seg selv, men i et system der de er korrelert med lignende komponenter. Dette var en radikal vending i sammenligningen av fenomener med den omgivende virkeligheten, hvis betydning filosofen Ernst Cassirer sammenlignet med "vitenskapen om Galileo, som i det syttende århundre veltet ideer om den materielle verden." følgelig selve forklaringene. Fenomener begynte å bli tolket ikke i forhold til årsakene til deres forekomst, men i forhold til effekten de kan ha i nåtid og fremtid. Tolkning sluttet å være uavhengig av en persons intensjoner (til tross for at intensjoner kan være upersonlige, «bevisstløs» i freudiansk betydning av ordet).

I sin lingvistikk viser Saussure spesielt denne vendingen i endringen i begrepet ordet i lingvistikken, som han definerer som et tegn og beskriver i form av dets funksjoner. Et tegn for ham er en kombinasjon av lyd og mening, «signified and designation» (66-67; i den engelske oversettelsen av 1983 av Roy Harris – «signification» og «signal»). Naturen til denne forbindelsen er "funksjonell" (verken det ene eller det andre elementet kan eksistere uten hverandre); dessuten «låner den ene egenskaper av den andre» (8). Dermed definerer Saussure det viktigste strukturelle elementet i språket - tegnet - og gjør grunnlaget for historisk lingvistikk til identiteten til tegn til ord, noe som krever en spesielt streng analyse. Derfor kan vi forstå forskjellige betydninger av for eksempel det samme ordet "tre" - ikke fordi ordet bare er et sett av visse kvaliteter, men fordi det er definert som et element i tegnsystemet, i den "strukturelle helheten", i språket.

Et slikt relativt ("diakritisk") enhetsbegrep ligger til grunn for begrepet alle språkelementer i strukturell lingvistikk. Dette er spesielt tydelig i den mest originale oppdagelsen av saussureansk lingvistikk, i utviklingen av begrepet "fonem" og "særtegn" ved språk. Fonemer er den minste av de talte og meningsfulle språkenhetene. De er ikke bare lyder som forekommer i språket, men «lydbilder», bemerker Saussure, som av morsmålsbrukere oppfattes som å ha mening. (Det skal bemerkes at Elmar Holenstein kaller Jakobsons lingvistikk, som viderefører Saussures ideer og begreper i sine hovedbestemmelser, for «fenomenologisk strukturalisme»). Det er derfor den ledende foredragsholderen ved Praha-skolen for strukturalisme, Jan Mukarowski, i 1937 observerte at «struktur. . . ikke et empirisk, men et fenomenologisk begrep; det er ikke resultatet i seg selv, men et sett av betydelige relasjoner til den kollektive bevisstheten (generasjon, andre, etc.)”. En lignende tanke ble uttrykt i 1960 av Lévi-Strauss, lederen av fransk strukturalisme: «Strukturen har ikke noe bestemt innhold; den er meningsfull i seg selv, og den logiske konstruksjonen den er innelukket i er virkelighetens avtrykk.

På sin side representerer fonemer, som de minste språklige elementene som er akseptable for persepsjon, en separat integrert "fenomenologisk virkelighet". For eksempel på engelsk kan lyden "t" uttales annerledes, men i alle tilfeller vil en person som snakker engelsk oppfatte den som "t". Aspirert, hevet eller senket, en lang "t"-lyd osv. vil like mye skille betydningen av ordene "å" og "gjøre". Dessuten er forskjellene mellom språk slik at varianter av en lyd på ett språk kan svare til forskjellige fonemer på et annet; for eksempel er "l" og "r" på engelsk forskjellige, mens de på andre språk er varianter av samme fonem (som det engelske "t", uttalt med og uten aspirasjon). Det enorme vokabularet til ethvert naturlig språk er et sett med kombinasjoner av et mye mindre antall fonemer. På engelsk, for eksempel, brukes bare 40 fonemer til å uttale og skrive omtrent en million ord.

Lydene til et språk er et systematisk organisert sett med funksjoner. På 1920-1930-tallet, etter Saussure, pekte Jacobson og N.S. Trubetskoy ut de "særeegenskapene" til fonemer. Disse funksjonene er basert på strukturen til taleorganene - tunge, tenner, stemmebånd - Saussure merker dette i "Course of General Linguistics", og Harris kaller det "fysiologisk fonetikk" (i Baskins tidligere oversettelse, begrepet "fonologi" " brukes) - de er koblet i "knuter » durg mot en venn for å lage lyder. For eksempel, på engelsk, er forskjellen mellom "t" og "d" tilstedeværelsen eller fraværet av "stemme" (spenningen i stemmebåndene), og stemmenivået som skiller ett fonem fra et annet. Dermed kan fonologi betraktes som et eksempel på den generelle språkregelen beskrevet av Saussure: «Det er bare forskjeller i språket». Enda viktigere er ikke dette: forskjellen innebærer vanligvis de nøyaktige forholdene den befinner seg mellom; men i språket er det bare forskjeller uten presise betingelser. Enten vi vurderer «betegnelse» eller «betegnet» – i språket er det verken begreper eller lyder som ville eksistert før utviklingen av språksystemet.

I en slik struktur defineres språklige analogier ikke ved hjelp av deres iboende kvaliteter, men ved hjelp av systemmessige ("strukturelle") relasjoner.

Jeg har allerede nevnt at fonologien i sin utvikling var avhengig av Saussures ideer. Selv om analysen hans av lingvistisk fysiologi i moderne tid, sier Harris, "ville bli kalt 'fysisk', i motsetning til 'psykologisk' eller 'funksjonell', artikulerte han i The Course tydelig retningen og grunnleggende prinsipper for funksjonell analyse av språk. Hans eneste verk utgitt i løpet av hans levetid, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Notater om det originale vokalsystemet på de indoeuropeiske språkene), utgitt i 1878, var helt i tråd med komparativ historisk lingvistikk av 1800-tallet. Likevel, i dette arbeidet, sier Jonathan Culler, viste Saussure "fruktbarheten av ideen om språk som et system av sammenkoblede fenomener, selv med dens historiske rekonstruksjon." Ved å analysere forholdet mellom fonemer, forklarte vekslingen av vokaler i de moderne språkene til den indoeuropeiske gruppen, foreslo Saussure at i tillegg til flere forskjellige lyder "a", må det være andre fonemer beskrevet formelt. "Det som gjør et spesielt inntrykk i Saussures arbeid," konkluderer Kaller, "er at nesten 50 år senere, da hettittisk kileskrift ble oppdaget og dechiffrert, ble det funnet et fonem, skriftlig betegnet med "h", som oppførte seg slik Saussure forutså. Gjennom formell analyse oppdaget han det som nå er kjent som den gutturale lyden i de indoeuropeiske språkene.

I konseptet med en relativ (diakritisk) definisjon av tegn, både eksplisitt og underforstått i kurset, er det en tredje nøkkelantakelse for strukturell lingvistikk, kalt av Saussure "tegnets vilkårlige natur." Med dette menes at forholdet mellom lyd og mening i språket ikke er motivert av noe som helst: man kan like gjerne koble ordet «arbre» ​​og ordet «tre» med begrepet «tre». Dessuten betyr dette at lyden også er vilkårlig: man kan definere begrepet "tre" ved tilstedeværelsen av bark (unntatt for palmetrær) og etter størrelse (bortsett fra "lave treplanter" - busker). Fra dette bør det være klart at alle antakelsene jeg presenterer ikke er delt inn i mer og mindre viktige: hver av dem - den systemiske naturen til tegn (mest forståelig i den "synkrone" studien av språket), deres relative (diakritiske) essens , den vilkårlige naturen til tegn - kommer fra fra resten.

I saussureansk lingvistikk blir det studerte fenomenet forstått som et sett med sammenligninger og motsetninger av språk. Språk er både et uttrykk for betydningen av ord (betegnelse) og deres resultat (kommunikasjon) – og disse to funksjonene faller aldri sammen (se Shleifers «Dekonstruksjon av språk»). Vi kan se vekslingen av form og innhold som Greimas og Kurte beskriver i siste versjon av tolkning: språklige kontraster definerer dens strukturelle enheter, og disse enhetene samhandler på suksessive nivåer for å skape et visst meningsfullt innhold. Siden elementene i språket er tilfeldige, kan verken kontrast eller kombinasjon være grunnlaget. Dette betyr at i et språk danner særtrekk en fonetisk kontrast på et annet forståelsesnivå, fonemer kombineres til kontrasterende morfemer, morfemer - til ord, ord - til setninger osv. I alle fall et helt fonem, ord, setning osv. er mer enn summen av delene (akkurat som vann, i Saussures eksempel, er mer enn en kombinasjon av hydrogen og oksygen).

Tre forutsetninger fra "Course of General Linguistics" førte Saussure til ideen om en ny vitenskap fra det tjuende århundre, atskilt fra lingvistikk, og studerte "livet til tegn i samfunnet." Saussure kalte denne vitenskapen semiologi (fra det greske "semeion" - et tegn). "Vitenskapen" om semiotikk, som utviklet seg i Øst-Europa på 1920- og 1930-tallet og i Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære funn sammensatt (eller formulert) med disse strukturene. I tillegg, i skumringen av sin karriere, parallelt med kurset i generell lingvistikk, engasjerte Saussure seg i en "semiotisk" analyse av senromersk poesi, og prøvde å oppdage bevisst komponerte anagrammer av egennavn. Denne metoden var på mange måter det motsatte av rasjonalisme i dens språklige analyse: den var et forsøk, som Saussure skriver i en av de 99 notatbøkene, å studere i systemet problemet med «sannsynlighet», som «blir grunnlaget for alt. " En slik undersøkelse, hevder Saussure selv, bidrar til å fokusere på den «virkelige siden» av sannsynlighet; «Nøkkelordet» som Saussure leter etter et anagram for er, ifølge Jean Starobinsky, «et verktøy for poeten, og ikke kilden til liv for diktet. Diktet tjener til å snu lydene til nøkkelordet. I følge Starobinsky fordyper ikke Saussure i denne analysen søket etter skjulte betydninger. Tvert imot, i hans verk er et ønske om å unngå spørsmål knyttet til bevissthet merkbart: «siden poesi ikke bare uttrykkes i ord, men også i det disse ordene gir opphav til, går den utenfor bevissthetens kontroll og avhenger kun av språkets lover."

Saussures forsøk på å studere egennavn i senromersk poesi (Tsvetan Todorov kalte dette en forkortelse av "et ord ... bare før det er skrevet") understreker en av komponentene i hans språklige analyse - tegnenes vilkårlige natur, samt den formelle essensen av saussureansk lingvistikk ("Språk," hevder han, "essensen av formen, ikke fenomenet"), som utelukker muligheten for å analysere meningen. Todorov konkluderer med at Saussures skrifter i dag virker bemerkelsesverdig konsistente i deres motvilje mot å studere symboler [fenomener som har en veldefinert betydning]. . . . Ved å utforske anagrammer, legger Saussure kun hensyn til repetisjon, men ikke til tidligere alternativer. . . . Ved å studere Nibelungenlied, definerer han symbolene bare for å tilordne dem til feilavlesninger: hvis de er utilsiktede, eksisterer ikke symbolene. Tross alt, i sine skrifter om generell lingvistikk, gjør han antagelsen om eksistensen av en semiologi som ikke bare beskriver språklige tegn; men denne antagelsen er begrenset av det faktum at semilogi bare kan beskrive tilfeldige, vilkårlige tegn.

Hvis dette virkelig er slik, er det bare fordi han ikke kunne forestille seg "intensjon" uten et objekt; han klarte ikke helt å bygge bro mellom form og innhold – i hans forfatterskap ble dette til et spørsmål. I stedet vendte han seg mot «språklig legitimitet». Mellom på den ene siden begrepene fra det nittende århundre basert på historie og subjektive formodninger, og metodene for tilfeldig tolkning basert på disse begrepene, og på den annen side de strukturalistiske begrepene som Lévi-Strauss kalte "Kantianisme uten en transcendent skuespiller" - sletter konfrontasjonen mellom form og innhold (subjekt og objekt), mening og opprinnelse i strukturalisme, psykoanalyse og til og med kvantemekanikk - verkene til Ferlinand de Saussure om lingvistikk og semiotikk markerer et vendepunkt i studiet av betydninger i språk og kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunnleggende om teorien om grammatikk / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiske metoder i lingvistikk. M., 1974.

4. Arnold I.V. Den semantiske strukturen til ordet i moderne engelsk og metodikken for studien. /I.V. Arnold-L .: Utdanning, 1966. - 187 s.

6.Bashlykov A.M. Automatisk oversettelsessystem. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 s.

7.Baudouin de Courtenay: Teoretisk arv og modernitet: Sammendrag av rapportene fra den internasjonale vitenskapelige konferansen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Språk og statistikk. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoretisk og anvendt lingvistikk. / V.A. Zvegintsev - M., 1969. - 143 s.

11. Kasevich, V.B. Semantikk. Syntaks. Morfologi. // V.B. Kasevich - M., 1988. - 292 s.

12. Lekomtsev Yu.K. INTRODUKSJON til det formelle språket i lingvistikken / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 s.

Matveeva G.G. Skjulte grammatiske betydninger og identifikasjon av den sosiale personen («portrett») til taleren / G.G. Matveev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Erfaring med å bygge språklige modeller "Mening<-->Tekst". / I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Oversettelse og anvendt lingvistikk / L.L. Nelyubin. - M.: Høyere skole, 1983. - 207 s.

16. Om de eksakte metodene for språkforskning: om den såkalte "matematiske lingvistikken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva og andre - M., 1961. - 162 s.

17. Piotrovsky L.G. Matematisk lingvistikk: Lærebok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Høyere skole, 1977. - 160 s.

18. Han er. Tekst, maskin, person. - L., 1975. - 213 s.

19. Han er. Anvendt lingvistikk / Ed. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Moderne strukturell lingvistikk. Problemer og metoder. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunnleggende om generell og maskinoversettelse / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. Teorien til F. de Saussure i lys av moderne lingvistikk / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Ugle, L.Z. Analytisk lingvistikk / L.Z. Ugle - M., 1970. - 192 s.

24. Saussure F. de. Notater om generell lingvistikk / F. de Saussure; Per. fra fr. - M.: Fremskritt, 2000. - 187 s.

25. Han er. Kurs i generell lingvistikk / Pr. fra fr. - Jekaterinburg, 1999. -426 s.

26. Talestatistikk og automatisk tekstanalyse / Red. utg. R.G. Piotrovsky. L., 1980. - 223 s.

27. Stoll, P. Setter. Logikk. Aksiomatiske teorier. / R. Stoll; Per. fra engelsk. - M., 1968. - 180 s.

28. Tenier, L. Fundamentals of strukturell syntaks. M., 1988.

29. Ubin I.I. Automatisering av oversettelsesaktiviteter i USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderne matematikk. M., 1966.

31. Shenk, R. Behandling av konseptuell informasjon. M., 1980.

32. Shikhanovich, Yu.A. INTRODUKSJON til moderne matematikk (initielle begreper). M., 1965

33. Shcherba L.V. Russiske vokaler i kvalitative og kvantitative termer / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Verdensborger // Spark - 1996. - Nr. 5. - s.13

35. V.A. Uspensky. Foreløpig for leserne av "New Literary Review" til de semiotiske meldingene til Andrei Nikolaevich Kolmogorov. - Ny litterær anmeldelse. -1997. - nr. 24. - S. 18-23

36. Perlovsky L. Bevissthet, språk og kultur. - Kunnskap er makt. -2000. №4 - S. 20-33

Introduksjon? Oversettelsesteori for forelesninger

2.4 Utsikter for anvendelse av matematiske metoder i lingvistikk

I datateknologiens tid har metodene for matematisk lingvistikk fått et nytt utviklingsperspektiv. Søket etter løsninger på problemene med språklig analyse blir nå i økende grad implementert på informasjonssystemnivå. Samtidig setter automatisering av prosessen med å behandle språklig materiale, som gir forskeren betydelige muligheter og fordeler, uunngåelig nye krav og oppgaver for ham.

Kombinasjonen av «eksakt» og «humanitær» kunnskap har blitt grobunn for nye oppdagelser innen lingvistikk, informatikk og filosofi.

Maskinoversettelse fra ett språk til et annet er fortsatt en raskt voksende gren av informasjonsteknologi. Til tross for at dataassistert oversettelse aldri kan sammenlignes i kvalitet med menneskelig oversettelse (spesielt for litterære tekster), har maskinen blitt en uunnværlig assistent for en person i å oversette store tekstvolumer. Det antas at det i nær fremtid vil bli laget mer avanserte oversettelsessystemer, hovedsakelig basert på semantisk analyse av teksten.

Et like lovende område er samspillet mellom lingvistikk og logikk, som fungerer som et filosofisk grunnlag for å forstå informasjonsteknologi og den såkalte "virtuelle virkeligheten". I nær fremtid vil arbeidet fortsette med å lage kunstige intelligenssystemer - selv om det igjen aldri vil være lik mennesket i sine evner. Slik konkurranse er meningsløs: i vår tid bør maskinen ikke bli (og bli) en rival, men en assistent for mennesket, ikke noe fra fantasiens rike, men en del av den virkelige verden.

Studiet av språket med statistiske metoder fortsetter, noe som gjør det mulig å mer nøyaktig bestemme dets kvalitative egenskaper. Det er viktig at de mest vågale hypotesene om språk finner sitt matematiske, og derfor logiske, bevis.

Det mest betydningsfulle er at ulike grener av bruken av matematikk i lingvistikk, tidligere ganske isolert, de siste årene har blitt korrelert med hverandre, koblet til et sammenhengende system, analogt med språksystemet oppdaget for et århundre siden av Ferdinand de Saussure og Yvan Baudouin de Courtenay. Dette er kontinuiteten til vitenskapelig kunnskap.

Lingvistikk i den moderne verden har blitt grunnlaget for utviklingen av informasjonsteknologi. Så lenge informatikk forblir en gren av menneskelig aktivitet i rask utvikling, vil foreningen av matematikk og lingvistikk fortsette å spille sin rolle i utviklingen av vitenskap.


Konklusjon

I løpet av 1900-tallet har datateknologier kommet langt – fra militær til fredelig bruk, fra et snevert spekter av mål til penetrering i alle områder av menneskelivet. Matematikk som vitenskap fikk stadig ny praktisk betydning med utviklingen av datateknologi. Denne prosessen fortsetter i dag.

Det tidligere utenkelige «tandemet» av «fysikere» og «lyrikere» er blitt en realitet. For det fulle samspillet mellom matematikk og informatikk med humaniora, var det nødvendig med kvalifiserte spesialister fra begge sider. Mens informatikere i økende grad har behov for systematisk humanitær kunnskap (språklig, kulturell, filosofisk) for å forstå endringer i virkeligheten rundt dem, i samspillet mellom menneske og teknologi, for å utvikle flere og flere nye språklige og mentale konsepter, for å skrive programmer, så må enhver "humaniora" i vår tid for deres profesjonelle vekst mestre minst det grunnleggende om å jobbe med en datamaskin.

Matematikk, som er nært forbundet med informatikk, fortsetter å utvikle seg og samhandle med naturvitenskap og humaniora. I det nye århundret svekkes ikke trenden mot matematisering av vitenskap, men tvert imot økende. På grunnlag av kvantitative data blir lovene for utviklingen av språket, dets historiske og filosofiske egenskaper forstått.

Matematisk formalisme er best egnet for å beskrive mønstre i lingvistikk (som faktisk i andre vitenskaper, både humaniora og naturvitenskap). Situasjonen utvikler seg noen ganger i vitenskapen på en slik måte at uten bruk av et passende matematisk språk, er det umulig å forstå naturen til fysisk, kjemisk osv. prosessen er ikke mulig. Å lage en planetarisk modell av atomet, den berømte engelske fysikeren fra XX århundre. E. Rutherford opplevde matematiske vanskeligheter. Til å begynne med ble teorien hans ikke akseptert: den hørtes ikke overbevisende ut, og grunnen til dette var Rutherfords uvitenhet om sannsynlighetsteorien, på grunnlag av mekanismen som det bare var mulig å forstå modellrepresentasjonen av atomære interaksjoner. Da han innså dette, meldte en fremragende vitenskapsmann seg allerede på det tidspunktet, eieren av Nobelprisen, seg på seminaret til matematikeren Professor Lamb og i to år, sammen med studentene, deltok på et kurs og utarbeidet en workshop om sannsynlighetsteorien. . Basert på det var Rutherford i stand til å beskrive elektronets oppførsel, og ga hans strukturelle modell overbevisende nøyaktighet og oppnå anerkjennelse. Det samme er med lingvistikk.

Dette reiser spørsmålet, hva er så matematisk i objektive fenomener, takket være at de kan beskrives på matematikkspråket, på språket med kvantitative egenskaper? Dette er homogene enheter av materie fordelt i rom og tid. De vitenskapene som har gått lenger enn andre mot isolasjonen av homogenitet, og viser seg å være bedre egnet for bruk av matematikk i dem.

Internett, som utviklet seg raskt på 1990-tallet, samlet representanter for ulike land, folk og kulturer. Til tross for at engelsk fortsetter å være hovedspråket for internasjonal kommunikasjon, har Internett blitt flerspråklig i vår tid. Dette førte til utviklingen av kommersielt vellykkede maskinoversettelsessystemer som er mye brukt i ulike felt av menneskelig aktivitet.

Datanettverk har blitt et objekt for filosofisk refleksjon – det er skapt flere og flere nye språklige, logiske, verdensbildebegreper som bidrar til å forstå «virtuell virkelighet». I mange kunstverk ble det skapt scenarier - oftere pessimistiske - om maskinenes dominans over en person, og virtuell virkelighet - over omverdenen. Slike prognoser viste seg langt fra alltid å være meningsløse. Informasjonsteknologi er ikke bare en lovende industri for å investere menneskelig kunnskap, det er også en måte å kontrollere informasjon på, og følgelig over menneskelig tanke.

Dette fenomenet har både en negativ og en positiv side. Negativt – fordi kontroll over informasjon er i strid med den umistelige menneskerettigheten til fri tilgang til den. Positivt - fordi mangelen på denne kontrollen kan føre til katastrofale konsekvenser for menneskeheten. Det er nok å minne om en av de klokeste filmene det siste tiåret - "When the World Ends" av Wim Wenders, hvis karakterer er fullstendig nedsenket i den "virtuelle virkeligheten" til sine egne drømmer spilt inn på en datamaskin. Imidlertid kan ikke en eneste vitenskapsmann og ikke en eneste kunstner gi et entydig svar på spørsmålet: hva som venter vitenskap og teknologi i fremtiden.

Å fokusere på "fremtiden", som noen ganger virket fantastisk, var et særtrekk ved vitenskapen på midten av det tjuende århundre, da oppfinnere søkte å lage perfekte modeller av teknologi som kunne fungere uten menneskelig innblanding. Tiden har vist den utopiske naturen til slik forskning. Det ville imidlertid være overflødig å fordømme forskere for dette – uten deres entusiasme på 1950-tallet – ville ikke 60-tallets informasjonsteknologi ha gjort et så kraftig sprang på 90-tallet, og vi ville ikke hatt det vi har nå.

De siste tiårene av det tjuende århundre har endret vitenskapens prioriteringer - forskning, oppfinnsom patos har viket for kommersiell interesse. Igjen, dette er verken bra eller dårlig. Dette er en realitet der vitenskapen i økende grad integreres i hverdagen.

Det 21. århundre har fortsatt denne trenden, og i vår tid bak oppfinnelser ligger ikke bare berømmelse og anerkjennelse, men først og fremst penger. Dette er også grunnen til at det er viktig å sikre at de siste prestasjonene innen vitenskap og teknologi ikke faller i hendene på terrorgrupper eller diktatoriske regimer. Oppgaven er vanskelig til det er umulig; å realisere det maksimalt er hele verdenssamfunnets oppgave.

Informasjon er et våpen, og våpen er ikke mindre farlige enn kjernefysiske eller kjemiske - bare det virker ikke fysisk, men heller psykologisk. Menneskeheten må tenke på hva som er viktigere for den i dette tilfellet – frihet eller kontroll.

De siste filosofiske konseptene knyttet til utviklingen av informasjonsteknologi og et forsøk på å forstå dem har vist begrensningene til både naturvitenskapelig materialisme, som dominerte på 1800- og begynnelsen av 1900-tallet, og ekstrem idealisme, som benekter betydningen av den materielle verden. . Det er viktig for moderne tankegang, spesielt vestens tankegang, å overvinne denne dualismen i tenkningen, når omverdenen er tydelig delt inn i materiell og ideal. Veien til dette er en dialog mellom kulturer, en sammenligning av ulike synspunkter på fenomenene rundt.

Paradoksalt nok kan informasjonsteknologi spille en viktig rolle i denne prosessen. Datanettverk, og spesielt Internett, er ikke bare en ressurs for underholdning og kraftig kommersiell aktivitet, de er også et middel for meningsfull, kontroversiell kommunikasjon mellom representanter for ulike sivilisasjoner i den moderne verden, samt for en dialog mellom fortiden og nåtiden. Vi kan si at Internett flytter de romlige og tidsmessige grensene.

Og i dialogen mellom kulturer gjennom informasjonsteknologi er språkets rolle som det eldste universelle kommunikasjonsmidlet fortsatt viktig. Det er derfor lingvistikk, i samspill med matematikk, filosofi og informatikk, har opplevd sin andre fødsel og fortsetter å utvikle seg i dag. Trenden til nåtiden vil fortsette i fremtiden – «til verdens ende», som for 15 år siden, spådde den samme V. Wenders. Riktignok er det ikke kjent når denne slutten vil inntreffe – men spiller det noen rolle nå, for fremtiden vil før eller siden uansett bli nåtid.


Vedlegg 1

Ferdinand de Saussure

Den sveitsiske lingvisten Ferdinand de Saussure (1857-1913) er ansett for å være grunnleggeren av moderne lingvistikk i sine forsøk på å beskrive språkets struktur i stedet for historien til bestemte språk og språkformer. Faktisk finner metoden for strukturalisme i lingvistikk og litteraturvitenskap og en betydelig gren av semiotikk sitt viktigste utgangspunkt i hans arbeid ved begynnelsen av det tjuende århundre. Det har til og med blitt hevdet at komplekset av strategier og forestillinger som har blitt kalt "poststrukturalisme" - arbeidet til Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes og andre - antydes av Saussures arbeid i lingvistikk og anagrammatiske lesninger av sen latinsk poesi, litterær modernisme til psykoanalyse og filosofi tidlig på det tjuende århundre. Som Algirdas Julien Greimas og Joseph Courtés argumenterer i Semiotics and Language: An Analytic Dictionary, under overskriften "Interpretation", oppsto en ny tolkningsmåte på begynnelsen av det tjuende århundre som de identifiserer med Saussurean-lingvistikk, Husserlian Phenomenology og Freudiansk psykoanalyse. I denne modusen er "tolkning ikke lenger et spørsmål om å tilskrive et gitt innhold til en form som ellers ville mangle en; snarere er det en parafrase som på en annen måte formulerer det ekvivalente innholdet til et betegnende element i et gitt semiotisk system" ( 159). i denne forståelsen av «tolkning» er form og innhold ikke forskjellige; snarere er hver "form" alternativt også et semantisk "innhold", en "signifiserende form", slik at tolkningen tilbyr en analogisk parafrase av noe som allerede betyr innenfor et annet system av signifikans.

En slik nytolkning av form og forståelse – som Claude Lévi-Strauss beskriver i en av sine mest programmatiske artikulasjoner av begrepet strukturalisme, i "Structure and Form: Reflections on a Work by Vladimir Propp" – er implisitt i Saussures posthume kurs. i General Linguistics (1916, trans., 1959, 1983). I sin levetid publiserte Saussure relativt lite, og hans hovedverk, Kurset, var transkripsjonen av studentene hans av flere kurs i generell lingvistikk han tilbød i 1907-11. I kurset etterlyste Saussure det "vitenskapelige" studiet av språk i motsetning til arbeidet i historisk lingvistikk som ble gjort på 1800-tallet. Dette arbeidet er en av de store prestasjonene til vestlig intellekt: å ta bestemte ord som byggesteinene i språk, historisk (eller "diakronisk") lingvistikk sporet opprinnelsen og utviklingen til vestlige språk fra en antatt felles språkkilde, først et "indoeuropeisk" språk og deretter et tidligere "p roto-indoeuropeisk" språk.

Det er nettopp denne studien av den unike forekomsten av ord, med den samtidige antakelsen om at språkets grunnleggende "enhet" faktisk er den positive eksistensen av disse "ordelementene", som Saussure stilte spørsmål ved. Arbeidet hans var et forsøk på å redusere mengden av fakta om språk, studert så nøye av historisk lingvistikk, til et håndterlig antall påstander. Den "sammenlignende skolen" for filologi fra det nittende århundre, sier Saussure i kurset, "lyktes ikke i å sette opp den sanne vitenskapen om lingvistikk" fordi "den ikke klarte å oppsøke naturen til sitt studieobjekt" ( 3). Denne "naturen," hevder han, er ikke bare å finne i de "elementære" ordene som et språk omfatter - de tilsynelatende "positive" faktaene (eller "stoffene") i språket - men i de formelle relasjonene som gir opphav til de "stoffer."

Saussures systematiske reundersøkelse av språk er basert på tre antakelser. Den første er at den vitenskapelige studien av språk må utvikle og studere systemet snarere enn historien til språklige fenomener. Av denne grunn skiller han mellom de spesielle forekomstene av språk - dens spesielle "talehendelser", som han betegner som prøveløslatelse - og det riktige objektet for lingvistikk, systemet (eller "koden") som styrer disse hendelsene, som han betegner som langue. En slik systematisk studie krever dessuten en " synkron" oppfatning av forholdet mellom elementene i språket på et bestemt øyeblikk snarere enn den "diakroniske" studien av utviklingen av språk gjennom historien.

Denne antagelsen ga opphav til det Roman Jakobson i 1929 kom til å betegne som "strukturalisme", der "ethvert sett med fenomener som undersøkes av samtidsvitenskap, behandles ikke som en mekanisk agglomerasjon, men som en strukturell helhet, den mekaniske oppfatningen av prosesser gir etter for spørsmålet. av deres funksjon" ("Romantic" 711). I denne passasjen artikulerer Jakobson Saussures intensjon om å definere lingvistikk som et vitenskapelig system i motsetning til en enkel, "mekanisk" regnskapsføring av historiske ulykker. Sammen med dette beskriver Jakobson også den andre grunnleggende antakelsen i Saussurean – vi kan kaller det nå "strukturell" – lingvistikk: at de grunnleggende elementene i språket bare kan studeres i forhold til deres funksjoner i stedet for i forhold til deres årsaker. Europeiske "ord"), disse hendelsene og enhetene må plasseres innenfor et systemisk rammeverk. der de er relatert til andre såkalte hendelser og entiteter. Dette er en radikal reorientering når det gjelder oppfatning av erfaring og fenomener, en hvis betydning filosofen Ernst Cassirer har sammenlignet med "den nye vitenskapen om Galileo som i det syttende århundre forandret hele vår konseptet om den fysiske verden" (sitert i Culler, Pursuit 2 4). Denne endringen, som Greimas og Courtés bemerker, gjenoppfatter "tolkning" og gjenoppfatter dermed forklaring og forståelse selv. I stedet for at forklaring "er i form av et fenomens årsaker, slik at det som en "effekt" på noen måter er underordnet dets årsaker, består forklaringen her i å underordne et fenomen til dets fremtidsorienterte "funksjon" eller "hensikt." Forklaring er ikke lenger uavhengig av menneskelige intensjoner eller hensikter (selv om disse intensjonene kan være upersonlige, felles eller, i freudianske termer, "ubevisste").

I sin lingvistikk oppnår Saussure denne transformasjonen spesifikt i redefinisjonen av det lingvistiske "ordet", som han beskriver som det lingvistiske "tegnet" og definerer i funksjonalistiske termer. Tegnet, hevder han, er foreningen av "et konsept og et lydbilde", som han kalte "signified and signifier" (66-67; Roy Harris' oversettelse fra 1983 tilbyr begrepene "signification" og "signal"). Naturen til deres "kombinasjon" er "funksjonell" ved at verken den betegnede eller betegneren er "årsaken" til den andre; snarere, "hver sine verdier fra den andre" (8). språkelementet, tegnet , relasjonelt og gjør den grunnleggende antagelsen om historisk lingvistikk, nemlig identiteten til de elementære enhetene av språk og betydning (dvs. "ord"), gjenstand for streng analyse. Ordet "tre" som det "samme" ordet er ikke fordi ordet er definert av iboende kvaliteter – det er ikke en "mekanisk agglomerasjon" av slike kvaliteter – men fordi det er definert som et element i et system, den "strukturelle helheten" av språket.

En slik relasjonell (eller "diakritisk") definisjon av en enhet styrer oppfatningen av alle elementene i språket i strukturell lingvistikk. Dette er tydeligst i den mest imponerende prestasjonen til saussureansk lingvistikk, utviklingen av begrepene "fonemene" og "særtrekkene" til språket. Fonemer er de minste artikulerte og betegnende enhetene i et språk. Det er ikke lydene som forekommer i språket, men "lydbildene" Saussure nevner, som blir oppfattet av høyttalere – fenomenalt oppfattet – som formidlende mening. (Dermed beskriver Elmar Holenstein Jakobsons lingvistikk, som følger Saussure på viktige måter, som «fenomenologisk strukturalisme.») Det er av denne grunn at den ledende talspersonen for Praha skolestrukturalisme, Jan Mukarovsky, i 1937 bemerket at «struktur . . . er en fenomenologisk og ikke en empirisk virkelighet; det er ikke verket i seg selv, men et sett av funksjonelle relasjoner som er lokalisert i bevisstheten til et kollektiv (generasjon, miljø, etc.)" (sitert i Galan 35). Likeledes Lévi-Strauss, den ledende talspersonen for fransk strukturalisme , bemerket i 1960 at "struktur ikke har noe distinkt innhold; den er tilfreds med seg selv, og den logiske organisasjonen den er arrestert i, er tenkt som en eiendom til det virkelige» (167; se også Jakobson, Fundamentals 27-28).

Fonemer, altså de minste merkbare elementene i språket, er ikke positive objekter, men en «fenomenologisk virkelighet». På engelsk, for eksempel, kan fonemet /t/ uttales på mange forskjellige måter, men i alle tilfeller vil en engelsktalende gjenkjenne at det fungerer som en /t/. En aspirert t (dvs. en t uttalt med en h-lignende pust etter seg), en høy eller lav t-lyd, en utvidet t-lyd, og så videre, vil alle fungere på samme måte for å skille betydningen av "to" og "do" på engelsk. Dessuten er forskjellene mellom språk slik at fonologiske variasjoner i ett språk kan utgjøre distinkte fonemer i et annet; dermed skiller engelsk mellom /l/ og /r/, mens andre språk er så strukturert at disse artikulasjonene betraktes som varianter av samme fonem (som aspirert og uaspirert t på engelsk). I hvert naturlig språk er det store antallet mulige ord en kombinasjon av et lite antall fonemer. Engelsk, for eksempel, har mindre enn 40 fonemer som til sammen danner over en million forskjellige ord.

Språkets fonem er i seg selv systematisk organiserte strukturer av funksjoner. På 1920- og 1930-tallet, etter Saussures ledelse, isolerte Jakobson og N. S. Trubetzkoy de "egenartede trekkene" til fonemer. Disse trekkene er basert på den fysiologiske strukturen til taleorganene - tunge, tenner, stemmebånd og så videre - som Saussure nevner i kurset og som Harris beskriver som "fysiologisk fonetikk" (39; Baskins tidligere oversettelse bruker begrepet "fonologi" [(1959) 38]) - og de kombineres i "bunter" av binære motsetninger for å danne fonemer. For eksempel, på engelsk er forskjellen mellom /t/ og /d/ tilstedeværelsen eller fraværet av "stemme" (engasjementet til stemmebåndene), og på stemmenivået definerer disse fonemene hverandre gjensidig. På denne måten er fonologi et konkret eksempel på en generell språkregel beskrevet av Saussure: I språket er det bare forskjeller. enda viktigere: en forskjell innebærer generelt positive termer som forskjellen er satt opp mellom; men i språket er det bare forskjeller uten positive termer. Enten vi tar det betegnede eller det betegnende, har språket verken ideer eller lyder som eksisterte før det språklige systemet. ( 120)

I dette rammeverket bestemmes språklige identiteter ikke av iboende kvaliteter, men av systemiske ("strukturelle") forhold.

Jeg har sagt at fonologien "fulgte ledetråden" til Saussure, for selv om analysen hans av fysiologien til språkproduksjon "i dag ville," som Harris sier, "bli kalt "fysisk", i motsetning til enten "psykologisk" eller "funksjonell". "" (lesing 49), følgelig artikulerte han i kurset retningen og konturene til en funksjonell analyse av språk. Tilsvarende var hans eneste utvidede publiserte verk, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir om det primitive systemet med vokaler i indoeuropeiske språk), som dukket opp i 1878, fullt ut plassert innenfor prosjektet til det nittende- århundres historisk lingvistikk. Likevel, innenfor dette arbeidet, som Jonathan Culler har hevdet, demonstrerte Saussure "fruktbarheten ved å tenke på språk som et system av rent relasjonelle elementer, selv når han jobbet med oppgaven med historisk rekonstruksjon" (Saussure 66). Ved å analysere de systematiske strukturelle relasjonene mellom fonemer for å redegjøre for mønstre av vokalveksling i eksisterende indoeuropeiske språk, antydet Saussure at i tillegg til flere forskjellige fonemer /a/, må det ha vært et annet fonem som kunne beskrives formelt. "Det som gjør Saussures arbeid så veldig imponerende," konkluderer Culler, "er det faktum at nesten femti år senere, da kileskriftet Hittite ble oppdaget og dechiffrert, ble det funnet å inneholde et fonem, skrevet h, som oppførte seg slik Saussure hadde spådd. . Han hadde oppdaget, ved en rent formell analyse, det som nå er kjent som strupehodene til indoeuropeisk» (66).

Denne oppfatningen av den relasjonelle eller diakritiske bestemmelsen av betydningselementene, som er både implisitt og eksplisitt i kurset, antyder en tredje antakelse som styrer strukturell lingvistikk, det Saussure kaller "tegnets vilkårlige natur." Med dette mener han at forholdet mellom betegneren og betegnet i språket aldri er nødvendig (eller "motivert"): man kunne like gjerne finne lydbetegneren arbre som betegnelsestreet for å forene seg med begrepet "tre". Men mer enn dette betyr det at det betegnede også er vilkårlig: man kan like gjerne definere begrepet "tre" ut fra dens treaktige kvalitet (som vil ekskludere palmer) som ved størrelsen (som ekskluderer de "lave treplantene" vi kalle busker). Dette bør gjøre det klart at nummereringen av forutsetningene jeg har presentert ikke representerer en prioriteringsrekkefølge: hver antakelse – den systemiske karakteren av betydning (best oppfattet ved å studere språket "synkront"), den relasjonelle eller "diakritiske" naturen til elementene av betydning, tegnenes vilkårlige natur – henter sin verdi fra de andre.

Det vil si saussureansk lingvistikk fenomenene den studerer i overordnede forhold mellom kombinasjon og kontrast i språk. I denne oppfatningen er språk både prosessen med å artikulere mening (betydelse) og dets produkt (kommunikasjon), og disse to funksjonene til språket er verken identiske eller fullstendig kongruente (se Schleifer, "Dekonstruksjon"). Her kan vi se vekslingen mellom form og innhold som Greimas og Courtés beskriver i modernistisk tolkning: språket presenterer kontraster som formelt definerer dets enheter, og disse enhetene kombineres på etterfølgende nivåer for å skape det betydningsfulle innholdet. Siden språkets elementer er vilkårlige, kan dessuten verken kontrast eller kombinasjon sies å være grunnleggende. I språk kombineres således karakteristiske trekk for å danne kontrasterende fonemer på et annet nivå av forståelse, fonemer kombineres for å danne kontrasterende morfemer, morfemer kombineres for å danne ord, ord kombineres for å danne setninger, og så videre. I hvert tilfelle er hele fonemet, eller ordet, eller setningen, og så videre, større enn summen av delene (akkurat som vann, H2O, i Saussures eksempel [(1959) 103] er mer enn den mekaniske agglomerasjonen av hydrogen og oksygen).

De tre forutsetningene for kurset i generell lingvistikk førte til at Saussure etterlyste en ny vitenskap fra det tjuende århundre som ville gå utover lingvistisk vitenskap for å studere «tegns liv i samfunnet». Saussure kalte denne vitenskapen "semiologi (fra gresk semeîon "tegn")" (16). "Vitenskapen" om semiotikk, slik den kom til å bli praktisert i Øst-Europa på 1920- og 1930-tallet og Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære artefakter utgjort (eller artikulert) av disse strukturene. Gjennom den sene delen av karrieren, selv mens han tilbød kursene i generell lingvistikk, forfulgte Saussure sin egen "semiotiske" analyse av sen latinsk poesi i et forsøk på å oppdage bevisst skjulte anagrammer av egennavn. Studiemetoden var på mange måter det motsatte av den funksjonelle rasjonalismen i hans språklige analyser: den forsøkte, som Saussure nevner i en av de 99 notatbøkene der han forfulgte denne studien, å systematisk undersøke problemet med "tilfeldighet", som " blir det uunngåelige grunnlaget for alt" (sitert i Starobinski 101). En slik studie, som Saussure selv sier, fokuserer på "det materielle faktum" om tilfeldigheter og mening (sitert 101), slik at "temaordet" hvis anagram Saussure søker, som Jean Starobinski hevder, "er, for poeten , et instrument, og ikke en livsviktig kime til diktet. Diktet kreves for å gjenbruke lydmaterialet til temaordet" (45). I denne analysen sier Starobinski: "Saussure mistet seg ikke i et søk etter skjulte betydninger." I stedet ser hans arbeid ut til å demonstrere et ønske om å unndra alle problemene som oppstår fra bevissthet: "Siden poesi ikke bare realiseres i ord, men er noe født av ord, unnslipper den bevissthetens vilkårlige kontroll for å avhenge utelukkende av en slags språklig lovlighet. "(121).

Det vil si Saussures forsøk på å oppdage egennavn i sen latinsk poesi - det Tzvetan Todorov kaller reduksjonen av et "ord. . . til dets signifier" (266) – understreker et av elementene som styrte hans språklige analyse, tegnets vilkårlige natur. (Det understreker også den formelle naturen til saussureansk lingvistikk – "Språk," hevder han, "er en form og ikke et stoff" – som effektivt eliminerer semantikk som et hovedobjekt for analyse.) Som Todorov konkluderer, fremstår Saussures arbeid bemerkelsesverdig homogent i dag i sin avvisning av å akseptere symbolske fenomener. . . . I sin forskning på anagrammer tar han kun hensyn til fenomenene repetisjon, ikke til evokasjon. . . . I sine studier av Nibelungen gjenkjenner han symboler bare for å tilskrive dem feillesninger: siden de ikke er tilsiktet, eksisterer ikke symboler. Til slutt i sine kurs om generell lingvistikk tenker han på eksistensen av semiologi, og dermed av andre tegn enn lingvistiske; men denne bekreftelsen er umiddelbart begrenset av det faktum at semiologi er viet til en enkelt type tegn: de som er vilkårlige. (269–70)

Hvis dette er sant, er det fordi Saussure ikke kunne tenke seg "intensjon" uten et subjekt; han kunne ikke helt unnslippe motsetningen mellom form og innhold, arbeidet hans gjorde så mye for å stille spørsmål. I stedet tyr han til «språklig lovlighet». Plassert mellom på den ene siden 1800-tallets forestillinger om historie, subjektivitet og den kausale tolkningsmåten styrt av disse forestillingene, og på den andre siden 1900-tallets "strukturalistiske" forestillinger om det Lévi-Strauss kalte "kantianisme uten et transcendentalt subjekt" (sitert i Connerton 23) - konsepter som sletter motsetningen mellom form og innhold (eller subjekt og objekt) og hierarkiet av forgrunn og bakgrunn i fullverdig strukturalisme, psykoanalyse og til og med kvantemekanikk - arbeidet til Ferdinand de Saussure i lingvistikk og semiotikk avgrenser et signalmoment i studiet av mening og kultur.

Ronald Schleifer


Vedlegg 2

Ferdinand de Saussure (oversettelse)

Den sveitsiske lingvisten Ferdinand de Saussure (1857-1913) regnes som grunnleggeren av moderne lingvistikk, takket være hans forsøk på å beskrive språkets struktur, snarere enn historien til individuelle språk og ordformer. I det store og hele ble grunnlaget for strukturelle metoder innen lingvistikk og litteraturkritikk og i stor grad semiotikk lagt i verkene hans helt på begynnelsen av det tjuende århundre. Det er bevist at metodene og konseptene for den såkalte "poststrukturalismen", utviklet i verkene til Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes og andre, går tilbake til de språklige verkene til Saussure og anagrammatiske lesninger av senromersk poesi. Det skal bemerkes at Saussures arbeid med lingvistikk og lingvistisk tolkning bidrar til å knytte et bredt spekter av intellektuelle disipliner, fra fysikk til litterære nyvinninger, psykoanalyse og filosofi fra det tidlige tjuende århundre. A. J. Greimas og J. Kurte skriver i Semiotics and Language: «En analytisk ordbok med tittelen «Interpretation» som en ny type tolkning dukket opp på begynnelsen av 1900-tallet sammen med lingvistikken til Saussure, fenomenologien til Husserl og psykoanalysen. av Freud. I et slikt tilfelle er "tolkning ikke å tilskrive et gitt innhold til en form som ellers ville mangle en; snarere er det en parafrase som på en annen måte formulerer det samme innholdet i et betydelig element i et gitt semiotisk system" (159 ). I denne forståelsen av «tolkning» er form og innhold uadskillelige; tvert imot er hver form fylt med semantisk mening ("meningsfull form"), så tolkningen tilbyr en ny, lignende gjenfortelling av noe meningsfylt i et annet tegnsystem.

En lignende forståelse av form og innhold, presentert av Claude Lévi-Strauss i et av strukturalismens nøkkelverk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan sees i Saussures posthumt publiserte bok A Course in Generell lingvistikk (1916, overs., 1959, 1983). I løpet av hans levetid publiserte Saussure lite, "Course" - hans hovedverk - ble samlet fra notatene til studenter som deltok på forelesningene hans om generell språkvitenskap i 1907-11. I kurset ba Saussure om en "vitenskapelig" studie av språk, og kontrasterte det med komparativ-historisk lingvistikk fra det nittende århundre. Dette verket kan betraktes som en av de største prestasjoner av vestlig tankegang: ved å ta individuelle ord som de strukturelle elementene i språket som grunnlag, beviste historisk (eller "diakronisk") lingvistikk opprinnelsen og utviklingen av vesteuropeiske språk fra en felles, indoeuropeisk språk – og et tidligere proto-indoeuropeisk.

Det er nettopp denne studien av den unike forekomsten av ord, med den samtidige antakelsen om at språkets grunnleggende "enhet" faktisk er den positive eksistensen av disse "ordelementene" som Saussure stilte spørsmål ved. Arbeidet hans var et forsøk på å redusere de mange fakta om språk som tilfeldig ble studert av komparativ lingvistikk til et lite antall teoremer. Den komparative filologiske skolen på 1800-tallet, skriver Saussure, "lyktes ikke i å skape en virkelig skole for lingvistikk" fordi "den ikke forsto essensen av studieobjektet" (3). Denne «essensen», hevder han, ligger ikke bare i enkeltord – språkets «positive substanser» – men også i de formelle sammenhengene som hjelper disse substansene til å eksistere.

Saussures «test» av språk er basert på tre forutsetninger. For det første er den vitenskapelige forståelsen av språk ikke basert på et historisk, men på et strukturelt fenomen. Derfor skilte han mellom individuelle språkfenomener - "talehendelser", som han definerer som "parole" - og det riktige, etter hans mening, studieobjektet for lingvistikk, systemet (kode, struktur) som kontrollerer disse hendelsene ( "langue"). En slik systematisk studie krever dessuten en «synkron» oppfatning av forholdet mellom språkets elementer i et gitt øyeblikk, snarere enn en «diakron» studie av språkets utvikling gjennom dets historie.

Denne hypotesen var forløperen til det Roman Jakobson i 1929 ville kalle "strukturalisme" - en teori der "ethvert sett av fenomener som er undersøkt av moderne vitenskap betraktes ikke som en mekanisk akkumulering, men som en strukturell helhet der den konstruktive komponenten er korrelert med funksjonen" ("Romantisk "711). I denne passasjen formulerte Jakobson Saussures idé om å definere språk som en struktur, i motsetning til den "mekaniske" oppregningen av historiske hendelser. I tillegg utvikler Jakobson en annen saussureansk antagelse, som ble forløperen til strukturell lingvistikk: de grunnleggende elementene i språket bør studeres ikke så mye med deres årsaker, men med deres funksjoner. Separate fenomener og hendelser (for eksempel historien om opprinnelsen til individuelle indoeuropeiske ord) bør studeres ikke av seg selv, men i et system der de er korrelert med lignende komponenter. Dette var en radikal vending i sammenligningen av fenomener med den omgivende virkeligheten, hvis betydning filosofen Ernst Cassirer sammenlignet med "vitenskapen om Galileo, som i det syttende århundre veltet ideer om den materielle verden." følgelig selve forklaringene. Fenomener begynte å bli tolket ikke i forhold til årsakene til deres forekomst, men i forhold til effekten de kan ha i nåtid og fremtid. Tolkning sluttet å være uavhengig av en persons intensjoner (til tross for at intensjoner kan være upersonlige, «bevisstløs» i freudiansk betydning av ordet).

I sin lingvistikk viser Saussure spesielt denne vendingen i endringen i begrepet ordet i lingvistikken, som han definerer som et tegn og beskriver i form av dets funksjoner. Et tegn for ham er en kombinasjon av lyd og mening, «signified and designation» (66-67; i den engelske oversettelsen av 1983 av Roy Harris – «signification» og «signal»). Naturen til denne forbindelsen er "funksjonell" (verken det ene eller det andre elementet kan eksistere uten hverandre); dessuten «låner den ene egenskaper av den andre» (8). Dermed definerer Saussure det viktigste strukturelle elementet i språket - tegnet - og gjør grunnlaget for historisk lingvistikk til identiteten til tegn til ord, noe som krever en spesielt streng analyse. Derfor kan vi forstå forskjellige betydninger av for eksempel det samme ordet "tre" - ikke fordi ordet bare er et sett av visse kvaliteter, men fordi det er definert som et element i tegnsystemet, i den "strukturelle helheten", i språket.

Et slikt relativt ("diakritisk") enhetsbegrep ligger til grunn for begrepet alle språkelementer i strukturell lingvistikk. Dette er spesielt tydelig i den mest originale oppdagelsen av saussureansk lingvistikk, i utviklingen av begrepet "fonem" og "særtegn" ved språk. Fonemer er den minste av de talte og meningsfulle språkenhetene. De er ikke bare lyder som forekommer i språket, men «lydbilder», bemerker Saussure, som av morsmålsbrukere oppfattes som å ha mening. (Det skal bemerkes at Elmar Holenstein kaller Jakobsons lingvistikk, som viderefører Saussures ideer og begreper i sine hovedbestemmelser, for «fenomenologisk strukturalisme»). Det er derfor den ledende foredragsholderen ved Praha-skolen for strukturalisme, Jan Mukarowski, i 1937 observerte at «struktur. . . ikke et empirisk, men et fenomenologisk begrep; det er ikke resultatet i seg selv, men et sett av betydelige relasjoner til den kollektive bevisstheten (generasjon, andre, etc.)”. En lignende tanke ble uttrykt i 1960 av Lévi-Strauss, lederen av fransk strukturalisme: «Strukturen har ikke noe bestemt innhold; den er meningsfull i seg selv, og den logiske konstruksjonen den er innelukket i er virkelighetens avtrykk.

På sin side representerer fonemer, som de minste språklige elementene som er akseptable for persepsjon, en separat integrert "fenomenologisk virkelighet". For eksempel på engelsk kan lyden "t" uttales annerledes, men i alle tilfeller vil en person som snakker engelsk oppfatte den som "t". Aspirert, hevet eller senket, en lang "t"-lyd osv. vil like mye skille betydningen av ordene "å" og "gjøre". Dessuten er forskjellene mellom språk slik at varianter av en lyd på ett språk kan svare til forskjellige fonemer på et annet; for eksempel er "l" og "r" på engelsk forskjellige, mens de på andre språk er varianter av samme fonem (som det engelske "t", uttalt med og uten aspirasjon). Det enorme vokabularet til ethvert naturlig språk er et sett med kombinasjoner av et mye mindre antall fonemer. På engelsk, for eksempel, brukes bare 40 fonemer til å uttale og skrive omtrent en million ord.

Lydene til et språk er et systematisk organisert sett med funksjoner. I 1920-1930-årene, etter Saussure, pekte Jacobson og N.S. Trubetskoy ut de "særeegenskapene" til fonemer. Disse funksjonene er basert på strukturen til taleorganene - tunge, tenner, stemmebånd - Saussure bemerker dette i "Course of General Linguistics", og Harris kaller det "fysiologisk fonetikk" (i Baskins tidligere oversettelse, begrepet "fonologi" " brukes) - de er koblet i "knuter » durg mot en venn for å lage lyder. For eksempel, på engelsk, er forskjellen mellom "t" og "d" tilstedeværelsen eller fraværet av "stemme" (spenningen i stemmebåndene), og stemmenivået som skiller ett fonem fra et annet. Dermed kan fonologi betraktes som et eksempel på den generelle språkregelen beskrevet av Saussure: «Det er bare forskjeller i språket». Enda viktigere er ikke dette: forskjellen innebærer vanligvis de nøyaktige forholdene den befinner seg mellom; men i språket er det bare forskjeller uten presise betingelser. Enten vi vurderer «betegnelse» eller «betegnet» – i språket er det verken begreper eller lyder som ville eksistert før utviklingen av språksystemet.

I en slik struktur defineres språklige analogier ikke ved hjelp av deres iboende kvaliteter, men ved hjelp av systemmessige ("strukturelle") relasjoner.

Jeg har allerede nevnt at fonologien i sin utvikling var avhengig av Saussures ideer. Selv om analysen hans av lingvistisk fysiologi i moderne tid, sier Harris, "ville bli kalt 'fysisk', i motsetning til 'psykologisk' eller 'funksjonell', artikulerte han i The Course tydelig retningen og grunnleggende prinsipper for funksjonell analyse av språk. Hans eneste publiserte verk i løpet av hans levetid, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Notater om det originale vokalsystemet på de indoeuropeiske språkene), utgitt i 1878, var helt i tråd med komparativ historisk lingvistikk av 1800-tallet. Likevel, i dette arbeidet, sier Jonathan Culler, viste Saussure "fruktbarheten av ideen om språk som et system av sammenkoblede fenomener, selv med dens historiske rekonstruksjon." Ved å analysere forholdet mellom fonemer, forklarte vekslingen av vokaler i de moderne språkene til den indoeuropeiske gruppen, foreslo Saussure at i tillegg til flere forskjellige lyder "a", må det være andre fonemer beskrevet formelt. "Det som gjør Saussures arbeid spesielt imponerende," konkluderer Kaller, "er at nesten 50 år senere, da hettittisk kileskrift ble oppdaget og dechiffrert, ble det funnet et fonem, skriftlig betegnet med "h", som oppførte seg slik Saussure forutså. Gjennom formell analyse oppdaget han det som nå er kjent som den gutturale lyden i de indoeuropeiske språkene.

I konseptet med en relativ (diakritisk) definisjon av tegn, både eksplisitt og underforstått i kurset, er det en tredje nøkkelantakelse for strukturell lingvistikk, kalt av Saussure "tegnets vilkårlige natur." Med dette menes at forholdet mellom lyd og mening i språket ikke er motivert av noe som helst: man kan like gjerne koble ordet «arbre» ​​og ordet «tre» med begrepet «tre». Dessuten betyr dette at lyden også er vilkårlig: man kan definere begrepet "tre" ved tilstedeværelsen av bark (unntatt for palmetrær) og etter størrelse (bortsett fra "lave treplanter" - busker). Fra dette bør det være klart at alle antakelsene jeg presenterer ikke er delt inn i mer og mindre viktige: hver av dem - den systemiske naturen til tegn (mest forståelig i den "synkrone" studien av språket), deres relative (diakritiske) essensen, den vilkårlige naturen til tegn - kommer fra fra resten.

I saussureansk lingvistikk blir det studerte fenomenet forstått som et sett med sammenligninger og motsetninger av språk. Språk er både et uttrykk for betydningen av ord (betegnelse) og deres resultat (kommunikasjon) – og disse to funksjonene faller aldri sammen (se Shleifers «Dekonstruksjon av språk»). Vi kan se vekslingen av form og innhold som Greimas og Kurte beskriver i siste versjon av tolkning: språklige kontraster definerer dens strukturelle enheter, og disse enhetene samhandler på suksessive nivåer for å skape et visst meningsfullt innhold. Siden elementene i språket er tilfeldige, kan verken kontrast eller kombinasjon være grunnlaget. Dette betyr at i et språk danner særtrekk en fonetisk kontrast på et annet forståelsesnivå, fonemer kombineres til kontrasterende morfemer, morfemer til ord, ord til setninger osv. I alle fall et helt fonem, ord, setning osv. er mer enn summen av delene (akkurat som vann, i Saussures eksempel, er mer enn kombinasjonen av hydrogen og oksygen).

Tre forutsetninger fra "Course of General Linguistics" førte Saussure til ideen om en ny vitenskap fra det tjuende århundre, atskilt fra lingvistikk, og studerte "livet til tegn i samfunnet." Saussure kalte denne vitenskapen semiologi (fra gresk "semeîon" - et tegn). «Vitenskapen» om semiotikk, som utviklet seg i Øst-Europa på 1920- og 1930-tallet og i Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære funn komponert (eller formulert) ved hjelp av disse strukturene. I tillegg, i skumringen av sin karriere, parallelt med kurset i generell lingvistikk, engasjerte Saussure seg i en "semiotisk" analyse av senromersk poesi, og prøvde å oppdage bevisst komponerte anagrammer av egennavn. Denne metoden var på mange måter det motsatte av rasjonalisme i dens språklige analyse: den var et forsøk, som Saussure skriver i en av de 99 notatbøkene, å studere i systemet problemet med «sannsynlighet», som «blir grunnlaget for alt. " En slik undersøkelse, hevder Saussure selv, bidrar til å fokusere på den «virkelige siden» av sannsynlighet; «Nøkkelordet» som Saussure leter etter et anagram for er, ifølge Jean Starobinsky, «et verktøy for poeten, og ikke kilden til liv for diktet. Diktet tjener til å snu lydene til nøkkelordet. I følge Starobinsky fordyper ikke Saussure i denne analysen søket etter skjulte betydninger. Tvert imot, i hans verk er et ønske om å unngå spørsmål knyttet til bevissthet merkbart: «siden poesi ikke bare uttrykkes i ord, men også i det disse ordene gir opphav til, går den utenfor bevissthetens kontroll og avhenger kun av språkets lover."

Saussures forsøk på å studere egennavn i senromersk poesi (Tsvetan Todorov kalte dette en forkortelse av "et ord ... bare før det er skrevet") understreker en av komponentene i hans språklige analyse - tegnenes vilkårlige natur, samt den formelle essensen av saussureansk lingvistikk ("Språk," hevder han, "essensen av formen, ikke fenomenet"), som utelukker muligheten for å analysere betydningen. Todorov konkluderer med at Saussures skrifter i dag virker bemerkelsesverdig konsistente i deres motvilje mot å studere symboler [fenomener som har en veldefinert betydning]. . . . Ved å utforske anagrammer, legger Saussure kun hensyn til repetisjon, men ikke til tidligere alternativer. . . . Ved å studere Nibelungenlied, definerer han symbolene bare for å tilordne dem til feilavlesninger: hvis de er utilsiktede, eksisterer ikke symbolene. Tross alt, i sine skrifter om generell lingvistikk, gjør han antagelsen om eksistensen av en semiologi som ikke bare beskriver språklige tegn; men denne antagelsen er begrenset av det faktum at semilogi bare kan beskrive tilfeldige, vilkårlige tegn.

Hvis dette virkelig er slik, er det bare fordi han ikke kunne forestille seg "intensjon" uten et objekt; han klarte ikke helt å bygge bro mellom form og innhold – i hans forfatterskap ble dette til et spørsmål. I stedet vendte han seg mot «språklig legitimitet». Mellom på den ene siden begrepene fra det nittende århundre basert på historie og subjektive formodninger, og metodene for tilfeldig tolkning basert på disse begrepene, og på den annen side de strukturalistiske begrepene som Lévi-Strauss kalte "Kantianisme uten en transcendent aktør" - ved å slette motsetningen mellom form og innhold (subjekt og objekt), mening og opphav i strukturalisme, psykoanalyse og til og med kvantemekanikk, markerer Ferlinand de Saussures skrifter om lingvistikk og semiotikk et vendepunkt i studiet av betydninger i språk og kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunnleggende om teorien om grammatikk / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiske metoder i lingvistikk. M., 1974.

4. Arnold I.V. Den semantiske strukturen til ordet i moderne engelsk og metodikken for studien. /I.V. Arnold - L .: Utdanning, 1966. - 187 s.

6.Bashlykov A.M. Automatisk oversettelsessystem. / A.M. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 s.

7.Baudouin de Courtenay: Teoretisk arv og modernitet: Sammendrag av rapportene fra den internasjonale vitenskapelige konferansen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Språk og statistikk. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoretisk og anvendt lingvistikk. / V.A. Zvegintsev - M., 1969. - 143 s.

11. Kasevich, V.B. Semantikk. Syntaks. Morfologi. // V.B. Kasevich -M., 1988. - 292 s.

12. Lekomtsev Yu.K. Introduksjon til lingvistikkens formelle språk / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 s.

Matveeva G.G. Skjulte grammatiske betydninger og identifikasjon av den sosiale personen («portrett») til taleren / G.G. Matveev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Erfaring med å bygge språklige modeller "Mening<-->Tekst". / I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Oversettelse og anvendt lingvistikk / L.L. Nelyubin. - M. : Videregående skole, 1983. - 207 s.

16. Om de eksakte metodene for språkforskning: om den såkalte "matematiske lingvistikken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva og andre - M., 1961. - 162 s.

17. Piotrovsky L.G. Matematisk lingvistikk: Lærebok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Videregående skole, 1977. - 160 s.

18. Han er. Tekst, maskin, person. - L., 1975. - 213 s.

19. Han er. Anvendt lingvistikk / Ed. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Moderne strukturell lingvistikk. Problemer og metoder. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunnleggende om generell og maskinoversettelse / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. Teorien til F. de Saussure i lys av moderne lingvistikk / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Ugle, L.Z. Analytisk lingvistikk / L.Z. Ugle - M., 1970. - 192 s.

24. Saussure F. de. Notater om generell lingvistikk / F. de Saussure; Per. fra fr. – M.: Fremskritt, 2000. – 187 s.

25. Han er. Kurs i generell lingvistikk / Pr. fra fr. - Jekaterinburg, 1999. -426 s.

26. Talestatistikk og automatisk tekstanalyse / Red. utg. R.G. Piotrovsky. L., 1980. - 223 s.

27. Stoll, P. Setter. Logikk. Aksiomatiske teorier. / R. Stoll; Per. fra engelsk. - M., 1968. - 180 s.

28. Tenier, L. Fundamentals of strukturell syntaks. M., 1988.

29. Ubin I.I. Automatisering av oversettelsesaktiviteter i USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderne matematikk. M., 1966.

31. Shenk, R. Behandling av konseptuell informasjon. M., 1980.

32. Shikhanovich, Yu.A. Introduksjon til moderne matematikk (initielle begreper). M., 1965

33. Shcherba L.V. Russiske vokaler i kvalitative og kvantitative termer / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Verdensborger // Ogonyok - 1996. - Nr. 5. – s.13

35. V.A. Uspensky. Foreløpig for leserne av "New Literary Review" til de semiotiske meldingene til Andrei Nikolaevich Kolmogorov. – En ny litteraturanmeldelse. –1997. - nr. 24. - S. 18-23

36. Perlovsky L. Bevissthet, språk og kultur. - Kunnskap er makt. –2000. nr. 4 - S. 20-33

37. Frumkina R.M. Om oss - på skrå. // Russian Journal. - 2000. - Nr. 1. – s. 12

38. Fitialov, S.Ya. Om syntaksmodellering i strukturell lingvistikk // Problems of Structural Linguistics. M., 1962.

39. Han er. Om ekvivalensen av NN-grammatikk og avhengighetsgrammatikk // Problems of Structural Linguistics. M., 1967.

40. Chomsky, N. Logiske grunnlag for lingvistisk teori // Nytt i lingvistikk. Utgave. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. trykk. jhu.ru

46. ​​en.wikipedia.org

47. www.smolensk.ru


Kryptanalyse er en vitenskap (og praksisen med dens anvendelse) om metodene og måtene å bryte chiffer. Kryptografi og kryptoanalyse utgjør et enkelt kunnskapsfelt - kryptologi, som i dag er feltet for moderne matematikk, som har viktige anvendelser innen moderne informasjonsteknologi. Begrepet "kryptografi" ble introdusert av D. Vallis. Behovet for å kryptere meldinger oppsto for lenge siden. V-...

Er den nærmeste, ikke den videre betydningen av ordet. Dermed svarte den psykologiske retningen, og spesielt den unge grammatikken, på mange spørsmål som stilte lingvistikken overfor på midten av 1800-tallet. Metodikken for komparativ historisk lingvistikk ble avklart, hovedproblemene med semasiologi og funksjonell-semantisk grammatikk ble stilt, forholdet mellom språk og tale ble analysert, ...

Kontakter", "Flerspråklighet i det sosiologiske aspektet". Deres studie er utført av sosiolingvistikk (sosiallingvistikk), som oppsto i skjæringspunktet mellom lingvistikk og sosiologi, samt etnolingvistikk, taleetnografi, stilistikk, retorikk, pragmatikk, teorien av språklig kommunikasjon, teorien om massekommunikasjon osv. Språk utfører følgende sosiale funksjoner i samfunnet: kommunikativ / informativ (...

Om seksjonene og sammensetningen av lingvistikk. De empirisk dannede delene av lingvistikken, som delvis krysser hverandre og derfor ikke danner et logisk enhetlig system, kan representeres som korrelerende med hverandre i henhold til noen forskjellige parametere. Generell lingvistikk og delvis språkvitenskap. De mest generelle og spesielle delene av lingvistikk skilles ut. En av hoveddelene av lingvistikk er teorien ...

Introduksjon

Kapittel 1. Historien om anvendelsen av matematiske metoder i lingvistikk

1.1. Dannelsen av strukturell lingvistikk ved overgangen til 1800- og 1900-tallet

1.2. Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre

Kapittel 2. Utvalgte eksempler på bruk av matematikk i lingvistikk

2.1. Maskinoversettelse

2.2.Statistiske metoder i språklæring

2.3. Å lære et språk ved hjelp av metoder for formell logikk

2.4. Utsikter for anvendelse av matematiske metoder i lingvistikk

Konklusjon

Litteratur

Vedlegg 1. Ronald Schleifer. Ferdinand de Saussure

Vedlegg 2. Ferdinand de Saussure (oversettelse)

Introduksjon

På 1900-tallet har det vært en kontinuerlig trend mot samspill og gjensidig gjennomtrenging av ulike kunnskapsfelt. Grensene mellom de enkelte vitenskapene viskes gradvis ut; det er flere og flere grener av mental aktivitet som er "i krysset" av humanitær, teknisk og naturvitenskapelig kunnskap.

Et annet åpenbart trekk ved moderniteten er ønsket om å studere strukturer og deres bestanddeler. Derfor får matematikken en økende plass, både i vitenskapsteori og i praksis. Ved å komme i kontakt på den ene siden med logikk og filosofi, på den andre siden med statistikk (og følgelig med samfunnsvitenskapene), trenger matematikken dypere og dypere inn i de områdene som lenge ble ansett for å være rent. "humanitær", utvider deres heuristiske potensiale (svaret på spørsmålet "hvor mye" vil ofte bidra til å svare på spørsmålene "hva" og "hvordan"). Lingvistikk var intet unntak.

Hensikten med kursarbeidet mitt er å kort belyse sammenhengen mellom matematikk og en slik gren av lingvistikk som lingvistikk. Siden 1950-tallet har matematikk blitt brukt i lingvistikk for å lage et teoretisk apparat for å beskrive strukturen til språk (både naturlige og kunstige). Imidlertid skal det sies at den ikke umiddelbart fant en slik praktisk anvendelse for seg selv. Opprinnelig begynte matematiske metoder i lingvistikk å bli brukt for å klargjøre de grunnleggende begrepene i lingvistikk, men med utviklingen av datateknologi begynte et slikt teoretisk premiss å finne anvendelse i praksis. Løsningen av oppgaver som maskinoversettelse, innhenting av maskininformasjon, automatisk tekstbehandling krevde en fundamentalt ny tilnærming til språket. Språkforskerne sto overfor spørsmålet: hvordan lære å representere språklige mønstre i den formen de kan brukes direkte på teknologi. Begrepet "matematisk lingvistikk", som er populært i vår tid, refererer til all lingvistisk forskning som bruker eksakte metoder (og begrepet eksakte metoder i vitenskap er alltid nært knyttet til matematikk). Noen forskere fra de siste årene mener at selve uttrykket ikke kan heves til rangering av et begrep, siden det ikke betyr noen spesiell "lingvistikk", men bare en ny retning fokusert på å forbedre, øke nøyaktigheten og påliteligheten til språkforskningsmetoder . Lingvistikk bruker både kvantitative (algebraiske) og ikke-kvantitative metoder, noe som bringer den nærmere matematisk logikk, og følgelig til filosofi, og til og med til psykologi. Til og med Schlegel bemerket samspillet mellom språk og bevissthet, og Ferdinand de Saussure, en fremtredende lingvist fra det tidlige tjuende århundre (jeg vil fortelle om hans innflytelse på utviklingen av matematiske metoder i lingvistikk senere), koblet strukturen til språket med dets tilhørighet. til folket. Den moderne forskeren L. Perlovsky går videre, og identifiserer de kvantitative egenskapene til språket (for eksempel antall kjønn, tilfeller) med særegenhetene ved den nasjonale mentaliteten (mer om dette i avsnitt 2.2, "Statistiske metoder i lingvistikk").

Samspillet mellom matematikk og lingvistikk er et mangefasettert tema, og i mitt arbeid vil jeg ikke dvele ved alle, men først og fremst ved de anvendte aspektene.

Kapittel I. Historie om anvendelsen av matematiske metoder i lingvistikk

1.1 Dannelsen av strukturell lingvistikk ved begynnelsen av XIX - XX århundrer

Den matematiske beskrivelsen av språket er basert på ideen om språk som en mekanisme, som går tilbake til den berømte sveitsiske lingvisten fra det tidlige tjuende århundre, Ferdinand de Saussure.

Den første koblingen til konseptet hans er teorien om språk som et system som består av tre deler (språket i seg selv er Språk, tale - passord, og taleaktivitet - Språk), der hvert ord (medlem av systemet) ikke anses i seg selv, men i forbindelse med andre medlemmer. Som en annen fremtredende lingvist, dansken Louis Hjelmslev, senere bemerket, var Saussure "den første som krevde en strukturell tilnærming til språket, det vil si en vitenskapelig beskrivelse av språket ved å registrere relasjonene mellom enheter."

Etter å ha forstått språk som en hierarkisk struktur, var Saussure den første som stilte problemet med verdien og betydningen av språkenheter. Separate fenomener og hendelser (for eksempel historien om opprinnelsen til individuelle indoeuropeiske ord) bør studeres ikke av seg selv, men i et system der de er korrelert med lignende komponenter.

Den strukturelle enheten til Saussure-språket betraktet ordet "tegn", der lyd og mening ble kombinert. Ingen av disse elementene eksisterer uten hverandre: derfor forstår morsmålet de ulike nyansene av betydningen av et polysemantisk ord som et separat element i den strukturelle helheten, i språket.

I teorien til F. de Saussure kan man således se samspillet mellom lingvistikk, på den ene siden, med sosiologi og sosialpsykologi (det bør bemerkes at samtidig utvikler Husserls fenomenologi, Freuds psykoanalyse, Einsteins relativitetsteori seg , pågår det eksperimenter med form og innhold i litteratur, musikk og kunst), på den annen side med matematikk (systemisitetsbegrepet tilsvarer det algebraiske språkbegrepet). Et slikt konsept endret begrepet språklig tolkning som sådan: Fenomener begynte å bli tolket ikke i forhold til årsakene til deres forekomst, men i forhold til nåtid og fremtid. Tolkning sluttet å være uavhengig av en persons intensjoner (til tross for at intensjoner kan være upersonlige, «ubevisste» i freudiansk betydning av ordet).

Funksjonen til den språklige mekanismen manifesteres gjennom taleaktiviteten til morsmål. Resultatet av talen er de såkalte "korrekte tekstene" - sekvenser av taleenheter som adlyder visse mønstre, hvorav mange tillater en matematisk beskrivelse. Teorien om måter å beskrive den syntaktiske strukturen på omhandler studiet av metoder for matematisk beskrivelse av korrekte tekster (primært setninger). I en slik struktur defineres språklige analogier ikke ved hjelp av deres iboende kvaliteter, men ved hjelp av systemmessige ("strukturelle") relasjoner.

I Vesten er Saussures ideer utviklet av de yngre samtidige til den store sveitsiske lingvisten: i Danmark - L. Hjelmslev, allerede nevnt av meg, som ga opphav til den algebraiske språkteorien i sitt arbeid "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tsjekkia - den russiske emigrantforskeren N. Trubetskoy.

Statistiske regelmessigheter i studiet av språk begynte å bli behandlet av ingen ringere enn grunnleggeren av genetikk, Georg Mendel. Det var først i 1968 at filologer oppdaget at han i de siste årene av sitt liv var fascinert av studiet av språklige fenomener ved hjelp av matematiske metoder. Mendel brakte denne metoden til lingvistikk fra biologien; på 1990-tallet var det bare de mest vågale lingvistene og biologene som hevdet gjennomførbarheten av en slik analyse. I arkivene til klosteret St. Tomasz i Brno, hvis abbed var Mendel, ble funnet ark med kolonner med etternavn som sluttet på "mann", "bauer", "mayer", og med noen brøker og beregninger. I et forsøk på å oppdage de formelle lovene for opprinnelsen til slektsnavn, gjør Mendel komplekse beregninger, der han tar hensyn til antall vokaler og konsonanter i det tyske språket, det totale antallet ord han vurderer, antall etternavn, etc.

I vårt land begynte den strukturelle lingvistikken å utvikle seg omtrent samtidig som i Vesten - ved overgangen til 1800- og 1900-tallet. Samtidig med F. de Saussure ble konseptet språk som et system utviklet i deres arbeider av professorer ved Kazan University F.F. Fortunatov og I.A. Baudouin de Courtenay. Sistnevnte korresponderte lenge med de Saussure, henholdsvis Genève- og Kazan-skolene for lingvistikk samarbeidet med hverandre. Hvis Saussure kan kalles ideologen for "eksakte" metoder innen lingvistikk, så la Baudouin de Courtenay det praktiske grunnlaget for deres anvendelse. Han var den første som skilte lingvistikk (som korrekt en vitenskap som bruker statistiske metoder og funksjonell avhengighet) fra filologi (et fellesskap av humanitære disipliner som studerer åndelig kultur gjennom språk og tale). Forskeren selv mente at "lingvistikk kan være nyttig i nær fremtid, bare frigjort fra den obligatoriske foreningen med filologi og litteraturhistorie". Fonologi ble "prøvegrunnen" for introduksjonen av matematiske metoder i lingvistikk - lyder som "atomer" i språksystemet, med et begrenset antall lett målbare egenskaper, var det mest hensiktsmessige materialet for formelle, strenge beskrivelsesmetoder. Fonologi benekter eksistensen av mening i lyd, så den "menneskelige" faktoren ble eliminert i studiene. I denne forstand er fonemer som fysiske eller biologiske objekter.

Fonemer, som de minste språklige elementene som er akseptable for persepsjon, representerer en egen sfære, en egen "fenomenologisk virkelighet". For eksempel på engelsk kan lyden "t" uttales annerledes, men i alle tilfeller vil en person som snakker engelsk oppfatte den som "t". Hovedsaken er at fonemet vil utføre sin viktigste - meningsfulle - funksjon. Dessuten er forskjellene mellom språk slik at varianter av en lyd på ett språk kan svare til forskjellige fonemer på et annet; for eksempel er "l" og "r" på engelsk forskjellige, mens de på andre språk er varianter av samme fonem (som det engelske "t", uttalt med eller uten aspirasjon). Det enorme vokabularet til ethvert naturlig språk er et sett med kombinasjoner av et mye mindre antall fonemer. På engelsk, for eksempel, brukes bare 40 fonemer til å uttale og skrive omtrent en million ord.

Lydene til et språk er et systematisk organisert sett med funksjoner. På 1920-1930-tallet, etter Saussure, pekte Jacobson og N.S. Trubetskoy ut de "særeegenskapene" til fonemer. Disse funksjonene er basert på strukturen til taleorganene - tunge, tenner, stemmebånd. For eksempel på engelsk er forskjellen mellom "t" og "d" tilstedeværelsen eller fraværet av en "stemme" (spenningen i stemmebåndene) og stemmenivået som skiller ett fonem fra et annet. Dermed kan fonologi betraktes som et eksempel på den generelle språkregelen beskrevet av Saussure: «Det er bare forskjeller i språk». Enda viktigere er ikke dette: forskjellen innebærer vanligvis de nøyaktige forholdene den befinner seg mellom; men i språket er det bare forskjeller uten presise betingelser. Enten vi vurderer «betegnelse» eller «betegnet» – i språket er det verken begreper eller lyder som ville eksistert før utviklingen av språksystemet.

I saussureansk lingvistikk blir det studerte fenomenet forstått som et sett med sammenligninger og motsetninger av språk. Språk er både et uttrykk for ordenes betydning og et kommunikasjonsmiddel, og disse to funksjonene faller aldri sammen. Vi kan legge merke til vekslingen mellom form og innhold: språklige kontraster definerer dens strukturelle enheter, og disse enhetene samhandler for å skape et visst meningsfullt innhold. Siden elementene i språket er tilfeldige, kan verken kontrast eller kombinasjon være grunnlaget. Dette betyr at i et språk danner særtrekk en fonetisk kontrast på et annet forståelsesnivå, fonemer kombineres til morfemer, morfemer - til ord, ord - til setninger osv. I alle fall et helt fonem, ord, setning osv. er mer enn bare summen av delene.

Saussure foreslo ideen om en ny vitenskap fra det tjuende århundre, atskilt fra lingvistikk, og studerte rollen til tegn i samfunnet. Saussure kalte denne vitenskapen semiologi (fra gresk "semeîon" - et tegn). "Vitenskapen" om semiotikk, som utviklet seg i Øst-Europa på 1920- og 1930-tallet og i Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære funn sammensatt (eller artikulert) i form av disse strukturene. I tillegg, i skumringen av karrieren, parallelt med kurset i generell lingvistikk, engasjerte Saussure seg i en "semiotisk" analyse av senromersk poesi, og prøvde å oppdage bevisst komponerte anagrammer av egennavn. Denne metoden var på mange måter det motsatte av rasjonalisme i dens språklige analyse: den var et forsøk på å studere i et system problemet med "sannsynlighet" i språk. Slik forskning bidrar til å fokusere på den «virkelige siden» av sannsynlighet; «stikkordet» som Saussure leter etter et anagram for, er ifølge Jean Starobinsky «et verktøy for poeten, ikke kilden til diktets liv». Diktet tjener til å bytte ut lydene til nøkkelordet. I følge Starobinsky fordyper ikke Saussure i denne analysen søket etter skjulte betydninger. Tvert imot, i hans verk er et ønske om å unngå spørsmål knyttet til bevissthet merkbart: «siden poesi ikke bare uttrykkes i ord, men også i det disse ordene gir opphav til, går den utenfor bevissthetens kontroll og avhenger kun av språkets lover» (se . Vedlegg 1).

Saussures forsøk på å studere egennavn i senromersk poesi understreker en av komponentene i hans språklige analyse – tegnenes vilkårlige natur, samt den formelle essensen av Saussures språkvitenskap, som utelukker muligheten for å analysere mening. Todorov konkluderer med at verkene til Saussure i dag ser ut til å være ekstremt konsistente i deres motvilje mot å studere symbolene på et fenomen som har en klart definert betydning [vedlegg 1]. Ved å utforske anagrammer, legger Saussure kun hensyn til repetisjon, men ikke til tidligere alternativer. . . . Ved å studere Nibelungenlied, definerer han symbolene bare for å tilordne dem til feilavlesninger: hvis de er utilsiktede, eksisterer ikke symbolene. Tross alt, i sine skrifter om generell lingvistikk, gjør han antagelsen om eksistensen av en semiologi som ikke bare beskriver språklige tegn; men denne antakelsen er begrenset av det faktum at semiologi bare kan beskrive tilfeldige, vilkårlige tegn.

Hvis dette virkelig er slik, er det bare fordi han ikke kunne forestille seg "intensjon" uten et objekt; han klarte ikke helt å bygge bro mellom form og innhold – i hans forfatterskap ble dette til et spørsmål. I stedet vendte han seg mot «språklig legitimitet». Mellom på den ene siden nittende århundres begreper basert på historie og subjektive formodninger, og metoder for tilfeldig tolkning basert på disse begrepene, og på den annen side strukturalistiske begreper som sletter motsetningen mellom form og innhold (subjekt og objekt), mening og opprinnelse i strukturalisme, psykoanalyse og til og med kvantemekanikk - skriftene til Ferdinand de Saussure om lingvistikk og semiotikk markerer et vendepunkt i studiet av betydninger i språk og kultur.

Russiske forskere var også representert på den første internasjonale kongressen for lingvister i Haag i 1928. S. Kartsevsky, R. Yakobson og N. Trubetskoy laget en rapport som undersøkte den hierarkiske strukturen til språket - i ånden til de mest moderne ideene for begynnelsen av forrige århundre. Jakobson utviklet i sine skrifter Saussures ideer om at de grunnleggende elementene i et språk først og fremst bør studeres i forbindelse med deres funksjoner, og ikke med årsakene til deres forekomst.

Dessverre, etter at Stalin kom til makten i 1924, blir russisk lingvistikk, som mange andre vitenskaper, kastet tilbake. Mange talentfulle vitenskapsmenn ble tvunget til å emigrere, ble utvist fra landet eller døde i leire. Først siden midten av 1950-tallet har en viss pluralisme av teorier blitt mulig – mer om dette i avsnitt 1.2.

1.2 Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre

Ved midten av det tjuende århundre hadde fire verdensspråklige skoler dannet seg, som hver viste seg å være stamfaren til en viss "nøyaktig" metode. Leningrad fonologiske skole(forfaderen var en student av Baudouin de Courtenay L.V. Shcherba) brukte et psykolingvistisk eksperiment basert på analysen av talen til morsmål som hovedkriteriet for å generalisere lyd i form av et fonem.

Forskere Praha språksirkel, spesielt - grunnleggeren N.S. Trubetskoy, som emigrerte fra Russland, utviklet teorien om opposisjoner - den semantiske strukturen til språket ble beskrevet av dem som et sett med opposisjonelt konstruerte semantiske enheter - Sem. Denne teorien ble brukt i studiet av ikke bare språk, men også kunstnerisk kultur.

Ideologer Amerikansk deskriptivisme var lingvistene L. Bloomfield og E. Sapir. Språk ble presentert for deskriptivister som et sett med taleutsagn, som var hovedobjektet for deres studie. Deres fokus var på reglene for vitenskapelig beskrivelse (derav navnet) av tekster: studiet av organisering, arrangement og klassifisering av elementene deres. Formalisering av analytiske prosedyrer innen fonologi og morfologi (utvikling av prinsipper for studiet av språk på forskjellige nivåer, distributiv analyse, metoden for direkte bestanddeler, etc.) førte til utformingen av generelle spørsmål om språklig modellering. Uoppmerksomhet på planen for språkets innhold, så vel som den paradigmatiske siden av språket, tillot ikke deskriptivister å tolke språket som et system fullt nok.

På 1960-tallet utviklet teorien om formell grammatikk seg, som hovedsakelig oppsto på grunn av arbeidet til den amerikanske filosofen og språkforskeren N. Chomsky. Han regnes med rette som en av de mest kjente moderne vitenskapsmenn og offentlige personer, mange artikler, monografier og til og med en dokumentar i full lengde er viet til ham. Med navnet på en fundamentalt ny måte å beskrive den syntaktiske strukturen oppfunnet av Chomsky - generativ (genererende) grammatikk - ble den tilsvarende trenden i lingvistikk kalt generativisme.

Chomsky, en etterkommer av innvandrere fra Russland, studerte lingvistikk, matematikk og filosofi ved University of Pennsylvania siden 1945, og ble sterkt påvirket av sin lærer Zelig Harris - i likhet med Harris, betraktet Chomsky og anser fortsatt sine politiske synspunkter nær anarkisme (han er fortsatt kjent som kritiker av det eksisterende amerikanske politiske systemet og som en av anti-globalismens åndelige ledere).

Chomskys første store vitenskapelige arbeid, masteroppgave "Morphology of Modern Hebrew » (1951) har forblitt upublisert. Chomsky tok doktorgraden fra University of Pennsylvania i 1955, men mye av forskningen som lå til grunn for avhandlingen hans (publisert i sin helhet først i 1975 under tittelen The Logical Structure of Linguistic Theory) og hans første monografi, Syntactic Structures (1957, Rus. trans. . 1962), ble fremført ved Harvard University i 1951-1955. I samme 1955 flyttet forskeren til Massachusetts Institute of Technology, hvor han ble professor i 1962.

Chomskys teori har gått gjennom flere stadier i utviklingen.

I den første monografien "Syntactic Structures" presenterte forskeren språket som en mekanisme for å generere et uendelig sett med setninger ved å bruke et begrenset sett med grammatiske virkemidler. For å beskrive språklige egenskaper foreslo han begrepene dype (skjult fra direkte persepsjon og generert av et system med rekursive, dvs. kan brukes gjentatte ganger, regler) og overflate (direkte oppfattet) grammatiske strukturer, samt transformasjoner som beskriver overgangen fra dype strukturer til overflatestrukturer. Flere overflatestrukturer kan tilsvare en dyp struktur (for eksempel en passiv struktur Dekretet er signert av presidenten avledet fra den samme dype strukturen som den aktive konstruksjonen Presidenten undertegner dekretet) og omvendt (dermed tvetydigheten mor elsker datter beskrevet som et resultat av et sammentreff av overflatestrukturer som går tilbake til to forskjellige dype, hvor den ene er den som elsker datteren, og i den andre den som er elsket av datteren).

Chomskys standardteori anses å være "Aspects"-modellen som er fremsatt i Chomskys bok "Aspects of the Theory of Syntax". I denne modellen ble for første gang regler for semantisk tolkning introdusert i formell teori, som tilskrev mening til dype strukturer. I Aspects står språklig kompetanse i motsetning til bruk av språk (performance), den såkalte Katz-Postal-hypotesen om bevaring av mening under transformasjon tas i bruk, i forbindelse med hvilken begrepet valgfri transformasjon er utelukket, og et apparat av syntaktiske funksjoner som beskriver leksikalsk kompatibilitet introduseres.

På 1970-tallet arbeidet Chomsky med teorien om kontroll og binding (GB-teori - fra ordene Myndighetene Og bindende) er mer generell enn den forrige. I den forlot forskeren de spesifikke reglene som beskriver de syntaktiske strukturene til spesifikke språk. Alle transformasjoner er erstattet med én universell bevegelsestransformasjon. Innenfor rammen av GB-teorien finnes det også private moduler som hver står for sin del av grammatikken.

Allerede nylig, i 1995, la Chomsky frem et minimalistisk program, der menneskelig språk beskrives som maskinspråk. Dette er bare et program - ikke en modell eller en teori. I den identifiserer Chomsky to hovedundersystemer av det menneskelige språkapparatet: leksikonet og datasystemet, samt to grensesnitt - fonetisk og logisk.

Chomskys formelle grammatikker har blitt klassiske for å beskrive ikke bare naturlige, men også kunstige språk - spesielt programmeringsspråk. Utviklingen av strukturell lingvistikk i andre halvdel av 1900-tallet kan med rette betraktes som en "chomskisk revolusjon".

Moskva fonologiske skole, hvis representanter var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, brukte en lignende teori for å studere fonetikk. Gradvis begynner "eksakte" metoder å bli brukt med hensyn til ikke bare fonetikk, men også syntaks. Både lingvister og matematikere, både her og i utlandet, begynner å studere språkets struktur. På 1950- og 60-tallet begynte et nytt stadium i samspillet mellom matematikk og lingvistikk i USSR, assosiert med utviklingen av maskinoversettelsessystemer.

Drivkraften for begynnelsen av disse verkene i vårt land var den første utviklingen innen maskinoversettelse i USA (selv om den første mekaniserte oversettelsesenheten av P.P. Smirnov-Troyansky ble oppfunnet i USSR i 1933, den var primitiv, ble ikke utbredt). I 1947 kom A. Butt og D. Britten med en kode for ord-for-ord-oversettelse ved hjelp av en datamaskin, et år senere foreslo R. Richens en regel for å dele ord i stammer og endelser i maskinoversettelse. Disse årene var ganske annerledes enn i dag. Dette var veldig store og dyre maskiner som tok opp hele rom og krevde en stor stab av ingeniører, operatører og programmerere for å vedlikeholde dem. I utgangspunktet ble disse datamaskinene brukt til å utføre matematiske beregninger for behovene til militære institusjoner - det nye innen matematikk, fysikk og teknologi tjente først og fremst militære anliggender. I de tidlige stadiene ble utviklingen av MP aktivt støttet av militæret, mens (under forholdene under den kalde krigen) utviklet den russisk-engelske retningen seg i USA, og den anglo-russiske retningen i USSR.

I januar 1954 fant "Georgetown-eksperimentet" sted ved Massachusetts Technical University - den første offentlige demonstrasjonen av oversettelse fra russisk til engelsk på IBM-701-maskinen. Sammendrag av meldingen om den vellykkede gjennomgangen av eksperimentet, laget av D.Yu. Panov, dukket opp i RJ "Mathematics", 1954, nr. 10: "Oversettelse fra ett språk til et annet ved hjelp av en maskin: en rapport om den første vellykkede testen."

D. Yu. Panov (den gang direktør for Institute of Scientific Information - INI, senere VINITI) tiltrakk seg I. K. Belskaya, som senere ledet maskinoversettelsesgruppen ved Institute of Precise Mathematics and Computer Engineering ved USSR Academy of Sciences, til å arbeid med maskinoversettelse. Ved slutten av 1955 dateres den første erfaringen med å oversette fra engelsk til russisk ved hjelp av BESM-maskinen tilbake. Programmer for BESM ble satt sammen av N.P. Trifonov og L.N. Korolev, hvis doktorgradsavhandling var viet metoder for å konstruere ordbøker for maskinoversettelse.

Parallelt ble det utført arbeid med maskinoversettelse ved Institutt for anvendt matematikk ved Mathematical Institute of USSR Academy of Sciences (nå M.V. Keldysh Institute of Applied Mathematics ved det russiske vitenskapsakademiet). Etter initiativ fra matematikeren A.A. Lyapunov. Han involverte O.S. Kulagin og hennes studenter T.D. Wentzel og N.N. Ricco. Ideene til Lyapunov og Kulagina om muligheten for å bruke teknologi til å oversette fra ett språk til et annet ble publisert i tidsskriftet Nature, 1955, nr. 8. Fra slutten av 1955 ble T.N. Moloshnaya, som deretter begynte uavhengig arbeid med den engelsk-russiske oversettelsesalgoritmen.

R. Frumkina, som på den tiden var engasjert i oversettelsesalgoritmen fra spansk, husker at det på dette stadiet av arbeidet var vanskelig å ta noen konsekvente skritt. Mye oftere måtte jeg følge den heuristiske opplevelsen - min egen eller kolleger.

Den første generasjonen av maskinoversettelsessystemer var imidlertid svært ufullkomne. Alle var basert på sekvensielle oversettelsesalgoritmer "ord for ord", "frase for frase" - semantiske sammenhenger mellom ord og setninger ble ikke tatt i betraktning på noen måte. For eksempel er setningene: John lette etter lekeboksen sin.Til slutt fant han det. Boksen lå i pennen.John var veldig glad. (John lette etter lekeboksen sin. Til slutt fant han den. Boksen lå i lekegrind. John var veldig fornøyd.) "Penn" i denne sammenhengen er ikke en "penn" (skriveverktøy), men en "lekegrind" ( leke-penn). Kunnskap om synonymer, antonymer og figurative betydninger er vanskelig å legge inn i en datamaskin. En lovende retning var utviklingen av datasystemer fokusert på bruk av en menneskelig oversetter.

Over tid ble direkte oversettelsessystemer erstattet av T-systemer (fra det engelske ordet "transfer" - transformasjon), der oversettelse ble utført på nivå med syntaktiske strukturer. Algoritmene til T-systemer brukte en mekanisme som gjorde det mulig å bygge en syntaktisk struktur i henhold til grammatikkreglene for språket i inngangssetningen (ligner på hvordan et fremmedspråk undervises på videregående), og deretter syntetisere utgangssetningen ved å transformere den syntaktiske strukturen og erstatte de nødvendige ordene fra ordboken.

Lyapunov snakket om oversettelse ved å trekke ut betydningen av den oversatte teksten og presentere den på et annet språk. Tilnærmingen til å bygge maskinoversettelsessystemer basert på å oppnå den semantiske representasjonen av inngangssetningen ved semantisk analyse og syntese av inngangssetningen i henhold til den oppnådde semantiske representasjonen anses fortsatt som den mest perfekte. Slike systemer kalles I-systemer (fra ordet "interlingua"). Oppgaven med å lage dem, satt tilbake på slutten av 50-tallet og begynnelsen av 60-tallet, har imidlertid ikke blitt fullstendig løst så langt, til tross for innsatsen fra International Federation of IFIP - verdenssamfunnet av forskere innen informasjonsbehandling.

Forskere tenkte på hvordan man formaliserer og bygger algoritmer for å jobbe med tekster, hvilke ordbøker som skal legges inn i maskinen, hvilke språklige mønstre som skal brukes i maskinoversettelse. Tradisjonell lingvistikk hadde ikke slike ideer – ikke bare når det gjelder semantikk, men også når det gjelder syntaks. På den tiden var det ingen lister over syntaktiske konstruksjoner for noe språk, betingelsene for deres kompatibilitet og utskiftbarhet ble ikke studert, reglene for å konstruere store enheter av syntaktisk struktur fra mindre bestanddeler ble ikke utviklet.

Behovet for å skape det teoretiske grunnlaget for maskinoversettelse førte til dannelsen og utviklingen av matematisk lingvistikk. Den ledende rollen i denne saken i USSR ble spilt av matematikerne A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ble viet studiet av den formelle teorien om grammatikk (samtidig med N. Khomsky i USA), Kuznetsov la frem oppgaven med aksiomatisering av lingvistikk, som går tilbake til verkene til F.F. Fortunatov.

mai 1960 ble dekretet fra presidiet til USSR Academy of Sciences "Om utvikling av strukturelle og matematiske metoder for studiet av språk" vedtatt, og de tilsvarende avdelingene ble opprettet ved Institute of Linguistics og Institute of det russiske språket. Siden 1960 begynte landets ledende humanitære universiteter - Fakultet for filologi ved Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​- å trene personell innen automatisk tekstbehandling.

Imidlertid er maskinoversettelsesverk fra denne perioden, kalt "klassisk", av teoretisk snarere enn praktisk interesse. Kostnadseffektive maskinoversettelsessystemer begynte å bli opprettet først på åttitallet av forrige århundre. Jeg vil snakke om dette senere i avsnitt 2.1, Maskinoversettelse.

1960-70-tallet inkluderer dyp teoretisk utvikling ved bruk av metodene for settteori og matematisk logikk, som feltteori og fuzzy set-teori.

Forfatteren av feltteori i lingvistikk var den sovjetiske poeten, oversetteren og lingvisten V.G. Admoni. Han utviklet først teorien sin på grunnlag av det tyske språket. For Admoni betegner konseptet "felt" et vilkårlig ikke-tomt sett med språklige elementer (for eksempel "leksikalsk felt", "semantisk felt").

Strukturen til feltet er heterogen: den består av en kjerne, hvis elementer har et komplett sett med funksjoner som definerer et sett, og en periferi, hvis elementer kan ha begge egenskapene til et gitt sett (ikke alle) og naboene. Jeg vil gi et eksempel som illustrerer denne påstanden: for eksempel, på engelsk, er feltet med sammensatte ord ("dagdrøm" - "drøm" vanskelig å skille fra feltet med uttrykk ("tåregass" - "tåregass"). .

Teorien om uklare sett som allerede er nevnt ovenfor er nært knyttet til feltteori. I USSR har lingvister V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dens stamfar var den amerikanske matematikeren L. Zadeh, som i 1965 publiserte artikkelen "Fuzzy Logic". Zade ga en matematisk begrunnelse for teorien om uklare sett, og vurderte dem på grunnlag av språklig materiale.

I denne teorien snakker vi ikke så mye om tilhørigheten av elementer til et gitt sett (АОа), som om graden av dette medlemskapet (mАОа), siden perifere elementer kan tilhøre flere felt i en eller annen grad. Zade (Lofti-zade) var opprinnelig fra Aserbajdsjan, frem til han var 12 år hadde han praksisen med å kommunisere på fire språk - aserbajdsjansk, russisk, engelsk og persisk - og brukte tre forskjellige alfabeter: kyrillisk, latin, arabisk. Når en vitenskapsmann blir spurt om hva som er felles mellom teorien om uklare sett og lingvistikk, benekter han ikke denne sammenhengen, men presiserer: «Jeg er ikke sikker på at studiet av disse språkene hadde stor innflytelse på min tenkning. Hvis dette var tilfelle, så bare ubevisst. I sin ungdom studerte Zadeh ved en presbyteriansk skole i Teheran, og etter andre verdenskrig emigrerte han til USA. "Spørsmålet er ikke om jeg er en amerikaner, russer, aserbajdsjan eller noen andre," sa han i en av samtalene, "jeg er formet av alle disse kulturene og folkene og føler meg ganske komfortabel blant hver av dem." I disse ordene er det noe som ligner på det som kjennetegner teorien om fuzzy sets - et avvik fra entydige definisjoner og skarpe kategorier.

I vårt land, på 70-tallet, ble verkene til vestlige lingvister fra det tjuende århundre oversatt og studert. I.A. Melchuk oversatte verkene til N. Chomsky til russisk. PÅ. Slyusareva i sin bok "The Theory of F. de Saussure in the Light of Modern Linguistics" kobler postulatene til Saussures lære med de faktiske problemene innen lingvistikk på 70-tallet. Det er en tendens til ytterligere matematisering av lingvistikk. De ledende innenlandske universitetene trener personell i spesialiteten "Matematisk (teoretisk, anvendt) lingvistikk". Samtidig er det i Vesten et kraftig sprang i utviklingen av datateknologi, som krever stadig flere nye språklige grunnlag.

På 1980-tallet ble professor ved Institute of Oriental Studies ved Academy of Sciences Yu.K. Lekomtsev, mens han analyserer språket i lingvistikk gjennom analyse av skjemaer, tabeller og andre typer notasjon som brukes i språklige beskrivelser, vurderer matematiske systemer som egner seg for disse formålene (hovedsakelig systemer av matrisealgebra).

Således, gjennom det tjuende århundre, var det en konvergens mellom det eksakte og humaniora. Samspillet mellom matematikk og lingvistikk fikk i økende grad praktiske anvendelser. Mer om dette i neste kapittel.

Kapittel 2. Utvalgte eksempler på bruk av matematikk i lingvistikk

2.1 Maskinoversettelse

Ideen om å oversette fra ett språk til et annet ved hjelp av en universell mekanisme oppsto flere århundrer før den første utviklingen på dette området begynte - tilbake i 1649 foreslo Rene Descartes ideen om et språk der de tilsvarende ideene til forskjellige språk vil bli uttrykt med ett symbol. De første forsøkene på å implementere denne ideen på 1930-40-tallet, begynnelsen av den teoretiske utviklingen i midten av århundret, forbedringen av oversettelsessystemer ved hjelp av teknologi på 1970-80-tallet, den raske utviklingen av oversettelsesteknologi i det siste tiår - dette er stadiene i utviklingen av maskinoversettelse som industri. Det er fra arbeidet med maskinoversettelse at datalingvistikk som vitenskap har vokst.

Med utviklingen av datateknologi på slutten av 70-tallet og begynnelsen av 80-tallet satte forskere seg mer realistiske og kostnadseffektive mål – maskinen ble ikke en konkurrent (som tidligere antatt), men en assistent for en menneskelig oversetter. Maskinoversettelse slutter å tjene utelukkende militære oppgaver (alle sovjetiske og amerikanske oppfinnelser og forskning, primært fokusert på russisk og engelsk, bidro til den kalde krigen på en eller annen måte). I 1978 ble ord over naturlig språk overført over det sammenkoblede Arpa-nettverket, og seks år senere dukket de første mikrodaopp i USA.

På 70-tallet kjøpte EU-kommisjonen den engelsk-franske versjonen av Systran-dataoversetteren, og bestiller også den fransk-engelske og italiensk-engelske versjonen, og det russisk-til-engelsk oversettelsessystemet som brukes av de amerikanske væpnede styrker. Slik ble grunnlaget for EUROTRA-prosjektet lagt.

Om gjenopplivingen av maskinoversettelse på 70-80-tallet. følgende fakta vitner: Kommisjonen for De europeiske fellesskap (CEC) kjøper den engelsk-franske versjonen av Systran, samt oversettelsessystemet fra russisk til engelsk (sistnevnte utviklet etter ALPAC-rapporten og fortsatte å bli brukt av US Air Force og NASA); i tillegg beordrer CEC utviklingen av de fransk-engelske og italiensk-engelske versjonene. Samtidig er det en rask utvidelse av maskinoversettelsesaktiviteter i Japan; i USA beordrer Pan American Health Organization (PAHO) utviklingen av en spansk-engelsk retning (SPANAM-system); US Air Force finansierer utviklingen av et maskinoversettelsessystem ved Linguistic Research Center ved University of Texas i Austin; TAUM-gruppen i Canada gjør bemerkelsesverdige fremskritt i utviklingen av deres METEO-system (meteorologisk oversettelse). En rekke prosjekter startet på 70- og 80-tallet. senere utviklet til fullverdige kommersielle systemer.

I perioden 1978-93 ble det brukt 20 millioner dollar på forskning innen maskinoversettelse i USA, 70 millioner i Europa og 200 millioner i Japan.

En av de nye utviklingene er TM-teknologien (oversettelsesminne), som fungerer etter akkumuleringsprinsippet: under oversettelsesprosessen lagres det originale segmentet (setningen) og oversettelsen, noe som resulterer i dannelsen av en språklig database; hvis et identisk eller lignende segment blir funnet i den nylig oversatte teksten, vises det sammen med oversettelsen og en indikasjon på prosentandelen. Oversetteren tar deretter en beslutning (om å redigere, avvise eller godta oversettelsen), hvis resultat lagres av systemet, så det er ikke nødvendig å oversette den samme setningen to ganger. Et velkjent kommersielt system basert på TM-teknologi er for tiden utviklet av TRADOS-systemet (grunnlagt i 1984).

For tiden utvikler flere dusin selskaper kommersielle maskinoversettelsessystemer, inkludert: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata programvare; Linguistica b.v. og andre Nå kan du bruke tjenestene til automatiske oversettere direkte på nettet: alphaWorks; PROMTs onlineoversetter; LogoMedia.net; AltaVistas Babel Fish-oversettelsestjeneste; InfiniT.com; Oversettelse av Internett.

Kommersielt effektive oversettelsessystemer dukket opp i andre halvdel av 80-tallet også i vårt land. Selve konseptet med maskinoversettelse har utvidet seg (det begynte å inkludere "opprettelsen av en rekke automatiske og automatiserte systemer og enheter som automatisk eller halvautomatisk utfører hele oversettelsessyklusen eller individuelle oppgaver i en dialog med en person"), og statlige bevilgninger til utvikling av denne næringen har økt.

Russisk, engelsk, tysk, fransk og japansk ble hovedspråkene i innenlandske oversettelsessystemer. All-Union Translation Center (VTsP) utviklet et system for å oversette fra engelsk og tysk til russisk på en datamaskin ES-1035-ANRAP. Den besto av tre ordbøker - input engelsk og tysk og utgang russisk - under en enkelt programvare. Det var flere utskiftbare spesialiserte ordbøker - for datateknologi, programmering, radioelektronikk, maskinteknikk, landbruk, metallurgi. Systemet kunne fungere i to moduser - automatisk og interaktivt, når skjermen viste kildeteksten og oversettelsen per setning, som en person kunne redigere. Hastigheten på å oversette tekst til ANRAP (fra begynnelsen av skrivingen til slutten av utskriften) var omtrent 100 sider per time.

I 1989 ble det opprettet en familie av kommersielle oversettere av typen SPRINT, som jobbet med russisk, engelsk, tysk og japansk. Deres største fordel var deres kompatibilitet med IBM PC - dermed nådde innenlandske maskinoversettelsessystemer det internasjonale kvalitetsnivået. Samtidig utvikles et system for maskinoversettelse fra fransk til russisk FRAP, som inkluderer 4 stadier av tekstanalyse: grafematisk, morfologisk, syntaktisk og semantisk. I LGPI dem. Herzen, arbeidet var i gang med et firespråklig (engelsk, fransk, spansk, russisk) SILOD-MP-system (engelsk-russiske og fransk-russiske ordbøker ble brukt i industriell modus.

For spesialisert oversettelse av tekster om elektroteknikk eksisterte ETAP-2-systemet. Analysen av inputteksten i den ble utført på to nivåer - morfologisk og syntaktisk. ETAP-2-ordboken inneholdt omtrent 4 tusen oppføringer; stadiet for teksttransformasjon - omtrent 1000 regler (96 generelle, 342 private, resten er ordbok). Alt dette sikret en tilfredsstillende kvalitet på oversettelsen (f.eks. ble tittelen på patentet "Optical phase grid arrangement and coupling device having an such arrangement" oversatt til "En optisk fasenettanordning og en tilkoblingsanordning med en slik enhet" - til tross for tautologi, betydningen er bevart).

Ved Minsk Pedagogical Institute of Foreign Languages, på grunnlag av den engelsk-russiske ordboken for ordformer og fraser, ble et system for maskinoversettelse av titler oppfunnet, ved Institute of Oriental Studies of the Academy of Sciences - et system for oversettelse fra japansk til russisk. Den første automatiske vokabular- og terminologitjenesten (SLOTHERM) for databehandling og programmering, opprettet ved Moscow Research Institute of Automation Systems, inneholdt omtrent 20 000 termer i en forklarende ordbok og spesielle ordbøker for språklig forskning.

Maskinoversettelsessystemer begynte gradvis å bli brukt, ikke bare til det tiltenkte formålet, men også som en viktig komponent i automatiske læringssystemer (for undervisning i oversettelse, stavekontroll og grammatisk kunnskap).

90-tallet førte med seg den raske utviklingen av PC-markedet (fra desktop til lomme) og informasjonsteknologi, den utbredte bruken av Internett (som blir mer internasjonal og flerspråklig). Alt dette gjorde videreutvikling av automatiserte oversettelsessystemer etterspurt. Siden tidlig på 1990-tallet Innenlandske utviklere går også inn på PC-systemmarkedet.

I juli 1990 ble det første kommersielle maskinoversettelsessystemet i Russland kalt PROMT (PROgrammer's Machine Translation) presentert på PC Forum i Moskva. PROMT vant NASA-anbudet for levering av MP-systemer (PROMT var det eneste ikke-amerikanske selskapet i dette I 1992 ga PROMT ut en hel familie av systemer under det nye navnet STYLUS for oversettelse fra engelsk, tysk, fransk, italiensk og spansk til russisk og fra russisk til engelsk, og verdens første maskinoversettelsessystem for Windows ble opprettet på grunnlaget for STYLUS i 1993. I 1994 ble STYLUS 2.0 utgitt for Windows 3.X/95/NT, og i 1995-1996 tredje generasjon maskinoversettelsessystemer, fullt 32-bits STYLUS 3.0 for Windows 95/NT, mens utviklingen av helt nye, verdens første russisk-tyske og russisk-franske maskinoversettelsessystemer ble vellykket fullført.

I 1997 ble det signert en avtale med det franske selskapet Softissimo om opprettelse av oversettelsessystemer fra fransk til tysk og engelsk og omvendt, og i desember i år ble verdens første tysk-franske oversettelsessystem utgitt. Samme år ga PROMT-selskapet ut et system implementert ved hjelp av Gigant-teknologien, som støtter flere språkretninger i ett skall, samt en spesiell oversetter for å jobbe på Internett WebTranSite.

I 1998 ble en hel konstellasjon av programmer utgitt under det nye navnet PROMT 98. Et år senere ga PROMT ut to nye produkter: en unik programvarepakke for arbeid på Internett - PROMT Internet, og en oversetter for bedriftspostsystemer - PROMT Mail Oversetter. I november 1999 ble PROMT anerkjent som det beste maskinoversettelsessystemet testet av det franske magasinet PC Expert, og utkonkurrerte sine konkurrenter med 30 prosent. Det er også utviklet spesielle serverløsninger for bedriftskunder - bedriftens oversettelsesserver PROMT Translation Server (PTS) og Internett-løsningen PROMT Internet Translation Server (PITS). I 2000 oppdaterte PROMT hele serien med programvareprodukter ved å gi ut en ny generasjon MT-systemer: PROMT Translation Office 2000, PROMT Internet 2000 og Magic Gooddy 2000.

Online oversettelse med støtte fra PROMT-systemet brukes på en rekke innenlandske og utenlandske nettsteder: PROMTs Online Translator, InfiniT.com, Translate.Ru, Lycos, etc., samt i institusjoner med forskjellige profiler for å oversette forretningsdokumenter, artikler og brev (det er oversettelsessystemer bygget direkte inn i Outlook Express og andre e-postklienter).

I dag dukker det opp nye maskinoversettelsesteknologier basert på bruk av kunstige intelligenssystemer og statistiske metoder. Om sistnevnte - i neste avsnitt.

2.2 Statistiske metoder i språkopplæring

Betydelig oppmerksomhet i moderne lingvistikk er gitt til studiet av språklige fenomener ved bruk av metodene for kvantitativ matematikk. Kvantitative data bidrar ofte til en dypere forståelse av fenomenene som studeres, deres plass og rolle i systemet av relaterte fenomener. Svaret på spørsmålet "hvor mye" hjelper til med å svare på spørsmålene "hva", "hvordan", "hvorfor" - slik er det heuristiske potensialet til en kvantitativ egenskap.

Statistiske metoder spiller en betydelig rolle i utviklingen av maskinoversettelsessystemer (se avsnitt 2.1). I den statistiske tilnærmingen vurderes oversettelsesproblemet i form av en støyende kanal. Tenk deg at vi må oversette en setning fra engelsk til russisk. Noisy channel-prinsippet gir oss følgende forklaring på forholdet mellom en engelsk og en russisk setning: en engelsk setning er ikke annet enn en russisk setning forvrengt av en slags støy. For å gjenopprette den opprinnelige russiske setningen, må vi vite hva folk vanligvis sier på russisk og hvordan russiske setninger forvrenges til engelsk. Oversettelsen utføres ved å søke etter en slik russisk setning som maksimerer produktene av den ubetingede sannsynligheten for den russiske setningen og sannsynligheten for den engelske setningen (original) gitt den gitte russiske setningen. I følge Bayes' teorem er denne russiske setningen den mest sannsynlige oversettelsen av engelsk:

der e er oversettelsessetningen og f er den opprinnelige setningen

Så vi trenger en kildemodell og en kanalmodell, eller en språkmodell og en oversettelsesmodell. Språkmodellen må tildele en sannsynlighetsscore til enhver setning på målspråket (i vårt tilfelle russisk), og oversettelsesmodellen til den opprinnelige setningen. (se tabell 1)

Generelt fungerer et maskinoversettelsessystem i to moduser:

1. Systemtrening: et opplæringskorpus av parallelle tekster tas, og ved hjelp av lineær programmering søkes det etter slike verdier av ovesom maksimerer sannsynligheten for (for eksempel) den russiske delen av korpuset med tilgjengelig engelsk iht. til den valgte oversettelsesmodellen. En modell av det russiske språket er bygget på den russiske delen av samme korpus.

2. Utnyttelse: basert på dataene innhentet for en ukjent engelsk setning, søkes det etter en russisk som maksimerer produktet av sannsynlighetene tildelt av språkmodellen og oversettelsesmodellen. Programmet som brukes for et slikt søk kalles en dekoder.

Den enkleste statistiske oversettelsesmodellen er den bokstavelige oversettelsesmodellen. Denne modellen forutsetter at for å oversette en setning fra ett språk til et annet, er det nok å oversette alle ordene (lag en "pose med ord"), og modellen vil gi deres plassering i riktig rekkefølge. For å redusere P( a, f | e) til P(a | e, f), dvs. sannsynligheter for en gitt justering gitt et par setninger, er hver sannsynlighet P(a, f | e) normalisert med summen av sannsynlighetene for alle justeringer av et gitt setningspar:

Implementeringen av Viterbi-algoritmen som brukes til å trene modell #1 er som følger:

1. Hele tabellen over oversettelseskorrespondanse er fylt med de samme verdiene.

2. For alle mulige varianter av parvise koblinger av ord, beregnes sannsynligheten P(a, f | e):

3. Verdiene til P(a, f | e) normaliseres for å oppnå verdiene til P(a | e, f).

4. Frekvensen til hvert translasjonspar beregnes, vektet av sannsynligheten for hvert justeringsalternativ.

5. De resulterende vektede frekvensene normaliseres og danner en ny tabell overynligheter

6. Algoritmen gjentas fra trinn 2.

Tenk på, som et eksempel, trening av en lignende modell på et korpus av to setningspar (fig. 2):

hvite hus

  • Hus/Hus

Etter et stort antall iterasjoner vil vi få en tabell (tabell 2), som viser at oversettelsen er utført med høy nøyaktighet.

Statistiske metoder er også mye brukt i studiet av ordforråd, morfologi, syntaks og stil. Forskere fra Perm State University utførte en studie basert på påstanden om at stereotype fraser er et viktig "byggemateriale" i teksten. Disse frasene består av "kjernefysiske" gjentatte ord og avhengige ordspesifikasjoner og har en uttalt stilistisk farge.

I vitenskapelig stil kan "kjernefysiske" ord kalles: forskning, studie, oppgave, problem, spørsmål, fenomen, fakta, observasjon, analyse osv. I journalistikken vil andre ord være «atomkraft», som har en økt verdi spesifikt for avisens tekst: tid, person, makt, virksomhet, handling, lov, liv, historie, sted etc. (totalt 29)

Av spesiell interesse for lingvister er også den faglige differensieringen av nasjonalspråket, originaliteten til bruken av ordforråd og grammatikk, avhengig av type yrke. Det er kjent at sjåfører i faglig tale bruker skjemaet sh O fer, sier legene k O klubb i stedet for cocktail Yu sh - slike eksempler kan gis. Statistikkens oppgave er å spore variasjonen i uttalen og endringen i språknormen.

Faglige forskjeller fører til forskjeller ikke bare grammatiske, men også leksikalske. Yakut State University oppkalt etter M.K. Ammosov ble 50 spørreskjemaer analysert med de vanligste reaksjonene på visse ord blant leger og byggherrer (tabell 3).

Utbyggere

Menneskelig

pasient (10), personlighet (5)

mann (5)

flink

hjelp (8), hjelp (7)

ond (16)

liv

død (10)

nydelig (5)

død

lik (8)

livet (6)

Brann

varme (8), brenne (6)

brann (7)

finger

hånd (14), panaritium (5)

stor (7), indeks (6)

øyne

syn (6), pupill, øyelege (5 hver)

brun (10), stor (6)

hode

sinn (14), hjerner (5)

stor (9), smart (8), smart (6)

å tape

bevissthet, liv (4 hver)

penger (5), finn (4)

Det kan bemerkes at leger oftere enn byggherrer gir assosiasjoner knyttet til deres faglige virksomhet, siden ordstimuliene gitt i spørreskjemaet har mer med deres yrke å gjøre enn med yrket som byggmester.

Statistiske regelmessigheter i et språk brukes til å lage frekvensordbøker - ordbøker som gir numeriske kjennetegn på frekvensen av ord (ordformer, fraser) til ethvert språk - språket til forfatteren, ethvert arbeid, etc. Vanligvis er hyppigheten av forekomst av et ord brukes som en karakteristikk av bruk i teksten til et bestemt bind

Modellen for taleoppfatning er umulig uten en ordbok som sin essensielle komponent. I oppfatningen av tale er den grunnleggende operasjonelle enheten ordet. Av dette følger det spesielt at hvert ord i den oppfattede teksten må identifiseres med den tilsvarende enheten i lytterens (eller leserens) interne vokabular. Det er naturlig å anta at søket helt fra begynnelsen er begrenset til noen underdomener av ordboken. I følge de fleste moderne teorier om taleoppfatning gir den faktiske fonetiske analysen av den klingende teksten i et typisk tilfelle bare noe delvis informasjon om ordets mulige fonologiske utseende, og denne typen informasjon tilsvarer ikke ett, men en viss MANGE ord av ordboken; Derfor oppstår to problemer:

(a) velge passende sett i henhold til visse parametere;

(b) innenfor rammen av det skisserte settet (hvis det er tildelt tilstrekkelig) å "eliminere" alle ord, bortsett fra det eneste som best samsvarer med det gitte ordet i den anerkjente teksten. En av "frafall"-strategiene er å ekskludere lavfrekvente ord. Det følger at vokabularet for taleoppfatning er en frekvensordbok. Det er opprettelsen av en datamaskinversjon av frekvensordboken til det russiske språket som er den første oppgaven til det presenterte prosjektet.

Basert på materialet til det russiske språket er det 5 frekvensordbøker (ikke medregnet grenordbøker). La oss bare merke noen generelle mangler ved de eksisterende ordbøkene.

Alle kjente frekvensordbøker for det russiske språket er basert på behandling av matriser av skrevne (trykte) tekster. Delvis av denne grunn, når identiteten til et ord i stor grad er basert på formell, grafisk tilfeldighet, blir det ikke tatt tilstrekkelig hensyn til semantikk. Som et resultat blir frekvenskarakteristikkene også forskjøvet, forvrengt; for eksempel, hvis kompilatoren av frekvensordboken inkluderer ord fra kombinasjonen "hverandre" i den generelle statistikken over bruken av ordet "venn", så er dette neppe berettiget: gitt semantikken, må vi innrømme at disse allerede er forskjellige ord, eller rettere sagt, at en uavhengig ordbokenhet bare er kombinasjonen som en helhet.

I alle eksisterende ordbøker er ord bare plassert i sine grunnleggende former: substantiv i entallsform, nominativ kasus, verb i infinitivform, etc. Noen av ordbøkene gir informasjon om hyppigheten av ordformer, men vanligvis gjør de det ikke konsekvent nok, ikke på en uttømmende måte. Frekvensene til forskjellige ordformer av samme ord stemmer tydeligvis ikke. Utvikleren av taleoppfatningsmodellen må ta i betraktning at i en reell persepsjonsprosess er det nettopp en spesifikk ordform som er «nedsenket» i teksten som er gjenstand for gjenkjennelse: basert på analysen av den innledende delen av eksponenten for ordformen dannes et sett med ord med identisk begynnelse, og den første delen av ordformen er ikke nødvendigvis identisk med den første delen av ordbokformen . Det er ordformen som har en bestemt rytmisk struktur, som også er en ekstremt viktig parameter for det perseptuelle utvalget av ord. Til slutt, i den endelige representasjonen av den anerkjente ytringen, igjen, blir ordene representert av de tilsvarende ordformene.

Det er mange verk som demonstrerer viktigheten av frekvens i prosessen med taleoppfatning. Men vi er ikke klar over verk der frekvensen av ordformer ville bli brukt - tvert imot ignorerer alle forfattere praktisk talt frekvensen av individuelle ordformer, og refererer utelukkende til leksemer. Hvis resultatene oppnådd av dem ikke anses som artefakter, må man anta at morsmålet på en eller annen måte har tilgang til informasjon om forholdet mellom frekvensene til ordformer og ordbokformer, dvs. faktisk leksemer. Dessuten kan en slik overgang fra en ordform til et leksem selvfølgelig ikke forklares med naturlig kunnskap om det tilsvarende paradigmet, siden frekvensinformasjon må brukes før den endelige identifiseringen av ordet, ellers mister den ganske enkelt sin betydning.

I henhold til de primære statistiske kjennetegnene er det mulig å bestemme med en gitt relativ feil den delen av ordboken, som inkluderer ord med høy forekomstfrekvens, uavhengig av teksttype. Det er også mulig, ved å innføre trinnvis rekkefølge i ordboken, å få en rekke ordbøker som dekker de første 100, 1000, 5000 osv. med hyppige ord. De statistiske egenskapene til ordboken er av interesse i forbindelse med den semantiske analysen av vokabular. Studiet av fagideologiske grupper og semantiske felt viser at leksikalske assosiasjoner støttes av semantiske lenker som er konsentrert rundt leksemer med den vanligste betydningen. Beskrivelsen av betydninger innenfor det leksiko-semantiske feltet kan utføres ved å identifisere ord med de mest abstrakte leksemene i betydning. Tilsynelatende utgjør "tomme" (fra nominative potenser) ordbokenheter et statistisk homogent lag.

Ordforråd for individuelle sjangere er ikke mindre verdifulle. Å studere målet for deres likhet og arten av statistiske fordelinger vil gi interessant informasjon om den kvalitative stratifiseringen av ordforråd avhengig av talebrukssfæren.

Sammenstilling av store frekvensordbøker krever bruk av datateknologi. Innføringen av delvis mekanisering og automatisering i arbeidet med en ordbok er av interesse som et eksperiment i maskinell bearbeiding av ordbøker for ulike tekster. En slik ordbok krever et mer strengt system for å behandle og samle vokabularmateriale. I miniatyr er dette et informasjonsinnhentingssystem som er i stand til å gi informasjon om ulike sider ved teksten og vokabularet. Noen grunnleggende forespørsler til dette systemet er planlagt helt fra begynnelsen: det totale antallet inventarord, de statistiske egenskapene til et enkelt ord og hele ordbøker, rekkefølgen av hyppige og sjeldne soner i ordboken, etc. Maskinkortfilen lar deg å automatisk bygge omvendte ordbøker for individuelle sjangere og kilder. Mange andre nyttige statistiske opplysninger om språket vil bli hentet ut fra den akkumulerte informasjonsmengden. Datafrekvensordboken skaper et forsøksgrunnlag for overgangen til en mer omfattende automatisering av vokabulararbeidet.

De statistiske dataene til frekvensordbøker kan også brukes mye til å løse andre språklige problemer - for eksempel ved å analysere og bestemme de aktive virkemidlene for orddannelse av det moderne russiske språket, løse problemer med å forbedre grafikk og staving, som er forbundet med å ta inn over seg ta hensyn til statistisk informasjon om vokabularet (det er viktig å ta hensyn til sannsynlige egenskaper ved grafemkombinasjoner, typer bokstavkombinasjoner realisert i ord), praktisk transkripsjon og translitterasjon. De statistiske parameterne til ordboken vil også være nyttige for å løse problemer med automatisering av skriving, gjenkjenning og automatisk lesing av bokstavelig tekst.

Moderne forklarende ordbøker og grammatikk for det russiske språket er hovedsakelig bygget på grunnlag av litterære og kunstneriske tekster. Det finnes frekvensordbøker for språket til A.S. Pushkin, A.S. Griboedova, F.M. Dostojevskij, V.V. Vysotsky og mange andre forfattere. Ved Institutt for historie og litteraturteori i Smolensk-staten. Pedagogisk universitet har i en årrekke jobbet med å lage frekvensordbøker over poetiske og prosatekster. For denne studien ble frekvensordbøker med alle tekstene til Pushkin og ytterligere to poeter fra gullalderen - "Ve fra vit" av Griboyedov og hele Lermontovs poesi valgt ut; Pasternak og fem andre diktere fra sølvalderen - Balmont 1894-1903, "Dikt om den vakre damen" av Blok, "Steen" av Mandelstam, "Ildstøtten" av Gumilyov, "Anno Domini MCMXXI" av Akhmatova og "Sisters of Mitt liv" av Pasternak og ytterligere fire diktere fra jernalderen - "Dikt av Yuri Zhivago", "Når det klarner opp", hele korpuset av tekster av M. Petrovs, "Veien er langt borte", "Vindskjerm", "Farvel til snøen" og "Horseshoes" av Mezhirov, "Antimirov" av Voznesensky og "Snezhnitsa » Rylenkova.

Det skal bemerkes at disse ordbøkene er forskjellige i natur: noen representerer ordforrådet til ett dramatisk verk, andre - bøker med tekster, eller flere bøker, eller hele korpuset til dikterens dikt. Resultatene av analysen presentert i denne artikkelen bør tas med forsiktighet, de kan ikke tas som absolutte. Ved hjelp av spesielle tiltak kan imidlertid forskjellen i teksters ontologiske natur reduseres til en viss grad.

De siste årene har motsetningen mellom samtale- og boktale blitt mer og tydeligere realisert. Denne problemstillingen diskuteres spesielt skarpt blant metodologer som krever en vending i undervisningen mot talespråket. Imidlertid forblir spesifisiteten til daglig tale fortsatt uforklarlig.

Ordbøker ble behandlet ved å opprette en brukerapplikasjon i miljøet til kontorprogrammet EXCEL97. Applikasjonen inkluderer fire regneark av EXCEL-boken - "Tittelark", "Ordbøker" -ark med innledende data, "Nærheter" og "Avstander" med resultater, samt et sett med makroer.

Den første informasjonen legges inn på arket "Ordbøker". Ordbøker av de studerte tekstene er skrevet inn i EXCEL-celler, den siste kolonnen S er dannet fra resultatene som er oppnådd og er lik antall ord som finnes i andre ordbøker. Tabellene "Nærhet" og "Avstander" inneholder beregnede mål for nærhet M, korrelasjon R og avstand D.

Applikasjonsmakroer er hendelsesbaserte programmeringsprosedyrer skrevet i Visual Basic for Application (VBA). Prosedyrer er basert på VBA-bibliotekobjekter og deres behandlingsmetoder. Så, for operasjoner med regneark i applikasjonen, brukes nøkkelobjektet Regneark (regneark) og den tilsvarende metoden for å aktivere arket Aktiver (aktiver). Innstilling av rekkevidden til de analyserte kildedataene på ordbokarket utføres ved hjelp av Select-metoden til Range-objektet (område), og overføringen av ord som verdier til variabler utføres som Value-egenskapen (verdi) i samme område gjenstand.

Til tross for at rangkorrelasjonsanalyse gjør oss forsiktige med avhengigheten av emner mellom ulike tekster, har de fleste av de hyppigste ordene i hver tekst treff i en eller flere andre tekster. Kolonne S viser antall slike ord blant de 15 mest hyppige ordene for hver forfatter. Ord med fet skrift vises bare i en dikters ord i tabellen vår. Blok, Akhmatova og Petrovs har ingen uthevede ord i det hele tatt, de har S = 15. Disse tre dikterne har de samme 15 mest hyppige ordene, de skiller seg bare på plass i listen. Men selv Pushkin, hvis ordforråd er det mest originale, har S = 8, og det er 7 uthevede ord.

Resultatene viser at det er et visst lag med ordforråd som konsentrerer poesiens hovedtemaer. Som regel er disse ordene korte: av det totale antallet (225) ordbruk av én stavelse 88, to stavelser 127, tre stavelser 10. Ofte representerer disse ordene hovedmytologene og kan falle inn i par: natt - dag, jord - himmel (sol), Gud - menneske (mennesker), liv - død, kropp - sjel, Roma - verden(på Mandelstam); kan kombineres til mytologer på et høyere nivå: himmel, stjerne, sol, jord; i en person, som regel, skiller kroppen, hjertet, blodet, armen, beinet, kinnet, øynene seg ut. Av de menneskelige tilstander gis preferanse til søvn og kjærlighet. Huset og byene tilhører den menneskelige verden - Moskva, Roma, Paris. Kreativitet er representert av leksemer ord Og sang.

Griboedov og Lermontov har nesten ingen ord som betegner naturen blant de vanligste ordene. De har tre ganger så mange ord som betegner en person, deler av kroppen hans, elementer av hans åndelige verden. Pushkin og diktere fra det tjuende århundre. betegnelser på menneske og natur er omtrent like. I dette viktige aspektet av emnet kan vi si at det tjuende århundre. fulgte Pushkin.

Minimalt tema sak blant de vanligste ordene finnes det bare i Griboyedov og Pushkin. Lermontov og diktere fra det tjuende århundre. det gir plass til et minimalt tema ord. Ordet utelukker ikke gjerninger (den bibelske tolkningen av emnet: i Det nye testamente blir all Jesu Kristi lære betraktet som Guds ord eller Jesu ord, og apostlene kaller seg noen ganger Ordets tjenere). Den hellige betydningen av leksemordet er overbevisende manifestert, for eksempel i Pasternaks vers «Og verdens bilde, åpenbart i Ordet». Den hellige betydningen av leksemet ord i forbindelse med og kontrast til menneskelige anliggender, manifesteres det overbevisende i diktet med samme navn av Gumilyov.

Tokens som bare finnes i én tekst karakteriserer originaliteten til en gitt bok eller en samling bøker. Ordet «sinn» er for eksempel det hyppigste i Griboedovs komedie «Ve fra vidd» – men det forekommer ikke blant frekvensordene i andre tekster. Temaet for sinnet er uten tvil det mest betydningsfulle i komedie. Dette leksemet følger bildet av Chatsky, og navnet på Chatsky er det hyppigste i komedie. Dermed kombinerer verket organisk det hyppigste fellessubstantivet med det hyppigste egennavnet.

Den høyeste korrelasjonskoeffisienten forbinder temaene til de tragiske bøkene "The Pillar of Fire" av Gumilyov og "Anno Domini MCMXXI" av Akhmatova. Blant de 15 vanligste substantivene er det 10 vanlige, inkludert blod, hjerte, sjel, kjærlighet, ord, himmel. Husk at Akhmatovas bok inkluderte en miniatyr "Du vil ikke være i live ...", skrevet mellom arrestasjonen av Gumilyov og henrettelsen hans.

Temaene til lyset og mengden i det studerte materialet finnes bare i "Diktene til Yuri Zhivago". Temaet for lyset i versene fra romanen har mange kontekstuelle betydninger: det er assosiert med bildet av Jesus Kristus, med temaene tro, udødelighet, kreativitet, kjærlighetsdato. Stearinlyset er den viktigste lyskilden i de sentrale scenene i romanen. Temaet for mengden utvikler seg i forbindelse med hovedideen til romanen, der privatlivet til en person med dets urokkelige verdier er i motsetning til den nye statens umoral, bygget på prinsippene om å behage mengden .

Arbeidet involverer også det tredje trinnet, også reflektert i programmet, - dette er beregningen av forskjellen i ordenstallene til ord som er felles for to ordbøker og gjennomsnittlig avstand mellom de samme ordene i to ordbøker. Dette stadiet gjør det mulig å gå fra de generelle trendene i samspillet mellom ordbøker identifisert ved hjelp av statistikk til et nivå som nærmer seg teksten. For eksempel korrelerer bøkene til Gumilyov og Akhmatova statistisk signifikant. Vi ser på hvilke ord som viste seg å være vanlige for ordbøkene deres, og først av alt velger vi de hvis serienummer avviker minimalt eller lik null. Det er disse ordene som har samme rangeringsnummer, og følgelig er det disse minimale temaene i hodet til de to dikterne som er like viktige. Deretter bør du gå til nivået av tekster og kontekster.

Kvantitative metoder bidrar også til å studere egenskapene til folk - morsmål. Si, det er 6 tilfeller på russisk, det er ingen tilfeller på engelsk, og på noen språk av folket i Dagestan når antallet tilfeller 40. L. Perlovsky i sin artikkel "Bevissthet, språk og kultur" korrelerer disse kjennetegn med folkeslags tendens til individualisme eller kollektivisme, med oppfatning av ting og fenomener hver for seg eller i forbindelse med andre. Tross alt var det i den engelsktalende verden (det er ingen tilfeller - tingen oppfattes "av seg selv") at slike begreper som individuell frihet, liberalisme og demokrati dukket opp (jeg merker at jeg bruker disse konseptene bare i forbindelse med språk, uten noen evaluerende egenskaper). Til tross for at slike gjetninger fortsatt bare forblir på nivået av dristige vitenskapelige hypoteser, hjelper de å se på allerede kjente fenomener på en ny måte.

Som vi kan se, kan kvantitative egenskaper brukes på helt andre områder av lingvistikken, noe som i økende grad visker ut grensene mellom «eksakte» og «humanitære» metoder. Lingvistikk tyr i økende grad til hjelp av ikke bare matematikk, men også datateknologi for å løse sine problemer.

2.3 Å lære språket ved hjelp av metoder for formell logikk

Med ikke-kvantitative metoder for matematikk, spesielt med logikk, samhandler moderne teoretisk lingvistikk ikke mindre fruktbart enn med kvantitative. Den raske utviklingen av datateknologi og veksten av deres rolle i den moderne verden krevde en revisjon av tilnærmingen til samspillet mellom språk og logikk generelt.

Metodene for logikk er mye brukt i utviklingen av formaliserte språk, spesielt programmeringsspråk, hvis elementer er noen symboler (i likhet med matematiske), valgt (eller konstruert fra tidligere valgte symboler) og tolket på en bestemt måte, assosiert uten "tradisjonell" bruk, forståelse og forståelse funksjoner av de samme symbolene i andre sammenhenger. En programmerer arbeider konstant med logikk i arbeidet sitt. Meningen med programmering er bare å lære datamaskinen å resonnere (i ordets videste forstand). Samtidig viser metodene for "resonnering" seg å være svært forskjellige. Hver programmerer bruker en viss tid på å lete etter feil i sine egne og andres programmer. Det vil si å søke etter feil i resonnement, i logikk. Og dette setter også sine spor. Det er mye lettere å oppdage logiske feil i vanlig tale. Den relative enkelheten til språkene studert av logikere lar dem belyse strukturene til disse språkene tydeligere enn det er oppnåelig av lingvister som analyserer utelukkende komplekse naturlige språk. I lys av det faktum at språkene studert av logikere bruker relasjoner kopiert fra naturlige språk, er logikere i stand til å gi betydelige bidrag til den generelle teorien om språk. Situasjonen her er lik den som finner sted i fysikk: fysikeren formulerer også teoremer for ideelt forenklede tilfeller som ikke forekommer i naturen i det hele tatt - han formulerer lover for ideelle gasser, ideelle væsker, snakker om bevegelse i fravær av friksjon, etc. For disse idealiserte tilfellene kan det etableres enkle lover som i stor grad vil bidra til forståelsen av hva som skjer i virkeligheten og hva som sannsynligvis ville forbli ukjent for fysikken hvis den forsøkte å vurdere virkeligheten direkte, i all dens kompleksitet.

I studiet av naturlige språk brukes logiske metoder slik at språkelever ikke dumt kan "memorere" så mange ord som mulig, men bedre forstå strukturen. L. Shcherba brukte også i sine forelesninger et eksempel på en setning bygget i henhold til lovene i det russiske språket: «Den glitrende kuzdra shteko bokra bokra og krøller bokra», og spurte deretter elevene hva dette betydde. Til tross for at betydningen av ordene i setningen forble uklar (de eksisterer ganske enkelt ikke på russisk), var det mulig å svare tydelig: "kuzdra" er subjektet, et feminint substantiv, i entall, nominativ kasus, " bokr" er animert og så videre. Oversettelsen av uttrykket viser seg å være noe sånt som dette: "Noe feminint på en gang gjorde noe over en slags mannlig skapning, og begynte så å gjøre noe slikt for en lang, gradvis en med ungen sin." Et lignende eksempel på en tekst (kunstnerisk) fra ikke-eksisterende ord, bygget helt i henhold til språkets lover, er Lewis Carrolls Jabberwock (i Alice in Wonderland forklarer Carroll, gjennom sin karakter Humpty Dumpty, betydningen av ordene han oppfunnet: "kokt" - klokken åtte om kvelden, når det er på tide å lage middag, "chlivky" - spinkel og fingernem, "shorek" - en krysning mellom en ilder, en grevling og en korketrekker, "dykk" - ​​hopp, dykk, spinn, "nava" - gress under soluret (strekker seg litt til høyre, litt til venstre og litt bakover), "grynt" - grynt og ler, "zelyuk" - en grønn kalkun, "myumzik" - en fugl; fjærene hennes er rufsete og stikker ut i alle retninger, som en kost, "mova" - langt hjemmefra) .

Et av hovedbegrepene i moderne logikk og teoretisk lingvistikk, brukt i studiet av språk med forskjellige logiske og matematiske beregninger, naturlige språk, for å beskrive forholdet mellom språk på forskjellige "nivåer" og for å karakterisere forholdet mellom språk under vurdering og fagområdene beskrevet med deres hjelp, er begrepet metaspråk. Et metaspråk er et språk som brukes til å uttrykke vurderinger om et annet språk, språkobjektet. Ved hjelp av et metaspråk studerer de strukturen til tegnkombinasjoner (uttrykk) til språkobjektet, beviser teoremer om dets uttrykksegenskaper, om dets forhold til andre språk osv. Språket som studeres kalles også fagspråket i forhold til dette metaspråket. Både fagspråket og metaspråket kan være vanlige (naturlige) språk. Metaspråket kan avvike fra objektspråket (for eksempel i en engelsk lærebok for russere er russisk metaspråket, og engelsk er objektspråket), men det kan også falle sammen med det eller avvike bare delvis, for eksempel i spesiell terminologi (Russisk lingvistisk terminologi er et element i metaspråket for å beskrive det russiske språket, de såkalte semantiske faktorene er en del av metaspråket for å beskrive semantikken til naturlige språk).

Konseptet "metalinguage" har blitt svært fruktbart i forbindelse med studiet av formaliserte språk som er bygget innenfor rammen av matematisk logikk. I motsetning til formaliserte fagspråk, er i dette tilfellet metaspråket, som metateorien er formulert ved hjelp av (studere egenskapene til fagteorien formulert på fagspråket), som regel et vanlig naturlig språk, på en spesiell måte et fragment av et naturlig språk begrenset på en spesiell måte, som ikke inneholder noen form for tvetydighet, metaforer, "metafysiske" begreper, etc. elementer av vanlig språk som hindrer dets bruk som et verktøy for nøyaktig vitenskapelig forskning. Samtidig kan selve metaspråket formaliseres og (uavhengig av dette) bli gjenstand for forskning utført ved hjelp av metaspråket, og en slik serie kan «tenkes» vokse i det uendelige.

Logikken lærer oss et fruktbart skille mellom språkobjektet og metaspråket. Språkobjektet er selve gjenstanden for logisk forskning, og metaspråket er det uunngåelig kunstige språket som slik forskning utføres på. Logisk tenkning består bare i å formulere relasjonene og strukturen til et ekte språk (objektspråk) på symbolspråket (metaspråk).

Metaspråket må i alle fall være "ikke fattigere" enn dets objektive språk (dvs. for hvert uttrykk av sistnevnte i metaspråket må det være navnet, "oversettelse") - ellers, hvis disse kravene ikke er oppfylt (som absolutt tar plass i naturlige språk, dersom særavtaler ikke gir noe annet) oppstår semantiske paradokser (antinomier).

Etter hvert som flere og flere nye programmeringsspråk ble opprettet, i forbindelse med problemet med programmeringsoversettere, var det et presserende behov for å lage metaspråk. For tiden er Backus-Naur-formen metalanguage (forkortet til BNF) den mest brukte for å beskrive syntaksen til programmeringsspråk. Det er en kompakt form i form av noen formler som ligner på matematiske. For hvert konsept av språket er det en unik metaformel (normal formel). Den består av venstre og høyre deler. Venstre side spesifiserer konseptet som defineres, og høyre side spesifiserer settet med tillatte språkkonstruksjoner som er kombinert i dette konseptet. Formelen bruker spesielle metategn i form av vinkelparenteser, som inneholder konseptet som defineres (på venstre side av formelen) eller et tidligere definert konsept (på høyre side), og separasjonen mellom venstre og høyre del er indikert med "::="-metategn, hvis betydning tilsvarer ordene "per definisjon er det". Metalingvistiske formler er innebygd i oversettere i en eller annen form; med deres hjelp blir konstruksjonene som brukes av programmereren sjekket for formell samsvar med noen av konstruksjonene som er syntaktisk gyldige på dette språket. Det er også separate metaspråk fra ulike vitenskaper - dermed eksisterer kunnskap i form av ulike metaspråk.

Logiske metoder fungerte også som grunnlag for opprettelsen av kunstige intelligenssystemer basert på begrepet konneksjonisme. Konneksjonisme er en spesiell trend innen filosofisk vitenskap, hvis emne er spørsmål om kunnskap. Innenfor rammen av denne trenden gjøres det forsøk på å forklare de intellektuelle evnene til en person som bruker kunstige nevrale nettverk. Sammensatt av et stort antall strukturelle enheter som ligner på nevroner, med en vekt tildelt hvert element som bestemmer styrken til forbindelsen med andre elementer, er nevrale nettverk forenklede modeller av den menneskelige hjernen. Eksperimenter med nevrale nettverk av denne typen har vist deres evne til å lære å utføre oppgaver som mønstergjenkjenning, lesing og identifisering av enkle grammatiske strukturer.

Filosofer begynte å interessere seg for konneksjonisme, da den konneksjonistiske tilnærmingen lovet å gi et alternativ til den klassiske teorien om sinnet og ideen som er utbredt innenfor denne teorien om at sinnets virkemåte ligner på behandlingen av symbolsk språk av en digital datamaskin. Dette konseptet er svært kontroversielt, men de siste årene har det funnet flere og flere støttespillere.

Det logiske studiet av språk viderefører Saussures konsept om språk som et system. Det faktum at det hele tiden fortsetter bekrefter nok en gang dristigheten til vitenskapelige formodninger fra begynnelsen av forrige århundre. Jeg vil vie den siste delen av arbeidet mitt til utsiktene for utvikling av matematiske metoder i lingvistikk i dag.

2.4 Utsikter for anvendelse av matematiske metoder i lingvistikk

I datateknologiens tid har metodene for matematisk lingvistikk fått et nytt utviklingsperspektiv. Søket etter løsninger på problemene med språklig analyse blir nå i økende grad implementert på informasjonssystemnivå. Samtidig setter automatisering av prosessen med å behandle språklig materiale, som gir forskeren betydelige muligheter og fordeler, uunngåelig nye krav og oppgaver for ham.

Kombinasjonen av «eksakt» og «humanitær» kunnskap har blitt grobunn for nye oppdagelser innen lingvistikk, informatikk og filosofi.

Maskinoversettelse fra ett språk til et annet er fortsatt en raskt voksende gren av informasjonsteknologi. Til tross for at dataassistert oversettelse aldri kan sammenlignes i kvalitet med menneskelig oversettelse (spesielt for litterære tekster), har maskinen blitt en uunnværlig assistent for en person i å oversette store tekstvolumer. Det antas at det i nær fremtid vil bli laget mer avanserte oversettelsessystemer, hovedsakelig basert på semantisk analyse av teksten.

Et like lovende område er samspillet mellom lingvistikk og logikk, som fungerer som et filosofisk grunnlag for å forstå informasjonsteknologi og den såkalte "virtuelle virkeligheten". I nær fremtid vil arbeidet fortsette med å lage kunstige intelligenssystemer - selv om det igjen aldri vil være lik mennesket i sine evner. Slik konkurranse er meningsløs: i vår tid bør maskinen ikke bli (og bli) en rival, men en assistent for mennesket, ikke noe fra fantasiens rike, men en del av den virkelige verden.

Studiet av språket med statistiske metoder fortsetter, noe som gjør det mulig å mer nøyaktig bestemme dets kvalitative egenskaper. Det er viktig at de mest vågale hypotesene om språk finner sitt matematiske, og derfor logiske, bevis.

Det mest betydningsfulle er at ulike grener av bruken av matematikk i lingvistikk, tidligere ganske isolert, de siste årene har blitt korrelert med hverandre, koblet til et sammenhengende system, analogt med språksystemet oppdaget for et århundre siden av Ferdinand de Saussure og Yvan Baudouin de Courtenay. Dette er kontinuiteten til vitenskapelig kunnskap.

Lingvistikk i den moderne verden har blitt grunnlaget for utviklingen av informasjonsteknologi. Så lenge informatikk forblir en gren av menneskelig aktivitet i rask utvikling, vil foreningen av matematikk og lingvistikk fortsette å spille sin rolle i utviklingen av vitenskap.

Konklusjon

I løpet av det 20. århundre har datateknologier kommet langt – fra militær til fredelig bruk, fra et smalt spekter av mål til penetrering i alle grener av menneskelivet. Matematikk som vitenskap fikk stadig ny praktisk betydning med utviklingen av datateknologi. Denne prosessen fortsetter i dag.

Det tidligere utenkelige «tandemet» av «fysikere» og «lyrikere» er blitt en realitet. For det fulle samspillet mellom matematikk og informatikk med humaniora, var det nødvendig med kvalifiserte spesialister fra begge sider. Mens informatikere i økende grad har behov for systematisk humanitær kunnskap (språklig, kulturell, filosofisk) for å forstå endringer i virkeligheten rundt dem, i samspillet mellom menneske og teknologi, for å utvikle flere og flere nye språklige og mentale konsepter, for å skrive programmer, så må enhver "humaniora" i vår tid for deres profesjonelle vekst mestre minst det grunnleggende om å jobbe med en datamaskin.

Matematikk, som er nært forbundet med informatikk, fortsetter å utvikle seg og samhandle med naturvitenskap og humaniora. I det nye århundret svekkes ikke trenden mot matematisering av vitenskap, men tvert imot økende. På grunnlag av kvantitative data blir lovene for utviklingen av språket, dets historiske og filosofiske egenskaper forstått.

Matematisk formalisme er best egnet for å beskrive mønstre i lingvistikk (som faktisk i andre vitenskaper - både humaniora og naturvitenskap). Situasjonen utvikler seg noen ganger i vitenskapen på en slik måte at uten bruk av et passende matematisk språk, er det umulig å forstå naturen til fysisk, kjemisk osv. prosessen er ikke mulig. Å lage en planetarisk modell av atomet, den berømte engelske fysikeren fra XX århundre. E. Rutherford opplevde matematiske vanskeligheter. Til å begynne med ble teorien hans ikke akseptert: den hørtes ikke overbevisende ut, og grunnen til dette var Rutherfords uvitenhet om sannsynlighetsteorien, på grunnlag av mekanismen som det bare var mulig å forstå modellrepresentasjonen av atomære interaksjoner. Da han innså dette, meldte en fremragende vitenskapsmann seg allerede på det tidspunktet, eieren av Nobelprisen, seg på seminaret til matematikeren Professor Lamb og i to år, sammen med studentene, deltok på et kurs og utarbeidet en workshop om sannsynlighetsteorien. . Basert på det var Rutherford i stand til å beskrive elektronets oppførsel, og ga hans strukturelle modell overbevisende nøyaktighet og oppnå anerkjennelse. Det samme er med lingvistikk.

Dette reiser spørsmålet, hva er så matematisk i objektive fenomener, takket være at de kan beskrives på matematikkspråket, på språket med kvantitative egenskaper? Dette er homogene enheter av materie fordelt i rom og tid. De vitenskapene som har gått lenger enn andre mot isolasjonen av homogenitet, og viser seg å være bedre egnet for bruk av matematikk i dem.

Internett, som utviklet seg raskt på 1990-tallet, samlet representanter for ulike land, folk og kulturer. Til tross for at engelsk fortsetter å være hovedspråket for internasjonal kommunikasjon, har Internett blitt flerspråklig i vår tid. Dette førte til utviklingen av kommersielt vellykkede maskinoversettelsessystemer som er mye brukt i ulike felt av menneskelig aktivitet.

Datanettverk har blitt et objekt for filosofisk refleksjon – det er skapt flere og flere nye språklige, logiske, verdensbildebegreper som bidrar til å forstå «virtuell virkelighet». I mange kunstverk ble det skapt scenarier - oftere pessimistiske - om maskinenes dominans over en person, og virtuell virkelighet - over omverdenen. Slike prognoser viste seg langt fra alltid å være meningsløse. Informasjonsteknologi er ikke bare en lovende industri for å investere menneskelig kunnskap, det er også en måte å kontrollere informasjon på, og følgelig over menneskelig tanke.

Dette fenomenet har både en negativ og en positiv side. Negativt – fordi kontroll over informasjon er i strid med den umistelige menneskerettigheten til fri tilgang til den. Positivt - fordi mangelen på denne kontrollen kan føre til katastrofale konsekvenser for menneskeheten. Det er nok å minne om en av de klokeste filmene det siste tiåret - "When the World Ends" av Wim Wenders, hvis karakterer er fullstendig nedsenket i den "virtuelle virkeligheten" til sine egne drømmer spilt inn på en datamaskin. Imidlertid kan ikke en eneste vitenskapsmann og ikke en eneste kunstner gi et entydig svar på spørsmålet: hva som venter vitenskap og teknologi i fremtiden.

Å fokusere på "fremtiden", som noen ganger virket fantastisk, var et særtrekk ved vitenskapen på midten av det tjuende århundre, da oppfinnere søkte å lage perfekte modeller av teknologi som kunne fungere uten menneskelig innblanding. Tiden har vist den utopiske naturen til slik forskning. Det ville imidlertid være overflødig å fordømme forskere for dette – uten deres entusiasme på 1950 – 60-tallet ville ikke informasjonsteknologien gjort et så kraftig sprang på 90-tallet, og vi ville ikke ha det vi har nå.

De siste tiårene av det tjuende århundre endret vitenskapens prioriteringer - forskning, oppfinnsom patos ga plass for kommersiell interesse. Igjen, dette er verken bra eller dårlig. Dette er en realitet der vitenskapen i økende grad integreres i hverdagen.

Det 21. århundre har fortsatt denne trenden, og i vår tid bak oppfinnelser ligger ikke bare berømmelse og anerkjennelse, men først og fremst penger. Dette er også grunnen til at det er viktig å sikre at de siste prestasjonene innen vitenskap og teknologi ikke faller i hendene på terrorgrupper eller diktatoriske regimer. Oppgaven er vanskelig til det er umulig; å realisere det så mye som mulig er hele verdenssamfunnets oppgave.

Informasjon er et våpen, og våpen er ikke mindre farlige enn atomvåpen eller kjemiske våpen – bare den virker ikke fysisk, men heller psykologisk. Menneskeheten må tenke på hva som er viktigere for den i dette tilfellet – frihet eller kontroll.

De siste filosofiske konseptene knyttet til utviklingen av informasjonsteknologi og et forsøk på å forstå dem har vist begrensningene til både naturvitenskapelig materialisme, som dominerte på 1800- og begynnelsen av 1900-tallet, og ekstrem idealisme, som benekter betydningen av den materielle verden. . Det er viktig for moderne tankegang, spesielt vestens tankegang, å overvinne denne dualismen i tenkningen, når omverdenen er tydelig delt inn i materiell og ideal. Veien til dette er en dialog mellom kulturer, en sammenligning av ulike synspunkter på fenomenene rundt.

Paradoksalt nok kan informasjonsteknologi spille en viktig rolle i denne prosessen. Datanettverk, og spesielt Internett, er ikke bare en ressurs for underholdning og kraftig kommersiell aktivitet, de er også et middel for meningsfull, kontroversiell kommunikasjon mellom representanter for ulike sivilisasjoner i den moderne verden, samt for en dialog mellom fortiden og nåtiden. Vi kan si at Internett flytter de romlige og tidsmessige grensene.

Og i dialogen mellom kulturer gjennom informasjonsteknologi er språkets rolle som det eldste universelle kommunikasjonsmidlet fortsatt viktig. Det er derfor lingvistikk, i samspill med matematikk, filosofi og informatikk, har opplevd sin andre fødsel og fortsetter å utvikle seg i dag. Trenden til nåtiden vil fortsette i fremtiden – «til verdens ende», som for 15 år siden, spådde den samme V. Wenders. Riktignok er det ikke kjent når denne slutten vil inntreffe – men er den viktig nå, for fremtiden vil før eller siden uansett bli nåtid.

Vedlegg 1

Ferdinand de Saussure

Den sveitsiske lingvisten Ferdinand de Saussure (1857-1913) er ansett for å være grunnleggeren av moderne lingvistikk i sine forsøk på å beskrive språkets struktur i stedet for historien til bestemte språk og språkformer. Faktisk finner metoden for strukturalisme i lingvistikk og litteraturvitenskap og en betydelig gren av semiotikk sitt viktigste utgangspunkt i hans arbeid ved begynnelsen av det tjuende århundre. Det har til og med blitt hevdet at komplekset av strategier og forestillinger som har blitt kalt "poststrukturalisme" - arbeidet til Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes og andre - antydes av Saussures arbeid. i lingvistikk og anagrammatiske lesninger av sen latinsk poesi, litterær modernisme til psykoanalyse og filosofi tidlig på det tjuende århundre. Som Algirdas Julien Greimas og Joseph Courtés argumenterer i Semiotics and Language: An Analytic Dictionary, under overskriften "Interpretation", oppsto en ny tolkningsmåte på begynnelsen av det tjuende århundre som de identifiserer med Saussurean-lingvistikk, Husserlian Phenomenology og Freudiansk psykoanalyse. I denne modusen er "tolkning ikke lenger et spørsmål om å tilskrive et gitt innhold til en form som ellers ville mangle en; snarere er det en parafrase som på en annen måte formulerer det ekvivalente innholdet til et betegnende element i et gitt semiotisk system" ( 159). i denne forståelsen av «tolkning» er form og innhold ikke forskjellige; snarere er hver "form" alternativt også et semantisk "innhold", en "signifiserende form", slik at tolkningen tilbyr en analogisk parafrase av noe som allerede betyr innenfor et annet system av signifikans.

En slik nytolkning av form og forståelse - som Claude Lévi-Strauss beskriver i en av sine mest programmatiske artikulasjoner av strukturalismebegrepet, i "Structure and Form: Reflections on a Work by Vladimir Propp" - er implisitt i Saussures posthume kurs. i General Linguistics (1916, trans., 1959, 1983). I sin levetid publiserte Saussure relativt lite, og hans hovedverk, Kurset, var transkripsjonen av studentene hans av flere kurs i generell lingvistikk han tilbød i 1907-11. I kurset etterlyste Saussure det "vitenskapelige" studiet av språk i motsetning til arbeidet i historisk lingvistikk som ble gjort på 1800-tallet. Dette arbeidet er en av de store prestasjonene til vestlig intellekt: å ta bestemte ord som byggesteinene i språk, historisk (eller "diakronisk") lingvistikk sporet opprinnelsen og utviklingen til vestlige språk fra en antatt felles språkkilde, først et "indoeuropeisk" språk og deretter et tidligere "p roto-indoeuropeisk" språk.

Det er nettopp denne studien av den unike forekomsten av ord, med den samtidige antakelsen om at språkets grunnleggende "enhet" faktisk er den positive eksistensen av disse "ordelementene", som Saussure stilte spørsmål ved. Arbeidet hans var et forsøk på å redusere mengden av fakta om språk, studert så nøye av historisk lingvistikk, til et håndterlig antall påstander. Den "sammenlignende skolen" for filologi fra det nittende århundre, sier Saussure i kurset, "lyktes ikke i å sette opp den sanne vitenskapen om lingvistikk" fordi "den ikke klarte å oppsøke naturen til sitt studieobjekt" ( 3). Denne "naturen," hevder han, finnes ikke bare i de "elementære" ordene som et språk omfatter - de tilsynelatende "positive" faktaene (eller "stoffene") i språket - men i de formelle relasjonene som gir opphav til de "stoffer."

Saussures systematiske reundersøkelse av språk er basert på tre antakelser. Den første er at den vitenskapelige studien av språk må utvikle og studere systemet i stedet for historien til språklige fenomener. Av denne grunn skiller han mellom de spesielle forekomstene av språket - dets spesielle. "tale-hendelser," som han betegner som prøveløslatelse - og det egentlige objektet for lingvistikk, systemet (eller "koden") som styrer de hendelsene, som han betegner som langue. En slik systematisk studie krever dessuten en "synkron" oppfatning av forholdet mellom elementene i språket på et bestemt øyeblikk snarere enn den "diakroniske" studien av språkets utvikling gjennom historien.

Denne antagelsen ga opphav til det Roman Jakobson i 1929 kom til å betegne som "strukturalisme", der "ethvert sett med fenomener som undersøkes av samtidsvitenskap, behandles ikke som en mekanisk agglomerasjon, men som en strukturell helhet, den mekaniske oppfatningen av prosesser gir etter for spørsmålet. av deres funksjon" ("Romantic" 711). I denne passasjen artikulerer Jakobson Saussures intensjon om å definere lingvistikk som et vitenskapelig system i motsetning til en enkel, "mekanisk" regnskapsføring av historiske ulykker. Sammen med dette beskriver Jakobson også den andre grunnleggende antakelsen i Saussurean - vi kan kaller det nå "strukturell" - lingvistikk: at de grunnleggende elementene i språket bare kan studeres i forhold til deres funksjoner i stedet for i forhold til deres årsaker. Europeiske "ord"), disse hendelsene og enhetene må plasseres innenfor et systemisk rammeverk. der de er relatert til andre såkalte hendelser og entiteter. Dette er en radikal reorientering når det gjelder oppfatning av erfaring og fenomener, en hvis betydning filosofen Ernst Cassirer har sammenlignet med "den nye vitenskapen om Galileo som i det syttende århundre forandret hele vår konseptet om den fysiske verden" (sitert i Culler, Pursuit 2 4). Denne endringen, som Greimas og Courtés bemerker, gjenoppfatter "tolkning" og gjenoppfatter dermed forklaring og forståelse selv. I stedet for at forklaring "er i form av et fenomens årsaker, slik at det som en "effekt" på noen måter er underordnet dets årsaker, består forklaringen her i å underordne et fenomen til dets fremtidsorienterte "funksjon" eller "hensikt." Forklaring er ikke lenger uavhengig av menneskelige intensjoner eller hensikter (selv om disse intensjonene kan være upersonlige, felles eller, i freudianske termer, "ubevisste").

I sin lingvistikk oppnår Saussure denne transformasjonen spesifikt i redefinisjonen av det lingvistiske "ordet", som han beskriver som det lingvistiske "tegnet" og definerer i funksjonalistiske termer. Tegnet, hevder han, er foreningen av "et konsept og et lydbilde", som han kalte "signified and signifier" (66-67; Roy Harris' oversettelse fra 1983 tilbyr begrepene "signification" og "signal"). Naturen til deres "kombinasjon" er "funksjonell" ved at verken den betegnede eller betegneren er "årsaken" til den andre; snarere, "hver sine verdier fra den andre" (8). språkelementet, tegnet , relasjonelt og gjør den grunnleggende antagelsen om historisk lingvistikk, nemlig identiteten til de elementære enhetene av språk og betydning (dvs. "ord"), gjenstand for streng analyse. Ordet "tre" som det "samme" ordet er ikke fordi ordet er definert av iboende kvaliteter - det er ikke en "mekanisk agglomerasjon" av slike kvaliteter - men fordi det er definert som et element i et system, språkets "strukturelle helhet".

En slik relasjonell (eller "diakritisk") definisjon av en enhet styrer oppfatningen av alle elementene i språket i strukturell lingvistikk. Dette er tydeligst i den mest imponerende prestasjonen til saussureansk lingvistikk, utviklingen av begrepene "fonemene" og "særtrekkene" til språket. Fonemer er de minste artikulerte og betegnende enhetene i et språk. Det er ikke lydene som forekommer i språket, men "lydbildene" Saussure nevner, som blir oppfattet av høyttalere - fenomenalt oppfattet - som meningsformidler. (Dermed beskriver Elmar Holenstein Jakobsons lingvistikk, som følger Saussure på viktige måter, som «fenomenologisk strukturalisme.») Det er av denne grunn at den ledende talspersonen for Praha skolestrukturalisme, Jan Mukarovsky, i 1937 bemerket at «struktur . . . er en fenomenologisk og ikke en empirisk virkelighet; det er ikke verket i seg selv, men et sett av funksjonelle relasjoner som er lokalisert i bevisstheten til et kollektiv (generasjon, miljø, etc.)" (sitert i Galan 35). Likeledes Lévi-Strauss, den ledende talspersonen for fransk strukturalisme , bemerket i 1960 at "struktur ikke har noe distinkt innhold; den er tilfreds med seg selv, og den logiske organisasjonen den er arrestert i, er tenkt som en eiendom til det virkelige» (167; se også Jakobson, Fundamentals 27-28).

Fonemer, altså de minste merkbare elementene i språket, er ikke positive objekter, men en «fenomenologisk virkelighet». På engelsk, for eksempel, kan fonemet /t/ uttales på mange forskjellige måter, men i alle tilfeller vil en engelsktalende gjenkjenne at det fungerer som en /t/. En aspirert t (dvs. en t uttalt med en h-lignende pust etter seg), en høy eller lav t-lyd, en utvidet t-lyd, og så videre, vil alle fungere på samme måte for å skille betydningen av "to" og "do" på engelsk. Dessuten er forskjellene mellom språk slik at fonologiske variasjoner i ett språk kan utgjøre distinkte fonemer i et annet; dermed skiller engelsk mellom /l/ og /r/, mens andre språk er så strukturert at disse artikulasjonene betraktes som varianter av samme fonem (som aspirert og uaspirert t på engelsk). I hvert naturlig språk er det store antallet mulige ord en kombinasjon av et lite antall fonemer. Engelsk, for eksempel, har mindre enn 40 fonemer som til sammen danner over en million forskjellige ord.

Språkets fonem er i seg selv systematisk organiserte strukturer av funksjoner. På 1920- og 1930-tallet, etter Saussures ledelse, isolerte Jakobson og N. S. Trubetzkoy de "egenartede trekkene" til fonemer. Disse trekkene er basert på den fysiologiske strukturen til taleorganene - tunge, tenner, stemmebånd og så videre - som Saussure nevner i Kurset og som Harris beskriver som "fysiologisk fonetikk" (39; Baskins tidligere oversettelse bruker begrepet "fonologi" [(1959) 38]) - og de kombineres i "bunter" av binære motsetninger for å danne fonemer. For eksempel, på engelsk er forskjellen mellom /t/ og /d/ tilstedeværelsen eller fraværet av "stemme" (engasjementet til stemmebåndene), og på stemmenivået definerer disse fonemene hverandre gjensidig. På denne måten er fonologi et konkret eksempel på en generell språkregel beskrevet av Saussure: I språket er det bare forskjeller. enda viktigere: en forskjell innebærer generelt positive termer som forskjellen er satt opp mellom; men i språket er det bare forskjeller uten positive termer. Enten vi tar det betegnede eller det betegnende, har språket verken ideer eller lyder som eksisterte før det språklige systemet. ( 120)

I dette rammeverket bestemmes språklige identiteter ikke av iboende kvaliteter, men av systemiske ("strukturelle") forhold.

Jeg har sagt at fonologien "fulgte ledetråden" til Saussure, for selv om analysen hans av fysiologien til språkproduksjon "i dag ville," som Harris sier, "bli kalt "fysisk", i motsetning til enten "psykologisk" eller "funksjonell". "" (lesing 49), følgelig artikulerte han i kurset retningen og konturene til en funksjonell analyse av språk. Tilsvarende var hans eneste utvidede publiserte verk, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir om det primitive systemet med vokaler i indoeuropeiske språk), som dukket opp i 1878, fullt ut plassert innenfor prosjektet til det nittende- århundres historisk lingvistikk. Likevel, innenfor dette arbeidet, som Jonathan Culler har hevdet, demonstrerte Saussure "fruktbarheten ved å tenke på språk som et system av rent relasjonelle elementer, selv når han jobbet med oppgaven med historisk rekonstruksjon" (Saussure 66). Ved å analysere de systematiske strukturelle relasjonene mellom fonemer for å redegjøre for mønstre av vokalveksling i eksisterende indoeuropeiske språk, antydet Saussure at i tillegg til flere forskjellige fonemer /a/, må det ha vært et annet fonem som kunne beskrives formelt. "Det som gjør Saussures arbeid så veldig imponerende," konkluderer Culler, "er det faktum at nesten femti år senere, da kileskriftet Hittite ble oppdaget og dechiffrert, ble det funnet å inneholde et fonem, skrevet h, som oppførte seg slik Saussure hadde spådd. . Han hadde oppdaget, ved en rent formell analyse, det som nå er kjent som strupehodene til indoeuropeisk» (66).

Denne oppfatningen av den relasjonelle eller diakritiske bestemmelsen av betydningselementene, som er både implisitt og eksplisitt i kurset, antyder en tredje antakelse som styrer strukturell lingvistikk, det Saussure kaller "tegnets vilkårlige natur." Med dette mener han at forholdet mellom betegneren og betegnet i språket aldri er nødvendig (eller "motivert"): man kunne like gjerne finne lydbetegneren arbre som betegnelsestreet for å forene seg med begrepet "tre". Men mer enn dette betyr det at det betegnede også er vilkårlig: man kan like gjerne definere begrepet "tre" ut fra dens treaktige kvalitet (som vil ekskludere palmer) som ved størrelsen (som ekskluderer de "lave treplantene" vi kalle busker). Dette bør gjøre det klart at nummereringen av forutsetningene jeg har presentert ikke representerer en prioriteringsrekkefølge: hver antakelse - den systemiske karakteren av betydning (best oppfattet ved å studere språket "synkront"), den relasjonelle eller "diakritiske" naturen til elementene av betydning, tegnenes vilkårlige natur - henter sin verdi fra de andre.

Det vil si saussureansk lingvistikk fenomenene den studerer i overordnede forhold mellom kombinasjon og kontrast i språk. I denne oppfatningen er språk både prosessen med å artikulere mening (betydelse) og dets produkt (kommunikasjon), og disse to funksjonene til språket er verken identiske eller fullstendig kongruente (se Schleifer, "Dekonstruksjon"). Her kan vi se vekslingen mellom form og innhold som Greimas og Courtés beskriver i modernistisk tolkning: språket presenterer kontraster som formelt definerer dets enheter, og disse enhetene kombineres på etterfølgende nivåer for å skape det betydningsfulle innholdet. Siden språkets elementer er vilkårlige, kan dessuten verken kontrast eller kombinasjon sies å være grunnleggende. I språk kombineres således karakteristiske trekk for å danne kontrasterende fonemer på et annet nivå av forståelse, fonemer kombineres for å danne kontrasterende morfemer, morfemer kombineres for å danne ord, ord kombineres for å danne setninger, og så videre. I hvert tilfelle er hele fonemet, eller ordet, eller setningen, og så videre, større enn summen av delene (akkurat som vann, H2O, i Saussures eksempel [(1959) 103] er mer enn den mekaniske agglomerasjonen av hydrogen og oksygen).

De tre forutsetningene for kurset i generell lingvistikk førte til at Saussure etterlyste en ny vitenskap fra det tjuende århundre som ville gå utover lingvistisk vitenskap for å studere «tegns liv i samfunnet». Saussure kalte denne vitenskapen "semiologi (fra gresk semeîon "tegn")" (16). "Vitenskapen" om semiotikk, slik den kom til å bli praktisert i Øst-Europa på 1920- og 1930-tallet og Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære artefakter utgjort (eller artikulert) av disse strukturene. Gjennom den sene delen av karrieren, selv mens han tilbød kursene i generell lingvistikk, forfulgte Saussure sin egen "semiotiske" analyse av sen latinsk poesi i et forsøk på å oppdage bevisst skjulte anagrammer av egennavn. Studiemetoden var på mange måter det motsatte av den funksjonelle rasjonalismen i hans språklige analyser: den forsøkte, som Saussure nevner i en av de 99 notatbøkene der han forfulgte denne studien, å systematisk undersøke problemet med "tilfeldighet", som " blir det uunngåelige grunnlaget for alt" (sitert i Starobinski 101). En slik studie, som Saussure selv sier, fokuserer på "det materielle faktum" om tilfeldigheter og mening (sitert 101), slik at "temaordet" hvis anagram Saussure søker, som Jean Starobinski hevder, "er, for poeten , et instrument, og ikke en livsviktig kime til diktet. Diktet kreves for å gjenbruke lydmaterialet til temaordet" (45). I denne analysen sier Starobinski: "Saussure mistet seg ikke i et søk etter skjulte betydninger." I stedet ser hans arbeid ut til å demonstrere et ønske om å unndra alle problemene som oppstår fra bevissthet: "Siden poesi ikke bare realiseres i ord, men er noe født av ord, unnslipper den bevissthetens vilkårlige kontroll for å avhenge utelukkende av en slags språklig lovlighet. "(121).

Det vil si Saussures forsøk på å oppdage egennavn i sen latinsk poesi - det Tzvetan Todorov kaller reduksjonen av et "ord . . . til dets signifier" (266) - understreker et av elementene som styrte hans språklige analyse, tegnets vilkårlige natur. (Det understreker også den formelle naturen til saussureansk lingvistikk - "Språk," hevder han, "er en form og ikke en substans" - som effektivt eliminerer semantikk som et hovedobjekt for analyse.) Som Todorov konkluderer, fremstår Saussures arbeid bemerkelsesverdig homogent i dag i sin avvisning av å akseptere symbolske fenomener. . . . I sin forskning på anagrammer tar han kun hensyn til fenomenene repetisjon, ikke til evokasjon. . . . I sine studier av Nibelungen gjenkjenner han symboler bare for å tilskrive dem feillesninger: siden de ikke er tilsiktet, eksisterer ikke symboler. Til slutt i sine kurs om generell lingvistikk tenker han på eksistensen av semiologi, og dermed av andre tegn enn lingvistiske; men denne bekreftelsen er umiddelbart begrenset av det faktum at semiologi er viet til en enkelt type tegn: de som er vilkårlige. (269–70)

Hvis dette er sant, er det fordi Saussure ikke kunne tenke seg "intensjon" uten et subjekt; han kunne ikke helt unnslippe motsetningen mellom form og innhold, arbeidet hans gjorde så mye for å stille spørsmål. I stedet tyr han til «språklig lovlighet». Plassert mellom på den ene siden 1800-tallets forestillinger om historie, subjektivitet og den kausale tolkningsmåten styrt av disse forestillingene, og på den andre siden 1900-tallets "strukturalistiske" forestillinger om det Lévi-Strauss kalte "kantianisme uten et transcendentalt subjekt" (sitert i Connerton 23) - begreper som sletter motsetningen mellom form og innhold (eller subjekt og objekt) og hierarkiet av forgrunn og bakgrunn i fullverdig strukturalisme, psykoanalyse og til og med kvantemekanikk - arbeidet til Ferdinand de Saussure i lingvistikk og semiotikk avgrenser et signalmoment i studiet av mening og kultur.

Ronald Schleifer

Vedlegg 2

Ferdinand de Saussure (oversettelse)

Den sveitsiske lingvisten Ferdinand de Saussure (1857-1913) regnes som grunnleggeren av moderne lingvistikk - takket være hans forsøk på å beskrive språkets struktur, snarere enn historien til individuelle språk og ordformer. I det store og hele ble grunnlaget for strukturelle metoder innen lingvistikk og litteraturkritikk og i stor grad semiotikk lagt i verkene hans helt på begynnelsen av det tjuende århundre. Det er bevist at metodene og konseptene for den såkalte "poststrukturalismen", utviklet i verkene til Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes og andre, går tilbake til de språklige verkene til Saussure og anagrammatiske lesninger av senromersk poesi. Det bør bemerkes at Saussures arbeid med lingvistikk og lingvistisk tolkning bidrar til å koble sammen et bredt spekter av intellektuelle disipliner - fra fysikk til litterære nyvinninger, psykoanalyse og filosofi fra det tidlige tjuende århundre. A. J. Greimas og J. Kurte skriver i Semiotics and Language: «En analytisk ordbok med tittelen «Interpretation» som en ny type tolkning dukket opp på begynnelsen av 1900-tallet sammen med lingvistikken til Saussure, fenomenologien til Husserl og psykoanalysen. av Freud. I et slikt tilfelle er "tolkning ikke å tilskrive et gitt innhold til en form som ellers ville mangle en; snarere er det en parafrase som på en annen måte formulerer det samme innholdet i et betydelig element i et gitt semiotisk system" (159 ). I denne forståelsen av «tolkning» er form og innhold uadskillelige; tvert imot er hver form fylt med semantisk mening ("meningsfull form"), så tolkningen tilbyr en ny, lignende gjenfortelling av noe meningsfylt i et annet tegnsystem.

En lignende forståelse av form og innhold, presentert av Claude Lévi-Strauss i et av strukturalismens programmatiske verk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan sees i Saussures posthume bok, A Course in Generell lingvistikk (1916, overs., 1959, 1983). I løpet av hans levetid publiserte Saussure lite, "Course" - hans hovedverk - ble samlet fra notatene til studenter som deltok på forelesningene hans om generell språkvitenskap i 1907-11. I kurset ba Saussure om en "vitenskapelig" studie av språk, og kontrasterte det med komparativ-historisk lingvistikk fra det nittende århundre. Dette verket kan betraktes som en av de største prestasjoner av vestlig tankegang: å ta utgangspunkt i individuelle ord som de strukturelle elementene i språket, beviste historisk (eller "diakronisk") lingvistikk opprinnelsen og utviklingen av vesteuropeiske språk fra et felles, indoeuropeisk språk – og et tidligere proto-indoeuropeisk.

Det er nettopp denne studien av den unike forekomsten av ord, med den samtidige antakelsen om at språkets grunnleggende "enhet" faktisk er den positive eksistensen av disse "ordelementene" som Saussure stilte spørsmål ved. Arbeidet hans var et forsøk på å redusere de mange fakta om språk som tilfeldig ble studert av komparativ lingvistikk til et lite antall teoremer. Den komparative filologiske skolen på 1800-tallet, skriver Saussure, "lyktes ikke i å skape en virkelig skole for lingvistikk" fordi "den ikke forsto essensen av studieobjektet" (3). Denne «essensen», hevder han, ligger ikke bare i enkeltord – språkets «positive substanser» – men også i de formelle forbindelsene som hjelper disse substansene til å eksistere.

Saussures «test» av språk er basert på tre forutsetninger. For det første er den vitenskapelige forståelsen av språk ikke basert på et historisk, men på et strukturelt fenomen. Derfor skilte han mellom individuelle språkfenomener - "talehendelser", som han definerer som "parole" - og det riktige, etter hans mening, studieobjektet for lingvistikk, systemet (kode, struktur) som kontrollerer disse hendelsene ( "langue"). En slik systematisk studie krever dessuten en «synkron» oppfatning av forholdet mellom språkets elementer i et gitt øyeblikk, snarere enn en «diakron» studie av språkets utvikling gjennom dets historie.

Denne hypotesen var forløperen til det Roman Jakobson i 1929 ville kalle "strukturalisme" - en teori der "ethvert sett av fenomener som er undersøkt av moderne vitenskap betraktes ikke som en mekanisk akkumulering, men som en strukturell helhet der den konstruktive komponenten er korrelert med funksjonen" ("Romantisk "711). I denne passasjen formulerte Jakobson Saussures idé om å definere språk som en struktur, i motsetning til den "mekaniske" oppregningen av historiske hendelser. I tillegg utvikler Jakobson en annen saussureansk antagelse, som ble forløperen til strukturell lingvistikk: de grunnleggende elementene i språket bør studeres ikke så mye med deres årsaker, men med deres funksjoner. Separate fenomener og hendelser (for eksempel historien om opprinnelsen til individuelle indoeuropeiske ord) bør studeres ikke av seg selv, men i et system der de er korrelert med lignende komponenter. Dette var en radikal vending i sammenligningen av fenomener med den omgivende virkeligheten, hvis betydning filosofen Ernst Cassirer sammenlignet med "vitenskapen om Galileo, som i det syttende århundre veltet ideer om den materielle verden." følgelig selve forklaringene. Fenomener begynte å bli tolket ikke i forhold til årsakene til deres forekomst, men i forhold til effekten de kan ha i nåtid og fremtid. Tolkning sluttet å være uavhengig av en persons intensjoner (til tross for at intensjoner kan være upersonlige, «bevisstløs» i freudiansk betydning av ordet).

I sin lingvistikk viser Saussure spesielt denne vendingen i endringen i begrepet ordet i lingvistikken, som han definerer som et tegn og beskriver i form av dets funksjoner. Et tegn for ham er en kombinasjon av lyd og mening, «signified and designation» (66-67; i den engelske oversettelsen av 1983 av Roy Harris – «signification» og «signal»). Naturen til denne forbindelsen er "funksjonell" (verken det ene eller det andre elementet kan eksistere uten hverandre); dessuten «låner den ene egenskaper av den andre» (8). Dermed definerer Saussure det viktigste strukturelle elementet i språket - tegnet - og gjør grunnlaget for historisk lingvistikk til identiteten til tegn til ord, noe som krever en spesielt streng analyse. Derfor kan vi forstå forskjellige betydninger av for eksempel det samme ordet "tre" - ikke fordi ordet bare er et sett av visse kvaliteter, men fordi det er definert som et element i tegnsystemet, i den "strukturelle helheten", i språket.

Et slikt relativt ("diakritisk") enhetsbegrep ligger til grunn for begrepet alle språkelementer i strukturell lingvistikk. Dette er spesielt tydelig i den mest originale oppdagelsen av saussureansk lingvistikk, i utviklingen av begrepet "fonem" og "særtegn" ved språk. Fonemer er den minste av de talte og meningsfulle språkenhetene. De er ikke bare lyder som forekommer i språket, men «lydbilder», bemerker Saussure, som av morsmålsbrukere oppfattes som å ha mening. (Det skal bemerkes at Elmar Holenstein kaller Jakobsons lingvistikk, som viderefører Saussures ideer og begreper i sine hovedbestemmelser, for «fenomenologisk strukturalisme»). Det er derfor den ledende foredragsholderen ved Praha-skolen for strukturalisme, Jan Mukarowski, i 1937 observerte at «struktur. . . ikke et empirisk, men et fenomenologisk begrep; det er ikke resultatet i seg selv, men et sett av betydelige relasjoner til den kollektive bevisstheten (generasjon, andre, etc.)”. En lignende tanke ble uttrykt i 1960 av Lévi-Strauss, lederen av fransk strukturalisme: «Strukturen har ikke noe bestemt innhold; den er meningsfull i seg selv, og den logiske konstruksjonen den er innelukket i er virkelighetens avtrykk.

På sin side representerer fonemer, som de minste språklige elementene som er akseptable for persepsjon, en separat integrert "fenomenologisk virkelighet". For eksempel på engelsk kan lyden "t" uttales annerledes, men i alle tilfeller vil en person som snakker engelsk oppfatte den som "t". Aspirert, hevet eller senket, en lang "t"-lyd osv. vil like mye skille betydningen av ordene "å" og "gjøre". Dessuten er forskjellene mellom språk slik at varianter av en lyd på ett språk kan svare til forskjellige fonemer på et annet; for eksempel er "l" og "r" på engelsk forskjellige, mens de på andre språk er varianter av samme fonem (som det engelske "t", uttalt med og uten aspirasjon). Det enorme vokabularet til ethvert naturlig språk er et sett med kombinasjoner av et mye mindre antall fonemer. På engelsk, for eksempel, brukes bare 40 fonemer til å uttale og skrive omtrent en million ord.

Lydene til et språk er et systematisk organisert sett med funksjoner. På 1920-1930-tallet, etter Saussure, pekte Jacobson og N.S. Trubetskoy ut de "særeegenskapene" til fonemer. Disse funksjonene er basert på strukturen til taleorganene - tunge, tenner, stemmebånd - Saussure merker dette i "Course of General Linguistics", og Harris kaller det "fysiologisk fonetikk" (i Baskins tidligere oversettelse, begrepet "fonologi" " brukes) - de er koblet i "knuter » durg mot en venn for å lage lyder. For eksempel, på engelsk, er forskjellen mellom "t" og "d" tilstedeværelsen eller fraværet av "stemme" (spenningen i stemmebåndene), og stemmenivået som skiller ett fonem fra et annet. Dermed kan fonologi betraktes som et eksempel på den generelle språkregelen beskrevet av Saussure: «Det er bare forskjeller i språket». Enda viktigere er ikke dette: forskjellen innebærer vanligvis de nøyaktige forholdene den befinner seg mellom; men i språket er det bare forskjeller uten presise betingelser. Enten vi vurderer «betegnelse» eller «betegnet» – i språket er det verken begreper eller lyder som ville eksistert før utviklingen av språksystemet.

I en slik struktur defineres språklige analogier ikke ved hjelp av deres iboende kvaliteter, men ved hjelp av systemmessige ("strukturelle") relasjoner.

Jeg har allerede nevnt at fonologien i sin utvikling var avhengig av Saussures ideer. Selv om analysen hans av lingvistisk fysiologi i moderne tid, sier Harris, "ville bli kalt 'fysisk', i motsetning til 'psykologisk' eller 'funksjonell', artikulerte han i The Course tydelig retningen og grunnleggende prinsipper for funksjonell analyse av språk. Hans eneste publiserte verk i løpet av hans levetid, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Notater om det originale vokalsystemet på de indoeuropeiske språkene), utgitt i 1878, var helt i tråd med komparativ historisk lingvistikk av 1800-tallet. Likevel, i dette arbeidet, sier Jonathan Culler, viste Saussure "fruktbarheten av ideen om språk som et system av sammenkoblede fenomener, selv med dens historiske rekonstruksjon." Ved å analysere forholdet mellom fonemer, forklarte vekslingen av vokaler i de moderne språkene til den indoeuropeiske gruppen, foreslo Saussure at i tillegg til flere forskjellige lyder "a", må det være andre fonemer beskrevet formelt. "Det som gjør et spesielt inntrykk i Saussures arbeid," konkluderer Kaller, "er at nesten 50 år senere, da hettittisk kileskrift ble oppdaget og dechiffrert, ble det funnet et fonem, skriftlig betegnet med "h", som oppførte seg slik Saussure forutså. Gjennom formell analyse oppdaget han det som nå er kjent som den gutturale lyden i de indoeuropeiske språkene.

I konseptet med en relativ (diakritisk) definisjon av tegn, både eksplisitt og underforstått i kurset, er det en tredje nøkkelantakelse for strukturell lingvistikk, kalt av Saussure "tegnets vilkårlige natur." Med dette menes at forholdet mellom lyd og mening i språket ikke er motivert av noe som helst: man kan like gjerne koble ordet «arbre» ​​og ordet «tre» med begrepet «tre». Dessuten betyr dette at lyden også er vilkårlig: man kan definere begrepet "tre" ved tilstedeværelsen av bark (unntatt for palmetrær) og etter størrelse (bortsett fra "lave treplanter" - busker). Fra dette bør det være klart at alle antakelsene jeg presenterer ikke er delt inn i mer og mindre viktige: hver av dem - den systemiske naturen til tegn (mest forståelig i den "synkrone" studien av språket), deres relative (diakritiske) essens , den vilkårlige naturen til tegn - kommer fra fra resten.

I saussureansk lingvistikk blir det studerte fenomenet forstått som et sett med sammenligninger og motsetninger av språk. Språk er både et uttrykk for betydningen av ord (betegnelse) og deres resultat (kommunikasjon) – og disse to funksjonene faller aldri sammen (se Shleifers «Dekonstruksjon av språk»). Vi kan se vekslingen av form og innhold som Greimas og Kurte beskriver i siste versjon av tolkning: språklige kontraster definerer dens strukturelle enheter, og disse enhetene samhandler på suksessive nivåer for å skape et visst meningsfullt innhold. Siden elementene i språket er tilfeldige, kan verken kontrast eller kombinasjon være grunnlaget. Dette betyr at i et språk danner særtrekk en fonetisk kontrast på et annet forståelsesnivå, fonemer kombineres til kontrasterende morfemer, morfemer - til ord, ord - til setninger osv. I alle fall et helt fonem, ord, setning osv. er mer enn summen av delene (akkurat som vann, i Saussures eksempel, er mer enn en kombinasjon av hydrogen og oksygen).

Tre forutsetninger fra "Course of General Linguistics" førte Saussure til ideen om en ny vitenskap fra det tjuende århundre, atskilt fra lingvistikk, og studerte "livet til tegn i samfunnet." Saussure kalte denne vitenskapen semiologi (fra gresk "semeîon" - et tegn). "Vitenskapen" om semiotikk, som utviklet seg i Øst-Europa på 1920- og 1930-tallet og i Paris på 1950- og 1960-tallet, utvidet studiet av språk og språklige strukturer til litterære funn sammensatt (eller formulert) med disse strukturene. I tillegg, i skumringen av sin karriere, parallelt med kurset i generell lingvistikk, engasjerte Saussure seg i en "semiotisk" analyse av senromersk poesi, og prøvde å oppdage bevisst komponerte anagrammer av egennavn. Denne metoden var på mange måter det motsatte av rasjonalisme i dens språklige analyse: den var et forsøk, som Saussure skriver i en av de 99 notatbøkene, å studere i systemet problemet med «sannsynlighet», som «blir grunnlaget for alt. " En slik undersøkelse, hevder Saussure selv, bidrar til å fokusere på den «virkelige siden» av sannsynlighet; «Nøkkelordet» som Saussure leter etter et anagram for er, ifølge Jean Starobinsky, «et verktøy for poeten, og ikke kilden til liv for diktet. Diktet tjener til å snu lydene til nøkkelordet. I følge Starobinsky fordyper ikke Saussure i denne analysen søket etter skjulte betydninger. Tvert imot, i hans verk er et ønske om å unngå spørsmål knyttet til bevissthet merkbart: «siden poesi ikke bare uttrykkes i ord, men også i det disse ordene gir opphav til, går den utenfor bevissthetens kontroll og avhenger kun av språkets lover."

Saussures forsøk på å studere egennavn i senromersk poesi (Tsvetan Todorov kalte dette en forkortelse av "et ord ... bare før det er skrevet") understreker en av komponentene i hans språklige analyse - tegnenes vilkårlige natur, samt den formelle essensen av saussureansk lingvistikk ("Språk," hevder han, "essensen av formen, ikke fenomenet"), som utelukker muligheten for å analysere meningen. Todorov konkluderer med at Saussures skrifter i dag virker bemerkelsesverdig konsistente i deres motvilje mot å studere symboler [fenomener som har en veldefinert betydning]. . . . Ved å utforske anagrammer, legger Saussure kun hensyn til repetisjon, men ikke til tidligere alternativer. . . . Ved å studere Nibelungenlied, definerer han symbolene bare for å tilordne dem til feilavlesninger: hvis de er utilsiktede, eksisterer ikke symbolene. Tross alt, i sine skrifter om generell lingvistikk, gjør han antagelsen om eksistensen av en semiologi som ikke bare beskriver språklige tegn; men denne antagelsen er begrenset av det faktum at semilogi bare kan beskrive tilfeldige, vilkårlige tegn.

Hvis dette virkelig er slik, er det bare fordi han ikke kunne forestille seg "intensjon" uten et objekt; han klarte ikke helt å bygge bro mellom form og innhold – i hans forfatterskap ble dette til et spørsmål. I stedet vendte han seg mot «språklig legitimitet». Mellom på den ene siden begrepene fra det nittende århundre basert på historie og subjektive formodninger, og metodene for tilfeldig tolkning basert på disse begrepene, og på den annen side de strukturalistiske begrepene som Lévi-Strauss kalte "Kantianisme uten en transcendent skuespiller" - sletter konfrontasjonen mellom form og innhold (subjekt og objekt), mening og opprinnelse i strukturalisme, psykoanalyse og til og med kvantemekanikk - verkene til Ferlinand de Saussure om lingvistikk og semiotikk markerer et vendepunkt i studiet av betydninger i språk og kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunnleggende om teorien om grammatikk / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiske metoder i lingvistikk. M., 1974.

4. Arnold I.V. Den semantiske strukturen til ordet i moderne engelsk og metodikken for studien. /I.V. Arnold-L .: Utdanning, 1966. - 187 s.

6.Bashlykov A.M. Automatisk oversettelsessystem. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 s.

7.Baudouin de Courtenay: Teoretisk arv og modernitet: Sammendrag av rapportene fra den internasjonale vitenskapelige konferansen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 s.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 s.

9. Golovin, B.N. Språk og statistikk. /B.N. Golovin - M., 1971. - 210 s.

10. Zvegintsev, V.A. Teoretisk og anvendt lingvistikk. / V.A. Zvegintsev - M., 1969. - 143 s.

11. Kasevich, V.B. Semantikk. Syntaks. Morfologi. // V.B. Kasevich - M., 1988. - 292 s.

12. Lekomtsev Yu.K. Introduksjon til lingvistikkens formelle språk / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 s.

Matveeva G.G. Skjulte grammatiske betydninger og identifikasjon av den sosiale personen («portrett») til taleren / G.G. Matveev. - Rostov, 1999. - 174 s.

14. Melchuk, I.A. Erfaring med å bygge språklige modeller "Meaning Text"./ I.A. Melchuk. - M., 1974. - 145 s.

15. Nelyubin L.L. Oversettelse og anvendt lingvistikk / L.L. Nelyubin. - M.: Høyere skole, 1983. - 207 s.

16. Om de eksakte metodene for språkforskning: om den såkalte "matematiske lingvistikken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva og andre - M., 1961. - 162 s.

17. Piotrovsky L.G. Matematisk lingvistikk: Lærebok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Høyere skole, 1977. - 160 s.

18. Han er. Tekst, maskin, person. - L., 1975. - 213 s.

19. Han er. Anvendt lingvistikk / Ed. A.S. Gerda. - L., 1986. - 176 s.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Moderne strukturell lingvistikk. Problemer og metoder. M., 1977. - 239 s.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunnleggende om generell og maskinoversettelse / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 s.

22. Slyusareva N.A. Teorien til F. de Saussure i lys av moderne lingvistikk / N.A. Slyusareva. - M.: Nauka, 1975. - 156 s.

23. Ugle, L.Z. Analytisk lingvistikk / L.Z. Ugle - M., 1970. - 192 s.

24. Saussure F. de. Notater om generell lingvistikk / F. de Saussure; Per. fra fr. - M.: Fremskritt, 2000. - 187 s.

25. Han er. Kurs i generell lingvistikk / Pr. fra fr. - Jekaterinburg, 1999. -426 s.

26. Talestatistikk og automatisk tekstanalyse / Red. utg. R.G. Piotrovsky. L., 1980. - 223 s.

27. Stoll, P. Setter. Logikk. Aksiomatiske teorier. / R. Stoll; Per. fra engelsk. - M., 1968. - 180 s.

28. Tenier, L. Fundamentals of strukturell syntaks. M., 1988.

29. Ubin I.I. Automatisering av oversettelsesaktiviteter i USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 s.

30. Faure, R., Kofman, A., Denis-Papin, M. Moderne matematikk. M., 1966.

31. Shenk, R. Behandling av konseptuell informasjon. M., 1980.

32. Shikhanovich, Yu.A. Introduksjon til moderne matematikk (initielle begreper). M., 1965

33. Shcherba L.V. Russiske vokaler i kvalitative og kvantitative termer / L.V. Shcherba - L.: Nauka, 1983. - 159 s.

34. Abdullah-zade F. Verdensborger // Spark - 1996. - Nr. 5. - s.13

35. V.A. Uspensky. Foreløpig for leserne av "New Literary Review" til de semiotiske meldingene til Andrei Nikolaevich Kolmogorov. - Ny litterær anmeldelse. -1997. - nr. 24. - S. 18-23

36. Perlovsky L. Bevissthet, språk og kultur. - Kunnskap er makt. -2000. №4 - S. 20-33

37. Frumkina R.M. Om oss - på skrå. // Russian Journal. - 2000. - Nr. 1. - s. 12

38. Fitialov, S.Ya. Om syntaksmodellering i strukturell lingvistikk // Problems of Structural Linguistics. M., 1962.

39. Han er. Om ekvivalensen av NN-grammatikk og avhengighetsgrammatikk // Problems of Structural Linguistics. M., 1967.

40. Chomsky, N. Logiske grunnlag for lingvistisk teori // Nytt i lingvistikk. Utgave. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. trykk. jhu.ru

46. ​​en.wikipedia.org

I løpet av det siste århundret har lingvistikk alltid blitt trukket frem som et eksempel på en vitenskap som utviklet seg raskt og svært raskt nådde metodisk modenhet. Allerede i midten av forrige århundre tok ung vitenskap trygt sin plass i kretsen av vitenskaper som hadde en tusenårig tradisjon, og en av dens mest fremtredende representanter - A. Schleicher - hadde mot til å tro at han med sine verker oppsummerte allerede den siste linjen.<113>Språkvitenskapens historie har imidlertid vist at en slik mening var for forhastet og uberettiget. På slutten av århundret gjennomgikk språkvitenskapen sitt første store sjokk knyttet til kritikken av nygrammatiske prinsipper, fulgt av andre. Det skal bemerkes at alle krisene som vi kan avdekke i språkvitenskapens historie, som regel ikke rokket ved grunnlaget, men tvert imot bidro til styrkingen og til slutt brakte med seg en foredling og forbedring av metodene for språklig forskning, utvidet sammen med temaer og vitenskapelige problemstillinger.

Men ved siden av lingvistikken levde og utviklet også andre vitenskaper seg, inkludert en lang rekke nye. De fysiske, kjemiske og tekniske (såkalte «eksakte») vitenskapene har fått en særlig rivende utvikling i vår tid, og deres teoretiske grunnlag, matematikken, har regjert over dem alle. De eksakte vitenskapene har ikke bare presset alle humaniora sterkt, men for tiden streber de etter å "bringe dem inn i deres tro", å underordne dem deres skikker, å påtvinge dem sine forskningsmetoder. I dagens situasjon, ved å bruke et japansk uttrykk, kan man si at nå sudler lingvister-filologer selve kanten av matten, der de eksakte vitenskapene, ledet av matematikk, triumferende og fritt befinner seg.

Ville det ikke vært mer hensiktsmessig fra et synspunkt av generelle vitenskapelige interesser å kapitulere for matematikken, å overgi seg helt til kraften i dens metoder, som noen stemmer åpenlyst kaller til 59, og derved kanskje få ny styrke? For å svare på disse spørsmålene, må vi først se på hva matematikken hevder i dette tilfellet, i hvilket område av lingvistikk matematiske metoder finner deres anvendelse, i hvilken grad de er i samsvar med spesifikasjonene til språkmaterialet og om de er i stand til å gi eller til og med bare foreslå svar på disse spørsmålene satt av språkvitenskapen.

Helt fra begynnelsen bør det bemerkes at blant entusiastene av den nye, matematiske trenden i lingvistikk<114>Det er ingen enstemmighet om dets mål og mål innen statisk forskning. Acad. A. A. Markov, som var den første som brukte matematiske metoder på språk, Boldrini, Yul, Mariotti anser språkelementer som egnet illustrerende materiale for å konstruere kvantitative metoder, eller for statistiske teoremer, uten i det hele tatt å lure på om resultatene av en slik studie er av interesse. til lingvister 6 0 . Ross mener at sannsynlighetsteori og matematisk statistikk gir et verktøy eller, som de nå foretrekker å si, en matematisk modell for å teste og bekrefte de språklige konklusjonene som tillater numerisk tolkning. Matematiske metoder er derfor kun tenkt som hjelpemidler for språkforskning 6 1 . Mye mer hevdes av Herdan, som i sin bok ikke bare oppsummerte og systematiserte alle forsøk på matematisk studie av språkproblemer, men også forsøkte å gi dem en klar orientering i forhold til videre arbeid. Han fokuserer presentasjonen av hele materialet i boken sin på "å forstå litterær statistikk (som han kaller studiet av tekster ved metoder for matematisk statistikk. - AT 3.) som en integrert del av lingvistikken» 6 2, og formulerer essensen og oppgavene til denne nye delen i lingvistikk med følgende ord: «Litterær statistikk som en kvantitativ språkfilosofi er anvendelig for alle grener av lingvistikk. Litterær statistikk er etter vår mening strukturell lingvistikk hevet til nivået av en kvantitativ vitenskap eller en kvantitativ filosofi. Derfor er det like feil å definere resultatene som å være utenfor scope<115>lingvistikk eller behandle det som et hjelpeverktøy for forskning» 6 3 .

Det er neppe tilrådelig å gå inn på teoretisering om hvorvidt det er legitimt i dette tilfellet å snakke om fremveksten av en ny gren av lingvistikken og løse spørsmålet om dens påstander, uten først å referere til vurderingen av hva som faktisk har blitt gjort i denne. område, og til å avklare i hvilken retning anvendelsen av nye metoder 6 4 . Dette vil hjelpe oss å forstå meningsforskjellene.

Bruken av matematiske (eller, mer presist, statistiske) kriterier for å løse språklige problemer er på ingen måte nytt for språkvitenskapen og har i en eller annen grad lenge vært brukt av språkforskere. Tross alt, faktisk, slike tradisjonelle begreper om lingvistikk som fonetisk lov (og relaterte<116>nee med det - et unntak fra loven), produktiviteten til grammatiske elementer (for eksempel avledningssuffikser), eller til og med kriteriene for relaterte forhold mellom språk, til en viss grad, er basert på relative statistiske trekk. Jo skarpere og mer distinkt den statistiske motsetningen til de observerte tilfellene er, jo mer grunn har vi til å snakke om produktive og uproduktive suffikser, om den fonetiske loven og unntak fra den, om tilstedeværelse eller fravær av slektskap mellom språk. Men hvis det statistiske prinsippet i slike tilfeller ble brukt mer eller mindre spontant, begynte det i fremtiden å bli brukt bevisst og allerede med en viss målsetting. Så i vår tid har de såkalte frekvensordbøkene for vokabular og uttrykk for individuelle språk 6 5 eller til og med betydningen av flerspråklige ord med et "generelt fokus på virkeligheten" 6 6 blitt utbredt. Dataene til disse ordbøkene brukes til å kompilere fremmedspråklige lærebøker (hvis tekstene er bygget på det mest brukte ordforrådet) og minimumsordbøker. Statistisk kalkulus fant en spesiell språklig bruk i metoden for leksikostatistikk eller glottokronologi av M. Swadesh, der det, på grunnlag av statistiske formler som tar hensyn til tilfellene av forsvinning av ord fra hovedfondets språk, er mulig å etablere den absolutte kronologien for inndelingen av språkfamilier 6 7 .

De siste årene har tilfeller av anvendelse av matematiske metoder på språklig materiale økt betydelig, og i mengden av slike forsøk har mer eller mindre bestemte retninger blitt skissert. La oss snu<117>til deres sekvensielle vurdering, uten å gå i detaljer.

La oss starte med retningen som har fått navnet stilostatistikk. I dette tilfellet snakker vi om definisjonen og karakteriseringen av stiltrekkene til individuelle verk eller forfattere gjennom de kvantitative relasjonene til de språklige elementene som brukes. Den statistiske tilnærmingen til studiet av stilistiske fenomener er basert på forståelsen av litterær stil som en individuell måte å mestre språkets virkemidler på. Samtidig er forskeren fullstendig distrahert fra spørsmålet om den kvalitative betydningen av de tellbare språklige elementene, og fokuserer hele sin oppmerksomhet kun på den kvantitative siden; den semantiske siden av de studerte språkenhetene, deres emosjonelle og uttrykksfulle belastning, så vel som deres andel i stoffet til et kunstverk - alt dette forblir utenfor, refererer til de såkalte overflødige fenomenene. Dermed fremstår et kunstverk i form av et mekanisk aggregat, hvis spesifisitet til konstruksjonen finner sitt uttrykk bare gjennom de numeriske relasjonene til elementene. Representanter for stylostatistikk lukker ikke øynene for alle omstendighetene som er nevnt, og motsetter seg metodene til tradisjonell stilistikk, som utvilsomt inkluderer elementer av subjektivitet, med en enkelt kvalitet ved den matematiske metoden, som etter deres mening kompenserer for alle dens mangler - objektiviteten til de oppnådde resultatene. «Vi streber», skriver for eksempel V. Fuchs, «... å karakterisere stilen til språklige uttrykk med matematiske midler. For dette formålet bør det lages metoder, hvis resultater bør ha samme objektivitet som resultatene fra de eksakte vitenskapene ... Dette antyder at vi, i det minste til å begynne med, kun vil beskjeftige oss med formelle strukturelle kvaliteter, og ikke med det semantiske. innhold i språklige uttrykk . På denne måten vil vi få et system av ordinalrelasjoner, som i sin helhet vil være grunnlaget og utgangspunktet for den matematiske stilteorien» 6 8 .<118>

Den enkleste typen statistisk tilnærming til studiet av språket til forfattere eller individuelle verk er å telle ordene som brukes, siden rikdommen til ordboken tilsynelatende skal karakterisere forfatteren selv på en bestemt måte. Resultatene av slike beregninger gir imidlertid noe uventede resultater i denne forbindelse og bidrar ikke på noen måte til estetisk kunnskap og vurdering av et litterært verk, som ikke minst er en av stilistikkens oppgaver. Her er noen data om det totale antallet ord brukt i en rekke verk:

Bibelen (latinsk). . . . . . . . . . 5649 ord

Bibelen (hebraisk). . . . 5642 ord

Demosthenes (tale). . . . . . . . . . . . 4972 ord

Sallust. . . . . . . . . . . . . . . . . 3394 ord

Horace. . . . . . . . . . . . . . . . . . . .6084 ord

Dante (guddommelig komedie) 5860 ord

(dette inkluderer 1615 egennavn og geografiske navn)

Tasso (Furious Orland). . . . 8474 ord

Milton. . . . . . . . . . . . . . . . . . . . .8000 ord (ca. gitt)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 ord

(omtrent, ifølge andre kilder 20 000 ord)

O. Jespersen påpeker at ordboken til Zola, Kipling og Jack London betydelig overgår ordboken til Milton, det vil si at tallet er 8000 6 9 . Beregningen av ordboken over taler til USAs president W. Wilson fant at den er rikere enn Shakespeares. Til dette skal legges data fra psykologer. Dermed fant Terman, basert på observasjoner av et stort antall tilfeller, at ordforrådet til et gjennomsnittlig barn er omtrent 3600 ord, og i en alder av 14 - allerede 9000. Den gjennomsnittlige voksen bruker 11700 ord, og en person på "økt intelligens" opp til 13500 7 0 . Slike numeriske data gir derfor ikke i seg selv grunnlag for å identifisere verkens stilistiske kvaliteter og kun "objektivt"<119>de oppgir bruken av et forskjellig antall ord av forskjellige forfattere, som, som beregningene ovenfor viser, ikke er relatert til den relative kunstneriske verdien av deres verk.

Beregninger av den relative hyppigheten av bruken av ord hos individuelle forfattere er bygget noe annerledes. I dette tilfellet blir ikke bare den totale mengden ord tatt i betraktning, men også bruksfrekvensen av individuelle ord. Statistisk bearbeiding av materialet som er oppnådd på denne måten består i at ord med lik bruksfrekvens er gruppert i klasser (eller rekker), noe som fører til etablering av frekvensfordelingen av alle ord brukt av en gitt forfatter. Et spesielt tilfelle av denne typen beregning er bestemmelsen av den relative frekvensen av spesielle ord (for eksempel romansk vokabular i Chaucers verk, som ble gjort av Mersand 7 1). Den relative frekvensen av ordene brukt av forfatterne inneholder den samme objektive informasjonen om stilen til individuelle forfattere som de ovennevnte totalberegningene, med den eneste forskjellen at resultatet er mer nøyaktige numeriske data. Men det brukes også til å datere individuelle verk av samme forfatter på grunnlag av en foreløpig beregning av den relative hyppigheten av hans bruk av ord i ulike perioder av livet hans (i henhold til verk datert av forfatteren selv). En annen type bruk av data fra slike beregninger er å fastslå ektheten av forfatterskapet til verk som dette spørsmålet virker tvilsomt for 7 2 . I dette siste tilfellet er alt basert på en sammenligning av statistiske formler for bruksfrekvensen i ekte og kontroversielle verk. Det er ikke nødvendig å snakke om den veldig store relativiteten og omtrentligheten til resultatene oppnådd med slike metoder. Tross alt endres den relative bruksfrekvensen ikke bare med forfatterens alder, men også avhengig av sjangeren, plottet og også det historiske miljøet for handlingen til verket (sammenlign for eksempel "Brød" og "Peter" I" av A. Tolstoy).<120>

Ved å utdype metoden beskrevet ovenfor, begynte stilostatistikk som stilkarakteristikk å ty til kriteriet om stabilitet for den relative frekvensen til de mest brukte ordene. Metoden som brukes i dette tilfellet kan illustreres ved den statistiske behandlingen av Pushkins historie "Kapteinens datter" av Esselson og Epstein ved Institute of Slavic Languages ​​ved University of Detroit (USA) 7 3 . Hele teksten i historien (omtrent 30 000 forekomster av ord) ble gjenstand for undersøkelsen, og deretter passasjer som inneholdt rundt 10 000 og 5000 forekomster. Videre, for å bestemme stabiliteten til den relative frekvensen av bruken av ord, ble de 102 mest brukte ordene (med en frekvens på 1160 ganger til 35) sammenlignet med den beregnede relative frekvensen (laget på grunnlag av selektive passasjer) med den faktiske. For eksempel ble fagforeningen "og" brukt 1160 ganger gjennom historien. I en passasje som inneholder 5 000 forekomster av alle ord, bør denne konjunksjonen forventes å bli brukt 5 000 x 1 160:30 000, eller rundet opp 193 ganger, og i en passasje som inneholder 10 000 forekomster av alle ord, forventes den å bli brukt 1,1060 x 10,060 : 30 000, eller 386 ganger. Sammenligning av data oppnådd ved bruk av denne typen beregninger med faktiske data viser et svært lite avvik (innenfor 5%). Basert på slike beregninger ble det funnet at i denne historien av Pushkin brukes preposisjonen "k" dobbelt så ofte som "y", og pronomenet "du" brukes tre ganger oftere enn "dem", osv. Dermed , til tross for i det hele tatt omskiftelser i handlingen, både gjennom historien og i dens enkelte deler, er det en stabilitet i den relative hyppigheten av bruken av ord. Det som observeres i forhold til noen (vanligste) ord er antagelig gjeldende for alle ord som brukes i verket. Det følger at stilen til forfatteren kan karakteriseres av et visst forhold mellom variasjonen av den gjennomsnittlige frekvensen for bruk av et ord og den generelle frekvensen for et gitt språk.<121>hyppigheten av bruken. Dette forholdet betraktes som en objektiv kvantitativ karakteristikk av forfatterens stil.

Andre formelle elementer i språkstrukturen studeres på lignende måte. Så for eksempel underkastet V. Fuchs de metriske trekkene i verkene til Goethe, Rilke, Caesar, Sallust, etc. for en komparativ-statistisk vurdering.

Kriteriet om stabiliteten til den relative hyppigheten av bruken av ord, mens det tydeliggjør teknikken for kvantitativ karakterisering av stil, introduserer ikke noe fundamentalt nytt sammenlignet med de mer primitive metodene analysert ovenfor. Alle metoder for stylostatistikk gir til syvende og sist like lidenskapelige "objektive" resultater, og glir over overflaten av tungen og klamrer seg bare til rent ytre tegn. Kvantitative metoder er tilsynelatende ikke i stand til å fokusere på de kvalitative forskjellene i materialet som studeres og faktisk utjevne alle objektene som studeres.

Der maksimal spesifikasjon er nødvendig, tilbys de mest generaliserte kriteriene; kvalitative egenskaper uttrykkes i kvantitetsspråket. Dette er ikke bare en logisk motsetning, men også en uenighet med tingenes natur. Faktisk, hva skjer hvis vi prøver å få en komparativ stilistisk (dvs. derfor kvalitativ) karakteristikk av verkene til Alexander Gerasimov og Rembrandt basert på det kvantitative forholdet mellom rød og svart maling på lerretene deres? Det ser ut til å være et absolutt tull. I hvilken grad kan fullstendig «objektiv» kvantitativ informasjon om fysiske data til en person kunne gi oss en idé om alt som kjennetegner en person og utgjør dens sanne essens? Tydeligvis ingen. De kan bare tjene som et individuelt tegn som skiller en person fra en annen, som et avtrykk av viklinger på tommelen. Situasjonen er lik med de kvantitative egenskapene til litterær stil. Hvis du ser nøye etter, gir de like magre data for å bedømme den faktiske stilistiske<122>kvaliteter ved forfatterens språk, samt en beskrivelse av viklingene på fingeren for studiet av menneskelig psykologi.

Til alt som er sagt, skal det legges til at det tidligere, i den såkalte formelle skolen for litteraturkritikk, allerede ble gjort et forsøk på å kvantitativt studere forfatterstilen, når epitet, metaforer og rytmisk-melodiske elementer. av vers ble talt. Dette forsøket ble imidlertid ikke videreutviklet.

Et annet anvendelsesområde for matematiske metoder for studiet av språklige fenomener kan grupperes under navnet språkstatistikk. Den søker å trenge inn i språkteoriens grunnleggende spørsmål og dermed oppnå et kall i den egentlige språklige sfæren. For å bli kjent med denne retningen, er det best å vende seg til det allerede nevnte arbeidet til Herdan, med ordene til en av dens mange anmeldere, "en monstrøst pretensiøs bok" 7 5 , fikk imidlertid bred respons blant lingvister 7 6 . I lys av det faktum at Kherdan (som allerede nevnt ovenfor) forsøkte å samle i sin bok alt det viktigste innen anvendelsen av matematiske metoder på språklige problemer, i boken hans har vi faktisk ikke så mye å gjøre med Kherdan som med en helhet. trend. Som selve tittelen på boken, «Språk som valg og sannsynlighet» viser, er hovedfokuset på å klargjøre hva i språket som er overlatt til talerens frie valg og hva som skyldes språkets immanente struktur, akkurat som på å bestemme det kvantitative forholdet mellom elementene i første og andre orden. Kherdans bok gir nesten uttømmende informasjon om alt arbeidet på dette området utført av representanter for ulike spesialiteter.<123>(filosofer, lingvister, matematikere, teknikere), men er ikke begrenset til dette og inkluderer mange originale observasjoner, betraktninger og konklusjoner fra forfatteren selv. Som et oppsummerende arbeid gir det en god idé om de kvantitative metodene som brukes, og om resultatene som er oppnådd med deres hjelp. Spørsmålene som vi betinget kombinerer til delen av språkstatistikken, behandles i bokens andre og fjerde del.

Av de mange tilfellene med å bruke metodene for matematisk statistikk til studiet av språklige spørsmål, vil vi fokusere på de mest generelle, som samtidig kan betraktes som de mest typiske. Bruke data fra andre forfattere - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 og andre, i tillegg til å sitere hans egne studier som bestemmer den relative frekvensen av fordelingen av fonemer, bokstaver, ordlengde (målt ved antall bokstaver og stavelser) , grammatiske former og metriske elementer i latinsk og gresk heksameter, fastslår Herdan faktumet om stabiliteten til den relative frekvensen av språklige elementer som en felles egenskap for alle språklige strukturer. Han utleder følgende regel: "Andelene av språklige elementer som tilhører et eller annet nivå eller sfære av språklig koding - fonologi, grammatikk, metrikk - forblir mer eller mindre konstant for et gitt språk, i en gitt periode av dets utvikling og innenfor grenser for tilstrekkelig omfattende og upartisk utførte observasjoner.» 8 2 . Denne regelen, som Herdan kaller språkets grunnleggende lov, søker han å tolke og utvide på en bestemt måte. «Han», skriver Herdan om denne loven, «er et uttrykk for at selv her, hvor menneskets vilje og valgfrihet er gitt<124>den bredeste rammen, hvor bevisste valg og bekymringsløs lek veksler levende med hverandre, generelt er det betydelig stabilitet... i grammatikk, men også i forhold til bruksfrekvensen av spesifikke fonemer, leksikale enheter (ord) og grammatiske fonemer og konstruksjoner; med andre ord, likheten er ikke bare i hva som brukes, men også i hvor ofte det brukes» 8 3 . Denne situasjonen skyldes forståelige årsaker, men dette gir opphav til nye konklusjoner. Når man for eksempel undersøker forskjellige tekster eller segmenter av et gitt språk, finner man at de relative frekvensene for bruk av et gitt bestemt fonem (eller andre taleelementer) av forskjellige personer forblir stort sett de samme. Dette fører til tolkningen av individuelle taleformer som noen fluktuasjoner i den konstante sannsynligheten for å bruke det betraktede fonemet på et gitt språk. Dermed viser det seg at en person i sin taleaktivitet er underlagt visse sannsynlighetslover i forhold til antall språklige elementer som brukes. Og så, når vi observerer et stort antall språklige elementer i et stort sett med tekster eller talesegmenter, får vi inntrykk av årsaksavhengighet i den forstand at det i dette tilfellet også er bestemmelse i forhold til bruken av visse språklige elementer. Det viser seg med andre ord å være tillatt å påstå at det som ser ut til å være en årsakssammenheng fra et intuitivt synspunkt, er kvantitativt en sannsynlighet 8 4 . Det er klart at jo større totalsummen<125>spesifisiteten til de undersøkte tekstene eller talesegmentene, jo tydeligere vil stabiliteten til den relative frekvensen av bruken av språklige elementer manifesteres også i individuell bruk (loven om store tall). Av dette trekkes en ny generell konklusjon om at språk er et massefenomen og bør behandles som det.

Disse konklusjonene, oppnådd på grunnlag av frekvensberegninger av fonetiske elementer, ord og grammatiske former, som til sammen utgjør et språk, brukes deretter på den "statistiske tolkningen" av Saussures inndeling i "språk" (lalangue) og "tale" (laparole). ). I følge Saussure er «språk» et sett av språklige vaner som gjør kommunikasjon mulig mellom medlemmer av et gitt språklig fellesskap. Dette er en sosial realitet, et «massefenomen», obligatorisk for alle mennesker som snakker dette språket. Herdan, som antydet, beviser at medlemmene av et enkelt språksamfunn ligner hverandre, ikke bare ved at de bruker samme fonemer, leksikale enheter og grammatiske former, men også ved at alle disse elementene brukes med samme frekvens. Dermed har hans statistiske definisjon av "språk" følgende form: "språk" (lalangue) er helheten av vanlige språklige elementer pluss deres relative sannsynlighet for å bli brukt.

Denne definisjonen av «språk» er også utgangspunktet for den tilsvarende statistiske tolkningen av «tale», som ifølge Saussure er en individuell ytring. Ved å kontrastere "språk" som et sosialt fenomen av "tale" som et individuelt fenomen, skrev Saussure: "Tale er en individuell handling av vilje og forståelse, der det er nødvendig å skille: 1. kombinasjoner som det talende subjektet bruker språket med. kode for å uttrykke sin personlige tanke; 2. en psykofysisk mekanisme som lar ham objektivisere disse kombinasjonene» 8 5 . Siden "språk" i språkstatistikk betraktes som et sett med elementer med en viss slektning<126>viss sannsynlighet for deres bruk, i den grad det inkluderer den statistiske helheten eller ensemblet (populasjonen) som den viktigste egenskapen og kan vurderes i dette aspektet. I samsvar med dette blir "tale" til et eget utvalg tatt fra "språk" som et statistisk aggregat. Sannsynligheten i dette tilfellet bestemmes av forholdet mellom "tale" og "språk" (i deres "kvantitative" forståelse), og fordelingen av den relative hyppigheten av bruken av forskjellige elementer i språket tolkes som et resultat av en kollektivt "valg" (valg) i en viss kronologisk periode av språkets eksistens. Når han innser at en slik tolkning av forskjellene mellom «språk» og «tale» likevel er bygget på helt andre grunnlag enn Saussures, skriver Herdan i denne forbindelse: «Denne tilsynelatende mindre modifikasjonen av Saussures konsept har den viktige konsekvensen at «språk» ( lalangue ) får nå en vesentlig egenskap i form av et statistisk aggregat (populasjon). Denne populasjonen er preget av visse relative frekvenser eller fluktuasjonssannsynligheter, noe som betyr at hvert språklig element tilhører et visst språklig nivå. I dette tilfellet viser "tale" (laparole), i samsvar med dens betydning, seg å være et begrep for å definere statistiske utvalg tatt fra "språk" som en statistisk populasjon. Det blir åpenbart at valget (valget) dukker opp her i form av forholdet mellom "tale" og "språk", som er forholdet mellom et utvalg tatt tilfeldig og et statistisk aggregat (populasjon). Selve rekkefølgen av frekvensfordeling, som en forekomst av taleaktiviteten til et språklig fellesskap gjennom århundrene, er et element av valg (valg), men ikke av individuelle valg, som i stil, men av kollektive valg. Ved å bruke en metafor kan vi her snakke om valget som er tatt av språkets ånd, hvis vi ved dette forstår prinsippene for språklig kommunikasjon, som er i samsvar med komplekset av mentale data til medlemmene i et bestemt språklig fellesskap. Stabiliteten til serier er resultatet av sannsynlighet (sjans)» 8 6 .

Et spesielt tilfelle av anvendelsen av det oppgitte prinsippet<127>pa er avgrensningen i språket for normative fenomener fra «unntak» (avvik). Språkstatistikk sier at den statistiske metoden gjør det mulig å eliminere uklarheten som eksisterer i denne utgaven og etablere klare kriterier for å skille mellom disse fenomenene. Hvis normen forstås som en statistisk populasjon (i ovennevnte betydning), og unntaket (eller feilen) er et avvik fra frekvensene vist av den statistiske populasjonen, foreslår en kvantitativ løsning av spørsmålet seg selv. Det hele koker ned til en statistisk sammenheng mellom "befolkning" og "uteligger". Hvis frekvensene som er observert i et enkelt utvalg avviker fra sannsynlighetene på grunn av den statistiske populasjonen med mer enn det som er bestemt av en rekke utvalgstellinger, så har vi grunn til å konkludere med at skillelinjen mellom "det samme" (norm) og "ikke" det samme" (unntak) brytes.

Kvantitative forskjeller mellom "språk" og "tale" brukes også for å skille mellom to typer språklige elementer: grammatisk og leksikalsk. Utgangspunktet for å løse dette problemet, som ofte byr på store vanskeligheter fra et språklig synspunkt, er antakelsen om at frekvensgraden til grammatiske elementer er annerledes enn leksikalske enheter. Dette er angivelig assosiert med "generalisering" av grammatiske elementer, hvordan de skiller seg fra konsepter fastsatt av leksikale enheter. I tillegg er angivelig grammatiske elementer som regel mye mindre i volum: som uavhengige ord (de inkluderer pronomen, preposisjoner, konjunksjoner og hjelpeord) består de vanligvis av et lite antall fonemer, og i form av "sammenkoblede former". " - fra ett eller to fonemer 8 7 . Jo mindre det språklige elementet er, jo mindre er dets "lengde" (kvantitative øyeblikk) i stand til å tjene som en definerende egenskap, og jo viktigere får "kvaliteten" til fonemer for dette formålet. Hvilke metoder foreslås for å løse problemet under vurdering? Det løses ved å referere til det rent kvantitative begrepet grammatisk<128>load, "Anta," skriver Herdan i denne forbindelse, "at vi er interessert i å sammenligne to språk i denne forbindelse. Hvordan bestemmer vi med en viss grad av objektivitet den «grammatiske belastningen» som et språk bærer? Det er klart at denne belastningen vil avhenge av plasseringen av avgrensningslinjen som skiller grammatikk fra ordforråd. Den første vurderingen som kan komme til oss er å bestemme hvor "kompleks" grammatikken til et gitt språk er. Tross alt er "kompleksitet" en kvalitativ egenskap, og konseptet "grammatisk belastning" er en kvantitativ egenskap. Riktignok avhenger belastningen til en viss grad av kompleksiteten, men ikke helt. Et språk kan bli belønnet med en ekstremt kompleks grammatikk, men bare en relativt liten del av den brukes i språkets aktivitet. Vi definerer "grammatisk belastning" som helheten av grammatikk som et språk bærer når det er i aksjon, som umiddelbart bringer problemet vårt inn i strukturell lingvistikk i den forstand disiplinen ble definert av Saussure. I den følgende presentasjonen brukes kvantitative metoder for å bestemme forskjellen mellom språk, avhengig av hvor grensen går, og skille grammatikk fra vokabular” 8 8 . Med andre ord bør språkforskjeller i dette tilfellet reduseres til forskjeller i numeriske relasjoner mellom grammatiske og leksikalske elementer.

Materialene vi har til rådighet tegner følgende bilde. På engelsk (bare "grammatiske ord" ble tatt i betraktning: pronomen, eller, som de også kalles, "erstatter", preposisjoner, konjunksjoner og hjelpeverb), i et segment som inkluderer 78633 tilfeller av bruk av alle ord (1027 forskjellige ord), 53 102 tilfellet med bruk av grammatiske elementer, eller mer presist "grammatiske ord" (149 forskjellige ord), som er 67,53 % med 15,8 % forskjellige ord. Slik er dataene til Deway 8 9 . Andre data viser en annen prosentandel<129>forhold: 57,1 % med 5,4 % forskjellige ord 9 0 . Dette betydelige avviket forklares av forskjellen mellom skriftspråk og talespråk. Skriftlige former for språket (første data) bruker visstnok flere grammatiske elementer enn muntlige (andre kasus). I Dantes guddommelige komedie (etter den italienske originalen) etablerte Mariotti 54,4% av forekomstene av "grammatiske ord".

En annen og, tilsynelatende, en mer perfekt måte å bestemme den grammatiske belastningen til et språk er å telle fonemene som er inkludert i de grammatiske elementene. I dette tilfellet tas ikke bare uavhengige grammatiske ord i betraktning, men også relaterte former. Det er ulike alternativer her. For eksempel å bestemme den relative frekvensen av bruken av individuelle konsonantfonem i grammatiske elementer og sammenligne dem med frekvensen av den totale bruken av de samme fonemerene (de endelige dataene for et slikt forhold på engelsk gir en andel på 99,9% til 100 000 - total bruk); eller en lignende sammenligning av konsonanter i henhold til separate klassifikasjonsgrupper (labial, palatal, velar og andre fonemer). Det endelige forholdet her tar form av en andel på 56,47 % (i grammatiske elementer) til 60,25 % (i total bruk); eller samme sammenligning av de første konsonantfonemene (i dette tilfellet var forholdet 100,2 % i grammatiske ord til 99,95 i total bruk). Andre mer komplekse statistiske operasjoner er også mulige, som imidlertid resulterer i lignende kvantitative uttrykk for problemet som studeres.

De gitte kvantitative dataene tjener som grunnlag for en generell konklusjon. Det koker ned til at fordelingen av fonemer i grammatiske elementer bestemmer arten av fordelingen (i numeriske termer, selvfølgelig) av fonemer i språket som helhet. Og dette lar oss igjen konkludere med at bruken av grammatiske elementer i minst grad avhenger av individuelle valg og utgjør den delen av det språklige uttrykket som styres av sannsynligheter.<130>ness. Denne spekulative konklusjonen bekreftes av beregningen av grammatiske former i det russiske språket, laget av Esselson 9 1 . Studien ble utsatt for 46896 ord hentet fra II-kilder (verk av Griboedov, Dostojevskij, Goncharov, Saltykov-Sjchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov og N. Ostrovsky). De ble delt inn i samtaleord (17 756 ord eller 37,9 %) og ikke-samtaler (29 140 ord eller 62,1 %). Deretter ble hele ordsettet delt inn i 4 grupper avhengig av deres grammatiske natur: 1. gruppe inkluderte substantiver, adjektiver, adjektiver i funksjonen av substantiver, pronomen og bøyde tall; i den andre gruppen - verb; i den tredje gruppen - verbale partisipp, partisipp i funksjonen til adjektiver og substantiv og gerundier; i 4. gruppe - ufravikelige former for adverb, preposisjoner, konjunksjoner og partikler. Oppsummeringsresultatene (også tabeller med data for individuelle forfattere er gitt) gir følgende forhold:

1. gruppe

2. gruppe

3. gruppe

4. gruppe

dagligdagse

stilltiende

Herdan karakteriserer betraktningen av de kvantitative dataene som dermed er oppnådd med følgende ord: «De begrunner konklusjonen om at grammatiske elementer bør betraktes som en faktor som bestemmer sannsynligheten for et språklig uttrykk. En slik konklusjon unngår den tyngende kvalifiseringen av hvert ord som brukes. Det er klart at siden grammatikk og vokabular ikke er lagret i vanntette skall, er det heller ikke rent "valg" eller ren "tilfeldighet". Både grammatikk og vokabular inneholder begge elementene, men i betydelig varierende proporsjoner» 9 2 .<131>

En stor del av Herdans bok er viet studiet av dualitet eller dualitet i språk, og selve begrepet dualitet er basert på matematiske egenskaper.

Dermed kan teoremer i projektiv geometri ordnes i to serier, slik at hver teorem i en serie kan hentes fra et teorem i en annen serie ved å erstatte ordene punktum Og rett. For eksempel, hvis et utsagn er gitt: "hvilke som helst forskjellige punkter tilhører én og bare én linje," så kan vi utlede den tilsvarende utsagn fra den: "hvilken som helst to forskjellige linjer tilhører ett og bare ett punkt." En annen metode for å bestemme dualitet er å plotte forskjellige plan av fenomenet som studeres langs abscissen og ordinatene. Så, som Yul 9 3 gjør, for eksempel, telles forskjellige bruksfrekvenser langs abscisseaksen, og antall leksikalske enheter hvis frekvens bestemmes, etc., telles langs ordinataksen.

Under begrepet dualitet definert på denne måten, som i alle tilfeller faktisk har karakteren av en binær kode og som også anses som det mest essensielle trekk ved den språklige strukturen, bringes fenomener med ekstremt forskjellige kvaliteter inn, som tillater opposisjon langs to plan : fordeling av bruken av ord i henhold til leksikalske enheters natur og fordeling av leksikalske enheter etter frekvens bruken av ord; skriftlige og muntlige former for tale; leksikalske og grammatiske elementer; synonymer og antonymer; fonem og dets grafiske representasjon; definerbare og definerende (Saussures signifiant og signifiy), etc.

Etter en kvantitativ studie av dualiteten til et eller annet spesielt, språklig fenomen eller begrenset «tekst», trekkes som regel en konklusjon, som kvalitetene til språklig universalitet tilskrives. Arten av slike konklusjoner og måten de er begrunnet på kan sees i eksemplet<132>studier av dualiteten til ordet og begrepet (faktisk snakker vi om forholdet mellom lengden på ordet og volumet av begrepet - det må tas i betraktning at den ekstremt frie bruken av språklige og andre termer i slike arbeider gjør ofte forståelse svært vanskelig). Det er viktig å merke seg at som materialet som fungerte som kilde for observasjoner av denne typen språklig dualitet, ble følgende brukt: den internasjonale nomenklaturen for sykdommer (omtrent 1000 navn) og det generelle registeret over sykdommer i England og Wells for 1949 I dette tilfellet gjøres følgende generelle konklusjon: "Hvert konsept som betegner en generell idé har det som kan kalles en "sfære" eller "volum." Den tillater gjennom sitt medium å tenke på mange objekter eller andre konsepter som er innenfor dens "sfære". På den annen side utgjør alle elementene som trengs for å definere et konsept det som kalles dets "innhold". Volum og innhold er gjensidig korrelert - jo mindre innholdet er, og følgelig jo mer abstrakt konseptet er, desto større omfang eller volum, det vil si, jo flere objekter bringes inn under det. Dette kan sees på som en analogi (i den konseptuelle sfæren) til prinsippene for koding, ifølge hvilke lengden på et symbol og bruksfrekvensen er gjensidig avhengige av hverandre» 9 4 .

Dualitetsprinsippet gjelder også for spesielle problemer. For eksempel når man etablerer ekvivalensen av betydningen av ord på to forskjellige språk. Som et resultat av å studere den engelsk-tyske ordboken av Muret-Zanders ved bruk av matematisk iterasjonsmetode, konkluderes det med at sannsynligheten for å bruke et engelsk ord med en eller flere betydninger i tysk oversettelse forblir konstant for hver forbokstav i hele ordboken 9 5 . Betraktning av ordrekkefølgen i kinesiske ordbøker fører til konklusjonen at den er av taksonomisk karakter, siden antall streker i tegnet indikerer dens plass (som en uavhengig radikal eller en viss underklasse underordnet radikalen). Taksonomi er et underordnet klassifiseringsprinsipp som brukes i zoologi og botanikk. Kherdan hevder det<133>grunnlaget for kinesisk leksikografi er også bygget på prinsippene for taksonomi 9 6, etc.

For å gjøre en generell vurdering av dette området for anvendelse av matematiske metoder for studiet av språklige problemer (dvs. språkstatistikk), er det tilsynelatende nødvendig å gå ut fra posisjonen som ble formulert av Ettinger: "Matematikk kan brukes effektivt. i lingvistikkens tjeneste bare når lingvistene er klare over de reelle grensene for dens anvendelse, så vel som mulighetene til de matematiske modellene som brukes» 9 7 . Med andre ord kan vi snakke om matematisk lingvistikk når matematiske metoder beviser deres egnethet til å løse de egentlige språklige problemene, som i sin helhet utgjør språkvitenskapen. Hvis dette ikke er tilfelle, selv om dette kan åpne for nye aspekter ved vitenskapelig forskning, så kan vi i dette tilfellet snakke om hva som helst, men ikke om lingvistikk - i dette tilfellet mener vi ikke forskjellige typer anvendt lingvistikk (vi vil snakke om det senere). tale nedenfor), men vitenskapelig, eller teoretisk, lingvistikk. Basert på denne posisjonen bør det bemerkes at fra en språkforskers synspunkt er mye i språkstatistikken tvilsomt og til og med forvirrende.

La oss gå til analysen av bare to eksempler (for ikke å rote opp presentasjonen), og fastslå at det kan gjøres svært betydelige innvendinger mot hvert av dem. Her har vi et kvantitativt skille mellom grammatiske og leksikale enheter. Det viser seg at for å gjøre et slikt skille, er det nødvendig å allerede vite på forhånd hva som hører til grammatikkfeltet, og hva man skal ha ordforråd, siden den "grammatiske belastningen" av språket (dvs. helheten av grammatiske elementer) brukt i tale), som angitt i sitert ovenfor, "avhenger av grenselinjen som skiller ordforråd fra grammatikk." Uten å vite hvor denne linjen går, er det derfor umulig å trekke det angitte skillet. Hva er da meningen med den kvantitative metoden for å skille det leksikale fra grammatikken?<134>matic? Men når det gjelder Herdan, tenker han ikke spesielt på dette spørsmålet og klassifiserer dristig språklige elementer, og refererer til de grammatiske elementene "sammenkoblede former", som etter presentasjonen å dømme skal forstås som ytre bøyning, og "grammatiske ord", som inkluderer preposisjoner , konjunksjoner, hjelpeverb og pronomen - sistnevnte i kraft av at de er "erstattere". Men hvis vi bare snakker om denne kvaliteten på pronomen og på dette grunnlaget relaterer dem til grammatiske elementer, bør slike ord som "førnevnte", "navngitt", "gitt" etc. også tilskrives dem, så hvordan de også opptrer som varamedlemmer. I forbindelse med metoden for å skille grammatiske elementer som brukes i språkstatistikk, oppstår naturligvis spørsmålet om hvordan man i dette tilfellet skal forholde seg til slike "ikke-formelle" grammatiske fenomener som ordstilling, toner, nullmorfemer, paradigmatiske relasjoner (noen av disse fenomenene). , forresten, finne refleksjon i de språkene som studeres med matematiske metoder)? Hvordan skille mellom språk med rik indre bøyning (som for eksempel i semittiske språk), der den ikke bare grammatisk modifiserer roten (radikal), men også gir den leksikalsk eksistens, siden roten uten permutasjoner har ingen reell eksistens i språket? Hva skal forstås med den grammatiske kompleksiteten til et språk, etter hvilket kriterium bestemmes det? Hvis det kvantitative poenget, som i dette tilfellet er fremhevet på alle mulige måter, så vil et av de grammatisk vanskeligste språkene være engelsk, som har slike konstruksjoner som Ishallhavebeencalling eller Hewouldhavebeencalling. I disse setningene er det kun kall som kan klassifiseres som leksikalsk, og alt annet må derfor betraktes som grammatisk. Hvilket grunnlag er det for å koble hyppigheten av bruk av grammatiske elementer med det generelle eller abstrakte i betydningen av grammatiske ord? Tross alt er det ganske åpenbart at den relativt store bruksfrekvensen av grammatiske elementer bestemmes av deres funksjon i konstruksjonen av setninger, og når det gjelder abstraktheten til betydninger, er det veldig enkelt å finne en stor<135>antallet leksikale elementer som lett kan konkurrere med grammatiske elementer i denne forbindelse, og er stort sett underordnet dem i frekvens (f.eks. væren, eksistens, utvidelse, rom, substans etc).

En lignende form for absurditet dukker opp foran oss når det gjelder definisjonen av dualitet (dualitet) av ordet og konseptet. Det er nødvendig å ha en ekstremt særegen forståelse av den strukturelle essensen av språket for å underkaste det forskning ved bruk av sykdommers nomenklatur og sykehusregisteret over sykdommer, som, som angitt ovenfor, fungerte som kildemateriale for svært viktig språklig konklusjoner. Uten å dvele ved den fullstendig obskure bruken av slike begreper som ikke har en språklig eksistens, som sfære, volum og innhold av et begrep (forresten, den leksikalske betydningen av ordet og begrepet betegnet med det vitenskapelige begrepet er grovt sett forvirret), la oss gå til konklusjonen som er gjort i denne saken. Som nevnt ovenfor har vi å gjøre med påstanden om at «omfang og innhold er gjensidig korrelert». Hele resonnementsforløpet som gir grunnlag for en slik konklusjon, så vel som metoden for matematisk operasjon av språklige fakta, viser tydelig at i dette tilfellet blir en svært essensiell kvalitet ved språket fullstendig ignorert, noe som forstyrrer alle beregningene som utføres : evnen til å uttrykke det samme "innholdet" ved hjelp av språklige enheter med forskjellig "volum", som utvilsomt dessuten har ulik relativ bruksfrekvens. Så vi kan utpeke samme person som Petrov, min bekjent, han, en muskovitt, en ung mann, en universitetsansatt, min kones bror, en mann som vi møtte på broen osv. I lys av slike fakta, er uten tvil bare private konklusjoner, som det imidlertid, som det ble påpekt, tillegges universell betydning, men også hensiktsmessigheten av å anvende de kvantitative metodene i seg selv på slike språklige problemer.

Men noen ganger blir lingvister tilbudt konklusjoner, hvis gyldighet ikke er i tvil. Dette er "språkets grunnleggende lov", som består i det faktum at det i språket er en viss stabilitet av dets elementer og den relative hyppigheten av deres omtale.<136>forbruk. Problemet med denne typen oppdagelser er imidlertid at de lenge har vært kjent for lingvister. Tross alt er det ganske åpenbart at hvis språket ikke hadde en viss stabilitet og hvert medlem av et gitt språksamfunn fritt varierte elementene i språket, ville gjensidig kommunikasjon ikke være mulig og selve eksistensen av språket ville bli meningsløs . Når det gjelder fordelingen av den relative hyppigheten av bruken av individuelle elementer i språket, har den funnet sitt uttrykk i lingvistikk i form av tildeling av kategorier av passivt og aktivt ordforråd og grammatikk, som L. V. Shcherba ga så mye oppmerksomhet. I dette tilfellet kan statistiske metoder bare hjelpe lingvister i fordelingen av spesifikke lingvistiske elementer i henhold til kategoriene for den relative hyppigheten av bruken, men de har ingen grunn til å hevde å oppdage nye mønstre som er av verdi for teoretisk lingvistikk.

På den annen side tilbyr språkstatistikk en rekke virkelig "originale" konklusjoner som er ekstremt indikative for arten av den vitenskapelige tenkningen til dens tilhengere. Dermed blir det "politiske vokabularet" i verkene til Churchill, Benes, Halifax, Stresemann og andre studert med komplekse statistiske metoder, og oversettelser av deres verk til engelsk brukes i beregningene for ikke-engelsktalende forfattere. Beregningsresultatene presenteres i form av en rekke tabeller, matematiske formler og ligninger. Den språklige tolkningen av kvantitative data er i dette tilfellet redusert til at Churchills bruk av «politisk vokabular» er den mest typiske (?) for denne forfattergruppen og at Churchills bruk av ord i saker hvor han behandler politiske spørsmål er typisk. av den engelske talegruppen 9 8 .

I et annet tilfelle, etter passende statistiske manipulasjoner, konkluderes det med at Hitler brøt dualiteten mellom "språk" og "tale" i den kvantitative betydningen av disse begrepene i bruken av Nazi-Tyskland. Et spesielt tilfelle av ødeleggelsen av denne dualiteten er den bokstavelige forståelsen<137>metaforiske vendinger (for eksempel "hell salt i åpne sår"). Nazi-Tyskland stemplet seg selv med så mange umenneskelige handlinger at det knapt er behov for å dømme det for denne språklige grusomheten 9 9 . I følge Kherdan fører Marx sin definisjon av språk som tankens umiddelbare virkelighet også til brudd på språklig dualitet, og dialektikkens lov om overgangen av et fenomen til det motsatte er etter hans mening den misforståtte språklige loven om dualiteten. av språk. Slike tolkninger taler for seg selv.

Til slutt, en vanlig mangel som er iboende i alle de ovennevnte tilfellene av den kvantitative metoden for å studere språklig materiale og dermed tilegne seg en metodisk karakter, er tilnærmingen til språklige elementer som et mekanisk sett av fakta som er helt uavhengig av hverandre, i samsvar med hvilke, om noen, eller mønstre, de refererer bare til de numeriske relasjonene til fordelingen av autonome fakta, utenfor deres systemiske avhengigheter. Riktignok prøver J. Watmou på alle mulige måter å forsikre seg om at det er matematikk som er bedre enn noen form for språklig strukturell analyse, i stand til å avsløre de strukturelle egenskapene til et språk. "Moderne matematikk," skriver han, "omhandler ikke måling og kalkulus, hvis nøyaktighet er begrenset av deres natur, men først og fremst med struktur. Dette er grunnen til at matematikk er svært befordrende for nøyaktigheten av språklæring - i den grad en separat beskrivelse, enda mer begrenset i naturen, ikke er i stand til ... Akkurat som i fysikk, brukes matematiske elementer for å beskrive den fysiske verden, siden de antas å korrespondere med elementer i den fysiske verden, så i matematisk lingvistikk antas de matematiske elementene å svare til elementene i taleverdenen» 101 . Men en slik formulering av spørsmålet redder på ingen måte situasjonen, siden den i beste fall kan<138>gi en analyse av språket enten som en fysisk struktur, som fortsatt er langt fra tilstrekkelig for språk, og i siste instans fortsatt er av samme mekanistiske karakter, eller som en logisk-matematisk struktur, og dette overfører språket til et annet plan, og på mange måter fremmed for det. Det er ikke overflødig å merke seg at Watmow forutser suksessene til matematisk lingvistikk bare i fremtiden, og når det gjelder deres virkelige resultater, vurderer han dem med følgende ord: "... nesten alt arbeidet gjort til dags dato av Herdan, Zipf, Yul, Giro (Guiraux) og andre, er på ingen måte utenfor rekkevidden av kritikk fra både lingvistikk og matematikk; hun lukter i stor grad av amatørmessighet» 103 . Så hvis vi ikke prøver å forutsi fremtiden for matematiske metoder innen språkforskning, men prøver å sette pris på det vi har i dag, så må vi innrømme at matematikken faktisk har vært begrenset innen språkvitenskapen bare til å "måling og telling" ”, og jeg kunne ikke gi en kvalitativ analyse av språket, fordype meg i strukturen.<139>

La oss prøve å være så objektive som mulig. I en viss del kan kvantitative data, tilsynelatende, brukes av lingvistikk, men bare som hjelpemiddel og hovedsakelig i problemer som har en praktisk orientering. Når det gjelder de fleste av de kvantitative metodene for å studere individuelle språklige fenomener, er den generelle konklusjonen til R. Brown utvilsomt berettiget: "De kan betraktes slik Kherdan anser dem, men hva er meningen med alt dette?" 104. La oss forestille oss at vi stiller spørsmålet: "Hva er trærne i denne hagen?". Og som svar får vi: «Det er hundre trær i denne hagen». Er dette svaret på spørsmålet vårt, og gir det virkelig mening? Men når det gjelder mange språklige spørsmål, gir matematiske metoder nettopp slike svar.

Det er imidlertid et bredt felt av forskningsaktivitet, hvor man hovedsakelig bruker matematiske metoder og samtidig orienterer dem mot språklig materiale, hvor hensiktsmessigheten av en slik kombinasjon er hevet over tvil. "Betydningen" av denne forskningsaktiviteten, dens betydning bestemmes av målene den streber etter. Det er allerede testet i praksis. I dette tilfellet snakker vi om problemene knyttet til opprettelsen av informasjonsmaskiner, strukturer for maskinoversettelse av skriftlige vitenskapelige tekster, automatisering av oversettelse av muntlig tale fra ett språk til et annet, og med hele spekteret av oppgaver som er kombinert i de språklige spørsmålene om kybernetikk. Hele settet med slike problemer får vanligvis det generelle navnet på anvendt lingvistikk. Dermed skiller den seg fra den såkalte matematiske lingvistikken, som inkluderer de arbeidsområdene som ovenfor er utpekt som stilstatistikk og språkstatistikk, selv om den på ingen måte unngår statistisk behandling av språklig materiale. Den kanskje viktigste egenskapen ved anvendt lingvistikk, som skiller den fra matematisk lingvistikk, som skissert ovenfor, er at førstnevnte har motsatt retning: ikke matematikk for lingvistikk, men lingvistikk.<140>(formalisert ved matematiske metoder) for et bredt spekter av praktiske problemer.

Det er ikke nødvendig å avsløre innholdet i individuelle problemer som nå er inkludert i det ekstremt brede området av anvendt lingvistikk. I motsetning til matematisk lingvistikk, diskuteres disse problemene aktivt i sovjetisk lingvistisk litteratur og begynner med rette å innta en stadig mer fremtredende plass i forskningsinstituttenes vitenskapelige problemer 105 . Dermed er de allerede godt kjent for vårt språklige fellesskap. Denne omstendigheten fritar oss imidlertid ikke for behovet for å utsette dem for refleksjon, spesielt fra synspunktet til prinsippene for språkvitenskapen. Dette vil utvilsomt bidra til å eliminere misforståelser som oftere og oftere oppstår mellom representanter for vitenskaper som er svært fjernt fra hverandre og som deltar i arbeidet med problemene med anvendt lingvistikk, og vil skissere måter for deres konvergens på den ene siden , og avgrensning av forskningsområder derimot. Det sier seg selv at følgende betraktninger vil representere lingvistens synspunkt, og det er nødvendig at matematikere ikke bare prøver å assimilere det, men i forbindelse med spørsmålene som reises, gir dem sin tolkning.

Lingvist-teoretikeren kan ikke på noen måte være fornøyd med at det i alle tilfeller<141>språk for formålene satt av anvendt lingvistikk, er deres grunnlag en matematisk modell. I samsvar med dette uttrykkes observasjoner av språkets fenomener og resultatene oppnådd på denne måten i termer og begreper om matematikk, det vil si gjennom matematiske ligninger og formler. La oss se på et eksempel for klarhet. Condon 1 06 og Zipf 1 07 fastslo at logaritmene til frekvensen ( f) forekomsten av ord i en stor tekst er plassert nesten i en rett linje, hvis de er korrelert i diagrammet med logaritmene for rang eller rang ( r) av disse ordene. Ligningen f=c:r, Hvor Med er en konstant gjenspeiler dette forholdet i begrenset forstand at c:r for innstilt verdi r gjengir den observerte frekvensen med stor tilnærming. Forholdet mellom f Og r, uttrykt med en matematisk formel, er en modell for forholdet mellom de observerte verdiene for bruksfrekvensen og rangeringen, eller rangeringen, av ord. Dette er et av tilfellene med matematisk modellering. 

Hele teorien om informasjon er helt og holdent basert på den matematiske modellen for kommunikasjonsprosessen utviklet av C. Shannon 108 . Det er definert som "en matematisk disiplin viet til metodene for å beregne og estimere mengden informasjon som finnes i alle data, og studiet av prosessene for lagring og overføring av informasjon" (TSB, vol. 51, s. 128). Følgelig mottar de grunnleggende konseptene for informasjonsteori et matematisk uttrykk.Informasjon måles i binitter eller binære enheter (en kode, som sammenlignes med et språk, med to betingede like sannsynlige signaler sender en binær enhet med informasjon under overføringen av hvert tegn -enten kode og gjennomsnittlig mengde informasjon som overføres<142>formasjoner. Redundans uttrykkes som en prosentandel av kodens totale overføringsevne”, 1 09 osv. På samme måte krever maskinoversettelse algoritmisk utvikling av kartlegging av elementer fra ett språk til et annet osv. 1 10 . Dette er andre tilfeller av modellering.

Bruken av modeller uten noen mening kan være til svært betydelig hjelp, spesielt, etter all sannsynlighet, for å løse problemene som anvendt lingvistikk setter seg selv. For teoretisk lingvistikk er det imidlertid veldig viktig at en abstrakt modell som regel ikke reproduserer alle funksjonene til et reelt fenomen, alle dets funksjonelle kvaliteter. Så en arkitekt kan, før han bygger et hus, lage sin modell, som gjengir huset som blir designet i alle de minste detaljene, og dette hjelper ham med å løse en rekke praktiske problemer knyttet til konstruksjonen av selve huset. Men en slik modell av et hus, uansett hvor nøyaktig den kan være, er blottet for den "funksjonen" og det formålet som alle hus er bygget for generelt - den er ikke i stand til å gi en person bolig. Situasjonen er lik med språket, hvor modellen ikke alltid er i stand til å gjengi alle sine kvaliteter. I dette tilfellet kompliseres saken ytterligere av at det ikke brukes språklige, men matematiske kriterier for å bygge modellen. "Matematiske modeller ... - skriver A. Ettinger, - spiller en ekstremt viktig rolle innen alle teknologiområder, men siden de er et verktøy for syntese, er deres betydning for lingvistikken, som først og fremst er en historisk og beskrivende disiplin, naturlig nok begrenset. " 1 11 .<143>

Matematisk modellering av et språk er faktisk kun anvendelig for dets statiske tilstand, som er betinget for en lingvist og faktisk er i direkte konflikt med den grunnleggende kvaliteten til et språk, hvis eksistensform er utvikling. Det sier seg selv at det statiske studiet av et språk på ingen måte er utelukket fra lingvistikken og er grunnlaget for å sette sammen normative grammatikker og ordbøker, beskrivende grammatikker, praktiske grammatikker og ordbøker som fungerer som en veiledning for praktisk studie av fremmedspråk osv. Men i alle slike verk, som hovedsakelig brukes i naturen, begrenser lingvister bevisst forskningsfeltet og lukker på ingen måte øynene for andre sider ved språket 1 12 . Med en statisk undersøkelse av språket, spesielt, forsvinner slike kvaliteter ved språket knyttet til dets dynamiske natur, som produktivitet, avhengighet av tankeformer og omfattende interaksjon med kulturelle, sosiale, politiske, historiske og andre faktorer. forskerens synsfelt. Bare på det synkrone planet kan språk betraktes som et system av konvensjonelle tegn eller koder, som imidlertid viser seg å være fullstendig uberettiget så snart vi inntar et dynamisk synspunkt mer egnet for språk. Det er i utviklingsprosessene at språkkvaliteter som motivasjon, polysemi av ord som ikke har stabile grenser, ikke-autonomi av betydningen av et ord og dets lydskall, og det kreative potensialet til et ord knyttet til konteksten er manifestert, og alt dette er i skarp motsetning til hovedkarakteristikkene til en kode eller et tegn 1 13 . Det er klart at man i anvendt lingvistikk også kan tenke på alle disse kvalitetene ved språket og for praktiske formål nøye seg med så å si et «øyeblikksbilde» av språket, som fortsatt er i stand til å gi en ganske omtrentlig idé om mekanismen for dens funksjon.<144>nirovaniya. Imidlertid må hvert slikt "øyeblikksbilde", hvis det betraktes som et språkfaktum, og ikke som et faktum i et system av konvensjonelle koder, inkluderes i den endeløse bevegelsesprosessen der språk alltid eksisterer 1 14 . Det kan ikke studeres utenfor de spesifikke forholdene som kjennetegner denne bevegelsen, som setter sitt preg på den gitte tilstanden til språket og bestemmer potensialet for dets videre utvikling. Her er det samme forskjell som mellom et øyeblikksfotografi av en person og hans portrett malt med en pensel av en ekte kunstner. I kunstnerens arbeid har vi foran oss et generaliserende bilde av en person i all originaliteten til ikke bare hans fysiske utseende, men også hans indre åndelige innhold. Fra et kunstnerisk portrett kan vi også lese fortiden til personen som er avbildet på det og finne ut hva han er i stand til i sine handlinger. Og et øyeblikksbilde, selv om det er i stand til å gi et mer nøyaktig bilde av utseendet til originalen, er blottet for disse egenskapene og fanger ofte både en tilfeldig kvise som hoppet opp på nesen og<145>en helt ukarakteristisk positur eller uttrykk, som til slutt fører til en forvrengning av originalen.

Det skal bemerkes at metoden med "øyeblikksbilder" selvfølgelig kan brukes på fakta om språkutvikling. Men i dette tilfellet vil vi faktisk bare forholde oss til separate tilstander av språket, som i sin kvantitative karakterisering ikke viser seg å henge sammen mer enn en komparativ kvantitativ karakterisering av forskjellige språk. Denne typen kvantitativ "dynamikk" vil ikke inneholde noe organisk, og forbindelsen mellom språkets individuelle tilstander vil kun hvile på sammenligningen av numeriske relasjoner. Hvis du også i dette tilfellet skal ty til en analogi, kan vi referere til barnets vekst. Hans utvikling kan selvfølgelig representeres i form av dynamikken til numeriske data om hans vekt, høyde, skiftende forhold mellom volumet av deler av kroppen hans, men alle disse dataene er absolutt løsrevet fra alt som først og fremst utgjør den individuelle essensen av en person - hans karakter, tilbøyeligheter, vaner. , smaker, etc.

En annen negativ side ved den matematiske «modelleringen» av språket er det faktum at det ikke kan tjene som det generelle prinsippet som det er mulig å gjennomføre en omfattende og omfattende – systematisk beskrivelse av språket på. Bare en matematisk tilnærming til fenomenene språk, for eksempel, vil ikke gjøre det mulig å besvare selv slike grunnleggende spørsmål (uten hvilke selve eksistensen av språkvitenskapen er utenkelig), som: hva er språk, hvilke fenomener bør være klassifisert som riktig lingvistisk, hvordan et ord eller en setning er definert, hva er de grunnleggende begrepene og kategoriene av språk, etc. Før du går over til de matematiske metodene for å studere språk, er det nødvendig å allerede ha svar (selv i form av en arbeidsform hypotese) på alle disse spørsmålene på forhånd. Det er ingen grunn til å lukke øynene for det faktum at i alle tilfeller vi kjenner til studiet av språklige fenomener med matematiske metoder, måtte alle disse konseptene og kategoriene uunngåelig aksepteres slik de ble definert av tradisjonelle eller, relativt sett, kvalitative metoder.

Dette trekket ved matematiske metoder i deres språklige anvendelse ble bemerket av Spang-Hanssen da pi<146>sal: «Man bør huske på at observerte fakta som får et kvantitativt uttrykk ... ikke har noen verdi dersom de ikke inngår i beskrivelsen, og for språklige formål bør det være en systematisk beskrivelse, nært knyttet til en kvalitativ språklig beskrivelse og teori» 1 15 . I en annen tale av Spang-Hanssen finner vi en presisering av denne tanken: «Inntil muligheten for å konstruere et kvantitativt system er bevist, og så lenge det finnes et allment akseptert kvalitativt system for et gitt fagområde, skal frekvensberegninger m.fl. numeriske egenskaper fra et språklig synspunkt gir ingen mening» 1 16 . Lignende ideer uttrykkes av Uldall, noe som uventet forbinder dem med utviklingen av det generelle teoretiske grunnlaget for glossematikk: «Når en lingvist vurderer eller måler alt han anser og måler, er det ikke selv bestemt kvantitativt; for eksempel blir ord, når de telles, definert, hvis de i det hele tatt er definert, i ganske forskjellige termer.<147>

Dermed viser det seg at både i teoretiske termer og i deres praktiske anvendelse er matematiske metoder direkte avhengige av språklige begreper og kategorier definert av tradisjonelle, filologiske eller, som nevnt ovenfor, kvalitative metoder. Når det gjelder anvendt lingvistikk, er det viktig å innse denne avhengigheten, og følgelig å bli kjent med helheten av hovedkategoriene for tradisjonell lingvistikk.

Riktignok er det ingen grunn til å bebreide representanter for de eksakte vitenskapene som arbeider innen anvendt lingvistikk for ikke å bruke dataene til moderne lingvistikk. Dette samsvarer ikke med tingenes faktiske tilstand. De kjenner ikke bare godt, men bruker også i sitt arbeid i stor utstrekning systemene med differensielle trekk etablert av lingvister som er karakteristiske for forskjellige språk, distribusjonen og arrangementet av lingvistiske elementer innenfor spesifikke språksystemer, prestasjonene til akustisk fonetikk, etc. Men i dette tilfellet er det nødvendig med et meget betydelig forbehold. Faktisk bruker representanter for de eksakte vitenskapene dataene fra kun én retning i lingvistikken - den såkalte beskrivende lingvistikken, som bevisst skilte seg fra de tradisjonelle problemene innen teoretisk lingvistikk, langt fra å dekke hele feltet av lingvistisk forskning, fra et egentlig språklig synspunkt har den betydelige metodiske mangler, som førte til nylig avslørt krise 1 18 , og har dessuten en rent praktisk orientering, tilsvarende interessene til anvendt lingvistikk. Alle forbeholdene og bebreidelsene som ble gjort ovenfor mot den statiske betraktningen av språket, gjelder for beskrivende lingvistikk. En slik ensidig tilnærming av deskriptiv lingvistikk kan, etterforskeren<148>Det kan imidlertid bare rettferdiggjøres med oppgavene som anvendt lingvistikk setter seg selv, men det uttømmer langt fra hele innholdet i språkvitenskapen.

I prosessen med å utvikle spørsmål om anvendt lingvistikk kan det oppstå nye teoretiske problemer, og de har faktisk allerede oppstått. Noen av disse problemene er nært knyttet til de spesifikke oppgavene til anvendt lingvistikk og er rettet mot å overvinne vanskelighetene som oppstår med å løse disse problemene. Andre problemer er direkte relatert til teoretisk lingvistikk, som tillater et nytt perspektiv på tradisjonelle ideer eller åpner for nye områder innen språkforskning, nye konsepter og teorier. Blant disse sistnevnte er for eksempel problemet med å skape et "maskinspråk" (eller mellomspråk), som er nærmest knyttet til et komplekst sett av slike kardinalspørsmål innen teoretisk lingvistikk som forholdet mellom begreper og leksikalske betydninger, logikk og grammatikk, diakroni og synkroni, språkets tegnnatur, essensen av språklig mening, prinsippene for å konstruere kunstige språk, etc. 1 19 . I dette tilfellet er det spesielt viktig å etablere gjensidig forståelse og fellesskap i det felles arbeidet til representanter for språklige disipliner og eksakte vitenskaper. Når det gjelder den språklige siden, i dette tilfellet bør vi tilsynelatende ikke snakke om allerede å begrense innsatsen til for eksempel designere av oversettelsesmaskiner på forhånd" og prøve å etablere arbeidsevnen til slike maskiner med versene til N. Gribatsjov eller prosaen til V. Kochetov 1 20 . Maskinen selv vil finne grensene for dens evner, og lønnsomhet - grensene for bruken. Men lingvister, som deres bidrag til den felles sak, må bringe sin kunnskap om funksjonene i språkets struktur, dets allsidighet, de interne kryssende relasjonene mellom dets elementer, så vel som de brede og multilaterale forbindelsene mellom språk og fysiske, fysiologiske , mentalt og logisk<149>mi-fenomener, spesifikke funksjonsmønstre og utvikling av språket. Helheten av denne kunnskapen er nødvendig for designere av de tilsvarende maskinene for ikke å vandre i feil retninger, men for å gjøre søket målrettet og tydelig orientert. Selv den svært korte gjennomgangen av tilfellene med å bruke matematiske metoder på språklige problemer, som ble gjort i dette essayet, overbeviser at slik kunnskap på ingen måte vil være overflødig for representanter for de eksakte vitenskapene.

På grunnlag av alle de ovennevnte betraktningene kan man åpenbart komme til noen generelle konklusjoner.

Så, matematisk lingvistikk? Hvis dette betyr bruk av matematiske metoder som en universell hovednøkkel for å løse alle språklige problemer, bør slike påstander anerkjennes som absolutt uberettigede. Alt som har blitt gjort i denne retningen har så langt gjort svært lite eller ikke i det hele tatt for å løse de tradisjonelle problemene i språkvitenskapen. I verste fall er bruken av matematiske metoder ledsaget av åpenbare absurditeter eller, fra et språklig synspunkt, absolutt meningsløst. I beste fall kan matematiske metoder brukes som hjelpemetoder for lingvistisk forskning, og stilles til tjeneste for spesifikke og begrensede språklige problemer. Det kan ikke være snakk om noen «kvantitativ språkfilosofi» i dette tilfellet. Fysikk, psykologi, fysiologi, logikk, sosiologi og etnologi grep i sin tid inn på uavhengigheten til språkvitenskapen, men de kunne ikke underlegge språkvitenskapen. Det motsatte skjedde - lingvistikken utnyttet prestasjonene til disse vitenskapene og, i den grad det var nødvendig for seg selv, begynte å bruke deres hjelp, og beriket dermed arsenalet av forskningsmetoder. Nå er det tydeligvis matematikkens tur. Det er å håpe at dette nye fellesskapet også vil bidra til å styrke språkvitenskapen, forbedre dens arbeidsmetoder og øke deres mangfold. Det er derfor like legitimt å snakke om matematisk lingvistikk som om fysisk lingvistikk, fysiologisk lingvistikk, logisk lingvistikk, psykologisk lingvistikk og<150>osv. Det er ingen slik lingvistikk, det er bare en lingvistikk, som lønnsomt bruker data fra andre vitenskaper som hjelpeforskningsverktøy. Dermed er det ingen grunn til å trekke seg tilbake før angrepet av den nye vitenskapen og lett gi den posisjonene den har vunnet. Her er det veldig passende å minne om ordene til A. Martinet: «Kanskje det er fristende å slutte seg til en eller annen større tankebevegelse ved å bruke noen få velvalgte termer, eller å erklære med en eller annen matematisk formel strengheten i ens resonnement. Tiden er imidlertid inne for lingvister til å innse uavhengigheten til sin vitenskap og å frigjøre seg fra det mindreverdighetskomplekset som får dem til å assosiere enhver av sine handlinger med et eller annet generelt vitenskapelig prinsipp, som et resultat av at virkelighetens konturer alltid blir bare mer vagt, i stedet for å bli klarere 21 .

Derfor matematikk i seg selv og lingvistikk i seg selv. Dette utelukker på ingen måte deres gjensidige hjelp eller et vennlig møte i felles arbeid med vanlige problemer. Denne typen anvendelsessted for den samordnede innsatsen til de to vitenskapene er hele det brede spekteret av problemer som er en del av anvendt lingvistikk og er av stor nasjonal økonomisk betydning. Man skulle bare ønske at begge vitenskapene i deres felles arbeid viste maksimal gjensidig forståelse, noe som utvilsomt også ville bidra til maksimal fruktbarhet av deres samarbeid.<151>

Hvor mye koster det å skrive oppgaven?

Velg type arbeid Oppgave (bachelor / spesialist) Del av oppgaven Masterdiplom Oppgave med praksis Emneteori Essay Essay Eksamen Oppgaver Attestasjonsarbeid (VAR / WQR) Forretningsplan Eksamensspørsmål MBA diplom Oppgave (høyskole / teknisk skole) Andre Cases Laboratoriearbeid , RGR Online hjelp Praksisrapport Informasjonssøk Presentasjon i PowerPoint Postgraduate abstract Medfølgende materiale til diplomet Artikkel Test Tegninger mer »

Takk, en e-post har blitt sendt til deg. Sjekk mailen din.

Vil du ha en 15% rabatt kampanjekode?

Motta SMS
med kampanjekode

Vellykket!

?Fortell kampanjekoden under en samtale med lederen.
Kampanjekoden kan kun brukes én gang på din første bestilling.
Type kampanjekode - " avgangsarbeid".

Samspill mellom matematikk og lingvistikk


Introduksjon

Kapittel 1. Historien om anvendelsen av matematiske metoder i lingvistikk

1.1. Dannelsen av strukturell lingvistikk ved overgangen til 1800- og 1900-tallet

1.2. Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre

Kapittel 2. Utvalgte eksempler på bruk av matematikk i lingvistikk

2.1. Maskinoversettelse

2.2.Statistiske metoder i språklæring

2.3. Å lære et språk ved hjelp av metoder for formell logikk

2.4. Utsikter for anvendelse av matematiske metoder i lingvistikk

Konklusjon

Litteratur

Vedlegg 1. Ronald Schleifer. Ferdinand de Saussure

Vedlegg 2. Ferdinand de Saussure (oversettelse)

Introduksjon


På 1900-tallet har det vært en kontinuerlig trend mot samspill og gjensidig gjennomtrenging av ulike kunnskapsfelt. Grensene mellom de enkelte vitenskapene viskes gradvis ut; det er flere og flere grener av mental aktivitet som er "i krysset" av humanitær, teknisk og naturvitenskapelig kunnskap.

Et annet åpenbart trekk ved moderniteten er ønsket om å studere strukturer og deres bestanddeler. Derfor får matematikken en økende plass, både i vitenskapsteori og i praksis. Ved å komme i kontakt på den ene siden med logikk og filosofi, på den andre siden med statistikk (og følgelig med samfunnsvitenskapene), trenger matematikken dypere og dypere inn i de områdene som lenge ble ansett for å være rent. "humanitær", utvider deres heuristiske potensiale (svaret på spørsmålet "hvor mye" vil ofte bidra til å svare på spørsmålene "hva" og "hvordan"). Lingvistikk var intet unntak.

Hensikten med kursarbeidet mitt er å kort belyse sammenhengen mellom matematikk og en slik gren av lingvistikk som lingvistikk. Siden 1950-tallet har matematikk blitt brukt i lingvistikk for å lage et teoretisk apparat for å beskrive strukturen til språk (både naturlige og kunstige). Imidlertid skal det sies at den ikke umiddelbart fant en slik praktisk anvendelse for seg selv. Opprinnelig begynte matematiske metoder i lingvistikk å bli brukt for å klargjøre de grunnleggende begrepene i lingvistikk, men med utviklingen av datateknologi begynte et slikt teoretisk premiss å finne anvendelse i praksis. Løsningen av oppgaver som maskinoversettelse, innhenting av maskininformasjon, automatisk tekstbehandling krevde en fundamentalt ny tilnærming til språket. Språkforskerne sto overfor spørsmålet: hvordan lære å representere språklige mønstre i den formen de kan brukes direkte på teknologi. Begrepet "matematisk lingvistikk", som er populært i vår tid, refererer til all lingvistisk forskning som bruker eksakte metoder (og begrepet eksakte metoder i vitenskap er alltid nært knyttet til matematikk). Noen forskere fra de siste årene mener at selve uttrykket ikke kan heves til rangering av et begrep, siden det ikke betyr noen spesiell "lingvistikk", men bare en ny retning fokusert på å forbedre, øke nøyaktigheten og påliteligheten til språkforskningsmetoder . Lingvistikk bruker både kvantitative (algebraiske) og ikke-kvantitative metoder, noe som bringer den nærmere matematisk logikk, og følgelig til filosofi, og til og med til psykologi. Til og med Schlegel bemerket samspillet mellom språk og bevissthet, og Ferdinand de Saussure, en fremtredende lingvist fra det tidlige tjuende århundre (jeg vil fortelle om hans innflytelse på utviklingen av matematiske metoder i lingvistikk senere), koblet strukturen til språket med dets tilhørighet. til folket. Den moderne forskeren L. Perlovsky går videre, og identifiserer de kvantitative egenskapene til språket (for eksempel antall kjønn, tilfeller) med særegenhetene ved den nasjonale mentaliteten (mer om dette i avsnitt 2.2, "Statistiske metoder i lingvistikk").

Samspillet mellom matematikk og lingvistikk er et mangefasettert tema, og i mitt arbeid vil jeg ikke dvele ved alle, men først og fremst ved de anvendte aspektene.

Kapittel I. Historie om anvendelsen av matematiske metoder i lingvistikk


1.1 Dannelsen av strukturell lingvistikk ved begynnelsen av XIX - XX århundrer


Den matematiske beskrivelsen av språket er basert på ideen om språk som en mekanisme, som går tilbake til den berømte sveitsiske lingvisten fra det tidlige tjuende århundre, Ferdinand de Saussure.

Den første koblingen til konseptet hans er teorien om språk som et system som består av tre deler (språket selv - språket, tale - prøveløslatelse og taleaktivitet - språk), der hvert ord (medlem av systemet) anses som ikke i seg selv , men i forbindelse med andre medlemmer. Som en annen fremtredende lingvist, dansken Louis Hjelmslev, senere bemerket, var Saussure "den første som krevde en strukturell tilnærming til språket, det vil si en vitenskapelig beskrivelse av språket ved å registrere relasjonene mellom enheter."

Etter å ha forstått språk som en hierarkisk struktur, var Saussure den første som stilte problemet med verdien og betydningen av språkenheter. Separate fenomener og hendelser (for eksempel historien om opprinnelsen til individuelle indoeuropeiske ord) bør studeres ikke av seg selv, men i et system der de er korrelert med lignende komponenter.

Den strukturelle enheten til Saussure-språket betraktet ordet "tegn", der lyd og mening ble kombinert. Ingen av disse elementene eksisterer uten hverandre: derfor forstår morsmålet de ulike nyansene av betydningen av et polysemantisk ord som et separat element i den strukturelle helheten, i språket.

I teorien til F. de Saussure kan man således se samspillet mellom lingvistikk, på den ene siden, med sosiologi og sosialpsykologi (det bør bemerkes at samtidig utvikler Husserls fenomenologi, Freuds psykoanalyse, Einsteins relativitetsteori seg , pågår det eksperimenter med form og innhold i litteratur, musikk og kunst), på den annen side med matematikk (konsistensbegrepet tilsvarer det algebraiske språkbegrepet). Et slikt konsept endret begrepet språklig tolkning som sådan: Fenomener begynte å bli tolket ikke i forhold til årsakene til deres forekomst, men i forhold til nåtid og fremtid. Tolkning sluttet å være uavhengig av en persons intensjoner (til tross for at intensjoner kan være upersonlige, «ubevisste» i freudiansk betydning av ordet).

Funksjonen til den språklige mekanismen manifesteres gjennom taleaktiviteten til morsmål. Resultatet av talen er de såkalte "korrekte tekstene" - sekvenser av taleenheter som adlyder visse mønstre, hvorav mange tillater matematisk beskrivelse. Teorien om måter å beskrive den syntaktiske strukturen på omhandler studiet av metoder for matematisk beskrivelse av korrekte tekster (primært setninger). I en slik struktur defineres språklige analogier ikke ved hjelp av deres iboende kvaliteter, men ved hjelp av systemmessige ("strukturelle") relasjoner.

I Vesten er Saussures ideer utviklet av de yngre samtidige til den store sveitsiske lingvisten: i Danmark - L. Hjelmslev, allerede nevnt av meg, som ga opphav til den algebraiske språkteorien i sitt arbeid "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tsjekkia - russisk vitenskapsmann-emigrant N. Trubetskoy.

Statistiske regelmessigheter i studiet av språk begynte å bli behandlet av ingen ringere enn grunnleggeren av genetikk, Georg Mendel. Det var først i 1968 at filologer oppdaget at han i de siste årene av sitt liv var fascinert av studiet av språklige fenomener ved hjelp av matematiske metoder. Mendel brakte denne metoden til lingvistikk fra biologien; på 1990-tallet var det bare de mest vågale lingvistene og biologene som hevdet gjennomførbarheten av en slik analyse. I arkivene til klosteret St. Tomasz i Brno, hvis abbed var Mendel, ble funnet ark med kolonner med etternavn som sluttet på "mann", "bauer", "mayer", og med noen brøker og beregninger. I et forsøk på å oppdage de formelle lovene for opprinnelsen til slektsnavn, gjør Mendel komplekse beregninger, der han tar hensyn til antall vokaler og konsonanter i det tyske språket, det totale antallet ord han vurderer, antall etternavn, etc.

I vårt land begynte den strukturelle lingvistikken å utvikle seg omtrent samtidig som i Vesten - ved overgangen til 1800- og 1900-tallet. Samtidig med F. de Saussure ble konseptet språk som et system utviklet i deres arbeider av professorer ved Kazan University F.F. Fortunatov og I.A. Baudouin de Courtenay. Sistnevnte korresponderte lenge med de Saussure, henholdsvis Genève- og Kazan-skolene for lingvistikk samarbeidet med hverandre. Hvis Saussure kan kalles ideologen for "eksakte" metoder innen lingvistikk, så la Baudouin de Courtenay det praktiske grunnlaget for deres anvendelse. Han var den første som skilte lingvistikk (som en eksakt vitenskap ved bruk av statistiske metoder og funksjonell avhengighet) fra filologi (et fellesskap av humanitære disipliner som studerer åndelig kultur gjennom språk og tale). Forskeren selv mente at "lingvistikk kan være nyttig i nær fremtid, bare frigjort fra den obligatoriske foreningen med filologi og litteraturhistorie". Fonologi ble "prøvegrunnen" for introduksjonen av matematiske metoder i lingvistikk - lyder som "atomer" i språksystemet, med et begrenset antall lett målbare egenskaper, var det mest hensiktsmessige materialet for formelle, strenge beskrivelsesmetoder. Fonologi benekter eksistensen av mening i lyd, så den "menneskelige" faktoren ble eliminert i studiene. I denne forstand er fonemer som fysiske eller biologiske objekter.

Fonemer, som de minste språklige elementene som er akseptable for persepsjon, representerer en egen sfære, en egen "fenomenologisk virkelighet". For eksempel på engelsk kan lyden "t" uttales annerledes, men i alle tilfeller vil en person som snakker engelsk oppfatte den som "t". Hovedsaken er at fonemet vil utføre sin viktigste - meningsfulle - funksjon. Dessuten er forskjellene mellom språk slik at varianter av en lyd på ett språk kan svare til forskjellige fonemer på et annet; for eksempel er "l" og "r" på engelsk forskjellige, mens de på andre språk er varianter av samme fonem (som det engelske "t", uttalt med eller uten aspirasjon). Det enorme vokabularet til ethvert naturlig språk er et sett med kombinasjoner av et mye mindre antall fonemer. På engelsk, for eksempel, brukes bare 40 fonemer til å uttale og skrive omtrent en million ord.

Lydene til et språk er et systematisk organisert sett med funksjoner. I 1920-1930-årene, etter Saussure, pekte Jacobson og N.S. Trubetskoy ut de "særeegenskapene" til fonemer. Disse funksjonene er basert på strukturen til taleorganene - tunge, tenner, stemmebånd. For eksempel på engelsk er forskjellen mellom "t" og "d" tilstedeværelsen eller fraværet av en "stemme" (spenningen i stemmebåndene) og stemmenivået som skiller ett fonem fra et annet. Dermed kan fonologi betraktes som et eksempel på den generelle språkregelen beskrevet av Saussure: «Det er bare forskjeller i språk». Enda viktigere er ikke dette: forskjellen innebærer vanligvis de nøyaktige forholdene den befinner seg mellom; men i språket er det bare forskjeller uten presise betingelser. Enten vi vurderer «betegnelse» eller «betegnet» – i språket er det verken begreper eller lyder som ville eksistert før utviklingen av språksystemet.

I saussureansk lingvistikk blir det studerte fenomenet forstått som et sett med sammenligninger og motsetninger av språk. Språk er både et uttrykk for ordenes betydning og et kommunikasjonsmiddel, og disse to funksjonene faller aldri sammen. Vi kan legge merke til vekslingen mellom form og innhold: språklige kontraster definerer dens strukturelle enheter, og disse enhetene samhandler for å skape et visst meningsfullt innhold. Siden elementene i språket er tilfeldige, kan verken kontrast eller kombinasjon være grunnlaget. Dette betyr at i et språk danner særtrekk en fonetisk kontrast på et annet forståelsesnivå, fonemer kombineres til morfemer, morfemer til ord, ord til setninger osv. I alle fall et helt fonem, ord, setning osv. er mer enn bare summen av delene.

Saussure foreslo ideen om en ny vitenskap fra det tjuende århundre, atskilt fra lingvistikk, og studerte rollen til tegn i samfunnet. Saussure kalte denne vitenskapen semiologi (fra det greske "semeon" - et tegn). "Vitenskapen" om semiotikk, som utviklet seg i Øst-Europa på 1920-1930-tallet og i Paris på 1950-1960-tallet, utvidet studiet av språk og språklige strukturer til litterære funn sammensatt (eller artikulert) i form av disse strukturene. I tillegg, i skumringen av karrieren, parallelt med kurset i generell lingvistikk, engasjerte Saussure seg i en "semiotisk" analyse av senromersk poesi, og prøvde å oppdage bevisst komponerte anagrammer av egennavn. Denne metoden var på mange måter det motsatte av rasjonalisme i dens språklige analyse: den var et forsøk på å studere i et system problemet med "sannsynlighet" i språk. Slik forskning bidrar til å fokusere på den «virkelige siden» av sannsynlighet; «stikkordet» som Saussure leter etter et anagram for, er ifølge Jean Starobinsky «et verktøy for poeten, ikke kilden til diktets liv». Diktet tjener til å bytte ut lydene til nøkkelordet. I følge Starobinsky fordyper ikke Saussure i denne analysen søket etter skjulte betydninger. Tvert imot, i hans verk er et ønske om å unngå spørsmål knyttet til bevissthet merkbart: «siden poesi ikke bare uttrykkes i ord, men også i det disse ordene gir opphav til, går den utenfor bevissthetens kontroll og avhenger kun av språkets lover» (se . Vedlegg 1).

Saussures forsøk på å studere egennavn i senromersk poesi understreker en av komponentene i hans språklige analyse – tegnenes vilkårlige natur, samt den formelle essensen av Saussures språkvitenskap, som utelukker muligheten for å analysere mening. Todorov konkluderer med at verkene til Saussure i dag ser ut til å være ekstremt konsistente i deres motvilje mot å studere symbolene på et fenomen som har en klart definert betydning [vedlegg 1]. Ved å utforske anagrammer, legger Saussure kun hensyn til repetisjon, men ikke til tidligere alternativer. . . . Ved å studere Nibelungenlied, definerer han symbolene bare for å tilordne dem til feilavlesninger: hvis de er utilsiktede, eksisterer ikke symbolene. Tross alt, i sine skrifter om generell lingvistikk, gjør han antagelsen om eksistensen av en semiologi som ikke bare beskriver språklige tegn; men denne antakelsen er begrenset av det faktum at semiologi bare kan beskrive tilfeldige, vilkårlige tegn.

Hvis dette virkelig er slik, er det bare fordi han ikke kunne forestille seg "intensjon" uten et objekt; han klarte ikke helt å bygge bro mellom form og innhold – i hans forfatterskap ble dette til et spørsmål. I stedet vendte han seg mot «språklig legitimitet». Mellom på den ene siden nittende århundres begreper basert på historie og subjektive formodninger, og metoder for tilfeldig tolkning basert på disse begrepene, og på den annen side strukturalistiske begreper som sletter motsetningen mellom form og innhold (subjekt og objekt), mening og opprinnelse i strukturalisme, psykoanalyse og til og med kvantemekanikk, Ferdinand de Saussures skrifter om lingvistikk og semiotikk markerer et vendepunkt i studiet av betydninger i språk og kultur.

Russiske forskere var også representert på den første internasjonale kongressen for lingvister i Haag i 1928. S. Kartsevsky, R. Yakobson og N. Trubetskoy laget en rapport som undersøkte den hierarkiske strukturen til språket - i ånden til de mest moderne ideene for begynnelsen av forrige århundre. Jakobson utviklet i sine skrifter Saussures ideer om at de grunnleggende elementene i et språk først og fremst bør studeres i forbindelse med deres funksjoner, og ikke med årsakene til deres forekomst.

Dessverre, etter at Stalin kom til makten i 1924, blir russisk lingvistikk, som mange andre vitenskaper, kastet tilbake. Mange talentfulle vitenskapsmenn ble tvunget til å emigrere, ble utvist fra landet eller døde i leire. Det var først på midten av 1950-tallet at en viss pluralisme av teorier ble mulig – mer om det i avsnitt 1.2.


1.2 Anvendelse av matematiske metoder i lingvistikk i andre halvdel av det tjuende århundre


Ved midten av det tjuende århundre hadde fire verdensspråklige skoler dannet seg, som hver viste seg å være stamfaren til en viss "nøyaktig" metode. Den fonologiske skolen i Leningrad (forfaderen var en elev av Baudouin de Courtenay L.V. Shcherba) brukte et psykolingvistisk eksperiment basert på analysen av talen til morsmål som hovedkriteriet for å generalisere lyd i form av et fonem.

Forskere fra Praha Linguistic Circle, spesielt grunnleggeren N.S. Trubetskoy, som emigrerte fra Russland, utviklet teorien om opposisjoner - den semantiske strukturen til språket ble beskrevet av dem som et sett med opposisjonelt konstruerte semantiske enheter - Sem. Denne teorien ble brukt i studiet av ikke bare språk, men også kunstnerisk kultur.

Den amerikanske deskriptivismens ideologer var lingvistene L. Bloomfield og E. Sapir. Språk ble presentert for deskriptivister som et sett med taleutsagn, som var hovedobjektet for deres studie. Deres fokus var på reglene for vitenskapelig beskrivelse (derav navnet) av tekster: studiet av organisering, arrangement og klassifisering av elementene deres. Formalisering av analytiske prosedyrer innen fonologi og morfologi (utvikling av prinsipper for studiet av språk på forskjellige nivåer, distributiv analyse, metoden for direkte bestanddeler, etc.) førte til utformingen av generelle spørsmål om språklig modellering. Uoppmerksomhet på planen for språkets innhold, så vel som den paradigmatiske siden av språket, tillot ikke deskriptivister å tolke språket som et system fullt nok.

På 1960-tallet utviklet teorien om formell grammatikk seg, som hovedsakelig oppsto på grunn av arbeidet til den amerikanske filosofen og språkforskeren N. Chomsky. Han regnes med rette som en av de mest kjente moderne vitenskapsmenn og offentlige personer, mange artikler, monografier og til og med en dokumentar i full lengde er viet til ham. Med navnet på en fundamentalt ny måte å beskrive den syntaktiske strukturen oppfunnet av Chomsky - generativ (generativ) grammatikk - ble den tilsvarende trenden i lingvistikk kalt generativisme.

Chomsky, en etterkommer av innvandrere fra Russland, studerte lingvistikk, matematikk og filosofi ved University of Pennsylvania siden 1945, og ble sterkt påvirket av sin lærer Zelig Harris - i likhet med Harris, betraktet Chomsky og anser fortsatt sine politiske synspunkter nær anarkisme (han er fortsatt kjent som kritiker av det eksisterende amerikanske politiske systemet og som en av anti-globalismens åndelige ledere).

Chomskys første store vitenskapelige arbeid, hans masteroppgave Morphology of Modern Hebrew (1951), forble upublisert. Chomsky tok doktorgraden fra University of Pennsylvania i 1955, men mye av forskningen som lå til grunn for avhandlingen hans (publisert i sin helhet først i 1975 under tittelen The Logical Structure of Linguistic Theory) og hans første monografi, Syntactic Structures (1957, Rus. trans. . 1962), ble fremført ved Harvard University i 1951-1955. I samme 1955 flyttet forskeren til Massachusetts Institute of Technology, hvor han ble professor i 1962.

Chomskys teori har gått gjennom flere stadier i utviklingen.

I den første monografien "Syntactic Structures" presenterte forskeren språket som en mekanisme for å generere et uendelig sett med setninger ved å bruke et begrenset sett med grammatiske virkemidler. For å beskrive språklige egenskaper foreslo han begrepene dype (skjult fra direkte persepsjon og generert av et system med rekursive, dvs. kan brukes gjentatte ganger, regler) og overflate (direkte oppfattet) grammatiske strukturer, samt transformasjoner som beskriver overgangen fra dype strukturer til overflatestrukturer. Flere overflatestrukturer kan tilsvare en dyp struktur (for eksempel den passive konstruksjonen Dekretet er signert av presidenten er avledet fra den samme dype strukturen som den aktive konstruksjonen presidenten signerer dekretet) og omvendt (for eksempel tvetydigheten Mor elsker datter beskrives som et resultat av tilfeldighetene av overflatestrukturer som går tilbake til to forskjellige dyp, i den ene hvor moren er den som elsker datteren, og i den andre den som datteren elsker).

Chomskys standardteori anses å være "Aspects"-modellen som er fremsatt i Chomskys bok "Aspects of the Theory of Syntax". I denne modellen ble for første gang regler for semantisk tolkning introdusert i formell teori, som tilskrev mening til dype strukturer. I Aspects står språklig kompetanse i motsetning til bruk av språk (performance), den såkalte Katz-Postal-hypotesen om bevaring av mening under transformasjon tas i bruk, i forbindelse med hvilken begrepet valgfri transformasjon er utelukket, og et apparat av syntaktiske funksjoner som beskriver leksikalsk kompatibilitet introduseres.

På 1970-tallet arbeidet Chomsky med teorien om styring og binding (GB-teori – fra ordene regjering og binding) – mer generell enn den forrige. I den forlot forskeren de spesifikke reglene som beskriver de syntaktiske strukturene til spesifikke språk. Alle transformasjoner er erstattet med én universell bevegelsestransformasjon. Innenfor rammen av GB-teorien finnes det også private moduler som hver står for sin del av grammatikken.

Allerede nylig, i 1995, la Chomsky frem et minimalistisk program, der menneskelig språk beskrives som maskinspråk. Det er bare et program, ikke en modell eller en teori. I den identifiserer Chomsky to hovedundersystemer av det menneskelige språkapparatet: leksikonet og datasystemet, samt to grensesnitt - fonetisk og logisk.

Chomskys formelle grammatikker har blitt klassiske for å beskrive ikke bare naturlige, men også kunstige språk - spesielt programmeringsspråk. Utviklingen av strukturell lingvistikk i andre halvdel av 1900-tallet kan med rette betraktes som en "chomskisk revolusjon".

Moskva fonologiske skole, hvis representanter var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, brukte en lignende teori for å studere fonetikk. Gradvis begynner "eksakte" metoder å bli brukt med hensyn til ikke bare fonetikk, men også syntaks. Både lingvister og matematikere, både her og i utlandet, begynner å studere språkets struktur. På 1950- og 60-tallet begynte et nytt stadium i samspillet mellom matematikk og lingvistikk i USSR, assosiert med utviklingen av maskinoversettelsessystemer.

Drivkraften for begynnelsen av disse verkene i vårt land var den første utviklingen innen maskinoversettelse i USA (selv om den første mekaniserte oversettelsesenheten av P.P. Smirnov-Troyansky ble oppfunnet i USSR i 1933, den var primitiv, ble ikke utbredt). I 1947 kom A. Butt og D. Britten med en kode for ord-for-ord-oversettelse ved hjelp av en datamaskin, et år senere foreslo R. Richens en regel for å dele ord i stammer og endelser i maskinoversettelse. Disse årene var ganske annerledes enn i dag. Dette var veldig store og dyre maskiner som tok opp hele rom og krevde en stor stab av ingeniører, operatører og programmerere for å vedlikeholde dem. I utgangspunktet ble disse datamaskinene brukt til å utføre matematiske beregninger for behovene til militære institusjoner - det nye innen matematikk, fysikk og teknologi tjente først og fremst militære anliggender. I de tidlige stadiene ble utviklingen av MP aktivt støttet av militæret, mens (under forholdene under den kalde krigen) utviklet den russisk-engelske retningen seg i USA, og den anglo-russiske retningen i USSR.

I januar 1954 fant Georgetown-eksperimentet, den første offentlige demonstrasjonen av oversettelse fra russisk til engelsk på IBM-701-maskinen, sted ved Massachusetts Technical University. Sammendrag av meldingen om den vellykkede gjennomgangen av eksperimentet, laget av D.Yu. Panov, dukket opp i RJ "Mathematics", 1954, nr. 10: "Oversettelse fra ett språk til et annet ved hjelp av en maskin: en rapport om den første vellykkede testen."

D. Yu. Panov (den gang direktør for Institute of Scientific Information - INI, senere VINITI) involverte I. K. Belskaya, som senere ledet maskinoversettelsesgruppen ved Institute of Precise Mathematics and Computer Engineering ved USSR Academy of Sciences, for å arbeid med maskinoversettelse. Ved slutten av 1955 dateres den første erfaringen med å oversette fra engelsk til russisk ved hjelp av BESM-maskinen tilbake. Programmer for BESM ble satt sammen av N.P. Trifonov og L.N. Korolev, hvis doktorgradsavhandling var viet metoder for å konstruere ordbøker for maskinoversettelse.

Parallelt ble det utført arbeid med maskinoversettelse ved Institutt for anvendt matematikk ved Mathematical Institute of USSR Academy of Sciences (nå M.V. Keldysh Institute of Applied Mathematics ved det russiske vitenskapsakademiet). Etter initiativ fra matematikeren A.A. Lyapunov. Han involverte O.S. Kulagin og hennes studenter T.D. Wentzel og N.N. Ricco. Ideene til Lyapunov og Kulagina om muligheten for å bruke teknologi til å oversette fra ett språk til et annet ble publisert i tidsskriftet Nature, 1955, nr. 8. Fra slutten av 1955 ble T.N. Moloshnaya, som deretter begynte uavhengig arbeid med den engelsk-russiske oversettelsesalgoritmen.

R. Frumkina, som på den tiden var engasjert i oversettelsesalgoritmen fra spansk, husker at det på dette stadiet av arbeidet var vanskelig å ta noen konsekvente skritt. Mye oftere måtte jeg følge den heuristiske opplevelsen - min egen eller kolleger.

Den første generasjonen av maskinoversettelsessystemer var imidlertid svært ufullkomne. Alle var basert på sekvensielle oversettelsesalgoritmer "ord for ord", "frase for frase" - semantiske sammenhenger mellom ord og setninger ble ikke tatt i betraktning på noen måte. For eksempel kan vi sitere setningene: «John lette etter lekeboksen sin. Til slutt fant han det. Boksen lå i pennen. John var veldig glad. (John lette etter lekeboksen sin. Til slutt fant han den. Boksen lå i lekegrind. John var veldig fornøyd.) «Penn» er i denne sammenheng ikke en «penn» (skriveverktøy), men en «lekegrind» (lekepenn). Kunnskap om synonymer, antonymer og figurative betydninger er vanskelig å legge inn i en datamaskin. En lovende retning var utviklingen av datasystemer fokusert på bruk av en menneskelig oversetter.

Over tid ble direkte oversettelsessystemer erstattet av T-systemer (fra det engelske ordet "transfer" - transformasjon), der oversettelse ble utført på nivå med syntaktiske strukturer. Algoritmene til T-systemer brukte en mekanisme som gjorde det mulig å bygge en syntaktisk struktur i henhold til grammatikkreglene for språket i inngangssetningen (ligner på hvordan et fremmedspråk undervises på videregående), og deretter syntetisere utgangssetningen ved å transformere den syntaktiske strukturen og erstatte de nødvendige ordene fra ordboken.

Lyapunov snakket om oversettelse ved å trekke ut betydningen av den oversatte teksten og presentere den på et annet språk. Tilnærmingen til å bygge maskinoversettelsessystemer basert på å oppnå den semantiske representasjonen av inngangssetningen ved semantisk analyse og syntese av inngangssetningen i henhold til den oppnådde semantiske representasjonen anses fortsatt som den mest perfekte. Slike systemer kalles I-systemer (fra ordet "interlingua"). Oppgaven med å lage dem, satt tilbake på slutten av 50- og begynnelsen av 60-tallet, er imidlertid ikke fullt ut løst så langt, til tross for innsatsen fra International Federation of IFIP, verdenssamfunnet av forskere innen informasjonsbehandling.

Forskere tenkte på hvordan man formaliserer og bygger algoritmer for å jobbe med tekster, hvilke ordbøker som skal legges inn i maskinen, hvilke språklige mønstre som skal brukes i maskinoversettelse. Tradisjonell lingvistikk hadde ikke slike ideer – ikke bare når det gjelder semantikk, men også når det gjelder syntaks. På den tiden var det ingen lister over syntaktiske konstruksjoner for noe språk, betingelsene for deres kompatibilitet og utskiftbarhet ble ikke studert, reglene for å konstruere store enheter av syntaktisk struktur fra mindre bestanddeler ble ikke utviklet.

Behovet for å skape det teoretiske grunnlaget for maskinoversettelse førte til dannelsen og utviklingen av matematisk lingvistikk. Den ledende rollen i denne saken i USSR ble spilt av matematikerne A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ble viet studiet av den formelle teorien om grammatikk (samtidig med N. Khomsky i USA), Kuznetsov la frem oppgaven med aksiomatisering av lingvistikk, som går tilbake til verkene til F.F. Fortunatov.

mai 1960 ble dekretet fra presidiet til USSR Academy of Sciences "Om utvikling av strukturelle og matematiske metoder for studiet av språk" vedtatt, og de tilsvarende avdelingene ble opprettet ved Institute of Linguistics og Institute of det russiske språket. Siden 1960 begynte de ledende humanitære universitetene i landet - det filologiske fakultetet ved Moscow State University, Leninrad, Novosibirsk-universiteter, Moscow State Institute of Foreign Languages ​​- å trene innen automatisk tekstbehandling.

Imidlertid er maskinoversettelsesverk fra denne perioden, kalt "klassisk", av teoretisk snarere enn praktisk interesse. Kostnadseffektive maskinoversettelsessystemer begynte å bli opprettet først på åttitallet av forrige århundre. Jeg vil snakke om dette senere i avsnitt 2.1, Maskinoversettelse.

1960-70-tallet inkluderer dyp teoretisk utvikling ved bruk av metodene for settteori og matematisk logikk, som feltteori og fuzzy set-teori.

Forfatteren av feltteori i lingvistikk var den sovjetiske poeten, oversetteren og lingvisten V.G. Admoni. Han utviklet først teorien sin på grunnlag av det tyske språket. For Admoni betegner konseptet "felt" et vilkårlig ikke-tomt sett med språklige elementer (for eksempel "leksikalsk felt", "semantisk felt").

Strukturen til feltet er heterogen: den består av en kjerne, hvis elementer har et komplett sett med funksjoner som definerer et sett, og en periferi, hvis elementer kan ha begge egenskapene til et gitt sett (ikke alle) og naboene. Jeg vil gi et eksempel som illustrerer denne påstanden: for eksempel, på engelsk, er feltet med sammensatte ord ("dagdrøm" - "drøm" vanskelig å skille fra feltet med uttrykk ("tåregass" - "tåregass"). .

Teorien om uklare sett som allerede er nevnt ovenfor er nært knyttet til feltteori. I USSR har lingvister V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dens stamfar var den amerikanske matematikeren L. Zadeh, som i 1965 publiserte artikkelen "Fuzzy Logic". Zade ga en matematisk begrunnelse for teorien om uklare sett, og vurderte dem på grunnlag av språklig materiale.

I denne teorien snakker vi ikke så mye om tilhørigheten av elementer til et gitt sett (АОа), som om graden av denne tilhørigheten (mАОа), siden perifere elementer kan tilhøre flere felt i en eller annen grad. Zade (Lofti-zade) var opprinnelig fra Aserbajdsjan, frem til han var 12 år hadde han praksisen med å kommunisere på fire språk - aserbajdsjansk, russisk, engelsk og persisk - og brukte tre forskjellige alfabeter: kyrillisk, latin, arabisk. Når en vitenskapsmann blir spurt om hva som er felles mellom teorien om uklare sett og lingvistikk, benekter han ikke denne sammenhengen, men presiserer: «Jeg er ikke sikker på at studiet av disse språkene hadde stor innflytelse på min tenkning. Hvis dette var tilfelle, så bare ubevisst. I sin ungdom studerte Zadeh ved en presbyteriansk skole i Teheran, og etter andre verdenskrig emigrerte han til USA. "Spørsmålet er ikke om jeg er amerikaner, russisk, aserbajdsjansk eller hva som helst," sa han.

Lignende sammendrag:

Språk og tale som et av de grunnleggende problemene i stilistikk. Konseptet fonem og fonologisk nivå. Begrepet språk som system og nivåer i språksystemet. Konseptet med morfemer og deres typer. En setning som en syntaktisk enhet av en tekst. Tegn på språksystemet.


Topp