Historien om tillämpningen av matematiska metoder i lingvistik. Reflektioner över samspelet mellan lingvistik och matematik

Formandet av strukturell lingvistik vid 1800- och 1900-talets skifte. Statistiska metoder i språkinlärning. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet. Att lära sig språket med metoder för formell logik. Funktioner i maskinöversättning.

INTRODUKTION

Kapitel 1. Historien om tillämpningen av matematiska metoder i lingvistik

1.1. Bildandet av strukturell lingvistik vid 1800- och 1900-talet

1.2. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1. Maskinöversätta

2.2.Statistiska metoder i språkinlärning

2.3. Att lära sig ett språk med metoder för formell logik

2.4. Utsikter för tillämpning av matematiska metoder i lingvistik

Slutsats

Litteratur

Bilaga 1. Ronald Schleifer. Ferdinand de Saussure

Bilaga 2. Ferdinand de Saussure (översättning)

INTRODUKTION

Under 1900-talet har det funnits en fortsatt trend mot interaktion och interpenetration av olika kunskapsområden. Gränserna mellan de enskilda vetenskaperna suddas ut gradvis; det finns fler och fler grenar av mental aktivitet som befinner sig "i korsningen" av humanitär, teknisk och naturvetenskaplig kunskap.

En annan uppenbar egenskap hos moderniteten är viljan att studera strukturer och deras beståndsdelar. Därför ges en allt större plats, både i vetenskapsteori och i praktiken, till matematik. Genom att å ena sidan komma i kontakt med logik och filosofi, å andra sidan med statistik (och följaktligen med samhällsvetenskap), tränger matematiken allt djupare in i de områden som länge ansågs vara rent. "humanitär", som utökar sin heuristiska potential (svaret på frågan "hur mycket" hjälper ofta till att svara på frågorna "vad" och "hur"). Språkvetenskapen var inget undantag.

Syftet med mitt kursarbete är att kort belysa sambandet mellan matematik och en sådan gren av lingvistik som lingvistik. Sedan 1950-talet har matematik använts inom lingvistik för att skapa en teoretisk apparat för att beskriva språkens struktur (både naturliga och artificiella). Samtidigt bör det sägas att den inte omedelbart fann en sådan praktisk tillämpning för sig själv. Inledningsvis började matematiska metoder inom lingvistik användas för att klargöra lingvistikens grundläggande begrepp, men med utvecklingen av datateknik började en sådan teoretisk premiss att få tillämpning i praktiken. Lösningen av sådana uppgifter som maskinöversättning, maskinell informationshämtning, automatisk textbearbetning krävde ett fundamentalt nytt förhållningssätt till språket. Språkvetarna ställdes inför frågan: hur man lär sig att representera språkliga mönster i den form i vilken de kan appliceras direkt på tekniken. Termen "matematisk lingvistik", som är populär i vår tid, syftar på all språklig forskning som använder exakta metoder (och begreppet exakta metoder inom naturvetenskap är alltid nära besläktat med matematik). Vissa forskare från de senaste åren tror att uttrycket i sig inte kan höjas till en term, eftersom det inte betyder någon speciell "lingvistik", utan bara en ny riktning fokuserad på att förbättra, öka noggrannheten och tillförlitligheten av språkforskningsmetoder . Lingvistik använder både kvantitativa (algebraiska) och icke-kvantitativa metoder, vilket för den närmare matematisk logik, och följaktligen till filosofi och till och med psykologi. Till och med Schlegel noterade samspelet mellan språk och medvetande, och Ferdinand de Saussure, en framstående lingvist i början av 1900-talet (jag kommer att berätta om hans inflytande på utvecklingen av matematiska metoder inom lingvistik senare), kopplade samman språkets struktur med dess tillhörighet till folket. Den moderna forskaren L. Perlovsky går längre och identifierar språkets kvantitativa egenskaper (till exempel antalet kön, fall) med särdragen hos den nationella mentaliteten (mer om detta i avsnitt 2.2, "Statistiska metoder i lingvistik").

Samspelet mellan matematik och lingvistik är ett mångfacetterat ämne, och i mitt arbete kommer jag inte att uppehålla mig vid alla, utan först och främst vid dess tillämpade aspekter.

Kapitel IHistoria om tillämpning av matematiska metoder i lingvistik

1.1 Bildande av strukturell lingvistikvid början av XIX - XX århundradena

Den matematiska beskrivningen av språket är baserad på idén om språket som en mekanism, som går tillbaka till den berömda schweiziska lingvisten från det tidiga nittonhundratalet, Ferdinand de Saussure.

Den första länken till hans koncept är teorin om språket som ett system som består av tre delar (språket i sig är det språk, Tal - Lösenord, och talaktivitet - språk), där varje ord (medlem av systemet) inte betraktas i sig självt utan i samband med andra medlemmar. Som en annan framstående lingvist, dansken Louis Hjelmslev, senare noterade, var Saussure "den förste som krävde ett strukturellt förhållningssätt till språket, det vill säga en vetenskaplig beskrivning av språket genom att registrera relationerna mellan enheter."

Saussures förståelse av språket som en hierarkisk struktur var den första som ställde problemet med värdet och betydelsen av språkliga enheter. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter.

Den strukturella enheten i Saussures språk betraktade ordet "tecken", där ljud och betydelse kombinerades. Inget av dessa element existerar utan varandra: därför förstår modersmålet de olika nyanserna av betydelsen av ett polysemantiskt ord som ett separat element i den strukturella helheten, i språket.

I F. de Saussures teori kan man alltså se samspelet mellan lingvistik å ena sidan med sociologi och socialpsykologi (det bör noteras att samtidigt utvecklas Husserls fenomenologi, Freuds psykoanalys, Einsteins relativitetsteori. , pågår experiment om form och innehåll inom litteratur, musik och bildkonst), å andra sidan med matematik (systemicitetsbegreppet motsvarar det algebraiska språkbegreppet). Ett sådant begrepp förändrade begreppet språklig tolkning som sådant: Fenomen började tolkas inte i relation till orsakerna till deras förekomst, utan i relation till nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikterna kan vara opersonliga, "omedvetna" i ordets freudianska mening).

Funktionen av den språkliga mekanismen manifesteras genom talaktiviteten hos modersmålstalare. Resultatet av tal är de så kallade "korrekta texterna" - sekvenser av talenheter som lyder vissa mönster, av vilka många tillåter en matematisk beskrivning. Teorin om sätt att beskriva den syntaktiska strukturen behandlar studier av metoder för matematisk beskrivning av korrekta texter (främst meningar). I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

I väst utvecklas Saussures idéer av den store schweiziska lingvistens yngre samtida: i Danmark - L. Hjelmslev, redan av mig nämnd, som gav upphov till den algebraiska språkteorin i sitt arbete "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tjeckien - den ryska emigrantforskaren N. Trubetskoy.

Statistiska regelbundenheter i studiet av språk började behandlas av ingen mindre än genetikens grundare, Georg Mendel. Det var först 1968 som filologer upptäckte att han under de sista åren av sitt liv fascinerades av studiet av språkliga fenomen med hjälp av matematikens metoder. Mendel tog med sig denna metod till lingvistik från biologin; på 1990-talet var det bara de mest vågade lingvisterna och biologerna som hävdade genomförbarheten av en sådan analys. I arkiven av klostret St. Tomasz i Brno, vars abbot var Mendel, hittades ark med kolumner av efternamn som slutade på "mann", "bauer", "mayer" och med några bråkdelar och beräkningar. I ett försök att upptäcka de formella lagarna för släktnamnens ursprung, gör Mendel komplexa beräkningar, där han tar hänsyn till antalet vokaler och konsonanter i det tyska språket, det totala antalet ord han anser, antalet efternamn, etc.

I vårt land började den strukturella lingvistiken utvecklas ungefär samtidigt som i väst - vid 1800- och 1900-talens skiftning. Samtidigt med F. de Saussure utvecklades begreppet språk som ett system i deras arbeten av professorer vid Kazan University F.F. Fortunatov och I.A. Baudouin de Courtenay. Den senare korresponderade länge med de Saussure, respektive Genève- och Kazan-språkskolan samarbetade med varandra. Om Saussure kan kallas ideologen för "exakta" metoder inom lingvistik, så lade Baudouin de Courtenay de praktiska grunderna för deras tillämpning. Han var den förste att separera lingvistik (som exakt en vetenskap som använder statistiska metoder och funktionellt beroende) från filologi (en gemenskap av humanitära discipliner som studerar andlig kultur genom språk och tal). Forskaren själv trodde att "lingvistik kan vara användbar inom en snar framtid, bara befriad från den obligatoriska föreningen med filologi och litteraturhistoria". Fonologi blev "testplatsen" för införandet av matematiska metoder i lingvistiken - ljud som "atomer" i språksystemet, med ett begränsat antal lätt mätbara egenskaper, var det lämpligaste materialet för formella, rigorösa beskrivningsmetoder. Fonologi förnekar existensen av mening i ljud, så den "mänskliga" faktorn eliminerades i studierna. I denna mening är fonem som fysiska eller biologiska föremål.

Fonemer, som de minsta språkliga element som är acceptabla för perception, representerar en separat sfär, en separat "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Huvudsaken är att fonemet kommer att utföra sin huvudsakliga - meningsfulla - funktion. Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med eller utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa funktioner är baserade på strukturen av talorganen - tunga, tänder, stämband. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av en "röst" (spänningen i stämbanden) och röstnivån som skiljer ett fonem från ett annat. Därmed kan fonologi betraktas som ett exempel på den allmänna språkregel som Saussure beskrev: "Det finns bara skillnader i språket". Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språket är både ett uttryck för ordens betydelse och ett kommunikationsmedel, och dessa två funktioner sammanfaller aldrig. Vi kan lägga märke till växlingen mellan form och innehåll: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till morfem, morfem - till ord, ord - till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än bara summan av dess delar.

Saussure föreslog idén om en ny vetenskap från 1900-talet, skild från lingvistik, som studerade teckens roll i samhället. Saussure kallade denna vetenskap för semiologi (från grekiskan "semeion" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller artikulerade) i termer av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade sig Saussure åt en "semiotisk" analys av sen romersk poesi, och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i dess språkliga analys: den var ett försök att i ett system studera problemet med "sannolikhet" i språket. Sådan forskning hjälper till att fokusera på den "verkliga sidan" av sannolikhet; "nyckelordet" som Saussure letar efter ett anagram för är enligt Jean Starobinsky "ett verktyg för poeten, inte källan till diktens liv." Dikten tjänar till att byta ut nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar” (se . Bilaga 1).

Saussures försök att studera egennamn i senromersk poesi framhäver en av komponenterna i hans språkliga analys – teckens godtyckliga karaktär, såväl som den formella essensen av Saussures språkvetenskap, som utesluter möjligheten att analysera betydelse. Todorov drar slutsatsen att idag verkar Saussures verk vara extremt konsekventa i sin ovilja att studera symbolerna för ett fenomen som har en tydligt definierad betydelse [Bilaga 1]. När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semiologi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoder för slumpmässig tolkning baserad på dessa begrepp, och å andra sidan strukturalistiska begrepp som raderar motsättningen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik - Ferdinand de Saussures skrifter om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ryska vetenskapsmän var också representerade vid den första internationella lingvistkongressen i Haag 1928. S. Kartsevsky, R. Yakobson och N. Trubetskoy gjorde en rapport som undersökte språkets hierarkiska struktur - i andan av de modernaste idéerna för början av förra seklet. Jakobson utvecklade i sina skrifter Saussures idéer om att de grundläggande elementen i ett språk först och främst bör studeras i samband med deras funktioner, och inte med orsakerna till deras förekomst.

Tyvärr, efter att Stalin kom till makten 1924, kastas rysk lingvistik, liksom många andra vetenskaper, tillbaka. Många begåvade vetenskapsmän tvingades emigrera, förvisades från landet eller dog i läger. Först sedan mitten av 1950-talet har en viss pluralism av teorier blivit möjlig – mer om detta i avsnitt 1.2.

1.2 Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

I mitten av 1900-talet hade fyra världsspråkliga skolor bildats, som var och en visade sig vara förfader till en viss "exakt" metod. Leningrad fonologiska skola(dess förfader var en elev till Baudouin de Courtenay L.V. Shcherba) använde ett psykolingvistiskt experiment baserat på analys av talet från infödda talare som huvudkriteriet för att generalisera ljud i form av ett fonem.

Forskare Prags språkcirkel, i synnerhet - dess grundare N.S. Trubetskoy, som emigrerade från Ryssland, utvecklade teorin om oppositioner - språkets semantiska struktur beskrevs av dem som en uppsättning oppositionellt konstruerade semantiska enheter - Sem. Denna teori tillämpades i studiet av inte bara språk, utan också konstnärlig kultur.

Ideologer Amerikansk deskriptivism var lingvisterna L. Bloomfield och E. Sapir. Språket presenterades för deskriptivister som en uppsättning talpåståenden, som var huvudobjektet för deras studie. Deras fokus låg på reglerna för vetenskaplig beskrivning (därav namnet) av texter: studiet av organisation, arrangemang och klassificering av deras element. Formalisering av analytiska procedurer inom fonologi och morfologi (utveckling av principer för studiet av språk på olika nivåer, distributiv analys, metoden för direkta beståndsdelar, etc.) ledde till formuleringen av allmänna frågor om språklig modellering. Ouppmärksamhet på planen för språkets innehåll, liksom den paradigmatiska sidan av språket, tillät inte deskriptivister att tolka språket som ett system fullt ut.

På 1960-talet utvecklades teorin om formell grammatik, som uppstod främst på grund av den amerikanske filosofen och lingvisten N. Chomskys arbete. Han anses med rätta vara en av de mest kända moderna vetenskapsmännen och offentliga personerna, många artiklar, monografier och till och med en dokumentär i full längd ägnas åt honom. Med namnet på ett i grunden nytt sätt att beskriva den syntaktiska strukturen som Chomsky uppfann - generativ (genererande) grammatik - kallades motsvarande trend inom lingvistik. generativism.

Chomsky, en ättling till invandrare från Ryssland, studerade lingvistik, matematik och filosofi vid University of Pennsylvania sedan 1945, starkt influerad av sin lärare Zelig Harris - liksom Harris, Chomsky betraktade och betraktar fortfarande sina politiska åsikter nära anarkismen (han är fortfarande känd som kritiker av det befintliga amerikanska politiska systemet och som en av anti-globalismens andliga ledare).

Chomskys första stora vetenskapliga arbete, magisteruppsats "Morphology of Modern Hebrew » (1951) har förblivit opublicerad. Chomsky doktorerade från University of Pennsylvania 1955, men mycket av den forskning som ligger till grund för hans avhandling (publicerad i sin helhet först 1975 under titeln The Logical Structure of Linguistic Theory) och hans första monografi, Syntactic Structures (1957, Rus. trans. . 1962), framfördes vid Harvard University 1951-1955. Samma 1955 flyttade vetenskapsmannen till Massachusetts Institute of Technology, där han blev professor 1962.

Chomskys teori har gått igenom flera stadier i sin utveckling.

I den första monografin "Syntaktiska strukturer" presenterade vetenskapsmannen språket som en mekanism för att generera en oändlig uppsättning meningar med en ändlig uppsättning grammatiska medel. För att beskriva språkliga egenskaper föreslog han begreppen djupa (dolda från direkt perception och genererade av ett system av rekursiva, d.v.s. kan tillämpas upprepade gånger, regler) och ytliga (direkt uppfattade) grammatiska strukturer, såväl som transformationer som beskriver övergången från djupa strukturer till ytstrukturer. Flera ytstrukturer kan motsvara en djup struktur (till exempel en passiv struktur Dekretet är undertecknat av presidenten härledd från samma djupa struktur som den aktiva konstruktionen Presidenten undertecknar dekretet) och vice versa (alltså tvetydigheten mamma älskar dotter beskrivs som resultatet av ett sammanträffande av ytstrukturer som går tillbaka till två olika djupa, där den ena är den som älskar dottern och i den andra den som är älskad av dottern).

Chomskys standardteori anses vara "Aspects"-modellen som anges i Chomskys bok "Aspects of the Theory of Syntax". I denna modell introducerades för första gången regler för semantisk tolkning i formell teori, vilket tillskrev mening till djupa strukturer. I Aspects ställs språklig kompetens i motsats till språkanvändning (performance), den så kallade Katz-Postalhypotesen om bevarande av mening under transformation antas, i samband med vilken begreppet valfri transformation utesluts, och en apparat av syntaktiska egenskaper som beskriver lexikal kompatibilitet introduceras.

På 1970-talet arbetade Chomsky med teorin om kontroll och bindning (GB-teori - från orden regering Och bindande) är mer allmän än den föregående. I den övergav forskaren de specifika reglerna som beskriver de syntaktiska strukturerna för specifika språk. Alla transformationer har ersatts med en universell rörelsetransformation. Inom ramen för GB-teorin finns även privata moduler som var och en ansvarar för sin egen del av grammatiken.

Redan nyligen, 1995, lade Chomsky fram ett minimalistiskt program, där mänskligt språk beskrivs som maskinspråk. Det här är bara ett program - inte en modell eller en teori. I den identifierar Chomsky två huvuddelsystem i den mänskliga språkapparaten: lexikonet och datorsystemet, såväl som två gränssnitt - fonetisk och logisk.

Chomskys formella grammatiker har blivit klassiska för att beskriva inte bara naturliga utan också konstgjorda språk - i synnerhet programmeringsspråk. Den strukturella lingvistikens utveckling under andra hälften av 1900-talet kan med rätta betraktas som en "chomskisk revolution".

Moskvas fonologiska skola, vars företrädare var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, använde en liknande teori för att studera fonetik. Så småningom börjar "exakta" metoder tillämpas med avseende på inte bara fonetik, utan också syntax. Både lingvister och matematiker, både här och utomlands, börjar studera språkets struktur. På 1950- och 60-talen började ett nytt skede i samspelet mellan matematik och lingvistik i Sovjetunionen, i samband med utvecklingen av maskinöversättningssystem.

Drivkraften till början av dessa arbeten i vårt land var den första utvecklingen inom området maskinöversättning i USA (även om den första mekaniserade översättningsanordningen av P.P. Smirnov-Trojanskij uppfanns i Sovjetunionen 1933, eftersom den var primitiv, blev inte utbredd). 1947 kom A. Butt och D. Britten med en kod för ord-för-ord-översättning med hjälp av en dator, ett år senare föreslog R. Richens en regel för att dela upp ord i stammar och ändelser i maskinöversättning. De åren var helt annorlunda än idag. Det var mycket stora och dyra maskiner som tog hela rum och krävde en stor stab av ingenjörer, operatörer och programmerare för att underhålla dem. I grund och botten användes dessa datorer för att utföra matematiska beräkningar för militära institutioners behov - det nya inom matematik, fysik och teknik tjänade först och främst militära angelägenheter. I de tidiga stadierna stöddes utvecklingen av MP aktivt av militären, med allt detta (under det kalla krigets förhållanden), den rysk-engelska riktningen utvecklades i USA och den anglo-ryska riktningen i Sovjetunionen.

I januari 1954 ägde "Georgetown Experiment" rum vid Massachusetts Technical University - den första offentliga demonstrationen av översättning från ryska till engelska på IBM-701-maskinen. Sammanfattning av meddelandet om den framgångsrika passagen av experimentet, gjort av D.Yu. Panov, dök upp i RJ "Mathematics", 1954, nr 10: "Översättning från ett språk till ett annat med hjälp av en maskin: en rapport om det första framgångsrika testet."

D. Yu. Panov (vid den tiden chef för Institute of Scientific Information - INI, senare VINITI) lockade I. K. Belskaya, som senare ledde maskinöversättningsgruppen vid Institutet för exakt matematik och datorteknik vid USSR Academy of Sciences, till att arbeta med maskinöversättning. I slutet av 1955 går den första erfarenheten av att översätta från engelska till ryska med hjälp av BESM-maskinen tillbaka. Program för BESM sammanställdes av N.P. Trifonov och L.N. Korolev, vars doktorsavhandling ägnades åt metoder för att konstruera ordböcker för maskinöversättning.

Parallellt utfördes arbete med maskinöversättning vid institutionen för tillämpad matematik vid det matematiska institutet vid USSR Academy of Sciences (nu M.V. Keldysh Institute of Applied Mathematics of the Russian Academy of Sciences). På initiativ av matematikern A.A. Lyapunov. Han involverade O.S. Kulagin och hennes elever T.D. Wentzel och N.N. Ricco. Lyapunovs och Kulaginas idéer om möjligheten att använda teknik för att översätta från ett språk till ett annat publicerades i tidskriften Nature, 1955, nr 8. Från slutet av 1955 har T.N. Moloshnaya, som sedan började självständigt arbete med den engelsk-ryska översättningsalgoritmen.

R. Frumkina, som vid den tiden var engagerad i översättningsalgoritmen från spanska, minns att det i detta skede av arbetet var svårt att ta några konsekventa steg. Mycket oftare var jag tvungen att följa den heuristiska upplevelsen - min egen eller kollegor.

Samtidigt var den första generationen av maskinöversättningssystem mycket ofullkomlig. Alla var baserade på sekventiella översättningsalgoritmer "ord för ord", "fras för fras" - semantiska samband mellan ord och meningar togs inte i beaktande på något sätt. Till exempel är meningarna: John letade efter sin leksakslåda.Till slut hittade han den. Lådan låg i pennan.John var väldigt glad. (John letade efter sin leksakslåda. Till slut hittade han den. Lådan låg i lekhagen. John var väldigt glad.)" "Penna" i detta sammanhang är inte en "penna" (skrivverktyg), utan en "lekhage" ( lek-penna). Kunskap om synonymer, antonymer och bildliga betydelser är svåra att föra in i en dator. En lovande riktning var utvecklingen av datorsystem fokuserade på användningen av en mänsklig översättare.

Med tiden ersattes direktöversättningssystem av T-system (från det engelska ordet "transfer" - transformation), där översättningen utfördes på nivån av syntaktiska strukturer. T-systemens algoritmer använde en mekanism som gjorde det möjligt att bygga en syntaktisk struktur enligt grammatikreglerna för språket i inmatningssatsen (liknande hur ett främmande språk lärs ut på gymnasiet), och sedan syntetisera den utgående meningen genom att omvandla den syntaktiska strukturen och ersätta de nödvändiga orden från ordboken.

Lyapunov talade om översättning genom att extrahera innebörden av den översatta texten och presentera den på ett annat språk. Tillvägagångssättet för att bygga maskinöversättningssystem baserat på att erhålla den semantiska representationen av den ingående meningen genom semantisk analys och syntes av den inmatade meningen enligt den erhållna semantiska representationen anses fortfarande vara den mest perfekta. Sådana system kallas I-system (från ordet "interlingua"). Samtidigt har uppgiften att skapa dem, som ligger tillbaka i slutet av 50-talet och början av 60-talet, inte lösts helt hittills, trots ansträngningarna från International Federation of IFIP - världsgemenskapen av forskare inom informationsbehandlingsområdet .

Forskare funderade på hur man formaliserar och bygger algoritmer för att arbeta med texter, vilka ordböcker som ska skrivas in i maskinen, vilka språkliga mönster som ska användas i maskinöversättning. Den traditionella lingvistiken hade inte sådana idéer – inte bara vad gäller semantik, utan också när det gäller syntax. På den tiden fanns det inga listor över syntaktiska konstruktioner för något språk, villkoren för deras kompatibilitet och utbytbarhet studerades inte, reglerna för att konstruera stora enheter av syntaktisk struktur från mindre beståndsdelar utvecklades inte.

Behovet av att skapa de teoretiska grunderna för maskinöversättning ledde till bildandet och utvecklingen av matematisk lingvistik. Den ledande rollen i denna fråga i Sovjetunionen spelades av matematikerna A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ägnades åt studiet av den formella teorin om grammatik (samtidigt med N. Khomsky i USA), Kuznetsov lade fram uppgiften att axiomatisera lingvistiken, som går tillbaka till F.F. Fortunatov.

Den 6 maj 1960 antogs dekretet från presidiet för USSR Academy of Sciences "Om utvecklingen av strukturella och matematiska metoder för studier av språk", och motsvarande avdelningar skapades vid Institute of Linguistics och Institute of det ryska språket. Sedan 1960 började landets ledande humanitära universitet - fakulteten för filologi vid Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​- att utbilda personal inom området för automatisk textbehandling.

Samtidigt är verk med maskinöversättning av denna period, kallade "klassisk", av mer teoretiskt än praktiskt intresse. Kostnadseffektiva maskinöversättningssystem började skapas först på åttiotalet av förra seklet. Jag kommer att prata om detta senare i avsnitt 2.1, Maskinöversättning.

1960-70-talen inkluderar djupa teoretiska utvecklingar med metoder för mängdlära och matematisk logik, såsom fältteori och fuzzy mängdteori.

Författaren till fältteori i lingvistik var den sovjetiske poeten, översättaren och lingvisten V.G. Admoni. Han utvecklade till en början sin teori utifrån det tyska språket. För Admoni betecknar begreppet "fält" en godtycklig icke-tom uppsättning språkliga element (till exempel "lexikalt fält", "semantiskt fält").

Fältets struktur är heterogen: den består av en kärna, vars element har en komplett uppsättning egenskaper som definierar en uppsättning, och en periferi, vars element kan ha båda egenskaperna hos en given uppsättning (inte alla) och närliggande. Jag kommer att ge ett exempel som illustrerar detta uttalande: till exempel, på engelska, är fältet för sammansatta ord ("day-dream" - "dream" svårt att skilja från fältet för fraser ("tårgas" - "tårgas"). .

Teorin om fuzzy sets som redan nämnts ovan är nära besläktad med fältteori. I Sovjetunionen har lingvisterna V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dess förfader var den amerikanske matematikern L. Zadeh, som 1965 publicerade artikeln "Fuzzy Logic". Zade gav en matematisk motivering för teorin om luddiga mängder och övervägde dem på basis av språkligt material.

I den här teorin talar vi inte så mycket om elements tillhörighet till en given mängd (Aa), utan om graden av detta medlemskap (Aa), eftersom perifera element kan tillhöra flera fält i en eller annan grad. Zade (Lofti-zade) var född i Azerbajdzjan, fram till 12 års ålder hade han praxis att kommunicera på fyra språk - azerbajdzjanska, ryska, engelska och persiska - och använde tre olika alfabet: kyrilliska, latinska, arabiska. När en vetenskapsman tillfrågas vad som är gemensamt mellan teorin om fuzzy sets och lingvistik, förnekar han inte detta samband, utan förtydligar: ”Jag är inte säker på att studiet av dessa språk hade ett stort inflytande på mitt tänkande. Om så var fallet, då bara undermedvetet. I sin ungdom studerade Zadeh på en presbyteriansk skola i Teheran, och efter andra världskriget emigrerade han till USA. "Frågan är inte om jag är amerikan, ryss, azerbajdzjan eller någon annan", sa han i ett av samtalen, "jag är formad av alla dessa kulturer och folk och känner mig ganska bekväm bland var och en av dem." I dessa ord finns något som liknar det som kännetecknar teorin om fuzzy sets - ett avsteg från entydiga definitioner och skarpa kategorier.

I vårt land, på 70-talet, översattes och studerades verk av västerländska lingvister från 1900-talet. I.A. Melchuk översatte N. Chomskys verk till ryska. PÅ. Slyusareva kopplar i sin bok "The Theory of F. de Saussure in the Light of Modern Linguistics" samman postulaten från Saussures undervisning med 70-talets lingvistiks faktiska problem. Det finns en tendens till ytterligare matematisering av lingvistik. De ledande inhemska universiteten utbildar personal i specialiteten "matematisk (teoretisk, tillämpad) lingvistik". Samtidigt sker i västvärlden ett kraftigt språng i utvecklingen av datateknik, vilket kräver allt fler språkliga grunder.

På 1980-talet, professor vid Institutet för orientaliska studier vid Vetenskapsakademien Yu.K. Lekomtsev, medan han analyserar språkvetenskapens språk genom analys av scheman, tabeller och andra typer av notation som används i språkliga beskrivningar, anser matematiska system lämpliga för dessa ändamål (främst system av matrisalgebra).

Under hela det tjugonde århundradet var det alltså en konvergens mellan det exakta och humaniora. Samspelet mellan matematik och lingvistik fick alltmer praktiska tillämpningar. Mer om detta i nästa kapitel.

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1 Maskinöversättning

Idén att översätta från ett språk till ett annat med hjälp av en universell mekanism uppstod flera århundraden innan den första utvecklingen på detta område började - redan 1649 föreslog Rene Descartes idén om ett språk där motsvarande idéer om olika språk skulle uttryckas med en symbol. De första försöken att implementera denna idé på 1930-40-talet, början av den teoretiska utvecklingen i mitten av seklet, förbättringen av översättningssystem med hjälp av teknik på 1970-80-talet, den snabba utvecklingen av översättningstekniken under det senaste decennium - det här är stadierna i utvecklingen av maskinöversättning som bransch. Det är från arbetet med maskinöversättning som datorlingvistik som vetenskap har vuxit fram.

Med utvecklingen av datorteknik i slutet av 70-talet och början av 80-talet satte forskarna upp sig mer realistiska och kostnadseffektiva mål – maskinen blev inte en konkurrent (som tidigare antagits), utan en assistent till en mänsklig översättare. Maskinöversättning upphör att tjäna enbart militära uppgifter (alla sovjetiska och amerikanska uppfinningar och forskning, främst inriktad på ryska och engelska, bidrog till det kalla kriget på ett eller annat sätt). 1978 sändes ord i naturliga språk över Arpa sammankopplade nätverk, och sex år senare dök de första översättningsprogrammen för mikrodatorer upp i USA.

På 70-talet köpte Europeiska gemenskapernas kommission den engelsk-franska versionen av datoröversättaren Systran, och beställde även de fransk-engelska och italienska-engelska versionerna och det ryska-till-engelska översättningssystemet som används av den amerikanska försvarsmakten. Så lades grunden till EUROTRA-projektet.

Om återupplivandet av maskinöversättning på 70-80-talet. Följande fakta vittnar: Europeiska gemenskapernas kommission (CEC) köper den engelsk-franska versionen av Systran, samt översättningssystemet från ryska till engelska (det senare utvecklades efter ALPAC-rapporten och fortsatte att användas av US Air Force och NASA); dessutom beordrar CEC utvecklingen av de fransk-engelska och italiensk-engelska versionerna. Samtidigt sker en snabb expansion av maskinöversättningsaktiviteter i Japan; i USA beordrar Pan American Health Organization (PAHO) utvecklingen av en spansk-engelsk riktning (SPANAM-system); Det amerikanska flygvapnet finansierar utvecklingen av ett maskinöversättningssystem vid Linguistic Research Center vid University of Texas i Austin; TAUM-gruppen i Kanada gör betydande framsteg i utvecklingen av sitt METEO-system (meteorologisk översättning). Ett antal projekt startade på 70- och 80-talen. utvecklades sedan till fullfjädrade kommersiella system.

Under perioden 1978-93 spenderades 20 miljoner dollar på forskning inom området maskinöversättning i USA, 70 miljoner i Europa och 200 miljoner i Japan.

En av de nya utvecklingarna är TM-teknologin (översättningsminne), som fungerar enligt ackumuleringsprincipen: under översättningsprocessen sparas det ursprungliga segmentet (meningen) och dess översättning, vilket resulterar i bildandet av en språklig databas; om ett identiskt eller liknande segment hittas i den nyöversatta texten, visas det tillsammans med översättningen och en indikation på procentuell matchning. Översättaren fattar sedan ett beslut (att redigera, avvisa eller acceptera översättningen), vars resultat lagras av systemet, så det finns inget behov av att översätta samma mening två gånger. Ett välkänt kommersiellt system baserat på TM-teknologi utvecklas för närvarande av TRADOS-systemet (grundat 1984).

För närvarande utvecklar flera dussin företag kommersiella maskinöversättningssystem, inklusive: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata programvara; Linguistica b.v. Nu kan du använda automatiska översättares tjänster direkt på webben: alphaWorks; PROMTs onlineöversättare, LogoMedia.net, AltaVistas översättningstjänst för Babel Fish; InfiniT.com; Översätta Internet.

Kommersiellt effektiva översättningssystem dök upp under andra hälften av 80-talet även i vårt land. Själva begreppet maskinöversättning har utökats (det började inkludera "skapandet av ett antal automatiska och automatiserade system och enheter som automatiskt eller halvautomatiskt utför hela översättningscykeln eller enskilda uppgifter i en dialog med en person"), och statliga anslag för utveckling av denna industri har ökat.

Ryska, engelska, tyska, franska och japanska blev huvudspråken i inhemska översättningssystem. All-Union Translation Center (VTsP) utvecklade ett system för att översätta från engelska och tyska till ryska på en dator ES-1035-ANRAP. Den bestod av tre ordböcker - inmatning av engelska och tyska och utmatning av ryska - under en enda programvara. Det fanns flera utbytbara specialiserade ordböcker - för datateknik, programmering, radioelektronik, maskinteknik, jordbruk, metallurgi. Systemet kunde fungera i två lägen - automatiskt och interaktivt, när skärmen visade källtexten och översättningen per fras, som en person kunde redigera. Hastigheten för att översätta text till ANRAP (från början av att skriva till slutet av utskrift) var cirka 100 sidor per timme.

1989 skapades en familj av kommersiella översättare av typen SPRINT, som arbetade med ryska, engelska, tyska och japanska. Deras främsta fördel var deras kompatibilitet med IBM PC - sålunda nådde inhemska maskinöversättningssystem den internationella kvalitetsnivån. Samtidigt utvecklas ett system för maskinöversättning från franska till ryska FRAP, som inkluderar 4 stadier av textanalys: grafematisk, morfologisk, syntaktisk och semantisk. I LGPI dem. Herzen, arbete pågick på ett fyraspråkigt (engelska, franska, spanska, ryska) SILOD-MP-system (engelsk-ryska och fransk-ryska ordböcker användes i industriellt läge.

För specialiserad översättning av texter om elektroteknik fanns ETAP-2-systemet. Analysen av ingångstexten i den utfördes på två nivåer - morfologisk och syntaktisk. ETAP-2 ordboken innehöll cirka 4 tusen poster; stadiet för textomvandling - cirka 1000 regler (96 allmänna, 342 privata, resten är ordbok). Allt detta säkerställde en tillfredsställande kvalitet på översättningen (säg, titeln på patentet "Optisk fasnätarrangemang och kopplingsanordning som har ett sådant arrangemang" översattes som "En optisk fasnätanordning och en anslutningsanordning med en sådan anordning" - trots att tautologi, innebörden bevaras).

Vid Minsks pedagogiska institut för främmande språk, på grundval av den engelsk-ryska ordboken för ordformer och fraser, uppfanns ett system för maskinöversättning av titlar, vid Institutet för orientaliska studier vid Vetenskapsakademien - ett system för översättning från japanska till ryska. Den första automatiska vokabulär- och terminologitjänsten (SLOTHERM) för datoranvändning och programmering, skapad vid Moskvas forskningsinstitut för automationssystem, innehöll cirka 20 000 termer i en förklarande ordbok och speciella ordböcker för språkforskning.

Maskinöversättningssystem började gradvis användas inte bara för sitt avsedda syfte, utan också som en viktig komponent i automatiska inlärningssystem (för undervisning i översättning, kontroll av stavning och grammatisk kunskap).

90-talet förde med sig den snabba utvecklingen av PC-marknaden (från stationär dator till ficka) och informationsteknik, den utbredda användningen av Internet (som blir mer internationellt och flerspråkigt). Allt detta gjorde att vidareutvecklingen av automatiserade översättningssystem efterfrågades. Sedan början av 1990-talet Inhemska utvecklare går också in på PC-systemmarknaden.

I juli 1990 presenterades det första kommersiella maskinöversättningssystemet i Ryssland som heter PROMT (PROgrammers maskinöversättning) vid PC Forum i Moskva. 1991, ZAO [!!! I enlighet med federal lag-99 av 05.05.2014, detta formulär ersattes av ett icke-offentligt aktiebolag] "Project MT", och redan 1992 vann PROMT-bolaget NASA-tävlingen för leverans av MP-system (PROMT var det enda icke-amerikanska företaget i denna tävling). hela familjen av system under det nya namnet STYLUS för översättning från engelska, tyska, franska, italienska och spanska till ryska och från ryska till engelska, och 1993 skapades världens första maskinöversättningssystem för Windows på basis av STYLUS. STYLUS 2.0 för Windows 3.X/95/NT släpptes, och 1995-1996 introducerades den tredje generationen av maskinöversättningssystem, helt 32-bitars STYLUS 3.0 för Windows 95/NT, samtidigt som utvecklingen av en helt nytt, världens första rysk-tyska och rysk-franska maskinöversättningssystem.

1997 tecknades ett avtal med det franska företaget Softissimo om skapandet av översättningssystem från franska till tyska och engelska och vice versa, och i december i år släpptes världens första tysk-franska översättningssystem. Samma år släppte PROMT-företaget ett system implementerat med Gigant-teknologin, som stöder flera språkriktningar i ett skal, samt en speciell översättare för att arbeta på Internet WebTranSite.

1998 släpptes en hel konstellation av program under det nya namnet PROMT 98. Ett år senare släppte PROMT två nya produkter: ett unikt mjukvarupaket för att arbeta på Internet - PROMT Internet, och en översättare för företagspostsystem - PROMT Mail Översättare. I november 1999 erkändes PROMT som det bästa maskinöversättningssystemet som testats av den franska tidskriften PC Expert och överträffade sina konkurrenter med 30 procent. Särskilda serverlösningar har också utvecklats för företagskunder - företagsöversättningsservern PROMT Translation Server (PTS) och internetlösningen PROMT Internet Translation Server (PITS). År 2000 uppdaterade PROMT hela sin serie av mjukvaruprodukter genom att släppa en ny generation av MT-system: PROMT Translation Office 2000, PROMT Internet 2000 och Magic Gooddy 2000.

Onlineöversättning med stöd av PROMT-systemet används på ett antal inhemska och utländska webbplatser: PROMTs onlineöversättare, InfiniT.com, Translate.Ru, Lycos, etc., såväl som i institutioner med olika profiler för översättning av affärsdokument, artiklar och brev (det finns översättningssystem inbyggda direkt i Outlook Express och andra e-postklienter).

Nuförtiden växer nya maskinöversättningsteknologier fram baserade på användningen av artificiell intelligens och statistiska metoder. Om det senare - i nästa avsnitt.

2.2 Extrametoder för språkinlärning

Betydande uppmärksamhet i modern lingvistik ägnas åt studiet av språkliga fenomen med hjälp av metoderna för kvantitativ matematik. Kvantitativa data hjälper ofta till att djupare förstå de fenomen som studeras, deras plats och roll i systemet av relaterade fenomen. Svaret på frågan "hur mycket" hjälper till att svara på frågorna "vad", "hur", "varför" - sådan är den heuristiska potentialen hos en kvantitativ egenskap.

Statistiska metoder spelar en betydande roll i utvecklingen av maskinöversättningssystem (se avsnitt 2.1). I det statistiska tillvägagångssättet betraktas översättningsproblemet i termer av en brusig kanal. Föreställ dig att vi behöver översätta en mening från engelska till ryska. Den bullriga kanalprincipen ger oss följande förklaring av förhållandet mellan en engelsk och en rysk mening: en engelsk mening är inget annat än en rysk mening som förvrängs av något slags brus. För att återställa den ursprungliga ryska meningen måste vi veta vad folk brukar säga på ryska och hur ryska fraser förvrängs till engelska. Översättningen utförs genom att söka efter en sådan rysk mening som maximerar produkterna av den ovillkorliga sannolikheten för den ryska meningen och sannolikheten för den engelska meningen (original) givet den givna ryska meningen. Enligt Bayes teorem är denna ryska mening den mest sannolika översättningen av engelska:

där e är översättningssatsen och f är den ursprungliga meningen

Så vi behöver en källmodell och en kanalmodell, eller en språkmodell och en översättningsmodell. Språkmodellen måste tilldela en sannolikhetspoäng till vilken mening som helst på målspråket (i vårt fall ryska), och översättningsmodellen till den ursprungliga meningen. (se tabell 1)

I allmänhet fungerar ett maskinöversättningssystem i två lägen:

1. Systemträning: en utbildningskorpus av parallella texter tas, och med hjälp av linjär programmering söker man efter sådana värden på översättningskorrespondenstabeller som maximerar sannolikheten för (till exempel) den ryska delen av korpusen med tillgänglig engelska enligt till den valda översättningsmodellen. En modell av det ryska språket är byggd på den ryska delen av samma korpus.

2. Exploatering: baserat på data som erhållits för en obekant engelsk mening, söks efter en ryska som maximerar produkten av sannolikheterna som tilldelas av språkmodellen och översättningsmodellen. Programmet som används för en sådan sökning kallas en avkodare.

Den enklaste statistiska översättningsmodellen är den bokstavliga översättningsmodellen. Denna modell antar att för att översätta en mening från ett språk till ett annat räcker det att översätta alla ord (skapa en "påse med ord"), och modellen kommer att ge deras placering i rätt ordning. För att minska P( a, f | e) till P(a | e, f), dvs. sannolikheter för en given anpassning givet ett par meningar, varje sannolikhet P(a, f | e) normaliseras med summan av sannolikheterna för alla anpassningar av ett givet par meningar:

Implementeringen av Viterbi-algoritmen som används för att träna modell #1 är som följer:

1. Hela tabellen med översätär fylld med samma värden.

2. För alla möjliga varianter av parvisa kopplingar av ord beräknas sannolikheten P(a, f | e):

3. Värdena för P(a, f | e) normaliseras för att erhålla värdena för P(a | e, f).

4. Frekvensen för varje översättningspar beräknas, viktad med sannolikheten för varje inriktningsalternativ.

5. De resulterande viktade frekvenserna normaliseras och bildar en ny tabell över översättningskorrespondenssannolikheter

6. Algoritmen upprepas från steg 2.

Betrakta, som ett exempel, träningen av en liknande modell på en korpus av två par meningar (Fig. 2):

vita huset

Efter ett stort antal iterationer kommer vi att få en tabell (tabell 2), som visar att översättningen är utförd med hög noggrannhet.

Statistiska metoder används också i stor utsträckning i studiet av ordförråd, morfologi, syntax och stil. Forskare från Perm State University genomförde en studie baserad på påståendet att stereotypa fraser är ett viktigt "byggmaterial" i texten. Dessa fraser består av "nukleära" upprepade ord och beroende ordspecifikatorer och har en uttalad stilistisk färgning.

I den vetenskapliga stilen kan "nukleära" ord kallas: forskning, studie, uppgift, problem, fråga, fenomen, fakta, observation, analys etc. Inom journalistiken kommer andra ord att vara "kärnkraft", som har ett ökat värde specifikt för tidningens text: tid, person, makt, affär, handling, lag, liv, historia, plats etc. (totalt 29)

Av särskilt intresse för lingvister är också den professionella differentieringen av det nationella språket, originaliteten i användningen av ordförråd och grammatik, beroende på typ av yrke. Det är känt att förare i professionellt tal använder formen sh O fer, säger läkarna k O klubb istället för cocktail Yu sh - sådana exempel kan ges. Statistikens uppgift är att spåra variabiliteten i uttalet och förändringen i språknormen.

Professionella skillnader leder till skillnader inte bara grammatiska utan också lexikala. Yakut State University uppkallad efter M.K. Ammosov analyserades 50 frågeformulär med de vanligaste reaktionerna på vissa ord bland läkare och byggare (tabell 3).

Byggare

Mänsklig

patient (10), personlighet (5)

man (5)

Bra

hjälp (8), hjälp (7)

ond (16)

liv

död (10)

härlig (5)

död

lik (8)

livet (6)

brand

värma (8), bränna (6)

eld (7)

finger

hand (14), panaritium (5)

stor (7), index (6)

ögon

syn (6), pupill, ögonläkare (5 vardera)

brun (10), stor (6)

huvud

sinne (14), hjärnor (5)

stor (9), smart (8), smart (6)

förlora

medvetande, liv (4 vardera)

pengar (5), hitta (4)

Det kan noteras att läkare oftare än byggmästare ger associationer med anknytning till deras yrkesverksamhet, eftersom ordstimuli som ges i enkäten har mer att göra med deras yrke än med yrket som byggmästare.

Statistiska regelbundenheter i ett språk används för att skapa frekvensordböcker - ordböcker som ger numeriska egenskaper för frekvensen av ord (ordformer, fraser) för vilket språk som helst - författarens språk, något arbete, etc. Vanligtvis förekommer frekvensen av ett ord används som ett kännetecken för användning i texten i en viss volym

Modellen för taluppfattning är omöjlig utan en ordbok som dess väsentliga komponent. I uppfattningen av tal är den grundläggande operativa enheten ordet. Av detta följer särskilt att varje ord i den uppfattade texten måste identifieras med motsvarande enhet av lyssnarens (eller läsarens) interna ordförråd. Det är naturligt att anta att sökningen redan från början är begränsad till vissa underdomäner i ordboken. Enligt de flesta moderna teorier om taluppfattning ger den faktiska fonetiska analysen av den klingande texten i ett typiskt fall endast viss delinformation om ordets möjliga fonologiska utseende, och denna typ av information motsvarar inte ett, utan ett visst MÅNGA ord av ordboken; Därför uppstår två problem:

(a) Välj lämplig uppsättning enligt vissa parametrar;

(b) inom gränserna för den skisserade uppsättningen (om den är allokerad på lämpligt sätt) att "eliminera" alla ord, utom det enda som bäst motsvarar det givna ordet i den erkända texten. En av strategierna för "avhopp" är att utesluta lågfrekventa ord. Härav följer att vokabulären för taluppfattning är en frekvensordbok. Det är skapandet av en datorversion av frekvensordboken för det ryska språket som är den initiala uppgiften för det presenterade projektet.

Baserat på materialet i det ryska språket finns det 5 frekvensordböcker (inte räknar grenordböcker). Låt oss bara notera några allmänna brister i de befintliga ordböckerna.

Alla kända frekvensordböcker för det ryska språket är baserade på bearbetning av skrivna (tryckta) texter. Delvis av denna anledning, när ett ords identitet till stor del bygger på formella, grafiska sammanträffanden, tas semantik inte tillräckligt med i beaktande. Som ett resultat är frekvensegenskaperna också förskjutna, förvrängda; till exempel, om kompilatorn av frekvensordboken inkluderar ord från kombinationen "varandra" i den allmänna statistiken för användningen av ordet "vän", så är detta knappast motiverat: med tanke på semantiken måste vi erkänna att dessa redan är olika ord, eller snarare, att en oberoende ordboksenhet bara är kombinationen som helhet.

I alla befintliga ordböcker placeras ord endast i sina grundläggande former: substantiv i singularform, nominativ kasus, verb i infinitivform, etc. Vissa av ordböckerna ger information om frekvensen av ordformer, men vanligtvis gör de det inte tillräckligt konsekvent, inte på ett uttömmande sätt. Frekvenserna för olika ordformer av samma ord stämmer uppenbarligen inte överens. Utvecklaren av taluppfattningsmodellen måste ta hänsyn till att i en verklig perceptuell process är det just en specifik ordform som är "nedsänkt" i texten som är föremål för igenkänning: baserat på analysen av den initiala delen av exponenten för ordformen, en uppsättning ord med identisk början bildas, och den initiala delen av ordformen är inte nödvändigtvis identisk med den initiala delen av ordboksformen. Det är ordformen som har en specifik rytmisk struktur, vilket också är en oerhört viktig parameter för det perceptuella urvalet av ord. Slutligen, i den slutliga representationen av det igenkända yttrandet, återigen, representeras orden av motsvarande ordformer.

Det finns många verk som visar vikten av frekvens i processen för taluppfattning. Men vi är inte medvetna om verk där frekvensen av ordformer skulle användas - tvärtom ignorerar alla författare praktiskt taget frekvensen av enskilda ordformer, och hänvisar uteslutande till lexem. Om resultaten som erhålls av dem inte anses vara artefakter, måste man anta att modersmålstalaren på något sätt har tillgång till information om förhållandet mellan frekvenserna av ordformer och ordboksformer, det vill säga faktiskt lexem. Dessutom kan en sådan övergång från en ordform till ett lexem naturligtvis inte förklaras av naturlig kunskap om motsvarande paradigm, eftersom frekvensinformation måste användas före den slutliga identifieringen av ordet, annars förlorar den helt enkelt sin mening.

Enligt de primära statistiska egenskaperna är det möjligt att med ett givet relativt fel fastställa den del av ordboken, som innehåller ord med hög förekomstfrekvens, oavsett typ av text. Det är också möjligt att, genom att införa stegvis ordning i ordboken, få en serie ordböcker som täcker de första 100, 1000, 5000, etc. av vanliga ord. Ordbokens statistiska egenskaper är av intresse i samband med den semantiska analysen av ordförråd. Studiet av ämnesideologiska grupper och semantiska fält visar att lexikala associationer stöds av semantiska länkar som är koncentrerade kring lexem med den vanligaste betydelsen. Beskrivningen av betydelser inom det lexiko-semantiska fältet kan utföras genom att identifiera ord med de mest abstrakta lexem i betydelse. Tydligen utgör "tomma" (ur synvinkel av nominativa styrkor) ordboksenheter ett statistiskt homogent lager.

Ordförråd för enskilda genrer är inte mindre värdefulla. Att studera måttet på deras likhet och arten av statistiska fördelningar kommer att ge intressant information om den kvalitativa stratifieringen av ordförråd beroende på användningsområdet för tal.

Sammanställning av stora frekvensordböcker kräver användning av datorteknik. ATT INTRODUCERA partiell mekanisering och automatisering i processen att arbeta med en ordbok är av intresse som ett experiment i maskinell bearbetning av ordböcker för olika texter. En sådan ordbok kräver ett mer rigoröst system för bearbetning och ackumulering av ordförrådsmaterial. I miniatyr är detta ett informationssökningssystem som kan ge information om olika aspekter av text och ordförråd. Några grundläggande förfrågningar till detta system är planerade från allra första början: det totala antalet inventeringsord, de statistiska egenskaperna för ett enstaka ord och hela ordböcker, ordningen av vanliga och sällsynta zoner i ordboken, etc. Maskinkortfilen låter dig att automatiskt bygga omvända ordböcker för enskilda genrer och källor. Många annan användbar statistisk information om språket kommer att extraheras från den ackumulerade mängden information. Datorfrekvensordboken skapar en experimentell grund för övergången till en mer omfattande automatisering av ordförrådsarbetet.

Statistiska data från frekvensordböcker kan också användas i stor utsträckning för att lösa andra språkliga problem - till exempel för att analysera och bestämma de aktiva sätten för ordbildning i det moderna ryska språket, lösa problem med att förbättra grafik och stavning, som är relaterade till att ta in ta hänsyn till statistisk information om ordförrådet (med allt detta är det viktigt att ta hänsyn till probabilistiska egenskaper hos grafekombinationer, typer av bokstavskombinationer realiserade i ord), praktisk transkription och translitteration. De statistiska parametrarna i ordboken kommer också att vara användbara för att lösa problem med att automatisera maskinskrivning, igenkänning och automatisk läsning av bokstavlig text.

Moderna förklarande ordböcker och grammatiker för det ryska språket är huvudsakligen byggda på basis av litterära och konstnärliga texter. Det finns frekvensordböcker över språket A.S. Pushkin, A.S. Griboedova, F.M. Dostojevskij, V.V. Vysotsky och många andra författare. Vid Institutionen för historia och litteraturteori i Smolensk-staten. Pedagogiska högskolan har under ett antal år arbetat med att sammanställa frekvensordböcker över poetiska och prosatexter. För denna studie valdes frekvensordböcker över alla texter av Pushkin och ytterligare två poeter från guldåldern - "Ve från Wit" av Griboyedov och all Lermontovs poesi; Pasternak och fem andra poeter från silveråldern - Balmont 1894-1903, "Dikter om den vackra damen" av Blok, "Sten" av Mandelstam, "Eldpelare" av Gumilyov, "Anno Domini MCMXXI" av Akhmatova och "Systrar till Mitt liv" av Pasternak och ytterligare fyra poeter från järnåldern - "Dikter av Yuri Zhivago", "När det klarnar upp", hela korpusen av texter av M. Petrovs, "Vägen är långt borta", "Vindskärmen", "Farväl till snön" och "Hästskor" av Mezhirov, "Antimirov" av Voznesensky och "Snezhnitsa » Rylenkova.

Det bör noteras att dessa ordböcker är olika till sin natur: vissa representerar vokabulären för ett dramatiskt verk, andra - böcker med sångtexter, eller flera böcker, eller hela korpusen av poetens dikter. Resultaten av analysen som presenteras i denna artikel bör tas med försiktighet, de kan inte tas som absoluta. Samtidigt kan skillnaden i texters ontologiska karaktär med hjälp av särskilda åtgärder minskas i viss mån.

På senare år har motsättningen mellan vardags- och boktal blivit allt tydligare insett. Denna fråga diskuteras särskilt skarpt bland metodologer som kräver en vändning i undervisningen mot det talade språket. Samtidigt förblir särdragen hos vardagstal fortfarande oförklarad.

Ordböcker bearbetades genom att skapa en användarapplikation i miljön för kontorsprogrammet EXCEL97. Applikationen innehåller fyra kalkylblad i EXCEL-boken - "Title Sheet", "Dictionaries" ark med initiala data, "Proximities" och "Distances" med resultat, samt en uppsättning makron.

Den första informationen skrivs in på bladet "Ordböcker". Ordböcker av de studerade texterna skrivs in i EXCEL-celler, den sista kolumnen S bildas från de erhållna resultaten och är lika med antalet ord som finns i andra ordböcker. Tabellerna "Närhet" och "Avstånd" innehåller beräknade mått på närhet M, korrelation R och avstånd D.

Applikationsmakron är händelsebaserade programmeringsprocedurer skrivna i Visual Basic for Application (VBA). Procedurerna är baserade på VBA-biblioteksobjekt och deras bearbetningsmetoder. Så för operationer med applikationens kalkylblad används nyckelobjektet Kalkylblad (kalkylblad) och motsvarande metod för att aktivera bladet Aktivera (aktivera). Inställning av intervallet för de analyserade källdata på ordboksbladet utförs med Select-metoden för Range-objektet (intervall), och överföringen av ord som värden till variabler utförs som Value-egenskapen (värde) för samma Range objekt.

Trots att rangkorrelationsanalys gör oss försiktiga med ämnens beroende mellan olika texter, har de flesta av de vanligaste orden i varje text matchningar i en eller flera andra texter. Kolumn S visar antalet sådana ord bland de 15 vanligaste orden för varje författare. Ord i fet stil förekommer endast i en poets ord i vår tabell. Blok, Akhmatova och Petrovs har inga markerade ord alls, de har S = 15. Dessa tre poeter har samma 15 vanligaste ord, de skiljer sig bara åt på platsen i listan. Men även Pushkin, vars ordförråd är det mest originella, har S = 8, och det finns 7 markerade ord.

Resultaten visar att det finns ett visst lager av ordförråd som koncentrerar poesins huvudteman. Som regel är dessa ord korta: av det totala antalet (225) ordanvändningar av enstavig 88, tvåstavig 127, trestavig 10. Ofta representerar dessa ord huvudmytologerna och kan delas in i par: natt - dag, jord - himmel (sol), Gud - människa (människor), liv - död, kropp - själ, Rom - värld(vid Mandelstam); kan kombineras till mytologer på högre nivå: himmel, stjärna, sol, jord; hos en person sticker som regel kroppen, hjärtat, blodet, armen, benet, kinden, ögonen ut. Av de mänskliga tillstånden ges företräde åt sömn och kärlek. Huset och städerna tillhör den mänskliga världen - Moskva, Rom, Paris. Kreativitet representeras av lexem ord Och låt.

Griboedov och Lermontov har nästan inga ord som betecknar naturen bland de vanligaste orden. De har tre gånger så många ord som betecknar en person, delar av hans kropp, delar av hans andliga värld. Pushkin och poeter av det tjugonde århundradet. beteckningar på människa och natur är ungefär lika. I denna viktiga aspekt av ämnet kan vi säga att det tjugonde århundradet. följde efter Pushkin.

Minimalt tema fall bland de vanligaste orden finns det bara i Griboyedov och Pushkin. Lermontov och nittonhundratalets poeter. det ger vika för ett minimalt tema ord. Ordet utesluter inte gärningar (den bibliska tolkningen av ämnet: i Nya testamentet betraktas alla Jesu Kristi läror som Guds ord eller Jesu ord, och apostlarna kallar sig ibland Ordets tjänare). Den heliga innebörden av lexemordet manifesteras på ett övertygande sätt, till exempel i Pasternaks vers "Och världens bild, uppenbarad i Ordet". Den heliga betydelsen av lexem ord i samband med och kontrast till mänskliga angelägenheter manifesteras det på ett övertygande sätt i dikten med samma namn av Gumilyov.

Polletter som bara finns i en text kännetecknar originaliteten hos en given bok eller en samling böcker. Till exempel är ordet "mind" det vanligaste i Griboedovs komedi "Wee from Wit" - men det förekommer inte bland frekvensorden i andra texter. Sinnets tema är det överlägset viktigaste inom komedi. Detta lexem åtföljer bilden av Chatsky, och namnet på Chatsky är det vanligaste i komedi. Verket kombinerar alltså organiskt det vanligaste vanliga substantivet med det vanligaste egennamnet.

Den högsta korrelationskoefficienten förbinder teman i de tragiska böckerna "Eldpelaren" av Gumilyov och "Anno Domini MCMXXI" av Akhmatova. Bland de 15 vanligaste substantiven finns det 10 vanliga, inklusive blod, hjärta, själ, kärlek, ord, himmel. Kom ihåg att Akhmatovas bok inkluderade en miniatyr "Du kommer inte att leva ...", skriven mellan arresteringen av Gumilyov och hans avrättning.

Teman för ljuset och folkmassan i det studerade materialet finns endast i "Yuri Zhivagos dikter". Temat för ljuset i verserna från romanen har många kontextuella betydelser: det är förknippat med bilden av Jesus Kristus, med teman som tro, odödlighet, kreativitet, kärleksdatum. Ljuset är den viktigaste ljuskällan i romanens centrala scener. Temat för folkmassan utvecklas i samband med romanens huvudidé, där en persons privatliv med dess orubbliga värden står i motsats till den nya statens omoral, byggd på principerna om att behaga folkmassan .

Arbetet innefattar också det tredje steget, som också återspeglas i programmet, - detta är beräkningen av skillnaden i ordningstalet för ord som är gemensamma för två ordböcker och det genomsnittliga avståndet mellan samma ord i två ordböcker. Detta steg gör det möjligt att gå från de allmänna trenderna i interaktionen mellan ordböcker som identifieras med hjälp av statistik till en nivå som närmar sig texten. Till exempel korrelerar Gumilyovs och Akhmatovas böcker statistiskt signifikant. Vi tittar på vilka ord som visade sig vara vanliga för deras ordböcker, och först och främst väljer vi de vars serienummer skiljer sig minimalt eller lika med noll. Det är dessa ord som har samma rangnummer och följaktligen är det dessa minimala teman i de två poeternas medvetande som är lika viktiga. Därefter bör du gå till nivån för texter och sammanhang.

Kvantitativa metoder hjälper också till att studera egenskaperna hos folk - modersmålstalare. Säg, det finns 6 fall på ryska, det finns inga fall på engelska, och på vissa språk av folket i Dagestan når antalet fall 40. L. Perlovsky i sin artikel "Medvetande, språk och kultur" korrelerar dessa egenskaper med folkens tendens till individualism eller kollektivism, med uppfattning om saker och fenomen separat eller i samband med andra. Det var trots allt i den engelsktalande världen (det finns inga fall - saken uppfattas "av sig själv") som begrepp som individuell frihet, liberalism och demokrati dök upp (jag noterar att jag använder dessa begrepp endast i samband med språk, utan några utvärderande egenskaper). Trots det faktum att sådana gissningar fortfarande bara förblir på nivån av djärva vetenskapliga hypoteser, hjälper de till att titta på redan bekanta fenomen på ett nytt sätt.

Som vi kan se kan kvantitativa egenskaper appliceras inom helt andra områden av lingvistiken, vilket alltmer suddar ut gränserna mellan "exakta" och "humanitära" metoder. Lingvistik tar allt mer till hjälp av inte bara matematik, utan även datorteknik för att lösa sina problem.

2.3 Lärande Ispråk med metoder för formell logik

Med icke-kvantitativa metoder för matematik, i synnerhet med logik, samverkar modern teoretisk lingvistik inte mindre fruktbart än med kvantitativa. Den snabba utvecklingen av datorteknik och tillväxten av deras roll i den moderna världen krävde en översyn av synen på samspelet mellan språk och logik i allmänhet.

Logikmetoderna används i stor utsträckning i utvecklingen av formaliserade språk, i synnerhet programmeringsspråk, vars element är några symboler (liknande matematiska), valda (eller konstruerade från tidigare valda symboler) och tolkade på ett visst sätt, associerade utan "traditionell" användning, förståelse och förståelse.funktioner av samma symboler i andra sammanhang. En programmerare sysslar ständigt med logik i sitt arbete. Meningen med programmering är bara att lära datorn att resonera (i ordets vidaste bemärkelse). Samtidigt visar sig metoderna för att "resonera" vara väldigt olika. Varje programmerare lägger en viss tid på att leta efter buggar i sina egna och andras program. Det vill säga att söka efter fel i resonemang, i logik. Och detta sätter också sina spår. Det är mycket lättare att upptäcka logiska fel i vanligt tal. Den relativa enkelheten hos språken som studeras av logiker gör att de kan belysa strukturerna för dessa språk tydligare än vad som är möjligt för lingvister som analyserar uteslutande komplexa naturliga språk. Med tanke på det faktum att de språk som studeras av logiker använder relationer kopierade från naturliga språk, kan logiker ge betydande bidrag till den allmänna teorin om språk. Situationen här liknar den som sker inom fysiken: fysikern formulerar också satser för idealiskt förenklade fall som inte alls förekommer i naturen - han formulerar lagar för idealgaser, idealvätskor, talar om rörelse i frånvaro av friktion, etc. För dessa idealiserade fall kan enkla lagar fastställas som i hög grad skulle bidra till förståelsen av vad som händer i verkligheten och vad som förmodligen skulle förbli okänt för fysiken om den försökte betrakta verkligheten direkt, i all dess komplexitet.

I studiet av naturliga språk används logiska metoder så att språkinlärare inte dumt kan "memorera" så många ord som möjligt, utan bättre förstå dess struktur. L. Shcherba använde också i sina föreläsningar ett exempel på en mening byggd enligt det ryska språkets lagar: "Den glittrande kuzdra shteko satte bokran och krullar bokran", och frågade sedan eleverna vad detta betydde. Trots att innebörden av orden i meningen förblev oklar (de existerar helt enkelt inte på ryska), var det möjligt att tydligt svara: "kuzdra" är ämnet, ett feminint substantiv, i singularis, nominativ, " bokr” är animerad osv. Översättningen av frasen visar sig vara ungefär så här: "Något feminint i ett svep gjorde något mot någon slags manlig varelse och började sedan göra något så här för en lång, gradvis en med sin unge." Ett liknande exempel på en text (konstnärlig) från icke-existerande ord, byggd helt enligt språkets lagar, är Lewis Carrolls Jabberwock (i Alice i Underlandet förklarar Carroll, genom sin karaktär Humpty Dumpty, betydelsen av orden han uppfann: "kokt" - klockan åtta på kvällen, när det är dags att laga middag, "chlivky" - tunn och skicklig, "shorek" - en korsning mellan en iller, en grävling och en korkskruv, "dyk" - ​​hoppa, dyka, snurra, "nava" - gräs under soluret (sträcker sig lite till höger, lite till vänster och lite bakåt), "grunt" - grymta och skratta, "zelyuk" - en grön kalkon, "myumzik" - en fågel; hennes fjädrar är rufsig och sticker ut i alla riktningar, som en kvast, "mova" - långt hemifrån) .

Ett av huvudkoncepten för modern logik och teoretisk lingvistik, som används i studien av språk av olika logiska och matematiska kalkyler, naturliga språk, för att beskriva förhållandet mellan språk på olika "nivåer" och för att karakterisera förhållandet mellan språk under övervägande och de ämnesområden som beskrivs med deras hjälp, är begreppet metaspråk. Ett metaspråk är ett språk som används för att uttrycka bedömningar om ett annat språk, språkobjektet. Med hjälp av ett metaspråk studerar de strukturen för teckenkombinationer (uttryck) av språkobjektet, bevisar satser om dess uttrycksegenskaper, om dess relation till andra språk etc. Språket som studeras kallas även ämnesspråk i förhållande till detta metaspråk. Både ämnesspråket och metaspråket kan vara vanliga (naturliga) språk. Metaspråket kan skilja sig från objektspråket (till exempel i en engelsk lärobok för ryska är ryska metaspråket och engelska är objektspråket), men det kan också sammanfalla med det eller bara skilja sig delvis, till exempel i speciell terminologi (Rysk lingvistisk terminologi är en del av metaspråket för att beskriva det ryska språket, de så kallade semantiska faktorerna är en del av metaspråket för att beskriva naturliga språks semantik).

Begreppet "metalinguage" har blivit mycket fruktbart i samband med studiet av formaliserade språk som är byggda inom ramen för matematisk logik. Till skillnad från formaliserade ämnesspråk är i detta fall metaspråket, med vilket metateorin formuleras (att studera egenskaperna hos ämnesteorin formulerad på ämnesspråket), i regel ett vanligt naturligt språk, på något speciellt sätt ett fragment av ett naturligt språk begränsat på ett speciellt sätt, som inte innehåller någon form av tvetydighet., metaforer, "metafysiska" begrepp, etc. element av vanligt språk som hindrar dess användning som ett verktyg för korrekt vetenskaplig forskning. Samtidigt kan själva metaspråket formaliseras och (oavsett detta) bli föremål för forskning som bedrivs med hjälp av metaspråket, och en sådan serie kan ”tänkas” växa i all oändlighet.

Logiken lär oss en fruktbar skillnad mellan språkobjektet och metaspråket. Språkobjektet är själva ämnet för logisk forskning, och metaspråket är det oundvikligen konstgjorda språk som sådan forskning bedrivs på. Logiskt tänkande består bara i att formulera relationerna och strukturen hos ett verkligt språk (objektspråk) på symbolspråket (metaspråk).

Metaspråket måste i alla fall vara "inte fattigare" än dess objektiva språk (dvs. för varje uttryck av det senare i metaspråket måste det finnas dess namn, "översättning") - annars, om dessa krav inte uppfylls (vilket säkerligen kräver plats i naturliga språk, om särskilda överenskommelser inte föreskriver annat) uppstår semantiska paradoxer (antinomier).

När fler och fler nya programmeringsspråk skapades, i samband med problemet med programmeringsöversättare, fanns det ett akut behov av att skapa metaspråk. För närvarande är Backus-Naur-formen metaspråk (förkortat BNF) det vanligaste för att beskriva syntaxen för programmeringsspråk. Det är en kompakt form i form av vissa formler som liknar matematiska. För varje begrepp i språket finns det en unik metaformel (normal formel). Den består av vänster och höger delar. Den vänstra sidan anger begreppet som definieras, och den högra anger uppsättningen av tillåtna språkkonstruktioner som kombineras i detta begrepp. Formeln använder speciella metatecken i form av vinkelparenteser, som innehåller begreppet som definieras (på vänster sida av formeln) eller ett tidigare definierat begrepp (på dess högra sida), och separationen mellan vänster och höger del anges med "::="-metatecken, vars betydelse är likvärdig med orden "per definition finns det". Metalinguistiska formler är inbäddade i översättare i någon form; med deras hjälp kontrolleras konstruktionerna som används av programmeraren för formell överensstämmelse med någon av de konstruktioner som är syntaktiskt giltiga i detta språk. Det finns också separata metaspråk för olika vetenskaper - sålunda finns kunskap i form av olika metaspråk.

Logiska metoder fungerade också som grunden för skapandet av artificiell intelligens baserade på begreppet kopplingism. Connectionism är en speciell trend inom filosofisk vetenskap, vars ämne är kunskapsfrågor. Inom ramen för denna trend görs försök att förklara de intellektuella förmågorna hos en person som använder artificiella neurala nätverk. Bestående av ett stort antal strukturella enheter som liknar neuroner, med en vikt tilldelad varje element som bestämmer styrkan i sambandet med andra element, är neurala nätverk förenklade modeller av den mänskliga hjärnan. Experiment med neurala nätverk av detta slag har visat deras förmåga att lära sig utföra uppgifter som mönsterigenkänning, läsning och identifiering av enkla grammatiska strukturer.

Filosofer började intressera sig för konnektionism, eftersom det konnektionistiska tillvägagångssättet lovade att tillhandahålla ett alternativ till den klassiska teorin om sinnet och den idé som allmänt hålls inom denna teori att sinnets funktion liknar bearbetningen av symbolspråk av en digital dator. Detta koncept är mycket kontroversiellt, men på senare år har det fått fler och fler anhängare.

Den logiska studien av språket fortsätter Saussures koncept om språket som ett system. Det faktum att det ständigt fortsätter bekräftar återigen djärvheten i vetenskapliga gissningar från början av förra seklet. Jag kommer att ägna det sista avsnittet av mitt arbete åt utsikterna för utvecklingen av matematiska metoder inom lingvistik idag.

2.4 Utsikter för tillämpning av matematiska metoder i lingvistik

I datateknikens tidevarv har matematisk lingvistiks metoder fått ett nytt utvecklingsperspektiv. Sökandet efter lösningar på problemen med språklig analys implementeras nu alltmer på informationssystemnivå. Samtidigt ställer automatisering av processen för bearbetning av språkligt material, vilket ger forskaren betydande möjligheter och fördelar, oundvikligen nya krav och uppgifter för honom.

Kombinationen av "exakt" och "humanitär" kunskap har blivit grogrund för nya upptäckter inom lingvistik, datavetenskap och filosofi.

Maskinöversättning från ett språk till ett annat är fortfarande en snabbt växande gren av informationsteknologi. Trots att datorstödd översättning aldrig kan jämföras i kvalitet med mänsklig översättning (särskilt för litterära texter) har maskinen blivit en oumbärlig assistent för en person vid översättning av stora textvolymer. Man tror att inom en snar framtid kommer mer avancerade översättningssystem att skapas, baserade i första hand på den semantiska analysen av texten.

Ett lika lovande område är samspelet mellan lingvistik och logik, som fungerar som en filosofisk grund för att förstå informationsteknologi och den så kallade "virtuella verkligheten". Inom en snar framtid kommer arbetet att fortsätta med skapandet av artificiell intelligens - även om det, återigen, aldrig kommer att vara lika med människan i sina förmågor. Sådan konkurrens är meningslös: i vår tid borde maskinen inte bli (och blir) en rival, utan en assistent till människan, inte något från fantasins rike, utan en del av den verkliga världen.

Studiet av språket med statistiska metoder fortsätter, vilket gör det möjligt att mer exakt bestämma dess kvalitativa egenskaper. Det är viktigt att de mest vågade hypoteserna om språk finner sitt matematiska, och därför logiska, bevis.

Det viktigaste är att olika grenar av matematikens tillämpning inom lingvistik, tidigare ganska isolerade, under de senaste åren har korrelerats med varandra, kopplat till ett sammanhängande system, i analogi med det språksystem som upptäcktes för ett sekel sedan av Ferdinand de Saussure och Yvan Baudouin de Courtenay. Detta är kontinuiteten i vetenskaplig kunskap.

Lingvistik i den moderna världen har blivit grunden för utvecklingen av informationsteknologi. Så länge datavetenskap förblir en snabbt växande gren av mänsklig verksamhet, kommer föreningen av matematik och lingvistik att fortsätta att spela sin roll i utvecklingen av vetenskap.

Slutsats

Under 1900-talet har datortekniken kommit långt - från militär till fredlig användning, från ett snävt spektrum av mål till penetration i alla grenar av mänskligt liv. Matematik som vetenskap fick ständigt ny praktisk betydelse med utvecklingen av datateknik. Denna process fortsätter idag.

Det tidigare otänkbara "tandemet" av "fysiker" och "textförfattare" har blivit verklighet. För den fulla interaktionen mellan matematik och datavetenskap med humaniora krävdes kvalificerade specialister från båda sidor. Medan datavetare i allt högre grad är i behov av systematisk humanitär kunskap (lingvistisk, kulturell, filosofisk) för att förstå förändringar i verkligheten kring dem, i samspelet mellan människa och teknik, för att utveckla fler och fler nya språkliga och mentala begrepp, att skriva program, då måste alla "Humaniora" i vår tid för sin professionella tillväxt behärska åtminstone grunderna i att arbeta med en dator.

Matematik, som är nära sammankopplad med informatik, fortsätter att utvecklas och samverka med naturvetenskap och humaniora. Under det nya århundradet försvagas inte trenden mot matematisering av vetenskapen, utan tvärtom ökar. På grundval av kvantitativa data förstås lagarna för språkets utveckling, dess historiska och filosofiska egenskaper.

Matematisk formalism är mest lämpad för att beskriva mönster inom lingvistik (liksom i andra vetenskaper - både humaniora och naturvetenskap). Situationen utvecklas ibland inom vetenskapen på ett sådant sätt att utan användning av ett lämpligt matematiskt språk är det omöjligt att förstå naturen av fysisk, kemisk, etc. processen är inte möjlig. Att skapa en planetmodell av atomen, den berömda engelska fysikern från XX-talet. E. Rutherford upplevde matematiska svårigheter. Till en början accepterades inte hans teori: det lät inte övertygande, och anledningen till detta var Rutherfords okunnighet om sannolikhetsteorin, på grundval av mekanismen för vilken det bara var möjligt att förstå modellrepresentationen av atomära interaktioner. Redan vid den tiden insåg en framstående vetenskapsman, ägaren av Nobelpriset, sig till seminariet för matematikern professor Lamb och under två år, tillsammans med studenterna, deltog i en kurs och arbetade ut en workshop om sannolikhetsteorin . Utifrån det kunde Rutherford beskriva elektronens beteende, vilket gav sin strukturella modell övertygande noggrannhet och fick erkännande. Detsamma är med lingvistik.

Detta väcker frågan, vad är så matematiskt i objektiva fenomen, tack vare vilket de kan beskrivas på matematikens språk, på språket för kvantitativa egenskaper? Dessa är homogena enheter av materia fördelade i rum och tid. De vetenskaper som har gått längre än andra mot isolering av homogenitet och visar sig vara bättre lämpade för användningen av matematik i dem.

Internet, som utvecklades snabbt på 1990-talet, samlade representanter för olika länder, folk och kulturer. Trots att engelska fortsätter att vara huvudspråket för internationell kommunikation har Internet blivit flerspråkigt i vår tid. Detta ledde till utvecklingen av kommersiellt framgångsrika maskinöversättningssystem som används i stor utsträckning inom olika områden av mänsklig aktivitet.

Datornätverk har blivit ett objekt för filosofisk reflektion – fler och fler nya språkliga, logiska, världsbildsbegrepp har skapats som hjälper till att förstå "virtuell verklighet". I många konstverk skapades scenarier - oftare pessimistiska - om maskiners dominans över en person, och virtuell verklighet - över omvärlden. Långt ifrån alltid visade sig sådana prognoser vara meningslösa. Informationsteknologi är inte bara en lovande bransch för att investera mänsklig kunskap, det är också ett sätt att kontrollera information och, följaktligen, över mänskligt tänkande.

Detta fenomen har både en negativ och en positiv sida. Negativt – eftersom kontroll över information strider mot den oförytterliga mänskliga rätten till fri tillgång till den. Positivt - eftersom avsaknaden av denna kontroll kan leda till katastrofala konsekvenser för mänskligheten. Det räcker med att påminna om en av det senaste decenniets klokaste filmer - "When the World Ends" av Wim Wenders, vars karaktärer är helt nedsänkta i den "virtuella verkligheten" av sina egna drömmar inspelade på en dator. Samtidigt kan inte en enda vetenskapsman och inte en enda konstnär ge ett entydigt svar på frågan: vad som väntar vetenskap och teknik i framtiden.

Att fokusera på "framtiden", som ibland förefaller fantastiskt, var ett utmärkande drag för vetenskapen i mitten av nittonhundratalet, när uppfinnare försökte skapa perfekta modeller av teknik som kunde fungera utan mänsklig inblandning. Tiden har visat den utopiska karaktären hos sådan forskning. Samtidigt vore det överflödigt att döma vetenskapsmän för detta – utan deras entusiasm på 1950- och 60-talen skulle informationsteknologin inte ha gjort ett så kraftfullt språng på 90-talet, och vi skulle inte ha det vi har nu.

De sista decennierna av 1900-talet förändrade vetenskapens prioriteringar - forskning, uppfinningsrik patos gav plats för kommersiellt intresse. Återigen, detta är varken bra eller dåligt. Detta är en verklighet där vetenskapen alltmer integreras i vardagen.

2000-talet har fortsatt denna trend, och i vår tid bakom uppfinningar ligger inte bara berömmelse och erkännande, utan först och främst pengar. Det är också därför det är viktigt att se till att de senaste landvinningarna inom vetenskap och teknik inte hamnar i händerna på terroristgrupper eller diktatoriska regimer. Uppgiften är svår till den grad omöjlig; att förverkliga det så mycket som möjligt är hela världssamfundets uppgift.

Information är ett vapen, och vapen är inte mindre farliga än kärnvapen eller kemiska vapen - bara det verkar inte fysiskt utan snarare psykiskt. Mänskligheten måste tänka på vad som är viktigare för den i det här fallet – frihet eller kontroll.

De senaste filosofiska begreppen relaterade till utvecklingen av informationsteknologi och ett försök att förstå dem har visat begränsningarna för både naturvetenskaplig materialism, som dominerade under 1800- och början av 1900-talet, och extrem idealism, som förnekar den materiella världens betydelse. . Det är viktigt för det moderna tänkandet, särskilt västerlandets tanke, att övervinna denna dualism i tänkandet, när omvärlden är tydligt uppdelad i materiellt och ideal. Vägen dit är en dialog mellan kulturer, en jämförelse av olika synpunkter på de omgivande fenomenen.

Paradoxalt nog kan informationsteknologi spela en viktig roll i denna process. Datornätverk, och särskilt Internet, är inte bara en resurs för underhållning och kraftfull kommersiell verksamhet, de är också ett sätt för meningsfull, kontroversiell kommunikation mellan representanter för olika civilisationer i den moderna världen, såväl som för en dialog mellan det förflutna och nuet. Vi kan säga att Internet tänjer på de rumsliga och tidsmässiga gränserna.

Och i dialogen mellan kulturer genom informationsteknologi är språkets roll som det äldsta universella kommunikationsmedlet fortfarande viktig. Det är därför lingvistik, i samspel med matematik, filosofi och datavetenskap, har upplevt sin andra födelse och fortsätter att utvecklas idag. Nutidens trend kommer att fortsätta i framtiden - "till världens ände", som för 15 år sedan, förutspådde samma V. Wenders. Det är visserligen inte känt när detta slut kommer att inträffa - men är det viktigt nu, eftersom framtiden förr eller senare kommer att bli nuet ändå.

Bilaga 1

Ferdinand de Saussure

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses allmänt vara grundaren av modern lingvistik i sina försök att beskriva språkets struktur snarare än historien om särskilda språk och språkformer. I själva verket finner strukturalismens metod inom lingvistik och litteraturvetenskap och en betydande gren av semiotik sin stora utgångspunkt i hans arbete vid sekelskiftet av 1900-talet. Det har till och med hävdats att komplexet av strategier och föreställningar som har kommit att kallas "poststrukturalism" - arbetet av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra - föreslås av Saussures arbete i lingvistik och anagrammatisk läsning av sen latinsk poesi, litterär modernism till psykoanalys och filosofi i början av nittonhundratalet. Som Algirdas Julien Greimas och Joseph Courtes argumenterar i Semiotics and Language: An Analytic Dictionary, under rubriken "Interpretation", uppstod ett nytt tolkningssätt i början av 1900-talet som de identifierar med saussureansk lingvistik, Husserliansk fenomenologi och freudiansk psykoanalys. I detta läge är "tolkning inte längre en fråga om att tillskriva ett givet innehåll till en form som annars skulle sakna en, snarare är det en omskrivning som på ett annat sätt formulerar det ekvivalenta innehållet i ett betecknande element inom ett givet semiotiskt system" ( 159). i denna förståelse av "tolkning" är form och innehåll inte distinkta; snarare är varje "form" alternativt också ett semantiskt "innehåll", en "signifierande form", så att tolkningen erbjuder en analogisk omskrivning av något som redan betyder inom något annat system av signifikans.

En sådan omtolkning av form och förståelse - som Claude Levi-Strauss beskriver i en av sina mest programmatiska artikulationer av begreppet strukturalism, i "Structure and Form: Reflections on a Work by Vladimir Propp" - är implicit i Saussures postuma kurs. i allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure relativt lite, och hans huvudverk, Kursen, var hans studenters transkription av flera kurser i allmän lingvistik som han erbjöd 1907-11. I kursen efterlyste Saussure den "vetenskapliga" studien av språket i motsats till det arbete inom historisk lingvistik som hade utförts på 1800-talet. Det arbetet är en av det västerländska intellektets stora landvinningar: att ta särskilda ord som byggstenar i språk, historisk (eller "diakronisk") lingvistik spårade ursprunget och utvecklingen av västerländska språk från en förmodad gemensam språkkälla, först ett "indoeuropeiskt" språk och sedan ett tidigare "p roto-indoeuropeiskt" språk.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement", som Saussure ifrågasatte. Hans arbete var ett försök att reducera mängden fakta om språk, studerad så noggrant av historisk lingvistik, till ett hanterbart antal påståenden. Den "jämförande skolan" för 1800-talets filologi, säger Saussure i Kursen, "lyckades inte med att upprätta den sanna vetenskapen om lingvistik" eftersom "den misslyckades med att söka upp naturen hos sitt studieobjekt" (3). Denna "natur", hävdar han, återfinns inte bara i de "elementala" orden som ett språk innehåller - språkets skenbara "positiva" fakta (eller "substanser") - utan i de formella relationer som ger upphov till dessa "ämnen."

Saussures systematiska omprövning av språk bygger på tre antaganden. Det första är att det vetenskapliga studiet av språk behöver utveckla och studera systemet snarare än språkfenomens historia. Av denna anledning skiljer han mellan språkets särskilda förekomster - dess speciella "talhändelser", som han betecknar som villkorlig frigivning - och det egentliga föremålet för lingvistik, systemet (eller "koden") som styr dessa händelser, som han betecknar som langue. En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element vid ett visst ögonblick snarare än den "diakroniska" studien av språkets utveckling genom historien.

Detta antagande gav upphov till vad Roman Jakobson 1929 kom att beteckna som "strukturalism", där "varje uppsättning fenomen som granskas av samtida vetenskap behandlas inte som en mekanisk agglomeration utan som en strukturell helhet, den mekaniska uppfattningen av processer ger efter för frågan. av deras funktion" ("Romantic" 711). I denna passage uttrycker Jakobson Saussures avsikt att definiera lingvistik som ett vetenskapligt system i motsats till en enkel, "mekanisk" redovisning av historiska olyckor. Tillsammans med detta beskriver Jakobson också det andra grundläggande antagandet i Saussurean - vi kan kallar det nu "strukturellt" - lingvistik: att språkets grundläggande element endast kan studeras i relation till deras funktioner snarare än i förhållande till deras orsaker. Europeiska "ord"), dessa händelser och enheter måste placeras inom ett systemiskt ramverk där de är relaterade till andra så kallade händelser och entiteter. Detta är en radikal omorientering i uppfattningen av erfarenhet och fenomen, en vars betydelse filosofen Ernst Cassirer har jämfört med "den nya vetenskapen om Galileo som på 1600-talet förändrade hela vår begreppet den fysiska världen" (citerad i Culler, Pursuit 2 4). Denna förändring, som Greimas och Courtes noterar, återuppfattar "tolkning" och återuppfattar således själva förklaring och förståelse. Istället för att förklaringen "är i termer av ett fenomens orsaker, så att det som "effekt" på något sätt är underordnat dess orsaker, består förklaringen här i att underordna ett fenomen dess framtidsorienterade "funktion" eller "syfte." Förklaring är inte längre oberoende av mänskliga avsikter eller syften (även om dessa avsikter kan vara opersonliga, gemensamma eller, i freudianska termer, "omedvetna").

I sin lingvistik åstadkommer Saussure denna omvandling specifikt i omdefinieringen av det språkliga "ordet", som han beskriver som det språkliga "tecknet" och definierar i funktionalistiska termer. Tecknet, hävdar han, är föreningen av "ett koncept och en ljudbild", som han kallade "signified and signifier" (66-67; Roy Harriss översättning från 1983 erbjuder termerna "signification" och "signal"). Naturen av deras "kombination" är "funktionell" i det att varken den betecknade eller betecknaren är den andras "orsak"; snarare "var och en av sina värden från den andra" (8). språkelementet, tecknet , relationellt och gör det grundläggande antagandet om historisk lingvistik, nämligen identiteten för de elementära enheterna av språk och betydelse (d.v.s. "ord"), föremål för rigorös analys. Ordet "träd" som "samma" ord är inte pga. ordet definieras av inneboende kvaliteter - det är inte en "mekanisk agglomeration" av sådana kvaliteter - utan för att det definieras som ett element i ett system, språkets "strukturella helhet".

En sådan relationell (eller "diakritisk") definition av en entitet styr uppfattningen av alla element i språket i strukturell lingvistik. Detta är tydligast i den mest imponerande bedriften inom saussureansk lingvistik, utvecklingen av begreppen "fonem" och "särskiljande drag" av språket. Fonemen är de minsta artikulerade och betecknande enheterna i ett språk. Det är inte de ljud som förekommer i språket utan de "ljudbilder" Saussure nämner, som uppfattas av talare - fenomenalt uppfattade - som förmedlande mening. (Elmar Holenstein beskriver således Jakobsons lingvistik, som följer Saussure på viktiga sätt, som "fenomenologisk strukturalism".) Det är av denna anledning som den ledande talespersonen för Prags skolstrukturalism, Jan Mukarovsky, 1937 noterade att "struktur . . . är en fenomenologisk och inte en empirisk verklighet; det är inte själva verket, utan en uppsättning funktionella relationer som är belägna i ett kollektivs medvetande (generation, miljö, etc.)" (citerad i Galan 35). Likaså Levi-Strauss, den ledande talespersonen för fransk strukturalism , noterade 1960 att "struktur har inget distinkt innehåll; den nöjer sig själv, och den logiska organisationen i vilken den är arresterad är tänkt som en egenskap hos det verkliga" (167; se även Jakobson, Fundamentals 27-28).

Fonemen, alltså de minsta märkbara elementen i språket, är inte positiva objekt utan en "fenomenologisk verklighet". På engelska, till exempel, kan fonemet /t/ uttalas på många olika sätt, men i alla fall kommer en engelsktalande att känna igen det som ett /t/. Ett aspirerat t (d.v.s. ett t uttalas med ett h-liknande andetag efter det), ett högt eller lågt t-ljud, ett utökat t-ljud, och så vidare, kommer alla att fungera på samma sätt för att urskilja betydelsen av "att" och "göra" på engelska. Dessutom är skillnaderna mellan språk sådana att fonologiska variationer i ett språk kan utgöra distinkta fonem i ett annat; sålunda skiljer engelska mellan /l/ och /r/, medan andra språk är så strukturerade att dessa artikulationer anses vara varianter av samma fonem (som den aspirerade och unaspirated t på engelska). I varje naturligt språk är det stora antalet möjliga ord en kombination av ett litet antal fonem. Engelska, till exempel, har mindre än 40 fonem som tillsammans bildar över en miljon olika ord.

Språkets fonem är i sig systematiskt organiserade strukturer av egenskaper. På 1920- och 1930-talen, efter Saussures ledning, isolerade Jakobson och N. S. Trubetzkoy de "särdragen" hos fonem. Dessa egenskaper är baserade på den fysiologiska strukturen hos talorganen - tunga, tänder, stämband och så vidare - att Saussure nämner i Kursen och som Harris beskriver som "fysiologisk fonetik" (39; Baskins tidigare översättning använder termen "fonologi" [(1959) 38]) - och de kombineras i "buntar" av binära oppositioner för att bilda fonem. Till exempel på engelska är skillnaden mellan /t/ och /d/ närvaron eller frånvaron av "röst" (engagerandet av stämbanden), och på röstnivån definierar dessa fonem varandra ömsesidigt. På så sätt är fonologi ett specifikt exempel på en allmän språkregel som beskrivs av Saussure: I språket finns bara skillnader. ännu viktigare: en skillnad innebär i allmänhet positiva termer mellan vilka skillnaden är satt upp; men i språket finns det bara skillnader utan positiva termer. Oavsett om vi tar det betecknade eller betecknaren, har språket varken idéer eller ljud som fanns före det språkliga systemet. ( 120)

Inom detta ramverk bestäms språkliga identiteter inte av inneboende kvaliteter utan av systemiska ("strukturella") relationer.

Jag har sagt att fonologin "följde ledningen" av Saussure, för även om hans analys av språkproduktionens fysiologi "nuförtiden", som Harris säger, "skulle kallas "fysisk" i motsats till antingen "psykologisk" eller "funktionell". "" (Läsning 49), följaktligen formulerade han i kursen riktningen och konturerna för en funktionell analys av språket. På samma sätt var hans enda utökade publicerade verk, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir om det primitiva systemet av vokaler i indoeuropeiska språk), som kom ut 1878, helt placerat inom projektet för nittonde- talets historiska lingvistik. Icke desto mindre, inom detta arbete, som Jonathan Culler har hävdat, visade Saussure "fruktbarheten av att tänka på språket som ett system av rent relationella föremål, även när han arbetade med uppgiften att historiska återuppbyggnaden" (Saussure 66). Genom att analysera de systematiska strukturella sambanden mellan fonem för att redogöra för mönster av vokalväxling i befintliga indoeuropeiska språk, föreslog Saussure att det utöver flera olika fonem /a/ måste ha funnits ett annat fonem som skulle kunna beskrivas formellt. "Det som gör Saussures arbete så mycket imponerande," avslutar Culler, "är det faktum att nästan femtio år senare, när kilskrift Hettite upptäcktes och dechiffrerades, visade sig det innehålla ett fonem, skrivet h, som betedde sig som Saussure hade förutspått. . Han hade upptäckt, genom en rent formell analys, vad som nu är känt som struphuvudet hos indoeuropeiska" (66).

Denna uppfattning om den relationella eller diakritiska bestämningen av betydelsens element, som är både implicit och explicit i kursen, antyder ett tredje antagande som styr strukturell lingvistik, vad Saussure kallar "tecknets godtyckliga natur". Med detta menar han att förhållandet mellan betecknare och betecknat i språket aldrig är nödvändigt (eller "motiverat"): man skulle lika gärna kunna hitta ljudbetecknaren arbre som betecknarträdet för att förena sig med begreppet "träd". Men mer än detta betyder det att det betecknade också är godtyckligt: ​​man skulle lika lätt kunna definiera begreppet "träd" genom dess vedartade kvalitet (vilket skulle utesluta palmer) som genom dess storlek (vilket utesluter de "låga vedartade växterna" vi ring buskar). Detta bör klargöra att numreringen av antaganden jag har presenterat inte representerar en prioritetsordning: varje antagande - den systemiska karaktären av signifikans (bäst uppfattas genom att studera språket "synkront"), den relationella eller "diakritiska" naturen hos elementen av betydelse, teckenens godtyckliga natur - får sitt värde från de andra.

Det vill säga, saussureansk lingvistik de fenomen den studerar i övergripande relationer av kombination och kontrast i språk. I denna uppfattning är språk både processen att artikulera mening (betydelse) och dess produkt (kommunikation), och dessa två språkfunktioner är varken identiska eller helt kongruenta (se Schleifer, "Dekonstruktion"). Här kan vi se den växling mellan form och innehåll som Greimas och Courtes beskriver i modernistisk tolkning: språket presenterar kontraster som formellt definierar dess enheter, och dessa enheter kombineras på efterföljande nivåer för att skapa det betecknande innehållet. Eftersom språkets beståndsdelar är godtyckliga kan dessutom varken kontrast eller kombination sägas vara grundläggande. Sålunda, i språket kombineras särdrag för att bilda kontrasterande fonem på en annan nivå av uppfattning, fonem kombineras för att bilda kontrasterande morfem, morfem kombineras för att bilda ord, ord kombineras för att bilda meningar, och så vidare. I varje fall är hela fonemet, eller ordet, eller meningen, och så vidare, större än summan av dess delar (precis som vatten, H2O, i Saussures exempel [(1959) 103] är mer än den mekaniska agglomerationen av väte och syre).

De tre antagandena i kursen i allmän lingvistik ledde till att Saussure efterlyste en ny vetenskap från 1900-talet som skulle gå utöver språkvetenskapen för att studera "teckens liv i samhället." Saussure kallade denna vetenskap "semiologi (från grekiska semeion "tecken")" (16). "Vetenskapen" om semiotik, som den kom att praktiseras i Östeuropa på 1920- och 1930-talen och Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära artefakter som konstituerades (eller artikulerades) av dessa strukturer. Under hela den sena delen av sin karriär, även när han erbjöd kurserna i allmän lingvistik, fortsatte Saussure sin egen "semiotiska" analys av sen latinsk poesi i ett försök att upptäcka medvetet dolda anagram av egennamn. Studiemetoden var på många sätt motsatsen till den funktionella rationalismen i hans språkliga analyser: den försökte, som Saussure nämner i en av de 99 anteckningsböcker där han genomförde denna studie, att systematiskt undersöka problemet med "slumpen", som " blir den oundvikliga grunden för allt" (citerad i Starobinski 101). En sådan studie, som Saussure själv säger, fokuserar på "det materiella faktum" av slump och mening (citerad 101), så att "temaordet" vars anagram Saussure söker, som Jean Starobinski hävdar, "är, för poeten , ett instrument och inte en livsviktig grodd till dikten. Dikten krävs för att återanvända temaordets ljudmaterial" (45). I denna analys säger Starobinski: "Saussure förlorade inte sig själv i ett sökande efter dolda betydelser." Istället tycks hans arbete visa en önskan att undvika alla problem som uppstår ur medvetandet: "Eftersom poesi inte bara förverkligas i ord utan är något som föds ur ord, undkommer den medvetandets godtyckliga kontroll för att enbart vara beroende av en sorts språklig laglighet "(121).

Det vill säga Saussures försök att upptäcka egennamn i sen latinsk poesi - vad Tzvetan Todorov kallar förminskningen av ett "ord . . . till dess signifier" (266) - understryker ett av de element som styrde hans språkliga analys, tecknets godtyckliga natur. (Det understryker också den formella karaktären hos Saussurean lingvistik - "Språk", hävdar han, "är en form och inte en substans" - som effektivt eliminerar semantik som ett huvudobjekt för analys.) Som Todorov avslutar framstår Saussures arbete anmärkningsvärt homogent idag i sin vägran att acceptera symboliska fenomen. . . . I sin forskning om anagram uppmärksammar han endast fenomenen med upprepning, inte till evokationsfenomen. . . . I sina studier av Nibelungen känner han igen symboler endast för att hänföra dem till felaktiga läsningar: eftersom de inte är avsiktliga existerar inte symboler. Slutligen i sina kurser om allmän lingvistik, överväger han existensen av semiologi, och därmed av andra tecken än lingvistiska; men denna bekräftelse begränsas på en gång av det faktum att semiologin är ägnad åt en enda typ av tecken: de som är godtyckliga. (269-70)

Om detta är sant, beror det på att Saussure inte kunde tänka sig "avsikt" utan ett ämne; han kunde inte riktigt undkomma motsättningen mellan form och innehåll, hans verk gjorde så mycket för att ifrågasätta. Istället tog han till "språklig laglighet". Belägen mellan å ena sidan 1800-talets föreställningar om historia, subjektivitet och sättet för kausal tolkning som styrs av dessa föreställningar och å andra sidan 1900-talets "strukturalistiska" föreställningar om vad Levi-Strauss kallade "kantianism utan ett transcendentalt subjekt" (citerat i Connerton 23) - begrepp som raderar motsättningen mellan form och innehåll (eller subjekt och objekt) och hierarkin av förgrund och bakgrund i fullskalig strukturalism, psykoanalys och till och med kvantmekanik - Ferdinands verk de Saussure i lingvistik och semiotik avgränsar ett signalmoment i studiet av mening och kultur.

Ronald Schleifer

Bilaga 2

Ferdinand de Saussure (översättning)

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses vara grundaren av modern lingvistik - tack vare hans försök att beskriva språkets struktur, snarare än historien om enskilda språk och ordformer. I stort sett lades grunden för strukturella metoder inom lingvistik och litteraturkritik och i stor utsträckning semiotik i hans verk redan i början av 1900-talet. Det är bevisat att metoderna och begreppen för den så kallade "poststrukturalismen", som utvecklats i verk av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra, går tillbaka till Saussures och Saussures språkliga verk. anagrammatiska läsningar av senromersk poesi. Det bör noteras att Saussures arbete med lingvistik och språklig tolkning hjälper till att koppla samman ett brett spektrum av intellektuella discipliner - från fysik till litterära innovationer, psykoanalys och filosofi från det tidiga nittonhundratalet. A. J. Greimas och J. Kurte skriver i Semiotics and Language: ”En analytisk ordbok med titeln ”Interpretation” som en ny sorts tolkning dök upp i början av 1900-talet tillsammans med Saussures lingvistik, Husserls fenomenologi och psykoanalysen. av Freud. I ett sådant fall är "tolkning inte att tillskriva ett givet innehåll till en form som annars skulle sakna en, utan snarare en omskrivning som på ett annat sätt formulerar samma innehåll av ett betydande element inom ett givet semiotiskt system" (159 ). I denna förståelse av "tolkning" är form och innehåll oskiljaktiga; tvärtom är varje form fylld med semantisk betydelse ("meningsfull form"), så tolkningen erbjuder en ny, liknande återberättelse av något meningsfullt i ett annat teckensystem.

En liknande förståelse av form och innehåll, presenterad av Claude Lévi-Strauss i ett av strukturalismens programmatiska verk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan ses i Saussures postuma bok, A Course in Allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure lite, "Kurs" - hans huvudverk - samlades från anteckningar från studenter som deltog i hans föreläsningar om allmän lingvistik 1907-11. I kursen efterlyste Saussure en "vetenskaplig" studie av språket, som kontrasterade det med 1800-talets jämförande-historiska lingvistik. Detta arbete kan betraktas som en av västerländskt tänkandes största landvinningar: med individuella ord som grundelementen i språket, bevisade historisk (eller "diakronisk") lingvistik ursprunget och utvecklingen av västeuropeiska språk från ett gemensamt, indoeuropeiskt språk – och ett tidigare proto-indoeuropeiskt.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement" som Saussure ifrågasatte. Hans arbete var ett försök att reducera de många fakta om språk som tillfälligt studerades av jämförande lingvistik till ett litet antal satser. 1800-talets jämförande filologiska skola, skriver Saussure, "lyckades inte skapa en riktig språkskola" eftersom "den inte förstod essensen av studieobjektet" (3). Denna "essens", menar han, ligger inte bara i enskilda ord - språkets "positiva substanser" - utan också i de formella sambanden som hjälper dessa substanser att existera.

Saussures "test" av språk bygger på tre antaganden. För det första är den vetenskapliga förståelsen av språk inte baserad på ett historiskt, utan på ett strukturellt fenomen. Därför skilde han mellan enskilda språkfenomen - "talhändelser", som han definierar som "parole" - och det riktiga, enligt hans åsikt, studieobjektet för lingvistik, systemet (kod, struktur) som styr dessa händelser ( "langue"). En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element i ett givet ögonblick, snarare än en "diakronisk" studie av språkets utveckling genom dess historia.

Denna hypotes var föregångaren till vad Roman Jakobson 1929 skulle kalla "strukturalism" - en teori där "alla fenomen som undersöks av modern vetenskap betraktas inte som en mekanisk ackumulation, utan som en strukturell helhet där den konstruktiva komponenten är korrelerad med funktionen" ("Romantisk "711). I denna passage formulerade Jakobson Saussures idé om att definiera språket som en struktur, i motsats till den "mekaniska" uppräkningen av historiska händelser. Dessutom utvecklar Jakobson ett annat saussureanskt antagande, som blev föregångaren till strukturell lingvistik: språkets grundläggande beståndsdelar bör studeras i samband inte så mycket med deras orsaker, utan med deras funktioner. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter. Detta var en radikal vändning i jämförelsen av fenomen med den omgivande verkligheten, vars betydelse filosofen Ernst Cassirer jämförde med "vetenskapen om Galileo, som på 1600-talet omkullkastade idéer om den materiella världen." följaktligen själva förklaringarna. Fenomen började tolkas inte i relation till orsakerna till att de inträffade, utan i relation till den effekt de kan ha i nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikter kan vara opersonliga, "omedvetet" i ordets freudianska mening).

I sin lingvistik visar Saussure särskilt denna vändning i förändringen av ordets begrepp inom lingvistik, som han definierar som ett tecken och beskriver i termer av dess funktioner. Ett tecken för honom är en kombination av ljud och betydelse, "signified and designation" (66-67; i den engelska översättningen från 1983 av Roy Harris - "signification" och "signal"). Denna förenings natur är "funktionell" (varken det ena eller det andra elementet kan existera utan varandra); dessutom "lånar den ena egenskaper från den andra" (8). Således definierar Saussure det huvudsakliga strukturella elementet i språket - tecknet - och gör basen för historisk lingvistik till identiteten av tecken till ord, vilket kräver en särskilt rigorös analys. Därför kan vi förstå olika betydelser av, säg, samma ord "träd" - inte för att ordet bara är en uppsättning av vissa egenskaper, utan för att det definieras som ett element i teckensystemet, i "den strukturella helheten", i språket.

Ett sådant relativt ("diakritiskt") enhetsbegrepp ligger till grund för begreppet alla delar av språket i strukturell lingvistik. Detta är särskilt tydligt i den mest originella upptäckten av saussureisk lingvistik, i utvecklingen av begreppet "fonem" och "särskiljande drag" hos språket. Fonemen är den minsta av de talade och meningsfulla språkenheterna. Det är inte bara ljud som förekommer i språket, utan "ljudbilder", konstaterar Saussure, som av infödda talare uppfattas som meningsfulla. (Det bör noteras att Elmar Holenstein kallar Jakobsons lingvistik, som fortsätter Saussures idéer och begrepp i sina huvudbestämmelser, för "fenomenologisk strukturalism"). Det är därför den ledande talaren för Pragskolan för strukturalism, Jan Mukarowski, 1937 observerade att ”struktur. . . inte ett empiriskt, utan ett fenomenologiskt begrepp; det är inte resultatet i sig, utan en uppsättning betydande relationer för det kollektiva medvetandet (generation, andra, etc.)”. En liknande tanke uttrycktes 1960 av Lévi-Strauss, den franska strukturalismens ledare: ”Strukturen har inget bestämt innehåll; den är meningsfull i sig, och den logiska konstruktion som den är innesluten i är verklighetens avtryck.

I sin tur representerar fonem, som de minsta språkliga element som är acceptabla för perception, en separat integrerad "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Aspirerat, höjt eller sänkt, ett långt "t"-ljud, etc. kommer lika att skilja betydelsen av orden "att" och "göra". Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med och utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa egenskaper är baserade på strukturen hos talorganen - tunga, tänder, stämband - Saussure märker detta i "Course of General Linguistics", och Harris kallar det "fysiologisk fonetik" (i Baskins tidigare översättning, termen "fonologi" " används) - de är kopplade i "knutar » durg mot en vän för att göra ljud. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av "röst" (spänningen i stämbanden), och röstnivån som skiljer ett fonem från ett annat. Således kan fonologi betraktas som ett exempel på den allmänna språkregel som beskrivs av Saussure: "Det finns bara skillnader i språket." Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

Jag har redan nämnt att fonologin i sin utveckling förlitade sig på Saussures idéer. Även om hans analys av språkfysiologi i modern tid, säger Harris, "skulle kallas 'fysisk', i motsats till 'psykologisk' eller 'funktionell', formulerade han i The Course tydligt riktningen och de grundläggande principerna för den funktionella analysen av språk. Hans enda verk som publicerades under hans livstid, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Anteckningar om det ursprungliga vokalsystemet i de indoeuropeiska språken), publicerat 1878, var helt i linje med jämförande historisk lingvistik i 1800-talet. Ändå, i detta arbete, säger Jonathan Culler, visade Saussure "fruktbarheten av idén om språk som ett system av sammanlänkade fenomen, även med dess historiska rekonstruktion." Genom att analysera förhållandet mellan fonem, förklara växlingen av vokaler i de moderna språken i den indoeuropeiska gruppen, föreslog Saussure att förutom flera olika ljud "a", måste det finnas andra fonem som formellt beskrivs. "Vad som gör ett speciellt intryck i Saussures verk," avslutar Kaller, "är att nästan 50 år senare, när hettitisk kilskrift upptäcktes och dechiffrerades, hittades ett fonem, i skrift betecknat med "h", som betedde sig som Saussure förutspådde. Genom formell analys upptäckte han det som nu är känt som det gutturala ljudet i de indoeuropeiska språken.

I konceptet med en relativ (diakritisk) definition av tecken, både explicit och underförstådd i kursen, finns det ett tredje nyckelantagande för strukturell lingvistik, kallat av Saussure "tecknets godtyckliga natur". Med detta menas att förhållandet mellan ljud och mening i språket inte är motiverat av någonting: man kan lika gärna koppla ihop ordet "arbre" och ordet "träd" med begreppet "träd". Dessutom betyder detta att ljudet också är godtyckligt: ​​man kan definiera begreppet "träd" genom närvaron av bark (förutom för palmer) och efter storlek (förutom för "låga träiga växter" - buskar). Av detta bör det vara klart att alla antaganden jag presenterar inte är uppdelade i mer och mindre viktiga: var och en av dem - den systemiska karaktären av tecken (mest förståeligt i den "synkrona" studien av språket), deras relativa (diakritiska) väsen , den godtyckliga karaktären av tecken - kommer från från resten.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språk är både ett uttryck för ordens betydelse (beteckning) och deras resultat (kommunikation) – och dessa två funktioner sammanfaller aldrig (se Shleifers "Dekonstruktion av språket"). Vi kan se den växling av form och innehåll som Greimas och Kurte beskriver i den senaste tolkningsversionen: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar på successiva nivåer för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till kontrasterande morfem, morfem - till ord, ord - till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än summan av dess delar (precis som vatten, i Saussures exempel, är mer än en kombination av väte och syre).

Tre antaganden om "Course of General Linguistics" ledde Saussure till idén om en ny vetenskap från 1900-talet, separat från lingvistik, som studerade "teckens liv i samhället." Saussure kallade denna vetenskap för semiologi (från grekiskan "semeion" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller formulerade) med dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade Saussure sig åt en "semiotisk" analys av sen romersk poesi och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i sin språkliga analys: den var ett försök, som Saussure skriver i en av de 99 anteckningsböckerna, att i systemet studera problemet med "sannolikhet", som "blir grunden för allting. " En sådan undersökning, hävdar Saussure själv, hjälper till att fokusera på den "riktiga sidan" av sannolikhet; ”Nyckelordet” som Saussure letar efter ett anagram för är, enligt Jean Starobinsky, ”ett verktyg för poeten, och inte källan till liv för dikten. Dikten tjänar till att vända nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar.”

Saussures försök att studera egennamn i sen romersk poesi (Tsvetan Todorov kallade detta en förkortning av "ett ord ... bara innan det skrivs") understryker en av komponenterna i hans språkliga analys - teckens godtyckliga karaktär, liksom den formella essensen av saussureisk lingvistik ("Språk", hävdar han, "formens väsen, inte fenomenet"), vilket utesluter möjligheten att analysera innebörden. Todorov drar slutsatsen att idag verkar Saussures skrifter anmärkningsvärt konsekventa i sin ovilja att studera symboler [fenomen som har en väldefinierad betydelse]. . . . När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semilogi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoderna för oavsiktlig tolkning baserad på dessa begrepp, och å andra sidan de strukturalistiska begrepp som Lévi-Strauss kallade "Kantianism utan en transcendent aktör" - raderar konfrontationen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik - Ferlinand de Saussures verk om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunderna i teorin om grammatik / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiska metoder i lingvistik. M., 1974.

4. Arnold I.V. Ordets semantiska struktur i modern engelska och metodiken för dess studie. /I.V. Arnold-L .: Utbildning, 1966. - 187 sid.

6.Bashlykov A.M. Automatiskt översättningssystem. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 sid.

7.Baudouin de Courtenay: Teoretiskt arv och modernitet: Sammandrag av rapporterna från den internationella vetenskapliga konferensen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 sid.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 sid.

9. Golovin, B.N. Språk och statistik. /B.N. Golovin - M., 1971. - 210 sid.

10. Zvegintsev, V.A. Teoretisk och tillämpad lingvistik. / V.A. Zvegintsev - M., 1969. - 143 sid.

11. Kasevich, V.B. Semantik. Syntax. Morfologi. // V.B. Kasevich - M., 1988. - 292 sid.

12. Lekomtsev Yu.K. INTRODUKTION till lingvistikens formella språk / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 sid.

Matveeva G.G. Dolda grammatiska betydelser och identifiering av den sociala personen (”porträtt”) av talaren / G.G. Matveev. - Rostov, 1999. - 174 sid.

14. Melchuk, I.A. Erfarenhet av att bygga språkliga modeller "Mening<-->Text". / I.A. Melchuk. - M., 1974. - 145 sid.

15. Nelyubin L.L. Översättning och tillämpad lingvistik / L.L. Nelyubin. - M.: Högre skola, 1983. - 207 sid.

16. Om språkforskningens exakta metoder: om den så kallade "matematiska lingvistiken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva och andra - M., 1961. - 162 sid.

17. Piotrovsky L.G. Matematisk lingvistik: Lärobok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Högre skola, 1977. - 160 sid.

18. Han är. Text, maskin, person. - L., 1975. - 213 sid.

19. Det är han. Tillämpad lingvistik / Ed. A.S. Gerda. - L., 1986. - 176 sid.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Modern strukturell lingvistik. Problem och metoder. M., 1977. - 239 sid.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunderna i allmän och maskinöversättning / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 sid.

22. Slyusareva N.A. Teorin om F. de Saussure i ljuset av modern lingvistik / N.A. Slyusareva. - M.: Nauka, 1975. - 156 sid.

23. Uggla, L.Z. Analytisk lingvistik / L.Z. Uggla - M., 1970. - 192 sid.

24. Saussure F. de. Anteckningar om allmän lingvistik / F. de Saussure; Per. från fr. - M.: Framsteg, 2000. - 187 sid.

25. Det är han. Kurs i allmän lingvistik / Per. från fr. - Jekaterinburg, 1999. -426 sid.

26. Talstatistik och automatisk textanalys / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 sid.

27. Stoll, P. Sets. Logik. Axiomatiska teorier / R. Stoll; Per. från engelska. - M., 1968. - 180 sid.

28. Tenier, L. Fundamentals of structural syntax. M., 1988.

29. Ubin I.I. Automatisering av översättningsaktiviteter i Sovjetunionen/I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 sid.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Bearbetning av konceptuell information. M., 1980.

32. Shikhanovich, Yu.A. INTRODUKTION till modern matematik (initiala begrepp). M., 1965

33. Shcherba L.V. Ryska vokaler i kvalitativa och kvantitativa termer / L.V. Shcherba - L.: Nauka, 1983. - 159 sid.

34. Abdullah-zade F. Medborgare i världen // Spark - 1996. - Nr 5. - s.13

35. V.A. Uspensky. Preliminär för läsarna av "New Literary Review" till de semiotiska meddelandena från Andrei Nikolaevich Kolmogorov. - Ny litteraturrecension. -1997. - Nr 24. - S. 18-23

36. Perlovsky L. Medvetande, språk och kultur. - Kunskap är makt. -2000. №4 - S. 20-33

Introduktion? Föreläsning översättningsteori

2.4 Utsikter för tillämpning av matematiska metoder inom lingvistik

I datateknikens tidevarv har matematisk lingvistiks metoder fått ett nytt utvecklingsperspektiv. Sökandet efter lösningar på problemen med språklig analys implementeras nu alltmer på informationssystemnivå. Samtidigt ställer automatisering av processen för bearbetning av språkligt material, vilket ger forskaren betydande möjligheter och fördelar, oundvikligen nya krav och uppgifter för honom.

Kombinationen av "exakt" och "humanitär" kunskap har blivit grogrund för nya upptäckter inom lingvistik, datavetenskap och filosofi.

Maskinöversättning från ett språk till ett annat är fortfarande en snabbt växande gren av informationsteknologi. Trots att datorstödd översättning aldrig kan jämföras i kvalitet med mänsklig översättning (särskilt för litterära texter) har maskinen blivit en oumbärlig assistent för en person vid översättning av stora textvolymer. Man tror att inom en snar framtid kommer mer avancerade översättningssystem att skapas, baserade i första hand på den semantiska analysen av texten.

Ett lika lovande område är samspelet mellan lingvistik och logik, som fungerar som en filosofisk grund för att förstå informationsteknologi och den så kallade "virtuella verkligheten". Inom en snar framtid kommer arbetet att fortsätta med skapandet av artificiell intelligens - även om det, återigen, aldrig kommer att vara lika med människan i sina förmågor. Sådan konkurrens är meningslös: i vår tid borde maskinen inte bli (och blir) en rival, utan en assistent till människan, inte något från fantasins rike, utan en del av den verkliga världen.

Studiet av språket med statistiska metoder fortsätter, vilket gör det möjligt att mer exakt bestämma dess kvalitativa egenskaper. Det är viktigt att de mest vågade hypoteserna om språk finner sitt matematiska, och därför logiska, bevis.

Det viktigaste är att olika grenar av matematikens tillämpning inom lingvistik, tidigare ganska isolerade, under de senaste åren har korrelerats med varandra, kopplat till ett sammanhängande system, i analogi med det språksystem som upptäcktes för ett sekel sedan av Ferdinand de Saussure och Yvan Baudouin de Courtenay. Detta är kontinuiteten i vetenskaplig kunskap.

Lingvistik i den moderna världen har blivit grunden för utvecklingen av informationsteknologi. Så länge datavetenskap förblir en snabbt växande gren av mänsklig verksamhet, kommer föreningen av matematik och lingvistik att fortsätta att spela sin roll i utvecklingen av vetenskap.


Slutsats

Under 1900-talet har datortekniken kommit långt - från militär till fredlig användning, från ett snävt spektrum av mål till penetration i alla områden av mänskligt liv. Matematik som vetenskap fick ständigt ny praktisk betydelse med utvecklingen av datateknik. Denna process fortsätter idag.

Det tidigare otänkbara "tandemet" av "fysiker" och "textförfattare" har blivit verklighet. För den fulla interaktionen mellan matematik och datavetenskap med humaniora krävdes kvalificerade specialister från båda sidor. Medan datavetare i allt högre grad är i behov av systematisk humanitär kunskap (lingvistisk, kulturell, filosofisk) för att förstå förändringar i verkligheten kring dem, i samspelet mellan människa och teknik, för att utveckla fler och fler nya språkliga och mentala begrepp, att skriva program, då måste alla "Humaniora" i vår tid för sin professionella tillväxt behärska åtminstone grunderna i att arbeta med en dator.

Matematik, som är nära sammankopplad med informatik, fortsätter att utvecklas och samverka med naturvetenskap och humaniora. Under det nya århundradet försvagas inte trenden mot matematisering av vetenskapen, utan tvärtom ökar. På grundval av kvantitativa data förstås lagarna för språkets utveckling, dess historiska och filosofiska egenskaper.

Matematisk formalism är mest lämpad för att beskriva mönster inom lingvistik (liksom i andra vetenskaper, både humaniora och naturvetenskap). Situationen utvecklas ibland inom vetenskapen på ett sådant sätt att utan användning av ett lämpligt matematiskt språk är det omöjligt att förstå naturen av fysisk, kemisk, etc. processen är inte möjlig. Att skapa en planetmodell av atomen, den berömda engelska fysikern från XX-talet. E. Rutherford upplevde matematiska svårigheter. Till en början accepterades inte hans teori: det lät inte övertygande, och anledningen till detta var Rutherfords okunnighet om sannolikhetsteorin, på grundval av mekanismen för vilken det bara var möjligt att förstå modellrepresentationen av atomära interaktioner. Redan vid den tiden insåg en framstående vetenskapsman, ägaren av Nobelpriset, sig till seminariet för matematikern professor Lamb och under två år, tillsammans med studenterna, deltog i en kurs och arbetade ut en workshop om sannolikhetsteorin . Utifrån det kunde Rutherford beskriva elektronens beteende, vilket gav sin strukturella modell övertygande noggrannhet och fick erkännande. Detsamma är med lingvistik.

Detta väcker frågan, vad är så matematiskt i objektiva fenomen, tack vare vilket de kan beskrivas på matematikens språk, på språket för kvantitativa egenskaper? Dessa är homogena enheter av materia fördelade i rum och tid. De vetenskaper som har gått längre än andra mot isolering av homogenitet och visar sig vara bättre lämpade för användningen av matematik i dem.

Internet, som utvecklades snabbt på 1990-talet, samlade representanter för olika länder, folk och kulturer. Trots att engelska fortsätter att vara huvudspråket för internationell kommunikation har Internet blivit flerspråkigt i vår tid. Detta ledde till utvecklingen av kommersiellt framgångsrika maskinöversättningssystem som används i stor utsträckning inom olika områden av mänsklig aktivitet.

Datornätverk har blivit ett objekt för filosofisk reflektion – fler och fler nya språkliga, logiska, världsbildsbegrepp har skapats som hjälper till att förstå "virtuell verklighet". I många konstverk skapades scenarier - oftare pessimistiska - om maskiners dominans över en person, och virtuell verklighet - över omvärlden. Långt ifrån alltid visade sig sådana prognoser vara meningslösa. Informationsteknologi är inte bara en lovande bransch för att investera mänsklig kunskap, det är också ett sätt att kontrollera information och, följaktligen, över mänskligt tänkande.

Detta fenomen har både en negativ och en positiv sida. Negativt – eftersom kontroll över information strider mot den oförytterliga mänskliga rätten till fri tillgång till den. Positivt - eftersom avsaknaden av denna kontroll kan leda till katastrofala konsekvenser för mänskligheten. Det räcker med att påminna om en av det senaste decenniets klokaste filmer - "When the World Ends" av Wim Wenders, vars karaktärer är helt nedsänkta i den "virtuella verkligheten" av sina egna drömmar inspelade på en dator. Men inte en enda vetenskapsman och inte en enda konstnär kan ge ett entydigt svar på frågan: vad som väntar vetenskap och teknik i framtiden.

Att fokusera på "framtiden", som ibland förefaller fantastiskt, var ett utmärkande drag för vetenskapen i mitten av nittonhundratalet, när uppfinnare försökte skapa perfekta modeller av teknik som kunde fungera utan mänsklig inblandning. Tiden har visat den utopiska karaktären hos sådan forskning. Det skulle dock vara överflödigt att fördöma forskare för detta - utan deras entusiasm på 1950-talet - skulle 60-talets informationsteknik inte ha gjort ett så kraftfullt språng på 90-talet, och vi skulle inte ha det vi har nu.

De senaste decennierna av 1900-talet har förändrat vetenskapens prioriteringar - forskning, uppfinningsrik patos har gett vika för kommersiellt intresse. Återigen, detta är varken bra eller dåligt. Detta är en verklighet där vetenskapen alltmer integreras i vardagen.

2000-talet har fortsatt denna trend, och i vår tid bakom uppfinningar ligger inte bara berömmelse och erkännande, utan först och främst pengar. Det är också därför det är viktigt att se till att de senaste landvinningarna inom vetenskap och teknik inte hamnar i händerna på terroristgrupper eller diktatoriska regimer. Uppgiften är svår till den grad omöjlig; att förverkliga det maximalt är en uppgift för hela världssamfundet.

Information är ett vapen, och vapen är inte mindre farliga än nukleära eller kemiska - bara det verkar inte fysiskt, utan snarare psykologiskt. Mänskligheten måste tänka på vad som är viktigare för den i det här fallet – frihet eller kontroll.

De senaste filosofiska begreppen relaterade till utvecklingen av informationsteknologi och ett försök att förstå dem har visat begränsningarna för både naturvetenskaplig materialism, som dominerade under 1800- och början av 1900-talet, och extrem idealism, som förnekar den materiella världens betydelse. . Det är viktigt för det moderna tänkandet, särskilt västerlandets tanke, att övervinna denna dualism i tänkandet, när omvärlden är tydligt uppdelad i materiellt och ideal. Vägen dit är en dialog mellan kulturer, en jämförelse av olika synpunkter på de omgivande fenomenen.

Paradoxalt nog kan informationsteknologi spela en viktig roll i denna process. Datornätverk, och särskilt Internet, är inte bara en resurs för underhållning och kraftfull kommersiell verksamhet, de är också ett sätt för meningsfull, kontroversiell kommunikation mellan representanter för olika civilisationer i den moderna världen, såväl som för en dialog mellan det förflutna och nuet. Vi kan säga att Internet tänjer på de rumsliga och tidsmässiga gränserna.

Och i dialogen mellan kulturer genom informationsteknologi är språkets roll som det äldsta universella kommunikationsmedlet fortfarande viktig. Det är därför lingvistik, i samspel med matematik, filosofi och datavetenskap, har upplevt sin andra födelse och fortsätter att utvecklas idag. Nutidens trend kommer att fortsätta i framtiden - "till världens ände", som för 15 år sedan, förutspådde samma V. Wenders. Det är visserligen inte känt när detta slut kommer att inträffa - men spelar det någon roll nu, för framtiden kommer förr eller senare att bli nuet ändå.


Bilaga 1

Ferdinand de Saussure

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses allmänt vara grundaren av modern lingvistik i sina försök att beskriva språkets struktur snarare än historien om särskilda språk och språkformer. I själva verket finner strukturalismens metod inom lingvistik och litteraturvetenskap och en betydande gren av semiotik sin stora utgångspunkt i hans arbete vid sekelskiftet av 1900-talet. Det har till och med hävdats att komplexet av strategier och föreställningar som har kommit att kallas "poststrukturalism" – arbetet av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra – föreslås av Saussures arbete i lingvistik och anagrammatisk läsning av sen latinsk poesi, litterär modernism till psykoanalys och filosofi i början av nittonhundratalet. Som Algirdas Julien Greimas och Joseph Courtés argumenterar i Semiotics and Language: An Analytic Dictionary, under rubriken "Interpretation", uppstod ett nytt tolkningssätt i början av 1900-talet som de identifierar med saussureansk lingvistik, husserliansk fenomenologi och freudiansk psykoanalys. I detta läge är "tolkning inte längre en fråga om att tillskriva ett givet innehåll till en form som annars skulle sakna en, snarare är det en omskrivning som på ett annat sätt formulerar det ekvivalenta innehållet i ett betecknande element inom ett givet semiotiskt system" ( 159). i denna förståelse av "tolkning" är form och innehåll inte distinkta; snarare är varje "form" alternativt också ett semantiskt "innehåll", en "signifierande form", så att tolkningen erbjuder en analogisk omskrivning av något som redan betyder inom något annat system av signifikans.

En sådan omtolkning av form och förståelse – som Claude Lévi-Strauss beskriver i en av sina mest programmatiska artikulationer av begreppet strukturalism, i "Structure and Form: Reflections on a Work by Vladimir Propp" – är implicit i Saussures postuma kurs. i allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure relativt lite, och hans huvudverk, Kursen, var hans studenters transkription av flera kurser i allmän lingvistik som han erbjöd 1907-11. I kursen efterlyste Saussure den "vetenskapliga" studien av språket i motsats till det arbete inom historisk lingvistik som hade utförts på 1800-talet. Det arbetet är en av det västerländska intellektets stora landvinningar: att ta särskilda ord som byggstenar i språk, historisk (eller "diakronisk") lingvistik spårade ursprunget och utvecklingen av västerländska språk från en förmodad gemensam språkkälla, först ett "indoeuropeiskt" språk och sedan ett tidigare "p roto-indoeuropeiskt" språk.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement", som Saussure ifrågasatte. Hans arbete var ett försök att reducera mängden fakta om språk, studerad så noggrant av historisk lingvistik, till ett hanterbart antal påståenden. Den "jämförande skolan" för 1800-talets filologi, säger Saussure i Kursen, "lyckades inte med att upprätta den sanna vetenskapen om lingvistik" eftersom "den misslyckades med att söka upp naturen hos sitt studieobjekt" (3). Denna "natur", hävdar han, återfinns inte bara i de "elementala" orden som ett språk innehåller – de skenbara "positiva" fakta (eller "substanser") i språket – utan i de formella relationer som ger upphov till dessa "ämnen."

Saussures systematiska omprövning av språk bygger på tre antaganden. Den första är att den vetenskapliga studien av språk behöver utveckla och studera systemet snarare än språkfenomens historia. Av denna anledning skiljer han mellan språkets speciella förekomster - dess speciella "talhändelser", som han betecknar som villkorlig frigivning – och det egentliga föremålet för lingvistik, systemet (eller "koden") som styr dessa händelser, som han betecknar som langue. En sådan systematisk studie kräver dessutom en " synkron" uppfattning om förhållandet mellan språkets element vid ett visst ögonblick snarare än den "diakroniska" studien av språkets utveckling genom historien.

Detta antagande gav upphov till vad Roman Jakobson 1929 kom att beteckna som "strukturalism", där "varje uppsättning fenomen som granskas av samtida vetenskap behandlas inte som en mekanisk agglomeration utan som en strukturell helhet, den mekaniska uppfattningen av processer ger efter för frågan. av deras funktion" ("Romantic" 711). I denna passage uttrycker Jakobson Saussures avsikt att definiera lingvistik som ett vetenskapligt system i motsats till en enkel, "mekanisk" redovisning av historiska olyckor. Tillsammans med detta beskriver Jakobson också det andra grundläggande antagandet i Saussurean – vi kan kallar det nu "strukturellt" – lingvistik: att språkets grundläggande element endast kan studeras i relation till deras funktioner snarare än i relation till deras orsaker. Europeiska "ord"), dessa händelser och enheter måste placeras inom ett systemiskt ramverk där de är relaterade till andra så kallade händelser och entiteter. Detta är en radikal omorientering i uppfattningen av erfarenhet och fenomen, en vars betydelse filosofen Ernst Cassirer har jämfört med "den nya vetenskapen om Galileo som på 1600-talet förändrade hela vår begreppet den fysiska världen" (citerad i Culler, Pursuit 2 4). Denna förändring, som Greimas och Courtés noterar, återuppfattar "tolkning" och återuppfattar således själva förklaring och förståelse. Istället för att förklaringen "är i termer av ett fenomens orsaker, så att det som "effekt" på något sätt är underordnat dess orsaker, består förklaringen här i att underordna ett fenomen dess framtidsorienterade "funktion" eller "syfte." Förklaring är inte längre oberoende av mänskliga avsikter eller syften (även om dessa avsikter kan vara opersonliga, gemensamma eller, i freudianska termer, "omedvetna").

I sin lingvistik åstadkommer Saussure denna omvandling specifikt i omdefinieringen av det språkliga "ordet", som han beskriver som det språkliga "tecknet" och definierar i funktionalistiska termer. Tecknet, hävdar han, är föreningen av "ett koncept och en ljudbild", som han kallade "signified and signifier" (66-67; Roy Harriss översättning från 1983 erbjuder termerna "signification" och "signal"). Naturen av deras "kombination" är "funktionell" i det att varken den betecknade eller betecknaren är den andras "orsak"; snarare "var och en av sina värden från den andra" (8). språkelementet, tecknet , relationellt och gör det grundläggande antagandet om historisk lingvistik, nämligen identiteten för de elementära enheterna av språk och betydelse (d.v.s. "ord"), föremål för rigorös analys. Ordet "träd" som "samma" ord är inte pga. ordet definieras av inneboende kvaliteter – det är inte en "mekanisk agglomeration" av sådana kvaliteter – utan för att det definieras som ett element i ett system, språkets "strukturella helhet".

En sådan relationell (eller "diakritisk") definition av en entitet styr uppfattningen av alla element i språket i strukturell lingvistik. Detta är tydligast i den mest imponerande bedriften inom saussureansk lingvistik, utvecklingen av begreppen "fonem" och "särskiljande drag" av språket. Fonemen är de minsta artikulerade och betecknande enheterna i ett språk. Det är inte de ljud som förekommer i språket utan de "ljudbilder" Saussure nämner, som uppfattas av talare – fenomenalt uppfattade – som förmedlande mening. (Elmar Holenstein beskriver således Jakobsons lingvistik, som följer Saussure på viktiga sätt, som "fenomenologisk strukturalism".) Det är av denna anledning som den ledande talespersonen för Prags skolstrukturalism, Jan Mukarovsky, 1937 noterade att "struktur . . . är en fenomenologisk och inte en empirisk verklighet; det är inte själva verket, utan en uppsättning funktionella relationer som är belägna i ett kollektivs medvetande (generation, miljö, etc.)" (citerad i Galan 35). Likaså Lévi-Strauss, den ledande talespersonen för fransk strukturalism , noterade 1960 att "struktur har inget distinkt innehåll; den nöjer sig själv, och den logiska organisationen i vilken den är arresterad är tänkt som en egenskap hos det verkliga" (167; se även Jakobson, Fundamentals 27-28).

Fonemen, alltså de minsta märkbara elementen i språket, är inte positiva objekt utan en "fenomenologisk verklighet". På engelska, till exempel, kan fonemet /t/ uttalas på många olika sätt, men i alla fall kommer en engelsktalande att känna igen det som ett /t/. Ett aspirerat t (d.v.s. ett t uttalas med ett h-liknande andetag efter det), ett högt eller lågt t-ljud, ett utökat t-ljud, och så vidare, kommer alla att fungera på samma sätt för att urskilja betydelsen av "att" och "göra" på engelska. Dessutom är skillnaderna mellan språk sådana att fonologiska variationer i ett språk kan utgöra distinkta fonem i ett annat; sålunda skiljer engelska mellan /l/ och /r/, medan andra språk är så strukturerade att dessa artikulationer anses vara varianter av samma fonem (som den aspirerade och unaspirated t på engelska). I varje naturligt språk är det stora antalet möjliga ord en kombination av ett litet antal fonem. Engelska, till exempel, har mindre än 40 fonem som tillsammans bildar över en miljon olika ord.

Språkets fonem är i sig systematiskt organiserade strukturer av egenskaper. På 1920- och 1930-talen, efter Saussures ledning, isolerade Jakobson och N. S. Trubetzkoy de "särdragen" hos fonem. Dessa egenskaper är baserade på den fysiologiska strukturen hos talorganen - tunga, tänder, stämband och så vidare - att Saussure nämner i kursen och som Harris beskriver som "fysiologisk fonetik" (39; Baskins tidigare översättning använder termen "fonologi" [(1959) 38]) – och de kombineras i "buntar" av binära oppositioner för att bilda fonem. Till exempel på engelska är skillnaden mellan /t/ och /d/ närvaron eller frånvaron av "röst" (engagerandet av stämbanden), och på röstnivån definierar dessa fonem varandra ömsesidigt. På så sätt är fonologi ett specifikt exempel på en allmän språkregel som beskrivs av Saussure: I språket finns bara skillnader. ännu viktigare: en skillnad innebär i allmänhet positiva termer mellan vilka skillnaden är satt upp; men i språket finns det bara skillnader utan positiva termer. Oavsett om vi tar det betecknade eller betecknaren, har språket varken idéer eller ljud som fanns före det språkliga systemet. ( 120)

Inom detta ramverk bestäms språkliga identiteter inte av inneboende kvaliteter utan av systemiska ("strukturella") relationer.

Jag har sagt att fonologin "följde ledningen" av Saussure, för även om hans analys av språkproduktionens fysiologi "nuförtiden", som Harris säger, "skulle kallas "fysisk" i motsats till antingen "psykologisk" eller "funktionell". "" (Läsning 49), följaktligen formulerade han i kursen riktningen och konturerna för en funktionell analys av språket. Likaså var hans enda utökade publicerade verk, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir om det primitiva systemet av vokaler i indoeuropeiska språk), som publicerades 1878, helt och hållet beläget i projektet för nittonde- talets historiska lingvistik. Icke desto mindre, inom detta arbete, som Jonathan Culler har hävdat, visade Saussure "fruktbarheten av att tänka på språket som ett system av rent relationella föremål, även när han arbetade med uppgiften att historiska återuppbyggnaden" (Saussure 66). Genom att analysera de systematiska strukturella sambanden mellan fonem för att redogöra för mönster av vokalväxling i befintliga indoeuropeiska språk, föreslog Saussure att det utöver flera olika fonem /a/ måste ha funnits ett annat fonem som skulle kunna beskrivas formellt. "Det som gör Saussures arbete så mycket imponerande," avslutar Culler, "är det faktum att nästan femtio år senare, när kilskrift Hettite upptäcktes och dechiffrerades, visade sig det innehålla ett fonem, skrivet h, som betedde sig som Saussure hade förutspått. . Han hade upptäckt, genom en rent formell analys, vad som nu är känt som struphuvudet hos indoeuropeiska" (66).

Denna uppfattning om den relationella eller diakritiska bestämningen av betydelsens element, som är både implicit och explicit i kursen, antyder ett tredje antagande som styr strukturell lingvistik, vad Saussure kallar "tecknets godtyckliga natur". Med detta menar han att förhållandet mellan betecknare och betecknat i språket aldrig är nödvändigt (eller "motiverat"): man skulle lika gärna kunna hitta ljudbetecknaren arbre som betecknarträdet för att förena sig med begreppet "träd". Men mer än detta betyder det att det betecknade också är godtyckligt: ​​man skulle lika lätt kunna definiera begreppet "träd" genom dess vedartade kvalitet (vilket skulle utesluta palmer) som genom dess storlek (vilket utesluter de "låga vedartade växterna" vi ring buskar). Detta bör klargöra att numreringen av antaganden jag har presenterat inte representerar en prioritetsordning: varje antagande – den systemiska karaktären av signifikans (bäst uppfattas genom att studera språket "synkront"), den relationella eller "diakritiska" naturen hos elementen av betydelse, teckens godtyckliga natur – får sitt värde från de andra.

Det vill säga, saussureansk lingvistik de fenomen den studerar i övergripande relationer av kombination och kontrast i språk. I denna uppfattning är språk både processen att artikulera mening (betydelse) och dess produkt (kommunikation), och dessa två språkfunktioner är varken identiska eller helt kongruenta (se Schleifer, "Dekonstruktion"). Här kan vi se den växling mellan form och innehåll som Greimas och Courtés beskriver i modernistisk tolkning: språket presenterar kontraster som formellt definierar dess enheter, och dessa enheter kombineras på efterföljande nivåer för att skapa det betecknande innehållet. Eftersom språkets beståndsdelar är godtyckliga kan dessutom varken kontrast eller kombination sägas vara grundläggande. Sålunda, i språket kombineras särdrag för att bilda kontrasterande fonem på en annan nivå av uppfattning, fonem kombineras för att bilda kontrasterande morfem, morfem kombineras för att bilda ord, ord kombineras för att bilda meningar, och så vidare. I varje fall är hela fonemet, eller ordet, eller meningen, och så vidare, större än summan av dess delar (precis som vatten, H2O, i Saussures exempel [(1959) 103] är mer än den mekaniska agglomerationen av väte och syre).

De tre antagandena i kursen i allmän lingvistik ledde till att Saussure efterlyste en ny vetenskap från 1900-talet som skulle gå utöver språkvetenskapen för att studera "teckens liv i samhället." Saussure kallade denna vetenskap "semiologi (från grekiska semeîon "tecken")" (16). "Vetenskapen" om semiotik, som den kom att praktiseras i Östeuropa på 1920- och 1930-talen och Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära artefakter som konstituerades (eller artikulerades) av dessa strukturer. Under hela den sena delen av sin karriär, även när han erbjöd kurserna i allmän lingvistik, fortsatte Saussure sin egen "semiotiska" analys av sen latinsk poesi i ett försök att upptäcka medvetet dolda anagram av egennamn. Studiemetoden var på många sätt motsatsen till den funktionella rationalismen i hans språkliga analyser: den försökte, som Saussure nämner i en av de 99 anteckningsböcker där han genomförde denna studie, att systematiskt undersöka problemet med "slumpen", som " blir den oundvikliga grunden för allt" (citerad i Starobinski 101). En sådan studie, som Saussure själv säger, fokuserar på "det materiella faktum" av slump och mening (citerad 101), så att "temaordet" vars anagram Saussure söker, som Jean Starobinski hävdar, "är, för poeten , ett instrument och inte en livsviktig grodd till dikten. Dikten krävs för att återanvända temaordets ljudmaterial" (45). I denna analys säger Starobinski: "Saussure förlorade inte sig själv i ett sökande efter dolda betydelser." Istället tycks hans arbete visa en önskan att undvika alla problem som uppstår ur medvetandet: "Eftersom poesi inte bara förverkligas i ord utan är något som föds ur ord, undkommer den medvetandets godtyckliga kontroll för att enbart vara beroende av en sorts språklig laglighet "(121).

Det vill säga Saussures försök att upptäcka egennamn i sen latinsk poesi - vad Tzvetan Todorov kallar förminskningen av ett "ord. . . till dess signifier" (266) – betonar ett av de element som styrde hans språkliga analys, tecknets godtyckliga natur. (Det betonar också den formella karaktären hos saussureansk lingvistik – "Språk", hävdar han, "är en form och inte en substans" – som effektivt eliminerar semantik som ett huvudobjekt för analys.) Som Todorov avslutar framstår Saussures arbete anmärkningsvärt homogent idag i sin vägran att acceptera symboliska fenomen. . . . I sin forskning om anagram uppmärksammar han endast fenomenen med upprepning, inte till evokationsfenomen. . . . I sina studier av Nibelungen känner han igen symboler endast för att hänföra dem till felaktiga läsningar: eftersom de inte är avsiktliga existerar inte symboler. Slutligen i sina kurser om allmän lingvistik, överväger han existensen av semiologi, och därmed av andra tecken än lingvistiska; men denna bekräftelse begränsas på en gång av det faktum att semiologin är ägnad åt en enda typ av tecken: de som är godtyckliga. (269-70)

Om detta är sant, beror det på att Saussure inte kunde tänka sig "avsikt" utan ett ämne; han kunde inte riktigt undkomma motsättningen mellan form och innehåll, hans verk gjorde så mycket för att ifrågasätta. Istället tog han till "språklig laglighet". Ligger mellan å ena sidan 1800-talets föreställningar om historia, subjektivitet och sättet för kausal tolkning som styrs av dessa föreställningar och å andra sidan 1900-talets "strukturalistiska" föreställningar om vad Lévi-Strauss kallade "kantianism utan ett transcendentalt subjekt" (citerat i Connerton 23) – begrepp som raderar motsättningen mellan form och innehåll (eller subjekt och objekt) och hierarkin av förgrund och bakgrund i fullskalig strukturalism, psykoanalys och till och med kvantmekanik – Ferdinands verk de Saussure i lingvistik och semiotik avgränsar ett signalmoment i studiet av mening och kultur.

Ronald Schleifer


Bilaga 2

Ferdinand de Saussure (översättning)

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses vara grundaren av modern lingvistik, tack vare hans försök att beskriva språkets struktur snarare än historien om enskilda språk och ordformer. I stort sett lades grunden för strukturella metoder inom lingvistik och litteraturkritik och i stor utsträckning semiotik i hans verk redan i början av 1900-talet. Det är bevisat att metoderna och begreppen för den så kallade "poststrukturalismen", som utvecklats i verk av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra, går tillbaka till Saussures och Saussures språkliga verk. anagrammatiska läsningar av senromersk poesi. Det bör noteras att Saussures arbete med lingvistik och språklig tolkning hjälper till att länka samman ett brett spektrum av intellektuella discipliner, från fysik till litterära innovationer, psykoanalys och filosofi från det tidiga nittonhundratalet. A. J. Greimas och J. Kurte skriver i Semiotics and Language: ”En analytisk ordbok med titeln ”Interpretation” som en ny sorts tolkning dök upp i början av 1900-talet tillsammans med Saussures lingvistik, Husserls fenomenologi och psykoanalysen. av Freud. I ett sådant fall är "tolkning inte att tillskriva ett givet innehåll till en form som annars skulle sakna en, utan snarare en omskrivning som på ett annat sätt formulerar samma innehåll av ett betydande element inom ett givet semiotiskt system" (159 ). I denna förståelse av "tolkning" är form och innehåll oskiljaktiga; tvärtom är varje form fylld med semantisk betydelse ("meningsfull form"), så tolkningen erbjuder en ny, liknande återberättelse av något meningsfullt i ett annat teckensystem.

En liknande förståelse av form och innehåll, presenterad av Claude Lévi-Strauss i ett av strukturalismens nyckelverk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan ses i Saussures postumt publicerade bok A Course in Allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure lite, "Kurs" - hans huvudverk - samlades från anteckningar från studenter som deltog i hans föreläsningar om allmän lingvistik 1907-11. I kursen efterlyste Saussure en "vetenskaplig" studie av språket, som kontrasterade det med 1800-talets jämförande-historiska lingvistik. Detta arbete kan betraktas som en av västerländskt tänkandes största landvinningar: med individuella ord som språkets strukturella element som grund, bevisade historisk (eller "diakronisk") språkvetenskap ursprunget och utvecklingen av västeuropeiska språk från en vanligt, indoeuropeiskt språk – och ett tidigare proto-indoeuropeiskt.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement" som Saussure ifrågasatte. Hans arbete var ett försök att reducera de många fakta om språk som tillfälligt studerades av jämförande lingvistik till ett litet antal satser. 1800-talets jämförande filologiska skola, skriver Saussure, "lyckades inte skapa en riktig språkskola" eftersom "den inte förstod essensen av studieobjektet" (3). Denna "essens", menar han, ligger inte bara i enskilda ord - språkets "positiva substanser" - utan också i de formella sambanden som hjälper dessa substanser att existera.

Saussures "test" av språk bygger på tre antaganden. För det första är den vetenskapliga förståelsen av språk inte baserad på ett historiskt, utan på ett strukturellt fenomen. Därför skilde han mellan enskilda språkfenomen - "talhändelser", som han definierar som "parole" - och det riktiga, enligt hans åsikt, studieobjektet för lingvistik, systemet (kod, struktur) som styr dessa händelser ( "langue"). En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element i ett givet ögonblick, snarare än en "diakronisk" studie av språkets utveckling genom dess historia.

Denna hypotes var föregångaren till vad Roman Jakobson 1929 skulle kalla "strukturalism" - en teori där "alla fenomen som undersöks av modern vetenskap betraktas inte som en mekanisk ackumulation, utan som en strukturell helhet där den konstruktiva komponenten är korrelerad med funktionen" ("Romantisk "711). I denna passage formulerade Jakobson Saussures idé om att definiera språket som en struktur, i motsats till den "mekaniska" uppräkningen av historiska händelser. Dessutom utvecklar Jakobson ett annat saussureanskt antagande, som blev föregångaren till strukturell lingvistik: språkets grundläggande beståndsdelar bör studeras i samband inte så mycket med deras orsaker, utan med deras funktioner. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter. Detta var en radikal vändning i jämförelsen av fenomen med den omgivande verkligheten, vars betydelse filosofen Ernst Cassirer jämförde med "vetenskapen om Galileo, som på 1600-talet omkullkastade idéer om den materiella världen." följaktligen själva förklaringarna. Fenomen började tolkas inte i relation till orsakerna till att de inträffade, utan i relation till den effekt de kan ha i nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikter kan vara opersonliga, "omedvetet" i ordets freudianska mening).

I sin lingvistik visar Saussure särskilt denna vändning i förändringen av ordets begrepp inom lingvistik, som han definierar som ett tecken och beskriver i termer av dess funktioner. Ett tecken för honom är en kombination av ljud och betydelse, "signified and designation" (66-67; i den engelska översättningen från 1983 av Roy Harris - "signification" och "signal"). Denna förenings natur är "funktionell" (varken det ena eller det andra elementet kan existera utan varandra); dessutom "lånar den ena egenskaper från den andra" (8). Således definierar Saussure det huvudsakliga strukturella elementet i språket - tecknet - och gör basen för historisk lingvistik till identiteten av tecken till ord, vilket kräver en särskilt rigorös analys. Därför kan vi förstå olika betydelser av, säg, samma ord "träd" - inte för att ordet bara är en uppsättning av vissa egenskaper, utan för att det definieras som ett element i teckensystemet, i "den strukturella helheten", i språket.

Ett sådant relativt ("diakritiskt") enhetsbegrepp ligger till grund för begreppet alla delar av språket i strukturell lingvistik. Detta är särskilt tydligt i den mest originella upptäckten av saussureisk lingvistik, i utvecklingen av begreppet "fonem" och "särskiljande drag" hos språket. Fonemen är den minsta av de talade och meningsfulla språkenheterna. Det är inte bara ljud som förekommer i språket, utan "ljudbilder", konstaterar Saussure, som av infödda talare uppfattas som meningsfulla. (Det bör noteras att Elmar Holenstein kallar Jakobsons lingvistik, som fortsätter Saussures idéer och begrepp i sina huvudbestämmelser, för "fenomenologisk strukturalism"). Det är därför den ledande talaren för Pragskolan för strukturalism, Jan Mukarowski, 1937 observerade att ”struktur. . . inte ett empiriskt, utan ett fenomenologiskt begrepp; det är inte resultatet i sig, utan en uppsättning betydande relationer för det kollektiva medvetandet (generation, andra, etc.)”. En liknande tanke uttrycktes 1960 av Lévi-Strauss, den franska strukturalismens ledare: ”Strukturen har inget bestämt innehåll; den är meningsfull i sig, och den logiska konstruktion som den är innesluten i är verklighetens avtryck.

I sin tur representerar fonem, som de minsta språkliga element som är acceptabla för perception, en separat integrerad "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Aspirerat, höjt eller sänkt, ett långt "t"-ljud, etc. kommer lika att skilja betydelsen av orden "att" och "göra". Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med och utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talet, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särskiljande egenskaperna" hos fonem. Dessa egenskaper är baserade på strukturen hos talorganen - tunga, tänder, stämband - Saussure noterar detta i "Course of General Linguistics", och Harris kallar det "fysiologisk fonetik" (i Baskins tidigare översättning, termen "fonologi" " används) - de är kopplade i "knutar » durg mot en vän för att göra ljud. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av "röst" (spänningen i stämbanden), och röstnivån som skiljer ett fonem från ett annat. Således kan fonologi betraktas som ett exempel på den allmänna språkregel som beskrivs av Saussure: "Det finns bara skillnader i språket." Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

Jag har redan nämnt att fonologin i sin utveckling förlitade sig på Saussures idéer. Även om hans analys av språkfysiologi i modern tid, säger Harris, "skulle kallas 'fysisk', i motsats till 'psykologisk' eller 'funktionell', formulerade han i The Course tydligt riktningen och de grundläggande principerna för den funktionella analysen av språk. Hans enda publicerade verk under hans livstid, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Anteckningar om det ursprungliga vokalsystemet i de indoeuropeiska språken), publicerat 1878, var helt i linje med jämförande historisk lingvistik i 1800-talet. Ändå, i detta arbete, säger Jonathan Culler, visade Saussure "fruktbarheten av idén om språk som ett system av sammanlänkade fenomen, även med dess historiska rekonstruktion." Genom att analysera förhållandet mellan fonem, förklara växlingen av vokaler i de moderna språken i den indoeuropeiska gruppen, föreslog Saussure att förutom flera olika ljud "a", måste det finnas andra fonem som formellt beskrivs. "Vad som gör Saussures arbete särskilt imponerande," avslutar Kaller, "är att nästan 50 år senare, när hettitisk kilskrift upptäcktes och dechiffrerades, hittades ett fonem, i skrift betecknat med "h", som betedde sig som Saussure förutspådde. Genom formell analys upptäckte han det som nu är känt som det gutturala ljudet i de indoeuropeiska språken.

I konceptet med en relativ (diakritisk) definition av tecken, både explicit och underförstådd i kursen, finns det ett tredje nyckelantagande för strukturell lingvistik, kallat av Saussure "tecknets godtyckliga natur". Med detta menas att förhållandet mellan ljud och mening i språket inte är motiverat av någonting: man kan lika gärna koppla ihop ordet "arbre" och ordet "träd" med begreppet "träd". Dessutom betyder detta att ljudet också är godtyckligt: ​​man kan definiera begreppet "träd" genom närvaron av bark (förutom för palmer) och efter storlek (förutom för "låga träiga växter" - buskar). Av detta bör det vara klart att alla antaganden jag presenterar inte är uppdelade i mer och mindre viktiga: var och en av dem - den systemiska karaktären av tecken (mest förståeligt i den "synkrona" studien av språket), deras relativa (diakritiska) essensen, den godtyckliga karaktären av tecken - kommer från från resten.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språk är både ett uttryck för ordens betydelse (beteckning) och deras resultat (kommunikation) – och dessa två funktioner sammanfaller aldrig (se Shleifers "Dekonstruktion av språket"). Vi kan se den växling av form och innehåll som Greimas och Kurte beskriver i den senaste tolkningsversionen: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar på successiva nivåer för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till kontrasterande morfem, morfem till ord, ord till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än summan av dess delar (precis som vatten, i Saussures exempel, är mer än kombinationen av väte och syre).

Tre antaganden om "Course of General Linguistics" ledde Saussure till idén om en ny vetenskap från 1900-talet, separat från lingvistik, som studerade "teckens liv i samhället." Saussure kallade denna vetenskap för semiologi (från grekiskan "semeîon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utökade studiet av språk och språkliga strukturer till litterära rön sammansatta (eller formulerade) med hjälp av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade Saussure sig åt en "semiotisk" analys av sen romersk poesi och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i sin språkliga analys: den var ett försök, som Saussure skriver i en av de 99 anteckningsböckerna, att i systemet studera problemet med "sannolikhet", som "blir grunden för allting. " En sådan undersökning, hävdar Saussure själv, hjälper till att fokusera på den "riktiga sidan" av sannolikhet; ”Nyckelordet” som Saussure letar efter ett anagram för är, enligt Jean Starobinsky, ”ett verktyg för poeten, och inte källan till liv för dikten. Dikten tjänar till att vända nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar.”

Saussures försök att studera egennamn i sen romersk poesi (Tsvetan Todorov kallade detta en förkortning av "ett ord ... bara innan det skrivs") understryker en av komponenterna i hans språkliga analys - teckens godtyckliga karaktär, liksom den formella essensen av saussureansk lingvistik ("Språk", hävdar han, "formens väsen, inte fenomenet"), vilket utesluter möjligheten att analysera innebörden. Todorov drar slutsatsen att idag verkar Saussures skrifter anmärkningsvärt konsekventa i sin ovilja att studera symboler [fenomen som har en väldefinierad betydelse]. . . . När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semilogi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoderna för oavsiktlig tolkning baserad på dessa begrepp, och å andra sidan de strukturalistiska begrepp som Lévi-Strauss kallade "Kantianism utan en transcendent aktör" - genom att radera motsättningen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik, markerar Ferlinand de Saussures skrifter om lingvistik och semiotik en vändpunkt i studiet av betydelser i språk och kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunderna i teorin om grammatik / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiska metoder i lingvistik. M., 1974.

4. Arnold I.V. Ordets semantiska struktur i modern engelska och metodiken för dess studie. /I.V. Arnold - L .: Education, 1966. - 187 sid.

6.Bashlykov A.M. Automatiskt översättningssystem. / A.M. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 sid.

7.Baudouin de Courtenay: Teoretiskt arv och modernitet: Sammandrag av rapporterna från den internationella vetenskapliga konferensen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 sid.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 sid.

9. Golovin, B.N. Språk och statistik. /B.N. Golovin - M., 1971. - 210 sid.

10. Zvegintsev, V.A. Teoretisk och tillämpad lingvistik. / V.A. Zvegintsev - M., 1969. - 143 sid.

11. Kasevich, V.B. Semantik. Syntax. Morfologi. // V.B. Kasevich -M., 1988. - 292 sid.

12. Lekomtsev Yu.K. Introduktion till lingvistikens formella språk / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 sid.

Matveeva G.G. Dolda grammatiska betydelser och identifiering av den sociala personen (”porträtt”) av talaren / G.G. Matveev. - Rostov, 1999. - 174 sid.

14. Melchuk, I.A. Erfarenhet av att bygga språkliga modeller "Mening<-->Text". / I.A. Melchuk. - M., 1974. - 145 sid.

15. Nelyubin L.L. Översättning och tillämpad lingvistik / L.L. Nelyubin. - M. : Högre skola, 1983. - 207 sid.

16. Om språkforskningens exakta metoder: om den så kallade "matematiska lingvistiken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva och andra - M., 1961. - 162 sid.

17. Piotrovsky L.G. Matematisk lingvistik: Lärobok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Högre skola, 1977. - 160 sid.

18. Han är. Text, maskin, person. - L., 1975. - 213 sid.

19. Det är han. Tillämpad lingvistik / Ed. A.S. Gerda. - L., 1986. - 176 sid.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Modern strukturell lingvistik. Problem och metoder. M., 1977. - 239 sid.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunderna i allmän och maskinöversättning / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 sid.

22. Slyusareva N.A. Teorin om F. de Saussure i ljuset av modern lingvistik / N.A. Slyusareva. - M.: Nauka, 1975. - 156 sid.

23. Uggla, L.Z. Analytisk lingvistik / L.Z. Uggla - M., 1970. - 192 sid.

24. Saussure F. de. Anteckningar om allmän lingvistik / F. de Saussure; Per. från fr. – M.: Framsteg, 2000. – 187 sid.

25. Det är han. Kurs i allmän lingvistik / Per. från fr. - Jekaterinburg, 1999. -426 sid.

26. Talstatistik och automatisk textanalys / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 sid.

27. Stoll, P. Sets. Logik. Axiomatiska teorier / R. Stoll; Per. från engelska. - M., 1968. - 180 sid.

28. Tenier, L. Fundamentals of structural syntax. M., 1988.

29. Ubin I.I. Automatisering av översättningsaktiviteter i Sovjetunionen/I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 sid.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Bearbetning av konceptuell information. M., 1980.

32. Shikhanovich, Yu.A. Introduktion till modern matematik (initiala begrepp). M., 1965

33. Shcherba L.V. Ryska vokaler i kvalitativa och kvantitativa termer / L.V. Shcherba - L.: Nauka, 1983. - 159 sid.

34. Abdullah-zade F. Världsmedborgare // Ogonyok - 1996. - Nr 5. – s.13

35. V.A. Uspensky. Preliminär för läsarna av "New Literary Review" till de semiotiska meddelandena från Andrei Nikolaevich Kolmogorov. – En ny litteraturrecension. –1997. - Nr 24. - S. 18-23

36. Perlovsky L. Medvetande, språk och kultur. - Kunskap är makt. –2000. Nr 4 - S. 20-33

37. Frumkina R.M. Om oss - snett. // Russian Journal. - 2000. - Nr 1. – s. 12

38. Fitialov, S.Ya. Om syntaxmodellering i strukturell lingvistik // Problems of Structural Linguistics. M., 1962.

39. Det är han. Om likvärdigheten mellan NN-grammatik och beroendegrammatik // Problems of Structural Linguistics. M., 1967.

40. Chomsky, N. Logiska grunder för lingvistisk teori // Nytt inom lingvistik. Problem. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. tryck. jhu.ru

46. ​​en.wikipedia.org

47. www.smolensk.ru


Kryptanalys är en vetenskap (och praktiken för dess tillämpning) om metoder och sätt att bryta chiffer. Kryptografi och kryptoanalys utgör ett enda kunskapsområde - kryptologi, som för närvarande är den moderna matematikens område, som har viktiga tillämpningar inom modern informationsteknologi. Termen "kryptografi" introducerades av D. Vallis. Behovet av att kryptera meddelanden uppstod för länge sedan. V-...

Är den närmaste, inte den vidare betydelsen av ordet. Den psykologiska riktningen, och särskilt den unga grammatiken, svarade alltså på många frågor som ställde lingvistiken inför mitten av 1800-talet. Metodiken för jämförande historisk lingvistik klargjordes, huvudproblemen med semasiologi och funktionell-semantisk grammatik ställdes, relationen mellan språk och tal analyserades, ...

Kontakter", "Flerspråkighet i den sociologiska aspekten". Deras studie utförs av sociolingvistik (sociallingvistik), som uppstod i skärningspunkten mellan lingvistik och sociologi, såväl som etnolinguistik, talets etnografi, stilistik, retorik, pragmatik, teorin av språklig kommunikation, teorin om masskommunikation, etc. Språket utför följande sociala funktioner i samhället: kommunikativt / informativt (...

Om språkvetenskapens avsnitt och sammansättning. De empiriskt formade delarna av lingvistiken, som delvis skär varandra och därför inte bildar ett logiskt enhetligt system, kan representeras som korrelerande med varandra enligt några olika parametrar. Allmän lingvistik och partiella språkvetenskaper. De mest allmänna och speciella delarna av lingvistik särskiljs. En av de viktigaste delarna av lingvistik är teorin ...

Introduktion

Kapitel 1. Historien om tillämpningen av matematiska metoder i lingvistik

1.1. Bildandet av strukturell lingvistik vid 1800- och 1900-talet

1.2. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1. Maskinöversätta

2.2.Statistiska metoder i språkinlärning

2.3. Att lära sig ett språk med metoder för formell logik

2.4. Utsikter för tillämpning av matematiska metoder i lingvistik

Slutsats

Litteratur

Bilaga 1. Ronald Schleifer. Ferdinand de Saussure

Bilaga 2. Ferdinand de Saussure (översättning)

Introduktion

Under 1900-talet har det funnits en fortsatt trend mot interaktion och interpenetration av olika kunskapsområden. Gränserna mellan de enskilda vetenskaperna suddas ut gradvis; det finns fler och fler grenar av mental aktivitet som befinner sig "i korsningen" av humanitär, teknisk och naturvetenskaplig kunskap.

En annan uppenbar egenskap hos moderniteten är viljan att studera strukturer och deras beståndsdelar. Därför ges en allt större plats, både i vetenskapsteori och i praktiken, till matematik. Genom att å ena sidan komma i kontakt med logik och filosofi, å andra sidan med statistik (och följaktligen med samhällsvetenskap), tränger matematiken allt djupare in i de områden som länge ansågs vara rent. "humanitär", som utökar sin heuristiska potential (svaret på frågan "hur mycket" hjälper ofta till att svara på frågorna "vad" och "hur"). Språkvetenskapen var inget undantag.

Syftet med mitt kursarbete är att kort belysa sambandet mellan matematik och en sådan gren av lingvistik som lingvistik. Sedan 1950-talet har matematik använts inom lingvistik för att skapa en teoretisk apparat för att beskriva språkens struktur (både naturliga och artificiella). Det bör dock sägas att den inte omedelbart fann en sådan praktisk tillämpning för sig själv. Inledningsvis började matematiska metoder inom lingvistik användas för att klargöra lingvistikens grundläggande begrepp, men med utvecklingen av datateknik började en sådan teoretisk premiss att få tillämpning i praktiken. Lösningen av sådana uppgifter som maskinöversättning, maskinell informationshämtning, automatisk textbearbetning krävde ett fundamentalt nytt förhållningssätt till språket. Språkvetarna ställdes inför frågan: hur man lär sig att representera språkliga mönster i den form i vilken de kan appliceras direkt på tekniken. Termen "matematisk lingvistik", som är populär i vår tid, syftar på all språklig forskning som använder exakta metoder (och begreppet exakta metoder inom naturvetenskap är alltid nära besläktat med matematik). Vissa forskare från de senaste åren tror att uttrycket i sig inte kan höjas till en term, eftersom det inte betyder någon speciell "lingvistik", utan bara en ny riktning fokuserad på att förbättra, öka noggrannheten och tillförlitligheten av språkforskningsmetoder . Lingvistik använder både kvantitativa (algebraiska) och icke-kvantitativa metoder, vilket för den närmare matematisk logik, och följaktligen till filosofi och till och med psykologi. Till och med Schlegel noterade samspelet mellan språk och medvetande, och Ferdinand de Saussure, en framstående lingvist i början av 1900-talet (jag kommer att berätta om hans inflytande på utvecklingen av matematiska metoder inom lingvistik senare), kopplade samman språkets struktur med dess tillhörighet till folket. Den moderna forskaren L. Perlovsky går längre och identifierar språkets kvantitativa egenskaper (till exempel antalet kön, fall) med särdragen hos den nationella mentaliteten (mer om detta i avsnitt 2.2, "Statistiska metoder i lingvistik").

Samspelet mellan matematik och lingvistik är ett mångfacetterat ämne, och i mitt arbete kommer jag inte att uppehålla mig vid alla, utan först och främst vid dess tillämpade aspekter.

Kapitel I. Historien om tillämpningen av matematiska metoder i lingvistik

1.1 Bildandet av strukturell lingvistik vid början av XIX - XX-talet

Den matematiska beskrivningen av språket är baserad på idén om språket som en mekanism, som går tillbaka till den berömda schweiziska lingvisten från det tidiga nittonhundratalet, Ferdinand de Saussure.

Den första länken till hans koncept är teorin om språket som ett system som består av tre delar (språket i sig är det språk, Tal - Lösenord, och talaktivitet - språk), där varje ord (medlem av systemet) inte betraktas i sig självt utan i samband med andra medlemmar. Som en annan framstående lingvist, dansken Louis Hjelmslev, senare noterade, var Saussure "den förste som krävde ett strukturellt förhållningssätt till språket, det vill säga en vetenskaplig beskrivning av språket genom att registrera relationerna mellan enheter."

Saussures förståelse av språket som en hierarkisk struktur var den första som ställde problemet med värdet och betydelsen av språkliga enheter. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter.

Den strukturella enheten i Saussures språk betraktade ordet "tecken", där ljud och betydelse kombinerades. Inget av dessa element existerar utan varandra: därför förstår modersmålet de olika nyanserna av betydelsen av ett polysemantiskt ord som ett separat element i den strukturella helheten, i språket.

I F. de Saussures teori kan man alltså se samspelet mellan lingvistik å ena sidan med sociologi och socialpsykologi (det bör noteras att samtidigt utvecklas Husserls fenomenologi, Freuds psykoanalys, Einsteins relativitetsteori. , pågår experiment om form och innehåll inom litteratur, musik och bildkonst), å andra sidan med matematik (systemicitetsbegreppet motsvarar det algebraiska språkbegreppet). Ett sådant begrepp förändrade begreppet språklig tolkning som sådant: Fenomen började tolkas inte i relation till orsakerna till deras förekomst, utan i relation till nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikterna kan vara opersonliga, "omedvetna" i ordets freudianska mening).

Funktionen av den språkliga mekanismen manifesteras genom talaktiviteten hos modersmålstalare. Resultatet av tal är de så kallade "korrekta texterna" - sekvenser av talenheter som lyder vissa mönster, av vilka många tillåter en matematisk beskrivning. Teorin om sätt att beskriva den syntaktiska strukturen behandlar studier av metoder för matematisk beskrivning av korrekta texter (främst meningar). I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

I väst utvecklas Saussures idéer av den store schweiziska lingvistens yngre samtida: i Danmark - L. Hjelmslev, redan av mig nämnd, som gav upphov till den algebraiska språkteorin i sitt arbete "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tjeckien - den ryska emigrantforskaren N. Trubetskoy.

Statistiska regelbundenheter i studiet av språk började behandlas av ingen mindre än genetikens grundare, Georg Mendel. Det var först 1968 som filologer upptäckte att han under de sista åren av sitt liv fascinerades av studiet av språkliga fenomen med hjälp av matematikens metoder. Mendel tog med sig denna metod till lingvistik från biologin; på 1990-talet var det bara de mest vågade lingvisterna och biologerna som hävdade genomförbarheten av en sådan analys. I arkiven av klostret St. Tomasz i Brno, vars abbot var Mendel, hittades ark med kolumner av efternamn som slutade på "mann", "bauer", "mayer" och med några bråkdelar och beräkningar. I ett försök att upptäcka de formella lagarna för släktnamnens ursprung, gör Mendel komplexa beräkningar, där han tar hänsyn till antalet vokaler och konsonanter i det tyska språket, det totala antalet ord han anser, antalet efternamn, etc.

I vårt land började den strukturella lingvistiken utvecklas ungefär samtidigt som i väst - vid 1800- och 1900-talens skiftning. Samtidigt med F. de Saussure utvecklades begreppet språk som ett system i deras arbeten av professorer vid Kazan University F.F. Fortunatov och I.A. Baudouin de Courtenay. Den senare korresponderade länge med de Saussure, respektive Genève- och Kazan-språkskolan samarbetade med varandra. Om Saussure kan kallas ideologen för "exakta" metoder inom lingvistik, så lade Baudouin de Courtenay de praktiska grunderna för deras tillämpning. Han var den förste att separera lingvistik (som exakt en vetenskap som använder statistiska metoder och funktionellt beroende) från filologi (en gemenskap av humanitära discipliner som studerar andlig kultur genom språk och tal). Forskaren själv trodde att "lingvistik kan vara användbar inom en snar framtid, bara befriad från den obligatoriska föreningen med filologi och litteraturhistoria". Fonologi blev "testplatsen" för införandet av matematiska metoder i lingvistiken - ljud som "atomer" i språksystemet, med ett begränsat antal lätt mätbara egenskaper, var det lämpligaste materialet för formella, rigorösa beskrivningsmetoder. Fonologi förnekar existensen av mening i ljud, så den "mänskliga" faktorn eliminerades i studierna. I denna mening är fonem som fysiska eller biologiska föremål.

Fonemer, som de minsta språkliga element som är acceptabla för perception, representerar en separat sfär, en separat "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Huvudsaken är att fonemet kommer att utföra sin huvudsakliga - meningsfulla - funktion. Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med eller utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa funktioner är baserade på strukturen av talorganen - tunga, tänder, stämband. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av en "röst" (spänningen i stämbanden) och röstnivån som skiljer ett fonem från ett annat. Därmed kan fonologi betraktas som ett exempel på den allmänna språkregel som Saussure beskrev: "Det finns bara skillnader i språket". Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språket är både ett uttryck för ordens betydelse och ett kommunikationsmedel, och dessa två funktioner sammanfaller aldrig. Vi kan lägga märke till växlingen mellan form och innehåll: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till morfem, morfem - till ord, ord - till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än bara summan av dess delar.

Saussure föreslog idén om en ny vetenskap från 1900-talet, skild från lingvistik, som studerade teckens roll i samhället. Saussure kallade denna vetenskap för semiologi (från grekiskan "semeîon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller artikulerade) i termer av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade sig Saussure åt en "semiotisk" analys av sen romersk poesi, och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i dess språkliga analys: den var ett försök att i ett system studera problemet med "sannolikhet" i språket. Sådan forskning hjälper till att fokusera på den "verkliga sidan" av sannolikhet; "nyckelordet" som Saussure letar efter ett anagram för är enligt Jean Starobinsky "ett verktyg för poeten, inte källan till diktens liv." Dikten tjänar till att byta ut nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar” (se . Bilaga 1).

Saussures försök att studera egennamn i senromersk poesi framhäver en av komponenterna i hans språkliga analys – teckens godtyckliga karaktär, såväl som den formella essensen av Saussures språkvetenskap, som utesluter möjligheten att analysera betydelse. Todorov drar slutsatsen att idag verkar Saussures verk vara extremt konsekventa i sin ovilja att studera symbolerna för ett fenomen som har en tydligt definierad betydelse [Bilaga 1]. När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semiologi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoder för slumpmässig tolkning baserad på dessa begrepp, och å andra sidan strukturalistiska begrepp som raderar motsättningen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik - Ferdinand de Saussures skrifter om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ryska vetenskapsmän var också representerade vid den första internationella lingvistkongressen i Haag 1928. S. Kartsevsky, R. Yakobson och N. Trubetskoy gjorde en rapport som undersökte språkets hierarkiska struktur - i andan av de modernaste idéerna för början av förra seklet. Jakobson utvecklade i sina skrifter Saussures idéer om att de grundläggande elementen i ett språk först och främst bör studeras i samband med deras funktioner, och inte med orsakerna till deras förekomst.

Tyvärr, efter att Stalin kom till makten 1924, kastas rysk lingvistik, liksom många andra vetenskaper, tillbaka. Många begåvade vetenskapsmän tvingades emigrera, förvisades från landet eller dog i läger. Först sedan mitten av 1950-talet har en viss pluralism av teorier blivit möjlig – mer om detta i avsnitt 1.2.

1.2 Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

I mitten av 1900-talet hade fyra världsspråkliga skolor bildats, som var och en visade sig vara förfader till en viss "exakt" metod. Leningrad fonologiska skola(dess förfader var en elev till Baudouin de Courtenay L.V. Shcherba) använde ett psykolingvistiskt experiment baserat på analys av talet från infödda talare som huvudkriteriet för att generalisera ljud i form av ett fonem.

Forskare Prags språkcirkel, i synnerhet - dess grundare N.S. Trubetskoy, som emigrerade från Ryssland, utvecklade teorin om oppositioner - språkets semantiska struktur beskrevs av dem som en uppsättning oppositionellt konstruerade semantiska enheter - Sem. Denna teori tillämpades i studiet av inte bara språk, utan också konstnärlig kultur.

Ideologer Amerikansk deskriptivism var lingvisterna L. Bloomfield och E. Sapir. Språket presenterades för deskriptivister som en uppsättning talpåståenden, som var huvudobjektet för deras studie. Deras fokus låg på reglerna för vetenskaplig beskrivning (därav namnet) av texter: studiet av organisation, arrangemang och klassificering av deras element. Formalisering av analytiska procedurer inom fonologi och morfologi (utveckling av principer för studiet av språk på olika nivåer, distributiv analys, metoden för direkta beståndsdelar, etc.) ledde till formuleringen av allmänna frågor om språklig modellering. Ouppmärksamhet på planen för språkets innehåll, liksom den paradigmatiska sidan av språket, tillät inte deskriptivister att tolka språket som ett system fullt ut.

På 1960-talet utvecklades teorin om formell grammatik, som uppstod främst på grund av den amerikanske filosofen och lingvisten N. Chomskys arbete. Han anses med rätta vara en av de mest kända moderna vetenskapsmännen och offentliga personerna, många artiklar, monografier och till och med en dokumentär i full längd ägnas åt honom. Med namnet på ett i grunden nytt sätt att beskriva den syntaktiska strukturen som Chomsky uppfann - generativ (genererande) grammatik - kallades motsvarande trend inom lingvistik. generativism.

Chomsky, en ättling till invandrare från Ryssland, studerade lingvistik, matematik och filosofi vid University of Pennsylvania sedan 1945, starkt influerad av sin lärare Zelig Harris - liksom Harris, Chomsky betraktade och betraktar fortfarande sina politiska åsikter nära anarkismen (han är fortfarande känd som kritiker av det befintliga amerikanska politiska systemet och som en av anti-globalismens andliga ledare).

Chomskys första stora vetenskapliga arbete, magisteruppsats "Morphology of Modern Hebrew » (1951) har förblivit opublicerad. Chomsky doktorerade från University of Pennsylvania 1955, men mycket av den forskning som ligger till grund för hans avhandling (publicerad i sin helhet först 1975 under titeln The Logical Structure of Linguistic Theory) och hans första monografi, Syntactic Structures (1957, Rus. trans. . 1962), framfördes vid Harvard University 1951-1955. Samma 1955 flyttade vetenskapsmannen till Massachusetts Institute of Technology, där han blev professor 1962.

Chomskys teori har gått igenom flera stadier i sin utveckling.

I den första monografin "Syntaktiska strukturer" presenterade vetenskapsmannen språket som en mekanism för att generera en oändlig uppsättning meningar med en ändlig uppsättning grammatiska medel. För att beskriva språkliga egenskaper föreslog han begreppen djupa (dolda från direkt perception och genererade av ett system av rekursiva, d.v.s. kan tillämpas upprepade gånger, regler) och ytliga (direkt uppfattade) grammatiska strukturer, såväl som transformationer som beskriver övergången från djupa strukturer till ytstrukturer. Flera ytstrukturer kan motsvara en djup struktur (till exempel en passiv struktur Dekretet är undertecknat av presidenten härledd från samma djupa struktur som den aktiva konstruktionen Presidenten undertecknar dekretet) och vice versa (alltså tvetydigheten mamma älskar dotter beskrivs som resultatet av ett sammanträffande av ytstrukturer som går tillbaka till två olika djupa, där den ena är den som älskar dottern och i den andra den som är älskad av dottern).

Chomskys standardteori anses vara "Aspects"-modellen som anges i Chomskys bok "Aspects of the Theory of Syntax". I denna modell introducerades för första gången regler för semantisk tolkning i formell teori, vilket tillskrev mening till djupa strukturer. I Aspects ställs språklig kompetens i motsats till språkanvändning (performance), den så kallade Katz-Postalhypotesen om bevarande av mening under transformation antas, i samband med vilken begreppet valfri transformation utesluts, och en apparat av syntaktiska egenskaper som beskriver lexikal kompatibilitet introduceras.

På 1970-talet arbetade Chomsky med teorin om kontroll och bindning (GB-teori - från orden regering Och bindande) är mer allmän än den föregående. I den övergav forskaren de specifika reglerna som beskriver de syntaktiska strukturerna för specifika språk. Alla transformationer har ersatts med en universell rörelsetransformation. Inom ramen för GB-teorin finns även privata moduler som var och en ansvarar för sin egen del av grammatiken.

Redan nyligen, 1995, lade Chomsky fram ett minimalistiskt program, där mänskligt språk beskrivs som maskinspråk. Det här är bara ett program - inte en modell eller en teori. I den identifierar Chomsky två huvuddelsystem i den mänskliga språkapparaten: lexikonet och datorsystemet, såväl som två gränssnitt - fonetisk och logisk.

Chomskys formella grammatiker har blivit klassiska för att beskriva inte bara naturliga utan också konstgjorda språk - i synnerhet programmeringsspråk. Den strukturella lingvistikens utveckling under andra hälften av 1900-talet kan med rätta betraktas som en "chomskisk revolution".

Moskvas fonologiska skola, vars företrädare var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, använde en liknande teori för att studera fonetik. Så småningom börjar "exakta" metoder tillämpas med avseende på inte bara fonetik, utan också syntax. Både lingvister och matematiker, både här och utomlands, börjar studera språkets struktur. På 1950- och 60-talen började ett nytt skede i samspelet mellan matematik och lingvistik i Sovjetunionen, i samband med utvecklingen av maskinöversättningssystem.

Drivkraften till början av dessa arbeten i vårt land var den första utvecklingen inom området maskinöversättning i USA (även om den första mekaniserade översättningsanordningen av P.P. Smirnov-Trojanskij uppfanns i Sovjetunionen 1933, eftersom den var primitiv, blev inte utbredd). 1947 kom A. Butt och D. Britten med en kod för ord-för-ord-översättning med hjälp av en dator, ett år senare föreslog R. Richens en regel för att dela upp ord i stammar och ändelser i maskinöversättning. De åren var helt annorlunda än idag. Det var mycket stora och dyra maskiner som tog hela rum och krävde en stor stab av ingenjörer, operatörer och programmerare för att underhålla dem. I grund och botten användes dessa datorer för att utföra matematiska beräkningar för militära institutioners behov - det nya inom matematik, fysik och teknik tjänade först och främst militära angelägenheter. I de tidiga stadierna stöddes utvecklingen av MP aktivt av militären, medan (under det kalla krigets förhållanden) den rysk-engelska riktningen utvecklades i USA och den anglo-ryska riktningen i Sovjetunionen.

I januari 1954 ägde "Georgetown Experiment" rum vid Massachusetts Technical University - den första offentliga demonstrationen av översättning från ryska till engelska på IBM-701-maskinen. Sammanfattning av meddelandet om den framgångsrika passagen av experimentet, gjort av D.Yu. Panov, dök upp i RJ "Mathematics", 1954, nr 10: "Översättning från ett språk till ett annat med hjälp av en maskin: en rapport om det första framgångsrika testet."

D. Yu. Panov (vid den tiden chef för Institute of Scientific Information - INI, senare VINITI) lockade I. K. Belskaya, som senare ledde maskinöversättningsgruppen vid Institutet för exakt matematik och datorteknik vid USSR Academy of Sciences, till att arbeta med maskinöversättning. I slutet av 1955 går den första erfarenheten av att översätta från engelska till ryska med hjälp av BESM-maskinen tillbaka. Program för BESM sammanställdes av N.P. Trifonov och L.N. Korolev, vars doktorsavhandling ägnades åt metoder för att konstruera ordböcker för maskinöversättning.

Parallellt utfördes arbete med maskinöversättning vid institutionen för tillämpad matematik vid det matematiska institutet vid USSR Academy of Sciences (nu M.V. Keldysh Institute of Applied Mathematics of the Russian Academy of Sciences). På initiativ av matematikern A.A. Lyapunov. Han involverade O.S. Kulagin och hennes elever T.D. Wentzel och N.N. Ricco. Lyapunovs och Kulaginas idéer om möjligheten att använda teknik för att översätta från ett språk till ett annat publicerades i tidskriften Nature, 1955, nr 8. Från slutet av 1955 har T.N. Moloshnaya, som sedan började självständigt arbete med den engelsk-ryska översättningsalgoritmen.

R. Frumkina, som vid den tiden var engagerad i översättningsalgoritmen från spanska, minns att det i detta skede av arbetet var svårt att ta några konsekventa steg. Mycket oftare var jag tvungen att följa den heuristiska upplevelsen - min egen eller kollegor.

Den första generationen av maskinöversättningssystem var dock mycket ofullkomliga. Alla var baserade på sekventiella översättningsalgoritmer "ord för ord", "fras för fras" - semantiska samband mellan ord och meningar togs inte i beaktande på något sätt. Till exempel är meningarna: John letade efter sin leksakslåda.Till slut hittade han den. Lådan låg i pennan.John var väldigt glad. (John letade efter sin leksakslåda. Till slut hittade han den. Lådan låg i lekhagen. John var väldigt glad.)" "Penna" i detta sammanhang är inte en "penna" (skrivverktyg), utan en "lekhage" ( lek-penna). Kunskap om synonymer, antonymer och bildliga betydelser är svåra att föra in i en dator. En lovande riktning var utvecklingen av datorsystem fokuserade på användningen av en mänsklig översättare.

Med tiden ersattes direktöversättningssystem av T-system (från det engelska ordet "transfer" - transformation), där översättningen utfördes på nivån av syntaktiska strukturer. T-systemens algoritmer använde en mekanism som gjorde det möjligt att bygga en syntaktisk struktur enligt grammatikreglerna för språket i inmatningssatsen (liknande hur ett främmande språk lärs ut på gymnasiet), och sedan syntetisera den utgående meningen genom att omvandla den syntaktiska strukturen och ersätta de nödvändiga orden från ordboken.

Lyapunov talade om översättning genom att extrahera innebörden av den översatta texten och presentera den på ett annat språk. Tillvägagångssättet för att bygga maskinöversättningssystem baserat på att erhålla den semantiska representationen av den ingående meningen genom semantisk analys och syntes av den inmatade meningen enligt den erhållna semantiska representationen anses fortfarande vara den mest perfekta. Sådana system kallas I-system (från ordet "interlingua"). Uppgiften att skapa dem, som ligger tillbaka i slutet av 50-talet och början av 60-talet, har dock inte lösts helt hittills, trots ansträngningarna från International Federation of IFIP - världsgemenskapen av forskare inom informationsbehandlingsområdet.

Forskare funderade på hur man formaliserar och bygger algoritmer för att arbeta med texter, vilka ordböcker som ska skrivas in i maskinen, vilka språkliga mönster som ska användas i maskinöversättning. Den traditionella lingvistiken hade inte sådana idéer – inte bara vad gäller semantik, utan också när det gäller syntax. På den tiden fanns det inga listor över syntaktiska konstruktioner för något språk, villkoren för deras kompatibilitet och utbytbarhet studerades inte, reglerna för att konstruera stora enheter av syntaktisk struktur från mindre beståndsdelar utvecklades inte.

Behovet av att skapa de teoretiska grunderna för maskinöversättning ledde till bildandet och utvecklingen av matematisk lingvistik. Den ledande rollen i denna fråga i Sovjetunionen spelades av matematikerna A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ägnades åt studiet av den formella teorin om grammatik (samtidigt med N. Khomsky i USA), Kuznetsov lade fram uppgiften att axiomatisera lingvistiken, som går tillbaka till F.F. Fortunatov.

Den 6 maj 1960 antogs dekretet från presidiet för USSR Academy of Sciences "Om utvecklingen av strukturella och matematiska metoder för studier av språk", och motsvarande avdelningar skapades vid Institute of Linguistics och Institute of det ryska språket. Sedan 1960 började landets ledande humanitära universitet - fakulteten för filologi vid Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages ​​- att utbilda personal inom området för automatisk textbehandling.

Maskinöversättningsverk från denna period, kallade "klassiska", är dock av teoretiskt snarare än praktiskt intresse. Kostnadseffektiva maskinöversättningssystem började skapas först på åttiotalet av förra seklet. Jag kommer att prata om detta senare i avsnitt 2.1, Maskinöversättning.

1960-70-talen inkluderar djupa teoretiska utvecklingar med metoder för mängdlära och matematisk logik, såsom fältteori och fuzzy mängdteori.

Författaren till fältteori i lingvistik var den sovjetiske poeten, översättaren och lingvisten V.G. Admoni. Han utvecklade till en början sin teori utifrån det tyska språket. För Admoni betecknar begreppet "fält" en godtycklig icke-tom uppsättning språkliga element (till exempel "lexikalt fält", "semantiskt fält").

Fältets struktur är heterogen: den består av en kärna, vars element har en komplett uppsättning egenskaper som definierar en uppsättning, och en periferi, vars element kan ha båda egenskaperna hos en given uppsättning (inte alla) och närliggande. Jag kommer att ge ett exempel som illustrerar detta uttalande: till exempel, på engelska, är fältet för sammansatta ord ("day-dream" - "dream" svårt att skilja från fältet för fraser ("tårgas" - "tårgas"). .

Teorin om fuzzy sets som redan nämnts ovan är nära besläktad med fältteori. I Sovjetunionen har lingvisterna V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dess förfader var den amerikanske matematikern L. Zadeh, som 1965 publicerade artikeln "Fuzzy Logic". Zade gav en matematisk motivering för teorin om luddiga mängder och övervägde dem på basis av språkligt material.

I den här teorin talar vi inte så mycket om elements tillhörighet till en given mängd (АОа), som om graden av detta medlemskap (mАОа), eftersom perifera element kan tillhöra flera fält i en eller annan grad. Zade (Lofti-zade) var född i Azerbajdzjan, fram till 12 års ålder hade han praxis att kommunicera på fyra språk - azerbajdzjanska, ryska, engelska och persiska - och använde tre olika alfabet: kyrilliska, latinska, arabiska. När en vetenskapsman tillfrågas vad som är gemensamt mellan teorin om fuzzy sets och lingvistik, förnekar han inte detta samband, utan förtydligar: ”Jag är inte säker på att studiet av dessa språk hade ett stort inflytande på mitt tänkande. Om så var fallet, då bara undermedvetet. I sin ungdom studerade Zadeh på en presbyteriansk skola i Teheran, och efter andra världskriget emigrerade han till USA. "Frågan är inte om jag är amerikan, ryss, azerbajdzjan eller någon annan", sa han i ett av samtalen, "jag är formad av alla dessa kulturer och folk och känner mig ganska bekväm bland var och en av dem." I dessa ord finns något som liknar det som kännetecknar teorin om fuzzy sets - ett avsteg från entydiga definitioner och skarpa kategorier.

I vårt land, på 70-talet, översattes och studerades verk av västerländska lingvister från 1900-talet. I.A. Melchuk översatte N. Chomskys verk till ryska. PÅ. Slyusareva kopplar i sin bok "The Theory of F. de Saussure in the Light of Modern Linguistics" samman postulaten från Saussures undervisning med 70-talets lingvistiks faktiska problem. Det finns en tendens till ytterligare matematisering av lingvistik. De ledande inhemska universiteten utbildar personal i specialiteten "matematisk (teoretisk, tillämpad) lingvistik". Samtidigt sker i västvärlden ett kraftigt språng i utvecklingen av datateknik, vilket kräver allt fler språkliga grunder.

På 1980-talet, professor vid Institutet för orientaliska studier vid Vetenskapsakademien Yu.K. Lekomtsev, medan han analyserar språkvetenskapens språk genom analys av scheman, tabeller och andra typer av notation som används i språkliga beskrivningar, anser matematiska system lämpliga för dessa ändamål (främst system av matrisalgebra).

Under hela det tjugonde århundradet var det alltså en konvergens mellan det exakta och humaniora. Samspelet mellan matematik och lingvistik fick alltmer praktiska tillämpningar. Mer om detta i nästa kapitel.

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1 Maskinöversättning

Idén att översätta från ett språk till ett annat med hjälp av en universell mekanism uppstod flera århundraden innan den första utvecklingen på detta område började - redan 1649 föreslog Rene Descartes idén om ett språk där motsvarande idéer om olika språk skulle uttryckas med en symbol. De första försöken att implementera denna idé på 1930-40-talet, början av den teoretiska utvecklingen i mitten av seklet, förbättringen av översättningssystem med hjälp av teknik på 1970-80-talet, den snabba utvecklingen av översättningstekniken under det senaste decennium - det här är stadierna i utvecklingen av maskinöversättning som bransch. Det är från arbetet med maskinöversättning som datorlingvistik som vetenskap har vuxit fram.

Med utvecklingen av datorteknik i slutet av 70-talet och början av 80-talet satte forskarna upp sig mer realistiska och kostnadseffektiva mål – maskinen blev inte en konkurrent (som tidigare antagits), utan en assistent till en mänsklig översättare. Maskinöversättning upphör att tjäna enbart militära uppgifter (alla sovjetiska och amerikanska uppfinningar och forskning, främst inriktad på ryska och engelska, bidrog till det kalla kriget på ett eller annat sätt). 1978 sändes ord i naturliga språk över Arpa sammankopplade nätverk, och sex år senare dök de första översättningsprogrammen för mikrodatorer upp i USA.

På 70-talet köpte Europeiska gemenskapernas kommission den engelsk-franska versionen av datoröversättaren Systran, och beställde även de fransk-engelska och italienska-engelska versionerna och det ryska-till-engelska översättningssystemet som används av den amerikanska försvarsmakten. Så lades grunden till EUROTRA-projektet.

Om återupplivandet av maskinöversättning på 70-80-talet. Följande fakta vittnar: Europeiska gemenskapernas kommission (CEC) köper den engelsk-franska versionen av Systran, samt översättningssystemet från ryska till engelska (det senare utvecklades efter ALPAC-rapporten och fortsatte att användas av US Air Force och NASA); dessutom beordrar CEC utvecklingen av de fransk-engelska och italiensk-engelska versionerna. Samtidigt sker en snabb expansion av maskinöversättningsaktiviteter i Japan; i USA beordrar Pan American Health Organization (PAHO) utvecklingen av en spansk-engelsk riktning (SPANAM-system); Det amerikanska flygvapnet finansierar utvecklingen av ett maskinöversättningssystem vid Linguistic Research Center vid University of Texas i Austin; TAUM-gruppen i Kanada gör betydande framsteg i utvecklingen av sitt METEO-system (meteorologisk översättning). Ett antal projekt startade på 70- och 80-talen. utvecklades sedan till fullfjädrade kommersiella system.

Under perioden 1978-93 spenderades 20 miljoner dollar på forskning inom området maskinöversättning i USA, 70 miljoner i Europa och 200 miljoner i Japan.

En av de nya utvecklingarna är TM-teknologin (översättningsminne), som fungerar enligt ackumuleringsprincipen: under översättningsprocessen sparas det ursprungliga segmentet (meningen) och dess översättning, vilket resulterar i bildandet av en språklig databas; om ett identiskt eller liknande segment hittas i den nyöversatta texten, visas det tillsammans med översättningen och en indikation på procentuell matchning. Översättaren fattar sedan ett beslut (att redigera, avvisa eller acceptera översättningen), vars resultat lagras av systemet, så det finns inget behov av att översätta samma mening två gånger. Ett välkänt kommersiellt system baserat på TM-teknologi utvecklas för närvarande av TRADOS-systemet (grundat 1984).

För närvarande utvecklar flera dussin företag kommersiella maskinöversättningssystem, inklusive: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata programvara; Linguistica b.v. Nu kan du använda automatiska översättares tjänster direkt på webben: alphaWorks; PROMTs onlineöversättare, LogoMedia.net, AltaVistas översättningstjänst för Babel Fish; InfiniT.com; Översätta Internet.

Kommersiellt effektiva översättningssystem dök upp under andra hälften av 80-talet även i vårt land. Själva begreppet maskinöversättning har utökats (det började inkludera "skapandet av ett antal automatiska och automatiserade system och enheter som automatiskt eller halvautomatiskt utför hela översättningscykeln eller enskilda uppgifter i en dialog med en person"), och statliga anslag för utveckling av denna industri har ökat.

Ryska, engelska, tyska, franska och japanska blev huvudspråken i inhemska översättningssystem. All-Union Translation Center (VTsP) utvecklade ett system för att översätta från engelska och tyska till ryska på en dator ES-1035-ANRAP. Den bestod av tre ordböcker - inmatning av engelska och tyska och utmatning av ryska - under en enda programvara. Det fanns flera utbytbara specialiserade ordböcker - för datateknik, programmering, radioelektronik, maskinteknik, jordbruk, metallurgi. Systemet kunde fungera i två lägen - automatiskt och interaktivt, när skärmen visade källtexten och översättningen per fras, som en person kunde redigera. Hastigheten för att översätta text till ANRAP (från början av att skriva till slutet av utskrift) var cirka 100 sidor per timme.

1989 skapades en familj av kommersiella översättare av typen SPRINT, som arbetade med ryska, engelska, tyska och japanska. Deras främsta fördel var deras kompatibilitet med IBM PC - sålunda nådde inhemska maskinöversättningssystem den internationella kvalitetsnivån. Samtidigt utvecklas ett system för maskinöversättning från franska till ryska FRAP, som inkluderar 4 stadier av textanalys: grafematisk, morfologisk, syntaktisk och semantisk. I LGPI dem. Herzen, arbete pågick på ett fyraspråkigt (engelska, franska, spanska, ryska) SILOD-MP-system (engelsk-ryska och fransk-ryska ordböcker användes i industriellt läge.

För specialiserad översättning av texter om elektroteknik fanns ETAP-2-systemet. Analysen av ingångstexten i den utfördes på två nivåer - morfologisk och syntaktisk. ETAP-2 ordboken innehöll cirka 4 tusen poster; stadiet för textomvandling - cirka 1000 regler (96 allmänna, 342 privata, resten är ordbok). Allt detta säkerställde en tillfredsställande kvalitet på översättningen (säg, titeln på patentet "Optisk fasnätarrangemang och kopplingsanordning som har ett sådant arrangemang" översattes som "En optisk fasnätanordning och en anslutningsanordning med en sådan anordning" - trots att tautologi, innebörden bevaras).

Vid Minsks pedagogiska institut för främmande språk, på grundval av den engelsk-ryska ordboken för ordformer och fraser, uppfanns ett system för maskinöversättning av titlar, vid Institutet för orientaliska studier vid Vetenskapsakademien - ett system för översättning från japanska till ryska. Den första automatiska vokabulär- och terminologitjänsten (SLOTHERM) för datoranvändning och programmering, skapad vid Moskvas forskningsinstitut för automationssystem, innehöll cirka 20 000 termer i en förklarande ordbok och speciella ordböcker för språkforskning.

Maskinöversättningssystem började gradvis användas inte bara för sitt avsedda syfte, utan också som en viktig komponent i automatiska inlärningssystem (för undervisning i översättning, kontroll av stavning och grammatisk kunskap).

90-talet förde med sig den snabba utvecklingen av PC-marknaden (från stationär dator till ficka) och informationsteknik, den utbredda användningen av Internet (som blir mer internationellt och flerspråkigt). Allt detta gjorde att vidareutvecklingen av automatiserade översättningssystem efterfrågades. Sedan början av 1990-talet Inhemska utvecklare går också in på PC-systemmarknaden.

I juli 1990 presenterades det första kommersiella maskinöversättningssystemet i Ryssland som heter PROMT (PROgrammers maskinöversättning) vid PC-forumet i Moskva. PROMT vann NASA:s anbud för leverans av MP-system (PROMT var det enda icke-amerikanska företaget i detta 1992 släppte PROMT en hel familj av system under det nya namnet STYLUS för översättning från engelska, tyska, franska, italienska och spanska till ryska och från ryska till engelska, och världens första maskinöversättningssystem för Windows skapades på grunden för STYLUS 1993. 1994 släpptes STYLUS 2.0 för Windows 3.X/95/NT, och 1995-1996 den tredje generationen av maskinöversättningssystem, helt 32-bitars STYLUS 3.0 för Windows 95/NT, medan utvecklingen av helt nya, världens första rysk-tyska och rysk-franska maskinöversättningssystem slutfördes framgångsrikt.

1997 tecknades ett avtal med det franska företaget Softissimo om skapandet av översättningssystem från franska till tyska och engelska och vice versa, och i december i år släpptes världens första tysk-franska översättningssystem. Samma år släppte PROMT-företaget ett system implementerat med Gigant-teknologin, som stöder flera språkriktningar i ett skal, samt en speciell översättare för att arbeta på Internet WebTranSite.

1998 släpptes en hel konstellation av program under det nya namnet PROMT 98. Ett år senare släppte PROMT två nya produkter: ett unikt mjukvarupaket för att arbeta på Internet - PROMT Internet, och en översättare för företagspostsystem - PROMT Mail Översättare. I november 1999 erkändes PROMT som det bästa maskinöversättningssystemet som testats av den franska tidskriften PC Expert och överträffade sina konkurrenter med 30 procent. Särskilda serverlösningar har också utvecklats för företagskunder - företagsöversättningsservern PROMT Translation Server (PTS) och internetlösningen PROMT Internet Translation Server (PITS). År 2000 uppdaterade PROMT hela sin serie av mjukvaruprodukter genom att släppa en ny generation av MT-system: PROMT Translation Office 2000, PROMT Internet 2000 och Magic Gooddy 2000.

Onlineöversättning med stöd av PROMT-systemet används på ett antal inhemska och utländska webbplatser: PROMTs onlineöversättare, InfiniT.com, Translate.Ru, Lycos, etc., såväl som i institutioner med olika profiler för översättning av affärsdokument, artiklar och brev (det finns översättningssystem inbyggda direkt i Outlook Express och andra e-postklienter).

Nuförtiden växer nya maskinöversättningsteknologier fram baserade på användningen av artificiell intelligens och statistiska metoder. Om det senare - i nästa avsnitt.

2.2 Statistiska metoder i språkinlärning

Betydande uppmärksamhet i modern lingvistik ägnas åt studiet av språkliga fenomen med hjälp av metoderna för kvantitativ matematik. Kvantitativa data hjälper ofta till att djupare förstå de fenomen som studeras, deras plats och roll i systemet av relaterade fenomen. Svaret på frågan "hur mycket" hjälper till att svara på frågorna "vad", "hur", "varför" - sådan är den heuristiska potentialen hos en kvantitativ egenskap.

Statistiska metoder spelar en betydande roll i utvecklingen av maskinöversättningssystem (se avsnitt 2.1). I det statistiska tillvägagångssättet betraktas översättningsproblemet i termer av en brusig kanal. Föreställ dig att vi behöver översätta en mening från engelska till ryska. Den bullriga kanalprincipen ger oss följande förklaring av förhållandet mellan en engelsk och en rysk mening: en engelsk mening är inget annat än en rysk mening som förvrängs av något slags brus. För att återställa den ursprungliga ryska meningen måste vi veta vad folk brukar säga på ryska och hur ryska fraser förvrängs till engelska. Översättningen utförs genom att söka efter en sådan rysk mening som maximerar produkterna av den ovillkorliga sannolikheten för den ryska meningen och sannolikheten för den engelska meningen (original) givet den givna ryska meningen. Enligt Bayes teorem är denna ryska mening den mest sannolika översättningen av engelska:

där e är översättningssatsen och f är den ursprungliga meningen

Så vi behöver en källmodell och en kanalmodell, eller en språkmodell och en översättningsmodell. Språkmodellen måste tilldela en sannolikhetspoäng till vilken mening som helst på målspråket (i vårt fall ryska), och översättningsmodellen till den ursprungliga meningen. (se tabell 1)

I allmänhet fungerar ett maskinöversättningssystem i två lägen:

1. Systemträning: en utbildningskorpus av parallella texter tas, och med hjälp av linjär programmering söker man efter sådana värden på översättningskorrespondenstabeller som maximerar sannolikheten för (till exempel) den ryska delen av korpusen med tillgänglig engelska enligt till den valda översättningsmodellen. En modell av det ryska språket är byggd på den ryska delen av samma korpus.

2. Exploatering: baserat på data som erhållits för en obekant engelsk mening, söks efter en ryska som maximerar produkten av sannolikheterna som tilldelas av språkmodellen och översättningsmodellen. Programmet som används för en sådan sökning kallas en avkodare.

Den enklaste statistiska översättningsmodellen är den bokstavliga översättningsmodellen. Denna modell antar att för att översätta en mening från ett språk till ett annat räcker det att översätta alla ord (skapa en "påse med ord"), och modellen kommer att ge deras placering i rätt ordning. För att minska P( a, f | e) till P(a | e, f), dvs. sannolikheter för en given anpassning givet ett par meningar, varje sannolikhet P(a, f | e) normaliseras med summan av sannolikheterna för alla anpassningar av ett givet par meningar:

Implementeringen av Viterbi-algoritmen som används för att träna modell #1 är som följer:

1. Hela tabellen med översätär fylld med samma värden.

2. För alla möjliga varianter av parvisa kopplingar av ord beräknas sannolikheten P(a, f | e):

3. Värdena för P(a, f | e) normaliseras för att erhålla värdena för P(a | e, f).

4. Frekvensen för varje översättningspar beräknas, viktad med sannolikheten för varje inriktningsalternativ.

5. De resulterande viktade frekvenserna normaliseras och bildar en ny tabell över översättningskorrespondenssannolikheter

6. Algoritmen upprepas från steg 2.

Betrakta, som ett exempel, träningen av en liknande modell på en korpus av två par meningar (Fig. 2):

vita huset

  • Hus/Hus

Efter ett stort antal iterationer kommer vi att få en tabell (tabell 2), som visar att översättningen är utförd med hög noggrannhet.

Statistiska metoder används också i stor utsträckning i studiet av ordförråd, morfologi, syntax och stil. Forskare från Perm State University genomförde en studie baserad på påståendet att stereotypa fraser är ett viktigt "byggmaterial" i texten. Dessa fraser består av "nukleära" upprepade ord och beroende ordspecifikatorer och har en uttalad stilistisk färgning.

I den vetenskapliga stilen kan "nukleära" ord kallas: forskning, studie, uppgift, problem, fråga, fenomen, fakta, observation, analys etc. Inom journalistiken kommer andra ord att vara "kärnkraft", som har ett ökat värde specifikt för tidningens text: tid, person, makt, affär, handling, lag, liv, historia, plats etc. (totalt 29)

Av särskilt intresse för lingvister är också den professionella differentieringen av det nationella språket, originaliteten i användningen av ordförråd och grammatik, beroende på typ av yrke. Det är känt att förare i professionellt tal använder formen sh O fer, säger läkarna k O klubb istället för cocktail Yu sh - sådana exempel kan ges. Statistikens uppgift är att spåra variabiliteten i uttalet och förändringen i språknormen.

Professionella skillnader leder till skillnader inte bara grammatiska utan också lexikala. Yakut State University uppkallad efter M.K. Ammosov analyserades 50 frågeformulär med de vanligaste reaktionerna på vissa ord bland läkare och byggare (tabell 3).

Byggare

Mänsklig

patient (10), personlighet (5)

man (5)

Bra

hjälp (8), hjälp (7)

ond (16)

liv

död (10)

härlig (5)

död

lik (8)

livet (6)

brand

värma (8), bränna (6)

eld (7)

finger

hand (14), panaritium (5)

stor (7), index (6)

ögon

syn (6), pupill, ögonläkare (5 vardera)

brun (10), stor (6)

huvud

sinne (14), hjärnor (5)

stor (9), smart (8), smart (6)

förlora

medvetande, liv (4 vardera)

pengar (5), hitta (4)

Det kan noteras att läkare oftare än byggmästare ger associationer med anknytning till deras yrkesverksamhet, eftersom ordstimuli som ges i enkäten har mer att göra med deras yrke än med yrket som byggmästare.

Statistiska regelbundenheter i ett språk används för att skapa frekvensordböcker - ordböcker som ger numeriska egenskaper för frekvensen av ord (ordformer, fraser) för vilket språk som helst - författarens språk, något arbete, etc. Vanligtvis förekommer frekvensen av ett ord används som ett kännetecken för användning i texten i en viss volym

Modellen för taluppfattning är omöjlig utan en ordbok som dess väsentliga komponent. I uppfattningen av tal är den grundläggande operativa enheten ordet. Av detta följer särskilt att varje ord i den uppfattade texten måste identifieras med motsvarande enhet av lyssnarens (eller läsarens) interna ordförråd. Det är naturligt att anta att sökningen redan från början är begränsad till vissa underdomäner i ordboken. Enligt de flesta moderna teorier om taluppfattning ger den faktiska fonetiska analysen av den klingande texten i ett typiskt fall endast viss delinformation om ordets möjliga fonologiska utseende, och denna typ av information motsvarar inte ett, utan ett visst MÅNGA ord av ordboken; Därför uppstår två problem:

(a) Välj lämplig uppsättning enligt vissa parametrar;

(b) inom gränserna för den skisserade uppsättningen (om den är allokerad på lämpligt sätt) att "eliminera" alla ord, utom det enda som bäst motsvarar det givna ordet i den erkända texten. En av strategierna för "avhopp" är att utesluta lågfrekventa ord. Härav följer att vokabulären för taluppfattning är en frekvensordbok. Det är skapandet av en datorversion av frekvensordboken för det ryska språket som är den initiala uppgiften för det presenterade projektet.

Baserat på materialet i det ryska språket finns det 5 frekvensordböcker (inte räknar grenordböcker). Låt oss bara notera några allmänna brister i de befintliga ordböckerna.

Alla kända frekvensordböcker för det ryska språket är baserade på bearbetning av skrivna (tryckta) texter. Delvis av denna anledning, när ett ords identitet till stor del bygger på formella, grafiska sammanträffanden, tas semantik inte tillräckligt med i beaktande. Som ett resultat är frekvensegenskaperna också förskjutna, förvrängda; till exempel, om kompilatorn av frekvensordboken inkluderar ord från kombinationen "varandra" i den allmänna statistiken för användningen av ordet "vän", så är detta knappast motiverat: med tanke på semantiken måste vi erkänna att dessa redan är olika ord, eller snarare, att en oberoende ordboksenhet bara är kombinationen som helhet.

I alla befintliga ordböcker placeras ord endast i sina grundläggande former: substantiv i singularform, nominativ kasus, verb i infinitivform, etc. Vissa av ordböckerna ger information om frekvensen av ordformer, men vanligtvis gör de det inte tillräckligt konsekvent, inte på ett uttömmande sätt. Frekvenserna för olika ordformer av samma ord stämmer uppenbarligen inte överens. Utvecklaren av taluppfattningsmodellen måste ta hänsyn till att i en verklig perceptuell process är det just en specifik ordform som är "nedsänkt" i texten som är föremål för igenkänning: baserat på analysen av den initiala delen av exponenten för ordformen, en uppsättning ord med identisk början bildas, och den initiala delen av ordformen är inte nödvändigtvis identisk med den initiala delen av ordboksformen. Det är ordformen som har en specifik rytmisk struktur, vilket också är en oerhört viktig parameter för det perceptuella urvalet av ord. Slutligen, i den slutliga representationen av det igenkända yttrandet, återigen, representeras orden av motsvarande ordformer.

Det finns många verk som visar vikten av frekvens i processen för taluppfattning. Men vi är inte medvetna om verk där frekvensen av ordformer skulle användas - tvärtom ignorerar alla författare praktiskt taget frekvensen av enskilda ordformer, och hänvisar uteslutande till lexem. Om resultaten som erhålls av dem inte anses vara artefakter, måste man anta att modersmålstalaren på något sätt har tillgång till information om förhållandet mellan frekvenserna av ordformer och ordboksformer, det vill säga faktiskt lexem. Dessutom kan en sådan övergång från en ordform till ett lexem naturligtvis inte förklaras av naturlig kunskap om motsvarande paradigm, eftersom frekvensinformation måste användas före den slutliga identifieringen av ordet, annars förlorar den helt enkelt sin mening.

Enligt de primära statistiska egenskaperna är det möjligt att med ett givet relativt fel fastställa den del av ordboken, som innehåller ord med hög förekomstfrekvens, oavsett typ av text. Det är också möjligt att, genom att införa stegvis ordning i ordboken, få en serie ordböcker som täcker de första 100, 1000, 5000, etc. av vanliga ord. Ordbokens statistiska egenskaper är av intresse i samband med den semantiska analysen av ordförråd. Studiet av ämnesideologiska grupper och semantiska fält visar att lexikala associationer stöds av semantiska länkar som är koncentrerade kring lexem med den vanligaste betydelsen. Beskrivningen av betydelser inom det lexiko-semantiska fältet kan utföras genom att identifiera ord med de mest abstrakta lexem i betydelse. Tydligen utgör "tomma" (ur synvinkel av nominativa styrkor) ordboksenheter ett statistiskt homogent lager.

Ordförråd för enskilda genrer är inte mindre värdefulla. Att studera måttet på deras likhet och arten av statistiska fördelningar kommer att ge intressant information om den kvalitativa stratifieringen av ordförråd beroende på användningsområdet för tal.

Sammanställning av stora frekvensordböcker kräver användning av datorteknik. Införandet av partiell mekanisering och automatisering i arbetet med en ordbok är av intresse som ett experiment i maskinell bearbetning av ordböcker för olika texter. En sådan ordbok kräver ett mer rigoröst system för bearbetning och ackumulering av ordförrådsmaterial. I miniatyr är detta ett informationssökningssystem som kan ge information om olika aspekter av text och ordförråd. Några grundläggande förfrågningar till detta system är planerade från allra första början: det totala antalet inventeringsord, de statistiska egenskaperna för ett enstaka ord och hela ordböcker, ordningen av vanliga och sällsynta zoner i ordboken, etc. Maskinkortfilen låter dig att automatiskt bygga omvända ordböcker för enskilda genrer och källor. Många annan användbar statistisk information om språket kommer att extraheras från den ackumulerade mängden information. Datorfrekvensordboken skapar en experimentell grund för övergången till en mer omfattande automatisering av ordförrådsarbetet.

Statistiska data från frekvensordböcker kan också användas i stor utsträckning för att lösa andra språkliga problem - till exempel för att analysera och bestämma de aktiva sätten för ordbildning av det moderna ryska språket, lösa problem med att förbättra grafik och stavning, som är förknippade med att ta in ta hänsyn till statistisk information om ordförrådet (det är viktigt att ta hänsyn till probabilistiska egenskaper hos grafekombinationer, typer av bokstavskombinationer realiserade i ord), praktisk transkription och translitteration. De statistiska parametrarna i ordboken kommer också att vara användbara för att lösa problem med att automatisera maskinskrivning, igenkänning och automatisk läsning av bokstavlig text.

Moderna förklarande ordböcker och grammatiker för det ryska språket är huvudsakligen byggda på basis av litterära och konstnärliga texter. Det finns frekvensordböcker över språket A.S. Pushkin, A.S. Griboedova, F.M. Dostojevskij, V.V. Vysotsky och många andra författare. Vid Institutionen för historia och litteraturteori i Smolensk-staten. Pedagogiska högskolan har under ett antal år arbetat med att sammanställa frekvensordböcker över poetiska och prosatexter. För denna studie valdes frekvensordböcker över alla texter av Pushkin och ytterligare två poeter från guldåldern - "Ve från Wit" av Griboyedov och all Lermontovs poesi; Pasternak och fem andra poeter från silveråldern - Balmont 1894-1903, "Dikter om den vackra damen" av Blok, "Sten" av Mandelstam, "Eldpelare" av Gumilyov, "Anno Domini MCMXXI" av Akhmatova och "Systrar till Mitt liv" av Pasternak och ytterligare fyra poeter från järnåldern - "Dikter av Yuri Zhivago", "När det klarnar upp", hela korpusen av texter av M. Petrovs, "Vägen är långt borta", "Vindskärmen", "Farväl till snön" och "Hästskor" av Mezhirov, "Antimirov" av Voznesensky och "Snezhnitsa » Rylenkova.

Det bör noteras att dessa ordböcker är olika till sin natur: vissa representerar vokabulären för ett dramatiskt verk, andra - böcker med sångtexter, eller flera böcker, eller hela korpusen av poetens dikter. Resultaten av analysen som presenteras i denna artikel bör tas med försiktighet, de kan inte tas som absoluta. Med hjälp av särskilda åtgärder kan dock skillnaden i texters ontologiska karaktär i viss mån minskas.

På senare år har motsättningen mellan vardags- och boktal blivit allt tydligare insett. Denna fråga diskuteras särskilt skarpt bland metodologer som kräver en vändning i undervisningen mot det talade språket. Emellertid förblir särdragen hos vardagligt tal fortfarande oförklarad.

Ordböcker bearbetades genom att skapa en användarapplikation i miljön för kontorsprogrammet EXCEL97. Applikationen innehåller fyra kalkylblad i EXCEL-boken - "Title Sheet", "Dictionaries" ark med initiala data, "Proximities" och "Distances" med resultat, samt en uppsättning makron.

Den första informationen skrivs in på bladet "Ordböcker". Ordböcker av de studerade texterna skrivs in i EXCEL-celler, den sista kolumnen S bildas från de erhållna resultaten och är lika med antalet ord som finns i andra ordböcker. Tabellerna "Närhet" och "Avstånd" innehåller beräknade mått på närhet M, korrelation R och avstånd D.

Applikationsmakron är händelsebaserade programmeringsprocedurer skrivna i Visual Basic for Application (VBA). Procedurerna är baserade på VBA-biblioteksobjekt och deras bearbetningsmetoder. Så för operationer med applikationens kalkylblad används nyckelobjektet Kalkylblad (kalkylblad) och motsvarande metod för att aktivera bladet Aktivera (aktivera). Inställning av intervallet för de analyserade källdata på ordboksbladet utförs med Select-metoden för Range-objektet (intervall), och överföringen av ord som värden till variabler utförs som Value-egenskapen (värde) för samma Range objekt.

Trots att rangkorrelationsanalys gör oss försiktiga med ämnens beroende mellan olika texter, har de flesta av de vanligaste orden i varje text matchningar i en eller flera andra texter. Kolumn S visar antalet sådana ord bland de 15 vanligaste orden för varje författare. Ord i fet stil förekommer endast i en poets ord i vår tabell. Blok, Akhmatova och Petrovs har inga markerade ord alls, de har S = 15. Dessa tre poeter har samma 15 vanligaste ord, de skiljer sig bara åt på platsen i listan. Men även Pushkin, vars ordförråd är det mest originella, har S = 8, och det finns 7 markerade ord.

Resultaten visar att det finns ett visst lager av ordförråd som koncentrerar poesins huvudteman. Som regel är dessa ord korta: av det totala antalet (225) ordanvändningar av enstavig 88, tvåstavig 127, trestavig 10. Ofta representerar dessa ord huvudmytologerna och kan delas in i par: natt - dag, jord - himmel (sol), Gud - människa (människor), liv - död, kropp - själ, Rom - värld(vid Mandelstam); kan kombineras till mytologer på högre nivå: himmel, stjärna, sol, jord; hos en person sticker som regel kroppen, hjärtat, blodet, armen, benet, kinden, ögonen ut. Av de mänskliga tillstånden ges företräde åt sömn och kärlek. Huset och städerna tillhör den mänskliga världen - Moskva, Rom, Paris. Kreativitet representeras av lexem ord Och låt.

Griboedov och Lermontov har nästan inga ord som betecknar naturen bland de vanligaste orden. De har tre gånger så många ord som betecknar en person, delar av hans kropp, delar av hans andliga värld. Pushkin och poeter av det tjugonde århundradet. beteckningar på människa och natur är ungefär lika. I denna viktiga aspekt av ämnet kan vi säga att det tjugonde århundradet. följde efter Pushkin.

Minimalt tema fall bland de vanligaste orden finns det bara i Griboyedov och Pushkin. Lermontov och nittonhundratalets poeter. det ger vika för ett minimalt tema ord. Ordet utesluter inte gärningar (den bibliska tolkningen av ämnet: i Nya testamentet betraktas alla Jesu Kristi läror som Guds ord eller Jesu ord, och apostlarna kallar sig ibland Ordets tjänare). Den heliga innebörden av lexemordet manifesteras på ett övertygande sätt, till exempel i Pasternaks vers "Och världens bild, uppenbarad i Ordet". Den heliga betydelsen av lexem ord i samband med och kontrast till mänskliga angelägenheter manifesteras det på ett övertygande sätt i dikten med samma namn av Gumilyov.

Polletter som bara finns i en text kännetecknar originaliteten hos en given bok eller en samling böcker. Till exempel är ordet "mind" det vanligaste i Griboedovs komedi "Wee from Wit" - men det förekommer inte bland frekvensorden i andra texter. Sinnets tema är det överlägset viktigaste inom komedi. Detta lexem åtföljer bilden av Chatsky, och namnet på Chatsky är det vanligaste i komedi. Verket kombinerar alltså organiskt det vanligaste vanliga substantivet med det vanligaste egennamnet.

Den högsta korrelationskoefficienten förbinder teman i de tragiska böckerna "Eldpelaren" av Gumilyov och "Anno Domini MCMXXI" av Akhmatova. Bland de 15 vanligaste substantiven finns det 10 vanliga, inklusive blod, hjärta, själ, kärlek, ord, himmel. Kom ihåg att Akhmatovas bok inkluderade en miniatyr "Du kommer inte att leva ...", skriven mellan arresteringen av Gumilyov och hans avrättning.

Teman för ljuset och folkmassan i det studerade materialet finns endast i "Yuri Zhivagos dikter". Temat för ljuset i verserna från romanen har många kontextuella betydelser: det är förknippat med bilden av Jesus Kristus, med teman som tro, odödlighet, kreativitet, kärleksdatum. Ljuset är den viktigaste ljuskällan i romanens centrala scener. Temat för folkmassan utvecklas i samband med romanens huvudidé, där en persons privatliv med dess orubbliga värden står i motsats till den nya statens omoral, byggd på principerna om att behaga folkmassan .

Arbetet innefattar också det tredje steget, som också återspeglas i programmet, - detta är beräkningen av skillnaden i ordningstalet för ord som är gemensamma för två ordböcker och det genomsnittliga avståndet mellan samma ord i två ordböcker. Detta steg gör det möjligt att gå från de allmänna trenderna i interaktionen mellan ordböcker som identifieras med hjälp av statistik till en nivå som närmar sig texten. Till exempel korrelerar Gumilyovs och Akhmatovas böcker statistiskt signifikant. Vi tittar på vilka ord som visade sig vara vanliga för deras ordböcker, och först och främst väljer vi de vars serienummer skiljer sig minimalt eller lika med noll. Det är dessa ord som har samma rangnummer och följaktligen är det dessa minimala teman i de två poeternas medvetande som är lika viktiga. Därefter bör du gå till nivån för texter och sammanhang.

Kvantitativa metoder hjälper också till att studera egenskaperna hos folk - modersmålstalare. Säg, det finns 6 fall på ryska, det finns inga fall på engelska, och på vissa språk av folket i Dagestan når antalet fall 40. L. Perlovsky i sin artikel "Medvetande, språk och kultur" korrelerar dessa egenskaper med folkens tendens till individualism eller kollektivism, med uppfattning om saker och fenomen separat eller i samband med andra. Det var trots allt i den engelsktalande världen (det finns inga fall - saken uppfattas "av sig själv") som begrepp som individuell frihet, liberalism och demokrati dök upp (jag noterar att jag använder dessa begrepp endast i samband med språk, utan några utvärderande egenskaper). Trots det faktum att sådana gissningar fortfarande bara förblir på nivån av djärva vetenskapliga hypoteser, hjälper de till att titta på redan bekanta fenomen på ett nytt sätt.

Som vi kan se kan kvantitativa egenskaper appliceras inom helt andra områden av lingvistiken, vilket alltmer suddar ut gränserna mellan "exakta" och "humanitära" metoder. Lingvistik tar allt mer till hjälp av inte bara matematik, utan även datorteknik för att lösa sina problem.

2.3 Att lära sig språket med metoder för formell logik

Med icke-kvantitativa metoder för matematik, i synnerhet med logik, samverkar modern teoretisk lingvistik inte mindre fruktbart än med kvantitativa. Den snabba utvecklingen av datorteknik och tillväxten av deras roll i den moderna världen krävde en översyn av synen på samspelet mellan språk och logik i allmänhet.

Logikmetoderna används i stor utsträckning i utvecklingen av formaliserade språk, i synnerhet programmeringsspråk, vars element är några symboler (liknande matematiska), valda (eller konstruerade från tidigare valda symboler) och tolkade på ett visst sätt, associerade utan "traditionell" användning, förståelse och förståelse.funktioner av samma symboler i andra sammanhang. En programmerare sysslar ständigt med logik i sitt arbete. Meningen med programmering är bara att lära datorn att resonera (i ordets vidaste bemärkelse). Samtidigt visar sig metoderna för att "resonera" vara väldigt olika. Varje programmerare lägger en viss tid på att leta efter buggar i sina egna och andras program. Det vill säga att söka efter fel i resonemang, i logik. Och detta sätter också sina spår. Det är mycket lättare att upptäcka logiska fel i vanligt tal. Den relativa enkelheten hos språken som studeras av logiker gör att de kan belysa strukturerna för dessa språk tydligare än vad som är möjligt för lingvister som analyserar uteslutande komplexa naturliga språk. Med tanke på det faktum att de språk som studeras av logiker använder relationer kopierade från naturliga språk, kan logiker ge betydande bidrag till den allmänna teorin om språk. Situationen här liknar den som sker inom fysiken: fysikern formulerar också satser för idealiskt förenklade fall som inte alls förekommer i naturen - han formulerar lagar för idealgaser, idealvätskor, talar om rörelse i frånvaro av friktion, etc. För dessa idealiserade fall kan enkla lagar fastställas som i hög grad skulle bidra till förståelsen av vad som händer i verkligheten och vad som förmodligen skulle förbli okänt för fysiken om den försökte betrakta verkligheten direkt, i all dess komplexitet.

I studiet av naturliga språk används logiska metoder så att språkinlärare inte dumt kan "memorera" så många ord som möjligt, utan bättre förstå dess struktur. L. Shcherba använde också i sina föreläsningar ett exempel på en mening byggd enligt det ryska språkets lagar: "Den glittrande kuzdra shteko satte bokran och krullar bokran", och frågade sedan eleverna vad detta betydde. Trots att innebörden av orden i meningen förblev oklar (de existerar helt enkelt inte på ryska), var det möjligt att tydligt svara: "kuzdra" är ämnet, ett feminint substantiv, i singularis, nominativ, " bokr” är animerad osv. Översättningen av frasen visar sig vara ungefär så här: "Något feminint i ett svep gjorde något mot någon slags manlig varelse och började sedan göra något så här för en lång, gradvis en med sin unge." Ett liknande exempel på en text (konstnärlig) från icke-existerande ord, byggd helt enligt språkets lagar, är Lewis Carrolls Jabberwock (i Alice i Underlandet förklarar Carroll, genom sin karaktär Humpty Dumpty, betydelsen av orden han uppfann: "kokt" - klockan åtta på kvällen, när det är dags att laga middag, "chlivky" - tunn och skicklig, "shorek" - en korsning mellan en iller, en grävling och en korkskruv, "dyk" - ​​hoppa, dyka, snurra, "nava" - gräs under soluret (sträcker sig lite till höger, lite till vänster och lite bakåt), "grunt" - grymta och skratta, "zelyuk" - en grön kalkon, "myumzik" - en fågel; hennes fjädrar är rufsig och sticker ut i alla riktningar, som en kvast, "mova" - långt hemifrån) .

Ett av huvudkoncepten för modern logik och teoretisk lingvistik, som används i studien av språk av olika logiska och matematiska kalkyler, naturliga språk, för att beskriva förhållandet mellan språk på olika "nivåer" och för att karakterisera förhållandet mellan språk under övervägande och de ämnesområden som beskrivs med deras hjälp, är begreppet metaspråk. Ett metaspråk är ett språk som används för att uttrycka bedömningar om ett annat språk, språkobjektet. Med hjälp av ett metaspråk studerar de strukturen för teckenkombinationer (uttryck) av språkobjektet, bevisar satser om dess uttrycksegenskaper, om dess relation till andra språk etc. Språket som studeras kallas även ämnesspråk i förhållande till detta metaspråk. Både ämnesspråket och metaspråket kan vara vanliga (naturliga) språk. Metaspråket kan skilja sig från objektspråket (till exempel i en engelsk lärobok för ryska är ryska metaspråket och engelska är objektspråket), men det kan också sammanfalla med det eller bara skilja sig delvis, till exempel i speciell terminologi (Rysk lingvistisk terminologi är en del av metaspråket för att beskriva det ryska språket, de så kallade semantiska faktorerna är en del av metaspråket för att beskriva naturliga språks semantik).

Begreppet "metalinguage" har blivit mycket fruktbart i samband med studiet av formaliserade språk som är byggda inom ramen för matematisk logik. Till skillnad från formaliserade ämnesspråk är i detta fall metaspråket, med vilket metateorin formuleras (att studera egenskaperna hos ämnesteorin formulerad på ämnesspråket), i regel ett vanligt naturligt språk, på något speciellt sätt ett fragment av ett naturligt språk begränsat på ett speciellt sätt, som inte innehåller någon form av tvetydighet., metaforer, "metafysiska" begrepp, etc. element av vanligt språk som hindrar dess användning som ett verktyg för korrekt vetenskaplig forskning. Samtidigt kan själva metaspråket formaliseras och (oavsett detta) bli föremål för forskning som bedrivs med hjälp av metaspråket, och en sådan serie kan ”tänkas” växa i all oändlighet.

Logiken lär oss en fruktbar skillnad mellan språkobjektet och metaspråket. Språkobjektet är själva ämnet för logisk forskning, och metaspråket är det oundvikligen konstgjorda språk som sådan forskning bedrivs på. Logiskt tänkande består bara i att formulera relationerna och strukturen hos ett verkligt språk (objektspråk) på symbolspråket (metaspråk).

Metaspråket måste i alla fall vara "inte fattigare" än dess objektiva språk (dvs. för varje uttryck av det senare i metaspråket måste det finnas dess namn, "översättning") - annars, om dessa krav inte uppfylls (vilket säkerligen kräver plats i naturliga språk, om särskilda överenskommelser inte föreskriver annat) uppstår semantiska paradoxer (antinomier).

När fler och fler nya programmeringsspråk skapades, i samband med problemet med programmeringsöversättare, fanns det ett akut behov av att skapa metaspråk. För närvarande är Backus-Naur-formen metaspråk (förkortat BNF) det vanligaste för att beskriva syntaxen för programmeringsspråk. Det är en kompakt form i form av vissa formler som liknar matematiska. För varje begrepp i språket finns det en unik metaformel (normal formel). Den består av vänster och höger delar. Den vänstra sidan anger begreppet som definieras, och den högra anger uppsättningen av tillåtna språkkonstruktioner som kombineras i detta begrepp. Formeln använder speciella metatecken i form av vinkelparenteser, som innehåller begreppet som definieras (på vänster sida av formeln) eller ett tidigare definierat begrepp (på dess högra sida), och separationen mellan vänster och höger del anges med "::="-metatecken, vars betydelse är likvärdig med orden "per definition finns det". Metalinguistiska formler är inbäddade i översättare i någon form; med deras hjälp kontrolleras konstruktionerna som används av programmeraren för formell överensstämmelse med någon av de konstruktioner som är syntaktiskt giltiga i detta språk. Det finns också separata metaspråk för olika vetenskaper - sålunda finns kunskap i form av olika metaspråk.

Logiska metoder fungerade också som grunden för skapandet av artificiell intelligens baserade på begreppet kopplingism. Connectionism är en speciell trend inom filosofisk vetenskap, vars ämne är kunskapsfrågor. Inom ramen för denna trend görs försök att förklara de intellektuella förmågorna hos en person som använder artificiella neurala nätverk. Bestående av ett stort antal strukturella enheter som liknar neuroner, med en vikt tilldelad varje element som bestämmer styrkan i sambandet med andra element, är neurala nätverk förenklade modeller av den mänskliga hjärnan. Experiment med neurala nätverk av detta slag har visat deras förmåga att lära sig utföra uppgifter som mönsterigenkänning, läsning och identifiering av enkla grammatiska strukturer.

Filosofer började intressera sig för konnektionism, eftersom det konnektionistiska tillvägagångssättet lovade att tillhandahålla ett alternativ till den klassiska teorin om sinnet och den idé som allmänt hålls inom denna teori att sinnets funktion liknar bearbetningen av symbolspråk av en digital dator. Detta koncept är mycket kontroversiellt, men på senare år har det fått fler och fler anhängare.

Den logiska studien av språket fortsätter Saussures koncept om språket som ett system. Det faktum att det ständigt fortsätter bekräftar återigen djärvheten i vetenskapliga gissningar från början av förra seklet. Jag kommer att ägna det sista avsnittet av mitt arbete åt utsikterna för utvecklingen av matematiska metoder inom lingvistik idag.

2.4 Utsikter för tillämpning av matematiska metoder inom lingvistik

I datateknikens tidevarv har matematisk lingvistiks metoder fått ett nytt utvecklingsperspektiv. Sökandet efter lösningar på problemen med språklig analys implementeras nu alltmer på informationssystemnivå. Samtidigt ställer automatisering av processen för bearbetning av språkligt material, vilket ger forskaren betydande möjligheter och fördelar, oundvikligen nya krav och uppgifter för honom.

Kombinationen av "exakt" och "humanitär" kunskap har blivit grogrund för nya upptäckter inom lingvistik, datavetenskap och filosofi.

Maskinöversättning från ett språk till ett annat är fortfarande en snabbt växande gren av informationsteknologi. Trots att datorstödd översättning aldrig kan jämföras i kvalitet med mänsklig översättning (särskilt för litterära texter) har maskinen blivit en oumbärlig assistent för en person vid översättning av stora textvolymer. Man tror att inom en snar framtid kommer mer avancerade översättningssystem att skapas, baserade i första hand på den semantiska analysen av texten.

Ett lika lovande område är samspelet mellan lingvistik och logik, som fungerar som en filosofisk grund för att förstå informationsteknologi och den så kallade "virtuella verkligheten". Inom en snar framtid kommer arbetet att fortsätta med skapandet av artificiell intelligens - även om det, återigen, aldrig kommer att vara lika med människan i sina förmågor. Sådan konkurrens är meningslös: i vår tid borde maskinen inte bli (och blir) en rival, utan en assistent till människan, inte något från fantasins rike, utan en del av den verkliga världen.

Studiet av språket med statistiska metoder fortsätter, vilket gör det möjligt att mer exakt bestämma dess kvalitativa egenskaper. Det är viktigt att de mest vågade hypoteserna om språk finner sitt matematiska, och därför logiska, bevis.

Det viktigaste är att olika grenar av matematikens tillämpning inom lingvistik, tidigare ganska isolerade, under de senaste åren har korrelerats med varandra, kopplat till ett sammanhängande system, i analogi med det språksystem som upptäcktes för ett sekel sedan av Ferdinand de Saussure och Yvan Baudouin de Courtenay. Detta är kontinuiteten i vetenskaplig kunskap.

Lingvistik i den moderna världen har blivit grunden för utvecklingen av informationsteknologi. Så länge datavetenskap förblir en snabbt växande gren av mänsklig verksamhet, kommer föreningen av matematik och lingvistik att fortsätta att spela sin roll i utvecklingen av vetenskap.

Slutsats

Under 1900-talet har datortekniken kommit långt - från militär till fredlig användning, från ett snävt spektrum av mål till penetration i alla grenar av mänskligt liv. Matematik som vetenskap fick ständigt ny praktisk betydelse med utvecklingen av datateknik. Denna process fortsätter idag.

Det tidigare otänkbara "tandemet" av "fysiker" och "textförfattare" har blivit verklighet. För den fulla interaktionen mellan matematik och datavetenskap med humaniora krävdes kvalificerade specialister från båda sidor. Medan datavetare i allt högre grad är i behov av systematisk humanitär kunskap (lingvistisk, kulturell, filosofisk) för att förstå förändringar i verkligheten kring dem, i samspelet mellan människa och teknik, för att utveckla fler och fler nya språkliga och mentala begrepp, att skriva program, då måste alla "Humaniora" i vår tid för sin professionella tillväxt behärska åtminstone grunderna i att arbeta med en dator.

Matematik, som är nära sammankopplad med informatik, fortsätter att utvecklas och samverka med naturvetenskap och humaniora. Under det nya århundradet försvagas inte trenden mot matematisering av vetenskapen, utan tvärtom ökar. På grundval av kvantitativa data förstås lagarna för språkets utveckling, dess historiska och filosofiska egenskaper.

Matematisk formalism är mest lämpad för att beskriva mönster inom lingvistik (liksom i andra vetenskaper - både humaniora och naturvetenskap). Situationen utvecklas ibland inom vetenskapen på ett sådant sätt att utan användning av ett lämpligt matematiskt språk är det omöjligt att förstå naturen av fysisk, kemisk, etc. processen är inte möjlig. Att skapa en planetmodell av atomen, den berömda engelska fysikern från XX-talet. E. Rutherford upplevde matematiska svårigheter. Till en början accepterades inte hans teori: det lät inte övertygande, och anledningen till detta var Rutherfords okunnighet om sannolikhetsteorin, på grundval av mekanismen för vilken det bara var möjligt att förstå modellrepresentationen av atomära interaktioner. Redan vid den tiden insåg en framstående vetenskapsman, ägaren av Nobelpriset, sig till seminariet för matematikern professor Lamb och under två år, tillsammans med studenterna, deltog i en kurs och arbetade ut en workshop om sannolikhetsteorin . Utifrån det kunde Rutherford beskriva elektronens beteende, vilket gav sin strukturella modell övertygande noggrannhet och fick erkännande. Detsamma är med lingvistik.

Detta väcker frågan, vad är så matematiskt i objektiva fenomen, tack vare vilket de kan beskrivas på matematikens språk, på språket för kvantitativa egenskaper? Dessa är homogena enheter av materia fördelade i rum och tid. De vetenskaper som har gått längre än andra mot isolering av homogenitet och visar sig vara bättre lämpade för användningen av matematik i dem.

Internet, som utvecklades snabbt på 1990-talet, samlade representanter för olika länder, folk och kulturer. Trots att engelska fortsätter att vara huvudspråket för internationell kommunikation har Internet blivit flerspråkigt i vår tid. Detta ledde till utvecklingen av kommersiellt framgångsrika maskinöversättningssystem som används i stor utsträckning inom olika områden av mänsklig aktivitet.

Datornätverk har blivit ett objekt för filosofisk reflektion – fler och fler nya språkliga, logiska, världsbildsbegrepp har skapats som hjälper till att förstå "virtuell verklighet". I många konstverk skapades scenarier - oftare pessimistiska - om maskiners dominans över en person, och virtuell verklighet - över omvärlden. Långt ifrån alltid visade sig sådana prognoser vara meningslösa. Informationsteknologi är inte bara en lovande bransch för att investera mänsklig kunskap, det är också ett sätt att kontrollera information och, följaktligen, över mänskligt tänkande.

Detta fenomen har både en negativ och en positiv sida. Negativt – eftersom kontroll över information strider mot den oförytterliga mänskliga rätten till fri tillgång till den. Positivt - eftersom avsaknaden av denna kontroll kan leda till katastrofala konsekvenser för mänskligheten. Det räcker med att påminna om en av det senaste decenniets klokaste filmer - "When the World Ends" av Wim Wenders, vars karaktärer är helt nedsänkta i den "virtuella verkligheten" av sina egna drömmar inspelade på en dator. Men inte en enda vetenskapsman och inte en enda konstnär kan ge ett entydigt svar på frågan: vad som väntar vetenskap och teknik i framtiden.

Att fokusera på "framtiden", som ibland förefaller fantastiskt, var ett utmärkande drag för vetenskapen i mitten av nittonhundratalet, när uppfinnare försökte skapa perfekta modeller av teknik som kunde fungera utan mänsklig inblandning. Tiden har visat den utopiska karaktären hos sådan forskning. Det skulle dock vara överflödigt att fördöma forskare för detta - utan deras entusiasm på 1950- och 60-talen skulle informationsteknologin inte ha gjort ett så kraftfullt språng på 90-talet, och vi skulle inte ha det vi har nu.

De sista decennierna av 1900-talet förändrade vetenskapens prioriteringar - forskning, uppfinningsrik patos gav plats för kommersiellt intresse. Återigen, detta är varken bra eller dåligt. Detta är en verklighet där vetenskapen alltmer integreras i vardagen.

2000-talet har fortsatt denna trend, och i vår tid bakom uppfinningar ligger inte bara berömmelse och erkännande, utan först och främst pengar. Det är också därför det är viktigt att se till att de senaste landvinningarna inom vetenskap och teknik inte hamnar i händerna på terroristgrupper eller diktatoriska regimer. Uppgiften är svår till den grad omöjlig; att förverkliga det så mycket som möjligt är hela världssamfundets uppgift.

Information är ett vapen, och vapen är inte mindre farliga än kärnvapen eller kemiska vapen - bara det verkar inte fysiskt utan snarare psykiskt. Mänskligheten måste tänka på vad som är viktigare för den i det här fallet – frihet eller kontroll.

De senaste filosofiska begreppen relaterade till utvecklingen av informationsteknologi och ett försök att förstå dem har visat begränsningarna för både naturvetenskaplig materialism, som dominerade under 1800- och början av 1900-talet, och extrem idealism, som förnekar den materiella världens betydelse. . Det är viktigt för det moderna tänkandet, särskilt västerlandets tanke, att övervinna denna dualism i tänkandet, när omvärlden är tydligt uppdelad i materiellt och ideal. Vägen dit är en dialog mellan kulturer, en jämförelse av olika synpunkter på de omgivande fenomenen.

Paradoxalt nog kan informationsteknologi spela en viktig roll i denna process. Datornätverk, och särskilt Internet, är inte bara en resurs för underhållning och kraftfull kommersiell verksamhet, de är också ett sätt för meningsfull, kontroversiell kommunikation mellan representanter för olika civilisationer i den moderna världen, såväl som för en dialog mellan det förflutna och nuet. Vi kan säga att Internet tänjer på de rumsliga och tidsmässiga gränserna.

Och i dialogen mellan kulturer genom informationsteknologi är språkets roll som det äldsta universella kommunikationsmedlet fortfarande viktig. Det är därför lingvistik, i samspel med matematik, filosofi och datavetenskap, har upplevt sin andra födelse och fortsätter att utvecklas idag. Nutidens trend kommer att fortsätta i framtiden - "till världens ände", som för 15 år sedan, förutspådde samma V. Wenders. Det är visserligen inte känt när detta slut kommer att inträffa - men är det viktigt nu, eftersom framtiden förr eller senare kommer att bli nuet ändå.

Bilaga 1

Ferdinand de Saussure

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses allmänt vara grundaren av modern lingvistik i sina försök att beskriva språkets struktur snarare än historien om särskilda språk och språkformer. I själva verket finner strukturalismens metod inom lingvistik och litteraturvetenskap och en betydande gren av semiotik sin stora utgångspunkt i hans arbete vid sekelskiftet av 1900-talet. Det har till och med hävdats att komplexet av strategier och föreställningar som har kommit att kallas "poststrukturalism" - arbetet av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra - föreslås av Saussures arbete i lingvistik och anagrammatisk läsning av sen latinsk poesi, litterär modernism till psykoanalys och filosofi i början av nittonhundratalet. Som Algirdas Julien Greimas och Joseph Courtés argumenterar i Semiotics and Language: An Analytic Dictionary, under rubriken "Interpretation", uppstod ett nytt tolkningssätt i början av 1900-talet som de identifierar med saussureansk lingvistik, husserliansk fenomenologi och freudiansk psykoanalys. I detta läge är "tolkning inte längre en fråga om att tillskriva ett givet innehåll till en form som annars skulle sakna en, snarare är det en omskrivning som på ett annat sätt formulerar det ekvivalenta innehållet i ett betecknande element inom ett givet semiotiskt system" ( 159). i denna förståelse av "tolkning" är form och innehåll inte distinkta; snarare är varje "form" alternativt också ett semantiskt "innehåll", en "signifierande form", så att tolkningen erbjuder en analogisk omskrivning av något som redan betyder inom något annat system av signifikans.

En sådan omtolkning av form och förståelse - som Claude Lévi-Strauss beskriver i en av sina mest programmatiska artikulationer av begreppet strukturalism, i "Structure and Form: Reflections on a Work by Vladimir Propp" - är implicit i Saussures postuma kurs. i allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure relativt lite, och hans huvudverk, Kursen, var hans studenters transkription av flera kurser i allmän lingvistik som han erbjöd 1907-11. I kursen efterlyste Saussure den "vetenskapliga" studien av språket i motsats till det arbete inom historisk lingvistik som hade utförts på 1800-talet. Det arbetet är en av det västerländska intellektets stora landvinningar: att ta särskilda ord som byggstenar i språk, historisk (eller "diakronisk") lingvistik spårade ursprunget och utvecklingen av västerländska språk från en förmodad gemensam språkkälla, först ett "indoeuropeiskt" språk och sedan ett tidigare "p roto-indoeuropeiskt" språk.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement", som Saussure ifrågasatte. Hans arbete var ett försök att reducera mängden fakta om språk, studerad så noggrant av historisk lingvistik, till ett hanterbart antal påståenden. Den "jämförande skolan" för 1800-talets filologi, säger Saussure i Kursen, "lyckades inte med att upprätta den sanna vetenskapen om lingvistik" eftersom "den misslyckades med att söka upp naturen hos sitt studieobjekt" (3). Denna "natur", hävdar han, återfinns inte bara i de "elementala" orden som ett språk innehåller - språkets skenbara "positiva" fakta (eller "substanser") - utan i de formella relationer som ger upphov till dessa "ämnen."

Saussures systematiska omprövning av språk bygger på tre antaganden. Det första är att det vetenskapliga studiet av språk behöver utveckla och studera systemet snarare än språkfenomens historia. Av denna anledning skiljer han mellan språkets särskilda förekomster - dess speciella "talhändelser", som han betecknar som villkorlig frigivning - och det egentliga föremålet för lingvistik, systemet (eller "koden") som styr dessa händelser, som han betecknar som langue. En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element vid ett visst ögonblick snarare än den "diakroniska" studien av språkets utveckling genom historien.

Detta antagande gav upphov till vad Roman Jakobson 1929 kom att beteckna som "strukturalism", där "varje uppsättning fenomen som granskas av samtida vetenskap behandlas inte som en mekanisk agglomeration utan som en strukturell helhet, den mekaniska uppfattningen av processer ger efter för frågan. av deras funktion" ("Romantic" 711). I denna passage uttrycker Jakobson Saussures avsikt att definiera lingvistik som ett vetenskapligt system i motsats till en enkel, "mekanisk" redovisning av historiska olyckor. Tillsammans med detta beskriver Jakobson också det andra grundläggande antagandet i Saussurean - vi kan kallar det nu "strukturellt" - lingvistik: att språkets grundläggande element endast kan studeras i relation till deras funktioner snarare än i förhållande till deras orsaker. Europeiska "ord"), dessa händelser och enheter måste placeras inom ett systemiskt ramverk där de är relaterade till andra så kallade händelser och entiteter. Detta är en radikal omorientering i uppfattningen av erfarenhet och fenomen, en vars betydelse filosofen Ernst Cassirer har jämfört med "den nya vetenskapen om Galileo som på 1600-talet förändrade hela vår begreppet den fysiska världen" (citerad i Culler, Pursuit 2 4). Denna förändring, som Greimas och Courtés noterar, återuppfattar "tolkning" och återuppfattar således själva förklaring och förståelse. Istället för att förklaringen "är i termer av ett fenomens orsaker, så att det som "effekt" på något sätt är underordnat dess orsaker, består förklaringen här i att underordna ett fenomen dess framtidsorienterade "funktion" eller "syfte." Förklaring är inte längre oberoende av mänskliga avsikter eller syften (även om dessa avsikter kan vara opersonliga, gemensamma eller, i freudianska termer, "omedvetna").

I sin lingvistik åstadkommer Saussure denna omvandling specifikt i omdefinieringen av det språkliga "ordet", som han beskriver som det språkliga "tecknet" och definierar i funktionalistiska termer. Tecknet, hävdar han, är föreningen av "ett koncept och en ljudbild", som han kallade "signified and signifier" (66-67; Roy Harriss översättning från 1983 erbjuder termerna "signification" och "signal"). Naturen av deras "kombination" är "funktionell" i det att varken den betecknade eller betecknaren är den andras "orsak"; snarare "var och en av sina värden från den andra" (8). språkelementet, tecknet , relationellt och gör det grundläggande antagandet om historisk lingvistik, nämligen identiteten för de elementära enheterna av språk och betydelse (d.v.s. "ord"), föremål för rigorös analys. Ordet "träd" som "samma" ord är inte pga. ordet definieras av inneboende kvaliteter - det är inte en "mekanisk agglomeration" av sådana kvaliteter - utan för att det definieras som ett element i ett system, språkets "strukturella helhet".

En sådan relationell (eller "diakritisk") definition av en entitet styr uppfattningen av alla element i språket i strukturell lingvistik. Detta är tydligast i den mest imponerande bedriften inom saussureansk lingvistik, utvecklingen av begreppen "fonem" och "särskiljande drag" av språket. Fonemen är de minsta artikulerade och betecknande enheterna i ett språk. Det är inte de ljud som förekommer i språket utan de "ljudbilder" Saussure nämner, som uppfattas av talare - fenomenalt uppfattade - som förmedlande mening. (Elmar Holenstein beskriver således Jakobsons lingvistik, som följer Saussure på viktiga sätt, som "fenomenologisk strukturalism".) Det är av denna anledning som den ledande talespersonen för Prags skolstrukturalism, Jan Mukarovsky, 1937 noterade att "struktur . . . är en fenomenologisk och inte en empirisk verklighet; det är inte själva verket, utan en uppsättning funktionella relationer som är belägna i ett kollektivs medvetande (generation, miljö, etc.)" (citerad i Galan 35). Likaså Lévi-Strauss, den ledande talespersonen för fransk strukturalism , noterade 1960 att "struktur har inget distinkt innehåll; den nöjer sig själv, och den logiska organisationen i vilken den är arresterad är tänkt som en egenskap hos det verkliga" (167; se även Jakobson, Fundamentals 27-28).

Fonemen, alltså de minsta märkbara elementen i språket, är inte positiva objekt utan en "fenomenologisk verklighet". På engelska, till exempel, kan fonemet /t/ uttalas på många olika sätt, men i alla fall kommer en engelsktalande att känna igen det som ett /t/. Ett aspirerat t (d.v.s. ett t uttalas med ett h-liknande andetag efter det), ett högt eller lågt t-ljud, ett utökat t-ljud, och så vidare, kommer alla att fungera på samma sätt för att urskilja betydelsen av "att" och "göra" på engelska. Dessutom är skillnaderna mellan språk sådana att fonologiska variationer i ett språk kan utgöra distinkta fonem i ett annat; sålunda skiljer engelska mellan /l/ och /r/, medan andra språk är så strukturerade att dessa artikulationer anses vara varianter av samma fonem (som den aspirerade och unaspirated t på engelska). I varje naturligt språk är det stora antalet möjliga ord en kombination av ett litet antal fonem. Engelska, till exempel, har mindre än 40 fonem som tillsammans bildar över en miljon olika ord.

Språkets fonem är i sig systematiskt organiserade strukturer av egenskaper. På 1920- och 1930-talen, efter Saussures ledning, isolerade Jakobson och N. S. Trubetzkoy de "särdragen" hos fonem. Dessa egenskaper är baserade på den fysiologiska strukturen hos talorganen - tunga, tänder, stämband och så vidare - att Saussure nämner i Kursen och som Harris beskriver som "fysiologisk fonetik" (39; Baskins tidigare översättning använder termen "fonologi" [(1959) 38]) - och de kombineras i "buntar" av binära oppositioner för att bilda fonem. Till exempel på engelska är skillnaden mellan /t/ och /d/ närvaron eller frånvaron av "röst" (engagerandet av stämbanden), och på röstnivån definierar dessa fonem varandra ömsesidigt. På så sätt är fonologi ett specifikt exempel på en allmän språkregel som beskrivs av Saussure: I språket finns bara skillnader. ännu viktigare: en skillnad innebär i allmänhet positiva termer mellan vilka skillnaden är satt upp; men i språket finns det bara skillnader utan positiva termer. Oavsett om vi tar det betecknade eller betecknaren, har språket varken idéer eller ljud som fanns före det språkliga systemet. ( 120)

Inom detta ramverk bestäms språkliga identiteter inte av inneboende kvaliteter utan av systemiska ("strukturella") relationer.

Jag har sagt att fonologin "följde ledningen" av Saussure, för även om hans analys av språkproduktionens fysiologi "nuförtiden", som Harris säger, "skulle kallas "fysisk" i motsats till antingen "psykologisk" eller "funktionell". "" (Läsning 49), följaktligen formulerade han i kursen riktningen och konturerna för en funktionell analys av språket. Likaså var hans enda utökade publicerade verk, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir om det primitiva systemet av vokaler i indoeuropeiska språk), som publicerades 1878, helt och hållet beläget i projektet för nittonde- talets historiska lingvistik. Icke desto mindre, inom detta arbete, som Jonathan Culler har hävdat, visade Saussure "fruktbarheten av att tänka på språket som ett system av rent relationella föremål, även när han arbetade med uppgiften att historiska återuppbyggnaden" (Saussure 66). Genom att analysera de systematiska strukturella sambanden mellan fonem för att redogöra för mönster av vokalväxling i befintliga indoeuropeiska språk, föreslog Saussure att det utöver flera olika fonem /a/ måste ha funnits ett annat fonem som skulle kunna beskrivas formellt. "Det som gör Saussures arbete så mycket imponerande," avslutar Culler, "är det faktum att nästan femtio år senare, när kilskrift Hettite upptäcktes och dechiffrerades, visade sig det innehålla ett fonem, skrivet h, som betedde sig som Saussure hade förutspått. . Han hade upptäckt, genom en rent formell analys, vad som nu är känt som struphuvudet hos indoeuropeiska" (66).

Denna uppfattning om den relationella eller diakritiska bestämningen av betydelsens element, som är både implicit och explicit i kursen, antyder ett tredje antagande som styr strukturell lingvistik, vad Saussure kallar "tecknets godtyckliga natur". Med detta menar han att förhållandet mellan betecknare och betecknat i språket aldrig är nödvändigt (eller "motiverat"): man skulle lika gärna kunna hitta ljudbetecknaren arbre som betecknarträdet för att förena sig med begreppet "träd". Men mer än detta betyder det att det betecknade också är godtyckligt: ​​man skulle lika lätt kunna definiera begreppet "träd" genom dess vedartade kvalitet (vilket skulle utesluta palmer) som genom dess storlek (vilket utesluter de "låga vedartade växterna" vi ring buskar). Detta bör klargöra att numreringen av antaganden jag har presenterat inte representerar en prioritetsordning: varje antagande - den systemiska karaktären av signifikans (bäst uppfattas genom att studera språket "synkront"), den relationella eller "diakritiska" naturen hos elementen av betydelse, teckenens godtyckliga natur - får sitt värde från de andra.

Det vill säga, saussureansk lingvistik de fenomen den studerar i övergripande relationer av kombination och kontrast i språk. I denna uppfattning är språk både processen att artikulera mening (betydelse) och dess produkt (kommunikation), och dessa två språkfunktioner är varken identiska eller helt kongruenta (se Schleifer, "Dekonstruktion"). Här kan vi se den växling mellan form och innehåll som Greimas och Courtés beskriver i modernistisk tolkning: språket presenterar kontraster som formellt definierar dess enheter, och dessa enheter kombineras på efterföljande nivåer för att skapa det betecknande innehållet. Eftersom språkets beståndsdelar är godtyckliga kan dessutom varken kontrast eller kombination sägas vara grundläggande. Sålunda, i språket kombineras särdrag för att bilda kontrasterande fonem på en annan nivå av uppfattning, fonem kombineras för att bilda kontrasterande morfem, morfem kombineras för att bilda ord, ord kombineras för att bilda meningar, och så vidare. I varje fall är hela fonemet, eller ordet, eller meningen, och så vidare, större än summan av dess delar (precis som vatten, H2O, i Saussures exempel [(1959) 103] är mer än den mekaniska agglomerationen av väte och syre).

De tre antagandena i kursen i allmän lingvistik ledde till att Saussure efterlyste en ny vetenskap från 1900-talet som skulle gå utöver språkvetenskapen för att studera "teckens liv i samhället." Saussure kallade denna vetenskap "semiologi (från grekiska semeîon "tecken")" (16). "Vetenskapen" om semiotik, som den kom att praktiseras i Östeuropa på 1920- och 1930-talen och Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära artefakter som konstituerades (eller artikulerades) av dessa strukturer. Under hela den sena delen av sin karriär, även när han erbjöd kurserna i allmän lingvistik, fortsatte Saussure sin egen "semiotiska" analys av sen latinsk poesi i ett försök att upptäcka medvetet dolda anagram av egennamn. Studiemetoden var på många sätt motsatsen till den funktionella rationalismen i hans språkliga analyser: den försökte, som Saussure nämner i en av de 99 anteckningsböcker där han genomförde denna studie, att systematiskt undersöka problemet med "slumpen", som " blir den oundvikliga grunden för allt" (citerad i Starobinski 101). En sådan studie, som Saussure själv säger, fokuserar på "det materiella faktum" av slump och mening (citerad 101), så att "temaordet" vars anagram Saussure söker, som Jean Starobinski hävdar, "är, för poeten , ett instrument och inte en livsviktig grodd till dikten. Dikten krävs för att återanvända temaordets ljudmaterial" (45). I denna analys säger Starobinski: "Saussure förlorade inte sig själv i ett sökande efter dolda betydelser." Istället tycks hans arbete visa en önskan att undvika alla problem som uppstår ur medvetandet: "Eftersom poesi inte bara förverkligas i ord utan är något som föds ur ord, undkommer den medvetandets godtyckliga kontroll för att enbart vara beroende av en sorts språklig laglighet "(121).

Det vill säga Saussures försök att upptäcka egennamn i sen latinsk poesi - vad Tzvetan Todorov kallar förminskningen av ett "ord . . . till dess signifier" (266) - understryker ett av de element som styrde hans språkliga analys, tecknets godtyckliga natur. (Det understryker också den formella karaktären hos Saussurean lingvistik - "Språk", hävdar han, "är en form och inte en substans" - som effektivt eliminerar semantik som ett huvudobjekt för analys.) Som Todorov avslutar framstår Saussures arbete anmärkningsvärt homogent idag i sin vägran att acceptera symboliska fenomen. . . . I sin forskning om anagram uppmärksammar han endast fenomenen med upprepning, inte till evokationsfenomen. . . . I sina studier av Nibelungen känner han igen symboler endast för att hänföra dem till felaktiga läsningar: eftersom de inte är avsiktliga existerar inte symboler. Slutligen i sina kurser om allmän lingvistik, överväger han existensen av semiologi, och därmed av andra tecken än lingvistiska; men denna bekräftelse begränsas på en gång av det faktum att semiologin är ägnad åt en enda typ av tecken: de som är godtyckliga. (269-70)

Om detta är sant, beror det på att Saussure inte kunde tänka sig "avsikt" utan ett ämne; han kunde inte riktigt undkomma motsättningen mellan form och innehåll, hans verk gjorde så mycket för att ifrågasätta. Istället tog han till "språklig laglighet". Ligger mellan å ena sidan 1800-talets föreställningar om historia, subjektivitet och sättet för kausal tolkning som styrs av dessa föreställningar och å andra sidan 1900-talets "strukturalistiska" föreställningar om vad Lévi-Strauss kallade "kantianism utan ett transcendentalt subjekt" (citerat i Connerton 23) - begrepp som raderar motsättningen mellan form och innehåll (eller subjekt och objekt) och hierarkin av förgrund och bakgrund i fullskalig strukturalism, psykoanalys och till och med kvantmekanik - Ferdinands verk de Saussure i lingvistik och semiotik avgränsar ett signalmoment i studiet av mening och kultur.

Ronald Schleifer

Bilaga 2

Ferdinand de Saussure (översättning)

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses vara grundaren av modern lingvistik - tack vare hans försök att beskriva språkets struktur, snarare än historien om enskilda språk och ordformer. I stort sett lades grunden för strukturella metoder inom lingvistik och litteraturkritik och i stor utsträckning semiotik i hans verk redan i början av 1900-talet. Det är bevisat att metoderna och begreppen för den så kallade "poststrukturalismen", som utvecklats i verk av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra, går tillbaka till Saussures och Saussures språkliga verk. anagrammatiska läsningar av senromersk poesi. Det bör noteras att Saussures arbete med lingvistik och språklig tolkning hjälper till att koppla samman ett brett spektrum av intellektuella discipliner - från fysik till litterära innovationer, psykoanalys och filosofi från det tidiga nittonhundratalet. A. J. Greimas och J. Kurte skriver i Semiotics and Language: ”En analytisk ordbok med titeln ”Interpretation” som en ny sorts tolkning dök upp i början av 1900-talet tillsammans med Saussures lingvistik, Husserls fenomenologi och psykoanalysen. av Freud. I ett sådant fall är "tolkning inte att tillskriva ett givet innehåll till en form som annars skulle sakna en, utan snarare en omskrivning som på ett annat sätt formulerar samma innehåll av ett betydande element inom ett givet semiotiskt system" (159 ). I denna förståelse av "tolkning" är form och innehåll oskiljaktiga; tvärtom är varje form fylld med semantisk betydelse ("meningsfull form"), så tolkningen erbjuder en ny, liknande återberättelse av något meningsfullt i ett annat teckensystem.

En liknande förståelse av form och innehåll, presenterad av Claude Lévi-Strauss i ett av strukturalismens programmatiska verk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan ses i Saussures postuma bok, A Course in Allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure lite, "Kurs" - hans huvudverk - samlades från anteckningar från studenter som deltog i hans föreläsningar om allmän lingvistik 1907-11. I kursen efterlyste Saussure en "vetenskaplig" studie av språket, som kontrasterade det med 1800-talets jämförande-historiska lingvistik. Detta arbete kan betraktas som en av västerländskt tänkandes största landvinningar: med individuella ord som grundelementen i språket, bevisade historisk (eller "diakronisk") lingvistik ursprunget och utvecklingen av västeuropeiska språk från ett gemensamt, indoeuropeiskt språk – och ett tidigare proto-indoeuropeiskt.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement" som Saussure ifrågasatte. Hans arbete var ett försök att reducera de många fakta om språk som tillfälligt studerades av jämförande lingvistik till ett litet antal satser. 1800-talets jämförande filologiska skola, skriver Saussure, "lyckades inte skapa en riktig språkskola" eftersom "den inte förstod essensen av studieobjektet" (3). Denna "essens", menar han, ligger inte bara i enskilda ord - språkets "positiva substanser" - utan också i de formella sambanden som hjälper dessa substanser att existera.

Saussures "test" av språk bygger på tre antaganden. För det första är den vetenskapliga förståelsen av språk inte baserad på ett historiskt, utan på ett strukturellt fenomen. Därför skilde han mellan enskilda språkfenomen - "talhändelser", som han definierar som "parole" - och det riktiga, enligt hans åsikt, studieobjektet för lingvistik, systemet (kod, struktur) som styr dessa händelser ( "langue"). En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element i ett givet ögonblick, snarare än en "diakronisk" studie av språkets utveckling genom dess historia.

Denna hypotes var föregångaren till vad Roman Jakobson 1929 skulle kalla "strukturalism" - en teori där "alla fenomen som undersöks av modern vetenskap betraktas inte som en mekanisk ackumulation, utan som en strukturell helhet där den konstruktiva komponenten är korrelerad med funktionen" ("Romantisk "711). I denna passage formulerade Jakobson Saussures idé om att definiera språket som en struktur, i motsats till den "mekaniska" uppräkningen av historiska händelser. Dessutom utvecklar Jakobson ett annat saussureanskt antagande, som blev föregångaren till strukturell lingvistik: språkets grundläggande beståndsdelar bör studeras i samband inte så mycket med deras orsaker, utan med deras funktioner. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter. Detta var en radikal vändning i jämförelsen av fenomen med den omgivande verkligheten, vars betydelse filosofen Ernst Cassirer jämförde med "vetenskapen om Galileo, som på 1600-talet omkullkastade idéer om den materiella världen." följaktligen själva förklaringarna. Fenomen började tolkas inte i relation till orsakerna till att de inträffade, utan i relation till den effekt de kan ha i nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikter kan vara opersonliga, "omedvetet" i ordets freudianska mening).

I sin lingvistik visar Saussure särskilt denna vändning i förändringen av ordets begrepp inom lingvistik, som han definierar som ett tecken och beskriver i termer av dess funktioner. Ett tecken för honom är en kombination av ljud och betydelse, "signified and designation" (66-67; i den engelska översättningen från 1983 av Roy Harris - "signification" och "signal"). Denna förenings natur är "funktionell" (varken det ena eller det andra elementet kan existera utan varandra); dessutom "lånar den ena egenskaper från den andra" (8). Således definierar Saussure det huvudsakliga strukturella elementet i språket - tecknet - och gör basen för historisk lingvistik till identiteten av tecken till ord, vilket kräver en särskilt rigorös analys. Därför kan vi förstå olika betydelser av, säg, samma ord "träd" - inte för att ordet bara är en uppsättning av vissa egenskaper, utan för att det definieras som ett element i teckensystemet, i "den strukturella helheten", i språket.

Ett sådant relativt ("diakritiskt") enhetsbegrepp ligger till grund för begreppet alla delar av språket i strukturell lingvistik. Detta är särskilt tydligt i den mest originella upptäckten av saussureisk lingvistik, i utvecklingen av begreppet "fonem" och "särskiljande drag" hos språket. Fonemen är den minsta av de talade och meningsfulla språkenheterna. Det är inte bara ljud som förekommer i språket, utan "ljudbilder", konstaterar Saussure, som av infödda talare uppfattas som meningsfulla. (Det bör noteras att Elmar Holenstein kallar Jakobsons lingvistik, som fortsätter Saussures idéer och begrepp i sina huvudbestämmelser, för "fenomenologisk strukturalism"). Det är därför den ledande talaren för Pragskolan för strukturalism, Jan Mukarowski, 1937 observerade att ”struktur. . . inte ett empiriskt, utan ett fenomenologiskt begrepp; det är inte resultatet i sig, utan en uppsättning betydande relationer för det kollektiva medvetandet (generation, andra, etc.)”. En liknande tanke uttrycktes 1960 av Lévi-Strauss, den franska strukturalismens ledare: ”Strukturen har inget bestämt innehåll; den är meningsfull i sig, och den logiska konstruktion som den är innesluten i är verklighetens avtryck.

I sin tur representerar fonem, som de minsta språkliga element som är acceptabla för perception, en separat integrerad "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Aspirerat, höjt eller sänkt, ett långt "t"-ljud, etc. kommer lika att skilja betydelsen av orden "att" och "göra". Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med och utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa egenskaper är baserade på strukturen hos talorganen - tunga, tänder, stämband - Saussure märker detta i "Course of General Linguistics", och Harris kallar det "fysiologisk fonetik" (i Baskins tidigare översättning, termen "fonologi" " används) - de är kopplade i "knutar » durg mot en vän för att göra ljud. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av "röst" (spänningen i stämbanden), och röstnivån som skiljer ett fonem från ett annat. Således kan fonologi betraktas som ett exempel på den allmänna språkregel som beskrivs av Saussure: "Det finns bara skillnader i språket." Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

Jag har redan nämnt att fonologin i sin utveckling förlitade sig på Saussures idéer. Även om hans analys av språkfysiologi i modern tid, säger Harris, "skulle kallas 'fysisk', i motsats till 'psykologisk' eller 'funktionell', formulerade han i The Course tydligt riktningen och de grundläggande principerna för den funktionella analysen av språk. Hans enda publicerade verk under hans livstid, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Anteckningar om det ursprungliga vokalsystemet i de indoeuropeiska språken), publicerat 1878, var helt i linje med jämförande historisk lingvistik i 1800-talet. Ändå, i detta arbete, säger Jonathan Culler, visade Saussure "fruktbarheten av idén om språk som ett system av sammanlänkade fenomen, även med dess historiska rekonstruktion." Genom att analysera förhållandet mellan fonem, förklara växlingen av vokaler i de moderna språken i den indoeuropeiska gruppen, föreslog Saussure att förutom flera olika ljud "a", måste det finnas andra fonem som formellt beskrivs. "Vad som gör ett speciellt intryck i Saussures verk," avslutar Kaller, "är att nästan 50 år senare, när hettitisk kilskrift upptäcktes och dechiffrerades, hittades ett fonem, i skrift betecknat med "h", som betedde sig som Saussure förutspådde. Genom formell analys upptäckte han det som nu är känt som det gutturala ljudet i de indoeuropeiska språken.

I konceptet med en relativ (diakritisk) definition av tecken, både explicit och underförstådd i kursen, finns det ett tredje nyckelantagande för strukturell lingvistik, kallat av Saussure "tecknets godtyckliga natur". Med detta menas att förhållandet mellan ljud och mening i språket inte är motiverat av någonting: man kan lika gärna koppla ihop ordet "arbre" och ordet "träd" med begreppet "träd". Dessutom betyder detta att ljudet också är godtyckligt: ​​man kan definiera begreppet "träd" genom närvaron av bark (förutom för palmer) och efter storlek (förutom för "låga träiga växter" - buskar). Av detta bör det vara klart att alla antaganden jag presenterar inte är uppdelade i mer och mindre viktiga: var och en av dem - den systemiska karaktären av tecken (mest förståeligt i den "synkrona" studien av språket), deras relativa (diakritiska) väsen , den godtyckliga karaktären av tecken - kommer från från resten.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språk är både ett uttryck för ordens betydelse (beteckning) och deras resultat (kommunikation) – och dessa två funktioner sammanfaller aldrig (se Shleifers "Dekonstruktion av språket"). Vi kan se den växling av form och innehåll som Greimas och Kurte beskriver i den senaste tolkningsversionen: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar på successiva nivåer för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till kontrasterande morfem, morfem - till ord, ord - till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än summan av dess delar (precis som vatten, i Saussures exempel, är mer än en kombination av väte och syre).

Tre antaganden om "Course of General Linguistics" ledde Saussure till idén om en ny vetenskap från 1900-talet, separat från lingvistik, som studerade "teckens liv i samhället." Saussure kallade denna vetenskap för semiologi (från grekiskan "semeîon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller formulerade) med dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade Saussure sig åt en "semiotisk" analys av sen romersk poesi och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i sin språkliga analys: den var ett försök, som Saussure skriver i en av de 99 anteckningsböckerna, att i systemet studera problemet med "sannolikhet", som "blir grunden för allting. " En sådan undersökning, hävdar Saussure själv, hjälper till att fokusera på den "riktiga sidan" av sannolikhet; ”Nyckelordet” som Saussure letar efter ett anagram för är, enligt Jean Starobinsky, ”ett verktyg för poeten, och inte källan till liv för dikten. Dikten tjänar till att vända nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar.”

Saussures försök att studera egennamn i sen romersk poesi (Tsvetan Todorov kallade detta en förkortning av "ett ord ... bara innan det skrivs") understryker en av komponenterna i hans språkliga analys - teckens godtyckliga karaktär, liksom den formella essensen av saussureisk lingvistik ("Språk", hävdar han, "formens väsen, inte fenomenet"), vilket utesluter möjligheten att analysera innebörden. Todorov drar slutsatsen att idag verkar Saussures skrifter anmärkningsvärt konsekventa i sin ovilja att studera symboler [fenomen som har en väldefinierad betydelse]. . . . När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semilogi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoderna för oavsiktlig tolkning baserad på dessa begrepp, och å andra sidan de strukturalistiska begrepp som Lévi-Strauss kallade "Kantianism utan en transcendent aktör" - raderar konfrontationen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik - Ferlinand de Saussures verk om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunderna i teorin om grammatik / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiska metoder i lingvistik. M., 1974.

4. Arnold I.V. Ordets semantiska struktur i modern engelska och metodiken för dess studie. /I.V. Arnold-L .: Utbildning, 1966. - 187 sid.

6.Bashlykov A.M. Automatiskt översättningssystem. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 sid.

7.Baudouin de Courtenay: Teoretiskt arv och modernitet: Sammandrag av rapporterna från den internationella vetenskapliga konferensen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 sid.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 sid.

9. Golovin, B.N. Språk och statistik. /B.N. Golovin - M., 1971. - 210 sid.

10. Zvegintsev, V.A. Teoretisk och tillämpad lingvistik. / V.A. Zvegintsev - M., 1969. - 143 sid.

11. Kasevich, V.B. Semantik. Syntax. Morfologi. // V.B. Kasevich - M., 1988. - 292 sid.

12. Lekomtsev Yu.K. Introduktion till lingvistikens formella språk / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 sid.

Matveeva G.G. Dolda grammatiska betydelser och identifiering av den sociala personen (”porträtt”) av talaren / G.G. Matveev. - Rostov, 1999. - 174 sid.

14. Melchuk, I.A. Erfarenhet av att bygga språkliga modeller "Meaning Text"./ I.A. Melchuk. - M., 1974. - 145 sid.

15. Nelyubin L.L. Översättning och tillämpad lingvistik / L.L. Nelyubin. - M.: Högre skola, 1983. - 207 sid.

16. Om språkforskningens exakta metoder: om den så kallade "matematiska lingvistiken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva och andra - M., 1961. - 162 sid.

17. Piotrovsky L.G. Matematisk lingvistik: Lärobok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Högre skola, 1977. - 160 sid.

18. Han är. Text, maskin, person. - L., 1975. - 213 sid.

19. Det är han. Tillämpad lingvistik / Ed. A.S. Gerda. - L., 1986. - 176 sid.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Modern strukturell lingvistik. Problem och metoder. M., 1977. - 239 sid.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunderna i allmän och maskinöversättning / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 sid.

22. Slyusareva N.A. Teorin om F. de Saussure i ljuset av modern lingvistik / N.A. Slyusareva. - M.: Nauka, 1975. - 156 sid.

23. Uggla, L.Z. Analytisk lingvistik / L.Z. Uggla - M., 1970. - 192 sid.

24. Saussure F. de. Anteckningar om allmän lingvistik / F. de Saussure; Per. från fr. - M.: Framsteg, 2000. - 187 sid.

25. Det är han. Kurs i allmän lingvistik / Per. från fr. - Jekaterinburg, 1999. -426 sid.

26. Talstatistik och automatisk textanalys / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 sid.

27. Stoll, P. Sets. Logik. Axiomatiska teorier / R. Stoll; Per. från engelska. - M., 1968. - 180 sid.

28. Tenier, L. Fundamentals of structural syntax. M., 1988.

29. Ubin I.I. Automatisering av översättningsaktiviteter i Sovjetunionen/I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 sid.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Bearbetning av konceptuell information. M., 1980.

32. Shikhanovich, Yu.A. Introduktion till modern matematik (initiala begrepp). M., 1965

33. Shcherba L.V. Ryska vokaler i kvalitativa och kvantitativa termer / L.V. Shcherba - L.: Nauka, 1983. - 159 sid.

34. Abdullah-zade F. Medborgare i världen // Spark - 1996. - Nr 5. - s.13

35. V.A. Uspensky. Preliminär för läsarna av "New Literary Review" till de semiotiska meddelandena från Andrei Nikolaevich Kolmogorov. - Ny litteraturrecension. -1997. - Nr 24. - S. 18-23

36. Perlovsky L. Medvetande, språk och kultur. - Kunskap är makt. -2000. №4 - S. 20-33

37. Frumkina R.M. Om oss - snett. // Russian Journal. - 2000. - Nr 1. - s. 12

38. Fitialov, S.Ya. Om syntaxmodellering i strukturell lingvistik // Problems of Structural Linguistics. M., 1962.

39. Det är han. Om likvärdigheten mellan NN-grammatik och beroendegrammatik // Problems of Structural Linguistics. M., 1967.

40. Chomsky, N. Logiska grunder för lingvistisk teori // Nytt inom lingvistik. Problem. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. tryck. jhu.ru

46. ​​en.wikipedia.org

Under det senaste århundradet har lingvistik alltid nämnts som ett exempel på en vetenskap som utvecklades snabbt och mycket snabbt nådde metodologisk mognad. Redan i mitten av förra seklet tog ung vetenskap med säkerhet sin plats i den krets av vetenskaper som hade en tusenårig tradition, och en av dess mest framstående representanter - A. Schleicher - hade modet att tro att han med sina verk summerade redan den sista raden.<113>Språkvetenskapens historia har dock visat att en sådan åsikt var för hastig och obefogad. I slutet av seklet genomgick lingvistiken sin första stora chock i samband med kritiken av neogrammatiska principer, följt av andra. Det bör noteras att alla kriser som vi kan avslöja i språkvetenskapens historia som regel inte skakade dess grund, utan tvärtom bidrog till förstärkningen och förde i slutändan med sig en förfining och förbättring av språkforskningens metoder, utvidgning tillsammans med teman och vetenskapliga frågeställningar.

Men vid sidan av lingvistiken levde och utvecklades även andra vetenskaper, inklusive ett stort antal nya. De fysikaliska, kemiska och tekniska (så kallade "exakta") vetenskaperna har fått en särskilt snabb utveckling i vår tid, och deras teoretiska grund, matematiken, har regerat över dem alla. De exakta vetenskaperna har inte bara starkt pressat alla humaniora, utan för närvarande strävar de efter att "föra dem till sin tro", att underordna dem deras seder, att påtvinga dem sina forskningsmetoder. I den nuvarande situationen, med hjälp av ett japanskt uttryck, kan man säga att nu smutsar lingvister-filologer själva kanten av mattan, där de exakta vetenskaperna, med matematiken i spetsen, triumferande och fritt placerade.

Vore det inte mer ändamålsenligt ur allmänna vetenskapliga intressen att kapitulera för matematiken, att helt kapitulera för kraften i dess metoder, till vilka vissa röster öppet kallar 59 , och därigenom kanske få ny kraft? För att svara på dessa frågor måste vi först titta på vad matematiken hävdar i det här fallet, inom vilket område av lingvistik matematiska metoder finner sin tillämpning, i vilken utsträckning de är förenliga med specifikationerna för språkmaterialet och om de kan ge eller till och med bara föreslå svar på dessa frågor som ställs av språkvetenskapen.

Redan från början bör det noteras att bland entusiasterna av den nya, matematiska trenden inom lingvistik<114>Det råder ingen enighet om dess mål och syften inom statisk forskning. Acad. A. A. Markov, som var den första att tillämpa matematiska metoder på språk, Boldrini, Yul, Mariotti betraktar språkelement som lämpligt illustrativt material för att konstruera kvantitativa metoder, eller för statistiska teorem, utan att alls undra om resultaten av en sådan studie är av intresse till lingvister 6 0 . Ross menar att sannolikhetsteori och matematisk statistik utgör ett verktyg eller, som de nu föredrar att säga, en matematisk modell för att testa och bekräfta de språkliga slutsatser som tillåter numerisk tolkning. Matematiska metoder är alltså endast tänkta som hjälpmedel för språkforskning 6 1 . Mycket mer hävdas av Herdan, som i sin bok inte bara sammanfattade och systematiserade alla försök till matematiska studier av språkproblem, utan också försökte ge dem en tydlig orientering i förhållande till det fortsatta arbetet. Han fokuserar presentationen av hela materialet i sin bok på "förstå litterär statistik (som han kallar studiet av texter med metoder för matematisk statistik. - VID 3.) som en integrerad del av lingvistik” 6 2 , och formulerar kärnan och uppgifterna i detta nya avsnitt i lingvistik med följande ord: ”Litterär statistik som en kvantitativ språkfilosofi är tillämplig på alla grenar av lingvistik. Litterär statistik är enligt vår mening strukturell lingvistik upphöjd till nivån av en kvantitativ vetenskap eller en kvantitativ filosofi. Därför är det lika fel att definiera dess resultat som att de ligger utanför räckvidden<115>lingvistik eller behandla den som ett hjälpmedel för forskning” 6 3 .

Det är knappast tillrådligt att gå in på teoretiseringar om huruvida det är legitimt i detta fall att tala om uppkomsten av en ny gren av lingvistik och lösa frågan om dess påståenden, utan att först hänvisa till övervägandet av vad som faktiskt har gjorts i detta område, och för att klargöra i vilken riktning tillämpningen av nya metoder 6 4 . Detta kommer att hjälpa oss att förstå skillnaderna i åsikter.

Användningen av matematiska (eller, närmare bestämt, statistiska) kriterier för att lösa språkliga problem är på intet sätt ny för språkvetenskapen och har i en eller annan grad använts av lingvister länge. När allt kommer omkring, faktiskt, sådana traditionella begrepp inom lingvistik som fonetisk lag (och relaterade<116>nee med det - ett undantag från lagen), produktiviteten hos grammatiska element (till exempel avledningssuffix), eller till och med kriterierna för relaterade relationer mellan språk, i viss utsträckning, är baserade på relativa statistiska egenskaper. När allt kommer omkring, ju skarpare och mer distinkt den statistiska oppositionen av de observerade fallen är, desto större anledning har vi att tala om produktiva och improduktiva suffix, om den fonetiska lagen och undantag från den, om närvaron eller frånvaron av släktskap mellan språk. Men om den statistiska principen i sådana fall användes mer eller mindre spontant, så började den i framtiden tillämpas medvetet och redan med en viss målsättning. Så i vår tid har de så kallade frekvensordböckerna för ordförråd och uttryck för enskilda språk 6 5 eller till och med betydelsen av flerspråkiga ord med ett "allmänt fokus på verkligheten" 6 6 blivit utbredda. Data från dessa ordböcker används för att sammanställa läroböcker på främmande språk (vars texter bygger på det vanligaste ordförrådet) och minimiordböcker. Statistisk kalkyl hittade en speciell språklig användning i metoden för lexikostatistik eller glottokronologi av M. Swadesh, där det, på grundval av statistiska formler som tar hänsyn till fall av försvinnande av ord från huvudfondens språk, är möjligt att fastställa den absoluta kronologin för indelningen av språkfamiljer 6 7 .

Under senare år har fallen av att tillämpa matematiska metoder på språkligt material ökat markant, och i mängden av sådana försök har mer eller mindre bestämda riktningar skisserats. Låt oss vända<117>till deras sekventiella övervägande, utan att gå in på detaljer.

Låt oss börja med riktningen som har fått namnet stylostatistics. I det här fallet talar vi om definitionen och karakteriseringen av de stilistiska dragen hos enskilda verk eller författare genom de kvantitativa relationerna mellan de språkliga elementen som används. Det statistiska förhållningssättet till studiet av stilfenomen bygger på förståelsen av litterär stil som ett individuellt sätt att bemästra språkets medel. Samtidigt är forskaren helt distraherad från frågan om den kvalitativa betydelsen av de räkningsbara språkliga elementen, och fokuserar all sin uppmärksamhet endast på den kvantitativa sidan; den semantiska sidan av de studerade språkenheterna, deras känslomässiga och uttrycksfulla belastning, såväl som deras andel i ett konstverks väv - allt detta förblir utanför, hänvisar till de så kallade redundanta fenomenen. Sålunda framträder ett konstverk i form av ett mekaniskt aggregat, vars särart kommer till uttryck endast genom de numeriska förhållandena mellan dess element. Representanter för stilostatistik blundar inte för alla de noterade omständigheterna, och motsätter sig metoderna för traditionell stilistik, som utan tvekan inkluderar element av subjektivitet, med en enda kvalitet hos den matematiska metoden, som, enligt deras åsikt, kompenserar för alla dess brister - objektiviteten i de uppnådda resultaten. ”Vi strävar”, skriver till exempel V. Fuchs, ”... att karakterisera stilen för språkliga uttryck med matematiska medel. För detta ändamål bör metoder skapas, vars resultat bör ha samma objektivitet som resultaten av de exakta vetenskaperna ... Detta tyder på att vi, åtminstone initialt, endast kommer att behandla formella strukturella kvaliteter, och inte med de semantiska innehållet i språkliga uttryck . På så sätt kommer vi att få ett system av ordinalrelationer, som i sin helhet kommer att utgöra grunden och utgångspunkten för den matematiska stilteorin” 6 8 .<118>

Den enklaste typen av statistiskt tillvägagångssätt för studiet av författares eller enskilda verks språk är att räkna de använda orden, eftersom ordbokens rikedom tydligen borde känneteckna författaren själv på ett visst sätt. Resultaten av sådana beräkningar ger dock i detta avseende något oväntade resultat och bidrar inte på något sätt till estetisk kunskap och värdering av ett litterärt verk, vilket inte minst är en av stilistikens uppgifter. Här är några uppgifter om det totala antalet ord som används i ett antal verk:

Bibeln (latin). . . . . . . . . . 5649 ord

Bibeln (hebreiska). . . . 5642 ord

Demosthenes (tal). . . . . . . . . . . . 4972 ord

Sallust. . . . . . . . . . . . . . . . . 3394 ord

Horace. . . . . . . . . . . . . . . . . . . .6084 ord

Dante (gudomlig komedi) 5860 ord

(detta inkluderar 1615 egennamn och geografiska namn)

Tasso (Furious Orland). . . . 8474 ord

Milton. . . . . . . . . . . . . . . . . . . . .8000 ord (ungefär angivet)

Shakespeare. . . . . . . . . . . . . . . . . . .15 000 ord

(ungefär, enligt andra källor 20 000 ord)

O. Jespersen påpekar att ordboken för Zola, Kipling och Jack London avsevärt överstiger Miltons ordbok, d.v.s. antalet är 8000 6 9 . Beräkningen av ordboken över tal från USA:s president W. Wilson fann att den är rikare än Shakespeares. Till detta bör läggas uppgifter från psykologer. Således fann Terman, baserat på observationer av ett stort antal fall, att ordförrådet för ett genomsnittligt barn är cirka 3600 ord, och vid 14 års ålder - redan 9000. Den genomsnittliga vuxen använder 11700 ord, och en person av "ökade intelligens" upp till 13500 7 0 . Sådana numeriska data i sig ger alltså inga skäl för att identifiera verkens stilistiska kvaliteter och endast "objektivt"<119>de anger användningen av olika antal ord av olika författare, vilket, som ovanstående beräkningar visar, inte är relaterat till det relativa konstnärliga värdet av deras verk.

Beräkningar av den relativa frekvensen av användningen av ord av enskilda författare är uppbyggda något annorlunda. I det här fallet tas inte bara hänsyn till den totala mängden ord, utan också hur ofta enskilda ord används. Statistisk bearbetning av det material som erhålls på detta sätt består i att ord med lika frekvens av användning grupperas i klasser (eller rangordningar), vilket leder till upprättandet av frekvensfördelningen av alla ord som används av en given författare. Ett specialfall av denna typ av beräkning är bestämningen av den relativa frekvensen av speciella ord (till exempel romansk vokabulär i Chaucers verk, som gjordes av Mersand 7 1). Den relativa frekvensen av de ord som används av författarna innehåller samma objektiva information om stilen hos enskilda författare som ovanstående totalberäkningar, med den enda skillnaden att resultatet är mer exakta numeriska data. Men det används också för att datera enskilda verk av samma författare på grundval av en preliminär beräkning av den relativa frekvensen av hans användning av ord under olika perioder av hans liv (enligt verk som daterats av författaren själv). En annan typ av användning av data från sådana beräkningar är att fastställa äktheten av författarskapet till verk för vilka denna fråga verkar tveksam 7 2 . I det sista fallet är allt baserat på en jämförelse av statistiska formler för användningsfrekvensen i äkta och kontroversiella verk. Det finns ingen anledning att tala om den mycket stora relativiteten och approximationen av de resultat som erhålls med sådana metoder. När allt kommer omkring ändras den relativa användningsfrekvensen inte bara med författarens ålder, utan också beroende på genren, handlingen och även den historiska miljön för verkets handling (jämför till exempel "Bröd" och "Peter" I" av A. Tolstoy).<120>

Genom att fördjupa metoden som beskrivits ovan började stylostatistik som stilkarakteristik att tillgripa kriteriet stabilitet för den relativa frekvensen av de mest använda orden. Metoden som används i detta fall kan illustreras av den statistiska bearbetningen av Pushkins berättelse "The Captain's Daughter" av Esselson och Epstein vid Institute of Slavic Languages ​​vid University of Detroit (USA) 7 3 . Hela texten i berättelsen (cirka 30 000 förekomster av ord) underkastades undersökningen, och sedan passager innehållande cirka 10 000 och 5 000 förekomster. Vidare, för att bestämma stabiliteten hos den relativa frekvensen av användningen av ord, jämfördes de 102 vanligaste orden (med en frekvens på 1160 gånger till 35) med den beräknade relativa frekvensen (gjord på basis av selektiva passager) med den faktiska. Till exempel användes facket "och" 1 160 gånger genom hela historien. I en passage som innehåller 5 000 förekomster av alla ord bör denna konjunktion förväntas användas 5 000 x 1 160:30 000, eller avrundas uppåt 193 gånger, och i en passage som innehåller 10 000 förekomster av alla ord förväntas den användas 1,100 x 10,060 : 30 000 eller 386 gånger. Jämförelse av data som erhållits med denna typ av beräkningar med faktiska data visar en mycket liten avvikelse (inom 5%). Baserat på sådana beräkningar fann man att i denna berättelse av Pushkin används prepositionen "k" dubbelt så ofta som "y", och pronomenet "du" används tre gånger oftare än "dem", etc. Således , trots alla växlingar i handlingen, både genom hela berättelsen och i dess enskilda delar, finns det en stabilitet i den relativa frekvensen av användningen av ord. Det som observeras i förhållande till några (vanligaste) ord är förmodligen tillämpligt på alla ord som används i verket. Härav följer att författarens stil kan karakteriseras av ett visst förhållande mellan variationen av den genomsnittliga frekvensen av att använda ett ord och den allmänna frekvensen för ett givet språk.<121>frekvensen av dess användning. Detta förhållande anses vara en objektiv kvantitativ egenskap hos författarens stil.

Andra formella delar av språkstrukturen studeras på liknande sätt. Så till exempel underkastade V. Fuchs de metriska särdragen i verken av Goethe, Rilke, Caesar, Sallust etc. för en jämförande-statistisk övervägande.

Kriteriet om stabiliteten för den relativa frekvensen av användningen av ord, samtidigt som det förtydligar tekniken för kvantitativ karaktärisering av stil, introducerar inte något fundamentalt nytt i jämförelse med de mer primitiva metoderna som analyserats ovan. Alla metoder för stylostatistik ger i slutändan lika passionerade "objektiva" resultat, glider över tungans yta och klamrar sig bara fast vid rent yttre tecken. Kvantitativa metoder kan tydligen inte fokusera på de kvalitativa skillnaderna i materialet som studeras och i själva verket utjämna alla objekt som studeras.

Där maximal specifikation behövs, erbjuds de mest generaliserade kriterierna; kvalitativa egenskaper uttrycks i kvantitetsspråket. Detta är inte bara en logisk motsägelse, utan också en oenighet med sakens natur. Ja, vad händer om vi försöker få en jämförande stilistisk (dvs. därför kvalitativ) egenskap hos Alexander Gerasimovs och Rembrandts verk baserat på det kvantitativa förhållandet mellan röd och svart färg på deras dukar? Det verkar vara ett absolut nonsens. I vilken utsträckning kan helt "objektiv" kvantitativ information om en persons fysiska data kunna ge oss en uppfattning om allt som kännetecknar en person och utgör hennes sanna väsen? Uppenbarligen ingen. De kan endast tjäna som ett individuellt tecken som skiljer en person från en annan, som ett avtryck av veck på tummen. Situationen liknar den litterära stilens kvantitativa egenskaper. Om man tittar noga ger de lika magra data för att bedöma den faktiska stilistiken<122>kvaliteter hos författarens språk, samt en beskrivning av vikningarna på fingret för studiet av mänsklig psykologi.

Till allt som sagts ska tilläggas att man redan tidigare, i den så kallade formella skolan för litteraturkritik, försökte kvantitativt studera författarstilen, då epitet, metaforer och rytmisk-melodiska inslag. av vers räknades. Detta försök utvecklades dock inte vidare.

Ett annat tillämpningsområde för matematiska metoder för studier av språkliga fenomen kan grupperas under namnet språklig statistik. Den försöker tränga in i språkteorins grundläggande frågor och på så sätt få en kallelse inom den egentliga språkliga sfären. För att bekanta sig med denna riktning är det bäst att vända sig till det redan nämnda verk av Herdan, med en av dess många recensenters ord, "en monstruöst pretentiös bok" 7 5 , fick dock ett brett gensvar bland lingvister 7 6 . Med tanke på det faktum att Kherdan (som redan nämnts ovan) försökte samla i sin bok allt som är viktigast inom området för tillämpning av matematiska metoder på språkliga problem, i hans bok har vi faktiskt inte så mycket att göra med Kherdan som med en helhet trend. Som själva titeln på boken, "Språk som val och sannolikhet", visar, ligger dess huvudsakliga fokus på att klargöra vad i språket som lämnas åt talarens fria val och vad som beror på språkets immanenta struktur, precis som på att bestämma det kvantitativa förhållandet mellan elementen i första och andra ordningen. Kherdans bok ger nästan uttömmande information om allt arbete på detta område som utförs av representanter för olika specialiteter.<123>(filosofer, lingvister, matematiker, tekniker), men är inte begränsad till detta och inkluderar många ursprungliga observationer, överväganden och slutsatser av författaren själv. Som ett sammanfattande arbete ger det en god uppfattning om de kvantitativa metoder som används och om de resultat som uppnåtts med deras hjälp. Frågorna som vi villkorligt kombinerar till avsnittet språkstatistik behandlas i bokens andra och fjärde del.

Av de många fallen att tillämpa metoderna för matematisk statistik för studier av språkliga frågor, kommer vi att fokusera på de mest allmänna, som samtidigt kan betraktas som de mest typiska. Använda data från andra författare - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 och andra, samt citerar sina egna studier som bestämmer den relativa frekvensen av fördelningen av fonem, bokstäver, ordlängd (mätt med antalet bokstäver och stavelser) , grammatiska former och metriska element i latin och grekisk hexameter, fastslår Herdan faktumet av stabiliteten hos den relativa frekvensen av språkliga element som en gemensam egenskap för alla språkliga strukturer. Han härleder följande regel: "Proportionerna av språkliga element som tillhör en eller annan nivå eller sfär av språklig kodning - fonologi, grammatik, metrik - förblir mer eller mindre konstant för ett givet språk, under en given period av dess utveckling och inom gränser för tillräckligt omfattande och opartiskt genomförda observationer.» 8 2 . Denna regel, som Herdan kallar språkets grundläggande lag, försöker han tolka och utvidga på ett visst sätt. ”Han”, skriver Herdan om denna lag, ”är ett uttryck för att även här, där människans vilja och valfrihet ges<124>det bredaste ramverket, där medvetna val och bekymmerslös lek levande växlar med varandra, i allmänhet finns det en betydande stabilitet... i grammatiken, men också i förhållande till användningsfrekvensen av specifika fonem, lexikaliska enheter (ord) och grammatiska fonem och konstruktioner; likheten ligger med andra ord inte bara i vad som används, utan också i hur ofta det används” 8 3 . Denna situation beror på förståeliga skäl, men detta ger upphov till nya slutsatser. När man till exempel undersöker olika texter eller segment av ett visst språk, finner man att de relativa frekvenserna för användning av ett givet speciellt fonem (eller andra talelement) av olika personer förblir i princip desamma. Detta leder till tolkningen av individuella former av tal som vissa fluktuationer i den konstanta sannolikheten att använda det övervägda fonem i ett givet språk. Således visar det sig att en person i sin talaktivitet är föremål för vissa sannolikhetslagar i förhållande till antalet språkliga element som används. Och sedan, när vi observerar ett stort antal språkliga element i en stor uppsättning texter eller talsegment, får vi intrycket av kausalt beroende i den meningen att det i det här fallet också finns bestämning i förhållande till användningen av vissa språkliga element. Det visar sig med andra ord vara tillåtet att hävda att det som ur intuitiv synvinkel verkar vara ett orsakssamband, är kvantitativt en sannolikhet 8 4 . Det är tydligt att ju större totalsumman<125>specificiteten hos de undersökta texterna eller talsegmenten, desto tydligare kommer stabiliteten hos den relativa frekvensen av användningen av språkliga element att manifesteras även i individuell användning (lagen om stora siffror). Av detta dras en ny generell slutsats att språk är ett massfenomen och bör behandlas som ett sådant.

Dessa slutsatser, som dragits på grundval av frekvensberäkningar av fonetiska element, ord och grammatiska former, som tillsammans utgör ett språk, tillämpas sedan på den "statistiska tolkningen" av Saussures uppdelning i "språk" (lalangue) och "tal" (laparole). ). Enligt Saussure är "språk" en uppsättning språkliga vanor som möjliggör kommunikation mellan medlemmar i en viss språklig gemenskap. Detta är en social verklighet, ett "massfenomen", obligatoriskt för alla människor som talar detta språk. Herdan, som antytts, bevisar att medlemmarna i en enda språkgemenskap liknar varandra inte bara genom att de använder samma fonem, lexikaliska enheter och grammatiska former, utan också genom att alla dessa element används med samma frekvens. Sålunda har hans statistiska definition av "språk" följande form: "språk" (lalangue) är helheten av vanliga språkliga element plus deras relativa sannolikhet att användas.

Denna definition av "språk" är också utgångspunkten för motsvarande statistiska tolkning av "tal", som enligt Saussure är ett individuellt yttrande. Genom att kontrastera "språk" som ett socialt fenomen av "tal" som ett individuellt fenomen, skrev Saussure: "Tal är en individuell handling av vilja och förståelse, där det är nödvändigt att särskilja: 1. kombinationer med vilka det talande subjektet använder språket kod för att uttrycka sin personliga tanke; 2. en psykofysisk mekanism som tillåter honom att objektivera dessa kombinationer” 8 5 . Eftersom "språk" i språkstatistik betraktas som en uppsättning element med en viss relativ<126>viss sannolikhet för deras användning, i den mån den inkluderar den statistiska helheten eller ensemblen (populationen) som den viktigaste egenskapen och kan beaktas i denna aspekt. I enlighet med detta förvandlas "tal" till ett separat urval taget från "språk" som ett statistiskt aggregat. Sannolikheten i detta fall bestäms av förhållandet mellan "tal" och "språk" (i deras "kvantitativa" förståelse), och fördelningen av den relativa frekvensen av användningen av olika delar av språket tolkas som ett resultat av en kollektivt "val" (val) i en viss kronologisk period av språkets existens. Efter att ha insett att en sådan tolkning av skillnaderna mellan "språk" och "tal" ändå bygger på helt andra grunder än Saussures, skriver Herdan i detta avseende: "Denna till synes mindre modifiering av Saussures koncept har den viktiga konsekvensen att "språk" ( lalangue ) får nu en väsentlig egenskap i form av ett statistiskt aggregat (population). Denna population kännetecknas av vissa relativa frekvenser eller fluktuationssannolikheter, vilket innebär att varje språkligt element tillhör en viss språklig nivå. I det här fallet visar sig "tal" (laparole), i enlighet med dess betydelse, vara en term för att definiera statistiska urval tagna från "språk" som en statistisk population. Det blir uppenbart att valet (valet) här uppträder i form av förhållandet mellan "tal" och "språk", vilket är förhållandet mellan ett slumpmässigt urval och ett statistiskt aggregat (population). Själva ordningen för frekvensfördelning, som en insättning av talaktiviteten i en språklig gemenskap under århundradena, är ett element av val (val), men inte av individuellt val, som i stil, utan av kollektiva val. Med hjälp av en metafor kan vi här prata om det val som gjorts av språkets ande, om vi med detta förstår principerna för språklig kommunikation, som är i överensstämmelse med komplexet av mentala data hos medlemmarna i en viss språklig gemenskap. Stabiliteten av serier är resultatet av sannolikhet (chans)» 8 6 .

Ett specialfall av tillämpningen av den angivna principen<127>pa är avgränsningen i språket av normativa fenomen från "undantag" (avvikelser). Språkstatistiken anger att den statistiska metoden gör det möjligt att eliminera den luddighet som finns i denna fråga och fastställa tydliga kriterier för att skilja mellan dessa fenomen. Om normen förstås som en statistisk population (i ovanstående mening), och undantaget (eller felet) är en avvikelse från de frekvenser som visas av den statistiska populationen, så föreslår en kvantitativ lösning av frågan sig själv. Det hela kokar ner till ett statistiskt samband mellan "population" och "outlier". Om de observerade frekvenserna i ett enskilt urval avviker från sannolikheterna på grund av den statistiska populationen med mer än vad som bestäms av en serie urvalsräkningar, så har vi anledning att dra slutsatsen att gränslinjen mellan "samma" (norm) och "ej samma" (undantag) överträds.

Kvantitativa skillnader mellan "språk" och "tal" används också för att skilja två typer av språkliga element: grammatiska och lexikala. Utgångspunkten för att lösa detta problem, som ofta ger stora svårigheter ur språklig synpunkt, är antagandet att frekvensgraden av grammatiska element är annorlunda än lexikaliska enheters. Detta påstås associeras med "generalisering" av grammatiska element, hur de skiljer sig från begrepp fixerade av lexikaliska enheter. Dessutom antas grammatiska element som regel vara mycket mindre i volym: som självständiga ord (de inkluderar pronomen, prepositioner, konjunktioner och hjälpord) består de vanligtvis av ett litet antal fonem och i form av "sammankopplade former" " - från ett eller två fonem 8 7 . Ju mindre det språkliga elementet är, desto mindre kan dess "längd" (kvantitativa moment) tjäna som en definierande egenskap, och desto viktigare får fonemens "kvalitet" för detta ändamål. Vilka metoder föreslås för att lösa det aktuella problemet? Det löses genom att hänvisa till det rent kvantitativa begreppet grammatisk<128>load, "Anta", skriver Herdan i detta sammanhang, "att vi är intresserade av att jämföra två språk i detta avseende. Hur bestämmer vi med en viss grad av objektivitet den "grammatiska belastning" som ett språk bär? Det är tydligt att denna belastning kommer att bero på positionen för gränslinjen som skiljer grammatik från ordförråd. Den första övervägande som kan komma till oss är att avgöra hur "komplex" grammatiken för ett givet språk är. När allt kommer omkring är "komplexitet" en kvalitativ egenskap, och begreppet "grammatisk belastning" är en kvantitativ egenskap. Visserligen beror belastningen till viss del på komplexiteten, men inte helt. Ett språk kan belönas med en extremt komplex grammatik, men endast en jämförelsevis liten del av den används i språkets verksamhet. Vi definierar "grammatisk belastning" som helheten av grammatik som ett språk bär när det är i aktion, vilket omedelbart för vårt problem in i strukturell lingvistiks område i den mening som disciplinen definierades av Saussure. I den följande presentationen används kvantitativa metoder för att bestämma skillnaden mellan språk, beroende på var gränsen går, för att skilja grammatik från ordförråd” 8 8 . Med andra ord bör språkskillnader i detta fall reduceras till skillnader i numeriska relationer mellan grammatiska och lexikala element.

Materialen som står till vårt förfogande målar upp följande bild. På engelska (endast "grammatiska ord" beaktades: pronomen, eller, som de också kallas, "substitutes", prepositioner, konjunktioner och hjälpverb), i ett segment som inkluderar 78633 fall av användning av alla ord (1027 olika ord), 53 102 fallet med användningen av grammatiska element, eller mer exakt "grammatiska ord" (149 olika ord), vilket är 67,53 % med 15,8 % av olika ord. Sådan är data från Deway 8 9 . Övriga uppgifter visar en annan procentandel<129>förhållande: 57,1% med 5,4% olika ord 9 0 . Denna betydande diskrepans förklaras av skillnaden mellan skriftspråk och talat språk. Skriftliga former av språket (första data) antas använda mer grammatiska element än muntliga (andra fallet). I Dantes gudomliga komedi (efter det italienska originalet) fastställde Mariotti 54,4 % av förekomsterna av "grammatiska ord".

Ett annat och, tydligen, ett mer perfekt sätt att bestämma den grammatiska belastningen av ett språk är att räkna de fonem som ingår i de grammatiska elementen. I det här fallet beaktas inte bara oberoende grammatiska ord, utan också relaterade former. Det finns olika alternativ här. Till exempel att bestämma den relativa frekvensen av användningen av individuella konsonantfonem i grammatiska element och jämföra dem med frekvensen för den totala användningen av dessa samma fonem (slutdata för ett sådant förhållande på engelska ger en andel på 99,9% till 100 000 - total användning); eller en liknande jämförelse av konsonanter enligt separata klassificeringsgrupper (labial, palatal, velar och andra fonem). Det slutliga förhållandet här tar formen av en andel på 56,47 % (i grammatiska element) till 60,25 % (i total användning); eller samma jämförelse av de initiala konsonantfonemen (i detta fall var förhållandet 100,2 % i grammatiska ord till 99,95 i total användning). Andra mer komplexa statistiska operationer är också möjliga, som dock resulterar i liknande kvantitativa uttryck för det problem som studeras.

De givna kvantitativa uppgifterna ligger till grund för en allmän slutsats. Det handlar om att fördelningen av fonem i grammatiska element bestämmer arten av fördelningen (i numeriska termer förstås) av fonem i språket som helhet. Och detta gör i sin tur att vi kan dra slutsatsen att användningen av grammatiska element i minsta utsträckning beror på individuella val och utgör den del av det språkliga uttrycket som styrs av sannolikheter.<130>ness. Denna spekulativa slutsats bekräftas av beräkningen av grammatiska former på ryska språket, gjord av Esselson 9 1 . Studien utsattes för 46896 ord hämtade från II-källor (verk av Griboedov, Dostojevskij, Goncharov, Saltykov-Sjchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgskij, Ehrenburg, Simonov och N. Ostrovsky). De delades in i vardagliga ord (17 756 ord eller 37,9%) och icke-vardagliga ord (29140 ord eller 62,1%). Sedan delades hela orduppsättningen in i 4 grupper beroende på deras grammatiska natur: den 1:a gruppen inkluderade substantiv, adjektiv, adjektiv i substantivs funktion, pronomen och böjda siffror; i den andra gruppen - verb; i den 3:e gruppen - verbala particip, particip i funktionen av adjektiv och substantiv och gerunder; i den fjärde gruppen - oföränderliga former av adverb, prepositioner, konjunktioner och partiklar. Sammanfattningsresultaten (även tabeller med data för enskilda författare ges) ger följande förhållande:

1:a gruppen

2:a gruppen

3:e gruppen

4:e gruppen

vardaglig

tystlåten

Herdan karaktäriserar övervägandet av de kvantitativa data som sålunda erhållits med följande ord: ”De motiverar slutsatsen att grammatiska element bör betraktas som en faktor som bestämmer sannolikheten för ett språkligt uttryck. En sådan slutsats undviker den betungande kvalificeringen av varje ord som används. Det är tydligt att, eftersom grammatik och ordförråd inte lagras i vattentäta skal, är det inte heller rent "val" eller en ren "slump". Både grammatik och ordförråd innehåller båda beståndsdelarna, fastän i väsentligt varierande proportioner” 9 2 .<131>

En stor del av Herdans bok ägnas åt studiet av dualitet eller dualitet i språket, och själva begreppet dualitet bygger på matematiska egenskaper.

Således kan satser i projektiv geometri ordnas i två serier, så att varje sats i en serie kan erhållas från någon sats i en annan serie genom att ersätta orden punkt Och hetero. Till exempel, om ett påstående ges: "alla olika punkter tillhör en och endast en linje," så kan vi härleda motsvarande påstående från det: "vilka som helst två olika linjer tillhör en och endast en punkt." En annan metod för att bestämma dualitet är att plotta olika plan av fenomenet som studeras längs abskissan och ordinaterna. Så som Yul 9 3 gör, till exempel, räknas olika användningsfrekvenser längs abskissaxeln, och antalet lexikaliska enheter vars frekvens bestäms etc. räknas längs ordinataaxeln.

Under begreppet dualitet definierat på detta sätt, som i alla fall faktiskt har karaktären av en binär kod och som också anses vara den mest väsentliga egenskapen hos den språkliga strukturen, förs fenomen med ytterst olika kvaliteter in, vilket tillåter motsättning längs två plan : fördelningen av användningen av ord efter arten av lexikaliska enheter och fördelningen av lexikaliska enheter efter frekvens.användningen av ord; skriftliga och talade former av tal; lexikaliska och grammatiska element; synonymer och antonymer; fonem och dess grafiska representation; definierbar och definierande (Saussures signifiant och signifiy), etc.

Efter en kvantitativ studie av dualiteten hos ett eller annat särskilt, språkligt fenomen eller begränsad "text" dras som regel en slutsats, till vilken den språkliga universalitetens kvaliteter tillskrivs. Typen av sådana slutsatser och hur de motiveras kan ses i exemplet<132>studier av ordets och begreppets dualitet (i själva verket talar vi om förhållandet mellan ordets längd och begreppets volym - man måste komma ihåg att den extremt fria användningen av språkliga och andra termer i sådana verk gör ofta förståelsen mycket svår). Det är viktigt att notera att som det material som fungerade som källa för observationer av denna typ av språklig dualitet, användes följande: den internationella nomenklaturen för sjukdomar (ca 1000 namn) och det allmänna registret över sjukdomar i England och Wells för 1949 I detta fall dras följande allmänna slutsats: "Varje begrepp som betecknar en allmän idé har vad som kan kallas en "sfär" eller "volym." Den tillåter genom sitt medium att tänka på många föremål eller andra koncept som finns inom dess "sfär". Å andra sidan utgör alla artiklar som behövs för att definiera ett begrepp vad som kallas dess "innehåll". Volym och innehåll är ömsesidigt korrelerade - ju mindre innehållet är och följaktligen ju mer abstrakt begreppet är, desto större är dess omfattning eller volym, det vill säga desto fler föremål förs in under det. Detta kan ses som en analogi (i den konceptuella sfären) till principerna för kodning, enligt vilka längden på en symbol och användningsfrekvensen är beroende av varandra” 9 4 .

Dualitetsprincipen gäller även för särskilda problem. Till exempel när man fastställer likvärdigheten mellan betydelsen av ord på två olika språk. Som ett resultat av att studera den engelsk-tyska ordboken av Muret-Zanders med den matematiska iterationsmetoden, dras slutsatsen att sannolikheten för att använda ett engelskt ord med en eller flera betydelser i tysk översättning förblir konstant för varje initialbokstav i hela ordboken 9 5 . Övervägande av ordföljden i kinesiska ordböcker leder till slutsatsen att den är av taxonomisk karaktär, eftersom antalet streck i tecknet anger dess plats (som en oberoende radikal eller en viss underklass underordnad radikalen). Taxonomi är en underordnad klassificeringsprincip som används inom zoologi och botanik. Kherdan hävdar det<133>den kinesiska lexikografins grunder bygger också på principerna för taxonomi 9 6, etc.

För att göra en allmän bedömning av detta område för tillämpning av matematiska metoder för studier av språkliga problem (dvs språkstatistik), är det tydligen nödvändigt att utgå från den position som formulerades av Ettinger: "Matematik kan användas effektivt i lingvistikens tjänst endast när lingvisterna är klara över de verkliga gränserna för dess tillämpning, liksom möjligheterna med de matematiska modeller som används” 9 7 . Vi kan med andra ord tala om matematisk lingvistik när matematiska metoder bevisar sin lämplighet för att lösa de egentliga språkliga problemen, som i sin helhet utgör språkvetenskapen. Om så inte är fallet, även om detta kan öppna upp för nya aspekter av vetenskaplig forskning, så kan vi i det här fallet prata om vad som helst, men inte om lingvistik - i det här fallet menar vi inte olika typer av tillämpad lingvistik (vi kommer att prata om det senare). tal nedan), men vetenskaplig, eller teoretisk, lingvistik. Utifrån denna ståndpunkt bör det noteras att ur en språkforskares synvinkel är mycket inom språkstatistiken tveksamt och till och med förbryllande.

Låt oss vända oss till analysen av endast två exempel (för att inte röra upp presentationen), och ange att mycket betydande invändningar kan göras mot vart och ett av dem. Här har vi en kvantitativ distinktion mellan grammatiska och lexikala enheter. Det visar sig att för att göra en sådan distinktion är det nödvändigt att redan i förväg veta vad som hör till grammatikens område och vad som ska ordförrådas, eftersom språkets "grammatiska belastning" (dvs. helheten av grammatiska element). används i tal), som anges i citat ovan, "beror på gränsdragningslinjen som skiljer ordförråd från grammatik." Utan att veta var denna gräns går är det därför omöjligt att dra den angivna distinktionen. Vad är då meningen med den kvantitativa metoden att skilja det lexikala från grammatiken?<134>matic? Men när det gäller Herdan så tänker han inte särskilt på denna fråga och klassificerar djärvt språkliga element, med hänvisning till de grammatiska elementen "sammanhängande former", som av framställningen att döma bör förstås som yttre böjning, och "grammatiska ord". som omfattar prepositioner , konjunktioner, hjälpverb och pronomen - det senare i kraft av att de är "ersättare". Men om vi bara talar om denna kvalitet av pronomen och på grundval av dem relaterar dem till grammatiska element, så bör sådana ord som "ovannämnda", "namngivna", "givna" etc. också tillskrivas dem, så hur de också agerar som suppleanter. I samband med metoden att separera grammatiska element som används i språkstatistiken uppstår naturligtvis frågan om hur man i detta fall ska hantera sådana "icke-formella" grammatiska fenomen som ordföljd, toner, nollmorfem, paradigmatiska relationer (några av dessa fenomen). , förresten, hitta reflektion i de språk som studeras med matematiska metoder)? Hur man gör en skillnad i språk med rik intern böjning (som till exempel i de semitiska språken), där den inte bara grammatiskt modifierar roten (radikal), utan också ger den lexikal existens, eftersom roten utan permutationer har ingen riktig existens i språket? Vad ska förstås med ett språks grammatiska komplexitet, efter vilket kriterium bestäms det? Om den kvantitativa punkten, som i det här fallet betonas på alla möjliga sätt, så kommer ett av de grammatiskt svåraste språken att vara engelska, som har sådana konstruktioner som Ishallhavebeencalling eller Hewouldhavebeencalling. I dessa meningar kan endast call klassificeras som lexikal, och allt annat måste därför betraktas som grammatiskt. Vilka skäl finns för att koppla frekvensen av användning av grammatiska element med det allmänna eller abstrakta i betydelsen av grammatiska ord? När allt kommer omkring är det ganska uppenbart att den relativt stora användningsfrekvensen av grammatiska element bestäms av deras funktion i konstruktionen av meningar, och när det gäller betydelsernas abstrakthet är det mycket lätt att hitta en stor<135>antalet lexikaliska element som lätt kan konkurrera med grammatiska element i detta avseende, och är i hög grad sämre än dem i frekvens (till exempel, vara, existens, förlängning, utrymme, substans etc).

En liknande typ av absurditet uppstår framför oss när det gäller definitionen av dualitet (dualitet) av ordet och begreppet. Det är nödvändigt att ha en extremt märklig förståelse för språkets strukturella väsen för att utsätta det för forskning med användning av sjukdomsnomenklaturen och sjukhusregistret över sjukdomar, som, som antytts ovan, fungerade som källmaterial för mycket viktiga språkliga Slutsatser. Utan att uppehålla sig vid den helt oklara användningen av sådana termer som inte har en språklig existens, såsom ett begrepps sfär, volym och innehåll (för övrigt är ordets lexikaliska betydelse och begreppet betecknat med den vetenskapliga termen grovt förvirrad), låt oss gå till slutsatsen som görs i det här fallet. Som nämnts ovan har vi att göra med påståendet att "omfattning och innehåll är ömsesidigt korrelerade." Hela resonemangsförloppet som ger skäl för en sådan slutsats, liksom metoden för matematisk operation av språkliga fakta, visar tydligt att i detta fall en mycket väsentlig egenskap hos språket helt ignoreras, vilket stör alla beräkningar som görs : förmågan att uttrycka samma sak "innehåll" genom språkliga enheter av olika "volym", som utan tvekan dessutom har olika relativa användningsfrekvenser. Så vi kan utse samma person som Petrov, min bekant, han, en moskovit, en ung man, en universitetsanställd, min frus bror, en man som vi träffade på bron, etc. Mot bakgrund av sådana fakta finns det är utan tvivel endast privata slutsatser, till vilka emellertid, som framhållits, allmän betydelse tillmäts, men också ändamålsenligheten att tillämpa själva de kvantitativa metoderna på sådana språkliga problem.

Men ibland erbjuds lingvister slutsatser, vars giltighet inte är ifrågasatt. Detta är "språkets grundläggande lag", som består i det faktum att det i språket finns en viss stabilitet hos dess element och den relativa frekvensen av deras omnämnande.<136>konsumtion. Problemet med denna typ av upptäckter är dock att de länge har varit kända för lingvister. När allt kommer omkring är det ganska uppenbart att om språket inte hade en viss stabilitet och varje medlem i en given språkgemenskap fritt varierade språkets delar, så skulle ömsesidig kommunikation inte vara möjlig och själva existensen av språket skulle bli meningslös . När det gäller fördelningen av den relativa frekvensen av användningen av enskilda delar av språket, har den funnit sitt uttryck i lingvistik i form av tilldelningen av kategorier av passivt och aktivt ordförråd och grammatik, som L. V. Shcherba ägnade så mycket uppmärksamhet. I det här fallet kan statistiska metoder bara hjälpa lingvister i fördelningen av specifika språkliga element enligt kategorierna av den relativa frekvensen av deras användning, men de har ingen anledning att hävda att de upptäcker några nya mönster som är av värde för teoretisk lingvistik.

Å andra sidan ger språkstatistiken ett antal verkligt "ursprungliga" slutsatser som är extremt indikativa för arten av det vetenskapliga tänkandet hos dess anhängare. Således studeras den "politiska vokabulären" i verk av Churchill, Benes, Halifax, Stresemann och andra med komplexa statistiska metoder, och översättningar av deras verk till engelska används i beräkningarna för icke-engelsktalande författare. Beräkningsresultaten presenteras i form av ett flertal tabeller, matematiska formler och ekvationer. Den språkliga tolkningen av kvantitativa data i detta fall reduceras till att Churchills användning av "politisk vokabulär" är den mest typiska (?) för denna grupp av författare och att Churchills användning av ord i de fall han sysslar med politiska frågor är typiskt. av den engelska talgruppen 9 8 .

I ett annat fall, efter lämpliga statistiska manipulationer, dras slutsatsen att Hitler brutit mot dualiteten mellan "språk" och "tal" i den kvantitativa betydelsen av dessa termer i användningen av Nazityskland. Ett specialfall av förstörelsen av denna dualitet är den bokstavliga förståelsen<137>metaforiska vändningar (till exempel "häll salt i öppna sår"). Nazityskland stämplade sig med så många omänskliga handlingar att det knappast finns något behov av att döma det för denna språkliga illdåd 9 9 . Enligt Kherdan leder Marx definition av språket som tankens omedelbara verklighet också till brott mot den språkliga dualiteten, och dialektikens lag om ett fenomens övergång till sin motsats är enligt hans mening dualitetens missförstådda språkliga lag. av språket. Sådana tolkningar talar för sig själva.

Slutligen, en vanlig brist som är inneboende i alla ovanstående fall av den kvantitativa metoden att studera språkligt material och därmed förvärva en metodologisk karaktär är inställningen till språkliga element som en mekanisk uppsättning fakta som är absolut oberoende av varandra, i enlighet med vilken, om någon, eller mönster, de hänvisar endast till de numeriska relationerna för fördelningen av autonoma fakta, utanför deras systemiska beroenden. Det är sant att J. Watmou försöker på alla möjliga sätt att försäkra sig om att det är matematik som är bättre än någon form av språklig strukturanalys, som kan avslöja ett språks strukturella egenskaper. ”Modern matematik”, skriver han, ”handlar inte om mätning och kalkyl, vars noggrannhet är begränsad till sin natur, utan i första hand med struktur. Det är därför matematik i hög grad bidrar till noggrannheten av språkinlärning - i den mån en separat beskrivning, ännu mer begränsad till sin natur, inte är kapabel till ... Precis som i fysiken används matematiska element för att beskriva den fysiska världen, eftersom de antas motsvara element i den fysiska världen, så i matematisk lingvistik antas de matematiska elementen motsvara elementen i talvärlden” 101 . Men en sådan formulering av frågan räddar inte på något sätt situationen, eftersom den i bästa fall kan<138>ge en analys av språket antingen som en fysisk struktur, som fortfarande är långt ifrån tillräcklig för språket, och i slutändan fortfarande är av samma mekanistiska karaktär, eller som en logisk-matematisk struktur, och detta överför språket till ett annat plan, och i många avseenden främmande för det. Det är inte överflödigt att notera att Watmow förutser framgångarna för matematisk lingvistik endast i framtiden, och när det gäller deras verkliga resultat, utvärderar han dem med följande ord: "... nästan allt arbete som hittills har gjorts av Herdan, Zipf, Yul, Giro (Guiraux) och andra, är på intet sätt utanför räckvidden för kritik från både lingvistik och matematik; hon luktar amatörmässighet i hög grad” 103 . Alltså, om vi inte försöker förutsäga framtiden för matematiska metoder inom språkforskning, utan försöker uppskatta vad vi har idag, då måste vi erkänna att matematiken faktiskt har begränsats inom språkvetenskapens område bara till "mätning och räkning ”, och jag kunde inte ge en kvalitativ analys av språket och gräva i dess struktur.<139>

Låt oss försöka vara så objektiva som möjligt. I en viss del kan uppenbarligen kvantitativa data användas av lingvistik, men endast som hjälpmedel och främst i problem som har en praktisk inriktning. När det gäller de flesta av de kvantitativa metoderna för att studera individuella språkfenomen är R. Browns allmänna slutsats utan tvekan motiverad: "De kan betraktas som Kherdan anser dem, men vad är meningen med allt detta?" 104 . Låt oss föreställa oss att vi ställer frågan: "Vad är det för träd i den här trädgården?". Och som svar får vi: "Det finns hundra träd i den här trädgården." Är detta svaret på vår fråga, och är det verkligen vettigt? Men när det gäller många språkliga frågor ger matematiska metoder just sådana svar.

Det finns emellertid ett brett forskningsområde, där man i huvudsak använder matematiska metoder och samtidigt orienterar dem mot språkligt material, där ändamålsenligheten av en sådan kombination är utom tvivel. "Meningen" med denna forskningsverksamhet, dess betydelse bestäms av de mål som den strävar efter. Det har redan testats i praktiken. I det här fallet talar vi om problemen förknippade med skapandet av informationsmaskiner, strukturer för maskinöversättning av skrivna vetenskapliga texter, automatisering av översättningen av muntligt tal från ett språk till ett annat och med hela utbudet av uppgifter som kombineras i cybernetikens språkliga frågor. Hela uppsättningen av sådana problem får vanligtvis det allmänna namnet tillämpad lingvistik. Därmed skiljer den sig från den så kallade matematiska lingvistiken, som omfattar de arbetsområden som ovan betecknats som stilstatistik och språkstatistik, även om den på intet sätt undviker statistisk bearbetning av språkmaterial. Den kanske viktigaste egenskapen hos tillämpad lingvistik, som skiljer den från matematisk lingvistik, som beskrivits ovan, är att den förra har motsatt riktning: inte matematik för lingvistik, utan lingvistik.<140>(formaliserad med matematiska metoder) för en lång rad praktiska problem.

Det finns inget behov av att avslöja innehållet i enskilda problem som nu ingår i det extremt breda området för tillämpad lingvistik. Till skillnad från matematisk lingvistik diskuteras dessa problem aktivt i sovjetisk språklitteratur och börjar med rätta inta en alltmer framträdande plats i forskningsinstitutens vetenskapliga problem 105 . De är alltså redan välkända för vår språkgemenskap. Denna omständighet befriar oss emellertid inte från behovet av att utsätta dem för reflektion, i synnerhet ur synvinkeln av språkvetenskapens principer. Detta kommer utan tvekan att bidra till att eliminera de missförstånd som allt oftare uppstår mellan representanter för vetenskaper som är mycket avlägsna från varandra och som deltar i arbetet med tillämpad lingvistiks problem, och kommer att skissera vägar för deras konvergens, å ena sidan , och avgränsning av forskningsområden å andra sidan. Det säger sig självt att följande överväganden kommer att representera lingvistens synvinkel, och det är nödvändigt att matematiker inte bara försöker tillgodogöra sig den, utan, i samband med de frågor som ställs, ger dem sin tolkning.

Lingvist-teoretikern kan inte på något sätt nöja sig med att i alla fall<141>språket för de ändamål som tillämpas av den tillämpade lingvistiken, är deras grund en matematisk modell. I enlighet med detta uttrycks iakttagelser av språkets fenomen och de resultat som erhålls på detta sätt i termer och begrepp inom matematiken, d.v.s. genom matematiska ekvationer och formler. Låt oss titta på ett exempel för tydlighetens skull. Condon 1 06 och Zipf 1 07 fastställde att logaritmerna för frekvensen ( f) förekomsten av ord i en stor text ligger nästan i en rak linje, om de i diagrammet är korrelerade med logaritmerna för rang eller rang ( r) av dessa ord. Ekvationen f=c:r, Var Medär en konstant återspeglar detta förhållande i den begränsade meningen att c:r för inställt värde råterger den observerade frekvensen med stor approximation. Relation mellan f Och r, uttryckt med en matematisk formel, är en modell för förhållandet mellan de observerade värdena för användningsfrekvensen och rangen, eller rangordningen, av ord. Detta är ett av fallen med matematisk modellering. 

Hela teorin om information är helt baserad på den matematiska modellen för kommunikationsprocessen som utvecklats av C. Shannon 108 . Det definieras som "en matematisk disciplin som ägnas åt metoderna för att beräkna och uppskatta mängden information som finns i alla data, och studiet av processerna för att lagra och överföra information" (TSB, vol. 51, s. 128). Följaktligen får de grundläggande begreppen informationsteori ett matematiskt uttryck.Information mäts i binits eller binära enheter (en kod, som liknas vid ett språk, med två villkorade lika sannolika signaler sänder en binär informationsenhet under överföringen av varje tecken -antingen kod och den genomsnittliga mängden information som överförs<142>formationer. Redundans uttrycks som en procentandel av kodens totala överföringsförmåga”, 1 09 etc. På samma sätt kräver maskinöversättning algoritmisk utveckling av kartläggning av element från ett språk till ett annat, etc. 1 10 . Det här är andra fall av modellering.

Användningen av modeller utan någon mening kan vara till mycket stor hjälp, i synnerhet, med all sannolikhet, för att lösa de problem som tillämpad lingvistik uppställer. Men för teoretisk lingvistik är det mycket viktigt att en abstrakt modell som regel inte reproducerar alla egenskaper hos ett verkligt fenomen, alla dess funktionella egenskaper. Så, en arkitekt, innan han bygger ett hus, kan skapa sin modell, som återger huset som designas i alla de minsta detaljerna, och detta hjälper honom att lösa ett antal praktiska frågor relaterade till själva konstruktionen av huset. Men en sådan modell av ett hus, oavsett hur exakt den kan vara, saknar den "funktionen" och det syftet för vilket alla hus är byggda i allmänhet - den är inte kapabel att ge en person bostad. Situationen är liknande med språket, där modellen inte alltid kan återge alla dess kvaliteter. I det här fallet kompliceras saken ytterligare av att inte språkliga, utan matematiska kriterier används för att bygga modellen. "Matematiska modeller ... - skriver A. Ettinger, - spelar en oerhört viktig roll inom alla teknikområden, men eftersom de är ett verktyg för syntes är deras betydelse för lingvistiken, som i första hand är en historisk och beskrivande disciplin, naturligtvis begränsad. ” 1 11 .<143>

Matematisk modellering av ett språk är faktiskt endast tillämplig på dess statiska tillstånd, vilket är villkorat för en lingvist och i själva verket står i direkt konflikt med den grundläggande kvaliteten hos ett språk, vars existensform är utveckling. Det säger sig självt att det statiska studiet av ett språk på intet sätt är uteslutet från lingvistiken och är grunden för att sammanställa normativa grammatiker och ordböcker, deskriptiva grammatiker, praktiska grammatiker och ordböcker som tjänar som vägledning för praktiska studier av främmande språk etc. Men i alla sådana verk, som till övervägande del tillämpas i naturen, begränsar lingvisterna medvetet forskningsfältet och blundar inte på något sätt för andra aspekter av språket 1 12 . Med en statisk granskning av i synnerhet språket försvinner sådana egenskaper hos språket som är förknippade med dess dynamiska natur, såsom produktivitet, beroende av tankeformer och omfattande interaktion med kulturella, sociala, politiska, historiska och andra faktorer. forskarens synfält. Endast på det synkrona planet kan språket betraktas som ett system av konventionella tecken eller koder, vilket dock visar sig vara helt omotiverat så fort vi antar en dynamisk synvinkel mer lämpad för språk. Det är i utvecklingsprocesserna som språkkvaliteter som motivation, polysemi av ord som inte har stabila gränser, icke-autonomi för betydelsen av ett ord och dess ljudskal, och den kreativa potentialen hos ett ord som är kopplat till sammanhanget är manifesteras, och allt detta står i skarp motsägelse till huvudegenskaperna hos en kod eller ett tecken 1 13 . Uppenbarligen kan man inom den tillämpade lingvistiken också tänka på alla dessa egenskaper hos språket och i praktiska syften nöja sig med så att säga en "ögonblicksbild" av språket, som ändå är kapabel att ge en ganska ungefärlig uppfattning om mekanismen för dess funktion.<144>nirovaniya. Men varje sådan "ögonblicksbild", om den betraktas som ett språkfaktum och inte som ett faktum i ett system av konventionella koder, måste inkluderas i den oändliga rörelseprocessen där språket alltid existerar 1 14 . Den kan inte studeras utanför de specifika förhållanden som kännetecknar denna rörelse, som sätter sin prägel på språkets givna tillstånd och bestämmer potentialen för dess vidare utveckling. Här är det samma skillnad som mellan ett ögonblicksfotografi av en person och hans porträtt målat med en pensel av en sann konstnär. I konstnärens verk har vi framför oss en generaliserande bild av en person i all originalitet av inte bara hans fysiska utseende, utan också hans inre andliga innehåll. Från ett konstnärligt porträtt kan vi också läsa det förflutna för den person som avbildas på det och avgöra vad han är kapabel till i sina handlingar. Och en ögonblicksbild, även om den kan ge en mer exakt bild av originalets utseende, saknar dessa egenskaper och fångar ofta både en oavsiktlig finne som hoppade upp på näsan och<145>en helt okarakteristisk pose eller uttryck, som i slutändan leder till en förvrängning av originalet.

Det bör noteras att metoden med "snapshots" naturligtvis kan tillämpas på fakta om språkutveckling. Men i det här fallet kommer vi faktiskt bara att ha att göra med separata tillstånd i språket, som i sin kvantitativa karaktärisering visar sig vara sammankopplade inte mer än en jämförande kvantitativ karakterisering av olika språk. Denna typ av kvantitativ "dynamik" kommer inte att innehålla något organiskt, och sambandet mellan de enskilda tillstånden i språket kommer endast att vila på jämförelsen av numeriska relationer. Om i detta fall också att tillgripa en analogi, kan vi hänvisa till barnets tillväxt. Hans utveckling kan naturligtvis representeras i form av dynamiken i numeriska data om hans vikt, längd, ändrade förhållanden mellan volymen av delar av hans kropp, men alla dessa data är absolut fristående från allt som i första hand utgör den individuella essensen av en person - hans karaktär, böjelser, vanor. , smaker, etc.

En annan negativ sida av den matematiska "modelleringen" av språket är det faktum att det inte kan fungera som den allmänna principen på vilken det är möjligt att genomföra en heltäckande och heltäckande - systematisk beskrivning av språket. Endast ett matematiskt förhållningssätt till exempelvis språkfenomenen kommer inte att göra det möjligt att besvara ens sådana grundläggande frågor (utan vilka själva existensen av språkvetenskapen är otänkbar), såsom: vad är språk, vilka fenomen bör vara klassificeras som korrekt språklig, hur ett ord eller en mening definieras, vilka är de grundläggande begreppen och kategorierna av språk, etc. Innan du vänder dig till de matematiska metoderna för att studera språk är det nödvändigt att redan ha svar (även i form av ett arbetssätt) hypotes) till alla dessa frågor i förväg. Det finns ingen anledning att blunda för det faktum att alla dessa begrepp och kategorier oundvikligen måste accepteras eftersom de definierades av traditionella eller, relativt sett, i alla fall som vi känner till studien av språkliga fenomen med matematiska metoder. kvalitativa metoder.

Denna egenskap hos matematiska metoder i deras språkliga tillämpning noterades av Spang-Hanssen när pi<146>sal: ”Man bör ha i åtanke att observerade fakta som får ett kvantitativt uttryck ... inte har något värde om de inte ingår i beskrivningen, och i språkliga syften bör det vara en systematisk beskrivning, närbesläktad med en kvalitativ språklig beskrivning. beskrivning och teori” 1 15 . I ett annat tal av Spang-Hanssen finner vi ett förtydligande av denna tanke: ”Tills dess att möjligheten att konstruera ett kvantitativt system är bevisad, och så länge det finns ett allmänt accepterat kvalitativt system för ett visst ämnesområde, frekvensberäkningar och annat numeriska egenskaper ur en språklig synvinkel vision är inte meningsfull" 1 16 . Liknande idéer uttrycks av Uldall, som något oväntat förbinder dem med utvecklingen av de allmänna teoretiska grunderna för glossematiken: ”När en lingvist betraktar eller mäter allt som han anser och mäter, är det inte självt kvantitativt bestämt; till exempel är ord, när de räknas, definierade, om de alls definieras, i helt olika termer.<147>

Sålunda visar det sig att matematiska metoder både i teoretiska termer och i sin praktiska tillämpning är direkt beroende av språkliga begrepp och kategorier definierade av traditionella, filologiska eller, som nämnts ovan, kvalitativa metoder. När det gäller tillämpad lingvistik är det viktigt att inse detta beroende, och följaktligen att bekanta sig med helheten av huvudkategorierna för traditionell lingvistik.

Det finns sant att det inte finns någon anledning att förebrå företrädare för de exakta vetenskaperna som arbetar inom området tillämpad lingvistik för att de inte använder data från modern lingvistik. Detta stämmer inte överens med det faktiska tillståndet. De känner inte bara mycket väl till, utan använder också i stor utsträckning i sitt arbete de system av differentiella egenskaper som etablerats av lingvister som är karakteristiska för olika språk, distributionen och arrangemanget av språkliga element inom specifika språksystem, prestationerna av akustisk fonetik, etc. Men i detta fall krävs en mycket betydande reservation. I själva verket använder representanter för de exakta vetenskaperna data från endast en riktning inom lingvistik - den så kallade deskriptiva lingvistiken, som medvetet särskiljde sig från den teoretiska lingvistikens traditionella problem, långt ifrån att täcka hela språkforskningens område, från en egentlig språklig synpunkt har den betydande metodologiska brister, vilket ledde till nyligen avslöjad kris 1 18 , och har dessutom en rent praktisk inriktning, motsvarande den tillämpade lingvistikens intressen. Alla reservationer och förebråelser som framfördes ovan mot den statiska hänsynen till språket är tillämpliga på deskriptiv lingvistik. Ett sådant ensidigt förhållningssätt av deskriptiv lingvistik kan, utredaren<148>Det kan emellertid endast motiveras av de uppgifter som tillämpad lingvistik ställer sig, men det uttömmer långt ifrån hela innehållet i språkvetenskapen.

I processen att utveckla frågor om tillämpad lingvistik kan nya teoretiska problem uppstå, och de har faktiskt redan uppstått. En del av dessa problem är nära besläktade med den tillämpade lingvistikens specifika uppgifter och syftar till att övervinna de svårigheter som uppstår för att lösa dessa problem. Andra problem är direkt relaterade till teoretisk lingvistik, vilket möjliggör ett nytt perspektiv på traditionella idéer eller öppnar upp nya områden inom språkforskning, nya begrepp och teorier. Bland dessa senare är till exempel problemet med att skapa ett "maskinspråk" (eller mellanspråk), som är närmast besläktat med en komplex uppsättning sådana kardinalfrågor inom teoretisk lingvistik som förhållandet mellan begrepp och lexikaliska betydelser, logik och grammatik, diakroni och synkroni, språkets teckenkaraktär, essensen av språklig mening, principerna för att konstruera konstgjorda språk, etc. 1 19 . I det här fallet är det särskilt viktigt att etablera ömsesidig förståelse och samvälde i det gemensamma arbetet av representanter för språkliga discipliner och de exakta vetenskaperna. När det gäller den språkliga sidan, i det här fallet borde vi tydligen inte tala om att redan i förväg begränsa ansträngningarna från till exempel designers av översättningsmaskiner” och försöka fastställa arbetsförmågan hos sådana maskiner med verserna i N. Gribachev eller V. Kochetovs prosa 1 20 . Maskinen själv kommer att hitta gränserna för dess kapacitet och lönsamhet - gränserna för dess användning. Men lingvister måste, som deras bidrag till den gemensamma saken, ta med sig sin kunskap om egenskaperna hos språkets struktur, dess mångsidighet, de inre korsande förhållandena mellan dess element, såväl som språkets breda och multilaterala kopplingar med fysiska, fysiologiska , mentalt och logiskt<149>mi-fenomen, specifika funktionsmönster och språkets utveckling. Helheten av denna kunskap är nödvändig för konstruktörerna av motsvarande maskiner för att inte vandra åt fel håll, utan för att göra sökningen målmedveten och tydligt orienterad. Till och med den mycket korta genomgången av fallen med tillämpning av matematiska metoder på språkliga problem, som gjordes i denna uppsats, övertygar om att sådan kunskap på intet sätt kommer att vara överflödig för företrädare för de exakta vetenskaperna.

På grundval av alla ovanstående överväganden kan man uppenbarligen komma till några generella slutsatser.

Så, matematisk lingvistik? Om detta innebär användningen av matematiska metoder som en universell huvudnyckel för att lösa alla språkliga problem, bör sådana påståenden erkännas som absolut oberättigade. Allt som har gjorts i denna riktning har hittills gjort väldigt lite eller till och med inte alls för att lösa språkvetenskapens traditionella problem. I värsta fall åtföljs tillämpningen av matematiska metoder av uppenbara absurditeter eller är, ur språklig synvinkel, absolut meningslös. I bästa fall kan matematiska metoder användas som hjälpmetoder för språkforskning, och ställas till tjänst för specifika och begränsade språkliga problem. Det kan inte vara fråga om någon "kvantitativ språkfilosofi" i detta fall. Fysik, psykologi, fysiologi, logik, sociologi och etnologi inkräktade på sin tid på språkvetenskapens oberoende, men de kunde inte underkuva lingvistiken. Motsatsen hände - lingvistiken drog fördel av dessa vetenskapers prestationer och började, i den utsträckning det var nödvändigt för sig själv, att använda deras hjälp, och berikade därigenom arsenalen av sina forskningsmetoder. Nu är det tydligen matematikens tur. Det är att hoppas att denna nya gemenskap också kommer att bidra till att stärka språkvetenskapen, förbättra dess arbetsmetoder och öka deras mångfald. Det är därför lika legitimt att tala om matematisk lingvistik som om fysisk lingvistik, fysiologisk lingvistik, logisk lingvistik, psykologisk lingvistik och<150>etc. Det finns ingen sådan lingvistik, det finns bara en lingvistik, som lönsamt använder data från andra vetenskaper som hjälpforskningsverktyg. Det finns alltså ingen anledning att dra sig tillbaka före den nya vetenskapens anstormning och att lätt ge efter för den de positioner den har vunnit. Här är det mycket lämpligt att påminna om A. Martinets ord: ”Kanske är det frestande att ansluta sig till en eller annan större tankerörelse genom att använda några väl valda termer, eller att med någon matematisk formel deklarera stringens i sitt resonemang. Men det är dags för lingvister att inse sin vetenskaps oberoende och att befria sig från det underlägsenhetskomplex som gör att de förknippar något av sina handlingar med en eller annan allmän vetenskaplig princip, som ett resultat av vilken verklighetens konturer alltid blir bara vagare, istället för att bli tydligare 21 .

Därför matematik i sig och lingvistik i sig. Detta utesluter inte på något sätt deras ömsesidiga hjälp eller ett vänskapligt möte i gemensamt arbete med gemensamma problem. Denna typ av tillämpningsplats för de två vetenskapernas samordnade ansträngningar är hela den breda skalan av problem som ingår i tillämpad lingvistik och är av stor nationell ekonomisk betydelse. Man skulle bara önska att båda vetenskaperna i sitt gemensamma arbete visade maximal ömsesidig förståelse, vilket utan tvekan också skulle bidra till maximal fruktbarhet av deras samarbete.<151>

Hur mycket kostar det att skriva ditt papper?

Välj typ av arbete Examensarbete (bachelor / specialist) Del av uppsatsen Magisterexamen Kursuppgifter med praktik Kursteori Uppsats Examination Uppgifter Attestationsarbete (VAR / WQR) Affärsplan Tentamensfrågor MBA-diplom Examensarbete (högskola / teknisk skola) Övriga fall Laborationer , RGR Onlinehjälp Övningsrapport Informationssökning Presentation i PowerPoint Forskarutbildning Medföljande material till diplomet Artikel Testritningar mer »

Tack, ett mejl har skickats till dig. Kolla din mail.

Vill du ha en kampanjkod med 15 % rabatt?

Ta emot SMS
med kampanjkod

Framgångsrikt!

?Berätta för kampanjkoden under ett samtal med chefen.
Kampanjkoden kan endast användas en gång på din första beställning.
Typ av kampanjkod - " examensarbete".

Interaktion mellan matematik och lingvistik


Introduktion

Kapitel 1. Historien om tillämpningen av matematiska metoder i lingvistik

1.1. Bildandet av strukturell lingvistik vid 1800- och 1900-talets skifte

1.2. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1. Maskinöversätta

2.2.Statistiska metoder i språkinlärning

2.3. Att lära sig ett språk med metoder för formell logik

2.4. Utsikter för tillämpning av matematiska metoder i lingvistik

Slutsats

Litteratur

Bilaga 1. Ronald Schleifer. Ferdinand de Saussure

Bilaga 2. Ferdinand de Saussure (översättning)

Introduktion


Under 1900-talet har det funnits en fortsatt trend mot interaktion och interpenetration av olika kunskapsområden. Gränserna mellan de enskilda vetenskaperna suddas ut gradvis; det finns fler och fler grenar av mental aktivitet som befinner sig "i korsningen" av humanitär, teknisk och naturvetenskaplig kunskap.

En annan uppenbar egenskap hos moderniteten är viljan att studera strukturer och deras beståndsdelar. Därför ges en allt större plats, både i vetenskapsteori och i praktiken, till matematik. Genom att å ena sidan komma i kontakt med logik och filosofi, å andra sidan med statistik (och följaktligen med samhällsvetenskap), tränger matematiken allt djupare in i de områden som länge ansågs vara rent. "humanitär", som utökar sin heuristiska potential (svaret på frågan "hur mycket" hjälper ofta till att svara på frågorna "vad" och "hur"). Språkvetenskapen var inget undantag.

Syftet med mitt kursarbete är att kort belysa sambandet mellan matematik och en sådan gren av lingvistik som lingvistik. Sedan 1950-talet har matematik använts inom lingvistik för att skapa en teoretisk apparat för att beskriva språkens struktur (både naturliga och artificiella). Det bör dock sägas att den inte omedelbart fann en sådan praktisk tillämpning för sig själv. Inledningsvis började matematiska metoder inom lingvistik användas för att klargöra lingvistikens grundläggande begrepp, men med utvecklingen av datateknik började en sådan teoretisk premiss att få tillämpning i praktiken. Lösningen av sådana uppgifter som maskinöversättning, maskinell informationshämtning, automatisk textbearbetning krävde ett fundamentalt nytt förhållningssätt till språket. Språkvetarna ställdes inför frågan: hur man lär sig att representera språkliga mönster i den form i vilken de kan appliceras direkt på tekniken. Termen "matematisk lingvistik", som är populär i vår tid, syftar på all språklig forskning som använder exakta metoder (och begreppet exakta metoder inom naturvetenskap är alltid nära besläktat med matematik). Vissa forskare från de senaste åren tror att uttrycket i sig inte kan höjas till en term, eftersom det inte betyder någon speciell "lingvistik", utan bara en ny riktning fokuserad på att förbättra, öka noggrannheten och tillförlitligheten av språkforskningsmetoder . Lingvistik använder både kvantitativa (algebraiska) och icke-kvantitativa metoder, vilket för den närmare matematisk logik, och följaktligen till filosofi och till och med psykologi. Till och med Schlegel noterade samspelet mellan språk och medvetande, och Ferdinand de Saussure, en framstående lingvist i början av 1900-talet (jag kommer att berätta om hans inflytande på utvecklingen av matematiska metoder inom lingvistik senare), kopplade samman språkets struktur med dess tillhörighet till folket. Den moderna forskaren L. Perlovsky går längre och identifierar språkets kvantitativa egenskaper (till exempel antalet kön, fall) med särdragen hos den nationella mentaliteten (mer om detta i avsnitt 2.2, "Statistiska metoder i lingvistik").

Samspelet mellan matematik och lingvistik är ett mångfacetterat ämne, och i mitt arbete kommer jag inte att uppehålla mig vid alla, utan först och främst vid dess tillämpade aspekter.

Kapitel I. Historien om tillämpningen av matematiska metoder i lingvistik


1.1 Bildandet av strukturell lingvistik vid början av XIX - XX-talet


Den matematiska beskrivningen av språket är baserad på idén om språket som en mekanism, som går tillbaka till den berömda schweiziska lingvisten från det tidiga nittonhundratalet, Ferdinand de Saussure.

Den första länken till hans koncept är teorin om språket som ett system som består av tre delar (språket självt - språket, tal - parole och talaktivitet - språket), där varje ord (medlem av systemet) anses inte i sig självt , men i anslutning till andra medlemmar. Som en annan framstående lingvist, dansken Louis Hjelmslev, senare noterade, var Saussure "den förste som krävde ett strukturellt förhållningssätt till språket, det vill säga en vetenskaplig beskrivning av språket genom att registrera relationerna mellan enheter."

Saussures förståelse av språket som en hierarkisk struktur var den första som ställde problemet med värdet och betydelsen av språkliga enheter. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter.

Den strukturella enheten i Saussures språk betraktade ordet "tecken", där ljud och betydelse kombinerades. Inget av dessa element existerar utan varandra: därför förstår modersmålet de olika nyanserna av betydelsen av ett polysemantiskt ord som ett separat element i den strukturella helheten, i språket.

I F. de Saussures teori kan man alltså se samspelet mellan lingvistik å ena sidan med sociologi och socialpsykologi (det bör noteras att samtidigt utvecklas Husserls fenomenologi, Freuds psykoanalys, Einsteins relativitetsteori. , experiment pågår med form och innehåll inom litteratur, musik och bildkonst), å andra sidan med matematik (konsistensbegreppet motsvarar det algebraiska språkbegreppet). Ett sådant begrepp förändrade begreppet språklig tolkning som sådant: Fenomen började tolkas inte i relation till orsakerna till deras förekomst, utan i relation till nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikterna kan vara opersonliga, "omedvetna" i ordets freudianska mening).

Funktionen av den språkliga mekanismen manifesteras genom talaktiviteten hos modersmålstalare. Resultatet av tal är de så kallade "korrekta texterna" - sekvenser av talenheter som lyder vissa mönster, av vilka många tillåter matematisk beskrivning. Teorin om sätt att beskriva den syntaktiska strukturen behandlar studier av metoder för matematisk beskrivning av korrekta texter (främst meningar). I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

I väst utvecklas Saussures idéer av den store schweiziska lingvistens yngre samtida: i Danmark - L. Hjelmslev, redan av mig nämnd, som gav upphov till den algebraiska språkteorin i sitt arbete "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tjeckien - rysk vetenskapsman-emigrant N. Trubetskoy.

Statistiska regelbundenheter i studiet av språk började behandlas av ingen mindre än genetikens grundare, Georg Mendel. Det var först 1968 som filologer upptäckte att han under de sista åren av sitt liv fascinerades av studiet av språkliga fenomen med hjälp av matematikens metoder. Mendel tog med sig denna metod till lingvistik från biologin; på 1990-talet var det bara de mest vågade lingvisterna och biologerna som hävdade genomförbarheten av en sådan analys. I arkiven av klostret St. Tomasz i Brno, vars abbot var Mendel, hittades ark med kolumner av efternamn som slutade på "mann", "bauer", "mayer" och med några bråkdelar och beräkningar. I ett försök att upptäcka de formella lagarna för släktnamnens ursprung, gör Mendel komplexa beräkningar, där han tar hänsyn till antalet vokaler och konsonanter i det tyska språket, det totala antalet ord han anser, antalet efternamn, etc.

I vårt land började den strukturella lingvistiken utvecklas ungefär samtidigt som i väst - vid 1800- och 1900-talens skiftning. Samtidigt med F. de Saussure utvecklades begreppet språk som ett system i deras arbeten av professorer vid Kazan University F.F. Fortunatov och I.A. Baudouin de Courtenay. Den senare korresponderade länge med de Saussure, respektive Genève- och Kazan-språkskolan samarbetade med varandra. Om Saussure kan kallas ideologen för "exakta" metoder inom lingvistik, så lade Baudouin de Courtenay de praktiska grunderna för deras tillämpning. Han var den förste att skilja lingvistik (som en exakt vetenskap med statistiska metoder och funktionellt beroende) från filologi (en gemenskap av humanitära discipliner som studerar andlig kultur genom språk och tal). Forskaren själv trodde att "lingvistik kan vara användbar inom en snar framtid, bara befriad från den obligatoriska föreningen med filologi och litteraturhistoria". Fonologi blev "testplatsen" för införandet av matematiska metoder i lingvistiken - ljud som "atomer" i språksystemet, med ett begränsat antal lätt mätbara egenskaper, var det lämpligaste materialet för formella, rigorösa beskrivningsmetoder. Fonologi förnekar existensen av mening i ljud, så den "mänskliga" faktorn eliminerades i studierna. I denna mening är fonem som fysiska eller biologiska föremål.

Fonemer, som de minsta språkliga element som är acceptabla för perception, representerar en separat sfär, en separat "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Huvudsaken är att fonemet kommer att utföra sin huvudsakliga - meningsfulla - funktion. Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med eller utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talet, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särskiljande egenskaperna" hos fonem. Dessa funktioner är baserade på strukturen hos talorganen - tunga, tänder, stämband. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av en "röst" (spänningen i stämbanden) och röstnivån som skiljer ett fonem från ett annat. Därmed kan fonologi betraktas som ett exempel på den allmänna språkregel som Saussure beskrev: "Det finns bara skillnader i språket". Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språket är både ett uttryck för ordens betydelse och ett kommunikationsmedel, och dessa två funktioner sammanfaller aldrig. Vi kan lägga märke till växlingen mellan form och innehåll: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till morfem, morfem till ord, ord till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än bara summan av dess delar.

Saussure föreslog idén om en ny vetenskap från 1900-talet, skild från lingvistik, som studerade teckens roll i samhället. Saussure kallade denna vetenskap semiologi (från grekiskan "semeon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920-1930-talen och i Paris på 1950-1960-talen, utökade studiet av språk och språkliga strukturer till litterära rön sammansatta (eller artikulerade) i termer av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade sig Saussure åt en "semiotisk" analys av sen romersk poesi, och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i dess språkliga analys: den var ett försök att i ett system studera problemet med "sannolikhet" i språket. Sådan forskning hjälper till att fokusera på den "verkliga sidan" av sannolikhet; "nyckelordet" som Saussure letar efter ett anagram för är enligt Jean Starobinsky "ett verktyg för poeten, inte källan till diktens liv." Dikten tjänar till att byta ut nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar” (se . Bilaga 1).

Saussures försök att studera egennamn i senromersk poesi framhäver en av komponenterna i hans språkliga analys – teckens godtyckliga karaktär, såväl som den formella essensen av Saussures språkvetenskap, som utesluter möjligheten att analysera betydelse. Todorov drar slutsatsen att idag verkar Saussures verk vara extremt konsekventa i sin ovilja att studera symbolerna för ett fenomen som har en tydligt definierad betydelse [Bilaga 1]. När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semiologi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoder för slumpmässig tolkning baserad på dessa begrepp, och å andra sidan strukturalistiska begrepp som raderar motsättningen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik, Ferdinand de Saussures skrifter om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ryska vetenskapsmän var också representerade vid den första internationella lingvistkongressen i Haag 1928. S. Kartsevsky, R. Yakobson och N. Trubetskoy gjorde en rapport som undersökte språkets hierarkiska struktur - i andan av de modernaste idéerna för början av förra seklet. Jakobson utvecklade i sina skrifter Saussures idéer om att de grundläggande elementen i ett språk först och främst bör studeras i samband med deras funktioner, och inte med orsakerna till deras förekomst.

Tyvärr, efter att Stalin kom till makten 1924, kastas rysk lingvistik, liksom många andra vetenskaper, tillbaka. Många begåvade vetenskapsmän tvingades emigrera, förvisades från landet eller dog i läger. Det var inte förrän i mitten av 1950-talet som en viss pluralism av teorier blev möjlig – mer om det i avsnitt 1.2.


1.2 Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet


I mitten av 1900-talet hade fyra världsspråkliga skolor bildats, som var och en visade sig vara förfader till en viss "exakt" metod. Den fonologiska skolan i Leningrad (dess förfader var elev till Baudouin de Courtenay L.V. Shcherba) använde ett psykolingvistiskt experiment baserat på analys av inföddas tal som huvudkriteriet för att generalisera ljud i form av ett fonem.

Forskare från Prags språkcirkel, i synnerhet dess grundare N.S. Trubetskoy, som emigrerade från Ryssland, utvecklade teorin om oppositioner - språkets semantiska struktur beskrevs av dem som en uppsättning oppositionellt konstruerade semantiska enheter - Sem. Denna teori tillämpades i studiet av inte bara språk, utan också konstnärlig kultur.

Den amerikanska deskriptivismens ideologer var lingvisterna L. Bloomfield och E. Sapir. Språket presenterades för deskriptivister som en uppsättning talpåståenden, som var huvudobjektet för deras studie. Deras fokus låg på reglerna för vetenskaplig beskrivning (därav namnet) av texter: studiet av organisation, arrangemang och klassificering av deras element. Formalisering av analytiska procedurer inom fonologi och morfologi (utveckling av principer för studiet av språk på olika nivåer, distributiv analys, metoden för direkta beståndsdelar, etc.) ledde till formuleringen av allmänna frågor om språklig modellering. Ouppmärksamhet på planen för språkets innehåll, liksom den paradigmatiska sidan av språket, tillät inte deskriptivister att tolka språket som ett system fullt ut.

På 1960-talet utvecklades teorin om formell grammatik, som uppstod främst på grund av den amerikanske filosofen och lingvisten N. Chomskys arbete. Han anses med rätta vara en av de mest kända moderna vetenskapsmännen och offentliga personerna, många artiklar, monografier och till och med en dokumentär i full längd ägnas åt honom. Med namnet på ett i grunden nytt sätt att beskriva den syntaktiska struktur som Chomsky uppfann - generativ (generativ) grammatik - kallades motsvarande trend inom lingvistik generativism.

Chomsky, en ättling till invandrare från Ryssland, studerade lingvistik, matematik och filosofi vid University of Pennsylvania sedan 1945, starkt influerad av sin lärare Zelig Harris - liksom Harris, Chomsky betraktade och betraktar fortfarande sina politiska åsikter nära anarkismen (han är fortfarande känd som kritiker av det befintliga amerikanska politiska systemet och som en av anti-globalismens andliga ledare).

Chomskys första stora vetenskapliga arbete, hans magisteravhandling Morphology of Modern Hebrew (1951), förblev opublicerad. Chomsky doktorerade från University of Pennsylvania 1955, men mycket av den forskning som ligger till grund för hans avhandling (publicerad i sin helhet först 1975 under titeln The Logical Structure of Linguistic Theory) och hans första monografi, Syntactic Structures (1957, Rus. trans. . 1962), framfördes vid Harvard University 1951-1955. Samma 1955 flyttade vetenskapsmannen till Massachusetts Institute of Technology, där han blev professor 1962.

Chomskys teori har gått igenom flera stadier i sin utveckling.

I den första monografin "Syntaktiska strukturer" presenterade vetenskapsmannen språket som en mekanism för att generera en oändlig uppsättning meningar med en ändlig uppsättning grammatiska medel. För att beskriva språkliga egenskaper föreslog han begreppen djupa (dolda från direkt perception och genererade av ett system av rekursiva, d.v.s. kan tillämpas upprepade gånger, regler) och ytliga (direkt uppfattade) grammatiska strukturer, såväl som transformationer som beskriver övergången från djupa strukturer till ytstrukturer. Flera ytstrukturer kan motsvara en djup struktur (till exempel den passiva konstruktionen Dekretet undertecknas av presidenten härrör från samma djupa struktur som den aktiva konstruktionen presidenten undertecknar dekretet) och vice versa (till exempel tvetydigheten Moder älskar dotter beskrivs som resultatet av sammanträffandet av ytstrukturer som går tillbaka till två olika djup, i den ena är mamman den som älskar dottern och i den andra den som dottern älskar).

Chomskys standardteori anses vara "Aspects"-modellen som anges i Chomskys bok "Aspects of the Theory of Syntax". I denna modell introducerades för första gången regler för semantisk tolkning i formell teori, vilket tillskrev mening till djupa strukturer. I Aspects ställs språklig kompetens i motsats till språkanvändning (performance), den så kallade Katz-Postalhypotesen om bevarande av mening under transformation antas, i samband med vilken begreppet valfri transformation utesluts, och en apparat av syntaktiska egenskaper som beskriver lexikal kompatibilitet introduceras.

På 1970-talet arbetade Chomsky med teorin om styrning och bindning (GB-teori - från orden regering och bindande) - mer generell än den tidigare. I den övergav forskaren de specifika reglerna som beskriver de syntaktiska strukturerna för specifika språk. Alla transformationer har ersatts med en universell rörelsetransformation. Inom ramen för GB-teorin finns även privata moduler som var och en ansvarar för sin egen del av grammatiken.

Redan nyligen, 1995, lade Chomsky fram ett minimalistiskt program, där mänskligt språk beskrivs som maskinspråk. Det är bara ett program, inte en modell eller en teori. I den identifierar Chomsky två huvuddelsystem i den mänskliga språkapparaten: lexikonet och datorsystemet, såväl som två gränssnitt - fonetisk och logisk.

Chomskys formella grammatiker har blivit klassiska för att beskriva inte bara naturliga utan också konstgjorda språk - i synnerhet programmeringsspråk. Den strukturella lingvistikens utveckling under andra hälften av 1900-talet kan med rätta betraktas som en "chomskisk revolution".

Moskvas fonologiska skola, vars representanter var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, använde en liknande teori för att studera fonetik. Så småningom börjar "exakta" metoder tillämpas med avseende på inte bara fonetik, utan också syntax. Både lingvister och matematiker, både här och utomlands, börjar studera språkets struktur. På 1950- och 60-talen började ett nytt skede i samspelet mellan matematik och lingvistik i Sovjetunionen, i samband med utvecklingen av maskinöversättningssystem.

Drivkraften till början av dessa arbeten i vårt land var den första utvecklingen inom området maskinöversättning i USA (även om den första mekaniserade översättningsanordningen av P.P. Smirnov-Trojanskij uppfanns i Sovjetunionen 1933, eftersom den var primitiv, blev inte utbredd). 1947 kom A. Butt och D. Britten med en kod för ord-för-ord-översättning med hjälp av en dator, ett år senare föreslog R. Richens en regel för att dela upp ord i stammar och ändelser i maskinöversättning. De åren var helt annorlunda än idag. Det var mycket stora och dyra maskiner som tog hela rum och krävde en stor stab av ingenjörer, operatörer och programmerare för att underhålla dem. I grund och botten användes dessa datorer för att utföra matematiska beräkningar för militära institutioners behov - det nya inom matematik, fysik och teknik tjänade först och främst militära angelägenheter. I de tidiga stadierna stöddes utvecklingen av MP aktivt av militären, medan (under det kalla krigets förhållanden) den rysk-engelska riktningen utvecklades i USA och den anglo-ryska riktningen i Sovjetunionen.

I januari 1954 ägde Georgetown-experimentet, den första offentliga demonstrationen av översättning från ryska till engelska på IBM-701-maskinen, rum vid Massachusetts Technical University. Sammanfattning av meddelandet om den framgångsrika passagen av experimentet, gjort av D.Yu. Panov, dök upp i RJ "Mathematics", 1954, nr 10: "Översättning från ett språk till ett annat med hjälp av en maskin: en rapport om det första framgångsrika testet."

D. Yu. Panov (på den tiden chef för Institutet för vetenskaplig information - INI, senare VINITI) involverade I. K. Belskaya, som senare ledde maskinöversättningsgruppen vid Institutet för exakt matematik och datorteknik vid USSR Academy of Sciences, för att arbeta med maskinöversättning. I slutet av 1955 går den första erfarenheten av att översätta från engelska till ryska med hjälp av BESM-maskinen tillbaka. Program för BESM sammanställdes av N.P. Trifonov och L.N. Korolev, vars doktorsavhandling ägnades åt metoder för att konstruera ordböcker för maskinöversättning.

Parallellt utfördes arbete med maskinöversättning vid institutionen för tillämpad matematik vid det matematiska institutet vid USSR Academy of Sciences (nu M.V. Keldysh Institute of Applied Mathematics of the Russian Academy of Sciences). På initiativ av matematikern A.A. Lyapunov. Han involverade O.S. Kulagin och hennes elever T.D. Wentzel och N.N. Ricco. Lyapunovs och Kulaginas idéer om möjligheten att använda teknik för att översätta från ett språk till ett annat publicerades i tidskriften Nature, 1955, nr 8. Från slutet av 1955 har T.N. Moloshnaya, som sedan började självständigt arbete med den engelsk-ryska översättningsalgoritmen.

R. Frumkina, som vid den tiden var engagerad i översättningsalgoritmen från spanska, minns att det i detta skede av arbetet var svårt att ta några konsekventa steg. Mycket oftare var jag tvungen att följa den heuristiska upplevelsen - min egen eller kollegor.

Den första generationen av maskinöversättningssystem var dock mycket ofullkomliga. Alla var baserade på sekventiella översättningsalgoritmer "ord för ord", "fras för fras" - semantiska samband mellan ord och meningar togs inte i beaktande på något sätt. Till exempel kan vi citera meningarna: "John letade efter sin leksakslåda. Till slut hittade han den. Lådan låg i pennan. John var väldigt glad. (John letade efter sin leksakslåda. Till slut hittade han den. Lådan låg i lekhagen. John var väldigt glad.)" "Penna" i detta sammanhang är inte en "penna" (skrivverktyg), utan en "lekhage" (lekpenna). Kunskap om synonymer, antonymer och bildliga betydelser är svåra att föra in i en dator. En lovande riktning var utvecklingen av datorsystem fokuserade på användningen av en mänsklig översättare.

Med tiden ersattes direktöversättningssystem av T-system (från det engelska ordet "transfer" - transformation), där översättningen utfördes på nivån av syntaktiska strukturer. T-systemens algoritmer använde en mekanism som gjorde det möjligt att bygga en syntaktisk struktur enligt grammatikreglerna för språket i inmatningssatsen (liknande hur ett främmande språk lärs ut på gymnasiet), och sedan syntetisera den utgående meningen genom att omvandla den syntaktiska strukturen och ersätta de nödvändiga orden från ordboken.

Lyapunov talade om översättning genom att extrahera innebörden av den översatta texten och presentera den på ett annat språk. Tillvägagångssättet för att bygga maskinöversättningssystem baserat på att erhålla den semantiska representationen av den ingående meningen genom semantisk analys och syntes av den inmatade meningen enligt den erhållna semantiska representationen anses fortfarande vara den mest perfekta. Sådana system kallas I-system (från ordet "interlingua"). Uppgiften att skapa dem, som ligger tillbaka i slutet av 50-talet och början av 60-talet, har dock inte lösts helt hittills, trots ansträngningarna från International Federation of IFIP, världsgemenskapen av forskare inom informationsbehandlingsområdet.

Forskare funderade på hur man formaliserar och bygger algoritmer för att arbeta med texter, vilka ordböcker som ska skrivas in i maskinen, vilka språkliga mönster som ska användas i maskinöversättning. Den traditionella lingvistiken hade inte sådana idéer – inte bara vad gäller semantik, utan också när det gäller syntax. På den tiden fanns det inga listor över syntaktiska konstruktioner för något språk, villkoren för deras kompatibilitet och utbytbarhet studerades inte, reglerna för att konstruera stora enheter av syntaktisk struktur från mindre beståndsdelar utvecklades inte.

Behovet av att skapa de teoretiska grunderna för maskinöversättning ledde till bildandet och utvecklingen av matematisk lingvistik. Den ledande rollen i denna fråga i Sovjetunionen spelades av matematikerna A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ägnades åt studiet av den formella teorin om grammatik (samtidigt med N. Khomsky i USA), Kuznetsov lade fram uppgiften att axiomatisera lingvistiken, som går tillbaka till F.F. Fortunatov.

Den 6 maj 1960 antogs dekretet från presidiet för USSR Academy of Sciences "Om utvecklingen av strukturella och matematiska metoder för studier av språk", och motsvarande avdelningar skapades vid Institute of Linguistics och Institute of det ryska språket. Sedan 1960, vid de ledande humanitära universiteten i landet - den filologiska fakulteten vid Moscow State University, Leninrad, Novosibirsk-universitetet, Moscow State Institute of Foreign Languages ​​- började utbildning inom området för automatisk textbehandling.

Maskinöversättningsverk från denna period, kallade "klassiska", är dock av teoretiskt snarare än praktiskt intresse. Kostnadseffektiva maskinöversättningssystem började skapas först på åttiotalet av förra seklet. Jag kommer att prata om detta senare i avsnitt 2.1, Maskinöversättning.

1960-70-talen inkluderar djupa teoretiska utvecklingar med metoder för mängdlära och matematisk logik, såsom fältteori och fuzzy mängdteori.

Författaren till fältteori i lingvistik var den sovjetiske poeten, översättaren och lingvisten V.G. Admoni. Han utvecklade till en början sin teori utifrån det tyska språket. För Admoni betecknar begreppet "fält" en godtycklig icke-tom uppsättning språkliga element (till exempel "lexikalt fält", "semantiskt fält").

Fältets struktur är heterogen: den består av en kärna, vars element har en komplett uppsättning egenskaper som definierar en uppsättning, och en periferi, vars element kan ha båda egenskaperna hos en given uppsättning (inte alla) och närliggande. Jag kommer att ge ett exempel som illustrerar detta uttalande: till exempel, på engelska, är fältet för sammansatta ord ("day-dream" - "dream" svårt att skilja från fältet för fraser ("tårgas" - "tårgas"). .

Teorin om fuzzy sets som redan nämnts ovan är nära besläktad med fältteori. I Sovjetunionen har lingvisterna V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dess förfader var den amerikanske matematikern L. Zadeh, som 1965 publicerade artikeln "Fuzzy Logic". Zade gav en matematisk motivering för teorin om luddiga mängder och övervägde dem på basis av språkligt material.

I den här teorin talar vi inte så mycket om elements tillhörighet till en given mängd (АОа), som om graden av denna tillhörighet (mАОа), eftersom perifera element kan tillhöra flera fält i en eller annan grad. Zade (Lofti-zade) var född i Azerbajdzjan, fram till 12 års ålder hade han praxis att kommunicera på fyra språk - azerbajdzjanska, ryska, engelska och persiska - och använde tre olika alfabet: kyrilliska, latinska, arabiska. När en vetenskapsman tillfrågas vad som är gemensamt mellan teorin om fuzzy sets och lingvistik, förnekar han inte detta samband, utan förtydligar: ”Jag är inte säker på att studiet av dessa språk hade ett stort inflytande på mitt tänkande. Om så var fallet, då bara undermedvetet. I sin ungdom studerade Zadeh på en presbyteriansk skola i Teheran, och efter andra världskriget emigrerade han till USA. "Frågan är inte om jag är amerikan, ryss, azerbajdzjan eller vad som helst", sa han.

Liknande abstrakt:

Språk och tal som ett av stilistikens grundläggande problem. Begreppet fonem och fonologisk nivå. Begreppet språk som system och nivåer i språksystemet. Begreppet morfem och deras typer. En mening som en syntaktisk enhet i en text. Tecken på språksystemet.


Topp