Hem › Kropp › Historien om tillämpningen av matematiska metoder i lingvistik. Reflektioner över samspelet mellan lingvistik och matematik

Historien om tillämpningen av matematiska metoder i lingvistik. Reflektioner över samspelet mellan lingvistik och matematik

Formandet av strukturell lingvistik vid 1800- och 1900-talets skifte. Statistiska metoder i språkinlärning. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet. Att lära sig språket med metoder för formell logik. Funktioner i maskinöversättning.

INTRODUKTION

Kapitel 1. Historien om tillämpningen av matematiska metoder i lingvistik

1.1. Bildandet av strukturell lingvistik vid 1800- och 1900-talet

1.2. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1. Maskinöversätta

2.2.Statistiska metoder i språkinlärning

2.3. Att lära sig ett språk med metoder för formell logik

2.4. Utsikter för tillämpning av matematiska metoder i lingvistik

Slutsats

Litteratur

Bilaga 1. Ronald Schleifer. Ferdinand de Saussure

Bilaga 2. Ferdinand de Saussure (översättning)

INTRODUKTION

Under 1900-talet har det funnits en fortsatt trend mot interaktion och interpenetration av olika kunskapsområden. Gränserna mellan de enskilda vetenskaperna suddas ut gradvis; det finns fler och fler grenar av mental aktivitet som befinner sig "i korsningen" av humanitär, teknisk och naturvetenskaplig kunskap.

En annan uppenbar egenskap hos moderniteten är viljan att studera strukturer och deras beståndsdelar. Därför ges en allt större plats, både i vetenskapsteori och i praktiken, till matematik. Genom att å ena sidan komma i kontakt med logik och filosofi, å andra sidan med statistik (och följaktligen med samhällsvetenskap), tränger matematiken allt djupare in i de områden som länge ansågs vara rent. "humanitär", som utökar sin heuristiska potential (svaret på frågan "hur mycket" hjälper ofta till att svara på frågorna "vad" och "hur"). Språkvetenskapen var inget undantag.

Syftet med mitt kursarbete är att kort belysa sambandet mellan matematik och en sådan gren av lingvistik som lingvistik. Sedan 1950-talet har matematik använts inom lingvistik för att skapa en teoretisk apparat för att beskriva språkens struktur (både naturliga och artificiella). Samtidigt bör det sägas att den inte omedelbart fann en sådan praktisk tillämpning för sig själv. Inledningsvis började matematiska metoder inom lingvistik användas för att klargöra lingvistikens grundläggande begrepp, men med utvecklingen av datateknik började en sådan teoretisk premiss att få tillämpning i praktiken. Lösningen av sådana uppgifter som maskinöversättning, maskinell informationshämtning, automatisk textbearbetning krävde ett fundamentalt nytt förhållningssätt till språket. Språkvetarna ställdes inför frågan: hur man lär sig att representera språkliga mönster i den form i vilken de kan appliceras direkt på tekniken. Termen "matematisk lingvistik", som är populär i vår tid, syftar på all språklig forskning som använder exakta metoder (och begreppet exakta metoder inom naturvetenskap är alltid nära besläktat med matematik). Vissa forskare från de senaste åren tror att uttrycket i sig inte kan höjas till en term, eftersom det inte betyder någon speciell "lingvistik", utan bara en ny riktning fokuserad på att förbättra, öka noggrannheten och tillförlitligheten av språkforskningsmetoder . Lingvistik använder både kvantitativa (algebraiska) och icke-kvantitativa metoder, vilket för den närmare matematisk logik, och följaktligen till filosofi och till och med psykologi. Till och med Schlegel noterade samspelet mellan språk och medvetande, och Ferdinand de Saussure, en framstående lingvist i början av 1900-talet (jag kommer att berätta om hans inflytande på utvecklingen av matematiska metoder inom lingvistik senare), kopplade samman språkets struktur med dess tillhörighet till folket. Den moderna forskaren L. Perlovsky går längre och identifierar språkets kvantitativa egenskaper (till exempel antalet kön, fall) med särdragen hos den nationella mentaliteten (mer om detta i avsnitt 2.2, "Statistiska metoder i lingvistik").

Samspelet mellan matematik och lingvistik är ett mångfacetterat ämne, och i mitt arbete kommer jag inte att uppehålla mig vid alla, utan först och främst vid dess tillämpade aspekter.

Kapitel IHistoria om tillämpning av matematiska metoder i lingvistik

1.1 Bildande av strukturell lingvistikvid början av XIX - XX århundradena

Den matematiska beskrivningen av språket är baserad på idén om språket som en mekanism, som går tillbaka till den berömda schweiziska lingvisten från det tidiga nittonhundratalet, Ferdinand de Saussure.

Den första länken till hans koncept är teorin om språket som ett system som består av tre delar (språket i sig är det språk, Tal - Lösenord, och talaktivitet - språk), där varje ord (medlem av systemet) inte betraktas i sig självt utan i samband med andra medlemmar. Som en annan framstående lingvist, dansken Louis Hjelmslev, senare noterade, var Saussure "den förste som krävde ett strukturellt förhållningssätt till språket, det vill säga en vetenskaplig beskrivning av språket genom att registrera relationerna mellan enheter."

Saussures förståelse av språket som en hierarkisk struktur var den första som ställde problemet med värdet och betydelsen av språkliga enheter. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter.

Den strukturella enheten i Saussures språk betraktade ordet "tecken", där ljud och betydelse kombinerades. Inget av dessa element existerar utan varandra: därför förstår modersmålet de olika nyanserna av betydelsen av ett polysemantiskt ord som ett separat element i den strukturella helheten, i språket.

I F. de Saussures teori kan man alltså se samspelet mellan lingvistik å ena sidan med sociologi och socialpsykologi (det bör noteras att samtidigt utvecklas Husserls fenomenologi, Freuds psykoanalys, Einsteins relativitetsteori. , pågår experiment om form och innehåll inom litteratur, musik och bildkonst), å andra sidan med matematik (systemicitetsbegreppet motsvarar det algebraiska språkbegreppet). Ett sådant begrepp förändrade begreppet språklig tolkning som sådant: Fenomen började tolkas inte i relation till orsakerna till deras förekomst, utan i relation till nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikterna kan vara opersonliga, "omedvetna" i ordets freudianska mening).

Funktionen av den språkliga mekanismen manifesteras genom talaktiviteten hos modersmålstalare. Resultatet av tal är de så kallade "korrekta texterna" - sekvenser av talenheter som lyder vissa mönster, av vilka många tillåter en matematisk beskrivning. Teorin om sätt att beskriva den syntaktiska strukturen behandlar studier av metoder för matematisk beskrivning av korrekta texter (främst meningar). I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

I väst utvecklas Saussures idéer av den store schweiziska lingvistens yngre samtida: i Danmark - L. Hjelmslev, redan av mig nämnd, som gav upphov till den algebraiska språkteorin i sitt arbete "Fundamentals of Linguistic Theory", i USA - E. Sapir, L. Bloomfield, C. Harris, i Tjeckien - den ryska emigrantforskaren N. Trubetskoy.

Statistiska regelbundenheter i studiet av språk började behandlas av ingen mindre än genetikens grundare, Georg Mendel. Det var först 1968 som filologer upptäckte att han under de sista åren av sitt liv fascinerades av studiet av språkliga fenomen med hjälp av matematikens metoder. Mendel tog med sig denna metod till lingvistik från biologin; på 1990-talet var det bara de mest vågade lingvisterna och biologerna som hävdade genomförbarheten av en sådan analys. I arkiven av klostret St. Tomasz i Brno, vars abbot var Mendel, hittades ark med kolumner av efternamn som slutade på "mann", "bauer", "mayer" och med några bråkdelar och beräkningar. I ett försök att upptäcka de formella lagarna för släktnamnens ursprung, gör Mendel komplexa beräkningar, där han tar hänsyn till antalet vokaler och konsonanter i det tyska språket, det totala antalet ord han anser, antalet efternamn, etc.

I vårt land började den strukturella lingvistiken utvecklas ungefär samtidigt som i väst - vid 1800- och 1900-talens skiftning. Samtidigt med F. de Saussure utvecklades begreppet språk som ett system i deras arbeten av professorer vid Kazan University F.F. Fortunatov och I.A. Baudouin de Courtenay. Den senare korresponderade länge med de Saussure, respektive Genève- och Kazan-språkskolan samarbetade med varandra. Om Saussure kan kallas ideologen för "exakta" metoder inom lingvistik, så lade Baudouin de Courtenay de praktiska grunderna för deras tillämpning. Han var den förste att separera lingvistik (som exakt en vetenskap som använder statistiska metoder och funktionellt beroende) från filologi (en gemenskap av humanitära discipliner som studerar andlig kultur genom språk och tal). Forskaren själv trodde att "lingvistik kan vara användbar inom en snar framtid, bara befriad från den obligatoriska föreningen med filologi och litteraturhistoria". Fonologi blev "testplatsen" för införandet av matematiska metoder i lingvistiken - ljud som "atomer" i språksystemet, med ett begränsat antal lätt mätbara egenskaper, var det lämpligaste materialet för formella, rigorösa beskrivningsmetoder. Fonologi förnekar existensen av mening i ljud, så den "mänskliga" faktorn eliminerades i studierna. I denna mening är fonem som fysiska eller biologiska föremål.

Fonemer, som de minsta språkliga element som är acceptabla för perception, representerar en separat sfär, en separat "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Huvudsaken är att fonemet kommer att utföra sin huvudsakliga - meningsfulla - funktion. Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med eller utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa funktioner är baserade på strukturen av talorganen - tunga, tänder, stämband. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av en "röst" (spänningen i stämbanden) och röstnivån som skiljer ett fonem från ett annat. Därmed kan fonologi betraktas som ett exempel på den allmänna språkregel som Saussure beskrev: "Det finns bara skillnader i språket". Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språket är både ett uttryck för ordens betydelse och ett kommunikationsmedel, och dessa två funktioner sammanfaller aldrig. Vi kan lägga märke till växlingen mellan form och innehåll: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till morfem, morfem - till ord, ord - till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än bara summan av dess delar.

Saussure föreslog idén om en ny vetenskap från 1900-talet, skild från lingvistik, som studerade teckens roll i samhället. Saussure kallade denna vetenskap för semiologi (från grekiskan "semeion" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller artikulerade) i termer av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade sig Saussure åt en "semiotisk" analys av sen romersk poesi, och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i dess språkliga analys: den var ett försök att i ett system studera problemet med "sannolikhet" i språket. Sådan forskning hjälper till att fokusera på den "verkliga sidan" av sannolikhet; "nyckelordet" som Saussure letar efter ett anagram för är enligt Jean Starobinsky "ett verktyg för poeten, inte källan till diktens liv." Dikten tjänar till att byta ut nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar” (se . Bilaga 1).

Saussures försök att studera egennamn i senromersk poesi framhäver en av komponenterna i hans språkliga analys – teckens godtyckliga karaktär, såväl som den formella essensen av Saussures språkvetenskap, som utesluter möjligheten att analysera betydelse. Todorov drar slutsatsen att idag verkar Saussures verk vara extremt konsekventa i sin ovilja att studera symbolerna för ett fenomen som har en tydligt definierad betydelse [Bilaga 1]. När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semiologi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoder för slumpmässig tolkning baserad på dessa begrepp, och å andra sidan strukturalistiska begrepp som raderar motsättningen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik - Ferdinand de Saussures skrifter om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ryska vetenskapsmän var också representerade vid den första internationella lingvistkongressen i Haag 1928. S. Kartsevsky, R. Yakobson och N. Trubetskoy gjorde en rapport som undersökte språkets hierarkiska struktur - i andan av de modernaste idéerna för början av förra seklet. Jakobson utvecklade i sina skrifter Saussures idéer om att de grundläggande elementen i ett språk först och främst bör studeras i samband med deras funktioner, och inte med orsakerna till deras förekomst.

Tyvärr, efter att Stalin kom till makten 1924, kastas rysk lingvistik, liksom många andra vetenskaper, tillbaka. Många begåvade vetenskapsmän tvingades emigrera, förvisades från landet eller dog i läger. Först sedan mitten av 1950-talet har en viss pluralism av teorier blivit möjlig – mer om detta i avsnitt 1.2.

1.2 Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

I mitten av 1900-talet hade fyra världsspråkliga skolor bildats, som var och en visade sig vara förfader till en viss "exakt" metod. Leningrad fonologiska skola(dess förfader var en elev till Baudouin de Courtenay L.V. Shcherba) använde ett psykolingvistiskt experiment baserat på analys av talet från infödda talare som huvudkriteriet för att generalisera ljud i form av ett fonem.

Forskare Prags språkcirkel, i synnerhet - dess grundare N.S. Trubetskoy, som emigrerade från Ryssland, utvecklade teorin om oppositioner - språkets semantiska struktur beskrevs av dem som en uppsättning oppositionellt konstruerade semantiska enheter - Sem. Denna teori tillämpades i studiet av inte bara språk, utan också konstnärlig kultur.

Ideologer Amerikansk deskriptivism var lingvisterna L. Bloomfield och E. Sapir. Språket presenterades för deskriptivister som en uppsättning talpåståenden, som var huvudobjektet för deras studie. Deras fokus låg på reglerna för vetenskaplig beskrivning (därav namnet) av texter: studiet av organisation, arrangemang och klassificering av deras element. Formalisering av analytiska procedurer inom fonologi och morfologi (utveckling av principer för studiet av språk på olika nivåer, distributiv analys, metoden för direkta beståndsdelar, etc.) ledde till formuleringen av allmänna frågor om språklig modellering. Ouppmärksamhet på planen för språkets innehåll, liksom den paradigmatiska sidan av språket, tillät inte deskriptivister att tolka språket som ett system fullt ut.

På 1960-talet utvecklades teorin om formell grammatik, som uppstod främst på grund av den amerikanske filosofen och lingvisten N. Chomskys arbete. Han anses med rätta vara en av de mest kända moderna vetenskapsmännen och offentliga personerna, många artiklar, monografier och till och med en dokumentär i full längd ägnas åt honom. Med namnet på ett i grunden nytt sätt att beskriva den syntaktiska strukturen som Chomsky uppfann - generativ (genererande) grammatik - kallades motsvarande trend inom lingvistik. generativism.

Chomsky, en ättling till invandrare från Ryssland, studerade lingvistik, matematik och filosofi vid University of Pennsylvania sedan 1945, starkt influerad av sin lärare Zelig Harris - liksom Harris, Chomsky betraktade och betraktar fortfarande sina politiska åsikter nära anarkismen (han är fortfarande känd som kritiker av det befintliga amerikanska politiska systemet och som en av anti-globalismens andliga ledare).

Chomskys första stora vetenskapliga arbete, magisteruppsats "Morphology of Modern Hebrew » (1951) har förblivit opublicerad. Chomsky doktorerade från University of Pennsylvania 1955, men mycket av den forskning som ligger till grund för hans avhandling (publicerad i sin helhet först 1975 under titeln The Logical Structure of Linguistic Theory) och hans första monografi, Syntactic Structures (1957, Rus. trans. . 1962), framfördes vid Harvard University 1951-1955. Samma 1955 flyttade vetenskapsmannen till Massachusetts Institute of Technology, där han blev professor 1962.

Chomskys teori har gått igenom flera stadier i sin utveckling.

I den första monografin "Syntaktiska strukturer" presenterade vetenskapsmannen språket som en mekanism för att generera en oändlig uppsättning meningar med en ändlig uppsättning grammatiska medel. För att beskriva språkliga egenskaper föreslog han begreppen djupa (dolda från direkt perception och genererade av ett system av rekursiva, d.v.s. kan tillämpas upprepade gånger, regler) och ytliga (direkt uppfattade) grammatiska strukturer, såväl som transformationer som beskriver övergången från djupa strukturer till ytstrukturer. Flera ytstrukturer kan motsvara en djup struktur (till exempel en passiv struktur Dekretet är undertecknat av presidenten härledd från samma djupa struktur som den aktiva konstruktionen Presidenten undertecknar dekretet) och vice versa (alltså tvetydigheten mamma älskar dotter beskrivs som resultatet av ett sammanträffande av ytstrukturer som går tillbaka till två olika djupa, där den ena är den som älskar dottern och i den andra den som är älskad av dottern).

Chomskys standardteori anses vara "Aspects"-modellen som anges i Chomskys bok "Aspects of the Theory of Syntax". I denna modell introducerades för första gången regler för semantisk tolkning i formell teori, vilket tillskrev mening till djupa strukturer. I Aspects ställs språklig kompetens i motsats till språkanvändning (performance), den så kallade Katz-Postalhypotesen om bevarande av mening under transformation antas, i samband med vilken begreppet valfri transformation utesluts, och en apparat av syntaktiska egenskaper som beskriver lexikal kompatibilitet introduceras.

På 1970-talet arbetade Chomsky med teorin om kontroll och bindning (GB-teori - från orden regering Och bindande) är mer allmän än den föregående. I den övergav forskaren de specifika reglerna som beskriver de syntaktiska strukturerna för specifika språk. Alla transformationer har ersatts med en universell rörelsetransformation. Inom ramen för GB-teorin finns även privata moduler som var och en ansvarar för sin egen del av grammatiken.

Redan nyligen, 1995, lade Chomsky fram ett minimalistiskt program, där mänskligt språk beskrivs som maskinspråk. Det här är bara ett program - inte en modell eller en teori. I den identifierar Chomsky två huvuddelsystem i den mänskliga språkapparaten: lexikonet och datorsystemet, såväl som två gränssnitt - fonetisk och logisk.

Chomskys formella grammatiker har blivit klassiska för att beskriva inte bara naturliga utan också konstgjorda språk - i synnerhet programmeringsspråk. Den strukturella lingvistikens utveckling under andra hälften av 1900-talet kan med rätta betraktas som en "chomskisk revolution".

Moskvas fonologiska skola, vars företrädare var A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, använde en liknande teori för att studera fonetik. Så småningom börjar "exakta" metoder tillämpas med avseende på inte bara fonetik, utan också syntax. Både lingvister och matematiker, både här och utomlands, börjar studera språkets struktur. På 1950- och 60-talen började ett nytt skede i samspelet mellan matematik och lingvistik i Sovjetunionen, i samband med utvecklingen av maskinöversättningssystem.

Drivkraften till början av dessa arbeten i vårt land var den första utvecklingen inom området maskinöversättning i USA (även om den första mekaniserade översättningsanordningen av P.P. Smirnov-Trojanskij uppfanns i Sovjetunionen 1933, eftersom den var primitiv, blev inte utbredd). 1947 kom A. Butt och D. Britten med en kod för ord-för-ord-översättning med hjälp av en dator, ett år senare föreslog R. Richens en regel för att dela upp ord i stammar och ändelser i maskinöversättning. De åren var helt annorlunda än idag. Det var mycket stora och dyra maskiner som tog hela rum och krävde en stor stab av ingenjörer, operatörer och programmerare för att underhålla dem. I grund och botten användes dessa datorer för att utföra matematiska beräkningar för militära institutioners behov - det nya inom matematik, fysik och teknik tjänade först och främst militära angelägenheter. I de tidiga stadierna stöddes utvecklingen av MP aktivt av militären, med allt detta (under det kalla krigets förhållanden), den rysk-engelska riktningen utvecklades i USA och den anglo-ryska riktningen i Sovjetunionen.

I januari 1954 ägde "Georgetown Experiment" rum vid Massachusetts Technical University - den första offentliga demonstrationen av översättning från ryska till engelska på IBM-701-maskinen. Sammanfattning av meddelandet om den framgångsrika passagen av experimentet, gjort av D.Yu. Panov, dök upp i RJ "Mathematics", 1954, nr 10: "Översättning från ett språk till ett annat med hjälp av en maskin: en rapport om det första framgångsrika testet."

D. Yu. Panov (vid den tiden chef för Institute of Scientific Information - INI, senare VINITI) lockade I. K. Belskaya, som senare ledde maskinöversättningsgruppen vid Institutet för exakt matematik och datorteknik vid USSR Academy of Sciences, till att arbeta med maskinöversättning. I slutet av 1955 går den första erfarenheten av att översätta från engelska till ryska med hjälp av BESM-maskinen tillbaka. Program för BESM sammanställdes av N.P. Trifonov och L.N. Korolev, vars doktorsavhandling ägnades åt metoder för att konstruera ordböcker för maskinöversättning.

Parallellt utfördes arbete med maskinöversättning vid institutionen för tillämpad matematik vid det matematiska institutet vid USSR Academy of Sciences (nu M.V. Keldysh Institute of Applied Mathematics of the Russian Academy of Sciences). På initiativ av matematikern A.A. Lyapunov. Han involverade O.S. Kulagin och hennes elever T.D. Wentzel och N.N. Ricco. Lyapunovs och Kulaginas idéer om möjligheten att använda teknik för att översätta från ett språk till ett annat publicerades i tidskriften Nature, 1955, nr 8. Från slutet av 1955 har T.N. Moloshnaya, som sedan började självständigt arbete med den engelsk-ryska översättningsalgoritmen.

R. Frumkina, som vid den tiden var engagerad i översättningsalgoritmen från spanska, minns att det i detta skede av arbetet var svårt att ta några konsekventa steg. Mycket oftare var jag tvungen att följa den heuristiska upplevelsen - min egen eller kollegor.

Samtidigt var den första generationen av maskinöversättningssystem mycket ofullkomlig. Alla var baserade på sekventiella översättningsalgoritmer "ord för ord", "fras för fras" - semantiska samband mellan ord och meningar togs inte i beaktande på något sätt. Till exempel är meningarna: John letade efter sin leksakslåda.Till slut hittade han den. Lådan låg i pennan.John var väldigt glad. (John letade efter sin leksakslåda. Till slut hittade han den. Lådan låg i lekhagen. John var väldigt glad.)" "Penna" i detta sammanhang är inte en "penna" (skrivverktyg), utan en "lekhage" ( lek-penna). Kunskap om synonymer, antonymer och bildliga betydelser är svåra att föra in i en dator. En lovande riktning var utvecklingen av datorsystem fokuserade på användningen av en mänsklig översättare.

Med tiden ersattes direktöversättningssystem av T-system (från det engelska ordet "transfer" - transformation), där översättningen utfördes på nivån av syntaktiska strukturer. T-systemens algoritmer använde en mekanism som gjorde det möjligt att bygga en syntaktisk struktur enligt grammatikreglerna för språket i inmatningssatsen (liknande hur ett främmande språk lärs ut på gymnasiet), och sedan syntetisera den utgående meningen genom att omvandla den syntaktiska strukturen och ersätta de nödvändiga orden från ordboken.

Lyapunov talade om översättning genom att extrahera innebörden av den översatta texten och presentera den på ett annat språk. Tillvägagångssättet för att bygga maskinöversättningssystem baserat på att erhålla den semantiska representationen av den ingående meningen genom semantisk analys och syntes av den inmatade meningen enligt den erhållna semantiska representationen anses fortfarande vara den mest perfekta. Sådana system kallas I-system (från ordet "interlingua"). Samtidigt har uppgiften att skapa dem, som ligger tillbaka i slutet av 50-talet och början av 60-talet, inte lösts helt hittills, trots ansträngningarna från International Federation of IFIP - världsgemenskapen av forskare inom informationsbehandlingsområdet .

Forskare funderade på hur man formaliserar och bygger algoritmer för att arbeta med texter, vilka ordböcker som ska skrivas in i maskinen, vilka språkliga mönster som ska användas i maskinöversättning. Den traditionella lingvistiken hade inte sådana idéer – inte bara vad gäller semantik, utan också när det gäller syntax. På den tiden fanns det inga listor över syntaktiska konstruktioner för något språk, villkoren för deras kompatibilitet och utbytbarhet studerades inte, reglerna för att konstruera stora enheter av syntaktisk struktur från mindre beståndsdelar utvecklades inte.

Behovet av att skapa de teoretiska grunderna för maskinöversättning ledde till bildandet och utvecklingen av matematisk lingvistik. Den ledande rollen i denna fråga i Sovjetunionen spelades av matematikerna A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, lingvister V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Kulaginas avhandling ägnades åt studiet av den formella teorin om grammatik (samtidigt med N. Khomsky i USA), Kuznetsov lade fram uppgiften att axiomatisera lingvistiken, som går tillbaka till F.F. Fortunatov.

Den 6 maj 1960 antogs dekretet från presidiet för USSR Academy of Sciences "Om utvecklingen av strukturella och matematiska metoder för studier av språk", och motsvarande avdelningar skapades vid Institute of Linguistics och Institute of det ryska språket. Sedan 1960 började landets ledande humanitära universitet - fakulteten för filologi vid Moscow State University, Leninrad, Novosibirsk Universities, Moscow State Institute of Foreign Languages - att utbilda personal inom området för automatisk textbehandling.

Samtidigt är verk med maskinöversättning av denna period, kallade "klassisk", av mer teoretiskt än praktiskt intresse. Kostnadseffektiva maskinöversättningssystem började skapas först på åttiotalet av förra seklet. Jag kommer att prata om detta senare i avsnitt 2.1, Maskinöversättning.

1960-70-talen inkluderar djupa teoretiska utvecklingar med metoder för mängdlära och matematisk logik, såsom fältteori och fuzzy mängdteori.

Författaren till fältteori i lingvistik var den sovjetiske poeten, översättaren och lingvisten V.G. Admoni. Han utvecklade till en början sin teori utifrån det tyska språket. För Admoni betecknar begreppet "fält" en godtycklig icke-tom uppsättning språkliga element (till exempel "lexikalt fält", "semantiskt fält").

Fältets struktur är heterogen: den består av en kärna, vars element har en komplett uppsättning egenskaper som definierar en uppsättning, och en periferi, vars element kan ha båda egenskaperna hos en given uppsättning (inte alla) och närliggande. Jag kommer att ge ett exempel som illustrerar detta uttalande: till exempel, på engelska, är fältet för sammansatta ord ("day-dream" - "dream" svårt att skilja från fältet för fraser ("tårgas" - "tårgas"). .

Teorin om fuzzy sets som redan nämnts ovan är nära besläktad med fältteori. I Sovjetunionen har lingvisterna V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, men dess förfader var den amerikanske matematikern L. Zadeh, som 1965 publicerade artikeln "Fuzzy Logic". Zade gav en matematisk motivering för teorin om luddiga mängder och övervägde dem på basis av språkligt material.

I den här teorin talar vi inte så mycket om elements tillhörighet till en given mängd (Aa), utan om graden av detta medlemskap (Aa), eftersom perifera element kan tillhöra flera fält i en eller annan grad. Zade (Lofti-zade) var född i Azerbajdzjan, fram till 12 års ålder hade han praxis att kommunicera på fyra språk - azerbajdzjanska, ryska, engelska och persiska - och använde tre olika alfabet: kyrilliska, latinska, arabiska. När en vetenskapsman tillfrågas vad som är gemensamt mellan teorin om fuzzy sets och lingvistik, förnekar han inte detta samband, utan förtydligar: ”Jag är inte säker på att studiet av dessa språk hade ett stort inflytande på mitt tänkande. Om så var fallet, då bara undermedvetet. I sin ungdom studerade Zadeh på en presbyteriansk skola i Teheran, och efter andra världskriget emigrerade han till USA. "Frågan är inte om jag är amerikan, ryss, azerbajdzjan eller någon annan", sa han i ett av samtalen, "jag är formad av alla dessa kulturer och folk och känner mig ganska bekväm bland var och en av dem." I dessa ord finns något som liknar det som kännetecknar teorin om fuzzy sets - ett avsteg från entydiga definitioner och skarpa kategorier.

I vårt land, på 70-talet, översattes och studerades verk av västerländska lingvister från 1900-talet. I.A. Melchuk översatte N. Chomskys verk till ryska. PÅ. Slyusareva kopplar i sin bok "The Theory of F. de Saussure in the Light of Modern Linguistics" samman postulaten från Saussures undervisning med 70-talets lingvistiks faktiska problem. Det finns en tendens till ytterligare matematisering av lingvistik. De ledande inhemska universiteten utbildar personal i specialiteten "matematisk (teoretisk, tillämpad) lingvistik". Samtidigt sker i västvärlden ett kraftigt språng i utvecklingen av datateknik, vilket kräver allt fler språkliga grunder.

På 1980-talet, professor vid Institutet för orientaliska studier vid Vetenskapsakademien Yu.K. Lekomtsev, medan han analyserar språkvetenskapens språk genom analys av scheman, tabeller och andra typer av notation som används i språkliga beskrivningar, anser matematiska system lämpliga för dessa ändamål (främst system av matrisalgebra).

Under hela det tjugonde århundradet var det alltså en konvergens mellan det exakta och humaniora. Samspelet mellan matematik och lingvistik fick alltmer praktiska tillämpningar. Mer om detta i nästa kapitel.

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1 Maskinöversättning

Idén att översätta från ett språk till ett annat med hjälp av en universell mekanism uppstod flera århundraden innan den första utvecklingen på detta område började - redan 1649 föreslog Rene Descartes idén om ett språk där motsvarande idéer om olika språk skulle uttryckas med en symbol. De första försöken att implementera denna idé på 1930-40-talet, början av den teoretiska utvecklingen i mitten av seklet, förbättringen av översättningssystem med hjälp av teknik på 1970-80-talet, den snabba utvecklingen av översättningstekniken under det senaste decennium - det här är stadierna i utvecklingen av maskinöversättning som bransch. Det är från arbetet med maskinöversättning som datorlingvistik som vetenskap har vuxit fram.

Med utvecklingen av datorteknik i slutet av 70-talet och början av 80-talet satte forskarna upp sig mer realistiska och kostnadseffektiva mål – maskinen blev inte en konkurrent (som tidigare antagits), utan en assistent till en mänsklig översättare. Maskinöversättning upphör att tjäna enbart militära uppgifter (alla sovjetiska och amerikanska uppfinningar och forskning, främst inriktad på ryska och engelska, bidrog till det kalla kriget på ett eller annat sätt). 1978 sändes ord i naturliga språk över Arpa sammankopplade nätverk, och sex år senare dök de första översättningsprogrammen för mikrodatorer upp i USA.

På 70-talet köpte Europeiska gemenskapernas kommission den engelsk-franska versionen av datoröversättaren Systran, och beställde även de fransk-engelska och italienska-engelska versionerna och det ryska-till-engelska översättningssystemet som används av den amerikanska försvarsmakten. Så lades grunden till EUROTRA-projektet.

Om återupplivandet av maskinöversättning på 70-80-talet. Följande fakta vittnar: Europeiska gemenskapernas kommission (CEC) köper den engelsk-franska versionen av Systran, samt översättningssystemet från ryska till engelska (det senare utvecklades efter ALPAC-rapporten och fortsatte att användas av US Air Force och NASA); dessutom beordrar CEC utvecklingen av de fransk-engelska och italiensk-engelska versionerna. Samtidigt sker en snabb expansion av maskinöversättningsaktiviteter i Japan; i USA beordrar Pan American Health Organization (PAHO) utvecklingen av en spansk-engelsk riktning (SPANAM-system); Det amerikanska flygvapnet finansierar utvecklingen av ett maskinöversättningssystem vid Linguistic Research Center vid University of Texas i Austin; TAUM-gruppen i Kanada gör betydande framsteg i utvecklingen av sitt METEO-system (meteorologisk översättning). Ett antal projekt startade på 70- och 80-talen. utvecklades sedan till fullfjädrade kommersiella system.

Under perioden 1978-93 spenderades 20 miljoner dollar på forskning inom området maskinöversättning i USA, 70 miljoner i Europa och 200 miljoner i Japan.

En av de nya utvecklingarna är TM-teknologin (översättningsminne), som fungerar enligt ackumuleringsprincipen: under översättningsprocessen sparas det ursprungliga segmentet (meningen) och dess översättning, vilket resulterar i bildandet av en språklig databas; om ett identiskt eller liknande segment hittas i den nyöversatta texten, visas det tillsammans med översättningen och en indikation på procentuell matchning. Översättaren fattar sedan ett beslut (att redigera, avvisa eller acceptera översättningen), vars resultat lagras av systemet, så det finns inget behov av att översätta samma mening två gånger. Ett välkänt kommersiellt system baserat på TM-teknologi utvecklas för närvarande av TRADOS-systemet (grundat 1984).

För närvarande utvecklar flera dussin företag kommersiella maskinöversättningssystem, inklusive: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata programvara; Linguistica b.v. Nu kan du använda automatiska översättares tjänster direkt på webben: alphaWorks; PROMTs onlineöversättare, LogoMedia.net, AltaVistas översättningstjänst för Babel Fish; InfiniT.com; Översätta Internet.

Kommersiellt effektiva översättningssystem dök upp under andra hälften av 80-talet även i vårt land. Själva begreppet maskinöversättning har utökats (det började inkludera "skapandet av ett antal automatiska och automatiserade system och enheter som automatiskt eller halvautomatiskt utför hela översättningscykeln eller enskilda uppgifter i en dialog med en person"), och statliga anslag för utveckling av denna industri har ökat.

Ryska, engelska, tyska, franska och japanska blev huvudspråken i inhemska översättningssystem. All-Union Translation Center (VTsP) utvecklade ett system för att översätta från engelska och tyska till ryska på en dator ES-1035-ANRAP. Den bestod av tre ordböcker - inmatning av engelska och tyska och utmatning av ryska - under en enda programvara. Det fanns flera utbytbara specialiserade ordböcker - för datateknik, programmering, radioelektronik, maskinteknik, jordbruk, metallurgi. Systemet kunde fungera i två lägen - automatiskt och interaktivt, när skärmen visade källtexten och översättningen per fras, som en person kunde redigera. Hastigheten för att översätta text till ANRAP (från början av att skriva till slutet av utskrift) var cirka 100 sidor per timme.

1989 skapades en familj av kommersiella översättare av typen SPRINT, som arbetade med ryska, engelska, tyska och japanska. Deras främsta fördel var deras kompatibilitet med IBM PC - sålunda nådde inhemska maskinöversättningssystem den internationella kvalitetsnivån. Samtidigt utvecklas ett system för maskinöversättning från franska till ryska FRAP, som inkluderar 4 stadier av textanalys: grafematisk, morfologisk, syntaktisk och semantisk. I LGPI dem. Herzen, arbete pågick på ett fyraspråkigt (engelska, franska, spanska, ryska) SILOD-MP-system (engelsk-ryska och fransk-ryska ordböcker användes i industriellt läge.

För specialiserad översättning av texter om elektroteknik fanns ETAP-2-systemet. Analysen av ingångstexten i den utfördes på två nivåer - morfologisk och syntaktisk. ETAP-2 ordboken innehöll cirka 4 tusen poster; stadiet för textomvandling - cirka 1000 regler (96 allmänna, 342 privata, resten är ordbok). Allt detta säkerställde en tillfredsställande kvalitet på översättningen (säg, titeln på patentet "Optisk fasnätarrangemang och kopplingsanordning som har ett sådant arrangemang" översattes som "En optisk fasnätanordning och en anslutningsanordning med en sådan anordning" - trots att tautologi, innebörden bevaras).

Vid Minsks pedagogiska institut för främmande språk, på grundval av den engelsk-ryska ordboken för ordformer och fraser, uppfanns ett system för maskinöversättning av titlar, vid Institutet för orientaliska studier vid Vetenskapsakademien - ett system för översättning från japanska till ryska. Den första automatiska vokabulär- och terminologitjänsten (SLOTHERM) för datoranvändning och programmering, skapad vid Moskvas forskningsinstitut för automationssystem, innehöll cirka 20 000 termer i en förklarande ordbok och speciella ordböcker för språkforskning.

Maskinöversättningssystem började gradvis användas inte bara för sitt avsedda syfte, utan också som en viktig komponent i automatiska inlärningssystem (för undervisning i översättning, kontroll av stavning och grammatisk kunskap).

90-talet förde med sig den snabba utvecklingen av PC-marknaden (från stationär dator till ficka) och informationsteknik, den utbredda användningen av Internet (som blir mer internationellt och flerspråkigt). Allt detta gjorde att vidareutvecklingen av automatiserade översättningssystem efterfrågades. Sedan början av 1990-talet Inhemska utvecklare går också in på PC-systemmarknaden.

I juli 1990 presenterades det första kommersiella maskinöversättningssystemet i Ryssland som heter PROMT (PROgrammers maskinöversättning) vid PC Forum i Moskva. 1991, ZAO [!!! I enlighet med federal lag-99 av 05.05.2014, detta formulär ersattes av ett icke-offentligt aktiebolag] "Project MT", och redan 1992 vann PROMT-bolaget NASA-tävlingen för leverans av MP-system (PROMT var det enda icke-amerikanska företaget i denna tävling). hela familjen av system under det nya namnet STYLUS för översättning från engelska, tyska, franska, italienska och spanska till ryska och från ryska till engelska, och 1993 skapades världens första maskinöversättningssystem för Windows på basis av STYLUS. STYLUS 2.0 för Windows 3.X/95/NT släpptes, och 1995-1996 introducerades den tredje generationen av maskinöversättningssystem, helt 32-bitars STYLUS 3.0 för Windows 95/NT, samtidigt som utvecklingen av en helt nytt, världens första rysk-tyska och rysk-franska maskinöversättningssystem.

1997 tecknades ett avtal med det franska företaget Softissimo om skapandet av översättningssystem från franska till tyska och engelska och vice versa, och i december i år släpptes världens första tysk-franska översättningssystem. Samma år släppte PROMT-företaget ett system implementerat med Gigant-teknologin, som stöder flera språkriktningar i ett skal, samt en speciell översättare för att arbeta på Internet WebTranSite.

1998 släpptes en hel konstellation av program under det nya namnet PROMT 98. Ett år senare släppte PROMT två nya produkter: ett unikt mjukvarupaket för att arbeta på Internet - PROMT Internet, och en översättare för företagspostsystem - PROMT Mail Översättare. I november 1999 erkändes PROMT som det bästa maskinöversättningssystemet som testats av den franska tidskriften PC Expert och överträffade sina konkurrenter med 30 procent. Särskilda serverlösningar har också utvecklats för företagskunder - företagsöversättningsservern PROMT Translation Server (PTS) och internetlösningen PROMT Internet Translation Server (PITS). År 2000 uppdaterade PROMT hela sin serie av mjukvaruprodukter genom att släppa en ny generation av MT-system: PROMT Translation Office 2000, PROMT Internet 2000 och Magic Gooddy 2000.

Onlineöversättning med stöd av PROMT-systemet används på ett antal inhemska och utländska webbplatser: PROMTs onlineöversättare, InfiniT.com, Translate.Ru, Lycos, etc., såväl som i institutioner med olika profiler för översättning av affärsdokument, artiklar och brev (det finns översättningssystem inbyggda direkt i Outlook Express och andra e-postklienter).

Nuförtiden växer nya maskinöversättningsteknologier fram baserade på användningen av artificiell intelligens och statistiska metoder. Om det senare - i nästa avsnitt.

2.2 Extrametoder för språkinlärning

Betydande uppmärksamhet i modern lingvistik ägnas åt studiet av språkliga fenomen med hjälp av metoderna för kvantitativ matematik. Kvantitativa data hjälper ofta till att djupare förstå de fenomen som studeras, deras plats och roll i systemet av relaterade fenomen. Svaret på frågan "hur mycket" hjälper till att svara på frågorna "vad", "hur", "varför" - sådan är den heuristiska potentialen hos en kvantitativ egenskap.

Statistiska metoder spelar en betydande roll i utvecklingen av maskinöversättningssystem (se avsnitt 2.1). I det statistiska tillvägagångssättet betraktas översättningsproblemet i termer av en brusig kanal. Föreställ dig att vi behöver översätta en mening från engelska till ryska. Den bullriga kanalprincipen ger oss följande förklaring av förhållandet mellan en engelsk och en rysk mening: en engelsk mening är inget annat än en rysk mening som förvrängs av något slags brus. För att återställa den ursprungliga ryska meningen måste vi veta vad folk brukar säga på ryska och hur ryska fraser förvrängs till engelska. Översättningen utförs genom att söka efter en sådan rysk mening som maximerar produkterna av den ovillkorliga sannolikheten för den ryska meningen och sannolikheten för den engelska meningen (original) givet den givna ryska meningen. Enligt Bayes teorem är denna ryska mening den mest sannolika översättningen av engelska:

där e är översättningssatsen och f är den ursprungliga meningen

Så vi behöver en källmodell och en kanalmodell, eller en språkmodell och en översättningsmodell. Språkmodellen måste tilldela en sannolikhetspoäng till vilken mening som helst på målspråket (i vårt fall ryska), och översättningsmodellen till den ursprungliga meningen. (se tabell 1)

I allmänhet fungerar ett maskinöversättningssystem i två lägen:

1. Systemträning: en utbildningskorpus av parallella texter tas, och med hjälp av linjär programmering söker man efter sådana värden på översättningskorrespondenstabeller som maximerar sannolikheten för (till exempel) den ryska delen av korpusen med tillgänglig engelska enligt till den valda översättningsmodellen. En modell av det ryska språket är byggd på den ryska delen av samma korpus.

2. Exploatering: baserat på data som erhållits för en obekant engelsk mening, söks efter en ryska som maximerar produkten av sannolikheterna som tilldelas av språkmodellen och översättningsmodellen. Programmet som används för en sådan sökning kallas en avkodare.

Den enklaste statistiska översättningsmodellen är den bokstavliga översättningsmodellen. Denna modell antar att för att översätta en mening från ett språk till ett annat räcker det att översätta alla ord (skapa en "påse med ord"), och modellen kommer att ge deras placering i rätt ordning. För att minska P( a, f | e) till P(a | e, f), dvs. sannolikheter för en given anpassning givet ett par meningar, varje sannolikhet P(a, f | e) normaliseras med summan av sannolikheterna för alla anpassningar av ett givet par meningar:

Implementeringen av Viterbi-algoritmen som används för att träna modell #1 är som följer:

1. Hela tabellen med översätär fylld med samma värden.

2. För alla möjliga varianter av parvisa kopplingar av ord beräknas sannolikheten P(a, f | e):

3. Värdena för P(a, f | e) normaliseras för att erhålla värdena för P(a | e, f).

4. Frekvensen för varje översättningspar beräknas, viktad med sannolikheten för varje inriktningsalternativ.

5. De resulterande viktade frekvenserna normaliseras och bildar en ny tabell över översättningskorrespondenssannolikheter

6. Algoritmen upprepas från steg 2.

Betrakta, som ett exempel, träningen av en liknande modell på en korpus av två par meningar (Fig. 2):

vita huset

Efter ett stort antal iterationer kommer vi att få en tabell (tabell 2), som visar att översättningen är utförd med hög noggrannhet.

Statistiska metoder används också i stor utsträckning i studiet av ordförråd, morfologi, syntax och stil. Forskare från Perm State University genomförde en studie baserad på påståendet att stereotypa fraser är ett viktigt "byggmaterial" i texten. Dessa fraser består av "nukleära" upprepade ord och beroende ordspecifikatorer och har en uttalad stilistisk färgning.

I den vetenskapliga stilen kan "nukleära" ord kallas: forskning, studie, uppgift, problem, fråga, fenomen, fakta, observation, analys etc. Inom journalistiken kommer andra ord att vara "kärnkraft", som har ett ökat värde specifikt för tidningens text: tid, person, makt, affär, handling, lag, liv, historia, plats etc. (totalt 29)

Av särskilt intresse för lingvister är också den professionella differentieringen av det nationella språket, originaliteten i användningen av ordförråd och grammatik, beroende på typ av yrke. Det är känt att förare i professionellt tal använder formen sh O fer, säger läkarna k O klubb istället för cocktail Yu sh - sådana exempel kan ges. Statistikens uppgift är att spåra variabiliteten i uttalet och förändringen i språknormen.

Professionella skillnader leder till skillnader inte bara grammatiska utan också lexikala. Yakut State University uppkallad efter M.K. Ammosov analyserades 50 frågeformulär med de vanligaste reaktionerna på vissa ord bland läkare och byggare (tabell 3).

		Byggare
Mänsklig	patient (10), personlighet (5)	man (5)
Bra	hjälp (8), hjälp (7)	ond (16)
liv	död (10)	härlig (5)
död	lik (8)	livet (6)
brand	värma (8), bränna (6)	eld (7)
finger	hand (14), panaritium (5)	stor (7), index (6)
ögon	syn (6), pupill, ögonläkare (5 vardera)	brun (10), stor (6)
huvud	sinne (14), hjärnor (5)	stor (9), smart (8), smart (6)
förlora	medvetande, liv (4 vardera)	pengar (5), hitta (4)

Det kan noteras att läkare oftare än byggmästare ger associationer med anknytning till deras yrkesverksamhet, eftersom ordstimuli som ges i enkäten har mer att göra med deras yrke än med yrket som byggmästare.

Statistiska regelbundenheter i ett språk används för att skapa frekvensordböcker - ordböcker som ger numeriska egenskaper för frekvensen av ord (ordformer, fraser) för vilket språk som helst - författarens språk, något arbete, etc. Vanligtvis förekommer frekvensen av ett ord används som ett kännetecken för användning i texten i en viss volym

Modellen för taluppfattning är omöjlig utan en ordbok som dess väsentliga komponent. I uppfattningen av tal är den grundläggande operativa enheten ordet. Av detta följer särskilt att varje ord i den uppfattade texten måste identifieras med motsvarande enhet av lyssnarens (eller läsarens) interna ordförråd. Det är naturligt att anta att sökningen redan från början är begränsad till vissa underdomäner i ordboken. Enligt de flesta moderna teorier om taluppfattning ger den faktiska fonetiska analysen av den klingande texten i ett typiskt fall endast viss delinformation om ordets möjliga fonologiska utseende, och denna typ av information motsvarar inte ett, utan ett visst MÅNGA ord av ordboken; Därför uppstår två problem:

(a) Välj lämplig uppsättning enligt vissa parametrar;

(b) inom gränserna för den skisserade uppsättningen (om den är allokerad på lämpligt sätt) att "eliminera" alla ord, utom det enda som bäst motsvarar det givna ordet i den erkända texten. En av strategierna för "avhopp" är att utesluta lågfrekventa ord. Härav följer att vokabulären för taluppfattning är en frekvensordbok. Det är skapandet av en datorversion av frekvensordboken för det ryska språket som är den initiala uppgiften för det presenterade projektet.

Baserat på materialet i det ryska språket finns det 5 frekvensordböcker (inte räknar grenordböcker). Låt oss bara notera några allmänna brister i de befintliga ordböckerna.

Alla kända frekvensordböcker för det ryska språket är baserade på bearbetning av skrivna (tryckta) texter. Delvis av denna anledning, när ett ords identitet till stor del bygger på formella, grafiska sammanträffanden, tas semantik inte tillräckligt med i beaktande. Som ett resultat är frekvensegenskaperna också förskjutna, förvrängda; till exempel, om kompilatorn av frekvensordboken inkluderar ord från kombinationen "varandra" i den allmänna statistiken för användningen av ordet "vän", så är detta knappast motiverat: med tanke på semantiken måste vi erkänna att dessa redan är olika ord, eller snarare, att en oberoende ordboksenhet bara är kombinationen som helhet.

I alla befintliga ordböcker placeras ord endast i sina grundläggande former: substantiv i singularform, nominativ kasus, verb i infinitivform, etc. Vissa av ordböckerna ger information om frekvensen av ordformer, men vanligtvis gör de det inte tillräckligt konsekvent, inte på ett uttömmande sätt. Frekvenserna för olika ordformer av samma ord stämmer uppenbarligen inte överens. Utvecklaren av taluppfattningsmodellen måste ta hänsyn till att i en verklig perceptuell process är det just en specifik ordform som är "nedsänkt" i texten som är föremål för igenkänning: baserat på analysen av den initiala delen av exponenten för ordformen, en uppsättning ord med identisk början bildas, och den initiala delen av ordformen är inte nödvändigtvis identisk med den initiala delen av ordboksformen. Det är ordformen som har en specifik rytmisk struktur, vilket också är en oerhört viktig parameter för det perceptuella urvalet av ord. Slutligen, i den slutliga representationen av det igenkända yttrandet, återigen, representeras orden av motsvarande ordformer.

Det finns många verk som visar vikten av frekvens i processen för taluppfattning. Men vi är inte medvetna om verk där frekvensen av ordformer skulle användas - tvärtom ignorerar alla författare praktiskt taget frekvensen av enskilda ordformer, och hänvisar uteslutande till lexem. Om resultaten som erhålls av dem inte anses vara artefakter, måste man anta att modersmålstalaren på något sätt har tillgång till information om förhållandet mellan frekvenserna av ordformer och ordboksformer, det vill säga faktiskt lexem. Dessutom kan en sådan övergång från en ordform till ett lexem naturligtvis inte förklaras av naturlig kunskap om motsvarande paradigm, eftersom frekvensinformation måste användas före den slutliga identifieringen av ordet, annars förlorar den helt enkelt sin mening.

Enligt de primära statistiska egenskaperna är det möjligt att med ett givet relativt fel fastställa den del av ordboken, som innehåller ord med hög förekomstfrekvens, oavsett typ av text. Det är också möjligt att, genom att införa stegvis ordning i ordboken, få en serie ordböcker som täcker de första 100, 1000, 5000, etc. av vanliga ord. Ordbokens statistiska egenskaper är av intresse i samband med den semantiska analysen av ordförråd. Studiet av ämnesideologiska grupper och semantiska fält visar att lexikala associationer stöds av semantiska länkar som är koncentrerade kring lexem med den vanligaste betydelsen. Beskrivningen av betydelser inom det lexiko-semantiska fältet kan utföras genom att identifiera ord med de mest abstrakta lexem i betydelse. Tydligen utgör "tomma" (ur synvinkel av nominativa styrkor) ordboksenheter ett statistiskt homogent lager.

Ordförråd för enskilda genrer är inte mindre värdefulla. Att studera måttet på deras likhet och arten av statistiska fördelningar kommer att ge intressant information om den kvalitativa stratifieringen av ordförråd beroende på användningsområdet för tal.

Sammanställning av stora frekvensordböcker kräver användning av datorteknik. ATT INTRODUCERA partiell mekanisering och automatisering i processen att arbeta med en ordbok är av intresse som ett experiment i maskinell bearbetning av ordböcker för olika texter. En sådan ordbok kräver ett mer rigoröst system för bearbetning och ackumulering av ordförrådsmaterial. I miniatyr är detta ett informationssökningssystem som kan ge information om olika aspekter av text och ordförråd. Några grundläggande förfrågningar till detta system är planerade från allra första början: det totala antalet inventeringsord, de statistiska egenskaperna för ett enstaka ord och hela ordböcker, ordningen av vanliga och sällsynta zoner i ordboken, etc. Maskinkortfilen låter dig att automatiskt bygga omvända ordböcker för enskilda genrer och källor. Många annan användbar statistisk information om språket kommer att extraheras från den ackumulerade mängden information. Datorfrekvensordboken skapar en experimentell grund för övergången till en mer omfattande automatisering av ordförrådsarbetet.

Statistiska data från frekvensordböcker kan också användas i stor utsträckning för att lösa andra språkliga problem - till exempel för att analysera och bestämma de aktiva sätten för ordbildning i det moderna ryska språket, lösa problem med att förbättra grafik och stavning, som är relaterade till att ta in ta hänsyn till statistisk information om ordförrådet (med allt detta är det viktigt att ta hänsyn till probabilistiska egenskaper hos grafekombinationer, typer av bokstavskombinationer realiserade i ord), praktisk transkription och translitteration. De statistiska parametrarna i ordboken kommer också att vara användbara för att lösa problem med att automatisera maskinskrivning, igenkänning och automatisk läsning av bokstavlig text.

Moderna förklarande ordböcker och grammatiker för det ryska språket är huvudsakligen byggda på basis av litterära och konstnärliga texter. Det finns frekvensordböcker över språket A.S. Pushkin, A.S. Griboedova, F.M. Dostojevskij, V.V. Vysotsky och många andra författare. Vid Institutionen för historia och litteraturteori i Smolensk-staten. Pedagogiska högskolan har under ett antal år arbetat med att sammanställa frekvensordböcker över poetiska och prosatexter. För denna studie valdes frekvensordböcker över alla texter av Pushkin och ytterligare två poeter från guldåldern - "Ve från Wit" av Griboyedov och all Lermontovs poesi; Pasternak och fem andra poeter från silveråldern - Balmont 1894-1903, "Dikter om den vackra damen" av Blok, "Sten" av Mandelstam, "Eldpelare" av Gumilyov, "Anno Domini MCMXXI" av Akhmatova och "Systrar till Mitt liv" av Pasternak och ytterligare fyra poeter från järnåldern - "Dikter av Yuri Zhivago", "När det klarnar upp", hela korpusen av texter av M. Petrovs, "Vägen är långt borta", "Vindskärmen", "Farväl till snön" och "Hästskor" av Mezhirov, "Antimirov" av Voznesensky och "Snezhnitsa » Rylenkova.

Det bör noteras att dessa ordböcker är olika till sin natur: vissa representerar vokabulären för ett dramatiskt verk, andra - böcker med sångtexter, eller flera böcker, eller hela korpusen av poetens dikter. Resultaten av analysen som presenteras i denna artikel bör tas med försiktighet, de kan inte tas som absoluta. Samtidigt kan skillnaden i texters ontologiska karaktär med hjälp av särskilda åtgärder minskas i viss mån.

På senare år har motsättningen mellan vardags- och boktal blivit allt tydligare insett. Denna fråga diskuteras särskilt skarpt bland metodologer som kräver en vändning i undervisningen mot det talade språket. Samtidigt förblir särdragen hos vardagstal fortfarande oförklarad.

Ordböcker bearbetades genom att skapa en användarapplikation i miljön för kontorsprogrammet EXCEL97. Applikationen innehåller fyra kalkylblad i EXCEL-boken - "Title Sheet", "Dictionaries" ark med initiala data, "Proximities" och "Distances" med resultat, samt en uppsättning makron.

Den första informationen skrivs in på bladet "Ordböcker". Ordböcker av de studerade texterna skrivs in i EXCEL-celler, den sista kolumnen S bildas från de erhållna resultaten och är lika med antalet ord som finns i andra ordböcker. Tabellerna "Närhet" och "Avstånd" innehåller beräknade mått på närhet M, korrelation R och avstånd D.

Applikationsmakron är händelsebaserade programmeringsprocedurer skrivna i Visual Basic for Application (VBA). Procedurerna är baserade på VBA-biblioteksobjekt och deras bearbetningsmetoder. Så för operationer med applikationens kalkylblad används nyckelobjektet Kalkylblad (kalkylblad) och motsvarande metod för att aktivera bladet Aktivera (aktivera). Inställning av intervallet för de analyserade källdata på ordboksbladet utförs med Select-metoden för Range-objektet (intervall), och överföringen av ord som värden till variabler utförs som Value-egenskapen (värde) för samma Range objekt.

Trots att rangkorrelationsanalys gör oss försiktiga med ämnens beroende mellan olika texter, har de flesta av de vanligaste orden i varje text matchningar i en eller flera andra texter. Kolumn S visar antalet sådana ord bland de 15 vanligaste orden för varje författare. Ord i fet stil förekommer endast i en poets ord i vår tabell. Blok, Akhmatova och Petrovs har inga markerade ord alls, de har S = 15. Dessa tre poeter har samma 15 vanligaste ord, de skiljer sig bara åt på platsen i listan. Men även Pushkin, vars ordförråd är det mest originella, har S = 8, och det finns 7 markerade ord.

Resultaten visar att det finns ett visst lager av ordförråd som koncentrerar poesins huvudteman. Som regel är dessa ord korta: av det totala antalet (225) ordanvändningar av enstavig 88, tvåstavig 127, trestavig 10. Ofta representerar dessa ord huvudmytologerna och kan delas in i par: natt - dag, jord - himmel (sol), Gud - människa (människor), liv - död, kropp - själ, Rom - värld(vid Mandelstam); kan kombineras till mytologer på högre nivå: himmel, stjärna, sol, jord; hos en person sticker som regel kroppen, hjärtat, blodet, armen, benet, kinden, ögonen ut. Av de mänskliga tillstånden ges företräde åt sömn och kärlek. Huset och städerna tillhör den mänskliga världen - Moskva, Rom, Paris. Kreativitet representeras av lexem ord Och låt.

Griboedov och Lermontov har nästan inga ord som betecknar naturen bland de vanligaste orden. De har tre gånger så många ord som betecknar en person, delar av hans kropp, delar av hans andliga värld. Pushkin och poeter av det tjugonde århundradet. beteckningar på människa och natur är ungefär lika. I denna viktiga aspekt av ämnet kan vi säga att det tjugonde århundradet. följde efter Pushkin.

Minimalt tema fall bland de vanligaste orden finns det bara i Griboyedov och Pushkin. Lermontov och nittonhundratalets poeter. det ger vika för ett minimalt tema ord. Ordet utesluter inte gärningar (den bibliska tolkningen av ämnet: i Nya testamentet betraktas alla Jesu Kristi läror som Guds ord eller Jesu ord, och apostlarna kallar sig ibland Ordets tjänare). Den heliga innebörden av lexemordet manifesteras på ett övertygande sätt, till exempel i Pasternaks vers "Och världens bild, uppenbarad i Ordet". Den heliga betydelsen av lexem ord i samband med och kontrast till mänskliga angelägenheter manifesteras det på ett övertygande sätt i dikten med samma namn av Gumilyov.

Polletter som bara finns i en text kännetecknar originaliteten hos en given bok eller en samling böcker. Till exempel är ordet "mind" det vanligaste i Griboedovs komedi "Wee from Wit" - men det förekommer inte bland frekvensorden i andra texter. Sinnets tema är det överlägset viktigaste inom komedi. Detta lexem åtföljer bilden av Chatsky, och namnet på Chatsky är det vanligaste i komedi. Verket kombinerar alltså organiskt det vanligaste vanliga substantivet med det vanligaste egennamnet.

Den högsta korrelationskoefficienten förbinder teman i de tragiska böckerna "Eldpelaren" av Gumilyov och "Anno Domini MCMXXI" av Akhmatova. Bland de 15 vanligaste substantiven finns det 10 vanliga, inklusive blod, hjärta, själ, kärlek, ord, himmel. Kom ihåg att Akhmatovas bok inkluderade en miniatyr "Du kommer inte att leva ...", skriven mellan arresteringen av Gumilyov och hans avrättning.

Teman för ljuset och folkmassan i det studerade materialet finns endast i "Yuri Zhivagos dikter". Temat för ljuset i verserna från romanen har många kontextuella betydelser: det är förknippat med bilden av Jesus Kristus, med teman som tro, odödlighet, kreativitet, kärleksdatum. Ljuset är den viktigaste ljuskällan i romanens centrala scener. Temat för folkmassan utvecklas i samband med romanens huvudidé, där en persons privatliv med dess orubbliga värden står i motsats till den nya statens omoral, byggd på principerna om att behaga folkmassan .

Arbetet innefattar också det tredje steget, som också återspeglas i programmet, - detta är beräkningen av skillnaden i ordningstalet för ord som är gemensamma för två ordböcker och det genomsnittliga avståndet mellan samma ord i två ordböcker. Detta steg gör det möjligt att gå från de allmänna trenderna i interaktionen mellan ordböcker som identifieras med hjälp av statistik till en nivå som närmar sig texten. Till exempel korrelerar Gumilyovs och Akhmatovas böcker statistiskt signifikant. Vi tittar på vilka ord som visade sig vara vanliga för deras ordböcker, och först och främst väljer vi de vars serienummer skiljer sig minimalt eller lika med noll. Det är dessa ord som har samma rangnummer och följaktligen är det dessa minimala teman i de två poeternas medvetande som är lika viktiga. Därefter bör du gå till nivån för texter och sammanhang.

Kvantitativa metoder hjälper också till att studera egenskaperna hos folk - modersmålstalare. Säg, det finns 6 fall på ryska, det finns inga fall på engelska, och på vissa språk av folket i Dagestan når antalet fall 40. L. Perlovsky i sin artikel "Medvetande, språk och kultur" korrelerar dessa egenskaper med folkens tendens till individualism eller kollektivism, med uppfattning om saker och fenomen separat eller i samband med andra. Det var trots allt i den engelsktalande världen (det finns inga fall - saken uppfattas "av sig själv") som begrepp som individuell frihet, liberalism och demokrati dök upp (jag noterar att jag använder dessa begrepp endast i samband med språk, utan några utvärderande egenskaper). Trots det faktum att sådana gissningar fortfarande bara förblir på nivån av djärva vetenskapliga hypoteser, hjälper de till att titta på redan bekanta fenomen på ett nytt sätt.

Som vi kan se kan kvantitativa egenskaper appliceras inom helt andra områden av lingvistiken, vilket alltmer suddar ut gränserna mellan "exakta" och "humanitära" metoder. Lingvistik tar allt mer till hjälp av inte bara matematik, utan även datorteknik för att lösa sina problem.

2.3 Lärande Ispråk med metoder för formell logik

Med icke-kvantitativa metoder för matematik, i synnerhet med logik, samverkar modern teoretisk lingvistik inte mindre fruktbart än med kvantitativa. Den snabba utvecklingen av datorteknik och tillväxten av deras roll i den moderna världen krävde en översyn av synen på samspelet mellan språk och logik i allmänhet.

Logikmetoderna används i stor utsträckning i utvecklingen av formaliserade språk, i synnerhet programmeringsspråk, vars element är några symboler (liknande matematiska), valda (eller konstruerade från tidigare valda symboler) och tolkade på ett visst sätt, associerade utan "traditionell" användning, förståelse och förståelse.funktioner av samma symboler i andra sammanhang. En programmerare sysslar ständigt med logik i sitt arbete. Meningen med programmering är bara att lära datorn att resonera (i ordets vidaste bemärkelse). Samtidigt visar sig metoderna för att "resonera" vara väldigt olika. Varje programmerare lägger en viss tid på att leta efter buggar i sina egna och andras program. Det vill säga att söka efter fel i resonemang, i logik. Och detta sätter också sina spår. Det är mycket lättare att upptäcka logiska fel i vanligt tal. Den relativa enkelheten hos språken som studeras av logiker gör att de kan belysa strukturerna för dessa språk tydligare än vad som är möjligt för lingvister som analyserar uteslutande komplexa naturliga språk. Med tanke på det faktum att de språk som studeras av logiker använder relationer kopierade från naturliga språk, kan logiker ge betydande bidrag till den allmänna teorin om språk. Situationen här liknar den som sker inom fysiken: fysikern formulerar också satser för idealiskt förenklade fall som inte alls förekommer i naturen - han formulerar lagar för idealgaser, idealvätskor, talar om rörelse i frånvaro av friktion, etc. För dessa idealiserade fall kan enkla lagar fastställas som i hög grad skulle bidra till förståelsen av vad som händer i verkligheten och vad som förmodligen skulle förbli okänt för fysiken om den försökte betrakta verkligheten direkt, i all dess komplexitet.

I studiet av naturliga språk används logiska metoder så att språkinlärare inte dumt kan "memorera" så många ord som möjligt, utan bättre förstå dess struktur. L. Shcherba använde också i sina föreläsningar ett exempel på en mening byggd enligt det ryska språkets lagar: "Den glittrande kuzdra shteko satte bokran och krullar bokran", och frågade sedan eleverna vad detta betydde. Trots att innebörden av orden i meningen förblev oklar (de existerar helt enkelt inte på ryska), var det möjligt att tydligt svara: "kuzdra" är ämnet, ett feminint substantiv, i singularis, nominativ, " bokr” är animerad osv. Översättningen av frasen visar sig vara ungefär så här: "Något feminint i ett svep gjorde något mot någon slags manlig varelse och började sedan göra något så här för en lång, gradvis en med sin unge." Ett liknande exempel på en text (konstnärlig) från icke-existerande ord, byggd helt enligt språkets lagar, är Lewis Carrolls Jabberwock (i Alice i Underlandet förklarar Carroll, genom sin karaktär Humpty Dumpty, betydelsen av orden han uppfann: "kokt" - klockan åtta på kvällen, när det är dags att laga middag, "chlivky" - tunn och skicklig, "shorek" - en korsning mellan en iller, en grävling och en korkskruv, "dyk" - hoppa, dyka, snurra, "nava" - gräs under soluret (sträcker sig lite till höger, lite till vänster och lite bakåt), "grunt" - grymta och skratta, "zelyuk" - en grön kalkon, "myumzik" - en fågel; hennes fjädrar är rufsig och sticker ut i alla riktningar, som en kvast, "mova" - långt hemifrån) .

Ett av huvudkoncepten för modern logik och teoretisk lingvistik, som används i studien av språk av olika logiska och matematiska kalkyler, naturliga språk, för att beskriva förhållandet mellan språk på olika "nivåer" och för att karakterisera förhållandet mellan språk under övervägande och de ämnesområden som beskrivs med deras hjälp, är begreppet metaspråk. Ett metaspråk är ett språk som används för att uttrycka bedömningar om ett annat språk, språkobjektet. Med hjälp av ett metaspråk studerar de strukturen för teckenkombinationer (uttryck) av språkobjektet, bevisar satser om dess uttrycksegenskaper, om dess relation till andra språk etc. Språket som studeras kallas även ämnesspråk i förhållande till detta metaspråk. Både ämnesspråket och metaspråket kan vara vanliga (naturliga) språk. Metaspråket kan skilja sig från objektspråket (till exempel i en engelsk lärobok för ryska är ryska metaspråket och engelska är objektspråket), men det kan också sammanfalla med det eller bara skilja sig delvis, till exempel i speciell terminologi (Rysk lingvistisk terminologi är en del av metaspråket för att beskriva det ryska språket, de så kallade semantiska faktorerna är en del av metaspråket för att beskriva naturliga språks semantik).

Begreppet "metalinguage" har blivit mycket fruktbart i samband med studiet av formaliserade språk som är byggda inom ramen för matematisk logik. Till skillnad från formaliserade ämnesspråk är i detta fall metaspråket, med vilket metateorin formuleras (att studera egenskaperna hos ämnesteorin formulerad på ämnesspråket), i regel ett vanligt naturligt språk, på något speciellt sätt ett fragment av ett naturligt språk begränsat på ett speciellt sätt, som inte innehåller någon form av tvetydighet., metaforer, "metafysiska" begrepp, etc. element av vanligt språk som hindrar dess användning som ett verktyg för korrekt vetenskaplig forskning. Samtidigt kan själva metaspråket formaliseras och (oavsett detta) bli föremål för forskning som bedrivs med hjälp av metaspråket, och en sådan serie kan ”tänkas” växa i all oändlighet.

Logiken lär oss en fruktbar skillnad mellan språkobjektet och metaspråket. Språkobjektet är själva ämnet för logisk forskning, och metaspråket är det oundvikligen konstgjorda språk som sådan forskning bedrivs på. Logiskt tänkande består bara i att formulera relationerna och strukturen hos ett verkligt språk (objektspråk) på symbolspråket (metaspråk).

Metaspråket måste i alla fall vara "inte fattigare" än dess objektiva språk (dvs. för varje uttryck av det senare i metaspråket måste det finnas dess namn, "översättning") - annars, om dessa krav inte uppfylls (vilket säkerligen kräver plats i naturliga språk, om särskilda överenskommelser inte föreskriver annat) uppstår semantiska paradoxer (antinomier).

När fler och fler nya programmeringsspråk skapades, i samband med problemet med programmeringsöversättare, fanns det ett akut behov av att skapa metaspråk. För närvarande är Backus-Naur-formen metaspråk (förkortat BNF) det vanligaste för att beskriva syntaxen för programmeringsspråk. Det är en kompakt form i form av vissa formler som liknar matematiska. För varje begrepp i språket finns det en unik metaformel (normal formel). Den består av vänster och höger delar. Den vänstra sidan anger begreppet som definieras, och den högra anger uppsättningen av tillåtna språkkonstruktioner som kombineras i detta begrepp. Formeln använder speciella metatecken i form av vinkelparenteser, som innehåller begreppet som definieras (på vänster sida av formeln) eller ett tidigare definierat begrepp (på dess högra sida), och separationen mellan vänster och höger del anges med "::="-metatecken, vars betydelse är likvärdig med orden "per definition finns det". Metalinguistiska formler är inbäddade i översättare i någon form; med deras hjälp kontrolleras konstruktionerna som används av programmeraren för formell överensstämmelse med någon av de konstruktioner som är syntaktiskt giltiga i detta språk. Det finns också separata metaspråk för olika vetenskaper - sålunda finns kunskap i form av olika metaspråk.

Logiska metoder fungerade också som grunden för skapandet av artificiell intelligens baserade på begreppet kopplingism. Connectionism är en speciell trend inom filosofisk vetenskap, vars ämne är kunskapsfrågor. Inom ramen för denna trend görs försök att förklara de intellektuella förmågorna hos en person som använder artificiella neurala nätverk. Bestående av ett stort antal strukturella enheter som liknar neuroner, med en vikt tilldelad varje element som bestämmer styrkan i sambandet med andra element, är neurala nätverk förenklade modeller av den mänskliga hjärnan. Experiment med neurala nätverk av detta slag har visat deras förmåga att lära sig utföra uppgifter som mönsterigenkänning, läsning och identifiering av enkla grammatiska strukturer.

Filosofer började intressera sig för konnektionism, eftersom det konnektionistiska tillvägagångssättet lovade att tillhandahålla ett alternativ till den klassiska teorin om sinnet och den idé som allmänt hålls inom denna teori att sinnets funktion liknar bearbetningen av symbolspråk av en digital dator. Detta koncept är mycket kontroversiellt, men på senare år har det fått fler och fler anhängare.

Den logiska studien av språket fortsätter Saussures koncept om språket som ett system. Det faktum att det ständigt fortsätter bekräftar återigen djärvheten i vetenskapliga gissningar från början av förra seklet. Jag kommer att ägna det sista avsnittet av mitt arbete åt utsikterna för utvecklingen av matematiska metoder inom lingvistik idag.

2.4 Utsikter för tillämpning av matematiska metoder i lingvistik

I datateknikens tidevarv har matematisk lingvistiks metoder fått ett nytt utvecklingsperspektiv. Sökandet efter lösningar på problemen med språklig analys implementeras nu alltmer på informationssystemnivå. Samtidigt ställer automatisering av processen för bearbetning av språkligt material, vilket ger forskaren betydande möjligheter och fördelar, oundvikligen nya krav och uppgifter för honom.

Kombinationen av "exakt" och "humanitär" kunskap har blivit grogrund för nya upptäckter inom lingvistik, datavetenskap och filosofi.

Maskinöversättning från ett språk till ett annat är fortfarande en snabbt växande gren av informationsteknologi. Trots att datorstödd översättning aldrig kan jämföras i kvalitet med mänsklig översättning (särskilt för litterära texter) har maskinen blivit en oumbärlig assistent för en person vid översättning av stora textvolymer. Man tror att inom en snar framtid kommer mer avancerade översättningssystem att skapas, baserade i första hand på den semantiska analysen av texten.

Ett lika lovande område är samspelet mellan lingvistik och logik, som fungerar som en filosofisk grund för att förstå informationsteknologi och den så kallade "virtuella verkligheten". Inom en snar framtid kommer arbetet att fortsätta med skapandet av artificiell intelligens - även om det, återigen, aldrig kommer att vara lika med människan i sina förmågor. Sådan konkurrens är meningslös: i vår tid borde maskinen inte bli (och blir) en rival, utan en assistent till människan, inte något från fantasins rike, utan en del av den verkliga världen.

Studiet av språket med statistiska metoder fortsätter, vilket gör det möjligt att mer exakt bestämma dess kvalitativa egenskaper. Det är viktigt att de mest vågade hypoteserna om språk finner sitt matematiska, och därför logiska, bevis.

Det viktigaste är att olika grenar av matematikens tillämpning inom lingvistik, tidigare ganska isolerade, under de senaste åren har korrelerats med varandra, kopplat till ett sammanhängande system, i analogi med det språksystem som upptäcktes för ett sekel sedan av Ferdinand de Saussure och Yvan Baudouin de Courtenay. Detta är kontinuiteten i vetenskaplig kunskap.

Lingvistik i den moderna världen har blivit grunden för utvecklingen av informationsteknologi. Så länge datavetenskap förblir en snabbt växande gren av mänsklig verksamhet, kommer föreningen av matematik och lingvistik att fortsätta att spela sin roll i utvecklingen av vetenskap.

Slutsats

Under 1900-talet har datortekniken kommit långt - från militär till fredlig användning, från ett snävt spektrum av mål till penetration i alla grenar av mänskligt liv. Matematik som vetenskap fick ständigt ny praktisk betydelse med utvecklingen av datateknik. Denna process fortsätter idag.

Det tidigare otänkbara "tandemet" av "fysiker" och "textförfattare" har blivit verklighet. För den fulla interaktionen mellan matematik och datavetenskap med humaniora krävdes kvalificerade specialister från båda sidor. Medan datavetare i allt högre grad är i behov av systematisk humanitär kunskap (lingvistisk, kulturell, filosofisk) för att förstå förändringar i verkligheten kring dem, i samspelet mellan människa och teknik, för att utveckla fler och fler nya språkliga och mentala begrepp, att skriva program, då måste alla "Humaniora" i vår tid för sin professionella tillväxt behärska åtminstone grunderna i att arbeta med en dator.

Matematik, som är nära sammankopplad med informatik, fortsätter att utvecklas och samverka med naturvetenskap och humaniora. Under det nya århundradet försvagas inte trenden mot matematisering av vetenskapen, utan tvärtom ökar. På grundval av kvantitativa data förstås lagarna för språkets utveckling, dess historiska och filosofiska egenskaper.

Matematisk formalism är mest lämpad för att beskriva mönster inom lingvistik (liksom i andra vetenskaper - både humaniora och naturvetenskap). Situationen utvecklas ibland inom vetenskapen på ett sådant sätt att utan användning av ett lämpligt matematiskt språk är det omöjligt att förstå naturen av fysisk, kemisk, etc. processen är inte möjlig. Att skapa en planetmodell av atomen, den berömda engelska fysikern från XX-talet. E. Rutherford upplevde matematiska svårigheter. Till en början accepterades inte hans teori: det lät inte övertygande, och anledningen till detta var Rutherfords okunnighet om sannolikhetsteorin, på grundval av mekanismen för vilken det bara var möjligt att förstå modellrepresentationen av atomära interaktioner. Redan vid den tiden insåg en framstående vetenskapsman, ägaren av Nobelpriset, sig till seminariet för matematikern professor Lamb och under två år, tillsammans med studenterna, deltog i en kurs och arbetade ut en workshop om sannolikhetsteorin . Utifrån det kunde Rutherford beskriva elektronens beteende, vilket gav sin strukturella modell övertygande noggrannhet och fick erkännande. Detsamma är med lingvistik.

Detta väcker frågan, vad är så matematiskt i objektiva fenomen, tack vare vilket de kan beskrivas på matematikens språk, på språket för kvantitativa egenskaper? Dessa är homogena enheter av materia fördelade i rum och tid. De vetenskaper som har gått längre än andra mot isolering av homogenitet och visar sig vara bättre lämpade för användningen av matematik i dem.

Internet, som utvecklades snabbt på 1990-talet, samlade representanter för olika länder, folk och kulturer. Trots att engelska fortsätter att vara huvudspråket för internationell kommunikation har Internet blivit flerspråkigt i vår tid. Detta ledde till utvecklingen av kommersiellt framgångsrika maskinöversättningssystem som används i stor utsträckning inom olika områden av mänsklig aktivitet.

Datornätverk har blivit ett objekt för filosofisk reflektion – fler och fler nya språkliga, logiska, världsbildsbegrepp har skapats som hjälper till att förstå "virtuell verklighet". I många konstverk skapades scenarier - oftare pessimistiska - om maskiners dominans över en person, och virtuell verklighet - över omvärlden. Långt ifrån alltid visade sig sådana prognoser vara meningslösa. Informationsteknologi är inte bara en lovande bransch för att investera mänsklig kunskap, det är också ett sätt att kontrollera information och, följaktligen, över mänskligt tänkande.

Detta fenomen har både en negativ och en positiv sida. Negativt – eftersom kontroll över information strider mot den oförytterliga mänskliga rätten till fri tillgång till den. Positivt - eftersom avsaknaden av denna kontroll kan leda till katastrofala konsekvenser för mänskligheten. Det räcker med att påminna om en av det senaste decenniets klokaste filmer - "When the World Ends" av Wim Wenders, vars karaktärer är helt nedsänkta i den "virtuella verkligheten" av sina egna drömmar inspelade på en dator. Samtidigt kan inte en enda vetenskapsman och inte en enda konstnär ge ett entydigt svar på frågan: vad som väntar vetenskap och teknik i framtiden.

Att fokusera på "framtiden", som ibland förefaller fantastiskt, var ett utmärkande drag för vetenskapen i mitten av nittonhundratalet, när uppfinnare försökte skapa perfekta modeller av teknik som kunde fungera utan mänsklig inblandning. Tiden har visat den utopiska karaktären hos sådan forskning. Samtidigt vore det överflödigt att döma vetenskapsmän för detta – utan deras entusiasm på 1950- och 60-talen skulle informationsteknologin inte ha gjort ett så kraftfullt språng på 90-talet, och vi skulle inte ha det vi har nu.

De sista decennierna av 1900-talet förändrade vetenskapens prioriteringar - forskning, uppfinningsrik patos gav plats för kommersiellt intresse. Återigen, detta är varken bra eller dåligt. Detta är en verklighet där vetenskapen alltmer integreras i vardagen.

2000-talet har fortsatt denna trend, och i vår tid bakom uppfinningar ligger inte bara berömmelse och erkännande, utan först och främst pengar. Det är också därför det är viktigt att se till att de senaste landvinningarna inom vetenskap och teknik inte hamnar i händerna på terroristgrupper eller diktatoriska regimer. Uppgiften är svår till den grad omöjlig; att förverkliga det så mycket som möjligt är hela världssamfundets uppgift.

Information är ett vapen, och vapen är inte mindre farliga än kärnvapen eller kemiska vapen - bara det verkar inte fysiskt utan snarare psykiskt. Mänskligheten måste tänka på vad som är viktigare för den i det här fallet – frihet eller kontroll.

De senaste filosofiska begreppen relaterade till utvecklingen av informationsteknologi och ett försök att förstå dem har visat begränsningarna för både naturvetenskaplig materialism, som dominerade under 1800- och början av 1900-talet, och extrem idealism, som förnekar den materiella världens betydelse. . Det är viktigt för det moderna tänkandet, särskilt västerlandets tanke, att övervinna denna dualism i tänkandet, när omvärlden är tydligt uppdelad i materiellt och ideal. Vägen dit är en dialog mellan kulturer, en jämförelse av olika synpunkter på de omgivande fenomenen.

Paradoxalt nog kan informationsteknologi spela en viktig roll i denna process. Datornätverk, och särskilt Internet, är inte bara en resurs för underhållning och kraftfull kommersiell verksamhet, de är också ett sätt för meningsfull, kontroversiell kommunikation mellan representanter för olika civilisationer i den moderna världen, såväl som för en dialog mellan det förflutna och nuet. Vi kan säga att Internet tänjer på de rumsliga och tidsmässiga gränserna.

Och i dialogen mellan kulturer genom informationsteknologi är språkets roll som det äldsta universella kommunikationsmedlet fortfarande viktig. Det är därför lingvistik, i samspel med matematik, filosofi och datavetenskap, har upplevt sin andra födelse och fortsätter att utvecklas idag. Nutidens trend kommer att fortsätta i framtiden - "till världens ände", som för 15 år sedan, förutspådde samma V. Wenders. Det är visserligen inte känt när detta slut kommer att inträffa - men är det viktigt nu, eftersom framtiden förr eller senare kommer att bli nuet ändå.

Bilaga 1

Ferdinand de Saussure

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses allmänt vara grundaren av modern lingvistik i sina försök att beskriva språkets struktur snarare än historien om särskilda språk och språkformer. I själva verket finner strukturalismens metod inom lingvistik och litteraturvetenskap och en betydande gren av semiotik sin stora utgångspunkt i hans arbete vid sekelskiftet av 1900-talet. Det har till och med hävdats att komplexet av strategier och föreställningar som har kommit att kallas "poststrukturalism" - arbetet av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra - föreslås av Saussures arbete i lingvistik och anagrammatisk läsning av sen latinsk poesi, litterär modernism till psykoanalys och filosofi i början av nittonhundratalet. Som Algirdas Julien Greimas och Joseph Courtes argumenterar i Semiotics and Language: An Analytic Dictionary, under rubriken "Interpretation", uppstod ett nytt tolkningssätt i början av 1900-talet som de identifierar med saussureansk lingvistik, Husserliansk fenomenologi och freudiansk psykoanalys. I detta läge är "tolkning inte längre en fråga om att tillskriva ett givet innehåll till en form som annars skulle sakna en, snarare är det en omskrivning som på ett annat sätt formulerar det ekvivalenta innehållet i ett betecknande element inom ett givet semiotiskt system" ( 159). i denna förståelse av "tolkning" är form och innehåll inte distinkta; snarare är varje "form" alternativt också ett semantiskt "innehåll", en "signifierande form", så att tolkningen erbjuder en analogisk omskrivning av något som redan betyder inom något annat system av signifikans.

En sådan omtolkning av form och förståelse - som Claude Levi-Strauss beskriver i en av sina mest programmatiska artikulationer av begreppet strukturalism, i "Structure and Form: Reflections on a Work by Vladimir Propp" - är implicit i Saussures postuma kurs. i allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure relativt lite, och hans huvudverk, Kursen, var hans studenters transkription av flera kurser i allmän lingvistik som han erbjöd 1907-11. I kursen efterlyste Saussure den "vetenskapliga" studien av språket i motsats till det arbete inom historisk lingvistik som hade utförts på 1800-talet. Det arbetet är en av det västerländska intellektets stora landvinningar: att ta särskilda ord som byggstenar i språk, historisk (eller "diakronisk") lingvistik spårade ursprunget och utvecklingen av västerländska språk från en förmodad gemensam språkkälla, först ett "indoeuropeiskt" språk och sedan ett tidigare "p roto-indoeuropeiskt" språk.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement", som Saussure ifrågasatte. Hans arbete var ett försök att reducera mängden fakta om språk, studerad så noggrant av historisk lingvistik, till ett hanterbart antal påståenden. Den "jämförande skolan" för 1800-talets filologi, säger Saussure i Kursen, "lyckades inte med att upprätta den sanna vetenskapen om lingvistik" eftersom "den misslyckades med att söka upp naturen hos sitt studieobjekt" (3). Denna "natur", hävdar han, återfinns inte bara i de "elementala" orden som ett språk innehåller - språkets skenbara "positiva" fakta (eller "substanser") - utan i de formella relationer som ger upphov till dessa "ämnen."

Saussures systematiska omprövning av språk bygger på tre antaganden. Det första är att det vetenskapliga studiet av språk behöver utveckla och studera systemet snarare än språkfenomens historia. Av denna anledning skiljer han mellan språkets särskilda förekomster - dess speciella "talhändelser", som han betecknar som villkorlig frigivning - och det egentliga föremålet för lingvistik, systemet (eller "koden") som styr dessa händelser, som han betecknar som langue. En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element vid ett visst ögonblick snarare än den "diakroniska" studien av språkets utveckling genom historien.

Detta antagande gav upphov till vad Roman Jakobson 1929 kom att beteckna som "strukturalism", där "varje uppsättning fenomen som granskas av samtida vetenskap behandlas inte som en mekanisk agglomeration utan som en strukturell helhet, den mekaniska uppfattningen av processer ger efter för frågan. av deras funktion" ("Romantic" 711). I denna passage uttrycker Jakobson Saussures avsikt att definiera lingvistik som ett vetenskapligt system i motsats till en enkel, "mekanisk" redovisning av historiska olyckor. Tillsammans med detta beskriver Jakobson också det andra grundläggande antagandet i Saussurean - vi kan kallar det nu "strukturellt" - lingvistik: att språkets grundläggande element endast kan studeras i relation till deras funktioner snarare än i förhållande till deras orsaker. Europeiska "ord"), dessa händelser och enheter måste placeras inom ett systemiskt ramverk där de är relaterade till andra så kallade händelser och entiteter. Detta är en radikal omorientering i uppfattningen av erfarenhet och fenomen, en vars betydelse filosofen Ernst Cassirer har jämfört med "den nya vetenskapen om Galileo som på 1600-talet förändrade hela vår begreppet den fysiska världen" (citerad i Culler, Pursuit 2 4). Denna förändring, som Greimas och Courtes noterar, återuppfattar "tolkning" och återuppfattar således själva förklaring och förståelse. Istället för att förklaringen "är i termer av ett fenomens orsaker, så att det som "effekt" på något sätt är underordnat dess orsaker, består förklaringen här i att underordna ett fenomen dess framtidsorienterade "funktion" eller "syfte." Förklaring är inte längre oberoende av mänskliga avsikter eller syften (även om dessa avsikter kan vara opersonliga, gemensamma eller, i freudianska termer, "omedvetna").

I sin lingvistik åstadkommer Saussure denna omvandling specifikt i omdefinieringen av det språkliga "ordet", som han beskriver som det språkliga "tecknet" och definierar i funktionalistiska termer. Tecknet, hävdar han, är föreningen av "ett koncept och en ljudbild", som han kallade "signified and signifier" (66-67; Roy Harriss översättning från 1983 erbjuder termerna "signification" och "signal"). Naturen av deras "kombination" är "funktionell" i det att varken den betecknade eller betecknaren är den andras "orsak"; snarare "var och en av sina värden från den andra" (8). språkelementet, tecknet , relationellt och gör det grundläggande antagandet om historisk lingvistik, nämligen identiteten för de elementära enheterna av språk och betydelse (d.v.s. "ord"), föremål för rigorös analys. Ordet "träd" som "samma" ord är inte pga. ordet definieras av inneboende kvaliteter - det är inte en "mekanisk agglomeration" av sådana kvaliteter - utan för att det definieras som ett element i ett system, språkets "strukturella helhet".

En sådan relationell (eller "diakritisk") definition av en entitet styr uppfattningen av alla element i språket i strukturell lingvistik. Detta är tydligast i den mest imponerande bedriften inom saussureansk lingvistik, utvecklingen av begreppen "fonem" och "särskiljande drag" av språket. Fonemen är de minsta artikulerade och betecknande enheterna i ett språk. Det är inte de ljud som förekommer i språket utan de "ljudbilder" Saussure nämner, som uppfattas av talare - fenomenalt uppfattade - som förmedlande mening. (Elmar Holenstein beskriver således Jakobsons lingvistik, som följer Saussure på viktiga sätt, som "fenomenologisk strukturalism".) Det är av denna anledning som den ledande talespersonen för Prags skolstrukturalism, Jan Mukarovsky, 1937 noterade att "struktur . . . är en fenomenologisk och inte en empirisk verklighet; det är inte själva verket, utan en uppsättning funktionella relationer som är belägna i ett kollektivs medvetande (generation, miljö, etc.)" (citerad i Galan 35). Likaså Levi-Strauss, den ledande talespersonen för fransk strukturalism , noterade 1960 att "struktur har inget distinkt innehåll; den nöjer sig själv, och den logiska organisationen i vilken den är arresterad är tänkt som en egenskap hos det verkliga" (167; se även Jakobson, Fundamentals 27-28).

Fonemen, alltså de minsta märkbara elementen i språket, är inte positiva objekt utan en "fenomenologisk verklighet". På engelska, till exempel, kan fonemet /t/ uttalas på många olika sätt, men i alla fall kommer en engelsktalande att känna igen det som ett /t/. Ett aspirerat t (d.v.s. ett t uttalas med ett h-liknande andetag efter det), ett högt eller lågt t-ljud, ett utökat t-ljud, och så vidare, kommer alla att fungera på samma sätt för att urskilja betydelsen av "att" och "göra" på engelska. Dessutom är skillnaderna mellan språk sådana att fonologiska variationer i ett språk kan utgöra distinkta fonem i ett annat; sålunda skiljer engelska mellan /l/ och /r/, medan andra språk är så strukturerade att dessa artikulationer anses vara varianter av samma fonem (som den aspirerade och unaspirated t på engelska). I varje naturligt språk är det stora antalet möjliga ord en kombination av ett litet antal fonem. Engelska, till exempel, har mindre än 40 fonem som tillsammans bildar över en miljon olika ord.

Språkets fonem är i sig systematiskt organiserade strukturer av egenskaper. På 1920- och 1930-talen, efter Saussures ledning, isolerade Jakobson och N. S. Trubetzkoy de "särdragen" hos fonem. Dessa egenskaper är baserade på den fysiologiska strukturen hos talorganen - tunga, tänder, stämband och så vidare - att Saussure nämner i Kursen och som Harris beskriver som "fysiologisk fonetik" (39; Baskins tidigare översättning använder termen "fonologi" [(1959) 38]) - och de kombineras i "buntar" av binära oppositioner för att bilda fonem. Till exempel på engelska är skillnaden mellan /t/ och /d/ närvaron eller frånvaron av "röst" (engagerandet av stämbanden), och på röstnivån definierar dessa fonem varandra ömsesidigt. På så sätt är fonologi ett specifikt exempel på en allmän språkregel som beskrivs av Saussure: I språket finns bara skillnader. ännu viktigare: en skillnad innebär i allmänhet positiva termer mellan vilka skillnaden är satt upp; men i språket finns det bara skillnader utan positiva termer. Oavsett om vi tar det betecknade eller betecknaren, har språket varken idéer eller ljud som fanns före det språkliga systemet. ( 120)

Inom detta ramverk bestäms språkliga identiteter inte av inneboende kvaliteter utan av systemiska ("strukturella") relationer.

Jag har sagt att fonologin "följde ledningen" av Saussure, för även om hans analys av språkproduktionens fysiologi "nuförtiden", som Harris säger, "skulle kallas "fysisk" i motsats till antingen "psykologisk" eller "funktionell". "" (Läsning 49), följaktligen formulerade han i kursen riktningen och konturerna för en funktionell analys av språket. På samma sätt var hans enda utökade publicerade verk, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir om det primitiva systemet av vokaler i indoeuropeiska språk), som kom ut 1878, helt placerat inom projektet för nittonde- talets historiska lingvistik. Icke desto mindre, inom detta arbete, som Jonathan Culler har hävdat, visade Saussure "fruktbarheten av att tänka på språket som ett system av rent relationella föremål, även när han arbetade med uppgiften att historiska återuppbyggnaden" (Saussure 66). Genom att analysera de systematiska strukturella sambanden mellan fonem för att redogöra för mönster av vokalväxling i befintliga indoeuropeiska språk, föreslog Saussure att det utöver flera olika fonem /a/ måste ha funnits ett annat fonem som skulle kunna beskrivas formellt. "Det som gör Saussures arbete så mycket imponerande," avslutar Culler, "är det faktum att nästan femtio år senare, när kilskrift Hettite upptäcktes och dechiffrerades, visade sig det innehålla ett fonem, skrivet h, som betedde sig som Saussure hade förutspått. . Han hade upptäckt, genom en rent formell analys, vad som nu är känt som struphuvudet hos indoeuropeiska" (66).

Denna uppfattning om den relationella eller diakritiska bestämningen av betydelsens element, som är både implicit och explicit i kursen, antyder ett tredje antagande som styr strukturell lingvistik, vad Saussure kallar "tecknets godtyckliga natur". Med detta menar han att förhållandet mellan betecknare och betecknat i språket aldrig är nödvändigt (eller "motiverat"): man skulle lika gärna kunna hitta ljudbetecknaren arbre som betecknarträdet för att förena sig med begreppet "träd". Men mer än detta betyder det att det betecknade också är godtyckligt: man skulle lika lätt kunna definiera begreppet "träd" genom dess vedartade kvalitet (vilket skulle utesluta palmer) som genom dess storlek (vilket utesluter de "låga vedartade växterna" vi ring buskar). Detta bör klargöra att numreringen av antaganden jag har presenterat inte representerar en prioritetsordning: varje antagande - den systemiska karaktären av signifikans (bäst uppfattas genom att studera språket "synkront"), den relationella eller "diakritiska" naturen hos elementen av betydelse, teckenens godtyckliga natur - får sitt värde från de andra.

Det vill säga, saussureansk lingvistik de fenomen den studerar i övergripande relationer av kombination och kontrast i språk. I denna uppfattning är språk både processen att artikulera mening (betydelse) och dess produkt (kommunikation), och dessa två språkfunktioner är varken identiska eller helt kongruenta (se Schleifer, "Dekonstruktion"). Här kan vi se den växling mellan form och innehåll som Greimas och Courtes beskriver i modernistisk tolkning: språket presenterar kontraster som formellt definierar dess enheter, och dessa enheter kombineras på efterföljande nivåer för att skapa det betecknande innehållet. Eftersom språkets beståndsdelar är godtyckliga kan dessutom varken kontrast eller kombination sägas vara grundläggande. Sålunda, i språket kombineras särdrag för att bilda kontrasterande fonem på en annan nivå av uppfattning, fonem kombineras för att bilda kontrasterande morfem, morfem kombineras för att bilda ord, ord kombineras för att bilda meningar, och så vidare. I varje fall är hela fonemet, eller ordet, eller meningen, och så vidare, större än summan av dess delar (precis som vatten, H2O, i Saussures exempel [(1959) 103] är mer än den mekaniska agglomerationen av väte och syre).

De tre antagandena i kursen i allmän lingvistik ledde till att Saussure efterlyste en ny vetenskap från 1900-talet som skulle gå utöver språkvetenskapen för att studera "teckens liv i samhället." Saussure kallade denna vetenskap "semiologi (från grekiska semeion "tecken")" (16). "Vetenskapen" om semiotik, som den kom att praktiseras i Östeuropa på 1920- och 1930-talen och Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära artefakter som konstituerades (eller artikulerades) av dessa strukturer. Under hela den sena delen av sin karriär, även när han erbjöd kurserna i allmän lingvistik, fortsatte Saussure sin egen "semiotiska" analys av sen latinsk poesi i ett försök att upptäcka medvetet dolda anagram av egennamn. Studiemetoden var på många sätt motsatsen till den funktionella rationalismen i hans språkliga analyser: den försökte, som Saussure nämner i en av de 99 anteckningsböcker där han genomförde denna studie, att systematiskt undersöka problemet med "slumpen", som " blir den oundvikliga grunden för allt" (citerad i Starobinski 101). En sådan studie, som Saussure själv säger, fokuserar på "det materiella faktum" av slump och mening (citerad 101), så att "temaordet" vars anagram Saussure söker, som Jean Starobinski hävdar, "är, för poeten , ett instrument och inte en livsviktig grodd till dikten. Dikten krävs för att återanvända temaordets ljudmaterial" (45). I denna analys säger Starobinski: "Saussure förlorade inte sig själv i ett sökande efter dolda betydelser." Istället tycks hans arbete visa en önskan att undvika alla problem som uppstår ur medvetandet: "Eftersom poesi inte bara förverkligas i ord utan är något som föds ur ord, undkommer den medvetandets godtyckliga kontroll för att enbart vara beroende av en sorts språklig laglighet "(121).

Det vill säga Saussures försök att upptäcka egennamn i sen latinsk poesi - vad Tzvetan Todorov kallar förminskningen av ett "ord . . . till dess signifier" (266) - understryker ett av de element som styrde hans språkliga analys, tecknets godtyckliga natur. (Det understryker också den formella karaktären hos Saussurean lingvistik - "Språk", hävdar han, "är en form och inte en substans" - som effektivt eliminerar semantik som ett huvudobjekt för analys.) Som Todorov avslutar framstår Saussures arbete anmärkningsvärt homogent idag i sin vägran att acceptera symboliska fenomen. . . . I sin forskning om anagram uppmärksammar han endast fenomenen med upprepning, inte till evokationsfenomen. . . . I sina studier av Nibelungen känner han igen symboler endast för att hänföra dem till felaktiga läsningar: eftersom de inte är avsiktliga existerar inte symboler. Slutligen i sina kurser om allmän lingvistik, överväger han existensen av semiologi, och därmed av andra tecken än lingvistiska; men denna bekräftelse begränsas på en gång av det faktum att semiologin är ägnad åt en enda typ av tecken: de som är godtyckliga. (269-70)

Om detta är sant, beror det på att Saussure inte kunde tänka sig "avsikt" utan ett ämne; han kunde inte riktigt undkomma motsättningen mellan form och innehåll, hans verk gjorde så mycket för att ifrågasätta. Istället tog han till "språklig laglighet". Belägen mellan å ena sidan 1800-talets föreställningar om historia, subjektivitet och sättet för kausal tolkning som styrs av dessa föreställningar och å andra sidan 1900-talets "strukturalistiska" föreställningar om vad Levi-Strauss kallade "kantianism utan ett transcendentalt subjekt" (citerat i Connerton 23) - begrepp som raderar motsättningen mellan form och innehåll (eller subjekt och objekt) och hierarkin av förgrund och bakgrund i fullskalig strukturalism, psykoanalys och till och med kvantmekanik - Ferdinands verk de Saussure i lingvistik och semiotik avgränsar ett signalmoment i studiet av mening och kultur.

Ronald Schleifer

Bilaga 2

Ferdinand de Saussure (översättning)

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses vara grundaren av modern lingvistik - tack vare hans försök att beskriva språkets struktur, snarare än historien om enskilda språk och ordformer. I stort sett lades grunden för strukturella metoder inom lingvistik och litteraturkritik och i stor utsträckning semiotik i hans verk redan i början av 1900-talet. Det är bevisat att metoderna och begreppen för den så kallade "poststrukturalismen", som utvecklats i verk av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra, går tillbaka till Saussures och Saussures språkliga verk. anagrammatiska läsningar av senromersk poesi. Det bör noteras att Saussures arbete med lingvistik och språklig tolkning hjälper till att koppla samman ett brett spektrum av intellektuella discipliner - från fysik till litterära innovationer, psykoanalys och filosofi från det tidiga nittonhundratalet. A. J. Greimas och J. Kurte skriver i Semiotics and Language: ”En analytisk ordbok med titeln ”Interpretation” som en ny sorts tolkning dök upp i början av 1900-talet tillsammans med Saussures lingvistik, Husserls fenomenologi och psykoanalysen. av Freud. I ett sådant fall är "tolkning inte att tillskriva ett givet innehåll till en form som annars skulle sakna en, utan snarare en omskrivning som på ett annat sätt formulerar samma innehåll av ett betydande element inom ett givet semiotiskt system" (159 ). I denna förståelse av "tolkning" är form och innehåll oskiljaktiga; tvärtom är varje form fylld med semantisk betydelse ("meningsfull form"), så tolkningen erbjuder en ny, liknande återberättelse av något meningsfullt i ett annat teckensystem.

En liknande förståelse av form och innehåll, presenterad av Claude Lévi-Strauss i ett av strukturalismens programmatiska verk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan ses i Saussures postuma bok, A Course in Allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure lite, "Kurs" - hans huvudverk - samlades från anteckningar från studenter som deltog i hans föreläsningar om allmän lingvistik 1907-11. I kursen efterlyste Saussure en "vetenskaplig" studie av språket, som kontrasterade det med 1800-talets jämförande-historiska lingvistik. Detta arbete kan betraktas som en av västerländskt tänkandes största landvinningar: med individuella ord som grundelementen i språket, bevisade historisk (eller "diakronisk") lingvistik ursprunget och utvecklingen av västeuropeiska språk från ett gemensamt, indoeuropeiskt språk – och ett tidigare proto-indoeuropeiskt.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement" som Saussure ifrågasatte. Hans arbete var ett försök att reducera de många fakta om språk som tillfälligt studerades av jämförande lingvistik till ett litet antal satser. 1800-talets jämförande filologiska skola, skriver Saussure, "lyckades inte skapa en riktig språkskola" eftersom "den inte förstod essensen av studieobjektet" (3). Denna "essens", menar han, ligger inte bara i enskilda ord - språkets "positiva substanser" - utan också i de formella sambanden som hjälper dessa substanser att existera.

Saussures "test" av språk bygger på tre antaganden. För det första är den vetenskapliga förståelsen av språk inte baserad på ett historiskt, utan på ett strukturellt fenomen. Därför skilde han mellan enskilda språkfenomen - "talhändelser", som han definierar som "parole" - och det riktiga, enligt hans åsikt, studieobjektet för lingvistik, systemet (kod, struktur) som styr dessa händelser ( "langue"). En sådan systematisk studie kräver dessutom en "synkron" uppfattning om förhållandet mellan språkets element i ett givet ögonblick, snarare än en "diakronisk" studie av språkets utveckling genom dess historia.

Denna hypotes var föregångaren till vad Roman Jakobson 1929 skulle kalla "strukturalism" - en teori där "alla fenomen som undersöks av modern vetenskap betraktas inte som en mekanisk ackumulation, utan som en strukturell helhet där den konstruktiva komponenten är korrelerad med funktionen" ("Romantisk "711). I denna passage formulerade Jakobson Saussures idé om att definiera språket som en struktur, i motsats till den "mekaniska" uppräkningen av historiska händelser. Dessutom utvecklar Jakobson ett annat saussureanskt antagande, som blev föregångaren till strukturell lingvistik: språkets grundläggande beståndsdelar bör studeras i samband inte så mycket med deras orsaker, utan med deras funktioner. Separata fenomen och händelser (säg historien om ursprunget för enskilda indoeuropeiska ord) bör studeras inte av sig själva, utan i ett system där de är korrelerade med liknande komponenter. Detta var en radikal vändning i jämförelsen av fenomen med den omgivande verkligheten, vars betydelse filosofen Ernst Cassirer jämförde med "vetenskapen om Galileo, som på 1600-talet omkullkastade idéer om den materiella världen." följaktligen själva förklaringarna. Fenomen började tolkas inte i relation till orsakerna till att de inträffade, utan i relation till den effekt de kan ha i nuet och framtiden. Tolkningen upphörde att vara oberoende av en persons avsikter (trots att avsikter kan vara opersonliga, "omedvetet" i ordets freudianska mening).

I sin lingvistik visar Saussure särskilt denna vändning i förändringen av ordets begrepp inom lingvistik, som han definierar som ett tecken och beskriver i termer av dess funktioner. Ett tecken för honom är en kombination av ljud och betydelse, "signified and designation" (66-67; i den engelska översättningen från 1983 av Roy Harris - "signification" och "signal"). Denna förenings natur är "funktionell" (varken det ena eller det andra elementet kan existera utan varandra); dessutom "lånar den ena egenskaper från den andra" (8). Således definierar Saussure det huvudsakliga strukturella elementet i språket - tecknet - och gör basen för historisk lingvistik till identiteten av tecken till ord, vilket kräver en särskilt rigorös analys. Därför kan vi förstå olika betydelser av, säg, samma ord "träd" - inte för att ordet bara är en uppsättning av vissa egenskaper, utan för att det definieras som ett element i teckensystemet, i "den strukturella helheten", i språket.

Ett sådant relativt ("diakritiskt") enhetsbegrepp ligger till grund för begreppet alla delar av språket i strukturell lingvistik. Detta är särskilt tydligt i den mest originella upptäckten av saussureisk lingvistik, i utvecklingen av begreppet "fonem" och "särskiljande drag" hos språket. Fonemen är den minsta av de talade och meningsfulla språkenheterna. Det är inte bara ljud som förekommer i språket, utan "ljudbilder", konstaterar Saussure, som av infödda talare uppfattas som meningsfulla. (Det bör noteras att Elmar Holenstein kallar Jakobsons lingvistik, som fortsätter Saussures idéer och begrepp i sina huvudbestämmelser, för "fenomenologisk strukturalism"). Det är därför den ledande talaren för Pragskolan för strukturalism, Jan Mukarowski, 1937 observerade att ”struktur. . . inte ett empiriskt, utan ett fenomenologiskt begrepp; det är inte resultatet i sig, utan en uppsättning betydande relationer för det kollektiva medvetandet (generation, andra, etc.)”. En liknande tanke uttrycktes 1960 av Lévi-Strauss, den franska strukturalismens ledare: ”Strukturen har inget bestämt innehåll; den är meningsfull i sig, och den logiska konstruktion som den är innesluten i är verklighetens avtryck.

I sin tur representerar fonem, som de minsta språkliga element som är acceptabla för perception, en separat integrerad "fenomenologisk verklighet". Till exempel på engelska kan ljudet "t" uttalas olika, men i alla fall kommer en person som talar engelska att uppfatta det som "t". Aspirerat, höjt eller sänkt, ett långt "t"-ljud, etc. kommer lika att skilja betydelsen av orden "att" och "göra". Dessutom är skillnaderna mellan språk sådana att varianter av ett ljud på ett språk kan motsvara olika fonem i ett annat; till exempel är "l" och "r" på engelska olika, medan de på andra språk är varianter av samma fonem (som det engelska "t", uttalas med och utan aspiration). Alla naturliga språks stora ordförråd är en uppsättning kombinationer av ett mycket mindre antal fonem. På engelska, till exempel, används endast 40 fonem för att uttala och skriva ungefär en miljon ord.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa egenskaper är baserade på strukturen hos talorganen - tunga, tänder, stämband - Saussure märker detta i "Course of General Linguistics", och Harris kallar det "fysiologisk fonetik" (i Baskins tidigare översättning, termen "fonologi" " används) - de är kopplade i "knutar » durg mot en vän för att göra ljud. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av "röst" (spänningen i stämbanden), och röstnivån som skiljer ett fonem från ett annat. Således kan fonologi betraktas som ett exempel på den allmänna språkregel som beskrivs av Saussure: "Det finns bara skillnader i språket." Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

Jag har redan nämnt att fonologin i sin utveckling förlitade sig på Saussures idéer. Även om hans analys av språkfysiologi i modern tid, säger Harris, "skulle kallas 'fysisk', i motsats till 'psykologisk' eller 'funktionell', formulerade han i The Course tydligt riktningen och de grundläggande principerna för den funktionella analysen av språk. Hans enda verk som publicerades under hans livstid, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Anteckningar om det ursprungliga vokalsystemet i de indoeuropeiska språken), publicerat 1878, var helt i linje med jämförande historisk lingvistik i 1800-talet. Ändå, i detta arbete, säger Jonathan Culler, visade Saussure "fruktbarheten av idén om språk som ett system av sammanlänkade fenomen, även med dess historiska rekonstruktion." Genom att analysera förhållandet mellan fonem, förklara växlingen av vokaler i de moderna språken i den indoeuropeiska gruppen, föreslog Saussure att förutom flera olika ljud "a", måste det finnas andra fonem som formellt beskrivs. "Vad som gör ett speciellt intryck i Saussures verk," avslutar Kaller, "är att nästan 50 år senare, när hettitisk kilskrift upptäcktes och dechiffrerades, hittades ett fonem, i skrift betecknat med "h", som betedde sig som Saussure förutspådde. Genom formell analys upptäckte han det som nu är känt som det gutturala ljudet i de indoeuropeiska språken.

I konceptet med en relativ (diakritisk) definition av tecken, både explicit och underförstådd i kursen, finns det ett tredje nyckelantagande för strukturell lingvistik, kallat av Saussure "tecknets godtyckliga natur". Med detta menas att förhållandet mellan ljud och mening i språket inte är motiverat av någonting: man kan lika gärna koppla ihop ordet "arbre" och ordet "träd" med begreppet "träd". Dessutom betyder detta att ljudet också är godtyckligt: man kan definiera begreppet "träd" genom närvaron av bark (förutom för palmer) och efter storlek (förutom för "låga träiga växter" - buskar). Av detta bör det vara klart att alla antaganden jag presenterar inte är uppdelade i mer och mindre viktiga: var och en av dem - den systemiska karaktären av tecken (mest förståeligt i den "synkrona" studien av språket), deras relativa (diakritiska) väsen , den godtyckliga karaktären av tecken - kommer från från resten.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språk är både ett uttryck för ordens betydelse (beteckning) och deras resultat (kommunikation) – och dessa två funktioner sammanfaller aldrig (se Shleifers "Dekonstruktion av språket"). Vi kan se den växling av form och innehåll som Greimas och Kurte beskriver i den senaste tolkningsversionen: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar på successiva nivåer för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till kontrasterande morfem, morfem - till ord, ord - till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än summan av dess delar (precis som vatten, i Saussures exempel, är mer än en kombination av väte och syre).

Tre antaganden om "Course of General Linguistics" ledde Saussure till idén om en ny vetenskap från 1900-talet, separat från lingvistik, som studerade "teckens liv i samhället." Saussure kallade denna vetenskap för semiologi (från grekiskan "semeion" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller formulerade) med dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade Saussure sig åt en "semiotisk" analys av sen romersk poesi och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i sin språkliga analys: den var ett försök, som Saussure skriver i en av de 99 anteckningsböckerna, att i systemet studera problemet med "sannolikhet", som "blir grunden för allting. " En sådan undersökning, hävdar Saussure själv, hjälper till att fokusera på den "riktiga sidan" av sannolikhet; ”Nyckelordet” som Saussure letar efter ett anagram för är, enligt Jean Starobinsky, ”ett verktyg för poeten, och inte källan till liv för dikten. Dikten tjänar till att vända nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar.”

Saussures försök att studera egennamn i sen romersk poesi (Tsvetan Todorov kallade detta en förkortning av "ett ord ... bara innan det skrivs") understryker en av komponenterna i hans språkliga analys - teckens godtyckliga karaktär, liksom den formella essensen av saussureisk lingvistik ("Språk", hävdar han, "formens väsen, inte fenomenet"), vilket utesluter möjligheten att analysera innebörden. Todorov drar slutsatsen att idag verkar Saussures skrifter anmärkningsvärt konsekventa i sin ovilja att studera symboler [fenomen som har en väldefinierad betydelse]. . . . När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semilogi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoderna för oavsiktlig tolkning baserad på dessa begrepp, och å andra sidan de strukturalistiska begrepp som Lévi-Strauss kallade "Kantianism utan en transcendent aktör" - raderar konfrontationen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik - Ferlinand de Saussures verk om lingvistik och semiotik markerar en vändpunkt i studiet av betydelser i språk och kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunderna i teorin om grammatik / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiska metoder i lingvistik. M., 1974.

4. Arnold I.V. Ordets semantiska struktur i modern engelska och metodiken för dess studie. /I.V. Arnold-L .: Utbildning, 1966. - 187 sid.

6.Bashlykov A.M. Automatiskt översättningssystem. / A.M. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 sid.

7.Baudouin de Courtenay: Teoretiskt arv och modernitet: Sammandrag av rapporterna från den internationella vetenskapliga konferensen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 sid.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 sid.

9. Golovin, B.N. Språk och statistik. /B.N. Golovin - M., 1971. - 210 sid.

10. Zvegintsev, V.A. Teoretisk och tillämpad lingvistik. / V.A. Zvegintsev - M., 1969. - 143 sid.

11. Kasevich, V.B. Semantik. Syntax. Morfologi. // V.B. Kasevich - M., 1988. - 292 sid.

12. Lekomtsev Yu.K. INTRODUKTION till lingvistikens formella språk / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 s., ill.

13. The Linguistic Heritage of Baudouin de Courtenay at the End of the 20th Century: Abstracts of the International Scientific and Practical Conference 15-18 mars 2000. - Krasnoyarsk, 2000. - 125 sid.

Matveeva G.G. Dolda grammatiska betydelser och identifiering av den sociala personen (”porträtt”) av talaren / G.G. Matveev. - Rostov, 1999. - 174 sid.

14. Melchuk, I.A. Erfarenhet av att bygga språkliga modeller "Mening<-->Text". / I.A. Melchuk. - M., 1974. - 145 sid.

15. Nelyubin L.L. Översättning och tillämpad lingvistik / L.L. Nelyubin. - M.: Högre skola, 1983. - 207 sid.

16. Om språkforskningens exakta metoder: om den så kallade "matematiska lingvistiken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva och andra - M., 1961. - 162 sid.

17. Piotrovsky L.G. Matematisk lingvistik: Lärobok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Högre skola, 1977. - 160 sid.

18. Han är. Text, maskin, person. - L., 1975. - 213 sid.

19. Det är han. Tillämpad lingvistik / Ed. A.S. Gerda. - L., 1986. - 176 sid.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Modern strukturell lingvistik. Problem och metoder. M., 1977. - 239 sid.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunderna i allmän och maskinöversättning / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 sid.

22. Slyusareva N.A. Teorin om F. de Saussure i ljuset av modern lingvistik / N.A. Slyusareva. - M.: Nauka, 1975. - 156 sid.

23. Uggla, L.Z. Analytisk lingvistik / L.Z. Uggla - M., 1970. - 192 sid.

24. Saussure F. de. Anteckningar om allmän lingvistik / F. de Saussure; Per. från fr. - M.: Framsteg, 2000. - 187 sid.

25. Det är han. Kurs i allmän lingvistik / Per. från fr. - Jekaterinburg, 1999. -426 sid.

26. Talstatistik och automatisk textanalys / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 sid.

27. Stoll, P. Sets. Logik. Axiomatiska teorier / R. Stoll; Per. från engelska. - M., 1968. - 180 sid.

28. Tenier, L. Fundamentals of structural syntax. M., 1988.

29. Ubin I.I. Automatisering av översättningsaktiviteter i Sovjetunionen/I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 sid.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Bearbetning av konceptuell information. M., 1980.

32. Shikhanovich, Yu.A. INTRODUKTION till modern matematik (initiala begrepp). M., 1965

33. Shcherba L.V. Ryska vokaler i kvalitativa och kvantitativa termer / L.V. Shcherba - L.: Nauka, 1983. - 159 sid.

34. Abdullah-zade F. Medborgare i världen // Spark - 1996. - Nr 5. - s.13

35. V.A. Uspensky. Preliminär för läsarna av "New Literary Review" till de semiotiska meddelandena från Andrei Nikolaevich Kolmogorov. - Ny litteraturrecension. -1997. - Nr 24. - S. 18-23

36. Perlovsky L. Medvetande, språk och kultur. - Kunskap är makt. -2000. №4 - S. 20-33

Introduktion? Föreläsning översättningsteori

2.4 Utsikter för tillämpning av matematiska metoder inom lingvistik

Kombinationen av "exakt" och "humanitär" kunskap har blivit grogrund för nya upptäckter inom lingvistik, datavetenskap och filosofi.

Slutsats

Under 1900-talet har datortekniken kommit långt - från militär till fredlig användning, från ett snävt spektrum av mål till penetration i alla områden av mänskligt liv. Matematik som vetenskap fick ständigt ny praktisk betydelse med utvecklingen av datateknik. Denna process fortsätter idag.

Matematisk formalism är mest lämpad för att beskriva mönster inom lingvistik (liksom i andra vetenskaper, både humaniora och naturvetenskap). Situationen utvecklas ibland inom vetenskapen på ett sådant sätt att utan användning av ett lämpligt matematiskt språk är det omöjligt att förstå naturen av fysisk, kemisk, etc. processen är inte möjlig. Att skapa en planetmodell av atomen, den berömda engelska fysikern från XX-talet. E. Rutherford upplevde matematiska svårigheter. Till en början accepterades inte hans teori: det lät inte övertygande, och anledningen till detta var Rutherfords okunnighet om sannolikhetsteorin, på grundval av mekanismen för vilken det bara var möjligt att förstå modellrepresentationen av atomära interaktioner. Redan vid den tiden insåg en framstående vetenskapsman, ägaren av Nobelpriset, sig till seminariet för matematikern professor Lamb och under två år, tillsammans med studenterna, deltog i en kurs och arbetade ut en workshop om sannolikhetsteorin . Utifrån det kunde Rutherford beskriva elektronens beteende, vilket gav sin strukturella modell övertygande noggrannhet och fick erkännande. Detsamma är med lingvistik.

Detta fenomen har både en negativ och en positiv sida. Negativt – eftersom kontroll över information strider mot den oförytterliga mänskliga rätten till fri tillgång till den. Positivt - eftersom avsaknaden av denna kontroll kan leda till katastrofala konsekvenser för mänskligheten. Det räcker med att påminna om en av det senaste decenniets klokaste filmer - "When the World Ends" av Wim Wenders, vars karaktärer är helt nedsänkta i den "virtuella verkligheten" av sina egna drömmar inspelade på en dator. Men inte en enda vetenskapsman och inte en enda konstnär kan ge ett entydigt svar på frågan: vad som väntar vetenskap och teknik i framtiden.

Att fokusera på "framtiden", som ibland förefaller fantastiskt, var ett utmärkande drag för vetenskapen i mitten av nittonhundratalet, när uppfinnare försökte skapa perfekta modeller av teknik som kunde fungera utan mänsklig inblandning. Tiden har visat den utopiska karaktären hos sådan forskning. Det skulle dock vara överflödigt att fördöma forskare för detta - utan deras entusiasm på 1950-talet - skulle 60-talets informationsteknik inte ha gjort ett så kraftfullt språng på 90-talet, och vi skulle inte ha det vi har nu.

De senaste decennierna av 1900-talet har förändrat vetenskapens prioriteringar - forskning, uppfinningsrik patos har gett vika för kommersiellt intresse. Återigen, detta är varken bra eller dåligt. Detta är en verklighet där vetenskapen alltmer integreras i vardagen.

2000-talet har fortsatt denna trend, och i vår tid bakom uppfinningar ligger inte bara berömmelse och erkännande, utan först och främst pengar. Det är också därför det är viktigt att se till att de senaste landvinningarna inom vetenskap och teknik inte hamnar i händerna på terroristgrupper eller diktatoriska regimer. Uppgiften är svår till den grad omöjlig; att förverkliga det maximalt är en uppgift för hela världssamfundet.

Information är ett vapen, och vapen är inte mindre farliga än nukleära eller kemiska - bara det verkar inte fysiskt, utan snarare psykologiskt. Mänskligheten måste tänka på vad som är viktigare för den i det här fallet – frihet eller kontroll.

Och i dialogen mellan kulturer genom informationsteknologi är språkets roll som det äldsta universella kommunikationsmedlet fortfarande viktig. Det är därför lingvistik, i samspel med matematik, filosofi och datavetenskap, har upplevt sin andra födelse och fortsätter att utvecklas idag. Nutidens trend kommer att fortsätta i framtiden - "till världens ände", som för 15 år sedan, förutspådde samma V. Wenders. Det är visserligen inte känt när detta slut kommer att inträffa - men spelar det någon roll nu, för framtiden kommer förr eller senare att bli nuet ändå.

Bilaga 1

Ferdinand de Saussure

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses allmänt vara grundaren av modern lingvistik i sina försök att beskriva språkets struktur snarare än historien om särskilda språk och språkformer. I själva verket finner strukturalismens metod inom lingvistik och litteraturvetenskap och en betydande gren av semiotik sin stora utgångspunkt i hans arbete vid sekelskiftet av 1900-talet. Det har till och med hävdats att komplexet av strategier och föreställningar som har kommit att kallas "poststrukturalism" – arbetet av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra – föreslås av Saussures arbete i lingvistik och anagrammatisk läsning av sen latinsk poesi, litterär modernism till psykoanalys och filosofi i början av nittonhundratalet. Som Algirdas Julien Greimas och Joseph Courtés argumenterar i Semiotics and Language: An Analytic Dictionary, under rubriken "Interpretation", uppstod ett nytt tolkningssätt i början av 1900-talet som de identifierar med saussureansk lingvistik, husserliansk fenomenologi och freudiansk psykoanalys. I detta läge är "tolkning inte längre en fråga om att tillskriva ett givet innehåll till en form som annars skulle sakna en, snarare är det en omskrivning som på ett annat sätt formulerar det ekvivalenta innehållet i ett betecknande element inom ett givet semiotiskt system" ( 159). i denna förståelse av "tolkning" är form och innehåll inte distinkta; snarare är varje "form" alternativt också ett semantiskt "innehåll", en "signifierande form", så att tolkningen erbjuder en analogisk omskrivning av något som redan betyder inom något annat system av signifikans.

En sådan omtolkning av form och förståelse – som Claude Lévi-Strauss beskriver i en av sina mest programmatiska artikulationer av begreppet strukturalism, i "Structure and Form: Reflections on a Work by Vladimir Propp" – är implicit i Saussures postuma kurs. i allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure relativt lite, och hans huvudverk, Kursen, var hans studenters transkription av flera kurser i allmän lingvistik som han erbjöd 1907-11. I kursen efterlyste Saussure den "vetenskapliga" studien av språket i motsats till det arbete inom historisk lingvistik som hade utförts på 1800-talet. Det arbetet är en av det västerländska intellektets stora landvinningar: att ta särskilda ord som byggstenar i språk, historisk (eller "diakronisk") lingvistik spårade ursprunget och utvecklingen av västerländska språk från en förmodad gemensam språkkälla, först ett "indoeuropeiskt" språk och sedan ett tidigare "p roto-indoeuropeiskt" språk.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement", som Saussure ifrågasatte. Hans arbete var ett försök att reducera mängden fakta om språk, studerad så noggrant av historisk lingvistik, till ett hanterbart antal påståenden. Den "jämförande skolan" för 1800-talets filologi, säger Saussure i Kursen, "lyckades inte med att upprätta den sanna vetenskapen om lingvistik" eftersom "den misslyckades med att söka upp naturen hos sitt studieobjekt" (3). Denna "natur", hävdar han, återfinns inte bara i de "elementala" orden som ett språk innehåller – de skenbara "positiva" fakta (eller "substanser") i språket – utan i de formella relationer som ger upphov till dessa "ämnen."

Saussures systematiska omprövning av språk bygger på tre antaganden. Den första är att den vetenskapliga studien av språk behöver utveckla och studera systemet snarare än språkfenomens historia. Av denna anledning skiljer han mellan språkets speciella förekomster - dess speciella "talhändelser", som han betecknar som villkorlig frigivning – och det egentliga föremålet för lingvistik, systemet (eller "koden") som styr dessa händelser, som han betecknar som langue. En sådan systematisk studie kräver dessutom en " synkron" uppfattning om förhållandet mellan språkets element vid ett visst ögonblick snarare än den "diakroniska" studien av språkets utveckling genom historien.

Detta antagande gav upphov till vad Roman Jakobson 1929 kom att beteckna som "strukturalism", där "varje uppsättning fenomen som granskas av samtida vetenskap behandlas inte som en mekanisk agglomeration utan som en strukturell helhet, den mekaniska uppfattningen av processer ger efter för frågan. av deras funktion" ("Romantic" 711). I denna passage uttrycker Jakobson Saussures avsikt att definiera lingvistik som ett vetenskapligt system i motsats till en enkel, "mekanisk" redovisning av historiska olyckor. Tillsammans med detta beskriver Jakobson också det andra grundläggande antagandet i Saussurean – vi kan kallar det nu "strukturellt" – lingvistik: att språkets grundläggande element endast kan studeras i relation till deras funktioner snarare än i relation till deras orsaker. Europeiska "ord"), dessa händelser och enheter måste placeras inom ett systemiskt ramverk där de är relaterade till andra så kallade händelser och entiteter. Detta är en radikal omorientering i uppfattningen av erfarenhet och fenomen, en vars betydelse filosofen Ernst Cassirer har jämfört med "den nya vetenskapen om Galileo som på 1600-talet förändrade hela vår begreppet den fysiska världen" (citerad i Culler, Pursuit 2 4). Denna förändring, som Greimas och Courtés noterar, återuppfattar "tolkning" och återuppfattar således själva förklaring och förståelse. Istället för att förklaringen "är i termer av ett fenomens orsaker, så att det som "effekt" på något sätt är underordnat dess orsaker, består förklaringen här i att underordna ett fenomen dess framtidsorienterade "funktion" eller "syfte." Förklaring är inte längre oberoende av mänskliga avsikter eller syften (även om dessa avsikter kan vara opersonliga, gemensamma eller, i freudianska termer, "omedvetna").

I sin lingvistik åstadkommer Saussure denna omvandling specifikt i omdefinieringen av det språkliga "ordet", som han beskriver som det språkliga "tecknet" och definierar i funktionalistiska termer. Tecknet, hävdar han, är föreningen av "ett koncept och en ljudbild", som han kallade "signified and signifier" (66-67; Roy Harriss översättning från 1983 erbjuder termerna "signification" och "signal"). Naturen av deras "kombination" är "funktionell" i det att varken den betecknade eller betecknaren är den andras "orsak"; snarare "var och en av sina värden från den andra" (8). språkelementet, tecknet , relationellt och gör det grundläggande antagandet om historisk lingvistik, nämligen identiteten för de elementära enheterna av språk och betydelse (d.v.s. "ord"), föremål för rigorös analys. Ordet "träd" som "samma" ord är inte pga. ordet definieras av inneboende kvaliteter – det är inte en "mekanisk agglomeration" av sådana kvaliteter – utan för att det definieras som ett element i ett system, språkets "strukturella helhet".

En sådan relationell (eller "diakritisk") definition av en entitet styr uppfattningen av alla element i språket i strukturell lingvistik. Detta är tydligast i den mest imponerande bedriften inom saussureansk lingvistik, utvecklingen av begreppen "fonem" och "särskiljande drag" av språket. Fonemen är de minsta artikulerade och betecknande enheterna i ett språk. Det är inte de ljud som förekommer i språket utan de "ljudbilder" Saussure nämner, som uppfattas av talare – fenomenalt uppfattade – som förmedlande mening. (Elmar Holenstein beskriver således Jakobsons lingvistik, som följer Saussure på viktiga sätt, som "fenomenologisk strukturalism".) Det är av denna anledning som den ledande talespersonen för Prags skolstrukturalism, Jan Mukarovsky, 1937 noterade att "struktur . . . är en fenomenologisk och inte en empirisk verklighet; det är inte själva verket, utan en uppsättning funktionella relationer som är belägna i ett kollektivs medvetande (generation, miljö, etc.)" (citerad i Galan 35). Likaså Lévi-Strauss, den ledande talespersonen för fransk strukturalism , noterade 1960 att "struktur har inget distinkt innehåll; den nöjer sig själv, och den logiska organisationen i vilken den är arresterad är tänkt som en egenskap hos det verkliga" (167; se även Jakobson, Fundamentals 27-28).

Språkets fonem är i sig systematiskt organiserade strukturer av egenskaper. På 1920- och 1930-talen, efter Saussures ledning, isolerade Jakobson och N. S. Trubetzkoy de "särdragen" hos fonem. Dessa egenskaper är baserade på den fysiologiska strukturen hos talorganen - tunga, tänder, stämband och så vidare - att Saussure nämner i kursen och som Harris beskriver som "fysiologisk fonetik" (39; Baskins tidigare översättning använder termen "fonologi" [(1959) 38]) – och de kombineras i "buntar" av binära oppositioner för att bilda fonem. Till exempel på engelska är skillnaden mellan /t/ och /d/ närvaron eller frånvaron av "röst" (engagerandet av stämbanden), och på röstnivån definierar dessa fonem varandra ömsesidigt. På så sätt är fonologi ett specifikt exempel på en allmän språkregel som beskrivs av Saussure: I språket finns bara skillnader. ännu viktigare: en skillnad innebär i allmänhet positiva termer mellan vilka skillnaden är satt upp; men i språket finns det bara skillnader utan positiva termer. Oavsett om vi tar det betecknade eller betecknaren, har språket varken idéer eller ljud som fanns före det språkliga systemet. ( 120)

Inom detta ramverk bestäms språkliga identiteter inte av inneboende kvaliteter utan av systemiska ("strukturella") relationer.

Jag har sagt att fonologin "följde ledningen" av Saussure, för även om hans analys av språkproduktionens fysiologi "nuförtiden", som Harris säger, "skulle kallas "fysisk" i motsats till antingen "psykologisk" eller "funktionell". "" (Läsning 49), följaktligen formulerade han i kursen riktningen och konturerna för en funktionell analys av språket. Likaså var hans enda utökade publicerade verk, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir om det primitiva systemet av vokaler i indoeuropeiska språk), som publicerades 1878, helt och hållet beläget i projektet för nittonde- talets historiska lingvistik. Icke desto mindre, inom detta arbete, som Jonathan Culler har hävdat, visade Saussure "fruktbarheten av att tänka på språket som ett system av rent relationella föremål, även när han arbetade med uppgiften att historiska återuppbyggnaden" (Saussure 66). Genom att analysera de systematiska strukturella sambanden mellan fonem för att redogöra för mönster av vokalväxling i befintliga indoeuropeiska språk, föreslog Saussure att det utöver flera olika fonem /a/ måste ha funnits ett annat fonem som skulle kunna beskrivas formellt. "Det som gör Saussures arbete så mycket imponerande," avslutar Culler, "är det faktum att nästan femtio år senare, när kilskrift Hettite upptäcktes och dechiffrerades, visade sig det innehålla ett fonem, skrivet h, som betedde sig som Saussure hade förutspått. . Han hade upptäckt, genom en rent formell analys, vad som nu är känt som struphuvudet hos indoeuropeiska" (66).

Denna uppfattning om den relationella eller diakritiska bestämningen av betydelsens element, som är både implicit och explicit i kursen, antyder ett tredje antagande som styr strukturell lingvistik, vad Saussure kallar "tecknets godtyckliga natur". Med detta menar han att förhållandet mellan betecknare och betecknat i språket aldrig är nödvändigt (eller "motiverat"): man skulle lika gärna kunna hitta ljudbetecknaren arbre som betecknarträdet för att förena sig med begreppet "träd". Men mer än detta betyder det att det betecknade också är godtyckligt: man skulle lika lätt kunna definiera begreppet "träd" genom dess vedartade kvalitet (vilket skulle utesluta palmer) som genom dess storlek (vilket utesluter de "låga vedartade växterna" vi ring buskar). Detta bör klargöra att numreringen av antaganden jag har presenterat inte representerar en prioritetsordning: varje antagande – den systemiska karaktären av signifikans (bäst uppfattas genom att studera språket "synkront"), den relationella eller "diakritiska" naturen hos elementen av betydelse, teckens godtyckliga natur – får sitt värde från de andra.

Det vill säga, saussureansk lingvistik de fenomen den studerar i övergripande relationer av kombination och kontrast i språk. I denna uppfattning är språk både processen att artikulera mening (betydelse) och dess produkt (kommunikation), och dessa två språkfunktioner är varken identiska eller helt kongruenta (se Schleifer, "Dekonstruktion"). Här kan vi se den växling mellan form och innehåll som Greimas och Courtés beskriver i modernistisk tolkning: språket presenterar kontraster som formellt definierar dess enheter, och dessa enheter kombineras på efterföljande nivåer för att skapa det betecknande innehållet. Eftersom språkets beståndsdelar är godtyckliga kan dessutom varken kontrast eller kombination sägas vara grundläggande. Sålunda, i språket kombineras särdrag för att bilda kontrasterande fonem på en annan nivå av uppfattning, fonem kombineras för att bilda kontrasterande morfem, morfem kombineras för att bilda ord, ord kombineras för att bilda meningar, och så vidare. I varje fall är hela fonemet, eller ordet, eller meningen, och så vidare, större än summan av dess delar (precis som vatten, H2O, i Saussures exempel [(1959) 103] är mer än den mekaniska agglomerationen av väte och syre).

De tre antagandena i kursen i allmän lingvistik ledde till att Saussure efterlyste en ny vetenskap från 1900-talet som skulle gå utöver språkvetenskapen för att studera "teckens liv i samhället." Saussure kallade denna vetenskap "semiologi (från grekiska semeîon "tecken")" (16). "Vetenskapen" om semiotik, som den kom att praktiseras i Östeuropa på 1920- och 1930-talen och Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära artefakter som konstituerades (eller artikulerades) av dessa strukturer. Under hela den sena delen av sin karriär, även när han erbjöd kurserna i allmän lingvistik, fortsatte Saussure sin egen "semiotiska" analys av sen latinsk poesi i ett försök att upptäcka medvetet dolda anagram av egennamn. Studiemetoden var på många sätt motsatsen till den funktionella rationalismen i hans språkliga analyser: den försökte, som Saussure nämner i en av de 99 anteckningsböcker där han genomförde denna studie, att systematiskt undersöka problemet med "slumpen", som " blir den oundvikliga grunden för allt" (citerad i Starobinski 101). En sådan studie, som Saussure själv säger, fokuserar på "det materiella faktum" av slump och mening (citerad 101), så att "temaordet" vars anagram Saussure söker, som Jean Starobinski hävdar, "är, för poeten , ett instrument och inte en livsviktig grodd till dikten. Dikten krävs för att återanvända temaordets ljudmaterial" (45). I denna analys säger Starobinski: "Saussure förlorade inte sig själv i ett sökande efter dolda betydelser." Istället tycks hans arbete visa en önskan att undvika alla problem som uppstår ur medvetandet: "Eftersom poesi inte bara förverkligas i ord utan är något som föds ur ord, undkommer den medvetandets godtyckliga kontroll för att enbart vara beroende av en sorts språklig laglighet "(121).

Det vill säga Saussures försök att upptäcka egennamn i sen latinsk poesi - vad Tzvetan Todorov kallar förminskningen av ett "ord. . . till dess signifier" (266) – betonar ett av de element som styrde hans språkliga analys, tecknets godtyckliga natur. (Det betonar också den formella karaktären hos saussureansk lingvistik – "Språk", hävdar han, "är en form och inte en substans" – som effektivt eliminerar semantik som ett huvudobjekt för analys.) Som Todorov avslutar framstår Saussures arbete anmärkningsvärt homogent idag i sin vägran att acceptera symboliska fenomen. . . . I sin forskning om anagram uppmärksammar han endast fenomenen med upprepning, inte till evokationsfenomen. . . . I sina studier av Nibelungen känner han igen symboler endast för att hänföra dem till felaktiga läsningar: eftersom de inte är avsiktliga existerar inte symboler. Slutligen i sina kurser om allmän lingvistik, överväger han existensen av semiologi, och därmed av andra tecken än lingvistiska; men denna bekräftelse begränsas på en gång av det faktum att semiologin är ägnad åt en enda typ av tecken: de som är godtyckliga. (269-70)

Om detta är sant, beror det på att Saussure inte kunde tänka sig "avsikt" utan ett ämne; han kunde inte riktigt undkomma motsättningen mellan form och innehåll, hans verk gjorde så mycket för att ifrågasätta. Istället tog han till "språklig laglighet". Ligger mellan å ena sidan 1800-talets föreställningar om historia, subjektivitet och sättet för kausal tolkning som styrs av dessa föreställningar och å andra sidan 1900-talets "strukturalistiska" föreställningar om vad Lévi-Strauss kallade "kantianism utan ett transcendentalt subjekt" (citerat i Connerton 23) – begrepp som raderar motsättningen mellan form och innehåll (eller subjekt och objekt) och hierarkin av förgrund och bakgrund i fullskalig strukturalism, psykoanalys och till och med kvantmekanik – Ferdinands verk de Saussure i lingvistik och semiotik avgränsar ett signalmoment i studiet av mening och kultur.

Ronald Schleifer

Bilaga 2

Ferdinand de Saussure (översättning)

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses vara grundaren av modern lingvistik, tack vare hans försök att beskriva språkets struktur snarare än historien om enskilda språk och ordformer. I stort sett lades grunden för strukturella metoder inom lingvistik och litteraturkritik och i stor utsträckning semiotik i hans verk redan i början av 1900-talet. Det är bevisat att metoderna och begreppen för den så kallade "poststrukturalismen", som utvecklats i verk av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra, går tillbaka till Saussures och Saussures språkliga verk. anagrammatiska läsningar av senromersk poesi. Det bör noteras att Saussures arbete med lingvistik och språklig tolkning hjälper till att länka samman ett brett spektrum av intellektuella discipliner, från fysik till litterära innovationer, psykoanalys och filosofi från det tidiga nittonhundratalet. A. J. Greimas och J. Kurte skriver i Semiotics and Language: ”En analytisk ordbok med titeln ”Interpretation” som en ny sorts tolkning dök upp i början av 1900-talet tillsammans med Saussures lingvistik, Husserls fenomenologi och psykoanalysen. av Freud. I ett sådant fall är "tolkning inte att tillskriva ett givet innehåll till en form som annars skulle sakna en, utan snarare en omskrivning som på ett annat sätt formulerar samma innehåll av ett betydande element inom ett givet semiotiskt system" (159 ). I denna förståelse av "tolkning" är form och innehåll oskiljaktiga; tvärtom är varje form fylld med semantisk betydelse ("meningsfull form"), så tolkningen erbjuder en ny, liknande återberättelse av något meningsfullt i ett annat teckensystem.

En liknande förståelse av form och innehåll, presenterad av Claude Lévi-Strauss i ett av strukturalismens nyckelverk, ("Structure and Form: Reflections on the Works of Vladimir Propp"), kan ses i Saussures postumt publicerade bok A Course in Allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure lite, "Kurs" - hans huvudverk - samlades från anteckningar från studenter som deltog i hans föreläsningar om allmän lingvistik 1907-11. I kursen efterlyste Saussure en "vetenskaplig" studie av språket, som kontrasterade det med 1800-talets jämförande-historiska lingvistik. Detta arbete kan betraktas som en av västerländskt tänkandes största landvinningar: med individuella ord som språkets strukturella element som grund, bevisade historisk (eller "diakronisk") språkvetenskap ursprunget och utvecklingen av västeuropeiska språk från en vanligt, indoeuropeiskt språk – och ett tidigare proto-indoeuropeiskt.

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement" som Saussure ifrågasatte. Hans arbete var ett försök att reducera de många fakta om språk som tillfälligt studerades av jämförande lingvistik till ett litet antal satser. 1800-talets jämförande filologiska skola, skriver Saussure, "lyckades inte skapa en riktig språkskola" eftersom "den inte förstod essensen av studieobjektet" (3). Denna "essens", menar han, ligger inte bara i enskilda ord - språkets "positiva substanser" - utan också i de formella sambanden som hjälper dessa substanser att existera.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talet, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särskiljande egenskaperna" hos fonem. Dessa egenskaper är baserade på strukturen hos talorganen - tunga, tänder, stämband - Saussure noterar detta i "Course of General Linguistics", och Harris kallar det "fysiologisk fonetik" (i Baskins tidigare översättning, termen "fonologi" " används) - de är kopplade i "knutar » durg mot en vän för att göra ljud. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av "röst" (spänningen i stämbanden), och röstnivån som skiljer ett fonem från ett annat. Således kan fonologi betraktas som ett exempel på den allmänna språkregel som beskrivs av Saussure: "Det finns bara skillnader i språket." Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

Jag har redan nämnt att fonologin i sin utveckling förlitade sig på Saussures idéer. Även om hans analys av språkfysiologi i modern tid, säger Harris, "skulle kallas 'fysisk', i motsats till 'psykologisk' eller 'funktionell', formulerade han i The Course tydligt riktningen och de grundläggande principerna för den funktionella analysen av språk. Hans enda publicerade verk under hans livstid, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Anteckningar om det ursprungliga vokalsystemet i de indoeuropeiska språken), publicerat 1878, var helt i linje med jämförande historisk lingvistik i 1800-talet. Ändå, i detta arbete, säger Jonathan Culler, visade Saussure "fruktbarheten av idén om språk som ett system av sammanlänkade fenomen, även med dess historiska rekonstruktion." Genom att analysera förhållandet mellan fonem, förklara växlingen av vokaler i de moderna språken i den indoeuropeiska gruppen, föreslog Saussure att förutom flera olika ljud "a", måste det finnas andra fonem som formellt beskrivs. "Vad som gör Saussures arbete särskilt imponerande," avslutar Kaller, "är att nästan 50 år senare, när hettitisk kilskrift upptäcktes och dechiffrerades, hittades ett fonem, i skrift betecknat med "h", som betedde sig som Saussure förutspådde. Genom formell analys upptäckte han det som nu är känt som det gutturala ljudet i de indoeuropeiska språken.

I konceptet med en relativ (diakritisk) definition av tecken, både explicit och underförstådd i kursen, finns det ett tredje nyckelantagande för strukturell lingvistik, kallat av Saussure "tecknets godtyckliga natur". Med detta menas att förhållandet mellan ljud och mening i språket inte är motiverat av någonting: man kan lika gärna koppla ihop ordet "arbre" och ordet "träd" med begreppet "träd". Dessutom betyder detta att ljudet också är godtyckligt: man kan definiera begreppet "träd" genom närvaron av bark (förutom för palmer) och efter storlek (förutom för "låga träiga växter" - buskar). Av detta bör det vara klart att alla antaganden jag presenterar inte är uppdelade i mer och mindre viktiga: var och en av dem - den systemiska karaktären av tecken (mest förståeligt i den "synkrona" studien av språket), deras relativa (diakritiska) essensen, den godtyckliga karaktären av tecken - kommer från från resten.

I saussureansk lingvistik förstås således det studerade fenomenet som en uppsättning jämförelser och motsättningar av språk. Språk är både ett uttryck för ordens betydelse (beteckning) och deras resultat (kommunikation) – och dessa två funktioner sammanfaller aldrig (se Shleifers "Dekonstruktion av språket"). Vi kan se den växling av form och innehåll som Greimas och Kurte beskriver i den senaste tolkningsversionen: språkliga kontraster definierar dess strukturella enheter, och dessa enheter samverkar på successiva nivåer för att skapa ett visst meningsfullt innehåll. Eftersom språkets element är slumpmässiga kan varken kontrast eller kombination ligga till grund. Det betyder att i ett språk bildar särdrag en fonetisk kontrast på en annan förståelsenivå, fonem kombineras till kontrasterande morfem, morfem till ord, ord till meningar osv. I alla fall ett helt fonem, ord, mening osv. är mer än summan av dess delar (precis som vatten, i Saussures exempel, är mer än kombinationen av väte och syre).

Tre antaganden om "Course of General Linguistics" ledde Saussure till idén om en ny vetenskap från 1900-talet, separat från lingvistik, som studerade "teckens liv i samhället." Saussure kallade denna vetenskap för semiologi (från grekiskan "semeîon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utökade studiet av språk och språkliga strukturer till litterära rön sammansatta (eller formulerade) med hjälp av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade Saussure sig åt en "semiotisk" analys av sen romersk poesi och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i sin språkliga analys: den var ett försök, som Saussure skriver i en av de 99 anteckningsböckerna, att i systemet studera problemet med "sannolikhet", som "blir grunden för allting. " En sådan undersökning, hävdar Saussure själv, hjälper till att fokusera på den "riktiga sidan" av sannolikhet; ”Nyckelordet” som Saussure letar efter ett anagram för är, enligt Jean Starobinsky, ”ett verktyg för poeten, och inte källan till liv för dikten. Dikten tjänar till att vända nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar.”

Saussures försök att studera egennamn i sen romersk poesi (Tsvetan Todorov kallade detta en förkortning av "ett ord ... bara innan det skrivs") understryker en av komponenterna i hans språkliga analys - teckens godtyckliga karaktär, liksom den formella essensen av saussureansk lingvistik ("Språk", hävdar han, "formens väsen, inte fenomenet"), vilket utesluter möjligheten att analysera innebörden. Todorov drar slutsatsen att idag verkar Saussures skrifter anmärkningsvärt konsekventa i sin ovilja att studera symboler [fenomen som har en väldefinierad betydelse]. . . . När Saussure utforskar anagram, uppmärksammar Saussure endast upprepning, men inte till tidigare alternativ. . . . När han studerar Nibelungenlied definierar han symbolerna endast för att tilldela dem felaktiga avläsningar: om de är oavsiktliga existerar inte symbolerna. När allt kommer omkring gör han i sina skrifter om allmän lingvistik antagandet att det finns en semiologi som inte bara beskriver språkliga tecken; men detta antagande begränsas av det faktum att semilogi endast kan beskriva slumpmässiga, godtyckliga tecken.

Om det verkligen är så, är det bara för att han inte kunde föreställa sig "avsikt" utan ett föremål; han kunde inte helt överbrygga klyftan mellan form och innehåll - i hans skrifter blev detta till en fråga. Istället vände han sig till "språklig legitimitet". Mellan å ena sidan artonhundratalets begrepp baserade på historia och subjektiva gissningar, och metoderna för oavsiktlig tolkning baserad på dessa begrepp, och å andra sidan de strukturalistiska begrepp som Lévi-Strauss kallade "Kantianism utan en transcendent aktör" - genom att radera motsättningen mellan form och innehåll (subjekt och objekt), mening och ursprung i strukturalism, psykoanalys och till och med kvantmekanik, markerar Ferlinand de Saussures skrifter om lingvistik och semiotik en vändpunkt i studiet av betydelser i språk och kultur.

Ronald Shleifer

Litteratur

1. Admoni V.G. Grunderna i teorin om grammatik / V.G. Admoni; USSR Academy of Sciences.-M.: Nauka, 1964.-104s.

3. Arapov, M.V., Herts, M.M. Matematiska metoder i lingvistik. M., 1974.

4. Arnold I.V. Ordets semantiska struktur i modern engelska och metodiken för dess studie. /I.V. Arnold - L .: Education, 1966. - 187 sid.

6.Bashlykov A.M. Automatiskt översättningssystem. / A.M. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 sid.

7.Baudouin de Courtenay: Teoretiskt arv och modernitet: Sammandrag av rapporterna från den internationella vetenskapliga konferensen / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 sid.

8. A. V. Gladkiy, Elements of Mathematical Linguistics. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 sid.

9. Golovin, B.N. Språk och statistik. /B.N. Golovin - M., 1971. - 210 sid.

10. Zvegintsev, V.A. Teoretisk och tillämpad lingvistik. / V.A. Zvegintsev - M., 1969. - 143 sid.

11. Kasevich, V.B. Semantik. Syntax. Morfologi. // V.B. Kasevich -M., 1988. - 292 sid.

12. Lekomtsev Yu.K. Introduktion till lingvistikens formella språk / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 s., ill.

Matveeva G.G. Dolda grammatiska betydelser och identifiering av den sociala personen (”porträtt”) av talaren / G.G. Matveev. - Rostov, 1999. - 174 sid.

14. Melchuk, I.A. Erfarenhet av att bygga språkliga modeller "Mening<-->Text". / I.A. Melchuk. - M., 1974. - 145 sid.

15. Nelyubin L.L. Översättning och tillämpad lingvistik / L.L. Nelyubin. - M. : Högre skola, 1983. - 207 sid.

16. Om språkforskningens exakta metoder: om den så kallade "matematiska lingvistiken" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva och andra - M., 1961. - 162 sid.

17. Piotrovsky L.G. Matematisk lingvistik: Lärobok / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Högre skola, 1977. - 160 sid.

18. Han är. Text, maskin, person. - L., 1975. - 213 sid.

19. Det är han. Tillämpad lingvistik / Ed. A.S. Gerda. - L., 1986. - 176 sid.

20. Revzin, I.I. språkmodeller. M., 1963. Revzin, I.I. Modern strukturell lingvistik. Problem och metoder. M., 1977. - 239 sid.

21. Revzin, I.I., Rozentsveig, V.Yu. Grunderna i allmän och maskinöversättning / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 sid.

22. Slyusareva N.A. Teorin om F. de Saussure i ljuset av modern lingvistik / N.A. Slyusareva. - M.: Nauka, 1975. - 156 sid.

23. Uggla, L.Z. Analytisk lingvistik / L.Z. Uggla - M., 1970. - 192 sid.

24. Saussure F. de. Anteckningar om allmän lingvistik / F. de Saussure; Per. från fr. – M.: Framsteg, 2000. – 187 sid.

25. Det är han. Kurs i allmän lingvistik / Per. från fr. - Jekaterinburg, 1999. -426 sid.

26. Talstatistik och automatisk textanalys / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 sid.

27. Stoll, P. Sets. Logik. Axiomatiska teorier / R. Stoll; Per. från engelska. - M., 1968. - 180 sid.

28. Tenier, L. Fundamentals of structural syntax. M., 1988.

29. Ubin I.I. Automatisering av översättningsaktiviteter i Sovjetunionen/I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 sid.

30. Faure, R., Kofman, A., Denis-Papin, M. Modern Mathematics. M., 1966.

31. Shenk, R. Bearbetning av konceptuell information. M., 1980.

32. Shikhanovich, Yu.A. Introduktion till modern matematik (initiala begrepp). M., 1965

33. Shcherba L.V. Ryska vokaler i kvalitativa och kvantitativa termer / L.V. Shcherba - L.: Nauka, 1983. - 159 sid.

34. Abdullah-zade F. Världsmedborgare // Ogonyok - 1996. - Nr 5. – s.13

35. V.A. Uspensky. Preliminär för läsarna av "New Literary Review" till de semiotiska meddelandena från Andrei Nikolaevich Kolmogorov. – En ny litteraturrecension. –1997. - Nr 24. - S. 18-23

36. Perlovsky L. Medvetande, språk och kultur. - Kunskap är makt. –2000. Nr 4 - S. 20-33

37. Frumkina R.M. Om oss - snett. // Russian Journal. - 2000. - Nr 1. – s. 12

38. Fitialov, S.Ya. Om syntaxmodellering i strukturell lingvistik // Problems of Structural Linguistics. M., 1962.

39. Det är han. Om likvärdigheten mellan NN-grammatik och beroendegrammatik // Problems of Structural Linguistics. M., 1967.

40. Chomsky, N. Logiska grunder för lingvistisk teori // Nytt inom lingvistik. Problem. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//press. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. tryck. jhu.ru

46. en.wikipedia.org

47. www.smolensk.ru

Kryptanalys är en vetenskap (och praktiken för dess tillämpning) om metoder och sätt att bryta chiffer. Kryptografi och kryptoanalys utgör ett enda kunskapsområde - kryptologi, som för närvarande är den moderna matematikens område, som har viktiga tillämpningar inom modern informationsteknologi. Termen "kryptografi" introducerades av D. Vallis. Behovet av att kryptera meddelanden uppstod för länge sedan. V-...

Är den närmaste, inte den vidare betydelsen av ordet. Den psykologiska riktningen, och särskilt den unga grammatiken, svarade alltså på många frågor som ställde lingvistiken inför mitten av 1800-talet. Metodiken för jämförande historisk lingvistik klargjordes, huvudproblemen med semasiologi och funktionell-semantisk grammatik ställdes, relationen mellan språk och tal analyserades, ...

Kontakter", "Flerspråkighet i den sociologiska aspekten". Deras studie utförs av sociolingvistik (sociallingvistik), som uppstod i skärningspunkten mellan lingvistik och sociologi, såväl som etnolinguistik, talets etnografi, stilistik, retorik, pragmatik, teorin av språklig kommunikation, teorin om masskommunikation, etc. Språket utför följande sociala funktioner i samhället: kommunikativt / informativt (...

Om språkvetenskapens avsnitt och sammansättning. De empiriskt formade delarna av lingvistiken, som delvis skär varandra och därför inte bildar ett logiskt enhetligt system, kan representeras som korrelerande med varandra enligt några olika parametrar. Allmän lingvistik och partiella språkvetenskaper. De mest allmänna och speciella delarna av lingvistik särskiljs. En av de viktigaste delarna av lingvistik är teorin ...

Introduktion

Kapitel 1. Historien om tillämpningen av matematiska metoder i lingvistik

1.1. Bildandet av strukturell lingvistik vid 1800- och 1900-talet

1.2. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1. Maskinöversätta

2.2.Statistiska metoder i språkinlärning

2.3. Att lära sig ett språk med metoder för formell logik

2.4. Utsikter för tillämpning av matematiska metoder i lingvistik

Slutsats

Litteratur

Bilaga 1. Ronald Schleifer. Ferdinand de Saussure

Bilaga 2. Ferdinand de Saussure (översättning)

Introduktion

Syftet med mitt kursarbete är att kort belysa sambandet mellan matematik och en sådan gren av lingvistik som lingvistik. Sedan 1950-talet har matematik använts inom lingvistik för att skapa en teoretisk apparat för att beskriva språkens struktur (både naturliga och artificiella). Det bör dock sägas att den inte omedelbart fann en sådan praktisk tillämpning för sig själv. Inledningsvis började matematiska metoder inom lingvistik användas för att klargöra lingvistikens grundläggande begrepp, men med utvecklingen av datateknik började en sådan teoretisk premiss att få tillämpning i praktiken. Lösningen av sådana uppgifter som maskinöversättning, maskinell informationshämtning, automatisk textbearbetning krävde ett fundamentalt nytt förhållningssätt till språket. Språkvetarna ställdes inför frågan: hur man lär sig att representera språkliga mönster i den form i vilken de kan appliceras direkt på tekniken. Termen "matematisk lingvistik", som är populär i vår tid, syftar på all språklig forskning som använder exakta metoder (och begreppet exakta metoder inom naturvetenskap är alltid nära besläktat med matematik). Vissa forskare från de senaste åren tror att uttrycket i sig inte kan höjas till en term, eftersom det inte betyder någon speciell "lingvistik", utan bara en ny riktning fokuserad på att förbättra, öka noggrannheten och tillförlitligheten av språkforskningsmetoder . Lingvistik använder både kvantitativa (algebraiska) och icke-kvantitativa metoder, vilket för den närmare matematisk logik, och följaktligen till filosofi och till och med psykologi. Till och med Schlegel noterade samspelet mellan språk och medvetande, och Ferdinand de Saussure, en framstående lingvist i början av 1900-talet (jag kommer att berätta om hans inflytande på utvecklingen av matematiska metoder inom lingvistik senare), kopplade samman språkets struktur med dess tillhörighet till folket. Den moderna forskaren L. Perlovsky går längre och identifierar språkets kvantitativa egenskaper (till exempel antalet kön, fall) med särdragen hos den nationella mentaliteten (mer om detta i avsnitt 2.2, "Statistiska metoder i lingvistik").

Samspelet mellan matematik och lingvistik är ett mångfacetterat ämne, och i mitt arbete kommer jag inte att uppehålla mig vid alla, utan först och främst vid dess tillämpade aspekter.

Kapitel I. Historien om tillämpningen av matematiska metoder i lingvistik

1.1 Bildandet av strukturell lingvistik vid början av XIX - XX-talet

Saussure föreslog idén om en ny vetenskap från 1900-talet, skild från lingvistik, som studerade teckens roll i samhället. Saussure kallade denna vetenskap för semiologi (från grekiskan "semeîon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller artikulerade) i termer av dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade sig Saussure åt en "semiotisk" analys av sen romersk poesi, och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i dess språkliga analys: den var ett försök att i ett system studera problemet med "sannolikhet" i språket. Sådan forskning hjälper till att fokusera på den "verkliga sidan" av sannolikhet; "nyckelordet" som Saussure letar efter ett anagram för är enligt Jean Starobinsky "ett verktyg för poeten, inte källan till diktens liv." Dikten tjänar till att byta ut nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar” (se . Bilaga 1).

1.2 Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

Chomskys teori har gått igenom flera stadier i sin utveckling.

Drivkraften till början av dessa arbeten i vårt land var den första utvecklingen inom området maskinöversättning i USA (även om den första mekaniserade översättningsanordningen av P.P. Smirnov-Trojanskij uppfanns i Sovjetunionen 1933, eftersom den var primitiv, blev inte utbredd). 1947 kom A. Butt och D. Britten med en kod för ord-för-ord-översättning med hjälp av en dator, ett år senare föreslog R. Richens en regel för att dela upp ord i stammar och ändelser i maskinöversättning. De åren var helt annorlunda än idag. Det var mycket stora och dyra maskiner som tog hela rum och krävde en stor stab av ingenjörer, operatörer och programmerare för att underhålla dem. I grund och botten användes dessa datorer för att utföra matematiska beräkningar för militära institutioners behov - det nya inom matematik, fysik och teknik tjänade först och främst militära angelägenheter. I de tidiga stadierna stöddes utvecklingen av MP aktivt av militären, medan (under det kalla krigets förhållanden) den rysk-engelska riktningen utvecklades i USA och den anglo-ryska riktningen i Sovjetunionen.

Den första generationen av maskinöversättningssystem var dock mycket ofullkomliga. Alla var baserade på sekventiella översättningsalgoritmer "ord för ord", "fras för fras" - semantiska samband mellan ord och meningar togs inte i beaktande på något sätt. Till exempel är meningarna: John letade efter sin leksakslåda.Till slut hittade han den. Lådan låg i pennan.John var väldigt glad. (John letade efter sin leksakslåda. Till slut hittade han den. Lådan låg i lekhagen. John var väldigt glad.)" "Penna" i detta sammanhang är inte en "penna" (skrivverktyg), utan en "lekhage" ( lek-penna). Kunskap om synonymer, antonymer och bildliga betydelser är svåra att föra in i en dator. En lovande riktning var utvecklingen av datorsystem fokuserade på användningen av en mänsklig översättare.

Lyapunov talade om översättning genom att extrahera innebörden av den översatta texten och presentera den på ett annat språk. Tillvägagångssättet för att bygga maskinöversättningssystem baserat på att erhålla den semantiska representationen av den ingående meningen genom semantisk analys och syntes av den inmatade meningen enligt den erhållna semantiska representationen anses fortfarande vara den mest perfekta. Sådana system kallas I-system (från ordet "interlingua"). Uppgiften att skapa dem, som ligger tillbaka i slutet av 50-talet och början av 60-talet, har dock inte lösts helt hittills, trots ansträngningarna från International Federation of IFIP - världsgemenskapen av forskare inom informationsbehandlingsområdet.

Maskinöversättningsverk från denna period, kallade "klassiska", är dock av teoretiskt snarare än praktiskt intresse. Kostnadseffektiva maskinöversättningssystem började skapas först på åttiotalet av förra seklet. Jag kommer att prata om detta senare i avsnitt 2.1, Maskinöversättning.

1960-70-talen inkluderar djupa teoretiska utvecklingar med metoder för mängdlära och matematisk logik, såsom fältteori och fuzzy mängdteori.

I den här teorin talar vi inte så mycket om elements tillhörighet till en given mängd (АОа), som om graden av detta medlemskap (mАОа), eftersom perifera element kan tillhöra flera fält i en eller annan grad. Zade (Lofti-zade) var född i Azerbajdzjan, fram till 12 års ålder hade han praxis att kommunicera på fyra språk - azerbajdzjanska, ryska, engelska och persiska - och använde tre olika alfabet: kyrilliska, latinska, arabiska. När en vetenskapsman tillfrågas vad som är gemensamt mellan teorin om fuzzy sets och lingvistik, förnekar han inte detta samband, utan förtydligar: ”Jag är inte säker på att studiet av dessa språk hade ett stort inflytande på mitt tänkande. Om så var fallet, då bara undermedvetet. I sin ungdom studerade Zadeh på en presbyteriansk skola i Teheran, och efter andra världskriget emigrerade han till USA. "Frågan är inte om jag är amerikan, ryss, azerbajdzjan eller någon annan", sa han i ett av samtalen, "jag är formad av alla dessa kulturer och folk och känner mig ganska bekväm bland var och en av dem." I dessa ord finns något som liknar det som kännetecknar teorin om fuzzy sets - ett avsteg från entydiga definitioner och skarpa kategorier.

Kapitel 2. Utvalda exempel på användning av matematik i lingvistik

2.1 Maskinöversättning

Under perioden 1978-93 spenderades 20 miljoner dollar på forskning inom området maskinöversättning i USA, 70 miljoner i Europa och 200 miljoner i Japan.

I juli 1990 presenterades det första kommersiella maskinöversättningssystemet i Ryssland som heter PROMT (PROgrammers maskinöversättning) vid PC-forumet i Moskva. PROMT vann NASA:s anbud för leverans av MP-system (PROMT var det enda icke-amerikanska företaget i detta 1992 släppte PROMT en hel familj av system under det nya namnet STYLUS för översättning från engelska, tyska, franska, italienska och spanska till ryska och från ryska till engelska, och världens första maskinöversättningssystem för Windows skapades på grunden för STYLUS 1993. 1994 släpptes STYLUS 2.0 för Windows 3.X/95/NT, och 1995-1996 den tredje generationen av maskinöversättningssystem, helt 32-bitars STYLUS 3.0 för Windows 95/NT, medan utvecklingen av helt nya, världens första rysk-tyska och rysk-franska maskinöversättningssystem slutfördes framgångsrikt.

Nuförtiden växer nya maskinöversättningsteknologier fram baserade på användningen av artificiell intelligens och statistiska metoder. Om det senare - i nästa avsnitt.

2.2 Statistiska metoder i språkinlärning

där e är översättningssatsen och f är den ursprungliga meningen

I allmänhet fungerar ett maskinöversättningssystem i två lägen:

Implementeringen av Viterbi-algoritmen som används för att träna modell #1 är som följer:

1. Hela tabellen med översätär fylld med samma värden.

2. För alla möjliga varianter av parvisa kopplingar av ord beräknas sannolikheten P(a, f | e):

3. Värdena för P(a, f | e) normaliseras för att erhålla värdena för P(a | e, f).

4. Frekvensen för varje översättningspar beräknas, viktad med sannolikheten för varje inriktningsalternativ.

5. De resulterande viktade frekvenserna normaliseras och bildar en ny tabell över översättningskorrespondenssannolikheter

6. Algoritmen upprepas från steg 2.

Betrakta, som ett exempel, träningen av en liknande modell på en korpus av två par meningar (Fig. 2):

vita huset

Hus/Hus

Efter ett stort antal iterationer kommer vi att få en tabell (tabell 2), som visar att översättningen är utförd med hög noggrannhet.

		Byggare
Mänsklig	patient (10), personlighet (5)	man (5)
Bra	hjälp (8), hjälp (7)	ond (16)
liv	död (10)	härlig (5)
död	lik (8)	livet (6)
brand	värma (8), bränna (6)	eld (7)
finger	hand (14), panaritium (5)	stor (7), index (6)
ögon	syn (6), pupill, ögonläkare (5 vardera)	brun (10), stor (6)
huvud	sinne (14), hjärnor (5)	stor (9), smart (8), smart (6)
förlora	medvetande, liv (4 vardera)	pengar (5), hitta (4)

(a) Välj lämplig uppsättning enligt vissa parametrar;

Baserat på materialet i det ryska språket finns det 5 frekvensordböcker (inte räknar grenordböcker). Låt oss bara notera några allmänna brister i de befintliga ordböckerna.

Sammanställning av stora frekvensordböcker kräver användning av datorteknik. Införandet av partiell mekanisering och automatisering i arbetet med en ordbok är av intresse som ett experiment i maskinell bearbetning av ordböcker för olika texter. En sådan ordbok kräver ett mer rigoröst system för bearbetning och ackumulering av ordförrådsmaterial. I miniatyr är detta ett informationssökningssystem som kan ge information om olika aspekter av text och ordförråd. Några grundläggande förfrågningar till detta system är planerade från allra första början: det totala antalet inventeringsord, de statistiska egenskaperna för ett enstaka ord och hela ordböcker, ordningen av vanliga och sällsynta zoner i ordboken, etc. Maskinkortfilen låter dig att automatiskt bygga omvända ordböcker för enskilda genrer och källor. Många annan användbar statistisk information om språket kommer att extraheras från den ackumulerade mängden information. Datorfrekvensordboken skapar en experimentell grund för övergången till en mer omfattande automatisering av ordförrådsarbetet.

Statistiska data från frekvensordböcker kan också användas i stor utsträckning för att lösa andra språkliga problem - till exempel för att analysera och bestämma de aktiva sätten för ordbildning av det moderna ryska språket, lösa problem med att förbättra grafik och stavning, som är förknippade med att ta in ta hänsyn till statistisk information om ordförrådet (det är viktigt att ta hänsyn till probabilistiska egenskaper hos grafekombinationer, typer av bokstavskombinationer realiserade i ord), praktisk transkription och translitteration. De statistiska parametrarna i ordboken kommer också att vara användbara för att lösa problem med att automatisera maskinskrivning, igenkänning och automatisk läsning av bokstavlig text.

Det bör noteras att dessa ordböcker är olika till sin natur: vissa representerar vokabulären för ett dramatiskt verk, andra - böcker med sångtexter, eller flera böcker, eller hela korpusen av poetens dikter. Resultaten av analysen som presenteras i denna artikel bör tas med försiktighet, de kan inte tas som absoluta. Med hjälp av särskilda åtgärder kan dock skillnaden i texters ontologiska karaktär i viss mån minskas.

På senare år har motsättningen mellan vardags- och boktal blivit allt tydligare insett. Denna fråga diskuteras särskilt skarpt bland metodologer som kräver en vändning i undervisningen mot det talade språket. Emellertid förblir särdragen hos vardagligt tal fortfarande oförklarad.

2.3 Att lära sig språket med metoder för formell logik

2.4 Utsikter för tillämpning av matematiska metoder inom lingvistik

Kombinationen av "exakt" och "humanitär" kunskap har blivit grogrund för nya upptäckter inom lingvistik, datavetenskap och filosofi.

Slutsats

Detta fenomen har både en negativ och en positiv sida. Negativt – eftersom kontroll över information strider mot den oförytterliga mänskliga rätten till fri tillgång till den. Positivt - eftersom avsaknaden av denna kontroll kan leda till katastrofala konsekvenser för mänskligheten. Det räcker med att påminna om en av det senaste decenniets klokaste filmer - "When the World Ends" av Wim Wenders, vars karaktärer är helt nedsänkta i den "virtuella verkligheten" av sina egna drömmar inspelade på en dator. Men inte en enda vetenskapsman och inte en enda konstnär kan ge ett entydigt svar på frågan: vad som väntar vetenskap och teknik i framtiden.

Att fokusera på "framtiden", som ibland förefaller fantastiskt, var ett utmärkande drag för vetenskapen i mitten av nittonhundratalet, när uppfinnare försökte skapa perfekta modeller av teknik som kunde fungera utan mänsklig inblandning. Tiden har visat den utopiska karaktären hos sådan forskning. Det skulle dock vara överflödigt att fördöma forskare för detta - utan deras entusiasm på 1950- och 60-talen skulle informationsteknologin inte ha gjort ett så kraftfullt språng på 90-talet, och vi skulle inte ha det vi har nu.

Bilaga 1

Ferdinand de Saussure

Den schweiziska lingvisten Ferdinand de Saussure (1857-1913) anses allmänt vara grundaren av modern lingvistik i sina försök att beskriva språkets struktur snarare än historien om särskilda språk och språkformer. I själva verket finner strukturalismens metod inom lingvistik och litteraturvetenskap och en betydande gren av semiotik sin stora utgångspunkt i hans arbete vid sekelskiftet av 1900-talet. Det har till och med hävdats att komplexet av strategier och föreställningar som har kommit att kallas "poststrukturalism" - arbetet av Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes och andra - föreslås av Saussures arbete i lingvistik och anagrammatisk läsning av sen latinsk poesi, litterär modernism till psykoanalys och filosofi i början av nittonhundratalet. Som Algirdas Julien Greimas och Joseph Courtés argumenterar i Semiotics and Language: An Analytic Dictionary, under rubriken "Interpretation", uppstod ett nytt tolkningssätt i början av 1900-talet som de identifierar med saussureansk lingvistik, husserliansk fenomenologi och freudiansk psykoanalys. I detta läge är "tolkning inte längre en fråga om att tillskriva ett givet innehåll till en form som annars skulle sakna en, snarare är det en omskrivning som på ett annat sätt formulerar det ekvivalenta innehållet i ett betecknande element inom ett givet semiotiskt system" ( 159). i denna förståelse av "tolkning" är form och innehåll inte distinkta; snarare är varje "form" alternativt också ett semantiskt "innehåll", en "signifierande form", så att tolkningen erbjuder en analogisk omskrivning av något som redan betyder inom något annat system av signifikans.

En sådan omtolkning av form och förståelse - som Claude Lévi-Strauss beskriver i en av sina mest programmatiska artikulationer av begreppet strukturalism, i "Structure and Form: Reflections on a Work by Vladimir Propp" - är implicit i Saussures postuma kurs. i allmän lingvistik (1916, övers., 1959, 1983). Under sin livstid publicerade Saussure relativt lite, och hans huvudverk, Kursen, var hans studenters transkription av flera kurser i allmän lingvistik som han erbjöd 1907-11. I kursen efterlyste Saussure den "vetenskapliga" studien av språket i motsats till det arbete inom historisk lingvistik som hade utförts på 1800-talet. Det arbetet är en av det västerländska intellektets stora landvinningar: att ta särskilda ord som byggstenar i språk, historisk (eller "diakronisk") lingvistik spårade ursprunget och utvecklingen av västerländska språk från en förmodad gemensam språkkälla, först ett "indoeuropeiskt" språk och sedan ett tidigare "p roto-indoeuropeiskt" språk.

Detta antagande gav upphov till vad Roman Jakobson 1929 kom att beteckna som "strukturalism", där "varje uppsättning fenomen som granskas av samtida vetenskap behandlas inte som en mekanisk agglomeration utan som en strukturell helhet, den mekaniska uppfattningen av processer ger efter för frågan. av deras funktion" ("Romantic" 711). I denna passage uttrycker Jakobson Saussures avsikt att definiera lingvistik som ett vetenskapligt system i motsats till en enkel, "mekanisk" redovisning av historiska olyckor. Tillsammans med detta beskriver Jakobson också det andra grundläggande antagandet i Saussurean - vi kan kallar det nu "strukturellt" - lingvistik: att språkets grundläggande element endast kan studeras i relation till deras funktioner snarare än i förhållande till deras orsaker. Europeiska "ord"), dessa händelser och enheter måste placeras inom ett systemiskt ramverk där de är relaterade till andra så kallade händelser och entiteter. Detta är en radikal omorientering i uppfattningen av erfarenhet och fenomen, en vars betydelse filosofen Ernst Cassirer har jämfört med "den nya vetenskapen om Galileo som på 1600-talet förändrade hela vår begreppet den fysiska världen" (citerad i Culler, Pursuit 2 4). Denna förändring, som Greimas och Courtés noterar, återuppfattar "tolkning" och återuppfattar således själva förklaring och förståelse. Istället för att förklaringen "är i termer av ett fenomens orsaker, så att det som "effekt" på något sätt är underordnat dess orsaker, består förklaringen här i att underordna ett fenomen dess framtidsorienterade "funktion" eller "syfte." Förklaring är inte längre oberoende av mänskliga avsikter eller syften (även om dessa avsikter kan vara opersonliga, gemensamma eller, i freudianska termer, "omedvetna").

En sådan relationell (eller "diakritisk") definition av en entitet styr uppfattningen av alla element i språket i strukturell lingvistik. Detta är tydligast i den mest imponerande bedriften inom saussureansk lingvistik, utvecklingen av begreppen "fonem" och "särskiljande drag" av språket. Fonemen är de minsta artikulerade och betecknande enheterna i ett språk. Det är inte de ljud som förekommer i språket utan de "ljudbilder" Saussure nämner, som uppfattas av talare - fenomenalt uppfattade - som förmedlande mening. (Elmar Holenstein beskriver således Jakobsons lingvistik, som följer Saussure på viktiga sätt, som "fenomenologisk strukturalism".) Det är av denna anledning som den ledande talespersonen för Prags skolstrukturalism, Jan Mukarovsky, 1937 noterade att "struktur . . . är en fenomenologisk och inte en empirisk verklighet; det är inte själva verket, utan en uppsättning funktionella relationer som är belägna i ett kollektivs medvetande (generation, miljö, etc.)" (citerad i Galan 35). Likaså Lévi-Strauss, den ledande talespersonen för fransk strukturalism , noterade 1960 att "struktur har inget distinkt innehåll; den nöjer sig själv, och den logiska organisationen i vilken den är arresterad är tänkt som en egenskap hos det verkliga" (167; se även Jakobson, Fundamentals 27-28).

Inom detta ramverk bestäms språkliga identiteter inte av inneboende kvaliteter utan av systemiska ("strukturella") relationer.

Jag har sagt att fonologin "följde ledningen" av Saussure, för även om hans analys av språkproduktionens fysiologi "nuförtiden", som Harris säger, "skulle kallas "fysisk" i motsats till antingen "psykologisk" eller "funktionell". "" (Läsning 49), följaktligen formulerade han i kursen riktningen och konturerna för en funktionell analys av språket. Likaså var hans enda utökade publicerade verk, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir om det primitiva systemet av vokaler i indoeuropeiska språk), som publicerades 1878, helt och hållet beläget i projektet för nittonde- talets historiska lingvistik. Icke desto mindre, inom detta arbete, som Jonathan Culler har hävdat, visade Saussure "fruktbarheten av att tänka på språket som ett system av rent relationella föremål, även när han arbetade med uppgiften att historiska återuppbyggnaden" (Saussure 66). Genom att analysera de systematiska strukturella sambanden mellan fonem för att redogöra för mönster av vokalväxling i befintliga indoeuropeiska språk, föreslog Saussure att det utöver flera olika fonem /a/ måste ha funnits ett annat fonem som skulle kunna beskrivas formellt. "Det som gör Saussures arbete så mycket imponerande," avslutar Culler, "är det faktum att nästan femtio år senare, när kilskrift Hettite upptäcktes och dechiffrerades, visade sig det innehålla ett fonem, skrivet h, som betedde sig som Saussure hade förutspått. . Han hade upptäckt, genom en rent formell analys, vad som nu är känt som struphuvudet hos indoeuropeiska" (66).

Det vill säga, saussureansk lingvistik de fenomen den studerar i övergripande relationer av kombination och kontrast i språk. I denna uppfattning är språk både processen att artikulera mening (betydelse) och dess produkt (kommunikation), och dessa två språkfunktioner är varken identiska eller helt kongruenta (se Schleifer, "Dekonstruktion"). Här kan vi se den växling mellan form och innehåll som Greimas och Courtés beskriver i modernistisk tolkning: språket presenterar kontraster som formellt definierar dess enheter, och dessa enheter kombineras på efterföljande nivåer för att skapa det betecknande innehållet. Eftersom språkets beståndsdelar är godtyckliga kan dessutom varken kontrast eller kombination sägas vara grundläggande. Sålunda, i språket kombineras särdrag för att bilda kontrasterande fonem på en annan nivå av uppfattning, fonem kombineras för att bilda kontrasterande morfem, morfem kombineras för att bilda ord, ord kombineras för att bilda meningar, och så vidare. I varje fall är hela fonemet, eller ordet, eller meningen, och så vidare, större än summan av dess delar (precis som vatten, H2O, i Saussures exempel [(1959) 103] är mer än den mekaniska agglomerationen av väte och syre).

De tre antagandena i kursen i allmän lingvistik ledde till att Saussure efterlyste en ny vetenskap från 1900-talet som skulle gå utöver språkvetenskapen för att studera "teckens liv i samhället." Saussure kallade denna vetenskap "semiologi (från grekiska semeîon "tecken")" (16). "Vetenskapen" om semiotik, som den kom att praktiseras i Östeuropa på 1920- och 1930-talen och Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära artefakter som konstituerades (eller artikulerades) av dessa strukturer. Under hela den sena delen av sin karriär, även när han erbjöd kurserna i allmän lingvistik, fortsatte Saussure sin egen "semiotiska" analys av sen latinsk poesi i ett försök att upptäcka medvetet dolda anagram av egennamn. Studiemetoden var på många sätt motsatsen till den funktionella rationalismen i hans språkliga analyser: den försökte, som Saussure nämner i en av de 99 anteckningsböcker där han genomförde denna studie, att systematiskt undersöka problemet med "slumpen", som " blir den oundvikliga grunden för allt" (citerad i Starobinski 101). En sådan studie, som Saussure själv säger, fokuserar på "det materiella faktum" av slump och mening (citerad 101), så att "temaordet" vars anagram Saussure söker, som Jean Starobinski hävdar, "är, för poeten , ett instrument och inte en livsviktig grodd till dikten. Dikten krävs för att återanvända temaordets ljudmaterial" (45). I denna analys säger Starobinski: "Saussure förlorade inte sig själv i ett sökande efter dolda betydelser." Istället tycks hans arbete visa en önskan att undvika alla problem som uppstår ur medvetandet: "Eftersom poesi inte bara förverkligas i ord utan är något som föds ur ord, undkommer den medvetandets godtyckliga kontroll för att enbart vara beroende av en sorts språklig laglighet "(121).

Om detta är sant, beror det på att Saussure inte kunde tänka sig "avsikt" utan ett ämne; han kunde inte riktigt undkomma motsättningen mellan form och innehåll, hans verk gjorde så mycket för att ifrågasätta. Istället tog han till "språklig laglighet". Ligger mellan å ena sidan 1800-talets föreställningar om historia, subjektivitet och sättet för kausal tolkning som styrs av dessa föreställningar och å andra sidan 1900-talets "strukturalistiska" föreställningar om vad Lévi-Strauss kallade "kantianism utan ett transcendentalt subjekt" (citerat i Connerton 23) - begrepp som raderar motsättningen mellan form och innehåll (eller subjekt och objekt) och hierarkin av förgrund och bakgrund i fullskalig strukturalism, psykoanalys och till och med kvantmekanik - Ferdinands verk de Saussure i lingvistik och semiotik avgränsar ett signalmoment i studiet av mening och kultur.

Ronald Schleifer

Bilaga 2

Ferdinand de Saussure (översättning)

Det är just denna studie av ordens unika förekomst, med det åtföljande antagandet att språkets grundläggande "enhet" i själva verket är den positiva existensen av dessa "ordelement" som Saussure ifrågasatte. Hans arbete var ett försök att reducera de många fakta om språk som tillfälligt studerades av jämförande lingvistik till ett litet antal satser. 1800-talets jämförande filologiska skola, skriver Saussure, "lyckades inte skapa en riktig språkskola" eftersom "den inte förstod essensen av studieobjektet" (3). Denna "essens", menar han, ligger inte bara i enskilda ord - språkets "positiva substanser" - utan också i de formella sambanden som hjälper dessa substanser att existera.

Ett språks ljud är en systematiskt organiserad uppsättning funktioner. På 1920-1930-talen, efter Saussure, pekade Jacobson och N.S. Trubetskoy ut de "särdragen" hos fonem. Dessa egenskaper är baserade på strukturen hos talorganen - tunga, tänder, stämband - Saussure märker detta i "Course of General Linguistics", och Harris kallar det "fysiologisk fonetik" (i Baskins tidigare översättning, termen "fonologi" " används) - de är kopplade i "knutar » durg mot en vän för att göra ljud. Till exempel på engelska är skillnaden mellan "t" och "d" närvaron eller frånvaron av "röst" (spänningen i stämbanden), och röstnivån som skiljer ett fonem från ett annat. Således kan fonologi betraktas som ett exempel på den allmänna språkregel som beskrivs av Saussure: "Det finns bara skillnader i språket." Ännu viktigare är inte detta: skillnaden innebär vanligtvis de exakta förhållandena mellan vilka den är belägen; men i språket finns det bara skillnader utan precisa villkor. Oavsett om vi överväger "beteckning" eller "betecknad" - i språket finns varken begrepp eller ljud som skulle ha funnits före språksystemets utveckling.

I en sådan struktur definieras språkliga analogier inte med hjälp av sina inneboende egenskaper, utan med hjälp av system (”strukturella”) relationer.

Jag har redan nämnt att fonologin i sin utveckling förlitade sig på Saussures idéer. Även om hans analys av språkfysiologi i modern tid, säger Harris, "skulle kallas 'fysisk', i motsats till 'psykologisk' eller 'funktionell', formulerade han i The Course tydligt riktningen och de grundläggande principerna för den funktionella analysen av språk. Hans enda publicerade verk under hans livstid, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Anteckningar om det ursprungliga vokalsystemet i de indoeuropeiska språken), publicerat 1878, var helt i linje med jämförande historisk lingvistik i 1800-talet. Ändå, i detta arbete, säger Jonathan Culler, visade Saussure "fruktbarheten av idén om språk som ett system av sammanlänkade fenomen, även med dess historiska rekonstruktion." Genom att analysera förhållandet mellan fonem, förklara växlingen av vokaler i de moderna språken i den indoeuropeiska gruppen, föreslog Saussure att förutom flera olika ljud "a", måste det finnas andra fonem som formellt beskrivs. "Vad som gör ett speciellt intryck i Saussures verk," avslutar Kaller, "är att nästan 50 år senare, när hettitisk kilskrift upptäcktes och dechiffrerades, hittades ett fonem, i skrift betecknat med "h", som betedde sig som Saussure förutspådde. Genom formell analys upptäckte han det som nu är känt som det gutturala ljudet i de indoeuropeiska språken.

Tre antaganden om "Course of General Linguistics" ledde Saussure till idén om en ny vetenskap från 1900-talet, separat från lingvistik, som studerade "teckens liv i samhället." Saussure kallade denna vetenskap för semiologi (från grekiskan "semeîon" - ett tecken). Semiotikens "vetenskap", som utvecklades i Östeuropa på 1920- och 1930-talen och i Paris på 1950- och 1960-talen, utvidgade studiet av språk och språkliga strukturer till litterära fynd sammansatta (eller formulerade) med dessa strukturer. Dessutom, i skymningen av sin karriär, parallellt med sin kurs i allmän lingvistik, ägnade Saussure sig åt en "semiotisk" analys av sen romersk poesi och försökte upptäcka medvetet sammansatta anagram av egennamn. Denna metod var på många sätt motsatsen till rationalism i sin språkliga analys: den var ett försök, som Saussure skriver i en av de 99 anteckningsböckerna, att i systemet studera problemet med "sannolikhet", som "blir grunden för allting. " En sådan undersökning, hävdar Saussure själv, hjälper till att fokusera på den "riktiga sidan" av sannolikhet; ”Nyckelordet” som Saussure letar efter ett anagram för är, enligt Jean Starobinsky, ”ett verktyg för poeten, och inte källan till liv för dikten. Dikten tjänar till att vända nyckelordets ljud. Enligt Starobinsky, i denna analys, "gräver Saussure inte i sökandet efter dolda betydelser." Tvärtom märks i hans verk en önskan att undvika frågor relaterade till medvetandet: ”eftersom poesin inte bara uttrycks i ord, utan också i vad dessa ord ger upphov till, går den bortom medvetandets kontroll och beror endast på språkets lagar.”