Historien om tillämpningen av matematiska metoder i lingvistik. Utsikter för tillämpning av matematiska metoder i lingvistik

Penetration i lingvistik matematiska metoder och "matematisk anda" bidrog till utvecklingen av lingvistik i riktning mot noggrannhet och objektivitet. Dock på väg ytterligare utveckling det finns allvarliga hinder i denna riktning. Författaren reflekterar över orsakerna till konvergensen mellan lingvistik och matematik, över gränserna för tillämpbarheten av matematiska metoder inom lingvistik, och över karaktären hos faktorer som hindrar ömsesidig förståelse mellan matematiker och lingvister.

När några unga lingvister under andra hälften av 1950-talet funderade på att tillämpa matematiska metoder för att studera språkets struktur och började samarbeta med matematiker, orsakade detta förvåning och till och med chock bland väldigt många av deras kollegor - trots allt var de övertygade från barndomen att humanitära vetenskaper, varav en är lingvistik, har inte och kan inte ha något gemensamt med matematik och andra "exakta" vetenskaper.

Samtidigt var förekomsten av ett nära samband mellan naturligt språk och matematik inte alls någon ny upptäckt på den tiden. L. S. Vygotsky skrev i sin bok "Thinking and Speech" publicerad 1934: "Den första som i matematik såg tänkande som härstammar från språket, men övervinner det, var tydligen Descartes" och fortsatte: "Vår vanliga vardaglig på grund av dess inneboende fluktuationer och inkonsekvenser av grammatiska och psykologiska, är den i ett tillstånd av mobil jämvikt mellan idealen om matematisk och fantastisk harmoni och i en oupphörlig rörelse, som vi kallar evolution.

Uppstår i Antikens Grekland läran om grammatiska kategorier var redan en beskrivning av ett antal av de viktigaste aspekterna av språkets struktur med hjälp av abstrakta modeller nära i stilen de modeller som skapades av antika grekiska matematiker för att beskriva rumsliga former; endast förtrogenhet med sådana begrepp som fall, kön etc., som har blivit, som H. Steinthal skrev, "vår andra natur", hindrar oss från att förstå vilken hög nivå av abstrakt tänkande deras skapande krävde. Så du borde bli förvånad hellre än att de första försöken att använda riktiga matematiska medel för att beskriva det språkliga "idealet för matematisk harmoni" gjordes först i mitten av 1900-talet.

Det finns två skäl till denna "fördröjning". För det första språkvetenskapen, efter betydande steg som tagits in forntida era, började verkligen utvecklas igen först på 1800-talet, men under hela detta århundrade riktades lingvisternas huvudsakliga uppmärksamhet mot språkets historia, och först under nästa århundrade, som i allmänhet var strukturalismens tidsålder för humaniora, gjorde lingvistik för första gången efter den antika perioden övergick till studiet av språkstrukturer, men på en ny nivå. När lingvisterna insåg att språket är, med F. de Saussures ord, ett "system av rena relationer", det vill säga ett system av tecken, vars fysiska natur är obetydlig, och endast relationerna mellan dem är signifikanta, parallellen mellan språk och matematiska konstruktioner blev ganska uppenbara , som också är "system av rena relationer", och redan i början av 1900-talet drömde samme de Saussure om att studera språket med matematiska medel.

För det andra kom kvantitativa metoder i förgrunden inom matematiken i början av New Age, och först på 1800-talet började matematiker återigen bygga icke-kvantitativa abstrakta modeller som skilde sig mer från de gamla. hög nivå abstraktioner, och även - vilket är särskilt viktigt för vårt ämne - av det faktum att de skulle kunna användas för att beskriva ett mycket bredare spektrum av fenomen än rumsliga former; ofta visade sig sådana modeller vara bekväma och jämna nödvändiga medel att studera fenomen som matematikerna som byggde dem inte alls tänkte på och inte ens visste om deras existens. Bland dessa modeller fanns de som senare fick tillämpning inom lingvistik; särskilt intensiv utveckling av matematiska discipliner, vars innehåll var deras konstruktion, skedde under första hälften av 1900-talet. Därför var mötet mellan matematik och lingvistik i mitten av detta århundrade ganska naturligt.

Ett av resultaten av detta möte var uppkomsten av en ny matematisk disciplin - matematisk lingvistik, vars ämne är utvecklingen av en matematisk apparat för språkforskning. Den centrala platsen i den matematiska lingvistiken upptas av teorin om formell grammatik, som på grund av arten av den apparat som används i den är relaterad till matematisk logik och i synnerhet till teorin om algoritmer. Den tillhandahåller formella metoder för att beskriva rätt språkenheter. olika nivåer, och även, vilket är särskilt viktigt, formella metoder för att beskriva omvandlingar av språkenheter - både på samma nivå och mellan nivåer. Teorin om syntaktiska strukturer ansluter till teorin om formell grammatik, som är mycket enklare när det gäller apparater, men inte mindre viktig för språkliga tillämpningar. Inom matematisk lingvistik utvecklas också analytiska modeller av språket, där man, på basis av vissa - anses kända - data om "korrekta texter", gör formella konstruktioner, vars resultat är en beskrivning av några " beståndsdelar» språkmekanism. På så sätt kan man få en formell beskrivning av några traditionella grammatiska begrepp. Detta bör också inkludera en beskrivning av meningen med meningen med hjälp av den intensionala logikens apparat ("Montagusemantik").

Med hjälp av den matematiska apparaten kan förstås bara ett av de två språkideal som Vygotskij talade om beskrivas; därför är de ofta hörda invändningarna mot användningen av en eller annan matematisk modell (eller matematiska modeller i allmänhet) på grund av att den inte täcker sådana och sådana speciella fall meningslöst: att beskriva de "fluktuationer och inkonsekvenser" som är inneboende i språket behöver man absolut andra, icke-matematiska medel, och bara en tydlig beskrivning av det "matematiska idealet" skulle kunna hjälpa till att hitta dem, eftersom det skulle göra det möjligt att tydligt avgränsa det "fantastiska" från det "matematiska" i språk. Men detta är fortfarande en fråga för framtiden.

Inte mindre, och kanske viktigare än framväxten av matematisk lingvistik, var den direkta penetreringen i lingvistiken av grundläggande matematiska idéer och begrepp - såsom mängd, funktion, isomorfism. I modern språklig semantik spelar begreppen predikat och kvantifierare, som kom från matematisk logik, en viktig roll. (Den första av dem uppstod i logiken även när den inte skiljdes från lingvistik, och nu har den återgått till lingvistik i en generaliserad och matematiskt bearbetad form.)

Och slutligen, väldigt stor betydelse har en förfining av språkforskningens språk, vilket sker på grund av att den ”matematiska andan” tränger in i lingvistiken, inte bara inom de områden där det är möjligt att använda matematiska idéer och metoder. Allt detta kan kort sammanfattas på följande sätt: lingvistik blir mer och mer korrekt och mer objektiv vetenskap – utan att förstås upphöra att vara en humanioravetenskap.

Dock på detta naturligt sätt Lingvistikens utveckling möter allvarliga hinder som kan bromsa den under lång tid. Den viktigaste är "separationen av fakulteter" som uppstod i början av den nya tiden: naturvetare och matematiker, å ena sidan, och humanitära vetenskapsmän, å andra sidan, är inte intresserade av kollegors arbete "i en annan fakultet ” och dessutom innerst inne, och ofta öppet föraktar dem. . Matematiker och naturvetare (och ännu fler "tekniker") tenderar att se humanistisk forskning som bara en sorts "dekoration" eller till och med "tomt prat", medan "humaniora" är redo att tolerera matematik och naturvetenskap endast för praktisk skull. nytta och är övertygade om att de är ingenting kan hjälpa till att förstå den mänskliga andens natur.

Bara i mitten 1800-talet i detta, med den store biologen och stora tänkaren Konrad Lorenz ord, "den onda muren mellan naturvetenskap och humaniora (die böse Mauer zwischen Natur- und Geistwissenschaften)" gjordes det första brottet på den tunnaste plats som skiljer logik från matematik. Under 1900-talet uppstod andra luckor - bland dem den som stansades från båda sidor av matematiker och språkvetare - men de är fortfarande få, muren är fortfarande stark och det råder ingen brist på ansträngningar från båda sidor för att stärka den ytterligare och lappa ihop hålen. Ofta är dessa ansträngningar ganska framgångsrika; den senaste "prestationen" i denna riktning är "profilutbildning" i gymnasium som redan i barndomen delar in dugliga och intresserade människor i "fakulteter" och lär dem att vara stolta över okunnighet inom "främmande" vetenskaper - kan i hög grad hindra den ytterligare sammansmältning av natur- och humanvetenskaperna, vilket är trängande nödvändigt för den normala utvecklingen av båda. . En av konsekvenserna av att resa muren är att "humaniora", inklusive de allra flesta lingvister, inte vet någonting ens om grunderna i just de delar av matematiken som har högsta värde för humaniora (och föreställ dig en matematiker som en person som uteslutande är upptagen med beräkningar).

Ett annat hinder är den frenetiska rasen som kännetecknar det nuvarande vetenskapens tillstånd, den oavbrutna jakten på fler och fler nya "resultat", som minskar horisonten och lämnar ingen tid att tänka på djupare problem eller engagera sig i en seriös studie av relaterade och, dessutom inte riktigt släkt vetenskaplig disciplin. Detta gäller lika för lingvister och matematiker - som faktiskt alla dem som är professionellt engagerade i naturvetenskap.

Och den tredje är tröghet, eller, enklare, lättja. Vid första anblicken är lättja och ett frenetiskt lopp oförenliga, men i verkligheten kommer de bra överens med varandra och stöttar och stimulerar dessutom varandra. När en person är för lat för att ta sig an en svår uppgift, tar han tag i en enklare och mer "pålitlig" en, framgång som motiverar och uppmuntrar hans tröghet. arrogant attityd mot mindre bröder, som svärmar på andra sidan väggen, uppmuntrar också till lättja och uppmuntras av det. När till exempel en matematiker föreslår att ompröva alla idéer om antik historia, utan att göra sig besväret att åtminstone litet bekanta sig med de urgamla språken, är det samma lat mamma som i mycket stor utsträckning ansvarar för detta.

Faran för vetenskapens utveckling som dessa hinder utgör är mycket allvarligare än den kan tyckas vid första anblicken. När okunskap inom "främmande" vetenskaper blir en fråga om stolthet leder detta naturligtvis till ytlighet och okunskap även hos "våra egna". Det har länge funnits många fler än två "fakulteter", deras antal växer från år till år, och var och en är inhägnad av en mur från de andra; väggar dyker upp även inne på fakulteterna. Forskarnas horisonter minskar gradvis; det är sant att forskningsapparaten blir mer och mer subtil och förfinad, men nästan uteslutande små föremål, och föreställningen att de är de enda värda att studera förstärks. Det finns all anledning att tala om en kris inom vetenskapen, och lingvistik är inget undantag. Nu verkar det som att det är dags att se tillbaka och tänka.

Här samlades lingvister av riktningen, som är förknippad med modellen "Meaning - Text". Denna modell, skapad på 60-talet av förra seklet, var en av de första och bästa resultat möte för lingvistik och matematik, varefter två generationer lingvister har vuxit upp, vana vid precist tänkande från sina studieår. Men de är tyvärr inte fria från tröghet, vilket hindrar dem från att inse existensen av en kris och fundera över sätt att övervinna den. Samtidigt har de bland alla lingvister - och kanske till och med bland alla som är engagerade inom humaniora - de mest objektiva möjligheterna till en sådan förståelse, och jag skulle vilja hoppas att de kommer att utnyttja dessa möjligheter.

Texten till rapporten var vänligt tillhandahållen av A.V. Gladkiy och förlaget

Historien om tillämpningen av matematiska metoder i lingvistik FÖRELÄSNING nr 1

planen

Bildning
strukturell lingvistik
tur XIX- XX århundraden.
Tillämpning av matematiska metoder
i lingvistik under andra hälften av det tjugonde
århundrade.
framtidsutsikter
applikationer
matematiska metoder i
lingvistik.

Ferdinand de Saussure (1857-1913) språk som system

rätt språk
tal - villkorlig frigivning
talaktivitet
- språk

I.A. Baudouin de Courtenay (1845 - 1929)

"Ljud är språkets "atomer".
system som har
begränsat antal
lätt mätbara egenskaper.
Detta är det mest bekväma
material för formella,
strikta metoder
beskrivningar."

Strukturell lingvistik -

det är en uppsättning synpunkter på språk och
metoder för sin forskning, baserad på
vilket ligger förståelsen av språket som
skyltsystem med tydligt urskiljbar
strukturella element (enheter
språk, deras klasser etc.) och önskan om
strikt (närmar sig exakt
vetenskap) formell beskrivning av språket.

Leningradskaya
fonologisk skola
(L.V. Shcherba) används som
huvudkriteriet för generalisering av ljud i
som fonem psykolingvistisk
analysbaserat experiment
inföddas tal.
Prags språkcirkel
(N.S. Trubetskoy) utvecklade teorin
oppositioner - semantisk struktur
språk beskrevs av dem som en uppsättning
oppositionellt konstruerad
semantiska enheter - fam.

Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet

amerikansk
deskriptivism
(L. Bloomfield och E. Sapir). Språk
presenteras för deskriptivister som
samling av talyttringar.
Formell grammatik av N. Chomsky.
Moskva
fonologisk skola,
vars företrädare var A.A.
Reformatsky, V.N. Sidorov, P.S.
Kuznetsov, A.M. Sukhotin, R.I. Avanesov.

maskinöversättningssystem

Algoritm
på varandra följande översättning
ord för ord, fras för fras.
T-system (från engelskt ordöverföra
- transformation), där översättningen
utförs på syntaktisk nivå
strukturer.
I-system (från ordet "interlingua") erhåller en semantisk representation
mata in mening genom sin
semantisk analys och syntes
ingångserbjudande på det mottagna
semantisk presentation.

10. Praktisk lingvistik

studier
inte ett språk i dess tillstånd (dvs.
system), och språket i aktion (d.v.s. i
kommunikation);
löser ett specifikt applikationsproblem,
skapa språkmodeller utan
påstår sig förklara språkets fakta
(som teoretisk lingvistik);
inriktning på specifika underspråk
(dvs. selektiv kunskap om språket), och inte
för hela språket.

11. kvantitativ lingvistik

- tvärvetenskaplig riktning i
tillämpad forskning, som
som det huvudsakliga studieverktyget
språk och tal används
kvantitativa eller statistiska
analysmetoder.

12. beräkningslingvistik

– utveckling av metoder, teknologier och
specifika system som tillhandahåller
kommunikation mellan en person och en dator på en naturlig
eller begränsat naturligt språk.

13. beräkningslingvistik

skapande av system för bearbetning av naturliga
språk (till exempel
text);
utveckling av system för informationssökning
(dokumentär, det vill säga där
texter, och fakta, d.v.s. i vilken
fakta lagras, presenteras inte bara i
textform, såväl som i form av tabeller,
formler, etc.);
skapa hypertextsystem (dvs.
uppsättning texter med länkar till dem
relationer);
utveckling av datorteknik
sammanställning och användning av ordböcker.

14. Tack för din uppmärksamhet!

15. Rapporter:

Lagar
natur och "humanitära" lagar.
Matematisk revolution inom lingvistik.
Copenhagen School of Structural
lingvistik.
Bildandet av tillämpad lingvistik som
vetenskaplig disciplin.

16. Praktisk pass:

Beskrivning av historien om tillämpningen av matematiska
metoder inom lingvistik från antiken till vår
dagar.
Manifestation av integrationstrender
matematiska, språkliga och andra kunskaper inom
historia om språkvetenskapens utveckling.
Jämförande egenskaper hos tillämpade och
teoretisk lingvistik (fyll i tabellen
Jämförande egenskaper hos tillämpade och
teoretisk lingvistik).
Korpuslingvistik som tillämpad sektion
lingvistik.
Tillämpade aspekter av kvantitativ lingvistik.
Beräkningslingvistik och dess verktyg.

Under det senaste århundradet har lingvistik alltid nämnts som ett exempel på en vetenskap som utvecklades snabbt och mycket snabbt nådde metodologisk mognad. Redan i mitten av förra seklet tog ung vetenskap med säkerhet sin plats i den krets av vetenskaper som hade en tusenårig tradition, och en av dess mest framstående representanter - A. Schleicher - hade modet att tro att han med sina verk summerade redan den sista raden.<113>Språkvetenskapens historia har dock visat att en sådan åsikt var för hastig och obefogad. I slutet av seklet genomgick lingvistiken sin första stora chock i samband med kritiken av neogrammatiska principer, följt av andra. Det bör noteras att alla kriser som vi kan avslöja i språkvetenskapens historia som regel inte skakade dess grund, utan tvärtom bidrog till förstärkningen och förde i slutändan med sig en förfining och förbättring av språkforskningens metoder, utvidgning tillsammans med teman och vetenskapliga frågeställningar.

Men vid sidan av lingvistiken levde och utvecklades även andra vetenskaper, inklusive ett stort antal nya. De fysikaliska, kemiska och tekniska (så kallade "exakta") vetenskaperna har fått en särskilt snabb utveckling i vår tid, och deras teoretiska grund, matematiken, har regerat över dem alla. De exakta vetenskaperna har inte bara starkt pressat alla humaniora, utan för närvarande strävar de efter att "föra dem till sin tro", att underordna dem deras seder, att påtvinga dem sina forskningsmetoder. I den nuvarande situationen, med hjälp av ett japanskt uttryck, kan man säga att nu smutsar lingvister-filologer själva kanten av mattan, där de exakta vetenskaperna, med matematiken i spetsen, triumferande och fritt placerade.

Vore det inte mer ändamålsenligt ur allmänna vetenskapliga intressen att kapitulera för matematiken, att helt kapitulera för kraften i dess metoder, till vilka vissa röster öppet kallar 59 , och därigenom kanske få ny kraft? För att svara på dessa frågor måste vi först titta på vad matematiken gör anspråk på det här fallet inom vilket område av lingvistik matematiska metoder finner sin tillämpning, i vilken utsträckning de överensstämmer med särdragen i språkligt material och om de kan ge eller bara föreslå svar på de frågor som språkvetenskapen ställer.

Redan från början bör det noteras att bland entusiasterna av den nya, matematiska trenden inom lingvistik<114>Det råder ingen enighet om dess mål och syften inom statisk forskning. Acad. A. A. Markov, som var den första att tillämpa matematiska metoder på språk, Boldrini, Yul, Mariotti betraktar språkelement som lämpligt illustrativt material för att konstruera kvantitativa metoder, eller för statistiska teorem, utan att alls undra om resultaten av en sådan studie är av intresse till lingvister 6 0 . Ross menar att sannolikhetsteori och matematisk statistik utgör ett verktyg eller, som de nu föredrar att säga, en matematisk modell för att testa och bekräfta de språkliga slutsatser som tillåter numerisk tolkning. Matematiska metoder är alltså endast tänkta som hjälpmedel för språkforskning 6 1 . Mycket mer hävdas av Herdan, som i sin bok inte bara sammanfattade och systematiserade alla försök till matematiska studier av språkproblem, utan också försökte ge dem en tydlig orientering i förhållande till det fortsatta arbetet. Han fokuserar presentationen av hela materialet i sin bok på "förstå litterär statistik (som han kallar studiet av texter med metoder för matematisk statistik. - VID 3.) som en integrerad del av lingvistik” 6 2 , och formulerar kärnan och uppgifterna i detta nya avsnitt i lingvistik med följande ord: ”Litterär statistik som en kvantitativ språkfilosofi är tillämplig på alla grenar av lingvistik. Litterär statistik är enligt vår mening strukturell lingvistik upphöjd till nivån av en kvantitativ vetenskap eller en kvantitativ filosofi. Därför är det lika fel att definiera dess resultat som att de ligger utanför räckvidden<115>lingvistik eller behandla den som ett hjälpmedel för forskning” 6 3 .

Det är knappast tillrådligt att gå in på teoretiseringar om huruvida det är legitimt i detta fall att tala om uppkomsten av en ny gren av lingvistik och lösa frågan om dess påståenden, utan att först hänvisa till övervägandet av vad som faktiskt har gjorts i detta område, och för att klargöra i vilken riktning tillämpningen av nya metoder 6 4 . Detta kommer att hjälpa oss att förstå skillnaderna i åsikter.

Användningen av matematiska (eller, närmare bestämt, statistiska) kriterier för att lösa språkliga problem är på intet sätt ny för språkvetenskapen och har i en eller annan grad använts av lingvister länge. När allt kommer omkring, faktiskt, sådana traditionella begrepp inom lingvistik som fonetisk lag (och relaterade<116>nee med det - ett undantag från lagen), produktiviteten hos grammatiska element (till exempel avledningssuffix), eller till och med kriterierna för relaterade relationer mellan språk, i viss utsträckning, är baserade på relativa statistiska egenskaper. När allt kommer omkring, ju skarpare och mer distinkt den statistiska oppositionen av de observerade fallen är, desto större anledning har vi att tala om produktiva och improduktiva suffix, om den fonetiska lagen och undantag från den, om närvaron eller frånvaron av släktskap mellan språk. Men om den statistiska principen i sådana fall användes mer eller mindre spontant, så började den i framtiden tillämpas medvetet och redan med en viss målsättning. Så i vår tid har de så kallade frekvensordböckerna för ordförråd och uttryck för enskilda språk 6 5 eller till och med betydelsen av flerspråkiga ord med ett "allmänt fokus på verkligheten" 6 6 blivit utbredda. Data från dessa ordböcker används för att sammanställa läroböcker på främmande språk (vars texter bygger på det vanligaste ordförrådet) och minimiordböcker. Statistisk kalkyl hittade en speciell språklig användning i metoden för lexikostatistik eller glottokronologi av M. Swadesh, där det, på grundval av statistiska formler som tar hänsyn till fall av försvinnande av ord från huvudfondens språk, är möjligt att fastställa den absoluta kronologin för indelningen av språkfamiljer 6 7 .

I senaste åren fall av att tillämpa matematiska metoder på språkligt material har multiplicerats avsevärt, och i mängden av sådana försök har mer eller mindre bestämda riktningar skisserats. Låt oss vända<117>till deras sekventiella övervägande, utan att gå in på detaljer.

Låt oss börja med riktningen som har fått namnet stylostatistics. I det här fallet talar vi om definitionen och karakteriseringen av de stilistiska dragen hos enskilda verk eller författare genom de kvantitativa relationerna mellan de språkliga elementen som används. Det statistiska förhållningssättet till studiet av stilfenomen bygger på förståelsen av litterär stil som ett individuellt sätt att bemästra språkets medel. Samtidigt är forskaren helt distraherad från frågan om den kvalitativa betydelsen av de räkningsbara språkliga elementen, och fokuserar all sin uppmärksamhet endast på den kvantitativa sidan; den semantiska sidan av de studerade språkenheterna, deras känslomässiga och uttrycksfulla belastning, såväl som deras andel i ett konstverks väv - allt detta förblir utanför, hänvisar till de så kallade redundanta fenomenen. Sålunda framträder ett konstverk i form av ett mekaniskt aggregat, vars särart kommer till uttryck endast genom de numeriska förhållandena mellan dess element. Representanter för stilostatistik blundar inte för alla de noterade omständigheterna, och motsätter sig metoderna för traditionell stilistik, som utan tvekan inkluderar element av subjektivitet, med en enda kvalitet hos den matematiska metoden, som, enligt deras åsikt, kompenserar för alla dess brister - objektiviteten i de uppnådda resultaten. ”Vi strävar”, skriver till exempel V. Fuchs, ”... att karakterisera stilen för språkliga uttryck med matematiska medel. För detta ändamål bör metoder skapas, vars resultat bör ha samma objektivitet som resultaten av de exakta vetenskaperna ... Detta tyder på att vi, åtminstone initialt, endast kommer att behandla formella strukturella kvaliteter, och inte med de semantiska innehållet i språkliga uttryck . På så sätt kommer vi att få ett system av ordinalrelationer, som i sin helhet kommer att utgöra grunden och utgångspunkten för den matematiska stilteorin” 6 8 .<118>

Den enklaste typen av statistiskt tillvägagångssätt för studiet av författares eller enskilda verks språk är att räkna de använda orden, eftersom ordbokens rikedom tydligen borde känneteckna författaren själv på ett visst sätt. Resultaten av sådana beräkningar ger dock i detta avseende något oväntade resultat och bidrar inte på något sätt till estetisk kunskap och värdering av ett litterärt verk, vilket inte minst är en av stilistikens uppgifter. Här är några uppgifter om det totala antalet ord som används i ett antal verk:

Bibeln (latin). . . . . . . . . . 5649 ord

Bibeln (hebreiska). . . . 5642 ord

Demosthenes (tal). . . . . . . . . . . . 4972 ord

Sallust. . . . . . . . . . . . . . . . . 3394 ord

Horace. . . . . . . . . . . . . . . . . . . .6084 ord

Dante (gudomlig komedi) 5860 ord

(detta inkluderar 1615 egennamn och geografiska namn)

Tasso (Furious Orland). . . . 8474 ord

Milton. . . . . . . . . . . . . . . . . . . . .8000 ord (ungefär angivet)

Shakespeare. . . . . . . . . . . . . . . . . . .15 000 ord

(ungefär, enligt andra källor 20 000 ord)

O. Jespersen påpekar att ordboken för Zola, Kipling och Jack London avsevärt överstiger Miltons ordbok, d.v.s. antalet är 8000 6 9 . Beräkningen av ordboken över tal från USA:s president W. Wilson fann att den är rikare än Shakespeares. Till detta bör läggas uppgifter från psykologer. Således fann Terman, baserat på observationer av ett stort antal fall, att ordförrådet för ett genomsnittligt barn är cirka 3600 ord, och vid 14 års ålder - redan 9000. Den genomsnittliga vuxen använder 11700 ord, och en person av "ökade intelligens" upp till 13500 7 0 . Sådana numeriska data i sig ger alltså inga skäl för att identifiera verkens stilistiska kvaliteter och endast "objektivt"<119>de anger användningen av olika antal ord av olika författare, vilket, som ovanstående beräkningar visar, inte är relaterat till det relativa konstnärliga värdet av deras verk.

Beräkningar av den relativa frekvensen av användningen av ord av enskilda författare är uppbyggda något annorlunda. I det här fallet tas inte bara hänsyn till den totala mängden ord, utan också hur ofta enskilda ord används. Statistisk bearbetning av det material som erhålls på detta sätt består i att ord med lika frekvens av användning grupperas i klasser (eller rangordningar), vilket leder till upprättandet av frekvensfördelningen av alla ord som används av en given författare. Ett specialfall av denna typ av beräkning är bestämningen av den relativa frekvensen av speciella ord (till exempel romansk vokabulär i Chaucers verk, som gjordes av Mersand 7 1). Den relativa frekvensen av de ord som används av författarna innehåller samma objektiva information om stilen hos enskilda författare som ovanstående totalberäkningar, med den enda skillnaden att resultatet är mer exakta numeriska data. Men det används också för att datera enskilda verk av samma författare på grundval av en preliminär beräkning av den relativa frekvensen av hans användning av ord under olika perioder av hans liv (enligt verk som daterats av författaren själv). En annan typ av användning av data från sådana beräkningar är att fastställa äktheten av författarskapet till verk för vilka denna fråga verkar tveksam 7 2 . I det sista fallet är allt baserat på en jämförelse av statistiska formler för användningsfrekvensen i äkta och kontroversiella verk. Det finns ingen anledning att tala om den mycket stora relativiteten och approximationen av de resultat som erhålls med sådana metoder. När allt kommer omkring ändras den relativa användningsfrekvensen inte bara med författarens ålder, utan också beroende på genren, handlingen och även den historiska miljön för verkets handling (jämför till exempel "Bröd" och "Peter" I" av A. Tolstoy).<120>

Genom att fördjupa metoden som beskrivits ovan började stylostatistik som stilkarakteristik att tillgripa kriteriet stabilitet för den relativa frekvensen av de mest använda orden. Metoden som används i detta fall kan illustreras av den statistiska bearbetningen av Pushkins berättelse "The Captain's Daughter" av Esselson och Epstein vid Institute of Slavic Languages ​​vid University of Detroit (USA) 7 3 . Hela texten i berättelsen (cirka 30 000 förekomster av ord) underkastades undersökningen, och sedan passager innehållande cirka 10 000 och 5 000 förekomster. Vidare, för att bestämma stabiliteten hos den relativa frekvensen av användningen av ord, jämfördes de 102 vanligaste orden (med en frekvens på 1160 gånger till 35) med den beräknade relativa frekvensen (gjord på basis av selektiva passager) med den faktiska. Till exempel användes facket "och" 1 160 gånger genom hela historien. I en passage som innehåller 5 000 förekomster av alla ord bör denna konjunktion förväntas användas 5 000 x 1 160:30 000, eller avrundas uppåt 193 gånger, och i en passage som innehåller 10 000 förekomster av alla ord förväntas den användas 1,100 x 10,060 : 30 000 eller 386 gånger. Jämförelse av data som erhållits med denna typ av beräkningar med faktiska data visar en mycket liten avvikelse (inom 5%). Baserat på sådana beräkningar fann man att i denna berättelse av Pushkin används prepositionen "k" dubbelt så ofta som "y", och pronomenet "du" används tre gånger oftare än "dem", etc. Således , trots alla växlingar i handlingen, både genom hela berättelsen och i dess enskilda delar, finns det en stabilitet i den relativa frekvensen av användningen av ord. Det som observeras i förhållande till några (vanligaste) ord är förmodligen tillämpligt på alla ord som används i verket. Härav följer att författarens stil kan karakteriseras av ett visst förhållande mellan variationen av den genomsnittliga frekvensen av att använda ett ord och den allmänna frekvensen för ett givet språk.<121>frekvensen av dess användning. Detta förhållande anses vara en objektiv kvantitativ egenskap hos författarens stil.

Andra formella delar av språkstrukturen studeras på liknande sätt. Så till exempel underkastade V. Fuchs de metriska särdragen i verken av Goethe, Rilke, Caesar, Sallust etc. för en jämförande-statistisk övervägande.

Kriteriet om stabiliteten för den relativa frekvensen av användningen av ord, samtidigt som det förtydligar tekniken för kvantitativ karaktärisering av stil, introducerar inte något fundamentalt nytt i jämförelse med de mer primitiva metoderna som analyserats ovan. Alla metoder för stylostatistik ger i slutändan lika passionerade "objektiva" resultat, glider över tungans yta och klamrar sig bara fast vid rent yttre tecken. Kvantitativa metoder kan tydligen inte fokusera på de kvalitativa skillnaderna i materialet som studeras och i själva verket utjämna alla objekt som studeras.

Där maximal specifikation behövs, erbjuds de mest generaliserade kriterierna; kvalitativa egenskaper uttrycks i kvantitetsspråket. Detta är inte bara en logisk motsägelse, utan också en oenighet med sakens natur. Ja, vad händer om vi försöker få en jämförande stilistisk (dvs. därför kvalitativ) egenskap hos Alexander Gerasimovs och Rembrandts verk baserat på det kvantitativa förhållandet mellan röd och svart färg på deras dukar? Det verkar vara ett absolut nonsens. I vilken utsträckning är helt "objektiv" kvantitativ information om en persons fysiska data kapabel att ge oss en uppfattning om allt som kännetecknar en person och gör honom sann essens? Uppenbarligen ingen. De kan endast tjäna som ett individuellt tecken som skiljer en person från en annan, som ett avtryck av veck på tummen. Situationen liknar den litterära stilens kvantitativa egenskaper. Om man tittar noga ger de lika magra data för att bedöma den faktiska stilistiken<122>kvaliteter hos författarens språk, samt en beskrivning av vikningarna på fingret för studiet av mänsklig psykologi.

Till allt som sagts ska tilläggas att man redan tidigare, i den så kallade formella skolan för litteraturkritik, försökte kvantitativt studera författarstilen, då epitet, metaforer och rytmisk-melodiska inslag. av vers räknades. Detta försök utvecklades dock inte vidare.

Ett annat tillämpningsområde för matematiska metoder för studiet av språkliga fenomen kan grupperas under namnet språklig statistik. Den försöker tränga in i språkteorins grundläggande frågor och på så sätt få en kallelse inom den egentliga språkliga sfären. För att bekanta sig med denna riktning är det bäst att vända sig till det redan nämnda verk av Herdan, med en av dess många recensenters ord, "en monstruöst pretentiös bok" 7 5 , fick dock ett brett gensvar bland lingvister 7 6 . Med tanke på det faktum att Kherdan (som redan nämnts ovan) försökte samla i sin bok allt som är viktigast inom området för tillämpning av matematiska metoder på språkliga problem, i hans bok har vi faktiskt inte så mycket att göra med Kherdan som med en helhet trend. Som själva titeln på boken, "Språk som val och sannolikhet", visar, ligger dess huvudsakliga fokus på att klargöra vad i språket som lämnas åt talarens fria val och vad som beror på språkets immanenta struktur, precis som på att bestämma det kvantitativa förhållandet mellan elementen i första och andra ordningen. Kherdans bok ger nästan uttömmande information om allt arbete på detta område som utförs av representanter för olika specialiteter.<123>(filosofer, lingvister, matematiker, tekniker), men är inte begränsad till detta och inkluderar många ursprungliga observationer, överväganden och slutsatser av författaren själv. Som ett sammanfattande arbete ger det en god uppfattning om de kvantitativa metoder som används och om de resultat som uppnåtts med deras hjälp. Frågorna som vi villkorligt kombinerar till avsnittet språkstatistik behandlas i bokens andra och fjärde del.

Av de många fallen att tillämpa metoderna för matematisk statistik för studier av språkliga frågor, kommer vi att fokusera på de mest allmänna, som samtidigt kan betraktas som de mest typiska. Använda data från andra författare - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 och andra, samt citerar sina egna studier som bestämmer den relativa frekvensen av fördelningen av fonem, bokstäver, ordlängd (mätt med antalet bokstäver och stavelser) , grammatiska former och metriska element i latin och grekisk hexameter, fastslår Herdan faktumet av stabiliteten hos den relativa frekvensen av språkliga element som en gemensam egenskap för alla språkliga strukturer. Han härleder följande regel: "Proportionerna av språkliga element som tillhör en eller annan nivå eller sfär av språklig kodning - fonologi, grammatik, metrik - förblir mer eller mindre konstant för ett givet språk, under en given period av dess utveckling och inom gränser för tillräckligt omfattande och opartiskt genomförda observationer.» 8 2 . Denna regel, som Herdan kallar språkets grundläggande lag, försöker han tolka och utvidga på ett visst sätt. ”Han”, skriver Herdan om denna lag, ”är ett uttryck för att även här, där människans vilja och valfrihet ges<124>det bredaste ramverket, där medvetna val och bekymmerslös lek levande växlar med varandra, i allmänhet finns det en betydande stabilitet... i grammatiken, men också i förhållande till användningsfrekvensen av specifika fonem, lexikaliska enheter (ord) och grammatiska fonem och konstruktioner; likheten ligger med andra ord inte bara i vad som används, utan också i hur ofta det används” 8 3 . Denna situation beror på förståeliga skäl, men detta ger upphov till nya slutsatser. När man till exempel undersöker olika texter eller segment av ett givet språk, finner man att de relativa frekvenserna för användning av ett givet speciellt fonem (eller andra talelement) av olika personer förblir i princip desamma. Detta leder till tolkningen av individuella former av tal som vissa fluktuationer i den konstanta sannolikheten att använda det övervägda fonem i ett givet språk. Sålunda visar det sig att en person i sin talaktivitet är föremål för vissa sannolikhetslagar i förhållande till antalet använda språkliga element. Och sedan, när vi observerar ett stort antal språkliga element i en stor uppsättning texter eller talsegment, får vi intrycket av kausalt beroende i den meningen att det i det här fallet också finns en bestämdhet i förhållande till användningen av vissa språkliga element. Det visar sig med andra ord vara tillåtet att hävda att det som ur intuitiv synvinkel tycks vara ett orsakssamband är kvantitativt en sannolikhet 8 4 . Det är tydligt att ju större totalsumman<125>specificiteten hos de undersökta texterna eller talsegmenten, desto tydligare kommer stabiliteten hos den relativa frekvensen av användningen av språkliga element att manifesteras även i individuell användning (lagen om stora siffror). Härifrån görs en ny allmän slutsats att språk är ett massfenomen och bör behandlas som ett sådant.

Dessa slutsatser, som dragits på grundval av frekvensberäkningar av fonetiska element, ord och grammatiska former, som tillsammans utgör ett språk, tillämpas sedan på den "statistiska tolkningen" av Saussures uppdelning i "språk" (lalangue) och "tal" (laparole). ). Enligt Saussure är "språk" en uppsättning språkliga vanor som möjliggör kommunikation mellan medlemmar i en viss språklig gemenskap. Detta är en social verklighet, ett "massfenomen", obligatoriskt för alla människor som talar detta språk. Herdan, som antytts, bevisar att medlemmarna i en enda språkgemenskap liknar varandra inte bara genom att de använder samma fonem, lexikaliska enheter och grammatiska former, utan också genom att alla dessa element används med samma frekvens. Sålunda har hans statistiska definition av "språk" följande form: "språk" (lalangue) är helheten av vanliga språkliga element plus deras relativa sannolikhet att användas.

Denna definition av "språk" är också utgångspunkten för motsvarande statistiska tolkning av "tal", som enligt Saussure är ett individuellt yttrande. Genom att kontrastera "språk" som ett socialt fenomen av "tal" som ett individuellt fenomen, skrev Saussure: "Tal är en individuell handling av vilja och förståelse, där det är nödvändigt att särskilja: 1. kombinationer med vilka det talande subjektet använder språket kod för att uttrycka sin personliga tanke; 2. en psykofysisk mekanism som tillåter honom att objektivera dessa kombinationer” 8 5 . Eftersom "språk" i språkstatistik betraktas som en uppsättning element med en viss relativ<126>viss sannolikhet för deras användning, i den mån den inkluderar den statistiska helheten eller ensemblen (populationen) som den viktigaste egenskapen och kan beaktas i denna aspekt. I enlighet med detta förvandlas "tal" till ett separat urval taget från "språk" som ett statistiskt aggregat. Sannolikheten i detta fall bestäms av förhållandet mellan "tal" och "språk" (i deras "kvantitativa" förståelse), och fördelningen av den relativa frekvensen av användningen av olika delar av språket tolkas som ett resultat av en kollektivt "val" (val) i en viss kronologisk period av språkets existens. Efter att ha insett att en sådan tolkning av skillnaderna mellan "språk" och "tal" ändå bygger på helt andra grunder än Saussures, skriver Herdan i detta avseende: "Denna till synes mindre modifiering av Saussures koncept har den viktiga konsekvensen att "språk" ( lalangue ) får nu en väsentlig egenskap i form av ett statistiskt aggregat (population). Denna population kännetecknas av vissa relativa frekvenser eller fluktuationssannolikheter, vilket innebär att varje språkligt element tillhör en viss språklig nivå. I det här fallet visar sig "tal" (laparole), i enlighet med dess betydelse, vara en term för att definiera statistiska urval tagna från "språk" som en statistisk population. Det blir uppenbart att valet (valet) här uppträder i form av förhållandet mellan "tal" och "språk", vilket är förhållandet mellan ett slumpmässigt urval och ett statistiskt aggregat (population). Själva ordningen för frekvensfördelning, som en insättning av talaktiviteten i en språklig gemenskap under århundradena, är ett element av val (val), men inte av individuellt val, som i stil, utan av kollektiva val. Med hjälp av en metafor kan vi här prata om det val som gjorts av språkets ande, om vi med detta förstår principerna för språklig kommunikation, som är i överensstämmelse med komplexet av mentala data hos medlemmarna i en viss språklig gemenskap. Stabiliteten av serier är resultatet av sannolikhet (chans)» 8 6 .

Ett specialfall av tillämpningen av den angivna principen<127>pa är avgränsningen i språket av normativa fenomen från "undantag" (avvikelser). Inom språkstatistiken hävdas att den statistiska metoden låter dig eliminera det befintliga denna fråga luddighet och fastställa tydliga kriterier för att skilja mellan dessa fenomen. Om normen förstås som en statistisk population (i ovanstående mening), och undantaget (eller felet) är en avvikelse från de frekvenser som visas av den statistiska populationen, så föreslår en kvantitativ lösning av frågan sig själv. Det hela kokar ner till ett statistiskt samband mellan "population" och "outlier". Om de observerade frekvenserna i ett enskilt urval avviker från sannolikheterna på grund av den statistiska populationen med mer än vad som bestäms av en serie urvalsräkningar, så har vi anledning att dra slutsatsen att gränslinjen mellan "samma" (norm) och "ej samma" (undantag) överträds.

Kvantitativa skillnader mellan "språk" och "tal" används också för att skilja två typer av språkliga element: grammatiska och lexikala. Utgångspunkten för att lösa detta problem, som ofta ger stora svårigheter ur språklig synpunkt, är antagandet att frekvensgraden av grammatiska element är annorlunda än lexikaliska enheters. Detta påstås associeras med "generalisering" av grammatiska element, hur de skiljer sig från begrepp fixerade av lexikaliska enheter. Dessutom antas grammatiska element som regel vara mycket mindre i volym: som oberoende ord (de inkluderar pronomen, prepositioner, konjunktioner och officiella ord) de består vanligtvis av ett litet antal fonem, och i form av "besläktade former" - av ett eller två fonem 8 7 . Ju mindre det språkliga elementet är, desto mindre kan dess "längd" (kvantitativa moment) tjäna som en definierande egenskap, och desto viktigare får fonemens "kvalitet" för detta ändamål. Vilka metoder föreslås för att lösa det aktuella problemet? Det löses genom att hänvisa till det rent kvantitativa begreppet grammatisk<128>load, "Anta", skriver Herdan i detta sammanhang, "att vi är intresserade av att jämföra två språk i detta avseende. Hur bestämmer vi med en viss grad av objektivitet den "grammatiska belastning" som ett språk bär? Det är tydligt att denna belastning kommer att bero på positionen för gränslinjen som skiljer grammatik från ordförråd. Den första övervägande som kan komma till oss är att avgöra hur "komplex" grammatiken för ett givet språk är. När allt kommer omkring är "komplexitet" en kvalitativ egenskap, och begreppet "grammatisk belastning" är en kvantitativ egenskap. Visserligen beror belastningen till viss del på komplexiteten, men inte helt. Ett språk kan belönas med en extremt komplex grammatik, men endast en jämförelsevis liten del av den används i språkets verksamhet. Vi definierar "grammatisk belastning" som helheten av grammatik som ett språk bär när det är i aktion, vilket omedelbart för vårt problem in i strukturell lingvistiks område i den mening som disciplinen definierades av Saussure. I den följande presentationen används kvantitativa metoder för att bestämma skillnaden mellan språk, beroende på var gränsen går, för att skilja grammatik från ordförråd” 8 8 . Med andra ord bör språkskillnader i detta fall reduceras till skillnader i numeriska relationer mellan grammatiska och lexikala element.

Materialen som står till vårt förfogande målar upp följande bild. I engelska språket(endast "grammatiska ord" togs i beaktande: pronomen, eller, som de också kallas, "ersättningar", prepositioner, konjunktioner och hjälpverb) i ett segment som inkluderar 78 633 fall av användning av alla ord (1027 olika ord), 53 102 fall av användning av grammatiska element, eller mer exakt, "grammatiska ord" (149 olika ord), hittades, vilket är 67,53 % vid 15,8 % olika ord. Sådan är data från Deway 8 9 . Övriga uppgifter visar en annan procentandel<129>förhållande: 57,1% med 5,4% olika ord 9 0 . Denna betydande diskrepans förklaras av skillnaden mellan skriftspråk och talat språk. Skriftliga formulär språk (första data) antas använda fler grammatiska element än muntliga (andra fallet). I Dantes gudomliga komedi (efter det italienska originalet) fastställde Mariotti 54,4 % av förekomsterna av "grammatiska ord".

Ett annat och, tydligen, ett mer perfekt sätt att bestämma den grammatiska belastningen av ett språk är att räkna de fonem som ingår i de grammatiska elementen. I det här fallet beaktas inte bara oberoende grammatiska ord, utan också relaterade former. Här är möjliga olika alternativ. Till exempel att bestämma den relativa frekvensen av användningen av individuella konsonantfonem i grammatiska element och jämföra dem med frekvensen för den totala användningen av dessa samma fonem (slutdata för ett sådant förhållande på engelska ger en andel på 99,9% till 100 000 - total användning); eller en liknande jämförelse av konsonanter enligt separata klassificeringsgrupper (labial, palatal, velar och andra fonem). Det slutliga förhållandet här tar formen av en andel på 56,47 % (i grammatiska element) till 60,25 % (i total användning); eller samma jämförelse av de initiala konsonantfonemen (i detta fall var förhållandet 100,2 % i grammatiska ord till 99,95 i total användning). Andra mer komplexa statistiska operationer är också möjliga, som dock resulterar i liknande kvantitativa uttryck för det problem som studeras.

De givna kvantitativa uppgifterna ligger till grund för en allmän slutsats. Det handlar om att fördelningen av fonem i grammatiska element bestämmer arten av fördelningen (i numeriska termer förstås) av fonem i språket som helhet. Och detta gör i sin tur att vi kan dra slutsatsen att användningen av grammatiska element i minsta utsträckning beror på individuella val och utgör den del av det språkliga uttrycket som styrs av sannolikheter.<130>ness. Denna spekulativa slutsats bekräftas av beräkningen av grammatiska former på ryska språket, gjord av Esselson 9 1 . Studien utsattes för 46896 ord hämtade från II-källor (verk av Griboedov, Dostojevskij, Goncharov, Saltykov-Sjchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgskij, Ehrenburg, Simonov och N. Ostrovsky). De delades in i vardagliga ord (17 756 ord eller 37,9%) och icke-vardagliga ord (29140 ord eller 62,1%). Sedan delades hela orduppsättningen in i 4 grupper beroende på deras grammatiska natur: den 1:a gruppen inkluderade substantiv, adjektiv, adjektiv i substantivs funktion, pronomen och böjda siffror; i den andra gruppen - verb; i den 3:e gruppen - verbala particip, particip i funktionen av adjektiv och substantiv och gerunder; i den fjärde gruppen - oföränderliga former av adverb, prepositioner, konjunktioner och partiklar. Sammanfattningsresultaten (även tabeller med data för enskilda författare ges) ger följande förhållande:

1:a gruppen

2:a gruppen

3:e gruppen

4:e gruppen

vardaglig

tystlåten

Herdan karaktäriserar övervägandet av de kvantitativa data som sålunda erhållits med följande ord: ”De motiverar slutsatsen att grammatiska element bör betraktas som en faktor som bestämmer sannolikheten för ett språkligt uttryck. En sådan slutsats undviker den betungande kvalificeringen av varje ord som används. Det är tydligt att, eftersom grammatik och ordförråd inte lagras i vattentäta skal, är det inte heller rent "val" eller en ren "slump". Både grammatik och ordförråd innehåller båda beståndsdelarna, fastän i väsentligt varierande proportioner” 9 2 .<131>

En stor del av Herdans bok ägnas åt studiet av dualitet eller dualitet i språket, och själva begreppet dualitet bygger på matematiska egenskaper.

Således kan satser i projektiv geometri ordnas i två serier, så att varje sats i en serie kan erhållas från någon sats i en annan serie genom att ersätta orden punkt Och hetero. Till exempel, om ett påstående ges: "alla olika punkter tillhör en och endast en linje," så kan vi härleda motsvarande påstående från det: "vilka som helst två olika linjer tillhör en och endast en punkt." En annan metod för att bestämma dualitet är att plotta längs abskissan och y-axeln olika planer fenomen som studeras. Så, som till exempel Yul 9 3, räknas olika användningsfrekvenser längs abskissan, och antalet lexikaliska enheter vars frekvens bestäms etc. räknas längs ordinatan.Det är så begreppet dualitet är tolkas, förmodligen lika tillämplig på språkforskning.

Under begreppet dualitet definierat på detta sätt, som i alla fall faktiskt har karaktären av en binär kod och som också anses vara den mest väsentliga egenskapen hos den språkliga strukturen, förs fenomen med ytterst olika kvaliteter in, vilket tillåter motsättning längs två plan : fördelningen av användningen av ord efter arten av lexikaliska enheter och fördelningen av lexikaliska enheter efter frekvens.användningen av ord; skriftliga och talade former av tal; lexikaliska och grammatiska element; synonymer och antonymer; fonem och dess grafiska representation; definierbar och definierande (Saussures signifiant och signifiy), etc.

Efter en kvantitativ studie av dualiteten hos ett eller annat särskilt, språkligt fenomen eller begränsad "text" dras som regel en slutsats, till vilken den språkliga universalitetens kvaliteter tillskrivs. Typen av sådana slutsatser och hur de motiveras kan ses i exemplet<132>studier av ordets och begreppets dualitet (i själva verket talar vi om förhållandet mellan ordets längd och begreppets volym - man måste komma ihåg att den extremt fria användningen av språkliga och andra termer i sådana verk gör ofta förståelsen mycket svår). Det är viktigt att notera att som det material som fungerade som källa för observationer av denna typ av språklig dualitet, användes följande: den internationella nomenklaturen för sjukdomar (ca 1000 namn) och det allmänna registret över sjukdomar i England och Wells för 1949 I detta fall dras följande allmänna slutsats: "Varje begrepp som betecknar en allmän idé har vad som kan kallas en "sfär" eller "volym." Den tillåter genom sitt medium att tänka på många föremål eller andra koncept som finns inom dess "sfär". Å andra sidan utgör alla artiklar som behövs för att definiera ett begrepp vad som kallas dess "innehåll". Volym och innehåll är ömsesidigt korrelerade - ju mindre innehållet är och följaktligen ju mer abstrakt begreppet är, desto större är dess omfattning eller volym, det vill säga desto fler föremål förs in under det. Detta kan ses som en analogi (i den konceptuella sfären) till principerna för kodning, enligt vilka längden på en symbol och användningsfrekvensen är beroende av varandra” 9 4 .

Dualitetsprincipen gäller även för särskilda problem. Till exempel när man fastställer likvärdigheten mellan två ords betydelser olika språk. Som ett resultat av att studera den engelsk-tyska ordboken av Muret-Zanders med den matematiska iterationsmetoden, dras slutsatsen att sannolikheten för att använda ett engelskt ord med en eller flera betydelser i tysk översättning förblir konstant för varje initialbokstav i hela ordboken 9 5 . Övervägande av ordföljden i kinesiska ordböcker leder till slutsatsen att den är av taxonomisk karaktär, eftersom antalet streck i tecknet anger dess plats (som en oberoende radikal eller en viss underklass underordnad radikalen). Taxonomi är en underordnad klassificeringsprincip som används inom zoologi och botanik. Kherdan hävdar det<133>den kinesiska lexikografins grunder bygger också på principerna för taxonomi 9 6, etc.

För att göra en allmän bedömning av detta område för tillämpning av matematiska metoder för studier av språkliga problem (dvs språkstatistik), är det tydligen nödvändigt att utgå från den position som formulerades av Ettinger: "Matematik kan användas effektivt i lingvistikens tjänst endast när lingvisterna är klara över de verkliga gränserna för dess tillämpning, liksom möjligheterna med de matematiska modeller som används” 9 7 . Vi kan med andra ord tala om matematisk lingvistik när matematiska metoder bevisar sin lämplighet för att lösa de egentliga språkliga problemen, som i sin helhet utgör språkvetenskapen. Om så inte är fallet, även om detta kan öppna upp nya aspekter av vetenskaplig forskning, så kan man i det här fallet prata om vad som helst, men inte om lingvistik - i det här fallet menar vi inte olika typer tillämpad lingvistik (det kommer att diskuteras nedan), och vetenskaplig eller teoretisk lingvistik. Utifrån denna ståndpunkt bör det noteras att ur en språkforskares synvinkel är mycket inom språkstatistiken tveksamt och till och med förbryllande.

Låt oss vända oss till analysen av endast två exempel (för att inte röra upp presentationen), och ange att mycket betydande invändningar kan göras mot vart och ett av dem. Här har vi en kvantitativ distinktion mellan grammatiska och lexikala enheter. Det visar sig att för att göra en sådan distinktion är det nödvändigt att redan i förväg veta vad som hör till grammatikområdet och vad som ska ordförrådas, eftersom språkets "grammatiska belastning" (dvs. helheten av grammatiska element). används i tal), som anges i citat ovan, "beror på gränsdragningslinjen som skiljer ordförråd från grammatik." Utan att veta var denna gräns går är det därför omöjligt att dra den angivna distinktionen. Vad är då meningen med den kvantitativa metoden att skilja det lexikala från grammatiken?<134>matic? Men när det gäller Herdan så tänker han inte särskilt på denna fråga och klassificerar djärvt språkliga element, med hänvisning till de grammatiska elementen "sammanhängande former", som av framställningen att döma bör förstås som yttre böjning, och "grammatiska ord". som omfattar prepositioner , konjunktioner, hjälpverb och pronomen - det senare i kraft av att de är "ersättare". Men om vi bara talar om denna kvalitet av pronomen och på grundval av dem relaterar dem till grammatiska element, så bör sådana ord som "ovannämnda", "namngivna", "givna" etc. också tillskrivas dem, så hur de också agerar som suppleanter. I samband med metoden att separera grammatiska element som används i språkstatistiken uppstår naturligtvis frågan om hur man i detta fall ska hantera sådana "icke-formella" grammatiska fenomen som ordföljd, toner, nollmorfem, paradigmatiska relationer (några av dessa fenomen). , förresten, hitta reflektion i de språk som studeras med matematiska metoder)? Hur man gör en skillnad i språk med rik intern böjning (som till exempel i de semitiska språken), där den inte bara grammatiskt modifierar roten (radikal), utan också ger den lexikal existens, eftersom roten utan permutationer har ingen riktig existens i språket? Vad ska förstås med ett språks grammatiska komplexitet, efter vilket kriterium bestäms det? Om den kvantitativa punkten, som i det här fallet betonas på alla möjliga sätt, så kommer ett av de grammatiskt svåraste språken att vara engelska, som har sådana konstruktioner som Ishallhavebeencalling eller Hewouldhavebeencalling. I dessa meningar kan endast call klassificeras som lexikal, och allt annat måste därför betraktas som grammatiskt. Vilka skäl finns för att koppla frekvensen av användning av grammatiska element med det allmänna eller abstrakta i betydelsen av grammatiska ord? När allt kommer omkring är det ganska uppenbart att den relativt stora användningsfrekvensen av grammatiska element bestäms av deras funktion i konstruktionen av meningar, och när det gäller betydelsernas abstrakthet är det mycket lätt att hitta en stor<135>antalet lexikaliska element som lätt kan konkurrera med grammatiska element i detta avseende, och är i hög grad sämre än dem i frekvens (till exempel, vara, existens, förlängning, utrymme, substans etc).

En liknande typ av absurditet uppstår framför oss när det gäller definitionen av dualitet (dualitet) av ordet och begreppet. Det är nödvändigt att ha en extremt märklig förståelse för språkets strukturella väsen för att utsätta det för forskning med användning av sjukdomsnomenklaturen och sjukhusregistret över sjukdomar, som, som antytts ovan, fungerade som källmaterial för mycket viktiga språkliga Slutsatser. Utan att uppehålla sig vid den helt oklara användningen av sådana termer som inte har en språklig existens, såsom ett begrepps sfär, volym och innehåll (för övrigt är ordets lexikaliska betydelse och begreppet betecknat med den vetenskapliga termen grovt förvirrad), låt oss gå till slutsatsen som görs i det här fallet. Som nämnts ovan har vi att göra med påståendet att "omfattning och innehåll är ömsesidigt korrelerade." Hela resonemangsförloppet som ger skäl för en sådan slutsats, liksom metoden för matematisk operation av språkliga fakta, visar tydligt att i detta fall en mycket väsentlig egenskap hos språket helt ignoreras, vilket stör alla beräkningar som görs : förmågan att uttrycka samma sak "innehåll" genom språkliga enheter av olika "volym", som utan tvekan dessutom har olika relativa användningsfrekvenser. Så vi kan utse samma person som Petrov, min bekant, han, en moskovit, en ung man, en universitetsanställd, min frus bror, en man som vi träffade på bron, etc. Mot bakgrund av sådana fakta finns det är utan tvivel endast privata slutsatser, till vilka emellertid, som framhållits, allmän betydelse tillmäts, men också ändamålsenligheten att tillämpa själva de kvantitativa metoderna på sådana språkliga problem.

Men ibland erbjuds lingvister slutsatser, vars giltighet inte är ifrågasatt. Detta är "språkets grundläggande lag", som består i det faktum att det i språket finns en viss stabilitet hos dess element och den relativa frekvensen av deras omnämnande.<136>konsumtion. Problemet med denna typ av upptäckter är dock att de länge har varit kända för lingvister. När allt kommer omkring är det ganska uppenbart att om språket inte hade en viss stabilitet och varje medlem i en given språkgemenskap fritt varierade språkets delar, så skulle ömsesidig kommunikation inte vara möjlig och själva existensen av språket skulle bli meningslös . När det gäller fördelningen av den relativa frekvensen av användningen av enskilda delar av språket, har den funnit sitt uttryck i lingvistik i form av tilldelningen av kategorier av passivt och aktivt ordförråd och grammatik, som L. V. Shcherba ägnade så mycket uppmärksamhet. I det här fallet kan statistiska metoder bara hjälpa lingvister i fördelningen av specifika språkliga element enligt kategorierna av den relativa frekvensen av deras användning, men de har ingen anledning att hävda att de upptäcker några nya mönster som är av värde för teoretisk lingvistik.

Å andra sidan ger språkstatistiken ett antal verkligt "ursprungliga" slutsatser som är extremt indikativa för arten av det vetenskapliga tänkandet hos dess anhängare. Således studeras den "politiska vokabulären" i verk av Churchill, Benes, Halifax, Stresemann och andra med komplexa statistiska metoder, och översättningar av deras verk till engelska används i beräkningarna för icke-engelsktalande författare. Beräkningsresultaten presenteras i form av ett flertal tabeller, matematiska formler och ekvationer. Den språkliga tolkningen av kvantitativa data i detta fall reduceras till att Churchills användning av "politisk vokabulär" är den mest typiska (?) för denna grupp av författare och att Churchills användning av ord i de fall han sysslar med politiska frågor är typiskt. av den engelska talgruppen 9 8 .

I ett annat fall, efter lämpliga statistiska manipulationer, dras slutsatsen att Hitler brutit mot dualiteten mellan "språk" och "tal" i den kvantitativa betydelsen av dessa termer i användningen av Nazityskland. Ett specialfall av förstörelsen av denna dualitet är den bokstavliga förståelsen<137>metaforiska vändningar (till exempel "häll salt i öppna sår"). Nazityskland stämplade sig med så många omänskliga handlingar att det knappast finns något behov av att döma det för denna språkliga illdåd 9 9 . Enligt Kherdan leder Marx definition av språket som tankens omedelbara verklighet också till brott mot den språkliga dualiteten, och dialektikens lag om ett fenomens övergång till sin motsats är enligt hans mening dualitetens missförstådda språkliga lag. av språket. Sådana tolkningar talar för sig själva.

Slutligen, en vanlig brist som är inneboende i alla ovanstående fall av den kvantitativa metoden att studera språkligt material och därmed förvärva en metodologisk karaktär är inställningen till språkliga element som en mekanisk uppsättning fakta som är absolut oberoende av varandra, i enlighet med vilken, om någon, eller mönster, de hänvisar endast till de numeriska relationerna för fördelningen av autonoma fakta, utanför deras systemiska beroenden. Det är sant att J. Watmou försöker på alla möjliga sätt att försäkra sig om att det är matematik som är bättre än någon form av språklig strukturanalys, som kan avslöja ett språks strukturella egenskaper. ”Modern matematik”, skriver han, ”handlar inte om mätning och kalkyl, vars noggrannhet är begränsad till sin natur, utan i första hand med struktur. Det är därför matematik i hög grad bidrar till noggrannheten av språkinlärning - i den mån en separat beskrivning, ännu mer begränsad till sin natur, inte är kapabel till ... Precis som i fysiken används matematiska element för att beskriva den fysiska världen, eftersom de antas motsvara element i den fysiska världen, så i matematisk lingvistik antas de matematiska elementen motsvara elementen i talvärlden” 101 . Men en sådan formulering av frågan räddar inte på något sätt situationen, eftersom den i bästa fall kan<138>ge en analys av språket antingen som en fysisk struktur, som fortfarande är långt ifrån tillräcklig för språket, och i slutändan fortfarande är av samma mekanistiska karaktär, eller som en logisk-matematisk struktur, och detta överför språket till ett annat plan, och i många avseenden främmande för det. Det är inte överflödigt att notera att Watmow förutser framgångarna för matematisk lingvistik endast i framtiden, och när det gäller deras verkliga resultat, utvärderar han dem med följande ord: "... nästan allt arbete som hittills har gjorts av Herdan, Zipf, Yul, Giro (Guiraux) och andra, är på intet sätt utanför räckvidden för kritik från både lingvistik och matematik; hon luktar amatörmässighet i hög grad” 103 . Alltså, om vi inte försöker förutsäga framtiden för matematiska metoder inom språkforskning, utan försöker uppskatta vad vi har idag, då måste vi erkänna att matematiken faktiskt har begränsats inom språkvetenskapens område bara till "mätning och räkning ”, och jag kunde inte ge en kvalitativ analys av språket och gräva i dess struktur.<139>

Låt oss försöka vara så objektiva som möjligt. I en viss del kan uppenbarligen kvantitativa data användas av lingvistik, men endast som hjälpmedel och främst i problem som har en praktisk inriktning. När det gäller de flesta av de kvantitativa metoderna för att studera individuella språkfenomen är R. Browns allmänna slutsats utan tvekan motiverad: "De kan betraktas som Kherdan anser dem, men vad är meningen med allt detta?" 104 . Låt oss föreställa oss att vi ställer frågan: "Vad är det för träd i den här trädgården?". Och som svar får vi: "Det finns hundra träd i den här trädgården." Är detta svaret på vår fråga, och är det verkligen vettigt? Men när det gäller många språkliga frågor ger matematiska metoder just sådana svar.

Det finns emellertid ett brett forskningsområde, där man i huvudsak använder matematiska metoder och samtidigt orienterar dem mot språkligt material, där ändamålsenligheten av en sådan kombination är utom tvivel. "Meningen" med denna forskningsverksamhet, dess betydelse bestäms av de mål som den strävar efter. Det har redan testats i praktiken. I det här fallet talar vi om problemen i samband med skapandet av informationsmaskiner, strukturer för maskinöversättning av skriftlig vetenskapliga texter, automatisering av översättningen av muntligt tal från ett språk till ett annat och med allt komplex av uppgifter som kombineras i de språkliga frågorna om kybernetik. Hela uppsättningen av sådana problem får vanligtvis det allmänna namnet tillämpad lingvistik. Därmed skiljer den sig från den så kallade matematiska lingvistiken, som omfattar de arbetsområden som ovan betecknats som stilstatistik och språkstatistik, även om den på intet sätt undviker statistisk bearbetning av språkmaterial. Den kanske viktigaste egenskapen hos tillämpad lingvistik, som skiljer den från matematisk lingvistik, som beskrivits ovan, är att den förra har motsatt riktning: inte matematik för lingvistik, utan lingvistik.<140>(formaliserad med matematiska metoder) för en lång rad praktiska problem.

Det finns inget behov av att avslöja innehållet i enskilda problem som nu ingår i det extremt breda området för tillämpad lingvistik. Till skillnad från matematisk lingvistik diskuteras dessa problem aktivt i sovjetisk språklitteratur och börjar med rätta inta en alltmer framträdande plats i forskningsinstitutens vetenskapliga problem 105 . De är alltså redan välkända för vår språkgemenskap. Denna omständighet befriar oss emellertid inte från behovet av att utsätta dem för reflektion, i synnerhet ur synvinkeln av språkvetenskapens principer. Detta kommer utan tvekan att bidra till att eliminera de missförstånd som allt oftare uppstår mellan representanter för vetenskaper som är mycket avlägsna från varandra och som deltar i arbetet med tillämpad lingvistiks problem, och kommer att skissera vägar för deras konvergens, å ena sidan , och avgränsning av forskningsområden å andra sidan. Det säger sig självt att följande överväganden kommer att representera lingvistens synvinkel, och det är nödvändigt att matematiker inte bara försöker tillgodogöra sig den, utan, i samband med de frågor som ställs, ger dem sin tolkning.

Lingvist-teoretikern kan inte på något sätt nöja sig med att i alla fall<141>språket för de ändamål som tillämpas av den tillämpade lingvistiken, är deras grund en matematisk modell. I enlighet med detta uttrycks iakttagelser av språkets fenomen och de resultat som erhålls på detta sätt i termer och begrepp inom matematiken, d.v.s. genom matematiska ekvationer och formler. Låt oss titta på ett exempel för tydlighetens skull. Condon 1 06 och Zipf 1 07 fastställde att logaritmerna för frekvensen ( f) förekomsten av ord i en stor text ligger nästan i en rak linje, om de i diagrammet är korrelerade med logaritmerna för rang eller rang ( r) av dessa ord. Ekvationen f=c:r, Var Medär en konstant återspeglar detta förhållande i den begränsade meningen att c:r för inställt värde råterger den observerade frekvensen med stor approximation. Relation mellan f Och r, uttryckt med en matematisk formel, är en modell för förhållandet mellan de observerade värdena för användningsfrekvensen och rangen, eller rangordningen, av ord. Detta är ett av fallen med matematisk modellering. 

Hela teorin om information är helt baserad på den matematiska modellen för kommunikationsprocessen som utvecklats av C. Shannon 108 . Det definieras som "en matematisk disciplin som ägnas åt metoderna för att beräkna och uppskatta mängden information som finns i alla data, och studiet av processerna för att lagra och överföra information" (TSB, vol. 51, s. 128). Följaktligen får de grundläggande begreppen informationsteori ett matematiskt uttryck.Information mäts i binits eller binära enheter (en kod, som liknas vid ett språk, med två villkorade lika sannolika signaler sänder en binär informationsenhet under överföringen av varje tecken -antingen kod och den genomsnittliga mängden information som överförs<142>formationer. Redundans uttrycks som en procentandel av kodens totala överföringsförmåga”, 1 09 etc. På samma sätt kräver maskinöversättning algoritmisk utveckling av kartläggning av element från ett språk till ett annat, etc. 1 10 . Det här är andra fall av modellering.

Användningen av modeller utan någon mening kan vara till mycket stor hjälp, i synnerhet, med all sannolikhet, för att lösa de problem som tillämpad lingvistik uppställer. Men för teoretisk lingvistik är det mycket viktigt att en abstrakt modell som regel inte reproducerar alla egenskaper hos ett verkligt fenomen, alla dess funktionella egenskaper. Så, en arkitekt, innan han bygger ett hus, kan skapa sin modell, som återger huset som designas i alla de minsta detaljerna, och detta hjälper honom att lösa ett antal praktiska frågor relaterade till själva konstruktionen av huset. Men en sådan modell av ett hus, oavsett hur exakt den kan vara, saknar den "funktionen" och det syftet för vilket alla hus är byggda i allmänhet - den är inte kapabel att ge en person bostad. Situationen är liknande med språket, där modellen inte alltid kan återge alla dess kvaliteter. I det här fallet kompliceras saken ytterligare av att inte språkliga, utan matematiska kriterier används för att bygga modellen. "Matematiska modeller ... - skriver A. Ettinger, - spelar en oerhört viktig roll inom alla teknikområden, men eftersom de är ett verktyg för syntes är deras betydelse för lingvistiken, som i första hand är en historisk och beskrivande disciplin, naturligtvis begränsad. ” 1 11 .<143>

Matematisk modellering av ett språk är faktiskt endast tillämplig på dess statiska tillstånd, vilket är villkorat för en lingvist och i själva verket står i direkt konflikt med den grundläggande kvaliteten hos ett språk, vars existensform är utveckling. Det säger sig självt att det statiska studiet av ett språk på intet sätt är uteslutet från lingvistiken och är grunden för att sammanställa normativa grammatiker och ordböcker, deskriptiva grammatiker, praktiska grammatiker och ordböcker som tjänar som vägledning för praktiska studier av främmande språk etc. Men i alla sådana verk, som till övervägande del tillämpas i naturen, begränsar lingvisterna medvetet forskningsfältet och blundar inte på något sätt för andra aspekter av språket 1 12 . Med en statisk granskning av i synnerhet språket försvinner sådana egenskaper hos språket som är förknippade med dess dynamiska natur, såsom produktivitet, beroende av tankeformer och omfattande interaktion med kulturella, sociala, politiska, historiska och andra faktorer. forskarens synfält. Endast på det synkrona planet kan språket betraktas som ett system av konventionella tecken eller koder, vilket dock visar sig vara helt omotiverat så fort vi antar en dynamisk synvinkel mer lämpad för språk. Det är i utvecklingsprocesserna som språkkvaliteter som motivation, polysemi av ord som inte har stabila gränser, icke-autonomi för betydelsen av ett ord och dess ljudskal, och den kreativa potentialen hos ett ord som är kopplat till sammanhanget är manifesteras, och allt detta står i skarp motsägelse till huvudegenskaperna hos en kod eller ett tecken 1 13 . Uppenbarligen kan man inom den tillämpade lingvistiken också tänka på alla dessa egenskaper hos språket och i praktiska syften nöja sig med så att säga en "ögonblicksbild" av språket, som ändå är kapabel att ge en ganska ungefärlig uppfattning om mekanismen för dess funktion.<144>nirovaniya. Men varje sådan "ögonblicksbild", om den betraktas som ett språkfaktum och inte som ett faktum i ett system av konventionella koder, måste inkluderas i den oändliga rörelseprocessen där språket alltid existerar 1 14 . Det kan inte studeras utanför de konkreta förhållanden som kännetecknar denna rörelse, som sätter sin prägel på givet tillstånd språk och betinga styrkan av dess vidare utveckling. Här är det samma skillnad som mellan ett ögonblicksfotografi av en person och hans porträtt målat med en pensel. sann konstnär. I konstnärens verk har vi framför oss en generaliserande bild av en person i all originalitet av inte bara hans fysiska utseende, utan också hans inre andliga innehåll. Från ett konstnärligt porträtt kan vi också läsa det förflutna för den person som avbildas på det och avgöra vad han är kapabel till i sina handlingar. Och en ögonblicksbild, även om den kan ge en mer exakt bild av originalets utseende, saknar dessa egenskaper och fångar ofta både en oavsiktlig finne som hoppade upp på näsan och<145>en helt okarakteristisk pose eller uttryck, som i slutändan leder till en förvrängning av originalet.

Det bör noteras att metoden med "snapshots" naturligtvis kan tillämpas på fakta om språkutveckling. Men i det här fallet kommer vi faktiskt bara att ha att göra med separata tillstånd i språket, som i sin kvantitativa karaktärisering visar sig vara sammankopplade inte mer än en jämförande kvantitativ karakterisering av olika språk. Denna typ av kvantitativ "dynamik" kommer inte att innehålla något organiskt, och sambandet mellan de enskilda tillstånden i språket kommer endast att vila på jämförelsen av numeriska relationer. Om i detta fall också att tillgripa en analogi, kan vi hänvisa till barnets tillväxt. Hans utveckling kan naturligtvis representeras i form av dynamiken i numeriska data om hans vikt, längd, ändrade förhållanden mellan volymen av delar av hans kropp, men alla dessa data är absolut fristående från allt som i första hand utgör den individuella essensen av en person - hans karaktär, böjelser, vanor. , smaker, etc.

En annan negativ sida av den matematiska "modelleringen" av språket är det faktum att det inte kan fungera som den allmänna principen på vilken det är möjligt att genomföra en heltäckande och heltäckande - systematisk beskrivning av språket. Endast ett matematiskt förhållningssätt till exempelvis språkfenomenen kommer inte att göra det möjligt att besvara ens sådana grundläggande frågor (utan vilka själva existensen av språkvetenskapen är otänkbar), såsom: vad är språk, vilka fenomen bör vara klassificeras som korrekt språklig, hur ett ord eller en mening definieras, vilka är de grundläggande begreppen och kategorierna av språk, etc. Innan du vänder dig till de matematiska metoderna för att studera språk är det nödvändigt att redan ha svar (även i form av ett arbetssätt) hypotes) till alla dessa frågor i förväg. Det finns ingen anledning att blunda för det faktum att alla dessa begrepp och kategorier oundvikligen måste accepteras eftersom de definierades av traditionella eller, relativt sett, i alla fall som vi känner till studien av språkliga fenomen med matematiska metoder. kvalitativa metoder.

Denna egenskap hos matematiska metoder i deras språkliga tillämpning noterades av Spang-Hanssen när pi<146>sal: ”Man bör ha i åtanke att observerade fakta som får ett kvantitativt uttryck ... inte har något värde om de inte ingår i beskrivningen, och i språkliga syften bör det vara en systematisk beskrivning, närbesläktad med en kvalitativ språklig beskrivning. beskrivning och teori” 1 15 . I ett annat tal av Spang-Hanssen finner vi ett förtydligande av denna tanke: ”Tills dess att möjligheten att konstruera ett kvantitativt system är bevisad, och så länge det finns ett allmänt accepterat kvalitativt system för ett visst ämnesområde, frekvensberäkningar och annat numeriska egenskaper ur en språklig synvinkel vision är inte meningsfull" 1 16 . Liknande idéer uttrycks av Uldall, som något oväntat förbinder dem med utvecklingen av de allmänna teoretiska grunderna för glossematiken: ”När en lingvist betraktar eller mäter allt som han anser och mäter, är det inte självt kvantitativt bestämt; till exempel är ord, när de räknas, definierade, om de alls definieras, i helt olika termer.<147>

Sålunda visar det sig att matematiska metoder både i teoretiska termer och i sin praktiska tillämpning är direkt beroende av språkliga begrepp och kategorier definierade av traditionella, filologiska eller, som nämnts ovan, kvalitativa metoder. När det gäller tillämpad lingvistik är det viktigt att inse detta beroende, och följaktligen att bekanta sig med helheten av huvudkategorierna för traditionell lingvistik.

Det finns sant att det inte finns någon anledning att förebrå företrädare för de exakta vetenskaperna som arbetar inom området tillämpad lingvistik för att de inte använder data från modern lingvistik. Detta stämmer inte överens med det faktiska tillståndet. De känner inte bara mycket väl till, utan använder också i stor utsträckning i sitt arbete de system av differentiella egenskaper som etablerats av lingvister som är karakteristiska för olika språk, distributionen och arrangemanget av språkliga element inom specifika språksystem, prestationerna av akustisk fonetik, etc. Men i detta fall krävs en mycket betydande reservation. I själva verket använder representanter för de exakta vetenskaperna data från endast en riktning inom lingvistik - den så kallade deskriptiva lingvistiken, som medvetet särskiljde sig från den teoretiska lingvistikens traditionella problem, långt ifrån att täcka hela språkforskningens område, från en egentlig språklig synpunkt har den betydande metodologiska brister, vilket ledde till nyligen avslöjad kris 1 18 , och har dessutom en rent praktisk inriktning, motsvarande den tillämpade lingvistikens intressen. Alla reservationer och förebråelser som framfördes ovan mot den statiska hänsynen till språket är tillämpliga på deskriptiv lingvistik. Ett sådant ensidigt förhållningssätt av deskriptiv lingvistik kan, utredaren<148>Det kan emellertid endast motiveras av de uppgifter som tillämpad lingvistik ställer sig, men det uttömmer långt ifrån hela innehållet i språkvetenskapen.

I processen att utveckla frågor om tillämpad lingvistik kan nya teoretiska problem uppstå, och de har faktiskt redan uppstått. En del av dessa problem är nära besläktade med den tillämpade lingvistikens specifika uppgifter och syftar till att övervinna de svårigheter som uppstår för att lösa dessa problem. Andra problem är direkt relaterade till teoretisk lingvistik, vilket möjliggör ett nytt perspektiv på traditionella idéer eller öppnar upp nya områden inom språkforskning, nya begrepp och teorier. Bland dessa senare är till exempel problemet med att skapa ett "maskinspråk" (eller mellanspråk), som är närmast besläktat med en komplex uppsättning sådana kardinalfrågor inom teoretisk lingvistik som förhållandet mellan begrepp och lexikaliska betydelser, logik och grammatik, diakroni och synkroni, språkets teckenkaraktär, essensen av språklig mening, principerna för att konstruera konstgjorda språk, etc. 1 19 . I det här fallet är det särskilt viktigt att etablera ömsesidig förståelse och samvälde i det gemensamma arbetet av representanter för språkliga discipliner och de exakta vetenskaperna. När det gäller den språkliga sidan, i det här fallet borde vi tydligen inte tala om att redan i förväg begränsa ansträngningarna från till exempel designers av översättningsmaskiner” och försöka fastställa arbetsförmågan hos sådana maskiner med verserna i N. Gribachev eller V. Kochetovs prosa 1 20 . Maskinen själv kommer att hitta gränserna för dess kapacitet och lönsamhet - gränserna för dess användning. Men lingvister måste, som deras bidrag till den gemensamma saken, ta med sig sin kunskap om egenskaperna hos språkets struktur, dess mångsidighet, de inre korsande förhållandena mellan dess element, såväl som språkets breda och multilaterala kopplingar med fysiska, fysiologiska , mentalt och logiskt<149>mi-fenomen, specifika funktionsmönster och språkets utveckling. Helheten av denna kunskap är nödvändig för konstruktörerna av motsvarande maskiner för att inte vandra åt fel håll, utan för att göra sökningen målmedveten och tydligt orienterad. Även den är väldigt kort recension fall av tillämpning av matematiska metoder på språkliga problem, som gjordes i denna uppsats, övertygar om att sådan kunskap på intet sätt kommer att vara överflödig för företrädare för de exakta vetenskaperna.

På grundval av alla ovanstående överväganden kan man uppenbarligen komma till några generella slutsatser.

Så, matematisk lingvistik? Om detta innebär användningen av matematiska metoder som en universell huvudnyckel för att lösa alla språkliga problem, bör sådana påståenden erkännas som absolut oberättigade. Allt som har gjorts i denna riktning har hittills gjort väldigt lite eller till och med inte alls för att lösa språkvetenskapens traditionella problem. I värsta fall åtföljs tillämpningen av matematiska metoder av uppenbara absurditeter eller är, ur språklig synvinkel, absolut meningslös. I bästa fall kan matematiska metoder användas som hjälpmetoder för språkforskning, och ställas till tjänst för specifika och begränsade språkliga problem. Det kan inte vara fråga om någon "kvantitativ språkfilosofi" i detta fall. Fysik, psykologi, fysiologi, logik, sociologi och etnologi inkräktade på sin tid på språkvetenskapens oberoende, men de kunde inte underkuva lingvistiken. Motsatsen hände - lingvistiken drog fördel av dessa vetenskapers prestationer och började, i den utsträckning det var nödvändigt för sig själv, att använda deras hjälp, och berikade därigenom arsenalen av sina forskningsmetoder. Nu är det tydligen matematikens tur. Det är att hoppas att denna nya gemenskap också kommer att bidra till att stärka språkvetenskapen, förbättra dess arbetsmetoder och öka deras mångfald. Det är därför lika legitimt att tala om matematisk lingvistik som om fysisk lingvistik, fysiologisk lingvistik, logisk lingvistik, psykologisk lingvistik och<150>etc. Det finns ingen sådan lingvistik, det finns bara en lingvistik, som lönsamt använder data från andra vetenskaper som hjälpforskningsverktyg. Det finns alltså ingen anledning att dra sig tillbaka före den nya vetenskapens anstormning och att lätt ge efter för den de positioner den har vunnit. Här är det mycket lämpligt att påminna om A. Martinets ord: ”Kanske är det frestande att ansluta sig till en eller annan större tankerörelse genom att använda några väl valda termer, eller att med någon matematisk formel deklarera stringens i sitt resonemang. Men det är dags för lingvister att inse sin vetenskaps oberoende och att befria sig från det underlägsenhetskomplex som gör att de förknippar något av sina handlingar med en eller annan allmän vetenskaplig princip, som ett resultat av vilken verklighetens konturer alltid blir bara vagare, istället för att bli tydligare 21 .

Därför matematik i sig och lingvistik i sig. Detta utesluter inte på något sätt deras ömsesidiga hjälp eller ett vänskapligt möte i gemensamt arbete med gemensamma problem. Denna typ av tillämpningsplats för de två vetenskapernas samordnade ansträngningar är hela den breda skalan av problem som ingår i tillämpad lingvistik och är av stor nationell ekonomisk betydelse. Man skulle bara önska att båda vetenskaperna i sitt gemensamma arbete visade maximal ömsesidig förståelse, vilket utan tvekan också skulle bidra till maximal fruktbarhet av deras samarbete.<151>

Innehållsförteckning
Introduktion
Kapitel 1. Historien om tillämpningen av matematiska metoder i lingvistik
1.1. Bildandet av strukturell lingvistik vid 1800- och 1900-talets skifte
1.2. Tillämpning av matematiska metoder i lingvistik under andra hälften av 1900-talet
Slutsats
Litteratur
Introduktion
Under 1900-talet har det funnits en fortsatt trend mot interaktion och interpenetration av olika kunskapsområden.Gränserna mellan enskilda vetenskaper suddas ut gradvis; det finns fler och fler grenar av mental aktivitet som befinner sig "i korsningen" av humanitär, teknisk och naturvetenskaplig kunskap.
En annan uppenbar egenskap hos moderniteten är viljan att studera strukturer och deras beståndsdelar. Därför mer och mer plats i vetenskaplig teori och i praktiken ges till matematik. Genom att å ena sidan komma i kontakt med logik och filosofi, å andra sidan med statistik (och följaktligen med samhällsvetenskap), tränger matematiken allt djupare in i de områden som länge ansågs vara rent. "humanitär", utökar sin heuristiska potential (svaret på frågan "hur mycket" hjälper ofta till att svara på frågorna "vad" och "hur"). Lingvistik var inget undantag, mitt mål terminspapper- kort belysa sambandet mellan matematik och en sådan gren av lingvistik som lingvistik. Sedan 1950-talet har matematik använts inom lingvistik för att skapa en teoretisk apparat för att beskriva språkens struktur (både naturliga och artificiella). Det ska dock sägas att hon inte direkt hittade sin egen sort. praktisk användning. Inledningsvis började matematiska metoder inom lingvistik användas för att klargöra lingvistikens grundläggande begrepp, men med utvecklingen av datateknik började en sådan teoretisk premiss att tillämpas i praktiken. Lösningen av sådana uppgifter som maskinöversättning, maskinell informationshämtning, automatisk textbearbetning krävde ett fundamentalt nytt förhållningssätt till språket. En fråga har uppstått inför lingvister: hur man lär sig att representera språkliga mönster i den form i vilken de kan appliceras direkt på tekniken. Termen "matematisk lingvistik", som är populär i vår tid, syftar på all språklig forskning som använder exakta metoder (och begreppet exakta metoder inom naturvetenskap är alltid nära besläktat med matematik). Vissa forskare från tidigare år tror att uttrycket i sig inte kan höjas till rang av en term, eftersom det inte betyder någon speciell "lingvistik", utan bara en ny riktning fokuserad på att förbättra, öka noggrannheten och tillförlitligheten av språkforskningsmetoder. Lingvistik använder både kvantitativa (algebraiska) och icke-kvantitativa metoder, vilket för den närmare matematisk logik, och följaktligen till filosofi och till och med psykologi. Till och med Schlegel noterade samspelet mellan språk och medvetande, och den framstående lingvisten från det tidiga nittonhundratalet, Ferdinand de Saussure (jag kommer att berätta om hans inflytande på utvecklingen av matematiska metoder inom lingvistik senare), kopplade samman språkets struktur med dess tillhörighet till folket. Den moderna forskaren L. Perlovsky går längre och identifierar språkets kvantitativa egenskaper (till exempel antalet kön, fall) med särdragen hos den nationella mentaliteten (mer om detta i avsnitt 2.2, "Statistiska metoder i lingvistik").
Samspelet mellan matematik och lingvistik är ett mångfacetterat ämne, och i mitt arbete kommer jag inte att uppehålla mig vid alla, utan först och främst vid dess tillämpade aspekter.
Kapitel I. Historien om tillämpningen av matematiska metoder i lingvistik
1.1 Bildandet av strukturell lingvistik vid början av XIX - XX-talet
Den matematiska beskrivningen av språket är baserad på idén om språket som en mekanism, som går tillbaka till den berömda schweiziska lingvisten från det tidiga nittonhundratalet, Ferdinand de Saussure.
Den första länken till hans koncept är teorin om språket som ett system som består av tre delar (språket självt - språket, tal - parole och talaktivitet - språket), där varje ord (medlem av systemet) anses inte i sig självt , men i samband med andra....


Topp