La storia dell'applicazione dei metodi matematici in linguistica. Prospettive per l'applicazione dei metodi matematici in linguistica

Penetrazione nella linguistica metodi matematici e lo "spirito matematico" ha contribuito allo sviluppo della linguistica nella direzione dell'accuratezza e dell'obiettività. Tuttavia, per la sua strada ulteriori sviluppi ci sono seri ostacoli in questa direzione. L'autore riflette sulle ragioni della convergenza di linguistica e matematica, sui limiti di applicabilità dei metodi matematici in linguistica e sulla natura dei fattori che impediscono la comprensione reciproca tra matematici e linguisti.

Quando, nella seconda metà degli anni Cinquanta, alcuni giovani linguisti pensarono di applicare i metodi matematici allo studio della struttura del linguaggio e iniziarono a collaborare con i matematici, ciò provocò sorpresa e persino shock in moltissimi loro colleghi, del resto erano convinti dall'infanzia che scienze umanitarie, una delle quali è la linguistica, non hanno e non possono avere nulla in comune con la matematica e le altre scienze "esatte".

Nel frattempo, l'esistenza di una stretta connessione tra linguaggio naturale e matematica non era affatto una nuova scoperta in quel momento. L. S. Vygotsky scrisse nel suo libro “Thinking and Speech” pubblicato nel 1934: “Il primo a vedere in matematica il pensiero che nasce dal linguaggio, ma lo supera, fu, a quanto pare, Descartes” e continuò: “Il nostro solito colloquiale a causa delle sue intrinseche fluttuazioni e incoerenze grammaticali e psicologiche, è in uno stato di equilibrio mobile tra gli ideali di armonia matematica e fantastica e in un movimento incessante, che chiamiamo evoluzione.

Nascere in Grecia antica la dottrina delle categorie grammaticali era già una descrizione di alcuni degli aspetti più importanti della struttura della lingua con l'ausilio di modelli astratti vicini nello stile a quei modelli creati dagli antichi matematici greci per descrivere le forme spaziali; solo la familiarità di concetti come caso, genere, ecc., che sono diventati, come scrisse H. Steinthal, “la nostra seconda natura”, ci impedisce di comprendere quale alto livello di pensiero astratto richiedesse la loro creazione. Quindi dovresti essere sorpreso piuttosto che che i primi tentativi di utilizzare mezzi matematici reali per descrivere l'“ideale dell'armonia matematica” linguistica furono compiuti solo a metà del XX secolo.

Ci sono due ragioni per questo "ritardo". In primo luogo, la scienza del linguaggio, dopo importanti passi compiuti epoca antica, ricominciò a svilupparsi davvero solo nell'Ottocento, ma per tutto questo secolo l'attenzione principale dei linguisti fu rivolta alla storia della lingua, e solo nel secolo successivo, che in generale fu l'età dello strutturalismo per le discipline umanistiche, la linguistica per la prima volta dopo il periodo antico si rivolse allo studio delle strutture linguistiche, ma a un nuovo livello. Quando i linguisti si sono resi conto che la lingua è, nelle parole di F. de Saussure, un “sistema di relazioni pure”, cioè un sistema di segni, la cui natura fisica è insignificante, e solo le relazioni tra loro sono significative, il parallelo tra divennero abbastanza evidenti il ​​linguaggio e le costruzioni matematiche, che sono anche "sistemi di relazioni pure", e già all'inizio del Novecento lo stesso de Saussure sognava di studiare il linguaggio con mezzi matematici.

In secondo luogo, i metodi quantitativi sono venuti alla ribalta in matematica all'inizio della New Age, e solo nel XIX secolo i matematici hanno ricominciato a costruire modelli astratti non quantitativi che differivano maggiormente da quelli antichi. alto livello astrazioni, e anche - cosa particolarmente importante per il nostro argomento - dal fatto che potrebbero essere usate per descrivere una gamma di fenomeni molto più ampia delle forme spaziali; spesso tali modelli si sono rivelati convenienti e uniformi mezzi necessari per studiare fenomeni che i matematici che li hanno costruiti non pensavano affatto e non sapevano nemmeno della loro esistenza. Tra questi modelli c'erano quelli che in seguito ricevettero applicazione in linguistica; sviluppo particolarmente intenso delle discipline matematiche, il cui contenuto era la loro costruzione, avvenne nella prima metà del XX secolo. Pertanto, l'incontro tra matematica e linguistica a metà di questo secolo è stato del tutto naturale.

Uno dei risultati di questo incontro è stato l'emergere di una nuova disciplina matematica: la linguistica matematica, il cui oggetto è lo sviluppo di un apparato matematico per la ricerca linguistica. Il posto centrale nella linguistica matematica è occupato dalla teoria delle grammatiche formali, che, per la natura dell'apparato utilizzato in essa, è correlata alla logica matematica e, in particolare, alla teoria degli algoritmi. Fornisce metodi formali per descrivere le unità linguistiche corrette. vari livelli, e anche, cosa particolarmente importante, metodi formali per descrivere le trasformazioni delle unità linguistiche, sia allo stesso livello che tra i livelli. La teoria delle strutture sintattiche confina con la teoria delle grammatiche formali, che è molto più semplice in termini di apparato, ma non meno importante per le applicazioni linguistiche. Nella linguistica matematica si stanno sviluppando anche modelli analitici della lingua, nei quali, sulla base di dati certi - ritenuti noti - su “testi corretti”, si fanno costruzioni formali, il cui risultato è una descrizione di alcuni “ parti costitutive» meccanismo linguistico. In questo modo si può ottenere una descrizione formale di alcuni concetti grammaticali tradizionali. Ciò dovrebbe includere anche la descrizione del significato della frase utilizzando l'apparato della logica intensionale ("semantica Montagu").

Naturalmente, con l'aiuto dell'apparato matematico, si può descrivere solo uno dei due ideali del linguaggio di cui parlava Vygotskij; pertanto, le obiezioni spesso sentite all'uso dell'uno o dell'altro modello matematico (o modelli matematici in generale) sulla base del fatto che non copre tali e tali casi speciali non hanno senso: descrivere le "fluttuazioni e incoerenze" inerenti a il linguaggio, ci vogliono assolutamente altri mezzi, non matematici, e solo una chiara descrizione dell'"ideale matematico" potrebbe aiutare a trovarli, poiché permetterebbe di delimitare nettamente il "fantastico" dal "matematico" nel lingua. Ma questa è ancora una questione per il futuro.

Non meno, e forse più importante dell'emergere della linguistica matematica, fu la penetrazione diretta nella linguistica di idee e concetti matematici fondamentali - come insieme, funzione, isomorfismo. Nella moderna semantica linguistica, i concetti di predicato e quantificatore, che derivano dalla logica matematica, giocano un ruolo importante. (Il primo di essi è sorto nella logica anche quando non era distinto dalla linguistica, e ora è tornato alla linguistica in una forma generalizzata ed elaborata matematicamente.)

E infine, molto Grande importanza ha un raffinamento del linguaggio della ricerca linguistica, che si verifica a causa della penetrazione dello "spirito matematico" nella linguistica, non solo in quelle aree in cui è possibile utilizzare idee e metodi matematici. Tutto ciò può essere brevemente riassunto come segue: la linguistica sta diventando una scienza sempre più accurata e più obiettiva - senza cessare, ovviamente, di essere una scienza delle discipline umanistiche.

Tuttavia, su questo modo naturale Lo sviluppo della linguistica incontra seri ostacoli che possono rallentarlo a lungo. La principale è la “separazione delle facoltà” sorta all'inizio della New Age: scienziati naturali e matematici, da un lato, e scienziati umanitari, dall'altro, non sono interessati al lavoro dei colleghi “di un'altra facoltà " e, inoltre, in fondo, e spesso li disprezzano apertamente. . I matematici e gli scienziati naturali (e ancor più i "tecnici") tendono a vedere la ricerca umanistica solo come una sorta di "decorazione" o addirittura "chiacchiere inutili", mentre le "scienze umane" sono pronte a tollerare la matematica e le scienze naturali solo per motivi pratici beneficio e sono convinto che non sono nulla può aiutare a comprendere la natura dello spirito umano.

Solo nel mezzo 19esimo secolo in questo, nelle parole del grande biologo e grande pensatore Konrad Lorenz, "il muro malvagio tra le scienze naturali e le discipline umanistiche (die böse Mauer zwischen Natur- und Geistwissenschaften)" fu fatta la prima breccia nel punto più sottile che separa la logica dalla matematica. Nel XX secolo sono apparse altre lacune - tra queste quella che è stata colmata da entrambe le parti da matematici e linguisti - ma sono ancora poche, il muro è ancora forte e non mancano gli sforzi da entrambe le parti per rafforzarlo ulteriormente e rattoppare i buchi. Spesso questi sforzi hanno abbastanza successo; l'ultimo "risultato" in questa direzione è "l'educazione al profilo" in Scuola superiore che già nell'infanzia divide le persone capaci e interessate in "facoltà" e insegna loro ad essere orgogliosi dell'ignoranza nelle scienze "straniere" - può ostacolare notevolmente l'ulteriore convergenza delle scienze naturali e umane, che è urgentemente necessaria per il normale sviluppo di entrambe . Una delle conseguenze dell'erezione del muro è che le "scienze umanistiche", compresa la stragrande maggioranza dei linguisti, non sanno nulla nemmeno delle basi proprio di quelle sezioni della matematica che hanno valore più alto per le discipline umanistiche (e immaginate un matematico come una persona che si occupa esclusivamente di calcoli).

Un altro ostacolo è la corsa frenetica caratteristica dello stato attuale della scienza, la ricerca continua di sempre più nuovi "risultati", restringendo l'orizzonte e non lasciando tempo per pensare a problemi più profondi o impegnarsi in uno studio serio di problemi correlati e, inoltre, non del tutto correlato disciplina scientifica. Questo vale anche per linguisti e matematici - come, in effetti, per tutti coloro che sono professionalmente impegnati nella scienza.

E il terzo è l'inerzia, o, più semplicemente, la pigrizia. A prima vista pigrizia e corsa frenetica sono incompatibili, ma in realtà vanno d'accordo tra loro e, inoltre, si sostengono e si stimolano a vicenda. Quando una persona è troppo pigra per affrontare un compito difficile, ne afferra uno più facile e più "affidabile", il cui successo giustifica e incoraggia la sua inerzia. atteggiamento arrogante nei confronti fratelli minori, brulicante dall'altra parte del muro, incoraggia anche la pigrizia e ne è incoraggiata. Quando, ad esempio, un matematico propone di riconsiderare tutte le idee su storia antica, senza darsi la pena di familiarizzare almeno un po 'con le lingue antiche, la stessa madre pigra ne è in gran parte responsabile.

Il pericolo per lo sviluppo della scienza rappresentato da questi ostacoli è molto più grave di quanto possa sembrare a prima vista. Quando l'ignoranza nelle scienze "straniere" diventa motivo di orgoglio, ciò porta naturalmente alla superficialità e all'ignoranza anche nelle "nostre". Esistono da tempo molte più di due "facoltà", il loro numero cresce di anno in anno, e ognuna è recintata da un muro dalle altre; i muri compaiono anche all'interno delle facoltà. Gli orizzonti dei ricercatori si stanno gradualmente restringendo; è vero che l'apparato della ricerca si fa sempre più sottile e raffinato, ma quasi esclusivamente piccoli oggetti, e si rafforza l'idea che siano gli unici che valga la pena studiare. Ci sono tutte le ragioni per parlare di una crisi della scienza e la linguistica non fa eccezione. Ora, mi sembra, è il momento di guardare indietro e pensare.

Qui si sono riuniti i linguisti della direzione, che è associata al modello "Significato - Testo". Questo modello, creato negli anni '60 del secolo scorso, è stato uno dei primi e migliori risultati incontro di linguistica e matematica, dopo il quale sono cresciute due generazioni di linguisti, abituati a un pensiero preciso fin dagli anni dello studente. Ma, purtroppo, non sono esenti dall'inerzia, che impedisce loro di rendersi conto dell'esistenza di una crisi e di pensare a come superarla. Nel frattempo, tra tutti i linguisti - e forse anche tra tutti coloro che sono coinvolti nelle discipline umanistiche - hanno le opportunità più oggettive per una tale comprensione, e vorrei sperare che sfruttino queste opportunità.

Il testo del rapporto è stato gentilmente fornito da AV Gladkiy e dalla casa editrice

La storia dell'applicazione dei metodi matematici in linguistica CONFERENZA N. 1

piano

Formazione
linguistica strutturale
SU fine del XIX- XX secoli.
Applicazione di metodi matematici
in linguistica nella seconda metà del Novecento
secolo.
prospettive
applicazioni
metodi matematici in
linguistica.

Ferdinand de Saussure (1857-1913) la lingua come sistema

lingua propriamente detta
discorso - parole
attività linguistica
- lingua

I.A. Baldovino di Courtenay (1845 - 1929)

“I suoni sono gli “atomi” del linguaggio
sistemi che hanno
numero limitato
proprietà facilmente misurabili.
Questo è il più conveniente
materiale per formali,
metodi rigorosi
descrizioni”.

Linguistica strutturale -

è un insieme di punti di vista sulla lingua e
metodi della sua ricerca, basati su
che sta la comprensione della lingua come
sistema di segni con chiaramente distinguibili
elementi strutturali (unità
lingua, le loro classi, ecc.) e il desiderio di
rigoroso (si avvicina esatto
scienze) descrizione formale della lingua.

Leningrado
scuola fonologica
(L.V. Shcherba) usato come
il criterio principale per la generalizzazione del suono in
come fonema psicolinguistico
esperimento basato sull'analisi
discorso dei madrelingua.
Circolo linguistico di Praga
(N.S. Trubetskoy) ha sviluppato la teoria
opposizioni - struttura semantica
la lingua è stata descritta da loro come un insieme
costruito oppositivamente
unità semantiche - fam.

Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento

americano
descrittivismo
(L. Bloomfield e E. Sapir). Lingua
presentato ai descrittivisti come
raccolta di espressioni vocali.
Grammatica formale di N. Chomsky.
Mosca
scuola fonologica,
i cui rappresentanti erano A.A.
Reformatsky, V.N. Sidorov, P.S.
Kuznetsov, A.M. Sukhotin, R.I. Avanesov.

sistemi di traduzione automatica

Algoritmo
traduzione consecutiva
parola per parola, frase per frase.
T-sistemi (da parola inglese trasferimento
- trasformazione), in cui la traduzione
svolta a livello sintattico
strutture.
I-sistemi (dalla parola "interlingua") ottenendo una rappresentazione semantica
inserire la frase attraverso its
analisi semantica e sintesi
offerta di ingresso sul ricevuto
presentazione semantica.

10. Linguistica pratica

studi
non una lingua nel suo stato (es.
sistema), e la lingua in azione (cioè in
comunicazione);
risolve uno specifico problema applicativo,
creare modelli linguistici senza
pretende di spiegare i fatti del linguaggio
(come linguistica teorica);
mirare a sottolingue specifiche
(cioè conoscenza selettiva della lingua), e non
per tutta la lingua.

11. linguistica quantitativa

- direzione interdisciplinare in
ricerca applicata, che
come principale strumento di studio
si usa il linguaggio e la parola
quantitativo o statistico
metodi di analisi.

12. linguistica computazionale

– sviluppo di metodi, tecnologie e
sistemi specifici che forniscono
comunicazione tra una persona e un computer su un naturale
o linguaggio naturale limitato.

13. linguistica computazionale

creazione di sistemi per la lavorazione naturale
linguaggio (ad esempio, i sistemi di elaborazione delle comunicazioni
testo);
sviluppo di sistemi di ricerca di informazioni
(documentario, cioè in cui
testi e fattuali, ad es. in quale
i fatti sono immagazzinati, presentati non solo in
forma testuale, oltre che sotto forma di tabelle,
formule, ecc.);
creazione di sistemi ipertestuali (es.
insieme di testi con link tra loro
relazioni);
sviluppo delle tecnologie informatiche
compilazione e uso di dizionari.

14. Grazie per l'attenzione!

15. Rapporti:

Legislazione
natura e leggi "umanitarie".
Rivoluzione matematica in linguistica.
Scuola di Struttura di Copenaghen
linguistica.
La formazione della linguistica applicata come
disciplina scientifica.

16. Sessione pratica:

Descrizione della storia dell'applicazione della matematica
Metodi in linguistica dall'antichità ai nostri
giorni.
Manifestazione delle tendenze di integrazione
matematiche, linguistiche e altre conoscenze in
storia dello sviluppo della scienza del linguaggio.
Caratteristiche comparative di applicato e
linguistica teorica (compilare la tabella
Caratteristiche comparative di applicato e
linguistica teorica).
La linguistica dei corpora come sezione applicata
linguistica.
Aspetti applicati della linguistica quantitativa.
Linguistica computazionale e suoi strumenti.

Nel corso dell'ultimo secolo, la linguistica è sempre stata citata come esempio di una scienza che si è sviluppata rapidamente e ha raggiunto molto rapidamente la maturità metodologica. Già a metà del secolo scorso, la giovane scienza si collocava con fiducia nel circolo delle scienze che aveva una tradizione millenaria, e uno dei suoi rappresentanti più in vista - A. Schleicher - ebbe il coraggio di credere che con le sue opere stava già riassumendo la riga finale.<113>La storia della linguistica, tuttavia, ha dimostrato che tale opinione era troppo frettolosa e ingiustificata. Alla fine del secolo la linguistica subì il suo primo grande shock legato alla critica dei principi neogrammatici, cui ne seguirono altri. Va notato che tutte le crisi che possiamo scoprire nella storia della scienza del linguaggio, di regola, non ne hanno scosso le fondamenta, ma, al contrario, hanno contribuito al rafforzamento e alla fine hanno portato con sé un affinamento e un miglioramento dei metodi della ricerca linguistica, ampliandosi con temi e questioni scientifiche.

Ma accanto alla linguistica vissero e si svilupparono anche altre scienze, tra cui un gran numero di nuove. Le scienze fisiche, chimiche e tecniche (le cosiddette "esatte") hanno ricevuto uno sviluppo particolarmente rapido nel nostro tempo e la loro base teorica, la matematica, ha regnato su tutte. Le scienze esatte non solo hanno fortemente sollecitato tutte le discipline umanistiche, ma attualmente si sforzano di "portarle nella loro fede", di subordinarle ai loro costumi, di imporre loro i loro metodi di ricerca. Nella situazione attuale, usando un'espressione giapponese, si può dire che ora i linguisti-filologi stanno contaminando il bordo stesso del tappeto, dove le scienze esatte, guidate dalla matematica, si trovano trionfalmente e liberamente.

Non sarebbe più opportuno, dal punto di vista degli interessi scientifici generali, arrendersi alla matematica, arrendersi interamente alla potenza dei suoi metodi, a cui alcune voci richiamano apertamente 59 , e quindi, forse, acquisire nuova forza? Per rispondere a queste domande, dobbiamo prima guardare a ciò che sostiene la matematica questo caso in quale area della linguistica i metodi matematici trovano la loro applicazione, in che misura sono coerenti con le specificità del materiale linguistico e se sono in grado di dare o anche solo suggerire risposte alle domande poste dalla scienza del linguaggio.

Fin dall'inizio, va notato che tra gli appassionati della nuova tendenza matematica in linguistica<114>Non c'è unanimità di opinioni riguardo ai suoi scopi e obiettivi nella ricerca statica. Acad. A. A. Markov, che per primo applicò i metodi matematici al linguaggio, Boldrini, Yul, Mariotti considerano gli elementi del linguaggio come idoneo materiale illustrativo per costruire metodi quantitativi, o per teoremi statistici, senza affatto chiedersi se i risultati di un tale studio siano interessanti ai linguisti 6 0 . Ross ritiene che la teoria della probabilità e la statistica matematica forniscano uno strumento o, come ora preferiscono dire, un modello matematico per testare e confermare quelle conclusioni linguistiche che consentono l'interpretazione numerica. Pertanto, i metodi matematici sono concepiti solo come mezzi ausiliari della ricerca linguistica 6 1 . Molto di più afferma Herdan, che nel suo libro non solo ha riassunto e sistematizzato tutti i tentativi di studio matematico dei problemi linguistici, ma ha anche cercato di dare loro un chiaro orientamento in relazione a ulteriori lavori. Incentra la presentazione dell'intero materiale del suo libro sulla "comprensione della statistica letteraria (come chiama lo studio dei testi con metodi di statistica matematica". - ALLE 3.) come parte integrante della linguistica” 6 2 , e formula l'essenza ei compiti di questa nuova sezione della linguistica con le seguenti parole: “La statistica letteraria come filosofia quantitativa del linguaggio è applicabile a tutti i rami della linguistica. A nostro avviso, la statistica letteraria è una linguistica strutturale elevata al livello di una scienza quantitativa o di una filosofia quantitativa. Pertanto, è ugualmente errato definire i suoi risultati come fuori ambito<115>linguistica o trattarla come uno strumento ausiliario per la ricerca” 6 3 .

Non è consigliabile addentrarsi in teorizzazioni sulla legittimità, in questo caso, di parlare dell'emergere di una nuova branca della linguistica e risolvere la questione delle sue pretese, senza prima riferirsi alla considerazione di quanto effettivamente è stato fatto in questo settore, ea chiarire in quale direzione l'applicazione dei nuovi metodi 6 4 . Questo ci aiuterà a capire le differenze di opinione.

L'uso di criteri matematici (o, più precisamente, statistici) per risolvere problemi linguistici non è affatto nuovo nella scienza del linguaggio e, in un modo o nell'altro, è stato a lungo utilizzato dai linguisti. Dopotutto, infatti, concetti tradizionali della linguistica come la legge fonetica (e relativi<116>nee con esso - un'eccezione alla legge), la produttività degli elementi grammaticali (ad esempio, i suffissi derivazionali), o anche i criteri per le relazioni correlate tra le lingue, in una certa misura, si basano su caratteristiche statistiche relative. Dopotutto, più netta e distinta è l'opposizione statistica dei casi osservati, più ragioni abbiamo per parlare di suffissi produttivi e improduttivi, della legge fonetica e delle sue eccezioni, della presenza o assenza di parentela tra le lingue. Ma se in tali casi il principio statistico è stato utilizzato più o meno spontaneamente, in futuro ha iniziato ad essere applicato consapevolmente e già con una certa definizione degli obiettivi. Così, ai nostri tempi, si sono diffusi i cosiddetti dizionari di frequenza del vocabolario e delle espressioni delle singole lingue 6 5 o anche i significati delle parole multilingue con un "focus generale sulla realtà" 6 6. I dati di questi dizionari vengono utilizzati per compilare libri di testo in lingua straniera (i cui testi sono costruiti sul vocabolario più comunemente usato) e dizionari minimi. Il calcolo statistico ha trovato un uso linguistico speciale nel metodo della lessicostatistica o glottocronologia di M. Swadesh, dove, sulla base di formule statistiche che tengono conto dei casi di scomparsa di parole dalle lingue del fondo principale, è possibile stabilire la cronologia assoluta della divisione delle famiglie linguistiche 6 7 .

IN l'anno scorso i casi di applicazione di metodi matematici al materiale linguistico si sono moltiplicati in modo significativo e nella massa di tali tentativi sono state delineate direzioni più o meno definite. Giriamo<117>alla loro considerazione sequenziale, senza entrare nei dettagli.

Cominciamo con la direzione a cui è stato dato il nome di stilostatistica. Si tratta in questo caso della definizione e caratterizzazione dei tratti stilistici di singole opere o autori attraverso le relazioni quantitative degli elementi linguistici utilizzati. L'approccio statistico allo studio dei fenomeni stilistici si basa sulla comprensione dello stile letterario come un modo individuale di padroneggiare i mezzi del linguaggio. Allo stesso tempo, il ricercatore è completamente distratto dalla questione del significato qualitativo degli elementi linguistici numerabili, concentrando tutta la sua attenzione solo sul lato quantitativo; il lato semantico delle unità linguistiche studiate, il loro carico emotivo ed espressivo, nonché la loro partecipazione al tessuto di un'opera d'arte - tutto ciò rimane fuori conto, si riferisce ai cosiddetti fenomeni ridondanti. Così, un'opera d'arte appare sotto forma di un aggregato meccanico, la cui specificità costruttiva trova la sua espressione solo attraverso le relazioni numeriche dei suoi elementi. I rappresentanti della stilostatistica non chiudono un occhio davanti a tutte le circostanze rilevate, opponendo ai metodi della stilistica tradizionale, che indubbiamente includono elementi di soggettività, con un'unica qualità del metodo matematico, che, a loro avviso, compensa tutti i suoi difetti - l'obiettività dei risultati raggiunti. “Ci sforziamo”, scrive, ad esempio, V. Fuchs, “... di caratterizzare lo stile dell'espressione linguistica con mezzi matematici. A tal fine, dovrebbero essere creati metodi i cui risultati dovrebbero avere la stessa oggettività dei risultati delle scienze esatte ... Ciò suggerisce che, almeno inizialmente, ci occuperemo solo di qualità strutturali formali, e non del semantico contenuto delle espressioni linguistiche. Otterremo così un sistema di relazioni ordinali, che nel suo insieme sarà la base e il punto di partenza della teoria matematica dello stile” 6 8 .<118>

Il tipo più semplice di approccio statistico allo studio della lingua degli scrittori o delle singole opere è contare le parole utilizzate, poiché la ricchezza del dizionario, a quanto pare, dovrebbe caratterizzare in un certo modo l'autore stesso. Tuttavia, i risultati di tali calcoli danno risultati alquanto inaspettati al riguardo e non contribuiscono in alcun modo alla conoscenza estetica e alla valutazione di un'opera letteraria, che non è ultimo uno dei compiti della stilistica. Ecco alcuni dati sul numero totale di parole utilizzate in una serie di opere:

Bibbia (latino). . . . . . . . . . 5649 parole

Bibbia (ebraico). . . . 5642 parole

Demostene (discorso). . . . . . . . . . . . 4972 parole

Sallustio. . . . . . . . . . . . . . . . . 3394 parole

Orazio. . . . . . . . . . . . . . . . . . . .6084 parole

Dante (Divina Commedia) 5860 parole

(questo include 1615 nomi propri e nomi geografici)

Tasso (Orland furioso). . . . 8474 parole

Milton. . . . . . . . . . . . . . . . . . . . .8000 parole (circa dato)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 parole

(circa, secondo altre fonti 20.000 parole)

O. Jespersen fa notare che il dizionario di Zola, Kipling e Jack London supera notevolmente il dizionario di Milton, cioè il numero è 8000 6 9 . Il calcolo del dizionario dei discorsi del presidente degli Stati Uniti W. Wilson ha scoperto che è più ricco di quello di Shakespeare. A questo vanno aggiunti i dati degli psicologi. Pertanto, Terman, sulla base delle osservazioni di un gran numero di casi, ha scoperto che il vocabolario di un bambino medio è di circa 3600 parole, e all'età di 14 anni - già 9000. L'adulto medio usa 11700 parole e una persona di "maggiore intelligenza" fino a 13500 7 0 . Pertanto, tali dati numerici di per sé non forniscono alcun fondamento per identificare le qualità stilistiche delle opere e solo "oggettivamente" con<119>affermano l'uso di un numero diverso di parole da parte di autori diversi, che, come mostrano i calcoli di cui sopra, non è correlato al relativo valore artistico delle loro opere.

I calcoli della frequenza relativa dell'uso delle parole da parte dei singoli autori sono costruiti in modo leggermente diverso. In questo caso, non viene presa in considerazione solo la quantità totale di parole, ma anche la frequenza di utilizzo delle singole parole. L'elaborazione statistica del materiale così ottenuto consiste nel raggruppare in classi (o ranghi) parole con uguale frequenza d'uso, il che porta a stabilire la distribuzione di frequenza di tutte le parole usate da un dato autore. Un caso speciale di questo tipo di calcolo è la determinazione della frequenza relativa di parole speciali (ad esempio, il vocabolario romanzesco nelle opere di Chaucer, come è stato fatto da Mersand 7 1). La frequenza relativa delle parole utilizzate dagli autori contiene le stesse informazioni oggettive sullo stile dei singoli autori dei calcoli totali di cui sopra, con l'unica differenza che il risultato è dati numerici più accurati. Ma serve anche per datare singole opere dello stesso autore sulla base di un calcolo preliminare della frequenza relativa del suo uso delle parole in diversi periodi della sua vita (secondo opere datate dall'autore stesso). Un altro tipo di utilizzo dei dati provenienti da tali calcoli è stabilire l'autenticità della paternità di opere per le quali questa domanda sembra dubbia 7 2 . In quest'ultimo caso, tutto si basa su un confronto di formule statistiche per la frequenza d'uso in opere autentiche e controverse. Non c'è bisogno di parlare della grandissima relatività e approssimazione dei risultati ottenuti con tali metodi. Dopotutto, la relativa frequenza d'uso cambia non solo con l'età dell'autore, ma anche a seconda del genere, della trama e anche dell'ambiente storico dell'azione dell'opera (confronta, ad esempio, "Bread" e "Peter I" di A. Tolstoy).<120>

Approfondendo il metodo sopra descritto, la stilostatistica come caratteristica di stile cominciò a ricorrere al criterio della stabilità della frequenza relativa delle parole più comunemente usate. Il metodo utilizzato in questo caso può essere illustrato dall'elaborazione statistica del racconto di Pushkin "La figlia del capitano" di Esselson ed Epstein presso l'Istituto di lingue slave dell'Università di Detroit (USA) 7 3 . All'indagine è stato sottoposto l'intero testo del racconto (circa 30.000 occorrenze di parole), quindi brani contenenti circa 10.000 e 5.000 occorrenze. Inoltre, al fine di determinare la stabilità della frequenza relativa dell'uso delle parole, le 102 parole più comunemente usate (con una frequenza da 1160 volte a 35) sono state confrontate con la frequenza relativa calcolata (realizzata sulla base di passaggi selettivi) con quello reale. Ad esempio, l'unione "e" è stata usata 1.160 volte nel corso della storia. In un passaggio contenente 5.000 occorrenze di tutte le parole, questa congiunzione dovrebbe essere usata 5.000 x 1.160:30.000, o arrotondata per eccesso 193 volte, e in un passaggio contenente 10.000 occorrenze di tutte le parole, dovrebbe essere usata 10.000 x 1.160 : 30.000 o 386 volte. Il confronto dei dati ottenuti utilizzando questo tipo di calcoli con i dati effettivi mostra una deviazione molto lieve (entro il 5%). Sulla base di tali calcoli, si è scoperto che in questa storia di Pushkin, la preposizione "k" è usata due volte più spesso di "y", e il pronome "tu" è usato tre volte più spesso di "loro", ecc. , nonostante tutte le vicissitudini della trama, sia nel corso della storia che nelle sue singole parti, c'è una stabilità nella frequenza relativa dell'uso delle parole. Quanto osservato in relazione ad alcune parole (più comuni) è presumibilmente applicabile a tutte le parole utilizzate nell'opera. Ne consegue che lo stile dell'autore può essere caratterizzato da un certo rapporto tra la variabilità della frequenza media di utilizzo di una parola e la frequenza generale per una data lingua.<121>la frequenza del suo utilizzo. Questo rapporto è considerato come una caratteristica quantitativa oggettiva dello stile dell'autore.

Altri elementi formali della struttura linguistica vengono studiati in modo analogo. Così, ad esempio, V. Fuchs sottoponeva a una considerazione comparativo-statistica i caratteri metrici delle opere di Goethe, Rilke, Cesare, Sallustio, ecc.

Il criterio della stabilità della frequenza relativa dell'uso delle parole, pur chiarendo la tecnica della caratterizzazione quantitativa dello stile, non introduce nulla di fondamentalmente nuovo rispetto ai metodi più primitivi sopra analizzati. Tutti i metodi di stilostatistica alla fine producono risultati "oggettivi" ugualmente spassionati, scivolando sulla superficie della lingua e aggrappandosi solo a segni puramente esterni. I metodi quantitativi, a quanto pare, non sono in grado di mettere a fuoco le differenze qualitative nel materiale oggetto di studio e di fatto livellano tutti gli oggetti oggetto di studio.

Laddove è necessaria la massima specificazione, vengono offerti i criteri più generalizzati; le caratteristiche qualitative sono espresse nel linguaggio della quantità. Questa non è solo una contraddizione logica, ma anche un disaccordo con la natura delle cose. In effetti, cosa succede se proviamo a ottenere una caratteristica stilistica comparativa (cioè qualitativa) delle opere di Alexander Gerasimov e Rembrandt basata sul rapporto quantitativo della pittura rossa e nera sulle loro tele? Sembra essere un'assoluta assurdità. In che misura informazioni quantitative del tutto “oggettive” sui dati fisici di una persona sono in grado di darci un’idea di tutto ciò che caratterizza una persona e la rende vera essenza? Ovviamente nessuno. Possono servire solo come segno individuale che distingue una persona da un'altra, come un'impronta di circonvoluzioni sul pollice. La situazione è simile con le caratteristiche quantitative dello stile letterario. Se guardi da vicino, forniscono dati altrettanto scarsi per giudicare lo stile reale<122>qualità del linguaggio dell'autore, nonché una descrizione delle circonvoluzioni sul dito per lo studio della psicologia umana.

A quanto detto va aggiunto che in passato, nella cosiddetta scuola formale della critica letteraria, si era già tentato di studiare quantitativamente lo stile degli scrittori, quando epiteti, metafore ed elementi ritmico-melodici di versi sono stati contati. Tuttavia, questo tentativo non è stato ulteriormente sviluppato.

Un'altra area di applicazione dei metodi matematici per lo studio dei fenomeni linguistici può essere raggruppata sotto il nome di statistica linguistica. Cerca di intromettersi nelle questioni fondamentali della teoria del linguaggio e di ottenere così una vocazione nella propria sfera linguistica. Per conoscere questa direzione, è meglio rivolgersi al già citato lavoro di Herdan, nelle parole di uno dei suoi numerosi revisori, "un libro mostruosamente pretenzioso" 7 5 , ha ricevuto, tuttavia, un'ampia risposta tra i linguisti 7 6 . In considerazione del fatto che Kherdan (come già accennato in precedenza) ha cercato di raccogliere nel suo libro tutto ciò che è più significativo nel campo dell'applicazione dei metodi matematici ai problemi linguistici, nel suo libro si tratta in realtà non tanto di Kherdan quanto di un intero tendenza. Come mostra il titolo stesso del libro, “Language as Choice and Probability”, il suo obiettivo principale è chiarire cosa nella lingua è lasciato alla libera scelta del parlante e cosa è dovuto alla struttura immanente della lingua, proprio come sulla determinazione del rapporto quantitativo degli elementi del primo e del secondo ordine. Il libro di Kherdan fornisce informazioni quasi esaurienti su tutto il lavoro in quest'area svolto da rappresentanti di varie specialità.<123>(filosofi, linguisti, matematici, tecnici), ma non si limita a questo e comprende molte osservazioni, considerazioni e conclusioni originali dell'autore stesso. Come lavoro riassuntivo, dà una buona idea dei metodi quantitativi utilizzati e dei risultati raggiunti con il loro aiuto. Le domande che combiniamo condizionalmente nella sezione della statistica linguistica sono trattate nella seconda e quarta parte del libro.

Dei tanti casi di applicazione dei metodi della statistica matematica allo studio delle questioni linguistiche, ci concentreremo su quelli più generali, che allo stesso tempo possono essere considerati i più tipici. Utilizzo di dati di altri autori - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 e altri, oltre a citare i propri studi che determinano la frequenza relativa della distribuzione di fonemi, lettere, lunghezza delle parole (misurata dal numero di lettere e sillabe) , forme grammaticali ed elementi metrici in esametro latino e greco, Herdan stabilisce il fatto della stabilità della frequenza relativa degli elementi linguistici come caratteristica comune a tutte le strutture linguistiche. Ne deriva la seguente regola: “Le proporzioni degli elementi linguistici appartenenti all'uno o all'altro livello o sfera di codificazione linguistica - fonologia, grammatica, metrica - rimangono più o meno costanti per una data lingua, in un dato periodo del suo sviluppo e all'interno del limiti di osservazioni sufficientemente ampie e imparziali.» 8 2 . Questa regola, che Herdan chiama la legge fondamentale del linguaggio, cerca di interpretarla ed espanderla in un certo modo. "Egli", scrive Herdan a proposito di questa legge, "è un'espressione del fatto che anche qui, dove la volontà umana e la libertà di scelta sono concesse<124>il quadro più ampio, dove scelta consapevole e gioco spensierato si alternano vividamente, in generale c'è una notevole stabilità... nella grammatica, ma anche in relazione alla frequenza d'uso di specifici fonemi, unità lessicali (parole) e fonemi grammaticali e costruzioni; in altre parole, la somiglianza non sta solo in cosa si usa, ma anche in quanto spesso si usa” 8 3 . Questa situazione è dovuta a ragioni comprensibili, ma ciò dà origine a nuove conclusioni. Quando si esaminano diversi testi o segmenti di una data lingua, ad esempio, si scopre che le frequenze relative di utilizzo di un dato particolare fonema (o altri elementi del discorso) da parte di persone diverse rimangono sostanzialmente le stesse. Ciò porta all'interpretazione delle singole forme di discorso come alcune fluttuazioni nella probabilità costante di utilizzare il fonema considerato in una data lingua. Pertanto, risulta che nella sua attività linguistica una persona è soggetta a determinate leggi di probabilità in relazione al numero di elementi linguistici utilizzati. E poi, quando osserviamo un numero enorme di elementi linguistici in un grande insieme di testi o segmenti di discorso, abbiamo l'impressione di dipendenza causale nel senso che in questo caso c'è determinazione anche in relazione all'uso di alcuni elementi linguistici. In altre parole, risulta lecito affermare che ciò che sembra essere una relazione causale da un punto di vista intuitivo, è quantitativamente una probabilità 8 4 . È chiaro che maggiore è il totale<125>la specificità dei testi o dei segmenti del discorso esaminati, tanto più chiaramente si manifesterà la stabilità della frequenza relativa dell'uso degli elementi linguistici anche nell'uso individuale (legge dei grandi numeri). Da qui ne viene creato uno nuovo conclusione generale che la lingua è un fenomeno di massa e dovrebbe essere trattata come tale.

Queste conclusioni, raggiunte sulla base di calcoli di frequenza di elementi fonetici, parole e forme grammaticali, che insieme costituiscono una lingua, vengono poi applicate alla "interpretazione statistica" della divisione di Saussure in "lingua" (lalangue) e "discorso" (laparole ). Secondo Saussure, la "lingua" è un insieme di abitudini linguistiche che rendono possibile la comunicazione tra i membri di una data comunità linguistica. Questa è una realtà sociale, un "fenomeno di massa", obbligatorio per tutte le persone che parlano questa lingua. Herdan, come indicato, dimostra che i membri di una stessa comunità linguistica sono simili tra loro non solo perché usano gli stessi fonemi, unità lessicali e forme grammaticali, ma anche perché tutti questi elementi sono usati con la stessa frequenza. Pertanto, la sua definizione statistica di "lingua" assume la seguente forma: "lingua" (lalangue) è la totalità degli elementi linguistici comuni più la loro relativa probabilità di essere usati.

Questa definizione di "linguaggio" è anche il punto di partenza per la corrispondente interpretazione statistica del "discorso", che, secondo Saussure, è un enunciato individuale. Contrapponendo il “linguaggio” come fenomeno sociale al “discorso” come fenomeno individuale, Saussure scriveva: “Il discorso è un atto individuale di volontà e comprensione, in cui è necessario distinguere: 1. combinazioni con cui il soggetto parlante usa il linguaggio codice per esprimere il suo pensiero personale; 2. un meccanismo psicofisico che gli permetta di oggettivare queste combinazioni” 8 5 . Poiché la "lingua" nelle statistiche linguistiche è considerata come un insieme di elementi con un certo relativo<126>certa probabilità del loro uso, in quanto include la totalità statistica o insieme (popolazione) come la caratteristica più essenziale e può essere considerata in questo aspetto. In accordo con ciò, il "discorso" si trasforma in un campione separato prelevato dal "linguaggio" come aggregato statistico. La probabilità in questo caso è determinata dalla relazione tra "discorso" e "linguaggio" (nella loro comprensione "quantitativa"), e la distribuzione della frequenza relativa dell'uso di diversi elementi del linguaggio è interpretata come il risultato di un "scelta" collettiva (scelta) in un certo periodo cronologico dell'esistenza della lingua. Rendendosi conto che una tale interpretazione delle differenze tra “linguaggio” e “discorso” è comunque costruita su basi completamente diverse da quelle di Saussure, Herdan scrive a questo proposito: “Questa modifica apparentemente minore del concetto di Saussure ha l'importante conseguenza che “linguaggio” ) acquista ora una caratteristica essenziale sotto forma di aggregato statistico (popolazione). Questa popolazione è caratterizzata da determinate frequenze relative o probabilità di fluttuazione, il che significa che ogni elemento linguistico appartiene a un certo livello linguistico. In questo caso, "discorso" (laparole), secondo il suo significato, risulta essere un termine per definire campioni statistici tratti da "lingua" come popolazione statistica. Diventa ovvio che la scelta (scelta) appare qui sotto forma del rapporto tra "discorso" e "lingua", essendo il rapporto tra un campione preso a caso e un aggregato statistico (popolazione). L'ordine stesso della distribuzione delle frequenze, in quanto deposito dell'attività linguistica di una comunità linguistica nel corso dei secoli, è un elemento di scelta (scelta), ma non di scelta individuale, come nello stile, ma di scelta collettiva. Usando una metafora, possiamo parlare qui della scelta fatta dallo spirito della lingua, se intendiamo con ciò i principi della comunicazione linguistica, che sono conformi al complesso dei dati mentali dei membri di una particolare comunità linguistica. La stabilità delle serie è il risultato della probabilità (caso)» 8 6 .

Un caso particolare dell'applicazione del principio dichiarato<127>pa è la delimitazione nel linguaggio dei fenomeni normativi dalle "eccezioni" (deviazioni). Nelle statistiche linguistiche si sostiene che il metodo statistico consente di eliminare l'esistente questa edizione sfocatura e stabilire criteri chiari per distinguere tra questi fenomeni. Se la norma è intesa come una popolazione statistica (nel senso di cui sopra), e l'eccezione (o errore) è una deviazione dalle frequenze mostrate dalla popolazione statistica, allora si suggerisce una soluzione quantitativa della questione. Tutto si riduce a una relazione statistica tra "popolazione" e "valore anomalo". Se le frequenze osservate in un singolo campione si discostano dalle probabilità dovute alla popolazione statistica più di quanto è determinato da una serie di conteggi campionari, allora abbiamo motivo di concludere che la linea di demarcazione tra "la stessa" (norma) e "non lo stesso" (eccezione) è violato.

Le differenze quantitative tra "lingua" e "discorso" sono utilizzate anche per distinguere due tipi di elementi linguistici: grammaticali e lessicali. Il punto di partenza per risolvere questo problema, che presenta spesso grosse difficoltà dal punto di vista linguistico, è l'assunto che il grado di frequenza degli elementi grammaticali sia diverso da quello delle unità lessicali. Ciò è presumibilmente associato alla "generalizzazione" degli elementi grammaticali, al modo in cui differiscono dai concetti fissati dalle unità lessicali. Inoltre, gli elementi grammaticali sono presumibilmente, di regola, di volume molto più piccolo: come parole indipendenti (includono pronomi, preposizioni, congiunzioni e parole ufficiali) di solito consistono in un piccolo numero di fonemi, e sotto forma di "forme correlate" - di uno o due fonemi 8 7 . Più piccolo è l'elemento linguistico, meno la sua "lunghezza" (momento quantitativo) può servire come caratteristica distintiva, e più importante diventa la "qualità" dei fonemi a questo scopo. Quali metodi vengono proposti per risolvere il problema in esame? Si risolve facendo riferimento al concetto puramente quantitativo di grammaticale<128>caricare, "Supponiamo", scrive Herdan a questo proposito, "che ci interessa confrontare due lingue a questo riguardo. Come determiniamo con un certo grado di obiettività il "carico grammaticale" che porta una lingua? È chiaro che questo carico dipenderà dalla posizione della linea di demarcazione che separa la grammatica dal vocabolario. La prima considerazione che può venirci in mente è determinare quanto sia "complessa" la grammatica di una data lingua. Dopotutto, la "complessità" è una caratteristica qualitativa e il concetto di "carico grammaticale" è una caratteristica quantitativa. È vero, il carico in una certa misura dipende dalla complessità, ma non del tutto. Una lingua può essere ricompensata con una grammatica estremamente complessa, ma solo una parte relativamente piccola di essa viene utilizzata nell'attività della lingua. Definiamo "carico grammaticale" l'insieme della grammatica che una lingua porta quando è in azione, il che porta immediatamente il nostro problema nell'ambito della linguistica strutturale nel senso in cui la disciplina è stata definita da Saussure. Nella presentazione che segue, vengono utilizzati metodi quantitativi per determinare la differenza tra le lingue, a seconda di dove si trova il confine, separando la grammatica dal vocabolario” 8 8 . In altre parole, le differenze linguistiche in questo caso dovrebbero essere ridotte a differenze nelle relazioni numeriche tra elementi grammaticali e lessicali.

I materiali a nostra disposizione dipingono il quadro seguente. IN lingua inglese(sono state prese in considerazione solo le “parole grammaticali”: pronomi, o, come vengono anche chiamati, “sostituti”, preposizioni, congiunzioni e verbi ausiliari) in un segmento che comprende 78.633 casi di utilizzo di tutte le parole (1027 parole diverse), sono stati trovati 53.102 casi di utilizzo di elementi grammaticali, o, più precisamente, “parole grammaticali” (149 parole diverse), che è 67,53 % al 15,8 % parole diverse. Tali sono i dati di Deway 8 9 . Altri dati mostrano una percentuale diversa<129>rapporto: 57,1% con il 5,4% di parole diverse 9 0 . Questa significativa discrepanza è spiegata dalla differenza tra lingua scritta e parlata. Forme scritte le lingue (primo dato) presumibilmente usano più elementi grammaticali di quelli orali (secondo caso). Nella Divina Commedia di Dante (dopo l'originale italiano), Mariotti ha stabilito il 54,4% delle occorrenze di "parole grammaticali".

Un altro e, apparentemente, un modo più perfetto per determinare il carico grammaticale di una lingua è contare i fonemi inclusi negli elementi grammaticali. In questo caso, non vengono prese in considerazione solo le parole grammaticali indipendenti, ma anche le forme correlate. Qui sono possibili varie opzioni. Ad esempio, determinando la frequenza relativa dell'uso dei singoli fonemi consonantici negli elementi grammaticali e confrontandoli con la frequenza dell'uso totale di questi stessi fonemi (i dati finali di tale rapporto in inglese danno una proporzione del 99,9% a 100.000 - uso totale); o un simile confronto di consonanti secondo gruppi di classificazione separati (labiale, palatale, velare e altri fonemi). Il rapporto finale qui assume la forma di una proporzione del 56,47% (in elementi grammaticali) al 60,25% (in uso totale); o lo stesso confronto dei fonemi consonantici iniziali (in questo caso, il rapporto era 100,2% in parole grammaticali a 99,95 in uso totale). Sono possibili anche altre operazioni statistiche più complesse, che però si traducono in analoghe espressioni quantitative del problema in esame.

I dati quantitativi forniti servono come base per una conclusione generale. Si riduce al fatto che la distribuzione dei fonemi in elementi grammaticali determina la natura della distribuzione (in termini numerici, ovviamente) dei fonemi nella lingua nel suo insieme. E questo, a sua volta, ci permette di concludere che l'uso degli elementi grammaticali dipende in misura minima dalla scelta individuale e costituisce quella parte dell'espressione linguistica che è controllata dalle probabilità.<130>ness. Questa conclusione speculativa è confermata dal calcolo delle forme grammaticali in lingua russa, effettuato da Esselson 9 1 . Lo studio è stato sottoposto a 46896 parole tratte da II fonti (opere di Griboedov, Dostoevskij, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov e N. Ostrovsky). Erano divisi in parole colloquiali (17.756 parole o 37,9%) e non colloquiali (29140 parole o 62,1%). Quindi l'intero insieme di parole è stato suddiviso in 4 gruppi a seconda della loro natura grammaticale: il 1° gruppo comprendeva sostantivi, aggettivi, aggettivi in ​​funzione di sostantivi, pronomi e numerali flessi; nel 2 ° gruppo - verbi; nel 3 ° gruppo - participi verbali, participi in funzione di aggettivi e nomi e gerundi; nel 4 ° gruppo - forme invariabili di avverbi, preposizioni, congiunzioni e particelle. I risultati di sintesi (vengono fornite anche tabelle con i dati per i singoli autori) danno il seguente rapporto:

1° gruppo

2° gruppo

3° gruppo

4° gruppo

colloquiale

taciturno

Herdan caratterizza la considerazione dei dati quantitativi così ottenuti con le seguenti parole: “Essi giustificano la conclusione che gli elementi grammaticali dovrebbero essere considerati come un fattore che determina la verosimiglianza di un'espressione linguistica. Una tale conclusione evita l'onerosa qualificazione di ogni parola usata. È chiaro che, dal momento che la grammatica e il vocabolario non sono immagazzinati in involucri stagni, non lo sono nemmeno la pura "scelta" o il puro "caso". Sia la grammatica che il vocabolario contengono entrambi gli elementi, sebbene in proporzioni notevolmente variabili” 9 2 .<131>

Un'ampia sezione del libro di Herdan è dedicata allo studio della dualità o dualità nel linguaggio, e il concetto stesso di dualità si basa su caratteristiche matematiche.

Pertanto, i teoremi in geometria proiettiva possono essere disposti in due serie, in modo che ogni teorema di una serie possa essere ottenuto da qualche teorema di un'altra serie sostituendo le parole punto E Dritto. Ad esempio, se viene data un'affermazione: "qualsiasi punto diverso appartiene a una e una sola linea", allora possiamo ricavarne l'affermazione corrispondente: "due qualsiasi linea diversa appartengono a uno e solo un punto". Un altro metodo per determinare la dualità consiste nel tracciare lungo l'ascissa e l'asse y piani diversi fenomeno oggetto di studio. Così, come fa ad esempio Yul 9 3, in ascissa si contano le diverse frequenze d'uso, in ordinata il numero di unità lessicali di cui si determina la frequenza, ecc. interpretato, presumibilmente ugualmente applicabile alla ricerca linguistica.

Sotto il concetto di dualità così definito, che in tutti i casi ha in realtà il carattere di un codice binario e che è considerato anche il tratto più essenziale della struttura linguistica, vengono portati fenomeni di qualità estremamente diverse, che consentono l'opposizione su due piani : la distribuzione dell'uso delle parole secondo la natura delle unità lessicali e la distribuzione delle unità lessicali secondo la frequenza l'uso delle parole; forme di discorso scritte e orali; elementi lessicali e grammaticali; sinonimi e contrari; fonema e sua rappresentazione grafica; definibile e definente (significante e significante di Saussure), ecc.

Dopo uno studio quantitativo della dualità dell'uno o dell'altro fenomeno linguistico particolare o "testo" limitato, di norma si trae una conclusione, alla quale vengono attribuite le qualità dell'universalità linguistica. La natura di tali conclusioni e il modo in cui sono giustificate possono essere viste nell'esempio<132>studi sulla dualità della parola e del concetto (si tratta infatti del rapporto tra la lunghezza della parola e il volume del concetto - va tenuto presente che l'uso estremamente libero di termini linguistici e di altro tipo in tali opere spesso rendono molto difficile la comprensione). È importante notare che come materiale che è servito come fonte di osservazioni di questo tipo di dualità linguistica, sono stati utilizzati: la nomenclatura internazionale delle malattie (circa 1000 nomi) e il registro generale delle malattie in Inghilterra e Wells per il 1949 In questo caso si giunge alla seguente conclusione generale: “Ogni concetto che denota un'idea generale possiede ciò che può essere chiamato una "sfera" o un "volume". Permette attraverso il suo mezzo di pensare a molti oggetti o altri concetti che si trovano all'interno della sua "sfera". D'altra parte, tutti gli elementi necessari per definire un concetto costituiscono quello che viene chiamato il suo "contenuto". Volume e contenuto sono reciprocamente correlati: più piccolo è il contenuto e, di conseguenza, più astratto è il concetto, maggiore è la sua portata o volume, cioè più oggetti vengono portati sotto di esso. Ciò può essere visto come un'analogia (in ambito concettuale) con i principi della codifica, secondo i quali la lunghezza di un simbolo e la frequenza d'uso sono interdipendenti” 9 4 .

Il principio di dualità si applica anche a problemi particolari. Ad esempio, quando si stabilisce l'equivalenza dei significati di due parole lingue differenti. Come risultato dello studio del dizionario inglese-tedesco di Muret-Zanders utilizzando il metodo dell'iterazione matematica, si conclude che la probabilità di utilizzare una parola inglese con uno o più significati nella traduzione tedesca rimane costante per ogni lettera iniziale nell'intero dizionario 9 5 . La considerazione dell'ordine delle parole nei dizionari cinesi porta alla conclusione che è di natura tassonomica, poiché il numero di tratti nel carattere indica il suo posto (come radicale indipendente o una certa sottoclasse subordinata al radicale). La tassonomia è un principio subordinante di classificazione utilizzato in zoologia e botanica. Kherdan lo afferma<133>le basi della lessicografia cinese sono costruite anche sui principi della tassonomia 9 6, ecc.

Facendo una valutazione generale di quest'area di applicazione dei metodi matematici allo studio dei problemi linguistici (cioè della statistica linguistica), è necessario, a quanto pare, procedere dalla posizione formulata da Ettinger: “La matematica può essere efficacemente utilizzata al servizio della linguistica solo quando ai linguisti siano chiari i reali limiti della sua applicazione, nonché le possibilità dei modelli matematici utilizzati” 9 7 . In altre parole, si può parlare di linguistica matematica quando i metodi matematici dimostrano la loro idoneità a risolvere quei problemi linguistici veri e propri, che nel loro insieme costituiscono la scienza del linguaggio. In caso contrario, sebbene ciò possa aprire nuovi aspetti della ricerca scientifica, allora in questo caso puoi parlare di qualsiasi cosa, ma non di linguistica - in questo caso intendiamo no tipi diversi linguistica applicata (di cui parleremo più avanti) e linguistica scientifica o teorica. Sulla base di questa posizione, va notato che dal punto di vista di un linguista, molto nelle statistiche linguistiche è dubbioso e persino sconcertante.

Passiamo all'analisi di due soli esempi (per non ingombrare la presentazione), stabilendo che a ciascuno di essi possono essere mosse obiezioni molto significative. Qui abbiamo una distinzione quantitativa tra unità grammaticali e lessicali. Si scopre che per fare una tale distinzione è necessario sapere già in anticipo cosa appartiene al campo della grammatica e cosa al vocabolario, poiché il "carico grammaticale" della lingua (cioè la totalità degli elementi grammaticali usato nel discorso), come indicato sopra citato, "dipende dalla linea di demarcazione che separa il vocabolario dalla grammatica". Senza sapere dove si trova questa linea, è quindi impossibile tracciare la distinzione indicata. Qual è allora il significato del metodo quantitativo di distinguere il lessicale dalla grammatica?<134>matico? Tuttavia, per quanto riguarda Herdan, non pensa particolarmente a questo problema e classifica audacemente gli elementi linguistici, riferendosi agli elementi grammaticali "forme connesse", che, a giudicare dalla presentazione, dovrebbero essere intesi come inflessione esterna, e "parole grammaticali", che comprendono preposizioni, congiunzioni, verbi ausiliari e pronomi - questi ultimi in virtù del fatto che sono "sostituti". Ma se parliamo solo di questa qualità dei pronomi e su questa base li colleghiamo a elementi grammaticali, allora, ovviamente, dovrebbero essere attribuiti anche a loro parole come "summenzionato", "chiamato", "dato", ecc. come anche loro agiscono come deputati. In connessione con il metodo di separazione degli elementi grammaticali utilizzato nella statistica linguistica, sorge spontanea la questione di come affrontare in questo caso fenomeni grammaticali "non formali" come l'ordine delle parole, i toni, i morfemi zero, le relazioni paradigmatiche (alcuni di questi fenomeni , a proposito, trova riflesso in quelle lingue studiate con metodi matematici)? Come tracciare una distinzione in lingue con ricca inflessione interna (come, ad esempio, nelle lingue semitiche), dove non solo modifica grammaticalmente la radice (radicale), ma le dà anche esistenza lessicale, poiché la radice senza permutazioni ha nessuna reale esistenza nella lingua? Cosa si deve intendere per complessità grammaticale di una lingua, in base a quale criterio viene determinata? Se il punto quantitativo, che in questo caso è enfatizzato in ogni modo possibile, allora una delle lingue grammaticalmente più difficili sarà l'inglese, che ha costruzioni come Ishallhavebeencalling o Hewouldhavebeencalling. In queste frasi, solo la chiamata può essere classificata come lessicale, e tutto il resto, quindi, deve essere considerato grammaticale. Quali motivi esistono per collegare la frequenza d'uso degli elementi grammaticali con la generalità o l'astrattezza dei significati delle parole grammaticali? Dopotutto, è abbastanza ovvio che la frequenza relativamente ampia di utilizzo degli elementi grammaticali è determinata dalla loro funzione nella costruzione delle frasi, e per quanto riguarda l'astrattezza dei significati, è molto facile trovare una grande<135>il numero di elementi lessicali che possono facilmente competere con gli elementi grammaticali in questo senso, essendo largamente inferiori ad essi in frequenza (ad esempio, essere, esistenza, estensione, spazio, sostanza eccetera).

Un tipo simile di assurdità si presenta davanti a noi nel caso della definizione di dualità (dualità) della parola e del concetto. È necessario avere una comprensione estremamente peculiare dell'essenza strutturale della lingua per sottoporla a ricerche utilizzando la nomenclatura delle malattie e il registro ospedaliero delle malattie, che, come indicato sopra, è servito da materiale di partenza per importantissimi studi linguistici conclusioni. Senza soffermarsi sull'uso del tutto oscuro di termini che non hanno esistenza linguistica, come la sfera, il volume e il contenuto di un concetto (a proposito, il significato lessicale della parola e il concetto denotato dal termine scientifico sono grossolanamente confuso), passiamo alla conclusione che si fa in questo caso. Come affermato sopra, abbiamo a che fare con l'affermazione che "la portata e il contenuto sono reciprocamente correlati". L'intero corso del ragionamento che dà fondamento a tale conclusione, così come il metodo di operazione matematica dei fatti linguistici, mostra chiaramente che in questo caso viene completamente ignorata una qualità molto essenziale della lingua, che sconvolge tutti i calcoli che vengono eseguiti : la capacità di esprimere la stessa cosa "contenuto" per unità linguistiche di diverso "volume", che hanno indubbiamente, inoltre, diversa frequenza d'uso relativa. Quindi, possiamo designare la stessa persona di Petrov, un mio conoscente, lui, un moscovita, un giovane, un impiegato universitario, il fratello di mia moglie, un uomo che abbiamo incontrato sul ponte, ecc. si tratta senza dubbio solo di conclusioni private, alle quali però, come è stato rilevato, si attribuisce un significato universale, ma anche dell'opportunità di applicare gli stessi metodi quantitativi a tali problemi linguistici.

Ma a volte ai linguisti vengono offerte conclusioni la cui validità non è in dubbio. Questa è la "legge fondamentale del linguaggio", che consiste nel fatto che nella lingua c'è una certa stabilità dei suoi elementi e la relativa frequenza della loro menzione.<136>consumo. Il problema con questo tipo di scoperte, tuttavia, è che sono note da tempo ai linguisti. Dopotutto, è abbastanza ovvio che se la lingua non avesse una certa stabilità e ogni membro di una data comunità linguistica variasse liberamente gli elementi della lingua, allora la comunicazione reciproca non sarebbe possibile e l'esistenza stessa della lingua diventerebbe priva di significato . Per quanto riguarda la distribuzione della frequenza relativa dell'uso dei singoli elementi della lingua, ha trovato la sua espressione in linguistica sotto forma di assegnazione di categorie di vocabolario e grammatica passivi e attivi, a cui L. V. Shcherba ha prestato tanta attenzione. In questo caso, i metodi statistici possono solo aiutare i linguisti nella distribuzione di specifici elementi linguistici secondo le categorie della frequenza relativa del loro uso, ma non hanno motivo di pretendere di scoprire nuovi modelli che abbiano valore per la linguistica teorica.

D'altra parte, la statistica linguistica offre una serie di conclusioni veramente "originali" che sono estremamente indicative della natura del pensiero scientifico dei suoi aderenti. Pertanto, il "vocabolario politico" nelle opere di Churchill, Benes, Halifax, Stresemann e altri viene studiato con metodi statistici complessi e le traduzioni delle loro opere in inglese vengono utilizzate nei calcoli per autori non anglofoni. I risultati del calcolo sono presentati sotto forma di numerose tabelle, formule matematiche ed equazioni. L'interpretazione linguistica dei dati quantitativi in ​​questo caso si riduce al fatto che l'uso del "vocabolario politico" da parte di Churchill è il più tipico (?) per questo gruppo di autori e che l'uso delle parole da parte di Churchill nei casi in cui tratta questioni politiche è tipico del gruppo di lingua inglese 9 8 .

In un altro caso, dopo opportune manipolazioni statistiche, si conclude che Hitler ha violato la dualità tra "linguaggio" e "discorso" nel senso quantitativo di questi termini nell'uso della Germania nazista. Un caso speciale della distruzione di questa dualità è la comprensione letterale<137>svolte metaforiche (ad esempio, "versa sale nelle ferite aperte"). La Germania nazista si è bollata con così tanti atti disumani che non c'è quasi bisogno di condannarla per questa atrocità linguistica 9 9 . Secondo Kherdan, la definizione di Marx del linguaggio come realtà immediata del pensiero porta anche alla violazione della dualità linguistica, e la legge della dialettica sulla transizione di un fenomeno nel suo opposto è, a suo avviso, la legge linguistica fraintesa della dualità di lingua. Tali interpretazioni parlano da sole.

Infine, un difetto comune inerente a tutti i suddetti casi del metodo quantitativo di studiare il materiale linguistico e quindi di acquisire un carattere metodologico è l'approccio agli elementi linguistici come un insieme meccanico di fatti assolutamente indipendenti l'uno dall'altro, in conformità con il quale, se del caso o modelli, si riferiscono solo alle relazioni numeriche della distribuzione di fatti autonomi, al di fuori delle loro dipendenze sistemiche. È vero, J. Watmou cerca in ogni modo possibile di assicurare che sia la matematica a essere migliore di qualsiasi tipo di analisi strutturale linguistica, in grado di rivelare le caratteristiche strutturali di una lingua. “La matematica moderna”, scrive, “non si occupa di misurazione e calcolo, la cui accuratezza è limitata dalla loro stessa natura, ma principalmente di struttura. Questo è il motivo per cui la matematica è altamente favorevole all'accuratezza dell'apprendimento delle lingue - nella misura in cui una descrizione separata, anche di natura più limitata, non è in grado di ... Proprio come in fisica, gli elementi matematici sono usati per descrivere il mondo fisico, poiché si suppone corrispondano a elementi del mondo fisico, così in linguistica matematica si suppone che gli elementi matematici corrispondano agli elementi del mondo della parola” 101 . Ma una tale formulazione della domanda non salva affatto la situazione, poiché nella migliore delle ipotesi può farlo<138>dare un'analisi del linguaggio o come struttura fisica, che è ancora lungi dall'essere sufficiente per il linguaggio, e in ultima analisi ha ancora lo stesso carattere meccanicistico, o come struttura logico-matematica, e questo trasferisce il linguaggio su un piano diverso, e per molti aspetti gli è estraneo. Non è superfluo notare che Watmow prevede i successi della linguistica matematica solo nel futuro, e quanto ai loro effettivi risultati li valuta con le seguenti parole: “...quasi tutto il lavoro svolto fino ad oggi da Herdan, Zipf, Yul, Giro (Guiraux) e altri, non è affatto estraneo alla critica sia della linguistica che della matematica; sa in gran parte di dilettantismo” 103 . Pertanto, se non proviamo a prevedere il futuro dei metodi matematici nella ricerca linguistica, ma proviamo ad apprezzare ciò che abbiamo oggi, allora dovremo ammettere che la matematica è stata effettivamente limitata nel campo della linguistica solo a "misurare e contare ”, e non ho potuto fare un'analisi qualitativa della lingua, approfondendo la sua struttura.<139>

Cerchiamo di essere il più obiettivi possibile. In una certa parte, i dati quantitativi, apparentemente, possono essere utilizzati dalla linguistica, ma solo come ausiliari e principalmente in problemi che hanno un orientamento pratico. Per quanto riguarda la maggior parte dei metodi quantitativi di studio dei singoli fenomeni linguistici, la conclusione generale di R. Brown è senza dubbio giustificata: "Possono essere considerati come li considera Kherdan, ma qual è il significato di tutto questo?" 104 . Immaginiamo di porre la domanda: "Quali sono gli alberi in questo giardino?". E in risposta otteniamo: "Ci sono cento alberi in questo giardino". È questa la risposta alla nostra domanda e ha davvero senso? Ma per quanto riguarda molte domande linguistiche, i metodi matematici danno proprio queste risposte.

Tuttavia, esiste un ampio campo di attività di ricerca, utilizzando principalmente metodi matematici e allo stesso tempo orientandoli al materiale linguistico, dove l'opportunità di tale combinazione è fuori dubbio. Il "significato" di questa attività di ricerca, il suo significato è determinato dagli obiettivi a cui aspira. È già stato testato nella pratica. In questo caso si tratta dei problemi legati alla creazione di macchine informatiche, strutture per la traduzione automatica di scritti testi scientifici, automazione della traduzione del discorso orale da una lingua all'altra e con tutto il complesso di compiti che si combinano nelle questioni linguistiche della cibernetica. L'intero insieme di tali problemi viene generalmente chiamato con il nome generico di linguistica applicata. Pertanto, si distingue dalla cosiddetta linguistica matematica, che comprende quelle aree di lavoro che sono state designate sopra come stilostatistica e statistica linguistica, sebbene non eviti affatto l'elaborazione statistica del materiale linguistico. Forse la caratteristica più importante della linguistica applicata, che la separa dalla linguistica matematica, come delineato sopra, è che la prima ha la direzione opposta: non la matematica per la linguistica, ma la linguistica.<140>(formalizzato con metodi matematici) per una vasta gamma di problemi pratici.

Non è necessario divulgare il contenuto dei singoli problemi che sono ormai inclusi nell'area estremamente ampia della linguistica applicata. Contrariamente alla linguistica matematica, questi problemi sono discussi attivamente nella letteratura linguistica sovietica e iniziano giustamente ad occupare un posto sempre più importante nei problemi scientifici degli istituti di ricerca 105 . Pertanto, sono già ben noti alla nostra comunità linguistica. Questa circostanza, tuttavia, non ci esonera dalla necessità di sottoporli a riflessione, in particolare, dal punto di vista dei principi della scienza del linguaggio. Ciò contribuirà indubbiamente ad eliminare le incomprensioni che sempre più spesso sorgono tra esponenti di scienze molto distanti tra loro e che partecipano ai lavori sui problemi della linguistica applicata, e delineerà vie per la loro convergenza, da un lato , e la delimitazione delle aree di ricerca, dall'altro. Va da sé che le seguenti considerazioni rappresenteranno il punto di vista del linguista, ed è necessario che i matematici non solo cerchino di assimilarlo, ma, in relazione alle questioni sollevate, ne diano la loro interpretazione.

Il linguista-teorico non può in alcun modo accontentarsi del fatto che in tutti i casi<141>lingua per gli scopi fissati dalla linguistica applicata, la loro base è un modello matematico. In accordo con ciò, le osservazioni sui fenomeni del linguaggio e i risultati così ottenuti sono espressi in termini e concetti della matematica, cioè attraverso equazioni e formule matematiche. Facciamo un esempio per chiarezza. Condon 1 06 e Zipf 1 07 hanno stabilito che i logaritmi della frequenza ( F) le occorrenze di parole in un testo di grandi dimensioni si trovano quasi in linea retta, se sono correlate nel diagramma con i logaritmi di rango o rango ( R) di queste parole. L'equazione f=c:r, Dove Conè una costante riflette questa relazione nel senso limitato che c:r per valore impostato R riproduce la frequenza osservata con grande approssimazione. Relazione tra F E R, espresso da una formula matematica, è un modello per il rapporto tra i valori osservati della frequenza d'uso e il rango, o rango, delle parole. Questo è uno dei casi di modellazione matematica. 

L'intera teoria dell'informazione è interamente basata sul modello matematico del processo comunicativo sviluppato da C. Shannon 108 . È definita come "una disciplina matematica dedicata ai metodi di calcolo e stima della quantità di informazioni contenute in qualsiasi dato, e allo studio dei processi di memorizzazione e trasmissione delle informazioni" (TSB, vol. 51, p. 128). Di conseguenza, i concetti di base della teoria dell'informazione ricevono un'espressione matematica L'informazione è misurata in binit o unità binarie (un codice, che è paragonato a una lingua, con due segnali condizionali ugualmente probabili trasmette un'unità binaria di informazioni durante la trasmissione di ogni carattere ).-il codice e la quantità media di informazioni trasmesse<142>formazioni. La ridondanza è espressa come percentuale della capacità trasmissiva totale del codice”, 1 09 ecc. Allo stesso modo, la traduzione automatica richiede lo sviluppo algoritmico della mappatura di elementi di una lingua in un'altra, ecc. 1 10 . Questi sono altri casi di modellazione.

L'uso di modelli privi di significato può essere di grande aiuto, in particolare, con ogni probabilità, nella soluzione dei problemi che la linguistica applicata si pone. Tuttavia, per la linguistica teorica, è molto importante che un modello astratto, di regola, non riproduca tutte le caratteristiche di un fenomeno reale, tutte le sue qualità funzionali. Quindi, un architetto, prima di costruire una casa, può realizzare il suo modello, che riproduce nei minimi dettagli la casa che si sta progettando, e questo lo aiuta a risolvere una serie di problemi pratici legati alla costruzione della casa stessa. Ma un tale modello di casa, per quanto accurato possa essere, è privo di quella "funzione" e di quello scopo per cui tutte le case sono generalmente costruite - non è in grado di fornire alloggio a una persona. La situazione è simile con la lingua, dove il modello non è sempre in grado di riprodurre tutte le sue qualità. In questo caso, la questione è ulteriormente complicata dal fatto che per costruire il modello vengono utilizzati criteri non linguistici, ma matematici. “I modelli matematici ... - scrive A. Ettinger, - svolgono un ruolo estremamente importante in tutte le aree della tecnologia, ma poiché sono uno strumento di sintesi, il loro significato per la linguistica, che è principalmente una disciplina storica e descrittiva, è naturalmente limitato ” 1 11 .<143>

La modellazione matematica di una lingua è in realtà applicabile solo al suo stato statico, che è condizionale per un linguista e di fatto è in diretto conflitto con la qualità fondamentale di una lingua, la cui stessa forma di esistenza è lo sviluppo. Va da sé che lo studio statico di una lingua non è affatto escluso dalla linguistica e costituisce la base per la compilazione di grammatiche e dizionari normativi, grammatiche descrittive, grammatiche pratiche e dizionari che servono da guida per lo studio pratico delle lingue straniere, ecc. Tuttavia, in tutti questi lavori, che sono prevalentemente applicati in natura, i linguisti limitano consapevolmente il campo di ricerca e non chiudono in alcun modo gli occhi su altri aspetti della lingua 1 12 . Con un esame statico della lingua, in particolare, tali qualità della lingua associate alla sua natura dinamica, come la produttività, la dipendenza dalle forme di pensiero e l'ampia interazione con fattori culturali, sociali, politici, storici e di altro tipo, scompaiono completamente da campo visivo del ricercatore. Solo sul piano sincronico il linguaggio può essere considerato come un sistema di segni o codici convenzionali, che però si rivela del tutto ingiustificato non appena si adotta un punto di vista dinamico più adatto al linguaggio. È nei processi di sviluppo che si sviluppano qualità linguistiche come la motivazione, la polisemia delle parole che non hanno confini stabili, la non autonomia del significato di una parola e del suo involucro sonoro, il potenziale creativo di una parola associato al contesto manifestato, e tutto ciò è in netta contraddizione con le caratteristiche principali di un codice o di un segno 1 13 . Ovviamente, in linguistica applicata, si può pensare anche a tutte queste qualità della lingua e, ai fini pratici, accontentarsi, per così dire, di una “istantanea” della lingua, capace comunque di dare un'idea abbastanza approssimativa di il meccanismo del suo funzionamento.<144>nirovaniya. Tuttavia, ciascuna di queste "istantanee", se considerata come un fatto del linguaggio, e non come un fatto di un sistema di codici convenzionali, deve essere inclusa nell'infinito processo di movimento in cui il linguaggio esiste sempre 1 14 . Non può essere studiato al di fuori delle condizioni concrete che caratterizzano questo movimento, che lascia il segno dato stato linguaggio e condizionando la potenza del suo ulteriore sviluppo. Qui c'è la stessa differenza che c'è tra una fotografia momentanea di una persona e il suo ritratto dipinto con un pennello. vero artista. Nell'opera dell'artista abbiamo davanti a noi un'immagine generalizzante di una persona in tutta l'originalità non solo del suo aspetto fisico, ma anche del suo contenuto spirituale interiore. Da un ritratto artistico possiamo anche leggere il passato della persona raffigurata su di esso e determinare di cosa è capace nelle sue azioni. E un'istantanea, sebbene capace di dare un'immagine più precisa dell'aspetto dell'originale, è priva di queste qualità e spesso cattura sia un brufolo accidentale che è saltato sul naso sia<145>una posa o un'espressione completamente insolita, che alla fine porta a una distorsione dell'originale.

Va notato che il metodo delle "istantanee" può, ovviamente, essere applicato ai fatti dello sviluppo del linguaggio. Ma in questo caso, in realtà, ci occuperemo solo di stati separati della lingua, che, nella loro caratterizzazione quantitativa, risultano essere collegati non più di una caratterizzazione quantitativa comparativa di lingue diverse. Questo tipo di "dinamica" quantitativa non conterrà nulla di organico, e la connessione tra i singoli stati della lingua poggerà solo sul confronto delle relazioni numeriche. Se anche in questo caso si ricorre a un'analogia, allora si può fare riferimento alla crescita del bambino. Il suo sviluppo, ovviamente, può essere rappresentato sotto forma di dinamica di dati numerici sul suo peso, altezza, rapporti mutevoli del volume delle parti del suo corpo, ma tutti questi dati sono assolutamente distaccati da tutto ciò che costituisce principalmente l'essenza individuale di una persona - il suo carattere, inclinazioni, abitudini. , sapori, ecc.

Un altro lato negativo della "modellazione" matematica della lingua è il fatto che non può servire come principio generale sulla base del quale è possibile effettuare una descrizione completa ed esaustiva - sistematica della lingua. Solo un approccio matematico ai fenomeni del linguaggio, ad esempio, non consentirà di rispondere nemmeno a domande così fondamentali (senza le quali l'esistenza stessa della scienza del linguaggio è impensabile), come: cos'è il linguaggio, quali fenomeni dovrebbero essere classificati come linguistici propri, come si definisce una parola o una frase, quali sono i concetti e le categorie di base del linguaggio, ecc. Prima di passare ai metodi matematici di studio del linguaggio, è necessario avere già delle risposte (anche sotto forma di ipotesi) a tutte queste domande in anticipo. Non c'è bisogno di chiudere un occhio sul fatto che in tutti i casi a noi noti dello studio dei fenomeni linguistici con metodi matematici, tutti questi concetti e categorie dovevano inevitabilmente essere accettati così come erano definiti dai tradizionali o, relativamente parlando, metodi qualitativi.

Questa caratteristica dei metodi matematici nella loro applicazione linguistica fu notata da Spang-Hanssen quando pi greco<146>sal: “Va tenuto presente che i fatti osservati che ricevono un'espressione quantitativa ... non hanno valore se non fanno parte della descrizione, e ai fini linguistici dovrebbe essere una descrizione sistematica, strettamente correlata a una descrizione linguistica qualitativa descrizione e teoria” 1 15 . In un altro discorso di Spang-Hanssen troviamo un chiarimento di questa idea: “Finché non sarà dimostrata la possibilità di costruire un sistema quantitativo, e fintanto che esiste un sistema qualitativo generalmente accettato per un dato campo di studio, calcoli di frequenza e altri caratteristiche numeriche dal punto di vista linguistico non hanno alcun senso" 1 16 . Idee simili sono espresse da Uldall, collegandole in qualche modo inaspettatamente con lo sviluppo dei fondamenti teorici generali della glossematica: “Quando un linguista considera o misura tutto ciò che considera e misura, non è esso stesso determinato quantitativamente; per esempio, le parole, quando vengono contate, sono definite, se lo sono affatto, in termini del tutto diversi.<147>

Pertanto, risulta che sia in termini teorici che nella loro applicazione pratica, i metodi matematici dipendono direttamente da concetti e categorie linguistici definiti da metodi tradizionali, filologici o, come accennato in precedenza, qualitativi. In termini di linguistica applicata, è importante rendersi conto di questa dipendenza e, di conseguenza, conoscere la totalità delle principali categorie della linguistica tradizionale.

È vero, non c'è motivo di rimproverare ai rappresentanti delle scienze esatte che lavorano nel campo della linguistica applicata di non aver utilizzato i dati della linguistica moderna. Ciò non corrisponde allo stato effettivo delle cose. Non solo conoscono perfettamente, ma usano anche ampiamente nel loro lavoro i sistemi di caratteristiche differenziali stabiliti dai linguisti che sono caratteristici delle diverse lingue, la distribuzione e la disposizione degli elementi linguistici all'interno di sistemi linguistici specifici, i risultati della fonetica acustica, ecc. in questo caso è necessaria una riserva molto significativa. In effetti, i rappresentanti delle scienze esatte utilizzano i dati di una sola direzione in linguistica: la cosiddetta linguistica descrittiva, che si è deliberatamente distinta dai problemi tradizionali della linguistica teorica, lungi dal coprire l'intero campo della ricerca linguistica, da una vera e propria dal punto di vista linguistico, presenta notevoli carenze metodologiche, che l'hanno portata alla crisi recentemente rivelata 1 18 , e, inoltre, ha un orientamento puramente pratico, corrispondente agli interessi della linguistica applicata. Alla linguistica descrittiva valgono tutte le riserve ei rimproveri che sono stati fatti sopra alla considerazione statica del linguaggio. Un simile approccio unilaterale della linguistica descrittiva può, il ricercatore<148>Tuttavia, può essere giustificato solo dai compiti che la linguistica applicata si pone, ma è lungi dall'esaurire l'intero contenuto della scienza del linguaggio.

Nel processo di sviluppo di questioni di linguistica applicata, possono sorgere nuovi problemi teorici, e di fatto sono già sorti. Alcuni di questi problemi sono strettamente correlati ai compiti specifici della linguistica applicata e mirano a superare le difficoltà che sorgono nella risoluzione di questi problemi. Altri problemi sono direttamente correlati alla linguistica teorica, consentendo una nuova prospettiva sulle idee tradizionali o aprendo nuove aree di ricerca linguistica, nuovi concetti e teorie. Tra questi ultimi, ad esempio, c'è il problema della creazione di un linguaggio "macchina" (o linguaggio intermedio), che è il più strettamente correlato a un insieme complesso di questioni cardinali della linguistica teorica come la relazione di concetti e significati lessicali, logica e grammatica, diacronia e sincronia, la natura segnica della lingua, l'essenza del significato linguistico, i principi di costruzione delle lingue artificiali, ecc. 1 19 . In questo caso, è particolarmente importante stabilire la comprensione reciproca e il commonwealth nel lavoro comune dei rappresentanti delle discipline linguistiche e delle scienze esatte. Per quanto riguarda il lato linguistico, in questo caso, a quanto pare, non si dovrebbe parlare di limitare già in anticipo gli sforzi, ad esempio, dei progettisti di macchine di traduzione” e di provare a stabilire le capacità lavorative di tali macchine con i versi di N. Gribachev o la prosa di V. Kochetov 1 20 . La macchina stessa troverà i limiti delle sue capacità e la redditività - i limiti del suo utilizzo. Ma i linguisti, come loro contributo alla causa comune, devono portare la loro conoscenza delle caratteristiche della struttura della lingua, della sua versatilità, delle relazioni intersecanti interne dei suoi elementi, così come delle connessioni ampie e multilaterali del linguaggio con il fisico, fisiologico , mentale e logico<149>fenomeni mi, modelli specifici di funzionamento e sviluppo del linguaggio. La totalità di questa conoscenza è necessaria ai progettisti delle macchine corrispondenti per non vagare in direzioni sbagliate, ma per rendere la ricerca mirata e chiaramente orientata. Anche quello è molto breve recensione casi di applicazione di metodi matematici a problemi linguistici, che è stato fatto in questo saggio, convince che tale conoscenza non sarà affatto superflua per i rappresentanti delle scienze esatte.

Sulla base di tutte le precedenti considerazioni, si può ovviamente giungere ad alcune conclusioni generali.

Quindi, linguistica matematica? Se ciò significa l'uso di metodi matematici come chiave universale per risolvere tutti i problemi linguistici, allora tali affermazioni dovrebbero essere riconosciute come assolutamente ingiustificate. Tutto ciò che è stato fatto in questa direzione ha finora fatto poco o niente per risolvere i tradizionali problemi della scienza del linguaggio. Nel peggiore dei casi, l'applicazione di metodi matematici è accompagnata da ovvie assurdità o, dal punto di vista linguistico, è assolutamente priva di significato. Nel migliore dei casi, i metodi matematici possono essere utilizzati come metodi ausiliari della ricerca linguistica, essendo posti al servizio di problemi linguistici specifici e limitati. In questo caso non si può parlare di alcuna "filosofia quantitativa del linguaggio". La fisica, la psicologia, la fisiologia, la logica, la sociologia e l'etnologia nel loro tempo hanno invaso l'indipendenza della scienza del linguaggio, ma non hanno potuto soggiogare la linguistica. È accaduto il contrario: la linguistica ha approfittato dei risultati di queste scienze e, nella misura necessaria per se stessa, ha iniziato a utilizzare il loro aiuto, arricchendo così l'arsenale dei suoi metodi di ricerca. Ora, a quanto pare, è il turno della matematica. È auspicabile che questa nuova comunità contribuisca anche al rafforzamento della scienza del linguaggio, al miglioramento dei suoi metodi di lavoro e all'aumento della loro diversità. È quindi altrettanto legittimo parlare di linguistica matematica come di linguistica fisica, linguistica fisiologica, linguistica logica, linguistica psicologica, e<150>ecc. Non esiste una linguistica del genere, esiste solo una linguistica, che utilizza proficuamente i dati di altre scienze come strumenti di ricerca ausiliari. Pertanto, non c'è motivo di ritirarsi davanti all'assalto della nuova scienza e di cedere facilmente ad essa le posizioni che ha conquistato. Qui è molto appropriato ricordare le parole di A. Martinet: “Forse si è tentati di unire l'uno o l'altro grande movimento di pensiero usando alcuni termini ben scelti, o dichiarare con qualche formula matematica il rigore del proprio ragionamento. Tuttavia, è giunto il momento per i linguisti di realizzare l'indipendenza della loro scienza e di liberarsi da quel complesso di inferiorità che li fa associare a qualsiasi loro azione con l'uno o l'altro principio scientifico generale, per cui i contorni della realtà diventano sempre solo più vago, invece di diventare più chiaro 21 .

Dunque matematica in sé e linguistica in sé. Ciò non esclude affatto la loro reciproca assistenza o un incontro amichevole nel lavoro congiunto su problemi comuni. Questo tipo di luogo di applicazione degli sforzi concertati delle due scienze è l'intera vasta gamma di problemi che fanno parte della linguistica applicata e sono di grande importanza economica nazionale. Si dovrebbe solo desiderare che nel loro lavoro congiunto entrambe le scienze abbiano mostrato la massima comprensione reciproca, che, senza dubbio, contribuirebbe anche alla massima fecondità della loro cooperazione.<151>

Sommario
introduzione
Capitolo 1. La storia dell'applicazione dei metodi matematici in linguistica
1.1. La formazione della linguistica strutturale a cavallo tra XIX e XX secolo
1.2. Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento
Conclusione
Letteratura
introduzione
Nel XX secolo, c'è stata una continua tendenza all'interazione e alla compenetrazione di vari campi del sapere: i confini tra le singole scienze si stanno gradualmente sfumando; ci sono sempre più rami dell'attività mentale che sono "all'incrocio" della conoscenza umanitaria, tecnica e delle scienze naturali.
Un'altra caratteristica evidente della modernità è il desiderio di studiare le strutture ei loro elementi costitutivi. Pertanto, sempre più posto in teoria scientifica e in pratica è dato alla matematica. Entrando in contatto, da un lato, con la logica e la filosofia, dall'altro, con la statistica (e, di conseguenza, con le scienze sociali), la matematica penetra sempre più in profondità in quegli ambiti che per lungo tempo sono stati considerati puramente "umanitari", ampliando il loro potenziale euristico (la risposta alla domanda "quanto" spesso aiuta a rispondere alle domande "cosa" e "come"). La linguistica non ha fatto eccezione, il mio obiettivo tesina- evidenziare brevemente la connessione tra la matematica e un ramo della linguistica come la linguistica. Dagli anni '50, la matematica è stata utilizzata in linguistica per creare un apparato teorico per descrivere la struttura delle lingue (sia naturali che artificiali). Tuttavia, va detto che non ha trovato subito la sua specie. uso pratico. Inizialmente, i metodi matematici in linguistica iniziarono ad essere utilizzati per chiarire i concetti di base della linguistica, tuttavia, con lo sviluppo della tecnologia informatica, tale premessa teorica iniziò ad essere applicata nella pratica. La risoluzione di compiti come la traduzione automatica, il recupero automatico delle informazioni, l'elaborazione automatica del testo richiedeva un approccio fondamentalmente nuovo alla lingua. Una domanda è sorta davanti ai linguisti: come imparare a rappresentare i modelli linguistici nella forma in cui possono essere applicati direttamente alla tecnologia. Il termine "linguistica matematica", popolare ai nostri tempi, si riferisce a qualsiasi ricerca linguistica che utilizza metodi esatti (e il concetto di metodi esatti nella scienza è sempre strettamente correlato alla matematica). Alcuni scienziati degli anni passati ritengono che l'espressione stessa non possa essere elevata al rango di termine, poiché non significa alcuna "linguistica" speciale, ma solo una nuova direzione focalizzata sul miglioramento, l'aumento dell'accuratezza e l'affidabilità dei metodi di ricerca linguistica. La linguistica utilizza metodi sia quantitativi (algebrici) che non quantitativi, il che la avvicina alla logica matematica e, di conseguenza, alla filosofia e persino alla psicologia. Anche Schlegel ha notato l'interazione tra linguaggio e coscienza, e il linguista di spicco dell'inizio del XX secolo, Ferdinand de Saussure (racconterò in seguito della sua influenza sullo sviluppo dei metodi matematici in linguistica), ha collegato la struttura della lingua con la sua appartenenza alle persone. Il ricercatore moderno L. Perlovsky va oltre, identificando le caratteristiche quantitative della lingua (ad esempio, il numero di sessi, casi) con le peculiarità della mentalità nazionale (maggiori informazioni su questo nella sezione 2.2, "Metodi statistici in linguistica").
L'interazione tra matematica e linguistica è un argomento poliedrico e nel mio lavoro non mi soffermerò su tutto, ma, prima di tutto, sui suoi aspetti applicati.
Capitolo I. Storia dell'applicazione dei metodi matematici in linguistica
1.1 La formazione della linguistica strutturale a cavallo tra il XIX e il XX secolo
La descrizione matematica del linguaggio si basa sull'idea del linguaggio come meccanismo, risalente al famoso linguista svizzero del primo Novecento, Ferdinand de Saussure.
Il collegamento iniziale del suo concetto è la teoria del linguaggio come sistema costituito da tre parti (lingua stessa - langue, discorso - parole e attività linguistica - langage), in cui ogni parola (membro del sistema) è considerata non in sé , ma in connessione con gli altri. ...


Superiore