La storia dell'applicazione dei metodi matematici in linguistica. Riflessioni sull'interazione tra linguistica e matematica

La formazione della linguistica strutturale a cavallo tra il XIX e il XX secolo. Metodi statistici nell'apprendimento delle lingue. Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento. Apprendimento della lingua con metodi di logica formale. Caratteristiche della traduzione automatica.

INTRODUZIONE

Capitolo 1. La storia dell'applicazione dei metodi matematici in linguistica

1.1. La formazione della linguistica strutturale a cavallo tra XIX e XX secolo

1.2. Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento

Capitolo 2. Esempi selezionati dell'uso della matematica in linguistica

2.1. Traduzione automatica

2.2.Metodi statistici nell'apprendimento delle lingue

2.3. Imparare una lingua con metodi di logica formale

2.4. Prospettive per l'applicazione dei metodi matematici in linguistica

Conclusione

Letteratura

Appendice 1. Ronald Schleifer. Ferdinando di Saussure

Appendice 2. Ferdinand de Saussure (traduzione)

INTRODUZIONE

Nel XX secolo c'è stata una tendenza continua verso l'interazione e la compenetrazione di vari campi della conoscenza. I confini tra le singole scienze si sfumano gradualmente; ci sono sempre più rami dell'attività mentale che sono "all'incrocio" della conoscenza umanitaria, tecnica e delle scienze naturali.

Un'altra caratteristica evidente della modernità è il desiderio di studiare le strutture ei loro elementi costitutivi. Pertanto, un posto crescente, sia nella teoria scientifica che nella pratica, è dato alla matematica. Entrando in contatto, da un lato, con la logica e la filosofia, dall'altro, con la statistica (e, di conseguenza, con le scienze sociali), la matematica penetra sempre più in profondità in quegli ambiti che per lungo tempo sono stati considerati puramente "umanitari", ampliando il loro potenziale euristico (la risposta alla domanda "quanto" spesso aiuta a rispondere alle domande "cosa" e "come"). La linguistica non ha fatto eccezione.

Lo scopo del mio corso è di evidenziare brevemente la connessione tra la matematica e un ramo della linguistica come la linguistica. Dagli anni '50, la matematica è stata utilizzata in linguistica per creare un apparato teorico per descrivere la struttura delle lingue (sia naturali che artificiali). Allo stesso tempo, va detto che non ha trovato immediatamente per sé un'applicazione così pratica. Inizialmente, i metodi matematici in linguistica iniziarono ad essere utilizzati per chiarire i concetti di base della linguistica, tuttavia, con lo sviluppo della tecnologia informatica, tale premessa teorica iniziò a trovare applicazione nella pratica. La risoluzione di compiti come la traduzione automatica, il recupero automatico delle informazioni, l'elaborazione automatica del testo richiedeva un approccio fondamentalmente nuovo alla lingua. I linguisti hanno affrontato la questione: come imparare a rappresentare i modelli linguistici nella forma in cui possono essere applicati direttamente alla tecnologia. Il termine "linguistica matematica", popolare ai nostri tempi, si riferisce a qualsiasi ricerca linguistica che utilizza metodi esatti (e il concetto di metodi esatti nella scienza è sempre strettamente correlato alla matematica). Alcuni scienziati degli ultimi anni ritengono che l'espressione stessa non possa essere elevata al rango di termine, poiché non significa alcuna "linguistica" speciale, ma solo una nuova direzione focalizzata sul miglioramento, l'aumento dell'accuratezza e l'affidabilità dei metodi di ricerca linguistica . La linguistica utilizza metodi sia quantitativi (algebrici) che non quantitativi, il che la avvicina alla logica matematica e, di conseguenza, alla filosofia e persino alla psicologia. Anche Schlegel ha notato l'interazione tra linguaggio e coscienza, e Ferdinand de Saussure, un eminente linguista dell'inizio del XX secolo (racconterò più avanti della sua influenza sullo sviluppo dei metodi matematici in linguistica), ha collegato la struttura della lingua con la sua appartenenza alle persone. Il ricercatore moderno L. Perlovsky va oltre, identificando le caratteristiche quantitative della lingua (ad esempio, il numero di sessi, casi) con le peculiarità della mentalità nazionale (maggiori informazioni su questo nella sezione 2.2, "Metodi statistici in linguistica").

L'interazione tra matematica e linguistica è un argomento poliedrico e nel mio lavoro non mi soffermerò su tutto, ma, prima di tutto, sui suoi aspetti applicati.

Capitolo IStoria dell'applicazione dei metodi matematici in linguistica

1.1 Formazione della linguistica strutturalea cavallo tra il XIX e il XX secolo

La descrizione matematica del linguaggio si basa sull'idea del linguaggio come meccanismo, che risale al famoso linguista svizzero del primo Novecento, Ferdinand de Saussure.

Il collegamento iniziale del suo concetto è la teoria del linguaggio come sistema costituito da tre parti (il linguaggio stesso è lingua, discorso - parola d'ordine e l'attività vocale - lingua), in cui ogni parola (membro del sistema) è considerata non in sé, ma in connessione con altri membri. Come notò in seguito un altro eminente linguista, il danese Louis Hjelmslev, Saussure "fu il primo a richiedere un approccio strutturale al linguaggio, cioè una descrizione scientifica del linguaggio registrando le relazioni tra le unità".

Comprendendo la lingua come una struttura gerarchica, Saussure fu il primo a porre il problema del valore e del significato delle unità linguistiche. Fenomeni ed eventi separati (diciamo, la storia dell'origine delle singole parole indoeuropee) dovrebbero essere studiati non da soli, ma in un sistema in cui sono correlati con componenti simili.

L'unità strutturale del linguaggio di Saussure considerava la parola, "segno", in cui si univano suono e significato. Nessuno di questi elementi esiste l'uno senza l'altro: quindi, il madrelingua comprende le varie sfumature del significato di una parola polisemantica come un elemento separato nell'insieme strutturale, nella lingua.

Così, nella teoria di F. de Saussure si può vedere l'interazione della linguistica, da un lato, con la sociologia e la psicologia sociale (va notato che allo stesso tempo si stanno sviluppando la fenomenologia di Husserl, la psicoanalisi di Freud, la teoria della relatività di Einstein , sperimentazioni su forma e contenuto in letteratura, musica e belle arti), dall'altro, con la matematica (il concetto di sistemicità corrisponde al concetto algebrico di linguaggio). Tale concetto ha cambiato il concetto di interpretazione linguistica in quanto tale: i fenomeni hanno cominciato a essere interpretati non in relazione alle cause del loro verificarsi, ma in relazione al presente e al futuro. L'interpretazione ha cessato di essere indipendente dalle intenzioni di una persona (nonostante il fatto che le intenzioni possano essere impersonali, "inconsce" nel senso freudiano del termine).

Il funzionamento del meccanismo linguistico si manifesta attraverso l'attività linguistica dei madrelingua. Il risultato del discorso sono i cosiddetti "testi corretti" - sequenze di unità vocali che obbediscono a determinati schemi, molti dei quali consentono una descrizione matematica. La teoria dei modi per descrivere la struttura sintattica si occupa dello studio dei metodi per la descrizione matematica di testi corretti (principalmente frasi). In una tale struttura, le analogie linguistiche sono definite non con l'aiuto delle loro qualità intrinseche, ma con l'aiuto di relazioni di sistema ("strutturali").

In Occidente, le idee di Saussure sono sviluppate dai giovani contemporanei del grande linguista svizzero: in Danimarca - L. Hjelmslev, da me già citato, che ha dato origine alla teoria algebrica del linguaggio nella sua opera "Fondamenti di teoria linguistica", in negli Stati Uniti - E. Sapir, L. Bloomfield, C. Harris, nella Repubblica Ceca - lo scienziato emigrato russo N. Trubetskoy.

Le regolarità statistiche nello studio del linguaggio iniziarono ad essere affrontate nientemeno che dal fondatore della genetica, Georg Mendel. Fu solo nel 1968 che i filologi scoprirono che, negli ultimi anni della sua vita, era affascinato dallo studio dei fenomeni linguistici con i metodi della matematica. Mendel ha portato questo metodo alla linguistica dalla biologia; negli anni '90, solo i linguisti ei biologi più audaci rivendicavano la fattibilità di tale analisi. Negli archivi del monastero di S. Tomasz a Brno, il cui abate era Mendel, sono stati trovati fogli con colonne di cognomi terminanti in "mann", "bauer", "mayer", e con alcune frazioni e calcoli. Nel tentativo di scoprire le leggi formali dell'origine dei cognomi, Mendel fa calcoli complessi, in cui tiene conto del numero di vocali e consonanti nella lingua tedesca, del numero totale di parole che considera, del numero di cognomi, eccetera.

Nel nostro paese, la linguistica strutturale ha iniziato a svilupparsi all'incirca nello stesso periodo dell'Occidente, a cavallo tra il XIX e il XX secolo. Contemporaneamente a F. de Saussure, il concetto di lingua come sistema è stato sviluppato nelle loro opere dai professori dell'Università di Kazan F.F. Fortunatov e I.A. Baldovino di Courtenay. Quest'ultimo ha corrisposto a lungo con de Saussure, rispettivamente, le scuole di linguistica di Ginevra e Kazan hanno collaborato tra loro. Se Saussure può essere definito l'ideologo dei metodi "esatti" in linguistica, allora Baudouin de Courtenay ha gettato le basi pratiche per la loro applicazione. Fu il primo a separare la linguistica (come accurato una scienza che utilizza metodi statistici e dipendenza funzionale) dalla filologia (una comunità di discipline umanitarie che studiano la cultura spirituale attraverso il linguaggio e la parola). Lo stesso scienziato riteneva che "la linguistica possa essere utile nel prossimo futuro, liberata solo dall'unione obbligatoria con la filologia e la storia letteraria" . La fonologia divenne il "banco di prova" per l'introduzione dei metodi matematici nella linguistica: i suoni come "atomi" del sistema linguistico, dotati di un numero limitato di proprietà facilmente misurabili, erano il materiale più conveniente per metodi di descrizione formali e rigorosi. La fonologia nega l'esistenza del significato nel suono, quindi il fattore "umano" è stato eliminato negli studi. In questo senso, i fonemi sono come oggetti fisici o biologici.

I fonemi, come i più piccoli elementi linguistici accettabili per la percezione, rappresentano una sfera separata, una "realtà fenomenologica" separata. Ad esempio, in inglese, il suono "t" può essere pronunciato in modo diverso, ma in tutti i casi una persona che parla inglese lo percepirà come "t". La cosa principale è che il fonema svolga la sua funzione principale, significativa. Inoltre, le differenze tra le lingue sono tali che varietà di un suono in una lingua possono corrispondere a diversi fonemi in un'altra; ad esempio, "l" e "r" in inglese sono diverse, mentre in altre lingue sono varietà dello stesso fonema (come la "t" inglese, pronunciata con o senza aspirazione). Il vasto vocabolario di qualsiasi linguaggio naturale è un insieme di combinazioni di un numero molto minore di fonemi. In inglese, ad esempio, vengono utilizzati solo 40 fonemi per pronunciare e scrivere circa un milione di parole.

I suoni di una lingua sono un insieme di caratteristiche sistematicamente organizzato. Negli anni '20 -'30, seguendo Saussure, Jacobson e N.S. Trubetskoy individuarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura degli organi del linguaggio: lingua, denti, corde vocali. Ad esempio, in inglese la differenza tra "t" e "d" è la presenza o l'assenza di una "voce" (la tensione delle corde vocali) e il livello di voce che distingue un fonema da un altro. Pertanto, la fonologia può essere considerata un esempio della regola linguistica generale descritta da Saussure: "Ci sono solo differenze nella lingua". Ancora più importante non è questo: la differenza di solito implica le condizioni esatte tra le quali si trova; ma nella lingua ci sono solo differenze senza condizioni precise. Che si tratti di "designazione" o "significato", nella lingua non ci sono né concetti né suoni che sarebbero esistiti prima dello sviluppo del sistema linguistico.

Pertanto, nella linguistica saussuriana, il fenomeno studiato è inteso come un insieme di confronti e opposizioni del linguaggio. La lingua è sia un'espressione del significato delle parole che un mezzo di comunicazione, e queste due funzioni non coincidono mai. Possiamo notare l'alternanza di forma e contenuto: i contrasti linguistici ne definiscono le unità strutturali, e queste unità interagiscono per creare un certo contenuto significativo. Poiché gli elementi del linguaggio sono casuali, né il contrasto né la combinazione possono essere la base. Ciò significa che in una lingua, i tratti distintivi formano un contrasto fonetico a un diverso livello di comprensione, i fonemi sono combinati in morfemi, morfemi - in parole, parole - in frasi, ecc. In ogni caso, un intero fonema, parola, frase, ecc. è più della semplice somma delle sue parti.

Saussure ha proposto l'idea di una nuova scienza del XX secolo, separata dalla linguistica, che studia il ruolo dei segni nella società. Saussure chiamò questa scienza semiologia (dal greco "semeion" - un segno). La "scienza" della semiotica, sviluppatasi nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, ha esteso lo studio del linguaggio e delle strutture linguistiche a scoperte letterarie composte (o articolate) in termini di queste strutture. Inoltre, al tramonto della sua carriera, parallelamente al suo corso di linguistica generale, Saussure si impegnò in un'analisi "semiotica" della tarda poesia romana, cercando di scoprire anagrammi deliberatamente composti di nomi propri. Questo metodo era per molti versi l'opposto del razionalismo nella sua analisi linguistica: era un tentativo di studiare in un sistema il problema della "probabilità" nel linguaggio. Tale ricerca aiuta a concentrarsi sul "lato reale" della probabilità; la "parola chiave" per la quale Saussure cerca un anagramma è, secondo Jean Starobinsky, "uno strumento per il poeta, non la fonte della vita del poema". La poesia serve a scambiare i suoni della parola chiave. Secondo Starobinsky, in questa analisi, "Saussure non approfondisce la ricerca di significati nascosti". Al contrario, nelle sue opere si nota la volontà di evitare domande legate alla coscienza: “poiché la poesia si esprime non solo nelle parole, ma anche in ciò che queste parole danno origine, va oltre il controllo della coscienza e dipende solo da le leggi della lingua” (cfr. Allegato 1).

Il tentativo di Saussure di studiare i nomi propri nella poesia tardo romana sottolinea una delle componenti della sua analisi linguistica: la natura arbitraria dei segni, nonché l'essenza formale della linguistica di Saussure, che esclude la possibilità di analizzare il significato. Todorov conclude che oggi le opere di Saussure sembrano essere estremamente coerenti nella loro riluttanza a studiare i simboli di un fenomeno che hanno un significato chiaramente definito [Appendice 1]. Esplorando gli anagrammi, Saussure presta attenzione solo alla ripetizione, ma non alle opzioni precedenti. . . . Studiando i Nibelunghi, definisce i simboli solo per assegnarli a letture errate: se non sono intenzionali, i simboli non esistono. Del resto, nei suoi scritti di linguistica generale, ipotizza l'esistenza di una semiologia che descriva non solo i segni linguistici; ma questa ipotesi è limitata dal fatto che la semiologia può descrivere solo segni casuali e arbitrari.

Se è davvero così, è solo perché non potrebbe immaginare "l'intenzione" senza un oggetto; non riusciva a colmare completamente il divario tra forma e contenuto - nei suoi scritti questo si trasformava in una domanda. Invece, si è rivolto alla "legittimità linguistica". Tra, da un lato, concetti ottocenteschi basati sulla storia e su congetture soggettive, e metodi di interpretazione aleatoria basati su questi concetti, e, dall'altro, concetti strutturalisti che cancellano l'opposizione tra forma e contenuto (soggetto e oggetto), significato e origini nello strutturalismo, nella psicoanalisi e persino nella meccanica quantistica: gli scritti di Ferdinand de Saussure sulla linguistica e la semiotica segnano una svolta nello studio dei significati nella lingua e nella cultura.

Gli scienziati russi erano anche rappresentati al Primo Congresso Internazionale dei Linguisti all'Aia nel 1928. S. Kartsevsky, R. Yakobson e N. Trubetskoy hanno redatto un rapporto che ha esaminato la struttura gerarchica della lingua, nello spirito delle idee più moderne dell'inizio del secolo scorso. Jakobson nei suoi scritti sviluppò le idee di Saussure secondo cui gli elementi fondamentali di una lingua dovrebbero essere studiati, prima di tutto, in connessione con le loro funzioni, e non con le ragioni del loro verificarsi.

Sfortunatamente, dopo l'ascesa al potere di Stalin nel 1924, la linguistica russa, come molte altre scienze, viene respinta. Molti scienziati di talento furono costretti a emigrare, furono espulsi dal paese o morirono nei campi. Solo a partire dalla metà degli anni '50 è diventato possibile un certo pluralismo di teorie - maggiori informazioni su questo nella sezione 1.2.

1.2 Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento

Entro la metà del ventesimo secolo si erano formate quattro scuole linguistiche mondiali, ognuna delle quali si rivelò l'antenata di un certo metodo "esatto". Scuola fonologica di Leningrado(il suo antenato era uno studente di Baudouin de Courtenay L.V. Shcherba) ha utilizzato un esperimento psicolinguistico basato sull'analisi del discorso dei madrelingua come criterio principale per generalizzare il suono sotto forma di fonema.

Scienziati Circolo linguistico di Praga, in particolare - il suo fondatore N.S. Trubetskoy, emigrato dalla Russia, sviluppò la teoria delle opposizioni: la struttura semantica della lingua fu da loro descritta come un insieme di unità semantiche costruite in modo opposto - Sem. Questa teoria è stata applicata nello studio non solo della lingua, ma anche della cultura artistica.

Ideologi descrittivismo americano erano linguisti L. Bloomfield ed E. Sapir. La lingua è stata presentata ai descrittivisti come un insieme di dichiarazioni vocali, che erano l'oggetto principale del loro studio. Il loro focus era sulle regole della descrizione scientifica (da cui il nome) dei testi: lo studio dell'organizzazione, disposizione e classificazione dei loro elementi. La formalizzazione di procedure analitiche nel campo della fonologia e della morfologia (sviluppo di principi per lo studio della lingua a diversi livelli, analisi distributiva, metodo dei costituenti diretti, ecc.) ha portato alla formulazione di questioni generali di modellazione linguistica. La disattenzione al piano del contenuto della lingua, così come il lato paradigmatico della lingua, non ha permesso ai descrittivisti di interpretare la lingua come sistema in modo sufficientemente completo.

Negli anni '60 si sviluppò la teoria delle grammatiche formali, nata principalmente grazie al lavoro del filosofo e linguista americano N. Chomsky. È giustamente considerato uno dei più famosi scienziati e personaggi pubblici moderni, a lui sono dedicati molti articoli, monografie e persino un documentario a figura intera. Con il nome di un modo fondamentalmente nuovo di descrivere la struttura sintattica inventata da Chomsky - grammatica generativa (generatrice) - fu chiamata la tendenza corrispondente nella linguistica generativismo.

Chomsky, discendente di immigrati dalla Russia, ha studiato linguistica, matematica e filosofia all'Università della Pennsylvania dal 1945, fortemente influenzato dal suo maestro Zelig Harris - come Harris, Chomsky considerava e considera ancora le sue opinioni politiche vicine all'anarchismo (è ancora noto come critico dell'attuale sistema politico statunitense e come uno dei leader spirituali dell'anti-globalismo).

Primo grande lavoro scientifico di Chomsky, tesi di laurea "Morfologia dell'ebraico moderno » (1951) è rimasto inedito. Chomsky ha conseguito il dottorato presso l'Università della Pennsylvania nel 1955, ma gran parte della ricerca alla base della sua dissertazione (pubblicata integralmente solo nel 1975 con il titolo The Logical Structure of Linguistic Theory) e della sua prima monografia, Syntactic Structures (1957, Rus. trans . 1962), è stato eseguito presso l'Università di Harvard nel 1951-1955. Nello stesso 1955, lo scienziato si trasferì al Massachusetts Institute of Technology, dove divenne professore nel 1962.

La teoria di Chomsky ha attraversato diverse fasi del suo sviluppo.

Nella prima monografia "Syntactic Structures", lo scienziato ha presentato il linguaggio come un meccanismo per generare un insieme infinito di frasi utilizzando un insieme finito di mezzi grammaticali. Per descrivere le proprietà linguistiche, ha proposto i concetti di strutture grammaticali profonde (nascoste alla percezione diretta e generate da un sistema di regole ricorsive, cioè applicabili ripetutamente) e superficiali (direttamente percepite), nonché trasformazioni che descrivono la transizione dalle strutture profonde a quelle superficiali. Diverse strutture superficiali possono corrispondere a una struttura profonda (ad esempio, una struttura passiva Il decreto è firmato dal Presidente derivato dalla stessa Deep Structure del costrutto attivo Il Presidente firma il decreto) e viceversa (quindi, l'ambiguità la madre ama la figlia descritta come il risultato di una coincidenza di strutture superficiali che risalgono a due diverse strutture profonde, in una delle quali la madre è colei che ama la figlia, e nell'altra colei che è amata dalla figlia).

La teoria standard di Chomsky è considerata il modello "Aspects" esposto nel libro di Chomsky "Aspects of the Theory of Syntax". In questo modello, per la prima volta, sono state introdotte regole di interpretazione semantica nella teoria formale, attribuendo significato a strutture profonde. In Aspects, la competenza linguistica è contrapposta all'uso del linguaggio (prestazione), viene adottata la cosiddetta ipotesi di Katz-Postal sulla conservazione del significato durante la trasformazione, in relazione alla quale viene escluso il concetto di trasformazione facoltativa, e un apparato di vengono introdotte caratteristiche sintattiche che descrivono la compatibilità lessicale.

Negli anni '70, Chomsky ha lavorato alla teoria del controllo e del legame (teoria GB - dalle parole governo E legame) è più generale del precedente. In esso, lo scienziato ha abbandonato le regole specifiche che descrivono le strutture sintattiche di lingue specifiche. Tutte le trasformazioni sono state sostituite con una trasformazione di movimento universale. Nell'ambito della teoria GB, ci sono anche moduli privati, ognuno dei quali è responsabile della propria parte della grammatica.

Già di recente, nel 1995, Chomsky ha presentato un programma minimalista, in cui il linguaggio umano è descritto come il linguaggio macchina. Questo è solo un programma, non un modello o una teoria. In esso, Chomsky identifica due sottosistemi principali dell'apparato linguistico umano: il lessico e il sistema informatico, nonché due interfacce: fonetica e logica.

Le grammatiche formali di Chomsky sono diventate classiche per descrivere non solo i linguaggi naturali ma anche quelli artificiali, in particolare i linguaggi di programmazione. Lo sviluppo della linguistica strutturale nella seconda metà del XX secolo può essere giustamente considerato una "rivoluzione chomskiana".

Scuola fonologica di Mosca, i cui rappresentanti erano A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, ha utilizzato una teoria simile per studiare la fonetica. A poco a poco, i metodi "esatti" iniziano ad essere applicati non solo alla fonetica, ma anche alla sintassi. Sia i linguisti che i matematici, sia qui che all'estero, stanno iniziando a studiare la struttura della lingua. Negli anni '50 e '60 iniziò in URSS una nuova fase nell'interazione tra matematica e linguistica, associata allo sviluppo dei sistemi di traduzione automatica.

L'impulso per l'inizio di questi lavori nel nostro paese sono stati i primi sviluppi nel campo della traduzione automatica negli Stati Uniti (sebbene il primo dispositivo di traduzione meccanizzato di P.P. Smirnov-Troyansky sia stato inventato nell'URSS nel 1933, essendo primitivo, non si è diffuso). Nel 1947, A. Butt e D. Britten elaborarono un codice per la traduzione parola per parola usando un computer, un anno dopo R. Richens propose una regola per dividere le parole in radici e desinenze nella traduzione automatica. Quegli anni erano molto diversi da oggi. Si trattava di macchine molto grandi e costose che occupavano intere stanze e richiedevano un grande staff di ingegneri, operatori e programmatori per mantenerle. Fondamentalmente, questi computer venivano utilizzati per eseguire calcoli matematici per le esigenze delle istituzioni militari: il nuovo in matematica, fisica e tecnologia serviva, prima di tutto, agli affari militari. Nelle prime fasi, lo sviluppo del parlamentare è stato attivamente sostenuto dai militari, con tutto ciò (nelle condizioni della Guerra Fredda), la direzione russo-inglese sviluppata negli Stati Uniti e la direzione anglo-russa nell'URSS.

Nel gennaio 1954, presso la Massachusetts Technical University, ebbe luogo il "Georgetown Experiment", la prima dimostrazione pubblica di traduzione dal russo all'inglese sulla macchina IBM-701. Estratto del messaggio sul passaggio riuscito dell'esperimento, realizzato da D.Yu. Panov, apparso in RJ "Mathematics", 1954, n. 10: "Traduzione da una lingua all'altra usando una macchina: un rapporto sul primo test riuscito".

D. Yu Panov (a quel tempo direttore dell'Istituto di informazione scientifica - INI, poi VINITI) attirò I. K. Belskaya, che in seguito diresse il gruppo di traduzione automatica presso l'Istituto di matematica precisa e ingegneria informatica dell'Accademia delle scienze dell'URSS, a lavorare sulla traduzione automatica. Alla fine del 1955 risale la prima esperienza di traduzione dall'inglese al russo con l'ausilio della macchina BESM. I programmi per BESM sono stati compilati da N.P. Trifonov e L.N. Korolev, la cui tesi di dottorato era dedicata ai metodi per costruire dizionari per la traduzione automatica.

Parallelamente, il lavoro sulla traduzione automatica è stato svolto presso il Dipartimento di matematica applicata dell'Istituto di matematica dell'Accademia delle scienze dell'URSS (ora M.V. Keldysh Institute of Applied Mathematics dell'Accademia delle scienze russa). Su iniziativa del matematico A.A. Lyapunov. Ha coinvolto O.S. Kulagin e i suoi studenti T.D. Wentzel e N.N. Ricco. Le idee di Lyapunov e Kulagina sulla possibilità di utilizzare la tecnologia per tradurre da una lingua all'altra sono state pubblicate sulla rivista Nature, 1955, n. 8. Dalla fine del 1955, T.N. Moloshnaya, che ha poi iniziato a lavorare in modo indipendente sull'algoritmo di traduzione inglese-russo.

R. Frumkina, che a quel tempo era impegnato nell'algoritmo di traduzione dallo spagnolo, ricorda che in questa fase del lavoro era difficile compiere passi coerenti. Molto più spesso ho dovuto seguire l'esperienza euristica, la mia o quella dei colleghi.

Allo stesso tempo, la prima generazione di sistemi di traduzione automatica era molto imperfetta. Tutti erano basati su algoritmi di traduzione sequenziale "parola per parola", "frase per frase" - le connessioni semantiche tra parole e frasi non venivano prese in considerazione in alcun modo. Ad esempio, le frasi sono: John stava cercando la sua scatola dei giocattoli.Finalmente l'ha trovato. La scatola era nella penna.Giovanni era molto felice. (John stava cercando la sua scatola dei giocattoli. Alla fine l'ha trovata. La scatola era nel box. John era molto felice.). "Penna" in questo contesto non è una "penna" (strumento di scrittura), ma un "box" ( play-pen). La conoscenza di sinonimi, contrari e significati figurativi è difficile da inserire in un computer. Una direzione promettente era lo sviluppo di sistemi informatici incentrati sull'uso di un traduttore umano.

Nel tempo, i sistemi di traduzione diretta sono stati sostituiti dai sistemi T (dalla parola inglese "transfer" - trasformazione), in cui la traduzione è stata effettuata a livello di strutture sintattiche. Gli algoritmi dei sistemi T hanno utilizzato un meccanismo che ha permesso di costruire una struttura sintattica secondo le regole grammaticali della lingua della frase in ingresso (simile a come viene insegnata una lingua straniera al liceo), e quindi sintetizzare la frase in uscita trasformando la struttura sintattica e sostituendo le parole necessarie dal dizionario.

Lyapunov ha parlato di traduzione estraendo il significato del testo tradotto e presentandolo in un'altra lingua. L'approccio alla costruzione di sistemi di traduzione automatica basati sull'ottenimento della rappresentazione semantica della frase di input mediante analisi semantica e sintesi della frase di input in base alla rappresentazione semantica ottenuta è ancora considerato il più perfetto. Tali sistemi sono chiamati sistemi I (dalla parola "interlingua"). Allo stesso tempo, il compito di crearli, arretrato tra la fine degli anni '50 e l'inizio degli anni '60, non è stato ancora completamente risolto, nonostante gli sforzi della Federazione internazionale dell'IFIP, la comunità mondiale di scienziati nel campo dell'elaborazione delle informazioni .

Gli scienziati hanno pensato a come formalizzare e costruire algoritmi per lavorare con i testi, quali dizionari dovrebbero essere inseriti nella macchina, quali schemi linguistici dovrebbero essere usati nella traduzione automatica. La linguistica tradizionale non aveva tali idee, non solo in termini di semantica, ma anche in termini di sintassi. A quel tempo non esistevano elenchi di costruzioni sintattiche per nessuna lingua, le condizioni per la loro compatibilità e intercambiabilità non erano state studiate, le regole per costruire grandi unità di struttura sintattica da elementi costitutivi più piccoli non erano state sviluppate.

La necessità di creare le basi teoriche della traduzione automatica ha portato alla formazione e allo sviluppo della linguistica matematica. Il ruolo principale in questa materia in URSS è stato svolto dai matematici A.A. Lyapunov, O.S. Kulagina, VA Uspensky, linguisti V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. La dissertazione di Kulagina era dedicata allo studio della teoria formale delle grammatiche (contemporaneamente a N. Khomsky negli Stati Uniti), Kuznetsov proponeva il compito dell'assiomatizzazione della linguistica, che risale alle opere di F.F. Fortunatov.

Il 6 maggio 1960 fu adottato il decreto del Presidio dell'Accademia delle scienze dell'URSS "Sullo sviluppo di metodi strutturali e matematici per lo studio del linguaggio" e furono create le corrispondenti divisioni presso l'Istituto di linguistica e l'Istituto di la lingua russa. Dal 1960, le principali università umanitarie del paese - la Facoltà di filologia dell'Università statale di Mosca, Leninrad, Università di Novosibirsk, Istituto statale di lingue straniere di Mosca - hanno iniziato a formare personale nel campo dell'elaborazione automatica del testo.

Allo stesso tempo, i lavori sulla traduzione automatica di questo periodo, chiamati "classici", sono di interesse più teorico che pratico. I sistemi di traduzione automatica convenienti iniziarono a essere creati solo negli anni ottanta del secolo scorso. Ne parlerò più avanti nella Sezione 2.1, Traduzione automatica.

Gli anni '60 e '70 includono profondi sviluppi teorici utilizzando i metodi della teoria degli insiemi e della logica matematica, come la teoria dei campi e la teoria degli insiemi fuzzy.

L'autore della teoria del campo in linguistica era il poeta, traduttore e linguista sovietico V.G. Ammoni. Inizialmente ha sviluppato la sua teoria sulla base della lingua tedesca. Per Admoni, il concetto di "campo" denota un insieme arbitrario non vuoto di elementi linguistici (ad esempio, "campo lessicale", "campo semantico").

La struttura del campo è eterogenea: è costituita da un nucleo, i cui elementi hanno un insieme completo di caratteristiche che definiscono un insieme, e una periferia, i cui elementi possono avere entrambe le caratteristiche di un dato insieme (non tutto) e quelli limitrofi. Darò un esempio che illustra questa affermazione: ad esempio, in inglese, il campo delle parole composte ("sogno ad occhi aperti" - "sogno" è difficile da separare dal campo delle frasi ("gas lacrimogeno" - "gas lacrimogeno") .

La teoria degli insiemi fuzzy già menzionata sopra è strettamente correlata alla teoria dei campi. In URSS, i linguisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, tuttavia, il suo antenato era il matematico americano L. Zadeh, che nel 1965 pubblicò l'articolo "Fuzzy Logic". Fornendo una giustificazione matematica alla teoria degli insiemi fuzzy, Zade li considerò sulla base del materiale linguistico.

In questa teoria, non stiamo parlando tanto dell'appartenenza di elementi a un dato insieme (Aa), ma del grado di questa appartenenza (Aa), poiché gli elementi periferici possono appartenere a più campi in un grado o nell'altro. Zade (Lofti-zade) era originario dell'Azerbaigian, fino all'età di 12 anni aveva la pratica di comunicare in quattro lingue - azero, russo, inglese e persiano - e usava tre diversi alfabeti: cirillico, latino, arabo. Quando a uno scienziato viene chiesto cosa c'è in comune tra la teoria degli insiemi fuzzy e la linguistica, non nega questa connessione, ma chiarisce: “Non sono sicuro che lo studio di queste lingue abbia avuto una grande influenza sul mio pensiero. Se così fosse, allora solo inconsciamente. In gioventù, Zadeh ha studiato in una scuola presbiteriana a Teheran e dopo la seconda guerra mondiale è emigrato negli Stati Uniti. "La domanda non è se sono americano, russo, azero o qualcun altro", ha detto in una delle conversazioni, "sono plasmato da tutte queste culture e popoli e mi sento abbastanza a mio agio tra ognuno di loro". In queste parole c'è qualcosa di simile a ciò che caratterizza la teoria degli insiemi fuzzy: un allontanamento da definizioni non ambigue e categorie nitide.

Nel nostro Paese, negli anni '70, sono state tradotte e studiate le opere dei linguisti occidentali del Novecento. I.A. Melchuk ha tradotto in russo le opere di N. Chomsky. SUL. Slyusareva nel suo libro "The Theory of F. de Saussure in the Light of Modern Linguistics" collega i postulati dell'insegnamento di Saussure con i problemi reali della linguistica degli anni '70. C'è una tendenza verso un'ulteriore matematizzazione della linguistica. Le principali università nazionali stanno formando personale nella specialità "Linguistica matematica (teorica, applicata)". Allo stesso tempo in Occidente c'è un brusco balzo nello sviluppo della tecnologia informatica, che richiede sempre più nuove basi linguistiche.

Negli anni '80, professore dell'Istituto di studi orientali dell'Accademia delle scienze Yu.K. Lekomtsev, analizzando il linguaggio della linguistica attraverso l'analisi di schemi, tabelle e altri tipi di notazione utilizzati nelle descrizioni linguistiche, considera i sistemi matematici adatti a questi scopi (principalmente sistemi di algebra matriciale).

Così, per tutto il ventesimo secolo, c'è stata una convergenza tra l'esatto e le discipline umanistiche. L'interazione della matematica con la linguistica trovò sempre più applicazioni pratiche. Maggiori informazioni su questo nel prossimo capitolo.

Capitolo 2. Esempi selezionati dell'uso della matematica in linguistica

2.1 Traduzione automatica

L'idea di tradurre da una lingua all'altra con l'aiuto di un meccanismo universale è nata diversi secoli prima che iniziassero i primi sviluppi in quest'area: già nel 1649, René Descartes propose l'idea di una lingua in cui le idee equivalenti di lingue diverse sarebbero espresse da un simbolo. I primi tentativi di attuare questa idea negli anni '30 -'40, l'inizio degli sviluppi teorici a metà del secolo, il miglioramento dei sistemi di traduzione con l'aiuto della tecnologia negli anni '70 -'80, il rapido sviluppo della tecnologia di traduzione negli ultimi decennio: queste sono le fasi dello sviluppo della traduzione automatica come industria. È dai lavori sulla traduzione automatica che è cresciuta la linguistica informatica come scienza.

Con lo sviluppo della tecnologia informatica tra la fine degli anni '70 e l'inizio degli anni '80, i ricercatori si sono posti obiettivi più realistici ed economici: la macchina non è diventata un concorrente (come si pensava in precedenza), ma un assistente di un traduttore umano. La traduzione automatica cessa di servire esclusivamente a compiti militari (tutte le invenzioni e le ricerche sovietiche e americane, incentrate principalmente sul russo e sull'inglese, hanno contribuito in un modo o nell'altro alla Guerra Fredda). Nel 1978, le parole in linguaggio naturale furono trasmesse sulla rete interconnessa Arpa e sei anni dopo apparvero negli Stati Uniti i primi programmi di traduzione per microcomputer.

Negli anni '70 la Commissione delle Comunità Europee acquista la versione inglese-francese del traduttore informatico Systran, ordinando anche le versioni francese-inglese e italiano-inglese, e il sistema di traduzione russo-inglese utilizzato dalle Forze Armate statunitensi. È così che sono state poste le basi del progetto EUROTRA.

Sulla rinascita della traduzione automatica negli anni '70 e '80. lo testimoniano i seguenti fatti: la Commissione delle Comunità europee (CEC) acquista la versione inglese-francese di Systran, nonché il sistema di traduzione dal russo all'inglese (quest'ultimo sviluppato dopo il rapporto ALPAC e continuato ad essere utilizzato dalla US Air Force e NASA); inoltre, la CEC ordina lo sviluppo delle versioni francese-inglese e italiano-inglese. Allo stesso tempo, c'è una rapida espansione delle attività di traduzione automatica in Giappone; negli Stati Uniti, l'Organizzazione Panamericana della Sanità (PAHO) ordina lo sviluppo di una direzione spagnolo-inglese (sistema SPANAM); L'aeronautica americana sta finanziando lo sviluppo di un sistema di traduzione automatica presso il Linguistic Research Center dell'Università del Texas ad Austin; Il gruppo TAUM in Canada sta facendo notevoli progressi nello sviluppo del proprio sistema METEO (traduzione meteorologica). Numerosi progetti sono stati avviati negli anni '70 e '80. successivamente sviluppato in sistemi commerciali a tutti gli effetti.

Nel periodo 1978-93 sono stati spesi 20 milioni di dollari per la ricerca nel campo della traduzione automatica negli Stati Uniti, 70 milioni in Europa e 200 milioni in Giappone.

Uno dei nuovi sviluppi è la tecnologia TM (translation memory), che funziona secondo il principio dell'accumulo: durante il processo di traduzione, il segmento originale (frase) e la sua traduzione vengono salvati, con conseguente formazione di un database linguistico; se nel testo appena tradotto viene trovato un segmento identico o simile, viene visualizzato insieme alla traduzione e all'indicazione della percentuale di corrispondenza. Il traduttore prende quindi una decisione (di modificare, rifiutare o accettare la traduzione), il cui risultato viene memorizzato dal sistema, quindi non è necessario tradurre la stessa frase due volte. Un noto sistema commerciale basato sulla tecnologia TM è attualmente sviluppato dal sistema TRADOS (fondato nel 1984).

Attualmente, diverse dozzine di aziende stanno sviluppando sistemi di traduzione automatica commerciale, tra cui: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. e altri Ora puoi utilizzare i servizi di traduttori automatici direttamente sul Web: alphaWorks; Traduttore online di PROMT, LogoMedia.net, servizio di traduzione Babel Fish di AltaVista; InfiniT.com; Tradurre Internet.

Sistemi di traduzione commercialmente efficaci sono comparsi nella seconda metà degli anni '80 anche nel nostro Paese. Il concetto stesso di traduzione automatica si è ampliato (ha iniziato a includere "la creazione di una serie di sistemi e dispositivi automatici e automatizzati che eseguono automaticamente o semiautomaticamente l'intero ciclo di traduzione o singole attività in un dialogo con una persona"), e gli stanziamenti governativi per lo sviluppo di questo settore sono aumentati.

Russo, inglese, tedesco, francese e giapponese sono diventati le principali lingue dei sistemi di traduzione domestici. L'All-Union Translation Center (VTsP) ha sviluppato un sistema per tradurre dall'inglese e dal tedesco al russo su un computer ES-1035-ANRAP. Consisteva in tre dizionari - input inglese e tedesco e output russo - sotto un unico software. C'erano diversi dizionari specializzati intercambiabili: per tecnologia informatica, programmazione, radioelettronica, ingegneria meccanica, agricoltura, metallurgia. Il sistema poteva funzionare in due modalità: automatica e interattiva, quando lo schermo mostrava il testo sorgente e la traduzione per frase, che una persona poteva modificare. La velocità di traduzione del testo in ANRAP (dall'inizio della battitura alla fine della stampa) era di circa 100 pagine all'ora.

Nel 1989 è stata creata una famiglia di traduttori commerciali del tipo SPRINT, che lavora con russo, inglese, tedesco e giapponese. Il loro principale vantaggio era la compatibilità con il PC IBM, quindi i sistemi di traduzione automatica domestici hanno raggiunto il livello di qualità internazionale. Allo stesso tempo, è in fase di sviluppo un sistema di traduzione automatica dal francese al russo FRAP, che comprende 4 fasi di analisi del testo: grafomatica, morfologica, sintattica e semantica. In LGPI loro. Herzen, era in corso il lavoro su un sistema SILOD-MP in quattro lingue (inglese, francese, spagnolo, russo) (i dizionari inglese-russo e franco-russo sono stati utilizzati in modalità industriale.

Per la traduzione specializzata di testi di ingegneria elettrica esisteva il sistema ETAP-2. L'analisi del testo di input in esso contenuto è stata effettuata a due livelli: morfologico e sintattico. Il dizionario ETAP-2 conteneva circa 4mila voci; la fase di trasformazione del testo - circa 1000 regole (96 generali, 342 private, il resto è dizionario). Tutto ciò garantiva una soddisfacente qualità di traduzione (ad esempio, il titolo del brevetto "Disposizione della griglia di fase ottica e dispositivo di accoppiamento avente tale disposizione" è stato tradotto come "Un dispositivo a griglia di fase ottica e un dispositivo di connessione con tale dispositivo" - nonostante la tautologia, il significato è conservato).

Presso l'Istituto pedagogico di lingue straniere di Minsk, sulla base del dizionario inglese-russo di forme e frasi di parole, è stato inventato un sistema per la traduzione automatica dei titoli, presso l'Istituto di studi orientali dell'Accademia delle scienze - un sistema per tradurre dal giapponese al russo. Il primo servizio automatico di vocabolario e terminologia (SLOTHERM) per l'informatica e la programmazione, creato presso l'Istituto di ricerca sui sistemi di automazione di Mosca, conteneva circa 20.000 termini in un dizionario esplicativo e dizionari speciali per la ricerca linguistica.

I sistemi di traduzione automatica iniziarono gradualmente ad essere utilizzati non solo per lo scopo previsto, ma anche come componente importante dei sistemi di apprendimento automatico (per insegnare la traduzione, controllare l'ortografia e la conoscenza grammaticale).

Gli anni '90 hanno portato con sé il rapido sviluppo del mercato dei PC (dal desktop al tascabile) e dell'informatica, l'uso diffuso di Internet (che sta diventando sempre più internazionale e multilingue). Tutto ciò ha reso richiesto l'ulteriore sviluppo di sistemi di traduzione automatica. Dall'inizio degli anni '90 Anche gli sviluppatori domestici stanno entrando nel mercato dei sistemi PC.

Nel luglio 1990, il primo sistema di traduzione automatica commerciale in Russia chiamato PROMT (PROgrammer's Machine Translation) è stato presentato al PC Forum di Mosca.Nel 1991, ZAO [!!! In conformità con la legge federale-99 del 05.05.2014, questo modulo è stata sostituita da una società per azioni non pubblica] "Project MT", e già nel 1992 la società PROMT ha vinto il concorso della NASA per la fornitura di sistemi MP (PROMT era l'unica società non americana in questo concorso). un'intera famiglia di sistemi con il nuovo nome STYLUS per la traduzione dall'inglese, tedesco, francese, italiano e spagnolo al russo e dal russo all'inglese, e nel 1993 è stato creato il primo sistema di traduzione automatica al mondo per Windows basato su STYLUS. per Windows 3.X/95/NT, e nel 1995-1996 è stata introdotta la terza generazione di sistemi di traduzione automatica, STYLUS 3.0 completamente a 32 bit per Windows 95/NT, contemporaneamente allo sviluppo di un sistema completamente nuovo, i primi sistemi di traduzione automatica russo-tedesco e russo-francese al mondo.

Nel 1997 è stato firmato un accordo con la società francese Softissimo per la creazione di sistemi di traduzione dal francese al tedesco e all'inglese e viceversa, e nel dicembre di quest'anno è stato rilasciato il primo sistema di traduzione tedesco-francese al mondo. Nello stesso anno, la società PROMT ha rilasciato un sistema implementato utilizzando la tecnologia Gigant, che supporta diverse indicazioni linguistiche in una shell, nonché uno speciale traduttore per lavorare su Internet WebTranSite.

Nel 1998, un'intera costellazione di programmi è stata rilasciata con il nuovo nome PROMT 98. Un anno dopo, PROMT ha rilasciato due nuovi prodotti: un pacchetto software unico per lavorare su Internet - PROMT Internet e un traduttore per i sistemi di posta aziendale - PROMT Mail Traduttore. Nel novembre 1999, PROMT è stato riconosciuto come il miglior sistema di traduzione automatica testato dalla rivista francese PC Expert, superando del 30% i suoi concorrenti. Sono state inoltre sviluppate speciali soluzioni server per i clienti aziendali: il server di traduzione aziendale PROMT Translation Server (PTS) e la soluzione Internet PROMT Internet Translation Server (PITS). Nel 2000, PROMT ha aggiornato l'intera linea di prodotti software rilasciando una nuova generazione di sistemi MT: PROMT Translation Office 2000, PROMT Internet 2000 e Magic Gooddy 2000.

La traduzione online con il supporto del sistema PROMT viene utilizzata su numerosi siti nazionali ed esteri: traduttore online PROMT, InfiniT.com, Translate.Ru, Lycos, ecc., nonché in istituzioni di vari profili per la traduzione di documenti commerciali, articoli e lettere (ci sono sistemi di traduzione integrati direttamente in Outlook Express e altri client di posta elettronica).

Al giorno d'oggi stanno emergendo nuove tecnologie di traduzione automatica basate sull'uso di sistemi di intelligenza artificiale e metodi statistici. A proposito di quest'ultimo - nella prossima sezione.

2.2 ExtraMetodi tecnici nell'apprendimento delle lingue

Una notevole attenzione nella linguistica moderna è data allo studio dei fenomeni linguistici utilizzando i metodi della matematica quantitativa. I dati quantitativi spesso aiutano a comprendere più a fondo i fenomeni studiati, il loro posto e il loro ruolo nel sistema dei fenomeni correlati. La risposta alla domanda "quanto" aiuta a rispondere alle domande "cosa", "come", "perché" - tale è il potenziale euristico di una caratteristica quantitativa.

I metodi statistici svolgono un ruolo significativo nello sviluppo dei sistemi di traduzione automatica (cfr. sezione 2.1). Nell'approccio statistico, il problema della traduzione è considerato in termini di un canale rumoroso. Immagina di dover tradurre una frase dall'inglese al russo. Il principio del canale rumoroso ci offre la seguente spiegazione del rapporto tra una frase inglese e una russa: una frase inglese non è altro che una frase russa distorta da un qualche tipo di rumore. Per recuperare la frase russa originale, dobbiamo sapere cosa dicono di solito le persone in russo e come le frasi russe vengono distorte in inglese. La traduzione viene effettuata cercando una tale frase russa che massimizzi i prodotti della probabilità incondizionata della frase russa e della probabilità della frase inglese (originale) data la frase russa data. Secondo il teorema di Bayes, questa frase russa è la traduzione più probabile dell'inglese:

dove e è la frase di traduzione e f è la frase originale

Quindi abbiamo bisogno di un modello di origine e di un modello di canale, o di un modello linguistico e di un modello di traduzione. Il modello linguistico deve assegnare un punteggio di probabilità a qualsiasi frase nella lingua di destinazione (nel nostro caso il russo) e il modello di traduzione alla frase originale. (vedi tabella 1)

In generale, un sistema di traduzione automatica opera in due modalità:

1. Formazione del sistema: viene preso un corpus di formazione di testi paralleli e, utilizzando la programmazione lineare, vengono cercati tali valori delle tabelle di corrispondenza della traduzione che massimizzano la probabilità che (ad esempio) la parte russa del corpus con l'inglese disponibile secondo al modello di traduzione selezionato. Un modello della lingua russa è costruito sulla parte russa dello stesso corpus.

2. Sfruttamento: in base ai dati ottenuti per una frase inglese sconosciuta, si cerca un russo che massimizzi il prodotto delle probabilità assegnate dal modello linguistico e dal modello traduttivo. Il programma utilizzato per tale ricerca si chiama decodificatore.

Il modello di traduzione statistica più semplice è il modello di traduzione letterale. Questo modello presuppone che per tradurre una frase da una lingua all'altra sia sufficiente tradurre tutte le parole (creare un "sacco di parole") e il modello fornirà la loro collocazione nell'ordine corretto. a, f | e) a P(a | e , f), cioè probabilità di un dato allineamento data una coppia di frasi, ogni probabilità P(a, f | e) è normalizzata dalla somma delle probabilità di tutti gli allineamenti di una data coppia di frasi:

L'implementazione dell'algoritmo di Viterbi utilizzato per addestrare il modello n. 1 è la seguente:

1. L'intera tabella delle probabilità di corrispondenza della traduzione è riempita con gli stessi valori.

2. Per tutte le possibili varianti di connessioni a coppie di parole, viene calcolata la probabilità P(a, f | e):

3. I valori di P(a, f | e) vengono normalizzati per ottenere i valori di P(a | e, f).

4. Viene calcolata la frequenza di ciascuna coppia di traduzione, ponderata in base alla probabilità di ciascuna opzione di allineamento.

5. Le frequenze ponderate risultanti vengono normalizzate e formano una nuova tabella di probabilità di corrispondenza della traduzione

6. L'algoritmo viene ripetuto dal passaggio 2.

Si consideri, ad esempio, l'addestramento di un modello simile su un corpus di due coppie di frasi (Fig. 2):

casa Bianca

Dopo un gran numero di iterazioni, otterremo una tabella (Tabella 2), che mostra che la traduzione viene eseguita con elevata precisione.

Inoltre, i metodi statistici sono ampiamente utilizzati nello studio del vocabolario, della morfologia, della sintassi e dello stile. Gli scienziati della Perm State University hanno condotto uno studio basato sull'affermazione che le frasi stereotipate sono un importante "materiale da costruzione" del testo. Queste frasi sono costituite da parole ripetute "nucleari" e specificatori di parole dipendenti e hanno una colorazione stilistica pronunciata.

Nello stile scientifico, le parole "nucleari" possono essere chiamate: ricerca, studio, compito, problema, domanda, fenomeno, fatto, osservazione, analisi ecc. Nel giornalismo, altre parole saranno "nucleari", che hanno un valore accresciuto specificamente per il testo del giornale: tempo, persona, potere, affari, azione, legge, vita, storia, luogo eccetera. (totale 29)

Di particolare interesse per i linguisti è anche la differenziazione professionale della lingua nazionale, l'originalità dell'uso del vocabolario e della grammatica, a seconda del tipo di occupazione. È noto che i conducenti nel linguaggio professionale usano la forma w O fer, i medici dicono k O club invece di cocktail Yu sh - tali esempi possono essere forniti. Il compito delle statistiche è monitorare la variabilità della pronuncia e il cambiamento nella norma linguistica.

Le differenze professionali portano a differenze non solo grammaticali, ma anche lessicali. Yakut State University prende il nome MK Ammosov, sono stati analizzati 50 questionari con le reazioni più comuni a determinate parole tra medici e costruttori (Tabella 3).

Costruttori

Umano

paziente (10), personalità (5)

uomo (5)

Bene

aiuto (8), aiuto (7)

malvagio (16)

vita

morte (10)

adorabile (5)

morte

cadavere (8)

vita (6)

fuoco

riscaldare (8), bruciare (6)

fuoco (7)

dito

mano (14), panaritium (5)

grande (7), indice (6)

occhi

visione (6), allievo, oftalmologo (5 ciascuno)

marrone (10), grande (6)

Testa

mente (14), cervello (5)

grande (9), intelligente (8), intelligente (6)

perdere

coscienza, vita (4 ciascuno)

soldi (5), trovare (4)

Si può notare che i medici più spesso dei costruttori danno associazioni legate alla loro attività professionale, poiché le parole-stimoli fornite nel questionario hanno più a che fare con la loro professione che con la professione di muratore.

Le regolarità statistiche in una lingua vengono utilizzate per creare dizionari di frequenza - dizionari che forniscono caratteristiche numeriche della frequenza delle parole (forme di parole, frasi) di qualsiasi lingua - la lingua dello scrittore, qualsiasi opera, ecc. Di solito, la frequenza di occorrenza di una parola è usata come caratteristica d'uso nel testo di un certo volume

Il modello della percezione del parlato è impossibile senza un dizionario come sua componente essenziale. Nella percezione della parola, l'unità operativa di base è la parola. Da ciò ne consegue, in particolare, che ogni parola del testo percepito deve essere identificata con la corrispondente unità del vocabolario interno dell'ascoltatore (o del lettore). È naturale supporre che fin dall'inizio la ricerca sia limitata ad alcuni sottodomini del dizionario. Secondo le più moderne teorie sulla percezione del parlato, l'effettiva analisi fonetica del testo sonoro in un caso tipico fornisce solo alcune informazioni parziali sul possibile aspetto fonologico della parola, e questo tipo di informazioni corrisponde non a una, ma a MOLTE parole del dizionario; Pertanto, sorgono due problemi:

(a) selezionare l'insieme appropriato in base a determinati parametri;

(b) entro i limiti dell'insieme delineato (se è allocato adeguatamente) per "eliminare" tutte le parole, eccetto l'unica che meglio corrisponde alla parola data del testo riconosciuto. Una delle strategie di "abbandono" consiste nell'escludere le parole a bassa frequenza. Ne consegue che il vocabolario per la percezione del parlato è un dizionario di frequenza. È la creazione di una versione per computer del dizionario delle frequenze della lingua russa il compito iniziale del progetto presentato.

Sulla base del materiale della lingua russa, ci sono 5 dizionari di frequenza (senza contare i dizionari di filiale). Notiamo solo alcune carenze generali dei dizionari esistenti.

Tutti i dizionari di frequenza conosciuti della lingua russa si basano sull'elaborazione di matrici di testi scritti (stampati). In parte per questo motivo, quando l'identità di una parola si basa in gran parte su coincidenze formali, grafiche, la semantica non viene presa sufficientemente in considerazione. Di conseguenza, anche le caratteristiche di frequenza vengono spostate, distorte; ad esempio, se il compilatore del dizionario delle frequenze include parole dalla combinazione "l'un l'altro" nelle statistiche generali dell'uso della parola "amico", allora questo è difficilmente giustificato: data la semantica, dobbiamo ammettere che queste sono già parole diverse, o meglio, che un'unità di dizionario indipendente è solo la combinazione nel suo insieme.

Inoltre, in tutti i dizionari esistenti, le parole sono poste solo nelle loro forme base: sostantivi al singolare, nominativo, verbi all'infinito, ecc. Alcuni dizionari forniscono informazioni sulla frequenza delle forme delle parole, ma di solito non lo fanno in modo abbastanza coerente, non in modo esaustivo. Le frequenze di diverse forme di parola della stessa parola ovviamente non corrispondono. Lo sviluppatore del modello di percezione del parlato deve tenere conto del fatto che in un processo percettivo reale è proprio una specifica forma di parola che è "immersa" nel testo che è soggetta a riconoscimento: sulla base dell'analisi della sezione iniziale dell'esponente di la forma della parola, si forma un insieme di parole con un inizio identico e la sezione iniziale della forma della parola non è necessariamente identica alla sezione iniziale della forma del dizionario. È la forma della parola che ha una struttura ritmica specifica, che è anche un parametro estremamente importante per la selezione percettiva delle parole. Infine, nella rappresentazione finale dell'enunciato riconosciuto, ancora una volta, le parole sono rappresentate dalle corrispondenti forme verbali.

Ci sono molte opere che dimostrano l'importanza della frequenza nel processo di percezione del parlato. Ma non siamo a conoscenza di opere in cui verrebbe utilizzata la frequenza delle forme delle parole - al contrario, tutti gli autori ignorano praticamente la frequenza delle singole forme delle parole, riferendosi esclusivamente ai lessemi. Se i risultati ottenuti da loro non sono considerati artefatti, si deve presumere che il madrelingua abbia in qualche modo accesso alle informazioni sul rapporto tra le frequenze delle forme delle parole e delle forme del dizionario, cioè, appunto, lessemi. Inoltre, una tale transizione da una forma verbale a un lessema, ovviamente, non può essere spiegata dalla conoscenza naturale del paradigma corrispondente, poiché le informazioni sulla frequenza devono essere utilizzate prima dell'identificazione finale della parola, altrimenti perde semplicemente il suo significato.

Secondo le caratteristiche statistiche primarie, è possibile determinare con un dato errore relativo quella parte del dizionario, che include parole con un'alta frequenza di occorrenza, indipendentemente dal tipo di testo. È anche possibile, introducendo nel dizionario l'ordinamento per gradi, ottenere una serie di dizionari che coprano le prime 100, 1000, 5000, ecc. di parole frequenti. Le caratteristiche statistiche del dizionario sono di interesse in connessione con l'analisi semantica del vocabolario. Lo studio dei gruppi soggetto-ideologici e dei campi semantici mostra che le associazioni lessicali sono supportate da collegamenti semantici che si concentrano attorno ai lessemi con il significato più comune. La descrizione dei significati all'interno del campo lessico-semantico può essere effettuata identificando le parole con i lessemi più astratti di significato. Apparentemente, le unità di dizionario "vuote" (dal punto di vista delle potenze nominative) costituiscono uno strato statisticamente omogeneo.

I vocabolari per i singoli generi non sono meno preziosi. Lo studio della misura della loro somiglianza e della natura delle distribuzioni statistiche fornirà informazioni interessanti sulla stratificazione qualitativa del vocabolario in funzione della sfera d'uso del discorso.

La compilazione di grandi dizionari di frequenza richiede l'uso della tecnologia informatica. L'INTRODUZIONE della meccanizzazione e dell'automazione parziali nel processo di lavoro su un dizionario è interessante come esperimento nell'elaborazione meccanica di dizionari per testi diversi. Un tale dizionario richiede un sistema più rigoroso per l'elaborazione e l'accumulo di materiale lessicale. In miniatura, si tratta di un sistema di recupero informazioni in grado di fornire informazioni su vari aspetti del testo e del vocabolario. A questo sistema sono previste fin dall'inizio alcune richieste fondamentali: il numero totale delle parole dell'inventario, le caratteristiche statistiche di una singola parola e di interi dizionari, l'ordinamento delle zone frequenti e rare del dizionario, ecc. per creare automaticamente dizionari inversi per singoli generi e fonti. Molte altre utili informazioni statistiche sulla lingua verranno estratte dalla matrice di informazioni accumulate. Il dizionario delle frequenze del computer crea una base sperimentale per il passaggio a un'automazione più ampia del lavoro sul vocabolario.

I dati statistici dei dizionari di frequenza possono anche essere ampiamente utilizzati per risolvere altri problemi linguistici, ad esempio per analizzare e determinare i mezzi attivi di formazione delle parole della lingua russa moderna, risolvere problemi di miglioramento della grafica e dell'ortografia, che sono legati alla presa in considerazione tenere conto delle informazioni statistiche sul vocabolario (con tutto ciò, è importante tenere conto delle caratteristiche probabilistiche delle combinazioni di grafemi, dei tipi di combinazioni di lettere realizzate nelle parole), della trascrizione pratica e della traslitterazione. I parametri statistici del dizionario saranno utili anche per risolvere problemi di automatizzazione della digitazione, del riconoscimento e della lettura automatica del testo letterale.

I moderni dizionari esplicativi e le grammatiche della lingua russa sono costruiti principalmente sulla base di testi letterari e artistici. Esistono dizionari di frequenza della lingua di A.S. Puskin, A.S. Griboedova, F.M. Dostoevskij, V.V. Vysotsky e molti altri autori. Presso il Dipartimento di Storia e Teoria della Letteratura dello Stato di Smolensk. L'Università Pedagogica lavora da diversi anni alla compilazione di dizionari di frequenza di testi poetici e in prosa. Per questo studio sono stati selezionati dizionari di frequenza di tutti i testi di Pushkin e di altri due poeti dell'età dell'oro: "Woe from Wit" di Griboedov e tutta la poesia di Lermontov; Pasternak e altri cinque poeti della Silver Age - Balmont 1894-1903, "Poems about the Beautiful Lady" di Blok, "Stone" di Mandelstam, "Pillar of Fire" di Gumilyov, "Anno Domini MCMXXI" di Akhmatova e "Sisters of My Life" di Pasternak e altri quattro poeti dell'età del ferro - "Poesie di Yuri Zhivago", "Quando si chiarisce", l'intero corpus di testi di M. Petrovs, "La strada è lontana", "Windshield", "Addio alla neve" e "Ferri di cavallo" di Mezhirov, "Antimirov" di Voznesensky e "Snezhnitsa » Rylenkova.

Va notato che questi dizionari sono di natura diversa: alcuni rappresentano il vocabolario di un'opera drammatica, altri - libri di testi, o più libri, o l'intero corpus delle poesie del poeta. I risultati dell'analisi presentati in questo documento dovrebbero essere presi con cautela, non possono essere considerati assoluti. Allo stesso tempo, con l'aiuto di misure speciali, la differenza nella natura ontologica dei testi può essere ridotta in una certa misura.

Negli ultimi anni, l'opposizione tra discorso colloquiale e libro si è realizzata sempre più chiaramente. Questo problema è discusso in modo particolarmente acuto tra i metodologi che richiedono una svolta nell'insegnamento verso la lingua parlata. Allo stesso tempo, la specificità del discorso colloquiale rimane ancora inspiegabile.

I dizionari sono stati elaborati creando un'applicazione utente nell'ambiente del programma per ufficio EXCEL97. L'applicazione include quattro fogli di lavoro del libro EXCEL: "Foglio del titolo", foglio "Dizionari" con i dati iniziali, "Prossimità" e "Distanze" con i risultati, nonché una serie di macro.

Le informazioni iniziali vengono inserite nel foglio "Dizionari". I dizionari dei testi studiati sono scritti in celle EXCEL, l'ultima colonna S è formata dai risultati ottenuti ed è uguale al numero di parole trovate in altri dizionari. Le tabelle "Prossimità" e "Distanze" contengono misure calcolate di prossimità M, correlazione R e distanza D.

Le macro applicative sono procedure di programmazione basate su eventi scritte in Visual Basic for Application (VBA). Le procedure si basano sugli oggetti della libreria VBA e sui relativi metodi di elaborazione. Pertanto, per le operazioni con i fogli di lavoro dell'applicazione, vengono utilizzati l'oggetto chiave Foglio di lavoro (foglio di lavoro) e il metodo corrispondente di attivazione del foglio Attiva (attiva). L'impostazione dell'intervallo dei dati di origine analizzati sul foglio Dizionario viene eseguita dal metodo Select dell'oggetto Range (intervallo) e il trasferimento delle parole come valori alle variabili viene eseguito come proprietà Value (valore) dello stesso Range oggetto.

Nonostante il fatto che l'analisi della correlazione per rango ci renda cauti sulla dipendenza degli argomenti tra testi diversi, la maggior parte delle parole più frequenti in ogni testo hanno corrispondenze in uno o più altri testi. La colonna S mostra il numero di tali parole tra le 15 parole più frequenti per ciascun autore. Le parole in grassetto compaiono solo nelle parole di un poeta nella nostra tabella. Blok, Akhmatova e Petrovs non hanno affatto parole evidenziate, hanno S = 15. Questi tre poeti hanno le stesse 15 parole più frequenti, differiscono solo per il posto nell'elenco. Ma anche Pushkin, il cui vocabolario è il più originale, ha S = 8, e ci sono 7 parole evidenziate.

I risultati mostrano che esiste un certo strato di vocabolario che concentra i temi principali della poesia. Di norma, queste parole sono brevi: sul numero totale (225) di usi delle parole di una sillaba 88, due sillabe 127, tre sillabe 10. Spesso queste parole rappresentano i principali mitologemmi e possono cadere in coppia: notte - giorno, terra - cielo (sole), Dio - uomo (persone), vita - morte, corpo - anima, Roma - mondo(a Mandel'stam); possono essere combinati in mitologemi di livello superiore: cielo, stella, sole, terra; in una persona, di regola, spiccano il corpo, il cuore, il sangue, il braccio, la gamba, la guancia, gli occhi. Tra gli stati umani, la preferenza è data al sonno e all'amore. La casa e le città appartengono al mondo umano: Mosca, Roma, Parigi. La creatività è rappresentata da lessemi parola E canzone.

Griboedov e Lermontov non hanno quasi parole che denotino la natura tra le parole più frequenti. Hanno tre volte più parole che denotano una persona, parti del suo corpo, elementi del suo mondo spirituale. Pushkin e poeti del ventesimo secolo. le designazioni di uomo e natura sono approssimativamente uguali. In questo importante aspetto dell'argomento, possiamo dire che il ventesimo secolo. seguì Pushkin.

Tema minimo caso tra le parole più frequenti, si trova solo in Griboedov e Pushkin. Lermontov e poeti del ventesimo secolo. lascia il posto a un tema minimale parola. La parola non esclude le azioni (l'interpretazione biblica dell'argomento: nel Nuovo Testamento, tutti gli insegnamenti di Gesù Cristo sono considerati la parola di Dio o la parola di Gesù, e gli apostoli a volte si definiscono ministri della Parola). Il significato sacro della parola lessema si manifesta in modo convincente, ad esempio, nel verso di Pasternak "E l'immagine del mondo, rivelata nella Parola". Il significato sacro del lessema parola in congiunzione e in contrasto con le vicende umane, si manifesta in modo convincente nell'omonima poesia di Gumilyov.

I token che si trovano in un solo testo caratterizzano l'originalità di un determinato libro o di una raccolta di libri. Ad esempio, la parola "mente" è la più frequente nella commedia di Griboedov "Woe from Wit" - ma non ricorre tra le parole frequenti di altri testi. Il tema della mente è di gran lunga il più significativo nella commedia. Questo lessema accompagna l'immagine di Chatsky, e il nome di Chatsky è il più frequente nella commedia. Pertanto, l'opera combina organicamente il nome comune più frequente con il nome proprio più frequente.

Il più alto coefficiente di correlazione collega i temi dei libri tragici "The Pillar of Fire" di Gumilyov e "Anno Domini MCMXXI" di Akhmatova. Tra i 15 sostantivi più frequenti ce ne sono 10 comuni, tra cui sangue, cuore, anima, amore, parola, cielo. Ricordiamo che il libro di Akhmatova includeva una miniatura "Non sarai vivo ...", scritta tra l'arresto di Gumilyov e la sua esecuzione.

I temi della candela e della folla nel materiale studiato si trovano solo nelle "Poesie di Yuri Zhivago". Il tema della candela nei versi del romanzo ha molti significati contestuali: è associato all'immagine di Gesù Cristo, ai temi della fede, dell'immortalità, della creatività, della data dell'amore. La candela è la fonte di luce più importante nelle scene centrali del romanzo. Il tema della folla si sviluppa in connessione con l'idea principale del romanzo, in cui la vita privata di una persona con i suoi valori incrollabili si contrappone all'immoralità del nuovo stato, costruito sui principi del piacere alla folla .

Il lavoro coinvolge anche la terza fase, anch'essa riflessa nel programma, ovvero il calcolo della differenza nei numeri ordinali di parole comuni a due dizionari e la distanza media tra le stesse parole di due dizionari. Questa fase consente di passare dalle tendenze generali nell'interazione dei dizionari identificate con l'aiuto delle statistiche a un livello che si avvicina al testo. Ad esempio, i libri di Gumilyov e Akhmatova sono correlati statisticamente in modo significativo. Osserviamo quali parole si sono rivelate comuni per i loro dizionari e, prima di tutto, scegliamo quelle i cui numeri di serie differiscono minimamente o uguali a zero. Sono queste parole che hanno lo stesso numero di rango e, di conseguenza, sono questi temi minimi nella mente dei due poeti che sono ugualmente importanti. Successivamente, dovresti passare al livello di testi e contesti.

I metodi quantitativi aiutano anche a studiare le caratteristiche dei popoli: i madrelingua. Supponiamo che ci siano 6 casi in russo, non ci sono casi in inglese e in alcune lingue dei popoli del Daghestan il numero di casi raggiunge i 40. L. Perlovsky nel suo articolo "Coscienza, lingua e cultura" correla questi caratteristiche con la tendenza dei popoli all'individualismo o al collettivismo, con la percezione di cose e fenomeni separatamente o in connessione con altri. Dopotutto, è stato nel mondo anglofono (non ci sono casi - la cosa è percepita "da sola") che sono apparsi concetti come libertà individuale, liberalismo e democrazia (noto che uso questi concetti solo in connessione con il lingua, senza alcuna caratteristica valutativa). Nonostante il fatto che tali ipotesi rimangano ancora solo a livello di audaci ipotesi scientifiche, aiutano a guardare i fenomeni già familiari in un modo nuovo.

Come possiamo vedere, le caratteristiche quantitative possono essere applicate in aree linguistiche completamente diverse, il che offusca sempre più i confini tra metodi "esatti" e "umanitari". La linguistica ricorre sempre più all'aiuto non solo della matematica, ma anche della tecnologia informatica per risolvere i suoi problemi.

2.3 Apprendimento Ilinguaggio con metodi di logica formale

Con i metodi non quantitativi della matematica, in particolare con la logica, la moderna linguistica teorica interagisce non meno fruttuosamente che con quelli quantitativi. Il rapido sviluppo delle tecnologie informatiche e la crescita del loro ruolo nel mondo moderno hanno richiesto una revisione dell'approccio all'interazione del linguaggio e della logica in generale.

I metodi della logica sono ampiamente utilizzati nello sviluppo di linguaggi formalizzati, in particolare linguaggi di programmazione, i cui elementi sono alcuni simboli (simili a matematici), scelti (o costruiti da simboli precedentemente selezionati) e interpretati in un certo modo, associati senza uso "tradizionale", comprensione e comprensione delle funzioni degli stessi simboli in altri contesti. Un programmatore si occupa costantemente di logica nel suo lavoro. Il significato della programmazione è proprio quello di insegnare al computer a ragionare (nel senso più ampio del termine). Allo stesso tempo, i metodi di "ragionamento" risultano essere molto diversi. Ogni programmatore passa una certa quantità di tempo alla ricerca di bug nei programmi propri e di altre persone. Cioè, cercare errori nel ragionamento, nella logica. E anche questo lascia il segno. È molto più facile rilevare errori logici nel linguaggio ordinario. La relativa semplicità delle lingue studiate dai logici consente loro di chiarire le strutture di queste lingue in modo più chiaro di quanto sia possibile ai linguisti che analizzano esclusivamente linguaggi naturali complessi. In considerazione del fatto che le lingue studiate dai logici utilizzano relazioni copiate dai linguaggi naturali, i logici possono dare contributi significativi alla teoria generale del linguaggio. La situazione qui è simile a quella che si verifica in fisica: il fisico formula anche teoremi per casi idealmente semplificati che non si verificano affatto in natura - formula leggi per gas ideali, liquidi ideali, parla di moto in assenza di attrito, eccetera. Per questi casi idealizzati si possono stabilire leggi semplici che contribuirebbero enormemente alla comprensione di ciò che sta accadendo nella realtà e di ciò che probabilmente rimarrebbe sconosciuto alla fisica se provasse a considerare la realtà direttamente, in tutta la sua complessità.

Nello studio delle lingue naturali, vengono utilizzati metodi logici in modo che gli studenti di lingue non possano stupidamente "memorizzare" quante più parole possibili, ma comprenderne meglio la struttura. L. Shcherba ha anche usato nelle sue lezioni un esempio di una frase costruita secondo le leggi della lingua russa: "Lo scintillante kuzdra shteko ha bocciato il bokra e arriccia il bokra", e poi ha chiesto agli studenti cosa significasse. Nonostante il significato delle parole nella frase rimanesse poco chiaro (semplicemente non esistono in russo), è stato possibile rispondere chiaramente: "kuzdra" è il soggetto, un sostantivo femminile, al singolare, nominativo, " bokr” è animato, e così via. La traduzione della frase risulta essere qualcosa del genere: "Qualcosa di femminile in una volta ha fatto qualcosa su una specie di creatura maschile, e poi ha iniziato a fare qualcosa del genere per un lungo, graduale con il suo cucciolo". Un esempio simile di testo (artistico) da parole inesistenti, costruito interamente secondo le leggi del linguaggio, è Jabberwock di Lewis Carroll (in Alice nel paese delle meraviglie, Carroll, attraverso il suo personaggio Humpty Dumpty, spiega il significato delle parole che inventato: "cotto" - le otto di sera, quando è ora di cucinare la cena, "chlivky" - fragile e abile, "shorek" - un incrocio tra un furetto, un tasso e un cavatappi, "tuffo" - ​salta, tuffati, gira, "nava" - erba sotto la meridiana (si estende un po' a destra, un po' a sinistra e un po' indietro), "grunt" - grugnisce e ride, "zelyuk" - un tacchino verde, "myumzik" - un uccello; le sue piume sono arruffate e sporgono in tutte le direzioni, come una scopa, "mova" - lontano da casa) .

Uno dei concetti principali della logica moderna e della linguistica teorica, utilizzato nello studio delle lingue di vario calcolo logico e matematico, lingue naturali, per descrivere la relazione tra lingue di diversi "livelli" e per caratterizzare la relazione tra il lingue in esame e le aree tematiche descritte con il loro aiuto, è il concetto di metalinguaggio. Un metalinguaggio è un linguaggio usato per esprimere giudizi su un altro linguaggio, l'oggetto linguaggio. Con l'aiuto di un metalinguaggio, studiano la struttura delle combinazioni di caratteri (espressioni) dell'oggetto linguaggio, dimostrano teoremi sulle sue proprietà espressive, sulla sua relazione con altre lingue, ecc. La lingua studiata è anche chiamata lingua del soggetto in rapporto con questo metalinguaggio. Sia la lingua soggetto che il metalinguaggio possono essere lingue ordinarie (naturali). Il metalinguaggio può differire dal linguaggio oggetto (ad esempio, in un libro di testo inglese per russi, il russo è il metalinguaggio e l'inglese è il linguaggio oggetto), ma può anche coincidere con esso o differire solo parzialmente, ad esempio, nella terminologia speciale (La terminologia linguistica russa è un elemento del metalinguaggio per descrivere la lingua russa, i cosiddetti fattori semantici fanno parte del metalinguaggio per descrivere la semantica delle lingue naturali).

Il concetto di "metalinguage" è diventato molto fruttuoso in connessione con lo studio dei linguaggi formalizzati costruiti nell'ambito della logica matematica. A differenza delle lingue soggetto formalizzate, in questo caso il metalinguaggio, per mezzo del quale la metateoria viene formulata (studiando le proprietà della teoria soggetto formulata nella lingua soggetto), è, di regola, una lingua naturale ordinaria, in qualche modo speciale un frammento di un linguaggio naturale limitato in modo speciale, non contenente alcun tipo di ambiguità , metafore, concetti "metafisici", ecc. elementi del linguaggio ordinario che ne impediscono l'uso come strumento per un'accurata ricerca scientifica. Allo stesso tempo, il metalinguaggio stesso può essere formalizzato e (a prescindere da ciò) diventare oggetto di ricerca svolta per mezzo del metametalinguaggio, e tale serie può essere “pensata” come crescente all'infinito.

La logica ci insegna una fruttuosa distinzione tra l'oggetto-linguaggio e il metalinguaggio. L'oggetto-linguaggio è il soggetto stesso della ricerca logica, e il metalinguaggio è quel linguaggio inevitabilmente artificiale in cui tale ricerca si svolge. Il pensiero logico consiste solo nel formulare le relazioni e la struttura di un linguaggio reale (linguaggio oggetto) nel linguaggio dei simboli (metalinguaggio).

Il metalinguaggio deve comunque essere “non più povero” del suo linguaggio obiettivo (cioè per ogni espressione di quest'ultimo nel metalinguaggio ci deve essere il suo nome, “traduzione”) - altrimenti, se questi requisiti non sono soddisfatti (il che richiede certamente posto nelle lingue naturali, se accordi speciali non prevedono diversamente) sorgono paradossi semantici (antinomie).

Man mano che venivano creati sempre più nuovi linguaggi di programmazione, in connessione con il problema della programmazione dei traduttori, c'era un urgente bisogno di creare metalinguaggi. Attualmente, il metalinguaggio della forma Backus-Naur (abbreviato in BNF) è il più comunemente usato per descrivere la sintassi dei linguaggi di programmazione. È una forma compatta sotto forma di alcune formule simili a quelle matematiche. Per ogni concetto della lingua esiste una metaformula unica (formula normale). Consiste di parti sinistra e destra. Il lato sinistro specifica il concetto definito e il lato destro specifica l'insieme di costrutti linguistici ammissibili che sono combinati in questo concetto. La formula utilizza metacaratteri speciali sotto forma di parentesi angolari, che contengono il concetto in fase di definizione (sul lato sinistro della formula) o un concetto precedentemente definito (sul lato destro), ed è indicata la separazione delle parti sinistra e destra dal metacarattere "::=", il cui significato è equivalente alle parole "per definizione c'è". Le formule metalinguistiche sono incorporate nei traduttori in qualche forma; con il loro aiuto, i costrutti utilizzati dal programmatore vengono verificati per verificarne la conformità formale con uno qualsiasi dei costrutti sintatticamente validi in questo linguaggio. Esistono anche metalingue separate di varie scienze, quindi la conoscenza esiste sotto forma di varie metalingue.

I metodi logici sono serviti anche come base per la creazione di sistemi di intelligenza artificiale basati sul concetto di connessionismo. Il connessionismo è una tendenza speciale nella scienza filosofica, il cui oggetto sono le questioni della conoscenza. Nell'ambito di questa tendenza, si stanno tentando di spiegare le capacità intellettuali di una persona utilizzando reti neurali artificiali. Composte da un gran numero di unità strutturali simili ai neuroni, con un peso assegnato a ciascun elemento che determina la forza della connessione con altri elementi, le reti neurali sono modelli semplificati del cervello umano. Esperimenti con reti neurali di questo tipo hanno dimostrato la loro capacità di imparare a svolgere compiti come il riconoscimento di schemi, la lettura e l'identificazione di semplici strutture grammaticali.

I filosofi iniziarono a interessarsi al connessionismo, poiché l'approccio connessionista prometteva di fornire un'alternativa alla teoria classica della mente e all'idea ampiamente diffusa all'interno di questa teoria che il funzionamento della mente fosse simile all'elaborazione del linguaggio simbolico da parte di un computer digitale. computer. Questo concetto è molto controverso, ma negli ultimi anni ha trovato sempre più sostenitori.

Lo studio logico del linguaggio continua il concetto di linguaggio come sistema di Saussure. Il fatto che continui costantemente conferma ancora una volta l'audacia delle congetture scientifiche dell'inizio del secolo scorso. Dedicherò l'ultima sezione del mio lavoro alle prospettive per lo sviluppo dei metodi matematici in linguistica oggi.

2.4 Prospettive per l'applicazione dei metodi matematici in linguistica

Nell'era della tecnologia informatica, i metodi della linguistica matematica hanno ricevuto una nuova prospettiva di sviluppo. La ricerca di soluzioni ai problemi dell'analisi linguistica è ora sempre più implementata a livello di sistemi informativi. Allo stesso tempo, l'automazione del processo di elaborazione del materiale linguistico, fornendo al ricercatore opportunità e vantaggi significativi, pone inevitabilmente nuove esigenze e compiti per lui.

La combinazione di conoscenza "esatta" e "umanitaria" è diventata terreno fertile per nuove scoperte nel campo della linguistica, dell'informatica e della filosofia.

La traduzione automatica da una lingua all'altra rimane un ramo in rapida crescita della tecnologia dell'informazione. Nonostante il fatto che la traduzione assistita da computer non possa mai essere paragonata in qualità alla traduzione umana (soprattutto per i testi letterari), la macchina è diventata un assistente indispensabile per una persona nella traduzione di grandi volumi di testo. Si ritiene che nel prossimo futuro verranno creati sistemi di traduzione più avanzati, basati principalmente sull'analisi semantica del testo.

Un'area altrettanto promettente è l'interazione tra linguistica e logica, che funge da base filosofica per comprendere la tecnologia dell'informazione e la cosiddetta "realtà virtuale". Nel prossimo futuro, continueranno i lavori per la creazione di sistemi di intelligenza artificiale, anche se, ancora una volta, non sarà mai uguale all'umano nelle sue capacità. Tale competizione non ha senso: ai nostri tempi, la macchina dovrebbe diventare (e diventa) non una rivale, ma un'assistente dell'uomo, non qualcosa del regno della fantasia, ma parte del mondo reale.

Continua lo studio della lingua con metodi statistici, che consente di determinarne con maggiore precisione le proprietà qualitative. È importante che le ipotesi più ardite sul linguaggio trovino la loro dimostrazione matematica, e quindi logica.

La cosa più significativa è che vari rami dell'applicazione della matematica in linguistica, prima abbastanza isolati, negli ultimi anni sono stati correlati tra loro, collegandosi in un sistema coerente, per analogia con il sistema linguistico scoperto un secolo fa da Ferdinand de Saussure e Yvan Baudouin de Courtenay. Questa è la continuità della conoscenza scientifica.

La linguistica nel mondo moderno è diventata la base per lo sviluppo della tecnologia dell'informazione. Finché l'informatica rimarrà una branca in rapido sviluppo dell'attività umana, l'unione di matematica e linguistica continuerà a svolgere il suo ruolo nello sviluppo della scienza.

Conclusione

Nel corso del XX secolo, le tecnologie informatiche hanno fatto molta strada: dall'uso militare a quello pacifico, da una gamma ristretta di obiettivi alla penetrazione in tutti i rami della vita umana. La matematica come scienza ha trovato un significato pratico sempre nuovo con lo sviluppo della tecnologia informatica. Questo processo continua ancora oggi.

Il "tandem" precedentemente impensabile di "fisici" e "parolieri" è diventato una realtà. Per la piena interazione della matematica e dell'informatica con le discipline umanistiche, erano richiesti specialisti qualificati da entrambe le parti. Mentre gli informatici hanno sempre più bisogno di conoscenze umanitarie sistematiche (linguistiche, culturali, filosofiche) per comprendere i cambiamenti nella realtà che li circonda, nell'interazione tra uomo e tecnologia, per sviluppare sempre più nuovi concetti linguistici e mentali, per scrivere programmi, quindi qualsiasi "Lettere" nel nostro tempo per la loro crescita professionale deve padroneggiare almeno le basi del lavoro con un computer.

La matematica, essendo strettamente interconnessa con l'informatica, continua a svilupparsi e ad interagire con le scienze naturali e umanistiche. Nel nuovo secolo, la tendenza alla matematizzazione della scienza non si indebolisce, ma anzi aumenta. Sulla base di dati quantitativi si comprendono le leggi dello sviluppo della lingua, le sue caratteristiche storiche e filosofiche.

Il formalismo matematico è più adatto per descrivere modelli in linguistica (come, in effetti, in altre scienze - sia umanistiche che naturali). La situazione a volte si sviluppa nella scienza in modo tale che senza l'uso di un linguaggio matematico appropriato è impossibile comprendere la natura fisica, chimica, ecc. processo non è possibile. Creare un modello planetario dell'atomo, il famoso fisico inglese del XX secolo. E. Rutherford ha incontrato difficoltà matematiche. All'inizio la sua teoria non fu accettata: non suonava convincente, e la ragione di ciò era l'ignoranza di Rutherford della teoria della probabilità, sulla base del meccanismo di cui era possibile comprendere solo la rappresentazione del modello delle interazioni atomiche. Rendendosi conto di ciò, già a quel tempo uno scienziato eccezionale, detentore del Premio Nobel, si iscrisse al seminario del matematico Professor Lamb e per due anni, insieme agli studenti, frequentò un corso ed elaborò un seminario sulla teoria della probabilità . Sulla base di ciò, Rutherford è stato in grado di descrivere il comportamento dell'elettrone, conferendo al suo modello strutturale un'accuratezza convincente e ottenendo riconoscimenti. Lo stesso è con la linguistica.

Ciò pone la domanda, cosa c'è di così matematico nei fenomeni oggettivi, grazie al quale possono essere descritti nel linguaggio della matematica, nel linguaggio delle caratteristiche quantitative? Si tratta di unità omogenee di materia distribuite nello spazio e nel tempo. Quelle scienze che sono andate più lontano di altre verso l'isolamento dell'omogeneità, e risultano essere più adatte per l'uso della matematica in esse.

Internet, che si è sviluppato rapidamente negli anni '90, ha riunito rappresentanti di vari paesi, popoli e culture. Nonostante il fatto che l'inglese continui ad essere la lingua principale della comunicazione internazionale, Internet è diventato multilingue ai nostri tempi. Ciò ha portato allo sviluppo di sistemi di traduzione automatica di successo commerciale ampiamente utilizzati in vari campi dell'attività umana.

Le reti di computer sono diventate oggetto di riflessione filosofica: sono stati creati sempre più nuovi concetti linguistici, logici, di visione del mondo che aiutano a comprendere la "realtà virtuale". In molte opere d'arte sono stati creati scenari - più spesso pessimistici - sul dominio delle macchine su una persona e della realtà virtuale - sul mondo esterno. Lungi dall'essere sempre tali previsioni si sono rivelate prive di significato. La tecnologia dell'informazione non è solo un'industria promettente per investire la conoscenza umana, è anche un modo per controllare le informazioni e, di conseguenza, il pensiero umano.

Questo fenomeno ha sia un lato negativo che uno positivo. Negativo - perché il controllo sulle informazioni è contrario al diritto umano inalienabile al libero accesso ad esse. Positivo - perché la mancanza di questo controllo può portare a conseguenze catastrofiche per l'umanità. Basti ricordare uno dei film più saggi dell'ultimo decennio - "Quando il mondo finisce" di Wim Wenders, i cui personaggi sono completamente immersi nella "realtà virtuale" dei propri sogni registrati su un computer. Allo stesso tempo, nessuno scienziato e nessun artista può dare una risposta univoca alla domanda: cosa attende la scienza e la tecnologia in futuro.

L'attenzione al "futuro", a volte apparentemente fantastica, era una caratteristica distintiva della scienza a metà del XX secolo, quando gli inventori cercavano di creare modelli perfetti di tecnologia che potessero funzionare senza l'intervento umano. Il tempo ha mostrato la natura utopica di tale ricerca. Allo stesso tempo, sarebbe superfluo condannare gli scienziati per questo - senza il loro entusiasmo negli anni '50 -'60, la tecnologia dell'informazione non avrebbe fatto un salto così potente negli anni '90 e non avremmo quello che abbiamo adesso.

Gli ultimi decenni del ventesimo secolo hanno cambiato le priorità della scienza: la ricerca, il pathos inventivo hanno lasciato il posto all'interesse commerciale. Ancora una volta, questo non è né buono né cattivo. Questa è una realtà in cui la scienza è sempre più integrata nella vita di tutti i giorni.

Il 21 ° secolo ha continuato questa tendenza e ai nostri tempi dietro le invenzioni non ci sono solo fama e riconoscimento, ma, prima di tutto, denaro. Questo è anche il motivo per cui è importante garantire che le ultime conquiste della scienza e della tecnologia non cadano nelle mani di gruppi terroristici o regimi dittatoriali. Il compito è difficile fino all'impossibilità; realizzarlo il più possibile è compito dell'intera comunità mondiale.

L'informazione è un'arma e le armi non sono meno pericolose delle armi nucleari o chimiche, solo che non agiscono fisicamente, ma piuttosto psicologicamente. L'umanità ha bisogno di pensare a ciò che è più importante per lei in questo caso: libertà o controllo.

Gli ultimi concetti filosofici relativi allo sviluppo delle tecnologie dell'informazione e un tentativo di comprenderle hanno mostrato i limiti sia del materialismo delle scienze naturali, che ha dominato durante il XIX e l'inizio del XX secolo, sia dell'idealismo estremo, che nega il significato del mondo materiale . È importante per il pensiero moderno, in particolare il pensiero occidentale, superare questo dualismo nel pensare, quando il mondo circostante è chiaramente diviso in materiale e ideale. Il percorso per questo è un dialogo di culture, un confronto di diversi punti di vista sui fenomeni circostanti.

Paradossalmente, la tecnologia dell'informazione può svolgere un ruolo importante in questo processo. Le reti di computer, e in particolare Internet, non sono solo una risorsa per l'intrattenimento e una vigorosa attività commerciale, sono anche un mezzo di comunicazione significativa e controversa tra rappresentanti di varie civiltà nel mondo moderno, nonché per un dialogo tra passato e il presente. Possiamo dire che Internet spinge i confini spaziali e temporali.

E nel dialogo delle culture attraverso la tecnologia dell'informazione, il ruolo della lingua come il più antico mezzo di comunicazione universale è ancora importante. Ecco perché la linguistica, in interazione con la matematica, la filosofia e l'informatica, ha vissuto la sua seconda nascita e continua a svilupparsi ancora oggi. La tendenza del presente continuerà in futuro - "fino alla fine del mondo", come predisse lo stesso V. Wenders 15 anni fa. È vero, non si sa quando avverrà questa fine, ma è importante adesso, perché il futuro prima o poi diventerà comunque presente.

Allegato 1

Ferdinando di Saussure

Il linguista svizzero Ferdinand de Saussure (1857-1913) è ampiamente considerato il fondatore della linguistica moderna nei suoi tentativi di descrivere la struttura del linguaggio piuttosto che la storia di particolari lingue e forme linguistiche. Infatti, il metodo dello strutturalismo negli studi linguistici e letterari e un ramo significativo della semiotica trovano il loro principale punto di partenza nel suo lavoro all'inizio del XX secolo. È stato persino sostenuto che il complesso di strategie e concezioni che è stato chiamato "poststrutturalismo" - il lavoro di Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e altri - è suggerito dal lavoro di Saussure in linguistica e letture anagrammatiche della tarda poesia latina, dal modernismo letterario alla psicoanalisi e alla filosofia del primo Novecento. Come sostengono Algirdas Julien Greimas e Joseph Courtes in Semiotics and Language: An Analytic Dictionary, sotto il titolo "Interpretazione", all'inizio del XX secolo sorse un nuovo modo di interpretare che essi identificano con la linguistica saussuriana, la fenomenologia husserliana e la psicoanalisi freudiana. In questa modalità, "l'interpretazione non è più questione di attribuire un dato contenuto a una forma che altrimenti ne sarebbe sprovvista; è piuttosto una parafrasi che formula in altro modo il contenuto equivalente di un elemento significante all'interno di un dato sistema semiotico" ( 159). in questa concezione di "interpretazione", forma e contenuto non sono distinti; anzi, ogni "forma" è, alternativamente, anche un "contenuto" semantico, una "forma significante", cosicché l'interpretazione offre una parafrasi analogica di qualcosa che già significa all'interno di qualche altro sistema di significazione.

Tale reinterpretazione della forma e della comprensione - che Claude Lévi-Strauss descrive in una delle sue articolazioni più programmatiche del concetto di strutturalismo, in "Struttura e forma: riflessioni su un'opera di Vladimir Propp" - è implicita nel Corso postumo di Saussure in Linguistica generale (1916, trad., 1959, 1983). Durante la sua vita, Saussure pubblicò relativamente poco, e la sua opera principale, il Corso, fu la trascrizione da parte dei suoi studenti di diversi corsi di linguistica generale che tenne nel 1907-11. Nel Corso Saussure invocava lo studio "scientifico" del linguaggio in contrapposizione al lavoro di linguistica storica che era stato svolto nel diciannovesimo secolo. Quel lavoro è una delle grandi conquiste dell'intelletto occidentale: prendere parole particolari come elementi costitutivi di linguistica, linguistica storica (o "diacronica") ha tracciato l'origine e lo sviluppo delle lingue occidentali da una presunta fonte linguistica comune, prima una lingua "indoeuropea" e poi una precedente "p lingua roto-indoeuropea".

È proprio questo studio delle occorrenze uniche delle parole, con il concomitante presupposto che l'"unità" fondamentale del linguaggio sia, in effetti, l'esistenza positiva di questi "elementi-parola", che Saussure ha messo in discussione. Il suo lavoro è stato un tentativo di ridurre la massa di fatti sul linguaggio, studiati così minuziosamente dalla linguistica storica, a un numero gestibile di proposizioni. La "scuola comparata" della filologia ottocentesca, dice Saussure nel Corso, "non è riuscita a fondare la vera scienza della linguistica" perché "non è riuscita a ricercare la natura del suo oggetto di studio" ( 3). Quella "natura", sostiene, si trova non semplicemente nelle parole "elementari" che un linguaggio comprende - gli apparenti fatti "positivi" (o "sostanze") del linguaggio - ma nelle relazioni formali che danno origine a quelle "sostanze".

Il riesame sistematico del linguaggio operato da Saussure si basa su tre presupposti: il primo è che lo studio scientifico del linguaggio ha bisogno di sviluppare e studiare il sistema piuttosto che la storia dei fenomeni linguistici, per questo egli distingue tra le occorrenze particolari del linguaggio - il suo particolare "eventi-discorso", che designa come parole - e l'oggetto proprio della linguistica, il sistema (o "codice") che governa quegli eventi, che designa come langue. Un tale studio sistematico, inoltre, richiede un "sincronico" concezione del rapporto tra gli elementi del linguaggio in un determinato istante piuttosto che lo studio "diacronico" dello sviluppo del linguaggio attraverso la storia.

Da questo presupposto nacque quello che Roman Jakobson nel 1929 venne a designare come "strutturalismo", in cui "qualsiasi insieme di fenomeni esaminati dalla scienza contemporanea è trattato non come un agglomerato meccanico ma come un tutto strutturale la concezione meccanica dei processi cede alla questione della loro funzione" ("Romantico" 711). In questo passaggio Jakobson sta articolando l'intenzione di Saussure di definire la linguistica come un sistema scientifico in opposizione a un semplice resoconto "meccanico" degli incidenti storici. ora chiamiamolo "strutturale" - linguistica: che gli elementi di base del linguaggio possono essere studiati solo in relazione alle loro funzioni piuttosto che in relazione alle loro cause. Le "parole") europee, quegli eventi ed entità devono essere situati all'interno di un quadro sistemico in cui sono messi in relazione con altri cosiddetti eventi ed entità.Si tratta di un radicale riorientamento nella concezione dell'esperienza e dei fenomeni, la cui importanza il filosofo Ernst Cassirer ha paragonato alla "nuova scienza di Galileo che nel XVII secolo cambiò tutto il nostro concetto del mondo fisico" (citato in Culler, Pursuit 2 4). Questo cambiamento, come notano Greimas e Courtes, riconcepisce "l'interpretazione" e quindi riconcepisce la spiegazione e la comprensione stesse. Invece di spiegare "essendo in termini di cause di un fenomeno, così che, come "effetto", è in qualche modo subordinato alle sue cause, la spiegazione qui consiste nel subordinare un fenomeno alla sua "funzione" orientata al futuro o "scopo." La spiegazione non è più indipendente dalle intenzioni o dagli scopi umani (anche se tali intenzioni possono essere impersonali, comunitarie o, in termini freudiani, "inconsce").

Nella sua linguistica Saussure compie questa trasformazione proprio nella ridefinizione della "parola" linguistica, che descrive come il "segno" linguistico e definisce in termini funzionalistici. Il segno, sostiene, è l'unione di "un concetto e un'immagine sonora", che ha chiamato "significato e significante" (66-67; la traduzione di Roy Harris del 1983 offre i termini "significazione" e "segnale"). La natura della loro "combinazione" è "funzionale" in quanto né il significato né il significante sono la "causa" dell'altro, ma "ciascuno i suoi valori dall'altro" (8). elemento del linguaggio, il segno , relazionale e sottopone ad analisi rigorosa l'assunto di base della linguistica storica, vale a dire l'identità delle unità elementari del linguaggio e del significato (cioè le "parole"). la parola "albero" come la "stessa" parola non è perché la parola è definita da qualità intrinseche - non è un "agglomerato meccanico" di tali qualità - ma perché è definita come un elemento di un sistema, il "tutto strutturale", "del linguaggio.

Tale definizione relazionale (o "diacritica") di un'entità governa la concezione di tutti gli elementi del linguaggio nella linguistica strutturale. Ciò è più evidente nel risultato più impressionante della linguistica saussuriana, lo sviluppo dei concetti di "fonemi" e "caratteristiche distintive" del linguaggio. I fonemi sono le più piccole unità articolate e significanti di una lingua. Non sono i suoni che ricorrono nel linguaggio, ma le "immagini sonore" menzionate da Saussure, che vengono percepite dai parlanti - apprese fenomenicamente - come portatrici di significato. (Così, Elmar Holenstein descrive la linguistica di Jakobson, che segue Saussure in modi importanti, come "strutturalismo fenomenologico"). . . è una realtà fenomenologica e non empirica; non è l'opera in sé, ma un insieme di relazioni funzionali che si situano nella coscienza di un collettivo (generazione, ambiente, ecc.)» (citato in Galan 35). Allo stesso modo Lévi-Strauss, il principale portavoce dello strutturalismo francese , osservava nel 1960 che "la struttura non ha un contenuto distinto; esso stesso è contenuto, e l'organizzazione logica in cui è contenuto è concepito come una proprietà del reale» (167; vedi anche Jakobson, Fundamentals 27-28).

I fonemi, dunque, i più piccoli elementi percepibili del linguaggio, non sono oggetti positivi ma una "realtà fenomenologica". In inglese, ad esempio, il fonema /t/ può essere pronunciato in molti modi diversi, ma in tutti i casi un anglofono lo riconoscerà come funzionante come /t/. Una t aspirata (cioè una t pronunciata con un respiro simile ad una h dopo di essa), un suono t acuto o basso, un suono t esteso e così via, funzioneranno tutti allo stesso modo nel distinguere il significato di "to" e "do" in inglese. Inoltre, le differenze tra le lingue sono tali che le variazioni fonologiche in una lingua possono costituire fonemi distinti in un'altra; quindi, l'inglese distingue tra /l/ e /r/, mentre altre lingue sono strutturate in modo tale che queste articolazioni sono considerate variazioni dello stesso fonema (come la t aspirata e non aspirata in inglese). In ogni linguaggio naturale, il vasto numero di parole possibili è una combinazione di un piccolo numero di fonemi. L'inglese, ad esempio, possiede meno di 40 fonemi che si combinano per formare oltre un milione di parole diverse.

I fonemi del linguaggio sono essi stessi strutture sistematicamente organizzate di caratteristiche. Negli anni '20 e '30, seguendo l'esempio di Saussure, Jakobson e N. S. Trubetzkoy isolarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura fisiologica degli organi del linguaggio - lingua, denti, corde vocali e così via - che Saussure menziona nel Corso e che Harris descrive come "fonetica fisiologica" ( 39; la precedente traduzione di Baskin usa il termine "fonologia" [(1959) 38]) - e si combinano in "fasci" di opposizioni binarie per formare fonemi. Ad esempio, in inglese la differenza tra /t/ e /d/ è la presenza o l'assenza di "voce" (l'impegno delle corde vocali), e sul piano della sonorizzazione questi fonemi si definiscono reciprocamente. In questo modo, la fonologia è un esempio specifico di una regola generale del linguaggio descritta da Saussure: Nel linguaggio ci sono solo differenze. ancora più importante: una differenza implica generalmente termini positivi tra i quali si stabilisce la differenza; ma nella lingua ci sono solo differenze senza termini positivi. Sia che prendiamo il significato o il significante, la lingua non ha né idee né suoni che esistevano prima del sistema linguistico. (120)

In questo quadro, le identità linguistiche sono determinate non da qualità intrinseche ma da relazioni sistemiche ("strutturali").

Ho detto che la fonologia "ha seguito l'esempio" di Saussure, perché anche se la sua analisi della fisiologia della produzione linguistica "sarebbe oggi chiamata", come dice Harris, "fisica", in opposizione a "psicologica" o "funzionale". "" (Lettura 49), di conseguenza nel Corso ha articolato la direzione e le linee di un'analisi funzionale del linguaggio. Allo stesso modo, la sua unica opera pubblicata estesa, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoria sul sistema primitivo delle vocali nelle lingue indoeuropee), apparsa nel 1878, si collocava pienamente all'interno del progetto ottocentesco. linguistica storica del sec. Tuttavia, all'interno di questo lavoro, come ha sostenuto Jonathan Culler, Saussure ha dimostrato "la fecondità di pensare il linguaggio come un sistema di elementi puramente relazionali, anche quando lavora al compito di ricostruzione storica" ​​(Saussure 66). Analizzando le relazioni strutturali sistematiche tra i fonemi per tenere conto dei modelli di alternanza vocalica nelle lingue indoeuropee esistenti, Saussure suggerì che oltre a diversi fonemi diversi /a/, doveva esserci un altro fonema che poteva essere descritto formalmente. "Ciò che rende il lavoro di Saussure così impressionante", conclude Culler, "è il fatto che quasi cinquant'anni dopo, quando l'ittita cuneiforme fu scoperto e decifrato, si scoprì che conteneva un fonema, scritto h, che si comportava come aveva predetto Saussure. . Aveva scoperto, con un'analisi puramente formale, quelli che oggi sono conosciuti come i laringei dell'indoeuropeo" (66).

Questa concezione della determinazione relazionale o diacritica degli elementi di significazione, implicita ed esplicita nel Corso, suggerisce un terzo assunto che governa la linguistica strutturale, ciò che Saussure chiama "l'arbitrarietà del segno". Con ciò intende che la relazione tra significante e significato nel linguaggio non è mai necessaria (o "motivata"): si potrebbe facilmente trovare il suono significante arbre come l'albero significante da unire al concetto "albero". Ma più di questo, significa che anche il significato è arbitrario: si potrebbe facilmente definire il concetto di "albero" per la sua qualità legnosa (che escluderebbe le palme) come per la sua dimensione (che esclude le "basse piante legnose" che noi chiama cespugli). Ciò dovrebbe chiarire che la numerazione delle ipotesi che ho presentato non rappresenta un ordine di priorità: ciascuna assunzione - la natura sistemica della significazione (compresa meglio studiando il linguaggio "in modo sincrono"), la natura relazionale o "diacritica" degli elementi della significazione, l'arbitrarietà dei segni - deriva il suo valore dagli altri.

Cioè, la linguistica saussuriana i fenomeni che studia nelle relazioni generali di combinazione e contrasto nel linguaggio. In questa concezione, il linguaggio è sia il processo di articolazione del significato (significazione) sia il suo prodotto (comunicazione), e queste due funzioni del linguaggio non sono né identiche né pienamente congruenti (vedi Schleifer, "Deconstruction"). Qui possiamo vedere l'alternanza tra forma e contenuto che Greimas e Courtes descrivono nell'interpretazione modernista: il linguaggio presenta contrasti che definiscono formalmente le sue unità, e queste unità si combinano su livelli successivi per creare il contenuto significante. Poiché gli elementi del linguaggio sono arbitrari, inoltre, né il contrasto né la combinazione possono dirsi fondamentali. Così, nel linguaggio i tratti distintivi si combinano per formare fonemi contrastanti su un altro livello di apprensione, i fonemi si combinano per formare morfemi contrastanti, i morfemi si combinano per formare parole, le parole si combinano per formare frasi e così via. In ogni caso, l'intero fonema, o parola, o frase, e così via, è maggiore della somma delle sue parti (proprio come l'acqua, H2O, nell'esempio di Saussure [(1959) 103] è più dell'agglomerato meccanico di idrogeno e ossigeno).

I tre presupposti del Corso di Linguistica Generale hanno portato Saussure a invocare una nuova scienza del XX secolo che andasse oltre la scienza linguistica per studiare "la vita dei segni all'interno della società". Saussure chiamò questa scienza "semiologia (dal greco semeion "segno")" (16). La "scienza" della semiotica, così come venne praticata nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, allargò lo studio del linguaggio e delle strutture linguistiche agli artefatti letterari costituiti (o articolati) da quelle strutture. Per tutta l'ultima parte della sua carriera, inoltre, anche mentre teneva i corsi di linguistica generale, Saussure proseguì la propria analisi "semiotica" della tarda poesia latina nel tentativo di scoprire anagrammi deliberatamente nascosti di nomi propri. Il metodo di studio era per molti versi l'opposto del razionalismo funzionale delle sue analisi linguistiche: esso tentava, come accenna Saussure in uno dei 99 quaderni in cui proseguiva questo studio, di esaminare sistematicamente il problema del "caso", che " diventa il fondamento inevitabile di tutto" (citato in Starobinski 101). Tale studio, come afferma lo stesso Saussure, si concentra sul "fatto materiale" del caso e del significato (cit. 101), cosicché la "parola-tema" di cui Saussure cerca l'anagramma, come sostiene Jean Starobinski, "è, per il poeta , uno strumento, e non un germe vitale del poema. Il poema è tenuto a reimpiegare i materiali fonici della parola-tema" (45). In questa analisi, Starobinski afferma: "Saussure non si è perso nella ricerca di significati nascosti". Invece, il suo lavoro sembra dimostrare un desiderio di eludere tutti i problemi che sorgono dalla coscienza: "Poiché la poesia non si realizza solo in parole ma è qualcosa che nasce dalle parole, sfugge al controllo arbitrario della coscienza per dipendere esclusivamente da una sorta di legalità linguistica "(121).

Cioè, il tentativo di Saussure di scoprire i nomi propri nella tarda poesia latina - ciò che Tzvetan Todorov chiama la riduzione di una "parola". . . al suo significante” (266) – sottolinea uno degli elementi che governavano la sua analisi linguistica, l'arbitrarietà del segno. una sostanza" - che eliminano effettivamente la semantica come principale oggetto di analisi.) Come conclude Todorov, il lavoro di Saussure appare oggi notevolmente omogeneo nel suo rifiuto di accettare i fenomeni simbolici. . . . Nella sua ricerca sugli anagrammi presta attenzione solo ai fenomeni di ripetizione, non a quelli di evocazione. . . . Nei suoi studi sui Nibelunghi riconosce i simboli solo per attribuirli a letture errate: poiché non sono intenzionali, i simboli non esistono. Infine nei suoi corsi di linguistica generale contempla l'esistenza della semiologia, e quindi dei segni diversi da quelli linguistici; ma questa affermazione è subito limitata dal fatto che la semiologia si dedica a un solo tipo di segni: quelli arbitrari. (269-70)

Se questo è vero, è perché Saussure non poteva concepire l'"intenzione" senza soggetto; non poteva del tutto sfuggire all'opposizione tra forma e contenuto che il suo lavoro tanto metteva in discussione. Invece, ha fatto ricorso alla "legalità linguistica". Situato tra, da un lato, le concezioni ottocentesche della storia, della soggettività e del modo di interpretazione causale governato da queste concezioni e, dall'altro, le concezioni "strutturaliste" novecentesche di quello che Lévi-Strauss chiamava "kantismo senza un soggetto trascendentale" (citato in Connerton 23) - concetti che cancellano l'opposizione tra forma e contenuto (o soggetto e oggetto) e la gerarchia tra primo piano e sfondo nello strutturalismo in piena regola, nella psicoanalisi e persino nella meccanica quantistica - opera di Ferdinand de Saussure in linguistica e semiotica circoscrive un momento significativo nello studio del significato e della cultura.

Ronald Schleifer

Allegato 2

Ferdinand de Saussure (traduzione)

Il linguista svizzero Ferdinand de Saussure (1857-1913) è considerato il fondatore della linguistica moderna, grazie ai suoi tentativi di descrivere la struttura della lingua, piuttosto che la storia delle singole lingue e delle forme delle parole. In generale, le basi dei metodi strutturali nella linguistica e nella critica letteraria e, in larga misura, la semiotica furono poste nelle sue opere all'inizio del ventesimo secolo. È dimostrato che i metodi e i concetti del cosiddetto "post-strutturalismo", sviluppati nelle opere di Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e altri, risalgono alle opere linguistiche di Saussure e Letture anagrammatiche della poesia tardoromana. Va notato che il lavoro di Saussure sulla linguistica e l'interpretazione linguistica aiuta a collegare un'ampia gamma di discipline intellettuali - dalla fisica alle innovazioni letterarie, alla psicoanalisi e alla filosofia del primo Novecento. A. J. Greimas e J. Kurte scrivono in Semiotics and Language: “Un dizionario analitico dal titolo “Interpretazione” come nuovo tipo di interpretazione è apparso all'inizio del XX secolo insieme alla linguistica di Saussure, alla fenomenologia di Husserl e alla psicoanalisi di Freud. In tal caso, «l'interpretazione non è l'attribuzione di un dato contenuto a una forma che altrimenti ne sarebbe priva, ma è una parafrasi che formula in altro modo lo stesso contenuto di un elemento significante all'interno di un dato sistema semiotico» (159). ). In questa concezione di "interpretazione", forma e contenuto sono inseparabili; al contrario, ogni forma è piena di significato semantico ("forma significativa"), quindi l'interpretazione offre una nuova, simile rivisitazione di qualcosa di significativo in un altro sistema di segni.

Una simile comprensione della forma e del contenuto, presentata da Claude Lévi-Strauss in una delle opere programmatiche dello strutturalismo, ("Struttura e forma: riflessioni sulle opere di Vladimir Propp"), può essere vista nel libro postumo di Saussure, A Course in Linguistica generale (1916, trad., 1959, 1983). Durante la sua vita, Saussure pubblicò poco, "Corso" - la sua opera principale - fu raccolto dagli appunti degli studenti che frequentarono le sue lezioni di linguistica generale nel 1907-11. Nel Corso, Saussure invocava uno studio "scientifico" del linguaggio, contrapponendolo alla linguistica storico-comparativa ottocentesca. Quest'opera può essere considerata una delle più grandi conquiste del pensiero occidentale: prendendo come base singole parole come elementi strutturali della lingua, la linguistica storica (o "diacronica") ha dimostrato l'origine e lo sviluppo delle lingue dell'Europa occidentale a partire una lingua comune, indoeuropea - e un precedente proto-indoeuropeo.

È proprio questo studio delle occorrenze uniche delle parole, con il concomitante presupposto che l'"unità" fondamentale del linguaggio sia, in effetti, l'esistenza positiva di questi "elementi verbali" che Saussure ha messo in discussione. Il suo lavoro è stato un tentativo di ridurre a un piccolo numero di teoremi i molti fatti sulla lingua studiati casualmente dalla linguistica comparata. La scuola filologica comparata dell'Ottocento, scrive Saussure, "non è riuscita a creare una vera e propria scuola di linguistica" perché "non ha compreso l'essenza dell'oggetto di studio" (3). Questa "essenza", sostiene, risiede non solo nelle singole parole - le "sostanze positive" del linguaggio - ma anche nelle connessioni formali che aiutano queste sostanze ad esistere.

Il "test" del linguaggio di Saussure si basa su tre presupposti. In primo luogo, la comprensione scientifica del linguaggio non si basa su un fenomeno storico, ma su un fenomeno strutturale. Pertanto, ha distinto tra i singoli fenomeni del linguaggio - "eventi del discorso", che definisce "parole" - e il proprio, a suo avviso, oggetto di studio della linguistica, il sistema (codice, struttura) che controlla questi eventi ( "lingua"). Uno studio così sistematico, inoltre, richiede una concezione "sincrona" del rapporto tra gli elementi del linguaggio in un dato momento, piuttosto che uno studio "diacronico" dello sviluppo del linguaggio attraverso la sua storia.

Questa ipotesi è stata l'antesignana di quello che Roman Jakobson nel 1929 chiamerà "strutturalismo" - una teoria in cui "qualsiasi insieme di fenomeni indagati dalla scienza moderna è considerato non come un accumulo meccanico, ma come un insieme strutturale in cui la componente costruttiva è correlata con la funzione" ("Romantico" 711). In questo passaggio Jakobson formulava l'idea di Saussure di definire il linguaggio come una struttura, in contrapposizione all'enumerazione "meccanica" degli eventi storici. Inoltre, Jakobson sviluppa un'altra ipotesi saussuriana, che divenne il precursore della linguistica strutturale: gli elementi di base del linguaggio dovrebbero essere studiati in connessione non tanto con le loro cause, ma con le loro funzioni. Fenomeni ed eventi separati (diciamo, la storia dell'origine delle singole parole indoeuropee) dovrebbero essere studiati non da soli, ma in un sistema in cui sono correlati con componenti simili. Questa fu una svolta radicale nel confronto dei fenomeni con la realtà circostante, il cui significato il filosofo Ernst Cassirer paragonò alla "scienza di Galileo, che nel XVII secolo capovolse le idee sul mondo materiale", di conseguenza, le spiegazioni stesse. I fenomeni iniziarono ad essere interpretati non in relazione alle cause del loro verificarsi, ma in relazione all'effetto che possono avere nel presente e futuro... L'interpretazione ha cessato di essere indipendente dalle intenzioni di una persona (nonostante il fatto che le intenzioni possano essere impersonali, “inconscio” nel senso freudiano del termine).

Nella sua linguistica, Saussure mostra questa svolta soprattutto nel mutamento del concetto di parola in linguistica, che definisce come segno e descrive in funzione delle sue funzioni. Un segno per lui è una combinazione di suono e significato, "significato e designazione" (66-67; nella traduzione inglese del 1983 di Roy Harris - "significazione" e "segnale"). La natura di questo composto è "funzionale" (né l'uno né l'altro elemento possono esistere l'uno senza l'altro); inoltre, "l'uno prende in prestito qualità dall'altro" (8). Così, Saussure definisce il principale elemento strutturale del linguaggio - il segno - e pone alla base della linguistica storica l'identità dei segni alle parole, che richiede un'analisi particolarmente rigorosa. Pertanto, possiamo comprendere diversi significati, diciamo, della stessa parola "albero" - non perché la parola sia solo un insieme di determinate qualità, ma perché è definita come un elemento nel sistema dei segni, nel "tutto strutturale", nella lingua.

Tale concetto di unità relativo ("diacritico") è alla base del concetto di tutti gli elementi del linguaggio nella linguistica strutturale. Ciò è particolarmente evidente nella scoperta più originale della linguistica saussuriana, nello sviluppo del concetto di "fonemi" e di "tratti distintivi" del linguaggio. I fonemi sono la più piccola delle unità linguistiche parlate e significative. Non sono solo suoni che ricorrono nella lingua, ma "immagini sonore", osserva Saussure, che sono percepite dai madrelingua come dotate di significato. (Va notato che Elmar Holenstein chiama la linguistica di Jakobson, che continua le idee ei concetti di Saussure nelle sue disposizioni principali, "strutturalismo fenomenologico"). Ecco perché il principale oratore della Scuola di strutturalismo di Praga, Jan Mukarowski, osservò nel 1937 che “la struttura. . . non un concetto empirico, ma fenomenologico; non è il risultato in sé, ma un insieme di relazioni significative della coscienza collettiva (generazione, altri, ecc.)”. Un pensiero simile fu espresso nel 1960 da Lévi-Strauss, capofila dello strutturalismo francese: “La struttura non ha un contenuto definito; è di per sé significativo, e la costruzione logica in cui è racchiuso è l'impronta della realtà.

A loro volta, i fonemi, in quanto i più piccoli elementi linguistici accettabili per la percezione, rappresentano una "realtà fenomenologica" integrale separata. Ad esempio, in inglese, il suono "t" può essere pronunciato in modo diverso, ma in tutti i casi una persona che parla inglese lo percepirà come "t". Aspirato, alzato o abbassato, un suono "t" lungo, ecc. distinguerà ugualmente il significato delle parole "to" e "do". Inoltre, le differenze tra le lingue sono tali che varietà di un suono in una lingua possono corrispondere a diversi fonemi in un'altra; ad esempio, "l" e "r" in inglese sono diverse, mentre in altre lingue sono varietà dello stesso fonema (come la "t" inglese, pronunciata con e senza aspirazione). Il vasto vocabolario di qualsiasi linguaggio naturale è un insieme di combinazioni di un numero molto minore di fonemi. In inglese, ad esempio, vengono utilizzati solo 40 fonemi per pronunciare e scrivere circa un milione di parole.

I suoni di una lingua sono un insieme di caratteristiche sistematicamente organizzato. Negli anni '20 -'30, seguendo Saussure, Jacobson e N.S. Trubetskoy individuarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura degli organi della parola - lingua, denti, corde vocali - Saussure lo nota nel "Corso di linguistica generale", e Harris lo chiama "fonetica fisiologica" (nella precedente traduzione di Baskin, il termine "fonologia " è usato) - sono collegati in "nodi » durg contro un amico per emettere suoni. Ad esempio, in inglese, la differenza tra "t" e "d" è la presenza o l'assenza di "voce" (la tensione delle corde vocali), e il livello di voce che distingue un fonema da un altro. Pertanto, la fonologia può essere considerata un esempio della regola linguistica generale descritta da Saussure: "Ci sono solo differenze nella lingua". Ancora più importante non è questo: la differenza di solito implica le condizioni esatte tra le quali si trova; ma nella lingua ci sono solo differenze senza condizioni precise. Che si tratti di "designazione" o "significato", nella lingua non ci sono né concetti né suoni che sarebbero esistiti prima dello sviluppo del sistema linguistico.

In una tale struttura, le analogie linguistiche sono definite non con l'aiuto delle loro qualità intrinseche, ma con l'aiuto di relazioni di sistema ("strutturali").

Ho già accennato al fatto che la fonologia nel suo sviluppo si basava sulle idee di Saussure. Sebbene la sua analisi della fisiologia linguistica nei tempi moderni, dice Harris, "sarebbe chiamata 'fisica', in contrapposizione a 'psicologica' o 'funzionale', in The Course ha chiaramente articolato la direzione e i principi di base dell'analisi funzionale del linguaggio. La sua unica opera pubblicata durante la sua vita, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Note sul sistema vocalico originario nelle lingue indoeuropee), pubblicata nel 1878, era del tutto in linea con la linguistica storica comparata del 19esimo secolo. Tuttavia, in quest'opera, dice Jonathan Culler, Saussure ha mostrato "la fecondità dell'idea di linguaggio come sistema di fenomeni interconnessi, anche con la sua ricostruzione storica". Analizzando la relazione tra i fonemi, spiegando l'alternanza delle vocali nelle lingue moderne del gruppo indoeuropeo, Saussure suggerì che oltre a diversi suoni diversi "a", dovevano esserci altri fonemi descritti formalmente. “Ciò che fa un'impressione speciale nel lavoro di Saussure”, conclude Kaller, “è che quasi 50 anni dopo, quando fu scoperto e decifrato il cuneiforme ittita, fu trovato un fonema, nella scrittura denotata da “h”, che si comportò come previsto da Saussure. Attraverso l'analisi formale, ha scoperto quello che oggi è noto come suono gutturale nelle lingue indoeuropee.

Nel concetto di definizione relativa (diacritica) dei segni, sia esplicita che implicita nel Corso, c'è un terzo assunto chiave della linguistica strutturale, chiamato da Saussure la "natura arbitraria del segno". Con ciò si intende che la relazione tra suono e significato nel linguaggio non è motivata da nulla: altrettanto facilmente si può collegare la parola "arbre" e la parola "albero" con il concetto di "albero". Inoltre, ciò significa che anche il suono è arbitrario: si può definire il concetto di "albero" dalla presenza della corteccia (ad eccezione delle palme) e dalle dimensioni (ad eccezione delle "piante legnose basse" - arbusti). Da ciò dovrebbe essere chiaro che tutte le ipotesi che presento non sono divise in più e meno importanti: ognuna di esse - la natura sistemica dei segni (più comprensibile nello studio "sincrono" della lingua), la loro essenza relativa (diacritica) , l'arbitrarietà dei segni - deriva dal resto.

Pertanto, nella linguistica saussuriana, il fenomeno studiato è inteso come un insieme di confronti e opposizioni del linguaggio. La lingua è sia un'espressione del significato delle parole (designazione) sia il loro risultato (comunicazione) - e queste due funzioni non coincidono mai (vedi "Deconstruction of Language" di Shleifer). Possiamo vedere l'alternanza di forma e contenuto che Greimas e Kurte descrivono nell'ultima versione dell'interpretazione: i contrasti linguistici definiscono le sue unità strutturali, e queste unità interagiscono su livelli successivi per creare un certo contenuto significativo. Poiché gli elementi del linguaggio sono casuali, né il contrasto né la combinazione possono essere la base. Ciò significa che in una lingua, le caratteristiche distintive formano un contrasto fonetico a un diverso livello di comprensione, i fonemi sono combinati in morfemi contrastanti, morfemi - in parole, parole - in frasi, ecc. In ogni caso, un intero fonema, parola, frase, ecc. è più della somma delle sue parti (proprio come l'acqua, nell'esempio di Saussure, è più della combinazione di idrogeno e ossigeno).

Tre presupposti del "Corso di linguistica generale" hanno portato Saussure all'idea di una nuova scienza del XX secolo, separata dalla linguistica, che studia "la vita dei segni nella società". Saussure chiamò questa scienza semiologia (dal greco "semeion" - un segno). La "scienza" della semiotica, sviluppatasi nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, ha ampliato lo studio del linguaggio e delle strutture linguistiche in reperti letterari composti (o formulati) con queste strutture. Inoltre, al tramonto della sua carriera, parallelamente al suo corso di linguistica generale, Saussure si impegnò in un'analisi "semiotica" della tarda poesia romana, cercando di scoprire anagrammi deliberatamente composti di nomi propri. Questo metodo era per molti versi l'opposto del razionalismo nella sua analisi linguistica: era un tentativo, come scrive Saussure in uno dei 99 quaderni, di studiare nel sistema il problema della "probabilità", che "diventa la base di tutto. " Tale indagine, sostiene lo stesso Saussure, aiuta a mettere a fuoco il "lato reale" della probabilità; La “parola chiave” per la quale Saussure cerca un anagramma è, secondo Jean Starobinsky, “uno strumento per il poeta, e non la fonte di vita per la poesia. La poesia serve a invertire i suoni della parola chiave. Secondo Starobinsky, in questa analisi, "Saussure non approfondisce la ricerca di significati nascosti". Al contrario, nelle sue opere si nota la volontà di evitare domande legate alla coscienza: “poiché la poesia si esprime non solo nelle parole, ma anche in ciò che queste parole danno origine, va oltre il controllo della coscienza e dipende solo da le leggi del linguaggio”.

Il tentativo di Saussure di studiare i nomi propri nella poesia tardo romana (Tsvetan Todorov lo definì un'abbreviazione di "una parola ... solo prima che sia scritta") sottolinea una delle componenti della sua analisi linguistica: la natura arbitraria dei segni, così come l'essenza formale della linguistica saussuriana ("Lingua", afferma, "l'essenza della forma, non il fenomeno"), che esclude la possibilità di analizzare il significato. Todorov conclude che oggi gli scritti di Saussure sembrano notevolmente coerenti nella loro riluttanza a studiare i simboli [fenomeni che hanno un significato ben definito]. . . . Esplorando gli anagrammi, Saussure presta attenzione solo alla ripetizione, ma non alle opzioni precedenti. . . . Studiando i Nibelunghi, definisce i simboli solo per assegnarli a letture errate: se non sono intenzionali, i simboli non esistono. Del resto, nei suoi scritti di linguistica generale, ipotizza l'esistenza di una semiologia che descriva non solo i segni linguistici; ma questa ipotesi è limitata dal fatto che la semilogia può descrivere solo segni casuali e arbitrari.

Se è davvero così, è solo perché non potrebbe immaginare "l'intenzione" senza un oggetto; non riusciva a colmare completamente il divario tra forma e contenuto - nei suoi scritti questo si trasformava in una domanda. Invece, si è rivolto alla "legittimità linguistica". Tra, da un lato, i concetti ottocenteschi basati sulla storia e sulle congetture soggettive, e i metodi di interpretazione accidentale basati su questi concetti, e, dall'altro, i concetti strutturalisti che Lévi-Strauss chiamavano "kantismo senza trascendente attore" - cancellando il confronto tra forma e contenuto (soggetto e oggetto), significato e origine nello strutturalismo, nella psicoanalisi e persino nella meccanica quantistica - le opere di Ferlinand de Saussure sulla linguistica e la semiotica segnano una svolta nello studio dei significati nel linguaggio e cultura.

Ronald Shleifer

Letteratura

1. Admoni V.G. Fondamenti di teoria della grammatica / V.G. Ammoni; Accademia delle scienze dell'URSS.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metodi matematici in linguistica. M., 1974.

4. Arnold I.V. La struttura semantica della parola nell'inglese moderno e la metodologia per il suo studio. /IV. Arnold-L.: Istruzione, 1966. - 187 p.

6.Bashlykov A.M. Sistema di traduzione automatica. / SONO. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7. Baudouin de Courtenay: Eredità teorica e modernità: Riassunti delle relazioni della conferenza scientifica internazionale / Ed.I.G. Kondratyev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Elementi di linguistica matematica. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Lingua e statistica. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Linguistica teorica e applicata. /V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantica. Sintassi. Morfologia. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. INTRODUZIONE al linguaggio formale della linguistica / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., riprod.

13. L'eredità linguistica di Baudouin de Courtenay alla fine del XX secolo: abstract della conferenza scientifica e pratica internazionale del 15-18 marzo 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Significati grammaticali nascosti e identificazione della persona sociale (“ritratto”) del parlante / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Esperienza nella costruzione di modelli linguistici "Significato<-->Testo". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Traduzione e linguistica applicata / L.L. Nelyubin. - M.: Scuola superiore, 1983. - 207 p.

16. Sui metodi esatti della ricerca linguistica: sulla cosiddetta "linguistica matematica" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva e altri - M., 1961. - 162 p.

17. Piotrovsky L.G. Linguistica matematica: libro di testo / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M .: Scuola superiore, 1977. - 160 p.

18. Lo è. Testo, macchina, persona. - L., 1975. - 213 p.

19. Lo è. Linguistica applicata / Ed. AS Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. modelli linguistici. M., 1963. Revzin, I.I. Linguistica strutturale moderna. Problemi e metodi. M., 1977. - 239 p.

21. Revzin, II, Rozentsveig, V.Yu. Fondamenti di traduzione generale e automatica / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 pag.

22. Slyusareva N.A. La teoria di F. de Saussure alla luce della linguistica moderna / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Gufo, L.Z. Linguistica analitica / L.Z. Gufo - M., 1970. - 192 p.

24. Saussure F. de. Appunti di linguistica generale / F. de Saussure; Per. da p. - M.: Progresso, 2000. - 187 p.

25. Lo è. Corso di Linguistica Generale / Per. da p. - Ekaterinburg, 1999. -426 p.

26. Statistiche vocali e analisi automatica del testo / Ed. ed. R.G. Piotrovskij. L., 1980. - 223 p.

27. Stoll, P. Imposta. Logica. Teorie assiomatiche / R. Stoll; Per. dall'inglese. - M., 1968. - 180 pag.

28. Tenier, L. Fondamenti di sintassi strutturale. M., 1988.

29. Ubin II. Automazione delle attività di traduzione in URSS / I.I. Ubin, L. Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematica moderna. M., 1966.

31. Shenk, R. Elaborazione di informazioni concettuali. M., 1980.

32. Shikhanovich, Yu.A. INTRODUZIONE alla matematica moderna (concetti iniziali). M., 1965

33. Shcherba L.V. Vocali russe in termini qualitativi e quantitativi / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Cittadino del mondo // Spark - 1996. - N. 5. - pag.13

35. VA Uspensky. Preliminare per i lettori della "New Literary Review" ai messaggi semiotici di Andrei Nikolaevich Kolmogorov. - Nuova rassegna letteraria. -1997. - N. 24. - S. 18-23

36. Perlovsky L. Coscienza, lingua e cultura. - Sapere è potere. -2000. №4 - S. 20-33

Introduzione? Teoria della traduzione delle lezioni

2.4 Prospettive per l'applicazione dei metodi matematici in linguistica

Nell'era della tecnologia informatica, i metodi della linguistica matematica hanno ricevuto una nuova prospettiva di sviluppo. La ricerca di soluzioni ai problemi dell'analisi linguistica è ora sempre più implementata a livello di sistemi informativi. Allo stesso tempo, l'automazione del processo di elaborazione del materiale linguistico, fornendo al ricercatore opportunità e vantaggi significativi, pone inevitabilmente nuove esigenze e compiti per lui.

La combinazione di conoscenza "esatta" e "umanitaria" è diventata terreno fertile per nuove scoperte nel campo della linguistica, dell'informatica e della filosofia.

La traduzione automatica da una lingua all'altra rimane un ramo in rapida crescita della tecnologia dell'informazione. Nonostante il fatto che la traduzione assistita da computer non possa mai essere paragonata in qualità alla traduzione umana (soprattutto per i testi letterari), la macchina è diventata un assistente indispensabile per una persona nella traduzione di grandi volumi di testo. Si ritiene che nel prossimo futuro verranno creati sistemi di traduzione più avanzati, basati principalmente sull'analisi semantica del testo.

Un'area altrettanto promettente è l'interazione tra linguistica e logica, che funge da base filosofica per comprendere la tecnologia dell'informazione e la cosiddetta "realtà virtuale". Nel prossimo futuro, continueranno i lavori per la creazione di sistemi di intelligenza artificiale, anche se, ancora una volta, non sarà mai uguale all'umano nelle sue capacità. Tale competizione non ha senso: ai nostri tempi, la macchina dovrebbe diventare (e diventa) non una rivale, ma un'assistente dell'uomo, non qualcosa del regno della fantasia, ma parte del mondo reale.

Continua lo studio della lingua con metodi statistici, che consente di determinarne con maggiore precisione le proprietà qualitative. È importante che le ipotesi più ardite sul linguaggio trovino la loro dimostrazione matematica, e quindi logica.

La cosa più significativa è che vari rami dell'applicazione della matematica in linguistica, prima abbastanza isolati, negli ultimi anni sono stati correlati tra loro, collegandosi in un sistema coerente, per analogia con il sistema linguistico scoperto un secolo fa da Ferdinand de Saussure e Yvan Baudouin de Courtenay. Questa è la continuità della conoscenza scientifica.

La linguistica nel mondo moderno è diventata la base per lo sviluppo della tecnologia dell'informazione. Finché l'informatica rimarrà una branca in rapido sviluppo dell'attività umana, l'unione di matematica e linguistica continuerà a svolgere il suo ruolo nello sviluppo della scienza.


Conclusione

Nel corso del XX secolo, le tecnologie informatiche hanno fatto molta strada: dall'uso militare a quello pacifico, da una gamma ristretta di obiettivi alla penetrazione in tutte le aree della vita umana. La matematica come scienza ha trovato un significato pratico sempre nuovo con lo sviluppo della tecnologia informatica. Questo processo continua ancora oggi.

Il "tandem" precedentemente impensabile di "fisici" e "parolieri" è diventato una realtà. Per la piena interazione della matematica e dell'informatica con le discipline umanistiche, erano richiesti specialisti qualificati da entrambe le parti. Mentre gli informatici hanno sempre più bisogno di conoscenze umanitarie sistematiche (linguistiche, culturali, filosofiche) per comprendere i cambiamenti nella realtà che li circonda, nell'interazione tra uomo e tecnologia, per sviluppare sempre più nuovi concetti linguistici e mentali, per scrivere programmi, quindi qualsiasi "Lettere" nel nostro tempo per la loro crescita professionale deve padroneggiare almeno le basi del lavoro con un computer.

La matematica, essendo strettamente interconnessa con l'informatica, continua a svilupparsi e ad interagire con le scienze naturali e umanistiche. Nel nuovo secolo, la tendenza alla matematizzazione della scienza non si indebolisce, ma anzi aumenta. Sulla base di dati quantitativi si comprendono le leggi dello sviluppo della lingua, le sue caratteristiche storiche e filosofiche.

Il formalismo matematico è più adatto per descrivere modelli in linguistica (come, in effetti, in altre scienze, sia umanistiche che naturali). La situazione a volte si sviluppa nella scienza in modo tale che senza l'uso di un linguaggio matematico appropriato è impossibile comprendere la natura fisica, chimica, ecc. processo non è possibile. Creare un modello planetario dell'atomo, il famoso fisico inglese del XX secolo. E. Rutherford ha incontrato difficoltà matematiche. All'inizio la sua teoria non fu accettata: non suonava convincente, e la ragione di ciò era l'ignoranza di Rutherford della teoria della probabilità, sulla base del meccanismo di cui era possibile comprendere solo la rappresentazione del modello delle interazioni atomiche. Rendendosi conto di ciò, già a quel tempo uno scienziato eccezionale, detentore del Premio Nobel, si iscrisse al seminario del matematico Professor Lamb e per due anni, insieme agli studenti, frequentò un corso ed elaborò un seminario sulla teoria della probabilità . Sulla base di ciò, Rutherford è stato in grado di descrivere il comportamento dell'elettrone, conferendo al suo modello strutturale un'accuratezza convincente e ottenendo riconoscimenti. Lo stesso è con la linguistica.

Ciò pone la domanda, cosa c'è di così matematico nei fenomeni oggettivi, grazie al quale possono essere descritti nel linguaggio della matematica, nel linguaggio delle caratteristiche quantitative? Si tratta di unità omogenee di materia distribuite nello spazio e nel tempo. Quelle scienze che sono andate più lontano di altre verso l'isolamento dell'omogeneità, e risultano essere più adatte per l'uso della matematica in esse.

Internet, che si è sviluppato rapidamente negli anni '90, ha riunito rappresentanti di vari paesi, popoli e culture. Nonostante il fatto che l'inglese continui ad essere la lingua principale della comunicazione internazionale, Internet è diventato multilingue ai nostri tempi. Ciò ha portato allo sviluppo di sistemi di traduzione automatica di successo commerciale ampiamente utilizzati in vari campi dell'attività umana.

Le reti di computer sono diventate oggetto di riflessione filosofica: sono stati creati sempre più nuovi concetti linguistici, logici, di visione del mondo che aiutano a comprendere la "realtà virtuale". In molte opere d'arte sono stati creati scenari - più spesso pessimistici - sul dominio delle macchine su una persona e della realtà virtuale - sul mondo esterno. Lungi dall'essere sempre tali previsioni si sono rivelate prive di significato. La tecnologia dell'informazione non è solo un'industria promettente per investire la conoscenza umana, è anche un modo per controllare le informazioni e, di conseguenza, il pensiero umano.

Questo fenomeno ha sia un lato negativo che uno positivo. Negativo - perché il controllo sulle informazioni è contrario al diritto umano inalienabile al libero accesso ad esse. Positivo - perché la mancanza di questo controllo può portare a conseguenze catastrofiche per l'umanità. Basti ricordare uno dei film più saggi dell'ultimo decennio - "Quando il mondo finisce" di Wim Wenders, i cui personaggi sono completamente immersi nella "realtà virtuale" dei propri sogni registrati su un computer. Tuttavia, né un singolo scienziato né un singolo artista può dare una risposta univoca alla domanda: cosa attende la scienza e la tecnologia in futuro.

L'attenzione al "futuro", a volte apparentemente fantastica, era una caratteristica distintiva della scienza a metà del XX secolo, quando gli inventori cercavano di creare modelli perfetti di tecnologia che potessero funzionare senza l'intervento umano. Il tempo ha mostrato la natura utopica di tale ricerca. Tuttavia, sarebbe superfluo condannare gli scienziati per questo - senza il loro entusiasmo negli anni '50 - la tecnologia dell'informazione degli anni '60 non avrebbe fatto un salto così potente negli anni '90 e non avremmo quello che abbiamo adesso.

Gli ultimi decenni del ventesimo secolo hanno cambiato le priorità della scienza: la ricerca, il pathos inventivo hanno lasciato il posto all'interesse commerciale. Ancora una volta, questo non è né buono né cattivo. Questa è una realtà in cui la scienza è sempre più integrata nella vita di tutti i giorni.

Il 21 ° secolo ha continuato questa tendenza e ai nostri tempi dietro le invenzioni non ci sono solo fama e riconoscimento, ma, prima di tutto, denaro. Questo è anche il motivo per cui è importante garantire che le ultime conquiste della scienza e della tecnologia non cadano nelle mani di gruppi terroristici o regimi dittatoriali. Il compito è difficile fino all'impossibilità; realizzarlo al massimo è compito dell'intera comunità mondiale.

L'informazione è un'arma e le armi non sono meno pericolose di quelle nucleari o chimiche, solo che non agiscono fisicamente, ma piuttosto psicologicamente. L'umanità ha bisogno di pensare a ciò che è più importante per lei in questo caso: libertà o controllo.

Gli ultimi concetti filosofici relativi allo sviluppo delle tecnologie dell'informazione e un tentativo di comprenderle hanno mostrato i limiti sia del materialismo delle scienze naturali, che ha dominato durante il XIX e l'inizio del XX secolo, sia dell'idealismo estremo, che nega il significato del mondo materiale . È importante per il pensiero moderno, in particolare il pensiero occidentale, superare questo dualismo nel pensare, quando il mondo circostante è chiaramente diviso in materiale e ideale. Il percorso per questo è un dialogo di culture, un confronto di diversi punti di vista sui fenomeni circostanti.

Paradossalmente, la tecnologia dell'informazione può svolgere un ruolo importante in questo processo. Le reti di computer, e in particolare Internet, non sono solo una risorsa per l'intrattenimento e una vigorosa attività commerciale, sono anche un mezzo di comunicazione significativa e controversa tra rappresentanti di varie civiltà nel mondo moderno, nonché per un dialogo tra passato e il presente. Possiamo dire che Internet spinge i confini spaziali e temporali.

E nel dialogo delle culture attraverso la tecnologia dell'informazione, il ruolo della lingua come il più antico mezzo di comunicazione universale è ancora importante. Ecco perché la linguistica, in interazione con la matematica, la filosofia e l'informatica, ha vissuto la sua seconda nascita e continua a svilupparsi ancora oggi. La tendenza del presente continuerà in futuro - "fino alla fine del mondo", come predisse lo stesso V. Wenders 15 anni fa. È vero, non si sa quando avverrà questa fine, ma importa adesso, perché il futuro prima o poi diventerà comunque il presente.


Allegato 1

Ferdinando di Saussure

Il linguista svizzero Ferdinand de Saussure (1857-1913) è ampiamente considerato il fondatore della linguistica moderna nei suoi tentativi di descrivere la struttura del linguaggio piuttosto che la storia di particolari lingue e forme linguistiche. Infatti, il metodo dello strutturalismo negli studi linguistici e letterari e un ramo significativo della semiotica trovano il loro principale punto di partenza nel suo lavoro all'inizio del XX secolo. È stato persino sostenuto che il complesso di strategie e concezioni che è stato chiamato "poststrutturalismo" - il lavoro di Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e altri - è suggerito dal lavoro di Saussure in linguistica e letture anagrammatiche della tarda poesia latina, dal modernismo letterario alla psicoanalisi e alla filosofia del primo Novecento. Come sostengono Algirdas Julien Greimas e Joseph Courtés in Semiotics and Language: An Analytic Dictionary, sotto il titolo "Interpretazione", all'inizio del XX secolo sorse una nuova modalità di interpretazione che essi identificano con la linguistica saussuriana, la fenomenologia husserliana e la psicoanalisi freudiana. In questa modalità, "l'interpretazione non è più questione di attribuire un dato contenuto a una forma che altrimenti ne sarebbe sprovvista; è piuttosto una parafrasi che formula in altro modo il contenuto equivalente di un elemento significante all'interno di un dato sistema semiotico" ( 159). in questa concezione di "interpretazione", forma e contenuto non sono distinti; anzi, ogni "forma" è, alternativamente, anche un "contenuto" semantico, una "forma significante", cosicché l'interpretazione offre una parafrasi analogica di qualcosa che già significa all'interno di qualche altro sistema di significazione.

Tale reinterpretazione della forma e della comprensione – che Claude Lévi-Strauss descrive in una delle sue articolazioni più programmatiche del concetto di strutturalismo, in "Struttura e forma: riflessioni su un'opera di Vladimir Propp" – è implicita nel Corso postumo di Saussure in Linguistica generale (1916, trad., 1959, 1983). Durante la sua vita, Saussure pubblicò relativamente poco, e la sua opera principale, il Corso, fu la trascrizione da parte dei suoi studenti di diversi corsi di linguistica generale che tenne nel 1907-11. Nel Corso Saussure invocava lo studio "scientifico" del linguaggio in contrapposizione al lavoro di linguistica storica che era stato svolto nel diciannovesimo secolo. Quel lavoro è una delle grandi conquiste dell'intelletto occidentale: prendere parole particolari come elementi costitutivi di linguistica, linguistica storica (o "diacronica") ha tracciato l'origine e lo sviluppo delle lingue occidentali da una presunta fonte linguistica comune, prima una lingua "indoeuropea" e poi una precedente "p lingua roto-indoeuropea".

È proprio questo studio delle occorrenze uniche delle parole, con il concomitante presupposto che l'"unità" fondamentale del linguaggio sia, in effetti, l'esistenza positiva di questi "elementi-parola", che Saussure ha messo in discussione. Il suo lavoro è stato un tentativo di ridurre la massa di fatti sul linguaggio, studiati così minuziosamente dalla linguistica storica, a un numero gestibile di proposizioni. La "scuola comparata" della filologia ottocentesca, dice Saussure nel Corso, "non è riuscita a fondare la vera scienza della linguistica" perché "non è riuscita a ricercare la natura del suo oggetto di studio" ( 3). Quella "natura", sostiene, si trova non semplicemente nelle parole "elementari" che un linguaggio comprende - i fatti apparentemente "positivi" (o "sostanze") del linguaggio - ma nelle relazioni formali che danno origine a quelle "sostanze".

Il riesame sistematico del linguaggio da parte di Saussure si basa su tre presupposti. Il primo è che lo studio scientifico del linguaggio ha bisogno di sviluppare e studiare il sistema piuttosto che la storia dei fenomeni linguistici. i suoi particolari "eventi-discorso", che designa come parole - e l'oggetto proprio della linguistica, il sistema (o "codice") che regola quegli eventi, che designa come langue. Un tale studio sistematico, inoltre, richiede un " concezione sincronica" del rapporto tra gli elementi del linguaggio in un determinato istante piuttosto che lo studio "diacronico" dello sviluppo del linguaggio attraverso la storia.

Da questo presupposto nacque quello che Roman Jakobson nel 1929 venne a designare come "strutturalismo", in cui "qualsiasi insieme di fenomeni esaminati dalla scienza contemporanea è trattato non come un agglomerato meccanico ma come un tutto strutturale la concezione meccanica dei processi cede alla questione della loro funzione" ("Romantico" 711). In questo passaggio Jakobson sta articolando l'intenzione di Saussure di definire la linguistica come un sistema scientifico in opposizione a un semplice resoconto "meccanico" di incidenti storici. ora chiamiamolo "strutturale" - linguistica: che gli elementi di base del linguaggio possono essere studiati solo in relazione alle loro funzioni piuttosto che in relazione alle loro cause. Le "parole") europee, quegli eventi ed entità devono essere situati all'interno di un quadro sistemico in cui sono messi in relazione con altri cosiddetti eventi ed entità.Si tratta di un radicale riorientamento nella concezione dell'esperienza e dei fenomeni, la cui importanza il filosofo Ernst Cassirer ha paragonato alla "nuova scienza di Galileo che nel XVII secolo cambiò tutto il nostro concetto del mondo fisico" (citato in Culler, Pursuit 2 4). Questo cambiamento, come notano Greimas e Courtés, riconcepisce "l'interpretazione" e quindi riconcepisce la spiegazione e la comprensione stesse. Invece di spiegare "essendo in termini di cause di un fenomeno, così che, come "effetto", è in qualche modo subordinato alle sue cause, la spiegazione qui consiste nel subordinare un fenomeno alla sua "funzione" orientata al futuro o "scopo." La spiegazione non è più indipendente dalle intenzioni o dagli scopi umani (anche se tali intenzioni possono essere impersonali, comunitarie o, in termini freudiani, "inconsce").

Nella sua linguistica Saussure compie questa trasformazione proprio nella ridefinizione della "parola" linguistica, che descrive come il "segno" linguistico e definisce in termini funzionalistici. Il segno, sostiene, è l'unione di "un concetto e un'immagine sonora", che ha chiamato "significato e significante" (66-67; la traduzione di Roy Harris del 1983 offre i termini "significazione" e "segnale"). La natura della loro "combinazione" è "funzionale" in quanto né il significato né il significante sono la "causa" dell'altro, ma "ciascuno i suoi valori dall'altro" (8). elemento del linguaggio, il segno , relazionale e sottopone ad analisi rigorosa l'assunto di base della linguistica storica, vale a dire l'identità delle unità elementari del linguaggio e del significato (cioè le "parole"). la parola "albero" come la "stessa" parola non è perché la parola è definita da qualità intrinseche - non è un "agglomerato meccanico" di tali qualità - ma perché è definita come un elemento in un sistema, il "tutto strutturale", "del linguaggio.

Tale definizione relazionale (o "diacritica") di un'entità governa la concezione di tutti gli elementi del linguaggio nella linguistica strutturale. Ciò è più evidente nel risultato più impressionante della linguistica saussuriana, lo sviluppo dei concetti di "fonemi" e "caratteristiche distintive" del linguaggio. I fonemi sono le più piccole unità articolate e significanti di una lingua. Non sono i suoni che ricorrono nel linguaggio, ma le "immagini sonore" menzionate da Saussure, che vengono percepite dai parlanti - apprese in modo fenomenale - come portatrici di significato. (Così, Elmar Holenstein descrive la linguistica di Jakobson, che segue Saussure in modi importanti, come "strutturalismo fenomenologico"). . . è una realtà fenomenologica e non empirica; non è l'opera in sé, ma un insieme di relazioni funzionali che si situano nella coscienza di un collettivo (generazione, ambiente, ecc.)" (citato in Galan 35). Allo stesso modo, Lévi-Strauss, il principale portavoce dello strutturalismo francese , osservava nel 1960 che "la struttura non ha un contenuto distinto; esso stesso è contenuto, e l'organizzazione logica in cui è contenuto è concepito come una proprietà del reale» (167; vedi anche Jakobson, Fundamentals 27-28).

I fonemi, dunque, i più piccoli elementi percepibili del linguaggio, non sono oggetti positivi ma una "realtà fenomenologica". In inglese, ad esempio, il fonema /t/ può essere pronunciato in molti modi diversi, ma in tutti i casi un anglofono lo riconoscerà come funzionante come /t/. Una t aspirata (cioè una t pronunciata con un respiro simile ad una h dopo di essa), un suono t acuto o basso, un suono t esteso e così via, funzioneranno tutti allo stesso modo nel distinguere il significato di "to" e "do" in inglese. Inoltre, le differenze tra le lingue sono tali che le variazioni fonologiche in una lingua possono costituire fonemi distinti in un'altra; quindi, l'inglese distingue tra /l/ e /r/, mentre altre lingue sono strutturate in modo tale che queste articolazioni sono considerate variazioni dello stesso fonema (come la t aspirata e non aspirata in inglese). In ogni linguaggio naturale, il vasto numero di parole possibili è una combinazione di un piccolo numero di fonemi. L'inglese, ad esempio, possiede meno di 40 fonemi che si combinano per formare oltre un milione di parole diverse.

I fonemi del linguaggio sono essi stessi strutture sistematicamente organizzate di caratteristiche. Negli anni '20 e '30, seguendo l'esempio di Saussure, Jakobson e N. S. Trubetzkoy isolarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura fisiologica degli organi del linguaggio - lingua, denti, corde vocali e così via - che Saussure menziona nel Corso e che Harris descrive come "fonetica fisiologica" ( 39; la precedente traduzione di Baskin usa il termine "fonologia" [(1959) 38]) – e si combinano in "fasci" di opposizioni binarie per formare fonemi. Ad esempio, in inglese la differenza tra /t/ e /d/ è la presenza o l'assenza di "voce" (l'impegno delle corde vocali), e sul piano della sonorizzazione questi fonemi si definiscono reciprocamente. In questo modo, la fonologia è un esempio specifico di una regola generale del linguaggio descritta da Saussure: Nel linguaggio ci sono solo differenze. ancora più importante: una differenza implica generalmente termini positivi tra i quali si stabilisce la differenza; ma nella lingua ci sono solo differenze senza termini positivi. Sia che prendiamo il significato o il significante, la lingua non ha né idee né suoni che esistevano prima del sistema linguistico. (120)

In questo quadro, le identità linguistiche sono determinate non da qualità intrinseche ma da relazioni sistemiche ("strutturali").

Ho detto che la fonologia "ha seguito l'esempio" di Saussure, perché anche se la sua analisi della fisiologia della produzione linguistica "sarebbe oggi chiamata", come dice Harris, "fisica", in opposizione a "psicologica" o "funzionale". "" (Lettura 49), di conseguenza nel Corso ha articolato la direzione e le linee di un'analisi funzionale del linguaggio. Allo stesso modo, la sua unica opera pubblicata estesa, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoria sul sistema primitivo delle vocali nelle lingue indoeuropee), apparsa nel 1878, si collocava pienamente all'interno del progetto ottocentesco. linguistica storica del sec. Tuttavia, all'interno di questo lavoro, come ha sostenuto Jonathan Culler, Saussure ha dimostrato "la fecondità di pensare il linguaggio come un sistema di elementi puramente relazionali, anche quando lavora al compito di ricostruzione storica" ​​(Saussure 66). Analizzando le relazioni strutturali sistematiche tra i fonemi per tenere conto dei modelli di alternanza vocalica nelle lingue indoeuropee esistenti, Saussure suggerì che oltre a diversi fonemi diversi /a/, doveva esserci un altro fonema che poteva essere descritto formalmente. "Ciò che rende il lavoro di Saussure così impressionante", conclude Culler, "è il fatto che quasi cinquant'anni dopo, quando l'ittita cuneiforme fu scoperto e decifrato, si scoprì che conteneva un fonema, scritto h, che si comportava come aveva predetto Saussure. . Aveva scoperto, con un'analisi puramente formale, quelli che oggi sono conosciuti come i laringei dell'indoeuropeo" (66).

Questa concezione della determinazione relazionale o diacritica degli elementi di significazione, implicita ed esplicita nel Corso, suggerisce un terzo assunto che governa la linguistica strutturale, ciò che Saussure chiama "l'arbitrarietà del segno". Con ciò intende che la relazione tra significante e significato nel linguaggio non è mai necessaria (o "motivata"): si potrebbe facilmente trovare il suono significante arbre come l'albero significante da unire al concetto "albero". Ma più di questo, significa che anche il significato è arbitrario: si potrebbe facilmente definire il concetto di "albero" per la sua qualità legnosa (che escluderebbe le palme) come per la sua dimensione (che esclude le "basse piante legnose" che noi chiama cespugli). Ciò dovrebbe chiarire che la numerazione delle assunzioni che ho presentato non rappresenta un ordine di priorità: ogni assunzione - la natura sistemica della significazione (compresa meglio studiando il linguaggio "in modo sincrono"), la natura relazionale o "diacritica" degli elementi della significazione, l'arbitrarietà dei segni – deriva il suo valore dagli altri.

Cioè, la linguistica saussuriana i fenomeni che studia nelle relazioni generali di combinazione e contrasto nel linguaggio. In questa concezione, il linguaggio è sia il processo di articolazione del significato (significazione) sia il suo prodotto (comunicazione), e queste due funzioni del linguaggio non sono né identiche né pienamente congruenti (vedi Schleifer, "Deconstruction"). Qui possiamo vedere l'alternanza tra forma e contenuto che Greimas e Courtés descrivono nell'interpretazione modernista: il linguaggio presenta contrasti che definiscono formalmente le sue unità, e queste unità si combinano su livelli successivi per creare il contenuto significante. Poiché gli elementi del linguaggio sono arbitrari, inoltre, né il contrasto né la combinazione possono dirsi fondamentali. Così, nel linguaggio i tratti distintivi si combinano per formare fonemi contrastanti su un altro livello di apprensione, i fonemi si combinano per formare morfemi contrastanti, i morfemi si combinano per formare parole, le parole si combinano per formare frasi e così via. In ogni caso, l'intero fonema, o parola, o frase, e così via, è maggiore della somma delle sue parti (proprio come l'acqua, H2O, nell'esempio di Saussure [(1959) 103] è più dell'agglomerato meccanico di idrogeno e ossigeno).

I tre presupposti del Corso di Linguistica Generale hanno portato Saussure a invocare una nuova scienza del XX secolo che andasse oltre la scienza linguistica per studiare "la vita dei segni all'interno della società". Saussure chiamò questa scienza "semiologia (dal greco semeîon "segno")" (16). La "scienza" della semiotica, così come venne praticata nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, allargò lo studio del linguaggio e delle strutture linguistiche agli artefatti letterari costituiti (o articolati) da quelle strutture. Per tutta l'ultima parte della sua carriera, inoltre, anche mentre teneva i corsi di linguistica generale, Saussure proseguì la propria analisi "semiotica" della tarda poesia latina nel tentativo di scoprire anagrammi deliberatamente nascosti di nomi propri. Il metodo di studio era per molti versi l'opposto del razionalismo funzionale delle sue analisi linguistiche: esso tentava, come accenna Saussure in uno dei 99 quaderni in cui proseguiva questo studio, di esaminare sistematicamente il problema del "caso", che " diventa il fondamento inevitabile di tutto" (citato in Starobinski 101). Tale studio, come afferma lo stesso Saussure, si concentra sul "fatto materiale" del caso e del significato (cit. 101), cosicché la "parola-tema" di cui Saussure cerca l'anagramma, come sostiene Jean Starobinski, "è, per il poeta , uno strumento, e non un germe vitale del poema. Il poema è tenuto a reimpiegare i materiali fonici della parola-tema" (45). In questa analisi, Starobinski afferma: "Saussure non si è perso nella ricerca di significati nascosti". Invece, il suo lavoro sembra dimostrare un desiderio di eludere tutti i problemi che sorgono dalla coscienza: "Poiché la poesia non si realizza solo in parole ma è qualcosa che nasce dalle parole, sfugge al controllo arbitrario della coscienza per dipendere esclusivamente da una sorta di legalità linguistica "(121).

Ovvero, il tentativo di Saussure di scoprire i nomi propri nella tarda poesia latina - ciò che Tzvetan Todorov chiama la riduzione di una "parola". . . al suo significante» (266) – sottolinea uno degli elementi che governavano la sua analisi linguistica, l'arbitrarietà del segno. una sostanza" – che eliminano effettivamente la semantica come principale oggetto di analisi.) Come conclude Todorov, il lavoro di Saussure appare oggi notevolmente omogeneo nel suo rifiuto di accettare i fenomeni simbolici. . . . Nella sua ricerca sugli anagrammi presta attenzione solo ai fenomeni di ripetizione, non a quelli di evocazione. . . . Nei suoi studi sui Nibelunghi riconosce i simboli solo per attribuirli a letture errate: poiché non sono intenzionali, i simboli non esistono. Infine nei suoi corsi di linguistica generale contempla l'esistenza della semiologia, e quindi dei segni diversi da quelli linguistici; ma questa affermazione è subito limitata dal fatto che la semiologia si dedica a un solo tipo di segni: quelli arbitrari. (269-70)

Se questo è vero, è perché Saussure non poteva concepire l'"intenzione" senza soggetto; non poteva del tutto sfuggire all'opposizione tra forma e contenuto che il suo lavoro tanto metteva in discussione. Invece, ha fatto ricorso alla "legalità linguistica". Situato tra, da un lato, le concezioni ottocentesche della storia, della soggettività e del modo di interpretazione causale governato da queste concezioni e, dall'altro, le concezioni "strutturaliste" novecentesche di quello che Lévi-Strauss chiamava "kantismo senza un soggetto trascendentale" (citato in Connerton 23) - concetti che cancellano l'opposizione tra forma e contenuto (o soggetto e oggetto) e la gerarchia di primo piano e sfondo nello strutturalismo in piena regola, nella psicoanalisi e persino nella meccanica quantistica - il lavoro di Ferdinando de Saussure in linguistica e semiotica circoscrive un momento significativo nello studio del significato e della cultura.

Ronald Schleifer


Allegato 2

Ferdinand de Saussure (traduzione)

Il linguista svizzero Ferdinand de Saussure (1857-1913) è considerato il fondatore della linguistica moderna, grazie ai suoi tentativi di descrivere la struttura del linguaggio, piuttosto che la storia delle singole lingue e delle forme delle parole. In generale, le basi dei metodi strutturali nella linguistica e nella critica letteraria e, in larga misura, la semiotica furono poste nelle sue opere all'inizio del ventesimo secolo. È dimostrato che i metodi e i concetti del cosiddetto "post-strutturalismo", sviluppati nelle opere di Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e altri, risalgono alle opere linguistiche di Saussure e Letture anagrammatiche della poesia tardoromana. Va notato che il lavoro di Saussure sulla linguistica e l'interpretazione linguistica contribuisce a collegare un'ampia gamma di discipline intellettuali, dalla fisica alle innovazioni letterarie, alla psicoanalisi e alla filosofia del primo Novecento. A. J. Greimas e J. Kurte scrivono in Semiotics and Language: “Un dizionario analitico dal titolo “Interpretazione” come nuovo tipo di interpretazione è apparso all'inizio del XX secolo insieme alla linguistica di Saussure, alla fenomenologia di Husserl e alla psicoanalisi di Freud. In tal caso, «l'interpretazione non è l'attribuzione di un dato contenuto a una forma che altrimenti ne sarebbe priva, ma è una parafrasi che formula in altro modo lo stesso contenuto di un elemento significante all'interno di un dato sistema semiotico» (159). ). In questa concezione di "interpretazione", forma e contenuto sono inseparabili; al contrario, ogni forma è piena di significato semantico ("forma significativa"), quindi l'interpretazione offre una nuova, simile rivisitazione di qualcosa di significativo in un altro sistema di segni.

Una simile comprensione della forma e del contenuto, presentata da Claude Lévi-Strauss in una delle opere chiave dello strutturalismo, ("Struttura e forma: riflessioni sulle opere di Vladimir Propp"), può essere vista nel libro postumo di Saussure A Course in Linguistica generale (1916, trad., 1959, 1983). Durante la sua vita, Saussure pubblicò poco, "Corso" - la sua opera principale - fu raccolto dagli appunti degli studenti che frequentarono le sue lezioni di linguistica generale nel 1907-11. Nel Corso, Saussure invocava uno studio "scientifico" del linguaggio, contrapponendolo alla linguistica storico-comparativa ottocentesca. Quest'opera può essere considerata una delle più grandi conquiste del pensiero occidentale: prendendo come base le singole parole come elementi strutturali del linguaggio, la linguistica storica (o "diacronica") ha dimostrato l'origine e lo sviluppo delle lingue dell'Europa occidentale da un lingua comune, indoeuropea - e un precedente proto-indoeuropeo.

È proprio questo studio delle occorrenze uniche delle parole, con il concomitante presupposto che l'"unità" fondamentale del linguaggio sia, in effetti, l'esistenza positiva di questi "elementi verbali" che Saussure ha messo in discussione. Il suo lavoro è stato un tentativo di ridurre a un piccolo numero di teoremi i molti fatti sulla lingua studiati casualmente dalla linguistica comparata. La scuola filologica comparata dell'Ottocento, scrive Saussure, "non è riuscita a creare una vera e propria scuola di linguistica" perché "non ha compreso l'essenza dell'oggetto di studio" (3). Questa "essenza", sostiene, risiede non solo nelle singole parole - le "sostanze positive" del linguaggio - ma anche nelle connessioni formali che aiutano queste sostanze ad esistere.

Il "test" del linguaggio di Saussure si basa su tre presupposti. In primo luogo, la comprensione scientifica del linguaggio non si basa su un fenomeno storico, ma su un fenomeno strutturale. Pertanto, ha distinto tra i singoli fenomeni del linguaggio - "eventi del discorso", che definisce "parole" - e il proprio, a suo avviso, oggetto di studio della linguistica, il sistema (codice, struttura) che controlla questi eventi ( "lingua"). Uno studio così sistematico, inoltre, richiede una concezione "sincrona" del rapporto tra gli elementi del linguaggio in un dato momento, piuttosto che uno studio "diacronico" dello sviluppo del linguaggio attraverso la sua storia.

Questa ipotesi è stata l'antesignana di quello che Roman Jakobson nel 1929 chiamerà "strutturalismo" - una teoria in cui "qualsiasi insieme di fenomeni indagati dalla scienza moderna è considerato non come un accumulo meccanico, ma come un insieme strutturale in cui la componente costruttiva è correlata con la funzione" ("Romantico" 711). In questo passaggio Jakobson formulava l'idea di Saussure di definire il linguaggio come una struttura, in contrapposizione all'enumerazione "meccanica" degli eventi storici. Inoltre, Jakobson sviluppa un'altra ipotesi saussuriana, che divenne il precursore della linguistica strutturale: gli elementi di base del linguaggio dovrebbero essere studiati in connessione non tanto con le loro cause, ma con le loro funzioni. Fenomeni ed eventi separati (diciamo, la storia dell'origine delle singole parole indoeuropee) dovrebbero essere studiati non da soli, ma in un sistema in cui sono correlati con componenti simili. Questa fu una svolta radicale nel confronto dei fenomeni con la realtà circostante, il cui significato il filosofo Ernst Cassirer paragonò alla "scienza di Galileo, che nel XVII secolo capovolse le idee sul mondo materiale", di conseguenza, le spiegazioni stesse. I fenomeni iniziarono ad essere interpretati non in relazione alle cause del loro verificarsi, ma in relazione all'effetto che possono avere nel presente e futuro... L'interpretazione ha cessato di essere indipendente dalle intenzioni di una persona (nonostante il fatto che le intenzioni possano essere impersonali, “inconscio” nel senso freudiano del termine).

Nella sua linguistica, Saussure mostra questa svolta soprattutto nel mutamento del concetto di parola in linguistica, che definisce come segno e descrive in funzione delle sue funzioni. Un segno per lui è una combinazione di suono e significato, "significato e designazione" (66-67; nella traduzione inglese del 1983 di Roy Harris - "significazione" e "segnale"). La natura di questo composto è "funzionale" (né l'uno né l'altro elemento possono esistere l'uno senza l'altro); inoltre, "l'uno prende in prestito qualità dall'altro" (8). Così, Saussure definisce il principale elemento strutturale del linguaggio - il segno - e pone alla base della linguistica storica l'identità dei segni alle parole, che richiede un'analisi particolarmente rigorosa. Pertanto, possiamo comprendere diversi significati, diciamo, della stessa parola "albero" - non perché la parola sia solo un insieme di determinate qualità, ma perché è definita come un elemento nel sistema dei segni, nel "tutto strutturale", nella lingua.

Tale concetto di unità relativo ("diacritico") è alla base del concetto di tutti gli elementi del linguaggio nella linguistica strutturale. Ciò è particolarmente evidente nella scoperta più originale della linguistica saussuriana, nello sviluppo del concetto di "fonemi" e di "tratti distintivi" del linguaggio. I fonemi sono la più piccola delle unità linguistiche parlate e significative. Non sono solo suoni che ricorrono nella lingua, ma "immagini sonore", osserva Saussure, che sono percepite dai madrelingua come dotate di significato. (Va notato che Elmar Holenstein chiama la linguistica di Jakobson, che continua le idee ei concetti di Saussure nelle sue disposizioni principali, "strutturalismo fenomenologico"). Ecco perché il principale oratore della Scuola di strutturalismo di Praga, Jan Mukarowski, osservò nel 1937 che “la struttura. . . non un concetto empirico, ma fenomenologico; non è il risultato in sé, ma un insieme di relazioni significative della coscienza collettiva (generazione, altri, ecc.)”. Un pensiero simile fu espresso nel 1960 da Lévi-Strauss, capofila dello strutturalismo francese: “La struttura non ha un contenuto definito; è di per sé significativo, e la costruzione logica in cui è racchiuso è l'impronta della realtà.

A loro volta, i fonemi, in quanto i più piccoli elementi linguistici accettabili per la percezione, rappresentano una "realtà fenomenologica" integrale separata. Ad esempio, in inglese, il suono "t" può essere pronunciato in modo diverso, ma in tutti i casi una persona che parla inglese lo percepirà come "t". Aspirato, alzato o abbassato, un suono "t" lungo, ecc. distinguerà ugualmente il significato delle parole "to" e "do". Inoltre, le differenze tra le lingue sono tali che varietà di un suono in una lingua possono corrispondere a diversi fonemi in un'altra; ad esempio, "l" e "r" in inglese sono diverse, mentre in altre lingue sono varietà dello stesso fonema (come la "t" inglese, pronunciata con e senza aspirazione). Il vasto vocabolario di qualsiasi linguaggio naturale è un insieme di combinazioni di un numero molto minore di fonemi. In inglese, ad esempio, vengono utilizzati solo 40 fonemi per pronunciare e scrivere circa un milione di parole.

I suoni di una lingua sono un insieme di caratteristiche sistematicamente organizzato. Negli anni '20 e '30, seguendo Saussure, Jacobson e N.S. Trubetskoy individuarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura degli organi della parola - lingua, denti, corde vocali - Saussure lo nota nel "Corso di linguistica generale", e Harris lo chiama "fonetica fisiologica" (nella precedente traduzione di Baskin, il termine "fonologia " è usato) - sono collegati in "nodi » durg contro un amico per emettere suoni. Ad esempio, in inglese, la differenza tra "t" e "d" è la presenza o l'assenza di "voce" (la tensione delle corde vocali), e il livello di voce che distingue un fonema da un altro. Pertanto, la fonologia può essere considerata un esempio della regola linguistica generale descritta da Saussure: "Ci sono solo differenze nella lingua". Ancora più importante non è questo: la differenza di solito implica le condizioni esatte tra le quali si trova; ma nella lingua ci sono solo differenze senza condizioni precise. Che si tratti di "designazione" o "significato", nella lingua non ci sono né concetti né suoni che sarebbero esistiti prima dello sviluppo del sistema linguistico.

In una tale struttura, le analogie linguistiche sono definite non con l'aiuto delle loro qualità intrinseche, ma con l'aiuto di relazioni di sistema ("strutturali").

Ho già accennato al fatto che la fonologia nel suo sviluppo si basava sulle idee di Saussure. Sebbene la sua analisi della fisiologia linguistica nei tempi moderni, dice Harris, "sarebbe chiamata 'fisica', in contrapposizione a 'psicologica' o 'funzionale', in The Course ha chiaramente articolato la direzione e i principi di base dell'analisi funzionale del linguaggio. La sua unica opera pubblicata durante la sua vita, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Note sul sistema vocale originale nelle lingue indoeuropee), pubblicata nel 1878, era completamente in linea con la linguistica storica comparata del 19esimo secolo. Tuttavia, in quest'opera, dice Jonathan Culler, Saussure ha mostrato "la fecondità dell'idea di linguaggio come sistema di fenomeni interconnessi, anche con la sua ricostruzione storica". Analizzando la relazione tra i fonemi, spiegando l'alternanza delle vocali nelle lingue moderne del gruppo indoeuropeo, Saussure suggerì che oltre a diversi suoni diversi "a", dovevano esserci altri fonemi descritti formalmente. “Ciò che rende particolarmente impressionante il lavoro di Saussure”, conclude Kaller, “è che quasi 50 anni dopo, quando fu scoperto e decifrato il cuneiforme ittita, fu trovato un fonema, nella scrittura denotata da “h”, che si comportava come previsto da Saussure. Attraverso l'analisi formale, ha scoperto quello che oggi è noto come suono gutturale nelle lingue indoeuropee.

Nel concetto di definizione relativa (diacritica) dei segni, sia esplicita che implicita nel Corso, c'è un terzo assunto chiave della linguistica strutturale, chiamato da Saussure la "natura arbitraria del segno". Con ciò si intende che la relazione tra suono e significato nel linguaggio non è motivata da nulla: altrettanto facilmente si può collegare la parola "arbre" e la parola "albero" con il concetto di "albero". Inoltre, ciò significa che anche il suono è arbitrario: si può definire il concetto di "albero" dalla presenza della corteccia (ad eccezione delle palme) e dalle dimensioni (ad eccezione delle "piante legnose basse" - arbusti). Da ciò dovrebbe essere chiaro che tutte le ipotesi che presento non sono divise in più e meno importanti: ognuna di esse - la natura sistemica dei segni (più comprensibile nello studio "sincrono" della lingua), il loro relativo (diacritico) l'essenza, l'arbitrarietà dei segni - viene dal resto.

Pertanto, nella linguistica saussuriana, il fenomeno studiato è inteso come un insieme di confronti e opposizioni del linguaggio. La lingua è sia un'espressione del significato delle parole (designazione) sia il loro risultato (comunicazione) - e queste due funzioni non coincidono mai (vedi "Deconstruction of Language" di Shleifer). Possiamo vedere l'alternanza di forma e contenuto che Greimas e Kurte descrivono nell'ultima versione dell'interpretazione: i contrasti linguistici definiscono le sue unità strutturali, e queste unità interagiscono su livelli successivi per creare un certo contenuto significativo. Poiché gli elementi del linguaggio sono casuali, né il contrasto né la combinazione possono essere la base. Ciò significa che in una lingua, i tratti distintivi formano un contrasto fonetico a un diverso livello di comprensione, i fonemi si combinano in morfemi contrastanti, i morfemi in parole, le parole in frasi, ecc. In ogni caso, un intero fonema, parola, frase, ecc. è più della somma delle sue parti (proprio come l'acqua, nell'esempio di Saussure, è più della combinazione di idrogeno e ossigeno).

Tre presupposti del "Corso di linguistica generale" hanno portato Saussure all'idea di una nuova scienza del XX secolo, separata dalla linguistica, che studia "la vita dei segni nella società". Saussure chiamò questa scienza semiologia (dal greco "semeîon" - un segno). La "scienza" della semiotica, sviluppatasi nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, ha ampliato lo studio del linguaggio e delle strutture linguistiche in scoperte letterarie composte (o formulate) con l'aiuto di queste strutture. Inoltre, al tramonto della sua carriera, parallelamente al suo corso di linguistica generale, Saussure si impegnò in un'analisi "semiotica" della tarda poesia romana, cercando di scoprire anagrammi deliberatamente composti di nomi propri. Questo metodo era per molti versi l'opposto del razionalismo nella sua analisi linguistica: era un tentativo, come scrive Saussure in uno dei 99 quaderni, di studiare nel sistema il problema della "probabilità", che "diventa la base di tutto. " Tale indagine, sostiene lo stesso Saussure, aiuta a mettere a fuoco il "lato reale" della probabilità; La “parola chiave” per la quale Saussure cerca un anagramma è, secondo Jean Starobinsky, “uno strumento per il poeta, e non la fonte di vita per la poesia. La poesia serve a invertire i suoni della parola chiave. Secondo Starobinsky, in questa analisi, "Saussure non approfondisce la ricerca di significati nascosti". Al contrario, nelle sue opere si nota la volontà di evitare domande legate alla coscienza: “poiché la poesia si esprime non solo nelle parole, ma anche in ciò che queste parole danno origine, va oltre il controllo della coscienza e dipende solo da le leggi del linguaggio”.

Il tentativo di Saussure di studiare i nomi propri nella poesia tardo romana (Tsvetan Todorov lo definì un'abbreviazione di "una parola ... solo prima che sia scritta") sottolinea una delle componenti della sua analisi linguistica: la natura arbitraria dei segni, così come l'essenza formale della linguistica saussuriana ("Lingua", sostiene, "l'essenza della forma, non il fenomeno"), che esclude la possibilità di analizzare il significato. Todorov conclude che oggi gli scritti di Saussure sembrano notevolmente coerenti nella loro riluttanza a studiare i simboli [fenomeni che hanno un significato ben definito]. . . . Esplorando gli anagrammi, Saussure presta attenzione solo alla ripetizione, ma non alle opzioni precedenti. . . . Studiando i Nibelunghi, definisce i simboli solo per assegnarli a letture errate: se non sono intenzionali, i simboli non esistono. Del resto, nei suoi scritti di linguistica generale, ipotizza l'esistenza di una semiologia che descriva non solo i segni linguistici; ma questa ipotesi è limitata dal fatto che la semilogia può descrivere solo segni casuali e arbitrari.

Se è davvero così, è solo perché non potrebbe immaginare "l'intenzione" senza un oggetto; non riusciva a colmare completamente il divario tra forma e contenuto - nei suoi scritti questo si trasformava in una domanda. Invece, si è rivolto alla "legittimità linguistica". Tra, da un lato, i concetti ottocenteschi basati sulla storia e sulle congetture soggettive, e i metodi di interpretazione accidentale basati su questi concetti, e, dall'altro, i concetti strutturalisti che Lévi-Strauss chiamavano "kantismo senza trascendente attore" - cancellando l'opposizione tra forma e contenuto (soggetto e oggetto), significato e origine nello strutturalismo, nella psicoanalisi e persino nella meccanica quantistica, gli scritti di Ferlinand de Saussure sulla linguistica e la semiotica segnano una svolta nello studio dei significati nella lingua e nella cultura.

Ronald Shleifer

Letteratura

1. Admoni V.G. Fondamenti di teoria della grammatica / V.G. Ammoni; Accademia delle scienze dell'URSS.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metodi matematici in linguistica. M., 1974.

4. Arnold I.V. La struttura semantica della parola nell'inglese moderno e la metodologia per il suo studio. /IV. Arnold - L.: Istruzione, 1966. - 187 p.

6.Bashlykov A.M. Sistema di traduzione automatica. / SONO. Bashlykov, A.A. Sokolov. - M.: FIMA LLC, 1997. - 20 p.

7. Baudouin de Courtenay: Eredità teorica e modernità: Riassunti delle relazioni della conferenza scientifica internazionale / Ed.I.G. Kondratyev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Elementi di linguistica matematica. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Lingua e statistica. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Linguistica teorica e applicata. /V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantica. Sintassi. Morfologia. // V.B. Kasevich -M., 1988. - 292 p.

12. Lekomtsev Yu.K. Introduzione al linguaggio formale della linguistica / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 p., riprod.

13. L'eredità linguistica di Baudouin de Courtenay alla fine del XX secolo: abstract della conferenza scientifica e pratica internazionale del 15-18 marzo 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Significati grammaticali nascosti e identificazione della persona sociale (“ritratto”) del parlante / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Esperienza nella costruzione di modelli linguistici "Significato<-->Testo". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. Traduzione e linguistica applicata / L.L. Nelyubin. - M. : Scuola superiore, 1983. - 207 p.

16. Sui metodi esatti della ricerca linguistica: sulla cosiddetta "linguistica matematica" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva e altri - M., 1961. - 162 p.

17. Piotrovsky L.G. Linguistica matematica: libro di testo / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Scuola superiore, 1977. - 160 p.

18. Lo è. Testo, macchina, persona. - L., 1975. - 213 p.

19. Lo è. Linguistica applicata / Ed. AS Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. modelli linguistici. M., 1963. Revzin, I.I. Linguistica strutturale moderna. Problemi e metodi. M., 1977. - 239 p.

21. Revzin, II, Rozentsveig, V.Yu. Fondamenti di traduzione generale e automatica / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 pag.

22. Slyusareva N.A. La teoria di F. de Saussure alla luce della linguistica moderna / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Gufo, L.Z. Linguistica analitica / L.Z. Gufo - M., 1970. - 192 p.

24. Saussure F. de. Appunti di linguistica generale / F. de Saussure; Per. da p. – M.: Progresso, 2000. – 187 p.

25. Lo è. Corso di Linguistica Generale / Per. da p. - Ekaterinburg, 1999. -426 p.

26. Statistiche vocali e analisi automatica del testo / Ed. ed. R.G. Piotrovskij. L., 1980. - 223 p.

27. Stoll, P. Imposta. Logica. Teorie assiomatiche / R. Stoll; Per. dall'inglese. - M., 1968. - 180 pag.

28. Tenier, L. Fondamenti di sintassi strutturale. M., 1988.

29. Ubin II. Automazione delle attività di traduzione in URSS / I.I. Ubin, L. Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematica moderna. M., 1966.

31. Shenk, R. Elaborazione di informazioni concettuali. M., 1980.

32. Shikhanovich, Yu.A. Introduzione alla matematica moderna (concetti iniziali). M., 1965

33. Shcherba L.V. Vocali russe in termini qualitativi e quantitativi / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Cittadino del mondo // Ogonyok - 1996. - N. 5. – pag.13

35. VA Uspensky. Preliminare per i lettori della "New Literary Review" ai messaggi semiotici di Andrei Nikolaevich Kolmogorov. - Una nuova rivista letteraria. –1997. - N. 24. - S. 18-23

36. Perlovsky L. Coscienza, lingua e cultura. - Sapere è potere. –2000. N. 4 - S. 20-33

37. Frumkina R.M. Chi siamo - obliquamente. // Giornale russo. - 2000. - N. 1. – pagina 12

38. Fizialov, S.Ya. Sulla modellazione della sintassi nella linguistica strutturale // Problemi di linguistica strutturale. M., 1962.

39. Lo è. Sull'equivalenza della grammatica NN e della grammatica delle dipendenze // Problemi di linguistica strutturale. M., 1967.

40. Chomsky, N. Fondamenti logici della teoria linguistica // Nuovo in linguistica. Problema. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//stampa. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. premere. jhu.ru

46. ​​​​en.wikipedia.org

47. www.smolensk.ru


La crittoanalisi è una scienza (e la pratica della sua applicazione) sui metodi e modi per violare le cifre. La crittografia e la crittoanalisi costituiscono un unico campo di conoscenza: la crittografia, che è attualmente il campo della matematica moderna, che ha importanti applicazioni nella moderna tecnologia dell'informazione. Il termine "crittografia" è stato introdotto da D. Vallis. La necessità di crittografare i messaggi è nata molto tempo fa. V-...

È il più vicino, non l'ulteriore significato della parola. Pertanto, la direzione psicologica, e in particolare la giovane grammatica, ha risposto a molte domande che si sono poste di fronte alla linguistica a metà del XIX secolo. È stata chiarita la metodologia della linguistica storica comparata, sono stati posti i principali problemi di semasiologia e di grammatica semantico-funzionale, è stata analizzata la relazione tra lingua e discorso, ...

Contatti", "Il multilinguismo nell'aspetto sociologico". Il loro studio è svolto dalla sociolinguistica (linguistica sociale), nata all'incrocio tra linguistica e sociologia, nonché etnolinguistica, etnografia del linguaggio, stilistica, retorica, pragmatica, teoria della comunicazione linguistica, la teoria della comunicazione di massa, ecc. La lingua svolge le seguenti funzioni sociali nella società: comunicativa / informativa (...

Sulle sezioni e la composizione della Linguistica. Le sezioni di Linguistica formate empiricamente, che si intersecano parzialmente e quindi non formano un sistema logicamente unificato, possono essere rappresentate come correlate tra loro secondo alcuni parametri diversi. Linguistica generale e scienze parziali del linguaggio. Si distinguono le sezioni più generali e particolari della Linguistica. Una delle sezioni principali della linguistica è la teoria ...

introduzione

Capitolo 1. La storia dell'applicazione dei metodi matematici in linguistica

1.1. La formazione della linguistica strutturale a cavallo tra XIX e XX secolo

1.2. Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento

Capitolo 2. Esempi selezionati dell'uso della matematica in linguistica

2.1. Traduzione automatica

2.2.Metodi statistici nell'apprendimento delle lingue

2.3. Imparare una lingua con metodi di logica formale

2.4. Prospettive per l'applicazione dei metodi matematici in linguistica

Conclusione

Letteratura

Appendice 1. Ronald Schleifer. Ferdinando di Saussure

Appendice 2. Ferdinand de Saussure (traduzione)

introduzione

Nel XX secolo c'è stata una tendenza continua verso l'interazione e la compenetrazione di vari campi della conoscenza. I confini tra le singole scienze si sfumano gradualmente; ci sono sempre più rami dell'attività mentale che sono "all'incrocio" della conoscenza umanitaria, tecnica e delle scienze naturali.

Un'altra caratteristica evidente della modernità è il desiderio di studiare le strutture ei loro elementi costitutivi. Pertanto, un posto crescente, sia nella teoria scientifica che nella pratica, è dato alla matematica. Entrando in contatto, da un lato, con la logica e la filosofia, dall'altro, con la statistica (e, di conseguenza, con le scienze sociali), la matematica penetra sempre più in profondità in quegli ambiti che per lungo tempo sono stati considerati puramente "umanitari", ampliando il loro potenziale euristico (la risposta alla domanda "quanto" spesso aiuta a rispondere alle domande "cosa" e "come"). La linguistica non ha fatto eccezione.

Lo scopo del mio corso è di evidenziare brevemente la connessione tra la matematica e un ramo della linguistica come la linguistica. Dagli anni '50, la matematica è stata utilizzata in linguistica per creare un apparato teorico per descrivere la struttura delle lingue (sia naturali che artificiali). Tuttavia, va detto che non ha trovato immediatamente per sé un'applicazione così pratica. Inizialmente, i metodi matematici in linguistica iniziarono ad essere utilizzati per chiarire i concetti di base della linguistica, tuttavia, con lo sviluppo della tecnologia informatica, tale premessa teorica iniziò a trovare applicazione nella pratica. La risoluzione di compiti come la traduzione automatica, il recupero automatico delle informazioni, l'elaborazione automatica del testo richiedeva un approccio fondamentalmente nuovo alla lingua. I linguisti hanno affrontato la questione: come imparare a rappresentare i modelli linguistici nella forma in cui possono essere applicati direttamente alla tecnologia. Il termine "linguistica matematica", popolare ai nostri tempi, si riferisce a qualsiasi ricerca linguistica che utilizza metodi esatti (e il concetto di metodi esatti nella scienza è sempre strettamente correlato alla matematica). Alcuni scienziati degli ultimi anni ritengono che l'espressione stessa non possa essere elevata al rango di termine, poiché non significa alcuna "linguistica" speciale, ma solo una nuova direzione focalizzata sul miglioramento, l'aumento dell'accuratezza e l'affidabilità dei metodi di ricerca linguistica . La linguistica utilizza metodi sia quantitativi (algebrici) che non quantitativi, il che la avvicina alla logica matematica e, di conseguenza, alla filosofia e persino alla psicologia. Anche Schlegel ha notato l'interazione tra linguaggio e coscienza, e Ferdinand de Saussure, un eminente linguista dell'inizio del XX secolo (racconterò più avanti della sua influenza sullo sviluppo dei metodi matematici in linguistica), ha collegato la struttura della lingua con la sua appartenenza alle persone. Il ricercatore moderno L. Perlovsky va oltre, identificando le caratteristiche quantitative della lingua (ad esempio, il numero di sessi, casi) con le peculiarità della mentalità nazionale (maggiori informazioni su questo nella sezione 2.2, "Metodi statistici in linguistica").

L'interazione tra matematica e linguistica è un argomento poliedrico e nel mio lavoro non mi soffermerò su tutto, ma, prima di tutto, sui suoi aspetti applicati.

Capitolo I. Storia dell'applicazione dei metodi matematici in linguistica

1.1 La formazione della linguistica strutturale a cavallo tra il XIX e il XX secolo

La descrizione matematica del linguaggio si basa sull'idea del linguaggio come meccanismo, che risale al famoso linguista svizzero del primo Novecento, Ferdinand de Saussure.

Il collegamento iniziale del suo concetto è la teoria del linguaggio come sistema costituito da tre parti (il linguaggio stesso è lingua, discorso - parola d'ordine e l'attività vocale - lingua), in cui ogni parola (membro del sistema) è considerata non in sé, ma in connessione con altri membri. Come notò in seguito un altro eminente linguista, il danese Louis Hjelmslev, Saussure "fu il primo a richiedere un approccio strutturale al linguaggio, cioè una descrizione scientifica del linguaggio registrando le relazioni tra le unità".

Comprendendo la lingua come una struttura gerarchica, Saussure fu il primo a porre il problema del valore e del significato delle unità linguistiche. Fenomeni ed eventi separati (diciamo, la storia dell'origine delle singole parole indoeuropee) dovrebbero essere studiati non da soli, ma in un sistema in cui sono correlati con componenti simili.

L'unità strutturale del linguaggio di Saussure considerava la parola, "segno", in cui si univano suono e significato. Nessuno di questi elementi esiste l'uno senza l'altro: quindi, il madrelingua comprende le varie sfumature del significato di una parola polisemantica come un elemento separato nell'insieme strutturale, nella lingua.

Così, nella teoria di F. de Saussure si può vedere l'interazione della linguistica, da un lato, con la sociologia e la psicologia sociale (va notato che allo stesso tempo si stanno sviluppando la fenomenologia di Husserl, la psicoanalisi di Freud, la teoria della relatività di Einstein , sperimentazioni su forma e contenuto in letteratura, musica e belle arti), dall'altro, con la matematica (il concetto di sistemicità corrisponde al concetto algebrico di linguaggio). Tale concetto ha cambiato il concetto di interpretazione linguistica in quanto tale: i fenomeni hanno cominciato a essere interpretati non in relazione alle cause del loro verificarsi, ma in relazione al presente e al futuro. L'interpretazione ha cessato di essere indipendente dalle intenzioni di una persona (nonostante il fatto che le intenzioni possano essere impersonali, "inconsce" nel senso freudiano del termine).

Il funzionamento del meccanismo linguistico si manifesta attraverso l'attività linguistica dei madrelingua. Il risultato del discorso sono i cosiddetti "testi corretti" - sequenze di unità vocali che obbediscono a determinati schemi, molti dei quali consentono una descrizione matematica. La teoria dei modi per descrivere la struttura sintattica si occupa dello studio dei metodi per la descrizione matematica di testi corretti (principalmente frasi). In una tale struttura, le analogie linguistiche sono definite non con l'aiuto delle loro qualità intrinseche, ma con l'aiuto di relazioni di sistema ("strutturali").

In Occidente, le idee di Saussure sono sviluppate dai giovani contemporanei del grande linguista svizzero: in Danimarca - L. Hjelmslev, da me già citato, che ha dato origine alla teoria algebrica del linguaggio nella sua opera "Fondamenti di teoria linguistica", in negli Stati Uniti - E. Sapir, L. Bloomfield, C. Harris, nella Repubblica Ceca - lo scienziato emigrato russo N. Trubetskoy.

Le regolarità statistiche nello studio del linguaggio iniziarono ad essere affrontate nientemeno che dal fondatore della genetica, Georg Mendel. Fu solo nel 1968 che i filologi scoprirono che, negli ultimi anni della sua vita, era affascinato dallo studio dei fenomeni linguistici con i metodi della matematica. Mendel ha portato questo metodo alla linguistica dalla biologia; negli anni '90, solo i linguisti ei biologi più audaci rivendicavano la fattibilità di tale analisi. Negli archivi del monastero di S. Tomasz a Brno, il cui abate era Mendel, sono stati trovati fogli con colonne di cognomi terminanti in "mann", "bauer", "mayer", e con alcune frazioni e calcoli. Nel tentativo di scoprire le leggi formali dell'origine dei cognomi, Mendel fa calcoli complessi, in cui tiene conto del numero di vocali e consonanti nella lingua tedesca, del numero totale di parole che considera, del numero di cognomi, eccetera.

Nel nostro paese, la linguistica strutturale ha iniziato a svilupparsi all'incirca nello stesso periodo dell'Occidente, a cavallo tra il XIX e il XX secolo. Contemporaneamente a F. de Saussure, il concetto di lingua come sistema è stato sviluppato nelle loro opere dai professori dell'Università di Kazan F.F. Fortunatov e I.A. Baldovino di Courtenay. Quest'ultimo ha corrisposto a lungo con de Saussure, rispettivamente, le scuole di linguistica di Ginevra e Kazan hanno collaborato tra loro. Se Saussure può essere definito l'ideologo dei metodi "esatti" in linguistica, allora Baudouin de Courtenay ha gettato le basi pratiche per la loro applicazione. Fu il primo a separare la linguistica (come accurato una scienza che utilizza metodi statistici e dipendenza funzionale) dalla filologia (una comunità di discipline umanitarie che studiano la cultura spirituale attraverso il linguaggio e la parola). Lo stesso scienziato riteneva che "la linguistica possa essere utile nel prossimo futuro, liberata solo dall'unione obbligatoria con la filologia e la storia letteraria" . La fonologia divenne il "banco di prova" per l'introduzione dei metodi matematici nella linguistica: i suoni come "atomi" del sistema linguistico, dotati di un numero limitato di proprietà facilmente misurabili, erano il materiale più conveniente per metodi di descrizione formali e rigorosi. La fonologia nega l'esistenza del significato nel suono, quindi il fattore "umano" è stato eliminato negli studi. In questo senso, i fonemi sono come oggetti fisici o biologici.

I fonemi, come i più piccoli elementi linguistici accettabili per la percezione, rappresentano una sfera separata, una "realtà fenomenologica" separata. Ad esempio, in inglese, il suono "t" può essere pronunciato in modo diverso, ma in tutti i casi una persona che parla inglese lo percepirà come "t". La cosa principale è che il fonema svolga la sua funzione principale, significativa. Inoltre, le differenze tra le lingue sono tali che varietà di un suono in una lingua possono corrispondere a diversi fonemi in un'altra; ad esempio, "l" e "r" in inglese sono diverse, mentre in altre lingue sono varietà dello stesso fonema (come la "t" inglese, pronunciata con o senza aspirazione). Il vasto vocabolario di qualsiasi linguaggio naturale è un insieme di combinazioni di un numero molto minore di fonemi. In inglese, ad esempio, vengono utilizzati solo 40 fonemi per pronunciare e scrivere circa un milione di parole.

I suoni di una lingua sono un insieme di caratteristiche sistematicamente organizzato. Negli anni '20 -'30, seguendo Saussure, Jacobson e N.S. Trubetskoy individuarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura degli organi del linguaggio: lingua, denti, corde vocali. Ad esempio, in inglese la differenza tra "t" e "d" è la presenza o l'assenza di una "voce" (la tensione delle corde vocali) e il livello di voce che distingue un fonema da un altro. Pertanto, la fonologia può essere considerata un esempio della regola linguistica generale descritta da Saussure: "Ci sono solo differenze nella lingua". Ancora più importante non è questo: la differenza di solito implica le condizioni esatte tra le quali si trova; ma nella lingua ci sono solo differenze senza condizioni precise. Che si tratti di "designazione" o "significato", nella lingua non ci sono né concetti né suoni che sarebbero esistiti prima dello sviluppo del sistema linguistico.

Pertanto, nella linguistica saussuriana, il fenomeno studiato è inteso come un insieme di confronti e opposizioni del linguaggio. La lingua è sia un'espressione del significato delle parole che un mezzo di comunicazione, e queste due funzioni non coincidono mai. Possiamo notare l'alternanza di forma e contenuto: i contrasti linguistici ne definiscono le unità strutturali, e queste unità interagiscono per creare un certo contenuto significativo. Poiché gli elementi del linguaggio sono casuali, né il contrasto né la combinazione possono essere la base. Ciò significa che in una lingua, i tratti distintivi formano un contrasto fonetico a un diverso livello di comprensione, i fonemi sono combinati in morfemi, morfemi - in parole, parole - in frasi, ecc. In ogni caso, un intero fonema, parola, frase, ecc. è più della semplice somma delle sue parti.

Saussure ha proposto l'idea di una nuova scienza del XX secolo, separata dalla linguistica, che studia il ruolo dei segni nella società. Saussure chiamò questa scienza semiologia (dal greco "semeîon" - un segno). La "scienza" della semiotica, sviluppatasi nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, ha esteso lo studio del linguaggio e delle strutture linguistiche a scoperte letterarie composte (o articolate) in termini di queste strutture. Inoltre, al tramonto della sua carriera, parallelamente al suo corso di linguistica generale, Saussure si impegnò in un'analisi "semiotica" della tarda poesia romana, cercando di scoprire anagrammi deliberatamente composti di nomi propri. Questo metodo era per molti versi l'opposto del razionalismo nella sua analisi linguistica: era un tentativo di studiare in un sistema il problema della "probabilità" nel linguaggio. Tale ricerca aiuta a concentrarsi sul "lato reale" della probabilità; la "parola chiave" per la quale Saussure cerca un anagramma è, secondo Jean Starobinsky, "uno strumento per il poeta, non la fonte della vita del poema". La poesia serve a scambiare i suoni della parola chiave. Secondo Starobinsky, in questa analisi, "Saussure non approfondisce la ricerca di significati nascosti". Al contrario, nelle sue opere si nota la volontà di evitare domande legate alla coscienza: “poiché la poesia si esprime non solo nelle parole, ma anche in ciò che queste parole danno origine, va oltre il controllo della coscienza e dipende solo da le leggi della lingua” (cfr. Allegato 1).

Il tentativo di Saussure di studiare i nomi propri nella poesia tardo romana sottolinea una delle componenti della sua analisi linguistica: la natura arbitraria dei segni, nonché l'essenza formale della linguistica di Saussure, che esclude la possibilità di analizzare il significato. Todorov conclude che oggi le opere di Saussure sembrano essere estremamente coerenti nella loro riluttanza a studiare i simboli di un fenomeno che hanno un significato chiaramente definito [Appendice 1]. Esplorando gli anagrammi, Saussure presta attenzione solo alla ripetizione, ma non alle opzioni precedenti. . . . Studiando i Nibelunghi, definisce i simboli solo per assegnarli a letture errate: se non sono intenzionali, i simboli non esistono. Del resto, nei suoi scritti di linguistica generale, ipotizza l'esistenza di una semiologia che descriva non solo i segni linguistici; ma questa ipotesi è limitata dal fatto che la semiologia può descrivere solo segni casuali e arbitrari.

Se è davvero così, è solo perché non potrebbe immaginare "l'intenzione" senza un oggetto; non riusciva a colmare completamente il divario tra forma e contenuto - nei suoi scritti questo si trasformava in una domanda. Invece, si è rivolto alla "legittimità linguistica". Tra, da un lato, concetti ottocenteschi basati sulla storia e su congetture soggettive, e metodi di interpretazione aleatoria basati su questi concetti, e, dall'altro, concetti strutturalisti che cancellano l'opposizione tra forma e contenuto (soggetto e oggetto), significato e origini nello strutturalismo, nella psicoanalisi e persino nella meccanica quantistica: gli scritti di Ferdinand de Saussure sulla linguistica e la semiotica segnano una svolta nello studio dei significati nella lingua e nella cultura.

Gli scienziati russi erano anche rappresentati al Primo Congresso Internazionale dei Linguisti all'Aia nel 1928. S. Kartsevsky, R. Yakobson e N. Trubetskoy hanno redatto un rapporto che ha esaminato la struttura gerarchica della lingua, nello spirito delle idee più moderne dell'inizio del secolo scorso. Jakobson nei suoi scritti sviluppò le idee di Saussure secondo cui gli elementi fondamentali di una lingua dovrebbero essere studiati, prima di tutto, in connessione con le loro funzioni, e non con le ragioni del loro verificarsi.

Sfortunatamente, dopo l'ascesa al potere di Stalin nel 1924, la linguistica russa, come molte altre scienze, viene respinta. Molti scienziati di talento furono costretti a emigrare, furono espulsi dal paese o morirono nei campi. Solo a partire dalla metà degli anni '50 è diventato possibile un certo pluralismo di teorie - maggiori informazioni su questo nella sezione 1.2.

1.2 Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento

Entro la metà del ventesimo secolo si erano formate quattro scuole linguistiche mondiali, ognuna delle quali si rivelò l'antenata di un certo metodo "esatto". Scuola fonologica di Leningrado(il suo antenato era uno studente di Baudouin de Courtenay L.V. Shcherba) ha utilizzato un esperimento psicolinguistico basato sull'analisi del discorso dei madrelingua come criterio principale per generalizzare il suono sotto forma di fonema.

Scienziati Circolo linguistico di Praga, in particolare - il suo fondatore N.S. Trubetskoy, emigrato dalla Russia, sviluppò la teoria delle opposizioni: la struttura semantica della lingua fu da loro descritta come un insieme di unità semantiche costruite in modo opposto - Sem. Questa teoria è stata applicata nello studio non solo della lingua, ma anche della cultura artistica.

Ideologi descrittivismo americano erano linguisti L. Bloomfield ed E. Sapir. La lingua è stata presentata ai descrittivisti come un insieme di dichiarazioni vocali, che erano l'oggetto principale del loro studio. Il loro focus era sulle regole della descrizione scientifica (da cui il nome) dei testi: lo studio dell'organizzazione, disposizione e classificazione dei loro elementi. La formalizzazione di procedure analitiche nel campo della fonologia e della morfologia (sviluppo di principi per lo studio della lingua a diversi livelli, analisi distributiva, metodo dei costituenti diretti, ecc.) ha portato alla formulazione di questioni generali di modellazione linguistica. La disattenzione al piano del contenuto della lingua, così come il lato paradigmatico della lingua, non ha permesso ai descrittivisti di interpretare la lingua come sistema in modo sufficientemente completo.

Negli anni '60 si sviluppò la teoria delle grammatiche formali, nata principalmente grazie al lavoro del filosofo e linguista americano N. Chomsky. È giustamente considerato uno dei più famosi scienziati e personaggi pubblici moderni, a lui sono dedicati molti articoli, monografie e persino un documentario a figura intera. Con il nome di un modo fondamentalmente nuovo di descrivere la struttura sintattica inventata da Chomsky - grammatica generativa (generatrice) - fu chiamata la tendenza corrispondente nella linguistica generativismo.

Chomsky, discendente di immigrati dalla Russia, ha studiato linguistica, matematica e filosofia all'Università della Pennsylvania dal 1945, fortemente influenzato dal suo maestro Zelig Harris - come Harris, Chomsky considerava e considera ancora le sue opinioni politiche vicine all'anarchismo (è ancora noto come critico dell'attuale sistema politico statunitense e come uno dei leader spirituali dell'anti-globalismo).

Primo grande lavoro scientifico di Chomsky, tesi di laurea "Morfologia dell'ebraico moderno » (1951) è rimasto inedito. Chomsky ha conseguito il dottorato presso l'Università della Pennsylvania nel 1955, ma gran parte della ricerca alla base della sua dissertazione (pubblicata integralmente solo nel 1975 con il titolo The Logical Structure of Linguistic Theory) e della sua prima monografia, Syntactic Structures (1957, Rus. trans . 1962), è stato eseguito presso l'Università di Harvard nel 1951-1955. Nello stesso 1955, lo scienziato si trasferì al Massachusetts Institute of Technology, dove divenne professore nel 1962.

La teoria di Chomsky ha attraversato diverse fasi del suo sviluppo.

Nella prima monografia "Syntactic Structures", lo scienziato ha presentato il linguaggio come un meccanismo per generare un insieme infinito di frasi utilizzando un insieme finito di mezzi grammaticali. Per descrivere le proprietà linguistiche, ha proposto i concetti di strutture grammaticali profonde (nascoste alla percezione diretta e generate da un sistema di regole ricorsive, cioè applicabili ripetutamente) e superficiali (direttamente percepite), nonché trasformazioni che descrivono la transizione dalle strutture profonde a quelle superficiali. Diverse strutture superficiali possono corrispondere a una struttura profonda (ad esempio, una struttura passiva Il decreto è firmato dal Presidente derivato dalla stessa Deep Structure del costrutto attivo Il Presidente firma il decreto) e viceversa (quindi, l'ambiguità la madre ama la figlia descritta come il risultato di una coincidenza di strutture superficiali che risalgono a due diverse strutture profonde, in una delle quali la madre è colei che ama la figlia, e nell'altra colei che è amata dalla figlia).

La teoria standard di Chomsky è considerata il modello "Aspects" esposto nel libro di Chomsky "Aspects of the Theory of Syntax". In questo modello, per la prima volta, sono state introdotte regole di interpretazione semantica nella teoria formale, attribuendo significato a strutture profonde. In Aspects, la competenza linguistica è contrapposta all'uso del linguaggio (prestazione), viene adottata la cosiddetta ipotesi di Katz-Postal sulla conservazione del significato durante la trasformazione, in relazione alla quale viene escluso il concetto di trasformazione facoltativa, e un apparato di vengono introdotte caratteristiche sintattiche che descrivono la compatibilità lessicale.

Negli anni '70, Chomsky ha lavorato alla teoria del controllo e del legame (teoria GB - dalle parole governo E legame) è più generale del precedente. In esso, lo scienziato ha abbandonato le regole specifiche che descrivono le strutture sintattiche di lingue specifiche. Tutte le trasformazioni sono state sostituite con una trasformazione di movimento universale. Nell'ambito della teoria GB, ci sono anche moduli privati, ognuno dei quali è responsabile della propria parte della grammatica.

Già di recente, nel 1995, Chomsky ha presentato un programma minimalista, in cui il linguaggio umano è descritto come il linguaggio macchina. Questo è solo un programma, non un modello o una teoria. In esso, Chomsky identifica due sottosistemi principali dell'apparato linguistico umano: il lessico e il sistema informatico, nonché due interfacce: fonetica e logica.

Le grammatiche formali di Chomsky sono diventate classiche per descrivere non solo i linguaggi naturali ma anche quelli artificiali, in particolare i linguaggi di programmazione. Lo sviluppo della linguistica strutturale nella seconda metà del XX secolo può essere giustamente considerato una "rivoluzione chomskiana".

Scuola fonologica di Mosca, i cui rappresentanti erano A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, ha utilizzato una teoria simile per studiare la fonetica. A poco a poco, i metodi "esatti" iniziano ad essere applicati non solo alla fonetica, ma anche alla sintassi. Sia i linguisti che i matematici, sia qui che all'estero, stanno iniziando a studiare la struttura della lingua. Negli anni '50 e '60 iniziò in URSS una nuova fase nell'interazione tra matematica e linguistica, associata allo sviluppo dei sistemi di traduzione automatica.

L'impulso per l'inizio di questi lavori nel nostro paese sono stati i primi sviluppi nel campo della traduzione automatica negli Stati Uniti (sebbene il primo dispositivo di traduzione meccanizzato di P.P. Smirnov-Troyansky sia stato inventato nell'URSS nel 1933, essendo primitivo, non si è diffuso). Nel 1947, A. Butt e D. Britten elaborarono un codice per la traduzione parola per parola usando un computer, un anno dopo R. Richens propose una regola per dividere le parole in radici e desinenze nella traduzione automatica. Quegli anni erano molto diversi da oggi. Si trattava di macchine molto grandi e costose che occupavano intere stanze e richiedevano un grande staff di ingegneri, operatori e programmatori per mantenerle. Fondamentalmente, questi computer venivano utilizzati per eseguire calcoli matematici per le esigenze delle istituzioni militari: il nuovo in matematica, fisica e tecnologia serviva, prima di tutto, agli affari militari. Nelle prime fasi, lo sviluppo del parlamentare era attivamente sostenuto dai militari, mentre (nelle condizioni della Guerra Fredda) si sviluppava la direzione russo-inglese negli Stati Uniti e la direzione anglo-russa nell'URSS.

Nel gennaio 1954, presso la Massachusetts Technical University, ebbe luogo il "Georgetown Experiment", la prima dimostrazione pubblica di traduzione dal russo all'inglese sulla macchina IBM-701. Estratto del messaggio sul passaggio riuscito dell'esperimento, realizzato da D.Yu. Panov, apparso in RJ "Mathematics", 1954, n. 10: "Traduzione da una lingua all'altra usando una macchina: un rapporto sul primo test riuscito".

D. Yu Panov (a quel tempo direttore dell'Istituto di informazione scientifica - INI, poi VINITI) attirò I. K. Belskaya, che in seguito diresse il gruppo di traduzione automatica presso l'Istituto di matematica precisa e ingegneria informatica dell'Accademia delle scienze dell'URSS, a lavorare sulla traduzione automatica. Alla fine del 1955 risale la prima esperienza di traduzione dall'inglese al russo con l'ausilio della macchina BESM. I programmi per BESM sono stati compilati da N.P. Trifonov e L.N. Korolev, la cui tesi di dottorato era dedicata ai metodi per costruire dizionari per la traduzione automatica.

Parallelamente, il lavoro sulla traduzione automatica è stato svolto presso il Dipartimento di matematica applicata dell'Istituto di matematica dell'Accademia delle scienze dell'URSS (ora M.V. Keldysh Institute of Applied Mathematics dell'Accademia delle scienze russa). Su iniziativa del matematico A.A. Lyapunov. Ha coinvolto O.S. Kulagin e i suoi studenti T.D. Wentzel e N.N. Ricco. Le idee di Lyapunov e Kulagina sulla possibilità di utilizzare la tecnologia per tradurre da una lingua all'altra sono state pubblicate sulla rivista Nature, 1955, n. 8. Dalla fine del 1955, T.N. Moloshnaya, che ha poi iniziato a lavorare in modo indipendente sull'algoritmo di traduzione inglese-russo.

R. Frumkina, che a quel tempo era impegnato nell'algoritmo di traduzione dallo spagnolo, ricorda che in questa fase del lavoro era difficile compiere passi coerenti. Molto più spesso ho dovuto seguire l'esperienza euristica, la mia o quella dei colleghi.

Tuttavia, la prima generazione di sistemi di traduzione automatica era molto imperfetta. Tutti erano basati su algoritmi di traduzione sequenziale "parola per parola", "frase per frase" - le connessioni semantiche tra parole e frasi non venivano prese in considerazione in alcun modo. Ad esempio, le frasi sono: John stava cercando la sua scatola dei giocattoli.Finalmente l'ha trovato. La scatola era nella penna.Giovanni era molto felice. (John stava cercando la sua scatola dei giocattoli. Alla fine l'ha trovata. La scatola era nel box. John era molto felice.). "Penna" in questo contesto non è una "penna" (strumento di scrittura), ma un "box" ( play-pen). La conoscenza di sinonimi, contrari e significati figurativi è difficile da inserire in un computer. Una direzione promettente era lo sviluppo di sistemi informatici incentrati sull'uso di un traduttore umano.

Nel tempo, i sistemi di traduzione diretta sono stati sostituiti dai sistemi T (dalla parola inglese "transfer" - trasformazione), in cui la traduzione è stata effettuata a livello di strutture sintattiche. Gli algoritmi dei sistemi T hanno utilizzato un meccanismo che ha permesso di costruire una struttura sintattica secondo le regole grammaticali della lingua della frase in ingresso (simile a come viene insegnata una lingua straniera al liceo), e quindi sintetizzare la frase in uscita trasformando la struttura sintattica e sostituendo le parole necessarie dal dizionario.

Lyapunov ha parlato di traduzione estraendo il significato del testo tradotto e presentandolo in un'altra lingua. L'approccio alla costruzione di sistemi di traduzione automatica basati sull'ottenimento della rappresentazione semantica della frase di input mediante analisi semantica e sintesi della frase di input in base alla rappresentazione semantica ottenuta è ancora considerato il più perfetto. Tali sistemi sono chiamati sistemi I (dalla parola "interlingua"). Tuttavia, il compito di crearli, arretrato tra la fine degli anni '50 e l'inizio degli anni '60, finora non è stato completamente risolto, nonostante gli sforzi della Federazione internazionale dell'IFIP, la comunità mondiale di scienziati nel campo dell'elaborazione delle informazioni.

Gli scienziati hanno pensato a come formalizzare e costruire algoritmi per lavorare con i testi, quali dizionari dovrebbero essere inseriti nella macchina, quali schemi linguistici dovrebbero essere usati nella traduzione automatica. La linguistica tradizionale non aveva tali idee, non solo in termini di semantica, ma anche in termini di sintassi. A quel tempo non esistevano elenchi di costruzioni sintattiche per nessuna lingua, le condizioni per la loro compatibilità e intercambiabilità non erano state studiate, le regole per costruire grandi unità di struttura sintattica da elementi costitutivi più piccoli non erano state sviluppate.

La necessità di creare le basi teoriche della traduzione automatica ha portato alla formazione e allo sviluppo della linguistica matematica. Il ruolo principale in questa materia in URSS è stato svolto dai matematici A.A. Lyapunov, O.S. Kulagina, VA Uspensky, linguisti V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. La dissertazione di Kulagina era dedicata allo studio della teoria formale delle grammatiche (contemporaneamente a N. Khomsky negli Stati Uniti), Kuznetsov proponeva il compito dell'assiomatizzazione della linguistica, che risale alle opere di F.F. Fortunatov.

Il 6 maggio 1960 fu adottato il decreto del Presidio dell'Accademia delle scienze dell'URSS "Sullo sviluppo di metodi strutturali e matematici per lo studio del linguaggio" e furono create le corrispondenti divisioni presso l'Istituto di linguistica e l'Istituto di la lingua russa. Dal 1960, le principali università umanitarie del paese - la Facoltà di filologia dell'Università statale di Mosca, Leninrad, Università di Novosibirsk, Istituto statale di lingue straniere di Mosca - hanno iniziato a formare personale nel campo dell'elaborazione automatica del testo.

Tuttavia, le opere di traduzione automatica di questo periodo, chiamate "classiche", sono di interesse teorico piuttosto che pratico. I sistemi di traduzione automatica convenienti iniziarono a essere creati solo negli anni ottanta del secolo scorso. Ne parlerò più avanti nella Sezione 2.1, Traduzione automatica.

Gli anni '60 e '70 includono profondi sviluppi teorici utilizzando i metodi della teoria degli insiemi e della logica matematica, come la teoria dei campi e la teoria degli insiemi fuzzy.

L'autore della teoria del campo in linguistica era il poeta, traduttore e linguista sovietico V.G. Ammoni. Inizialmente ha sviluppato la sua teoria sulla base della lingua tedesca. Per Admoni, il concetto di "campo" denota un insieme arbitrario non vuoto di elementi linguistici (ad esempio, "campo lessicale", "campo semantico").

La struttura del campo è eterogenea: è costituita da un nucleo, i cui elementi hanno un insieme completo di caratteristiche che definiscono un insieme, e una periferia, i cui elementi possono avere entrambe le caratteristiche di un dato insieme (non tutto) e quelli limitrofi. Darò un esempio che illustra questa affermazione: ad esempio, in inglese, il campo delle parole composte ("sogno ad occhi aperti" - "sogno" è difficile da separare dal campo delle frasi ("gas lacrimogeno" - "gas lacrimogeno") .

La teoria degli insiemi fuzzy già menzionata sopra è strettamente correlata alla teoria dei campi. In URSS, i linguisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, tuttavia, il suo antenato era il matematico americano L. Zadeh, che nel 1965 pubblicò l'articolo "Fuzzy Logic". Fornendo una giustificazione matematica alla teoria degli insiemi fuzzy, Zade li considerò sulla base del materiale linguistico.

In questa teoria, non stiamo parlando tanto dell'appartenenza di elementi a un dato insieme (АОа), quanto del grado di questa appartenenza (mАОа), poiché gli elementi periferici possono appartenere a più campi in un grado o nell'altro. Zade (Lofti-zade) era originario dell'Azerbaigian, fino all'età di 12 anni aveva la pratica di comunicare in quattro lingue - azero, russo, inglese e persiano - e usava tre diversi alfabeti: cirillico, latino, arabo. Quando a uno scienziato viene chiesto cosa c'è in comune tra la teoria degli insiemi fuzzy e la linguistica, non nega questa connessione, ma chiarisce: “Non sono sicuro che lo studio di queste lingue abbia avuto una grande influenza sul mio pensiero. Se così fosse, allora solo inconsciamente. In gioventù, Zadeh ha studiato in una scuola presbiteriana a Teheran e dopo la seconda guerra mondiale è emigrato negli Stati Uniti. "La domanda non è se sono americano, russo, azero o qualcun altro", ha detto in una delle conversazioni, "sono plasmato da tutte queste culture e popoli e mi sento abbastanza a mio agio tra ognuno di loro". In queste parole c'è qualcosa di simile a ciò che caratterizza la teoria degli insiemi fuzzy: un allontanamento da definizioni non ambigue e categorie nitide.

Nel nostro Paese, negli anni '70, sono state tradotte e studiate le opere dei linguisti occidentali del Novecento. I.A. Melchuk ha tradotto in russo le opere di N. Chomsky. SUL. Slyusareva nel suo libro "The Theory of F. de Saussure in the Light of Modern Linguistics" collega i postulati dell'insegnamento di Saussure con i problemi reali della linguistica degli anni '70. C'è una tendenza verso un'ulteriore matematizzazione della linguistica. Le principali università nazionali stanno formando personale nella specialità "Linguistica matematica (teorica, applicata)". Allo stesso tempo in Occidente c'è un brusco balzo nello sviluppo della tecnologia informatica, che richiede sempre più nuove basi linguistiche.

Negli anni '80, professore dell'Istituto di studi orientali dell'Accademia delle scienze Yu.K. Lekomtsev, analizzando il linguaggio della linguistica attraverso l'analisi di schemi, tabelle e altri tipi di notazione utilizzati nelle descrizioni linguistiche, considera i sistemi matematici adatti a questi scopi (principalmente sistemi di algebra matriciale).

Così, per tutto il ventesimo secolo, c'è stata una convergenza tra l'esatto e le discipline umanistiche. L'interazione della matematica con la linguistica trovò sempre più applicazioni pratiche. Maggiori informazioni su questo nel prossimo capitolo.

Capitolo 2. Esempi selezionati dell'uso della matematica in linguistica

2.1 Traduzione automatica

L'idea di tradurre da una lingua all'altra con l'aiuto di un meccanismo universale è nata diversi secoli prima che iniziassero i primi sviluppi in quest'area: già nel 1649, René Descartes propose l'idea di una lingua in cui le idee equivalenti di lingue diverse sarebbero espresse da un simbolo. I primi tentativi di attuare questa idea negli anni '30 -'40, l'inizio degli sviluppi teorici a metà del secolo, il miglioramento dei sistemi di traduzione con l'aiuto della tecnologia negli anni '70 -'80, il rapido sviluppo della tecnologia di traduzione negli ultimi decennio: queste sono le fasi dello sviluppo della traduzione automatica come industria. È dai lavori sulla traduzione automatica che è cresciuta la linguistica informatica come scienza.

Con lo sviluppo della tecnologia informatica tra la fine degli anni '70 e l'inizio degli anni '80, i ricercatori si sono posti obiettivi più realistici ed economici: la macchina non è diventata un concorrente (come si pensava in precedenza), ma un assistente di un traduttore umano. La traduzione automatica cessa di servire esclusivamente a compiti militari (tutte le invenzioni e le ricerche sovietiche e americane, incentrate principalmente sul russo e sull'inglese, hanno contribuito in un modo o nell'altro alla Guerra Fredda). Nel 1978, le parole in linguaggio naturale furono trasmesse sulla rete interconnessa Arpa e sei anni dopo apparvero negli Stati Uniti i primi programmi di traduzione per microcomputer.

Negli anni '70 la Commissione delle Comunità Europee acquista la versione inglese-francese del traduttore informatico Systran, ordinando anche le versioni francese-inglese e italiano-inglese, e il sistema di traduzione russo-inglese utilizzato dalle Forze Armate statunitensi. È così che sono state poste le basi del progetto EUROTRA.

Sulla rinascita della traduzione automatica negli anni '70 e '80. lo testimoniano i seguenti fatti: la Commissione delle Comunità europee (CEC) acquista la versione inglese-francese di Systran, nonché il sistema di traduzione dal russo all'inglese (quest'ultimo sviluppato dopo il rapporto ALPAC e continuato ad essere utilizzato dalla US Air Force e NASA); inoltre, la CEC ordina lo sviluppo delle versioni francese-inglese e italiano-inglese. Allo stesso tempo, c'è una rapida espansione delle attività di traduzione automatica in Giappone; negli Stati Uniti, l'Organizzazione Panamericana della Sanità (PAHO) ordina lo sviluppo di una direzione spagnolo-inglese (sistema SPANAM); L'aeronautica americana sta finanziando lo sviluppo di un sistema di traduzione automatica presso il Linguistic Research Center dell'Università del Texas ad Austin; Il gruppo TAUM in Canada sta facendo notevoli progressi nello sviluppo del proprio sistema METEO (traduzione meteorologica). Numerosi progetti sono stati avviati negli anni '70 e '80. successivamente sviluppato in sistemi commerciali a tutti gli effetti.

Nel periodo 1978-93 sono stati spesi 20 milioni di dollari per la ricerca nel campo della traduzione automatica negli Stati Uniti, 70 milioni in Europa e 200 milioni in Giappone.

Uno dei nuovi sviluppi è la tecnologia TM (translation memory), che funziona secondo il principio dell'accumulo: durante il processo di traduzione, il segmento originale (frase) e la sua traduzione vengono salvati, con conseguente formazione di un database linguistico; se nel testo appena tradotto viene trovato un segmento identico o simile, viene visualizzato insieme alla traduzione e all'indicazione della percentuale di corrispondenza. Il traduttore prende quindi una decisione (di modificare, rifiutare o accettare la traduzione), il cui risultato viene memorizzato dal sistema, quindi non è necessario tradurre la stessa frase due volte. Un noto sistema commerciale basato sulla tecnologia TM è attualmente sviluppato dal sistema TRADOS (fondato nel 1984).

Attualmente, diverse dozzine di aziende stanno sviluppando sistemi di traduzione automatica commerciale, tra cui: Systran, IBM, L&H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Linguistica b.v. e altri Ora puoi utilizzare i servizi di traduttori automatici direttamente sul Web: alphaWorks; Traduttore online di PROMT, LogoMedia.net, servizio di traduzione Babel Fish di AltaVista; InfiniT.com; Tradurre Internet.

Sistemi di traduzione commercialmente efficaci sono comparsi nella seconda metà degli anni '80 anche nel nostro Paese. Il concetto stesso di traduzione automatica si è ampliato (ha iniziato a includere "la creazione di una serie di sistemi e dispositivi automatici e automatizzati che eseguono automaticamente o semiautomaticamente l'intero ciclo di traduzione o singole attività in un dialogo con una persona"), e gli stanziamenti governativi per lo sviluppo di questo settore sono aumentati.

Russo, inglese, tedesco, francese e giapponese sono diventati le principali lingue dei sistemi di traduzione domestici. L'All-Union Translation Center (VTsP) ha sviluppato un sistema per tradurre dall'inglese e dal tedesco al russo su un computer ES-1035-ANRAP. Consisteva in tre dizionari - input inglese e tedesco e output russo - sotto un unico software. C'erano diversi dizionari specializzati intercambiabili: per tecnologia informatica, programmazione, radioelettronica, ingegneria meccanica, agricoltura, metallurgia. Il sistema poteva funzionare in due modalità: automatica e interattiva, quando lo schermo mostrava il testo sorgente e la traduzione per frase, che una persona poteva modificare. La velocità di traduzione del testo in ANRAP (dall'inizio della battitura alla fine della stampa) era di circa 100 pagine all'ora.

Nel 1989 è stata creata una famiglia di traduttori commerciali del tipo SPRINT, che lavora con russo, inglese, tedesco e giapponese. Il loro principale vantaggio era la compatibilità con il PC IBM, quindi i sistemi di traduzione automatica domestici hanno raggiunto il livello di qualità internazionale. Allo stesso tempo, è in fase di sviluppo un sistema di traduzione automatica dal francese al russo FRAP, che comprende 4 fasi di analisi del testo: grafomatica, morfologica, sintattica e semantica. In LGPI loro. Herzen, era in corso il lavoro su un sistema SILOD-MP in quattro lingue (inglese, francese, spagnolo, russo) (i dizionari inglese-russo e franco-russo sono stati utilizzati in modalità industriale.

Per la traduzione specializzata di testi di ingegneria elettrica esisteva il sistema ETAP-2. L'analisi del testo di input in esso contenuto è stata effettuata a due livelli: morfologico e sintattico. Il dizionario ETAP-2 conteneva circa 4mila voci; la fase di trasformazione del testo - circa 1000 regole (96 generali, 342 private, il resto è dizionario). Tutto ciò garantiva una soddisfacente qualità di traduzione (ad esempio, il titolo del brevetto "Disposizione della griglia di fase ottica e dispositivo di accoppiamento avente tale disposizione" è stato tradotto come "Un dispositivo a griglia di fase ottica e un dispositivo di connessione con tale dispositivo" - nonostante la tautologia, il significato è conservato).

Presso l'Istituto pedagogico di lingue straniere di Minsk, sulla base del dizionario inglese-russo di forme e frasi di parole, è stato inventato un sistema per la traduzione automatica dei titoli, presso l'Istituto di studi orientali dell'Accademia delle scienze - un sistema per tradurre dal giapponese al russo. Il primo servizio automatico di vocabolario e terminologia (SLOTHERM) per l'informatica e la programmazione, creato presso l'Istituto di ricerca sui sistemi di automazione di Mosca, conteneva circa 20.000 termini in un dizionario esplicativo e dizionari speciali per la ricerca linguistica.

I sistemi di traduzione automatica iniziarono gradualmente ad essere utilizzati non solo per lo scopo previsto, ma anche come componente importante dei sistemi di apprendimento automatico (per insegnare la traduzione, controllare l'ortografia e la conoscenza grammaticale).

Gli anni '90 hanno portato con sé il rapido sviluppo del mercato dei PC (dal desktop al tascabile) e dell'informatica, l'uso diffuso di Internet (che sta diventando sempre più internazionale e multilingue). Tutto ciò ha reso richiesto l'ulteriore sviluppo di sistemi di traduzione automatica. Dall'inizio degli anni '90 Anche gli sviluppatori domestici stanno entrando nel mercato dei sistemi PC.

Nel luglio 1990, al PC Forum di Mosca, viene presentato il primo sistema di traduzione automatica commerciale in Russia denominato PROMT (PROgrammer's Machine Translation), che vince la gara della NASA per la fornitura di sistemi MP (la PROMT era l'unica azienda non americana in questo Nel 1992, PROMT ha rilasciato un'intera famiglia di sistemi con il nuovo nome STYLUS per la traduzione dall'inglese, tedesco, francese, italiano e spagnolo al russo e dal russo all'inglese, e il primo sistema di traduzione automatica al mondo per Windows è stato creato il la base di STYLUS nel 1993. Nel 1994, STYLUS 2.0 è stato rilasciato per Windows 3.X/95/NT, e nel 1995-1996 la terza generazione di sistemi di traduzione automatica, completamente STYLUS 3.0 a 32 bit per Windows 95/NT, mentre è stato completato con successo lo sviluppo dei primi sistemi di traduzione automatica russo-tedesco e russo-francese completamente nuovi al mondo.

Nel 1997 è stato firmato un accordo con la società francese Softissimo per la creazione di sistemi di traduzione dal francese al tedesco e all'inglese e viceversa, e nel dicembre di quest'anno è stato rilasciato il primo sistema di traduzione tedesco-francese al mondo. Nello stesso anno, la società PROMT ha rilasciato un sistema implementato utilizzando la tecnologia Gigant, che supporta diverse indicazioni linguistiche in una shell, nonché uno speciale traduttore per lavorare su Internet WebTranSite.

Nel 1998, un'intera costellazione di programmi è stata rilasciata con il nuovo nome PROMT 98. Un anno dopo, PROMT ha rilasciato due nuovi prodotti: un pacchetto software unico per lavorare su Internet - PROMT Internet e un traduttore per i sistemi di posta aziendale - PROMT Mail Traduttore. Nel novembre 1999, PROMT è stato riconosciuto come il miglior sistema di traduzione automatica testato dalla rivista francese PC Expert, superando del 30% i suoi concorrenti. Sono state inoltre sviluppate speciali soluzioni server per i clienti aziendali: il server di traduzione aziendale PROMT Translation Server (PTS) e la soluzione Internet PROMT Internet Translation Server (PITS). Nel 2000, PROMT ha aggiornato l'intera linea di prodotti software rilasciando una nuova generazione di sistemi MT: PROMT Translation Office 2000, PROMT Internet 2000 e Magic Gooddy 2000.

La traduzione online con il supporto del sistema PROMT viene utilizzata su numerosi siti nazionali ed esteri: traduttore online PROMT, InfiniT.com, Translate.Ru, Lycos, ecc., nonché in istituzioni di vari profili per la traduzione di documenti commerciali, articoli e lettere (ci sono sistemi di traduzione integrati direttamente in Outlook Express e altri client di posta elettronica).

Al giorno d'oggi stanno emergendo nuove tecnologie di traduzione automatica basate sull'uso di sistemi di intelligenza artificiale e metodi statistici. A proposito di quest'ultimo - nella prossima sezione.

2.2 Metodi statistici nell'apprendimento delle lingue

Una notevole attenzione nella linguistica moderna è data allo studio dei fenomeni linguistici utilizzando i metodi della matematica quantitativa. I dati quantitativi spesso aiutano a comprendere più a fondo i fenomeni studiati, il loro posto e il loro ruolo nel sistema dei fenomeni correlati. La risposta alla domanda "quanto" aiuta a rispondere alle domande "cosa", "come", "perché" - tale è il potenziale euristico di una caratteristica quantitativa.

I metodi statistici svolgono un ruolo significativo nello sviluppo dei sistemi di traduzione automatica (cfr. sezione 2.1). Nell'approccio statistico, il problema della traduzione è considerato in termini di un canale rumoroso. Immagina di dover tradurre una frase dall'inglese al russo. Il principio del canale rumoroso ci offre la seguente spiegazione del rapporto tra una frase inglese e una russa: una frase inglese non è altro che una frase russa distorta da un qualche tipo di rumore. Per recuperare la frase russa originale, dobbiamo sapere cosa dicono di solito le persone in russo e come le frasi russe vengono distorte in inglese. La traduzione viene effettuata cercando una tale frase russa che massimizzi i prodotti della probabilità incondizionata della frase russa e della probabilità della frase inglese (originale) data la frase russa data. Secondo il teorema di Bayes, questa frase russa è la traduzione più probabile dell'inglese:

dove e è la frase di traduzione e f è la frase originale

Quindi abbiamo bisogno di un modello di origine e di un modello di canale, o di un modello linguistico e di un modello di traduzione. Il modello linguistico deve assegnare un punteggio di probabilità a qualsiasi frase nella lingua di destinazione (nel nostro caso il russo) e il modello di traduzione alla frase originale. (vedi tabella 1)

In generale, un sistema di traduzione automatica opera in due modalità:

1. Formazione del sistema: viene preso un corpus di formazione di testi paralleli e, utilizzando la programmazione lineare, vengono cercati tali valori delle tabelle di corrispondenza della traduzione che massimizzano la probabilità che (ad esempio) la parte russa del corpus con l'inglese disponibile secondo al modello di traduzione selezionato. Un modello della lingua russa è costruito sulla parte russa dello stesso corpus.

2. Sfruttamento: in base ai dati ottenuti per una frase inglese sconosciuta, si cerca un russo che massimizzi il prodotto delle probabilità assegnate dal modello linguistico e dal modello traduttivo. Il programma utilizzato per tale ricerca si chiama decodificatore.

Il modello di traduzione statistica più semplice è il modello di traduzione letterale. Questo modello presuppone che per tradurre una frase da una lingua all'altra sia sufficiente tradurre tutte le parole (creare un "sacco di parole") e il modello fornirà la loro collocazione nell'ordine corretto. a, f | e) a P(a | e , f), cioè probabilità di un dato allineamento data una coppia di frasi, ogni probabilità P(a, f | e) è normalizzata dalla somma delle probabilità di tutti gli allineamenti di una data coppia di frasi:

L'implementazione dell'algoritmo di Viterbi utilizzato per addestrare il modello n. 1 è la seguente:

1. L'intera tabella delle probabilità di corrispondenza della traduzione è riempita con gli stessi valori.

2. Per tutte le possibili varianti di connessioni a coppie di parole, viene calcolata la probabilità P(a, f | e):

3. I valori di P(a, f | e) vengono normalizzati per ottenere i valori di P(a | e, f).

4. Viene calcolata la frequenza di ciascuna coppia di traduzione, ponderata in base alla probabilità di ciascuna opzione di allineamento.

5. Le frequenze ponderate risultanti vengono normalizzate e formano una nuova tabella di probabilità di corrispondenza della traduzione

6. L'algoritmo viene ripetuto dal passaggio 2.

Si consideri, ad esempio, l'addestramento di un modello simile su un corpus di due coppie di frasi (Fig. 2):

casa Bianca

  • Casa/Casa

Dopo un gran numero di iterazioni, otterremo una tabella (Tabella 2), che mostra che la traduzione viene eseguita con elevata precisione.

Inoltre, i metodi statistici sono ampiamente utilizzati nello studio del vocabolario, della morfologia, della sintassi e dello stile. Gli scienziati della Perm State University hanno condotto uno studio basato sull'affermazione che le frasi stereotipate sono un importante "materiale da costruzione" del testo. Queste frasi sono costituite da parole ripetute "nucleari" e specificatori di parole dipendenti e hanno una colorazione stilistica pronunciata.

Nello stile scientifico, le parole "nucleari" possono essere chiamate: ricerca, studio, compito, problema, domanda, fenomeno, fatto, osservazione, analisi ecc. Nel giornalismo, altre parole saranno "nucleari", che hanno un valore accresciuto specificamente per il testo del giornale: tempo, persona, potere, affari, azione, legge, vita, storia, luogo eccetera. (totale 29)

Di particolare interesse per i linguisti è anche la differenziazione professionale della lingua nazionale, l'originalità dell'uso del vocabolario e della grammatica, a seconda del tipo di occupazione. È noto che i conducenti nel linguaggio professionale usano la forma w O fer, i medici dicono k O club invece di cocktail Yu sh - tali esempi possono essere forniti. Il compito delle statistiche è monitorare la variabilità della pronuncia e il cambiamento nella norma linguistica.

Le differenze professionali portano a differenze non solo grammaticali, ma anche lessicali. Yakut State University prende il nome MK Ammosov, sono stati analizzati 50 questionari con le reazioni più comuni a determinate parole tra medici e costruttori (Tabella 3).

Costruttori

Umano

paziente (10), personalità (5)

uomo (5)

Bene

aiuto (8), aiuto (7)

malvagio (16)

vita

morte (10)

adorabile (5)

morte

cadavere (8)

vita (6)

fuoco

riscaldare (8), bruciare (6)

fuoco (7)

dito

mano (14), panaritium (5)

grande (7), indice (6)

occhi

visione (6), allievo, oftalmologo (5 ciascuno)

marrone (10), grande (6)

Testa

mente (14), cervello (5)

grande (9), intelligente (8), intelligente (6)

perdere

coscienza, vita (4 ciascuno)

soldi (5), trovare (4)

Si può notare che i medici più spesso dei costruttori danno associazioni legate alla loro attività professionale, poiché le parole-stimoli fornite nel questionario hanno più a che fare con la loro professione che con la professione di muratore.

Le regolarità statistiche in una lingua vengono utilizzate per creare dizionari di frequenza - dizionari che forniscono caratteristiche numeriche della frequenza delle parole (forme di parole, frasi) di qualsiasi lingua - la lingua dello scrittore, qualsiasi opera, ecc. Di solito, la frequenza di occorrenza di una parola è usata come caratteristica d'uso nel testo di un certo volume

Il modello della percezione del parlato è impossibile senza un dizionario come sua componente essenziale. Nella percezione della parola, l'unità operativa di base è la parola. Da ciò ne consegue, in particolare, che ogni parola del testo percepito deve essere identificata con la corrispondente unità del vocabolario interno dell'ascoltatore (o del lettore). È naturale supporre che fin dall'inizio la ricerca sia limitata ad alcuni sottodomini del dizionario. Secondo le più moderne teorie sulla percezione del parlato, l'effettiva analisi fonetica del testo sonoro in un caso tipico fornisce solo alcune informazioni parziali sul possibile aspetto fonologico della parola, e questo tipo di informazioni corrisponde non a una, ma a MOLTE parole del dizionario; Pertanto, sorgono due problemi:

(a) selezionare l'insieme appropriato in base a determinati parametri;

(b) entro i limiti dell'insieme delineato (se è allocato adeguatamente) per "eliminare" tutte le parole, eccetto l'unica che meglio corrisponde alla parola data del testo riconosciuto. Una delle strategie di "abbandono" consiste nell'escludere le parole a bassa frequenza. Ne consegue che il vocabolario per la percezione del parlato è un dizionario di frequenza. È la creazione di una versione per computer del dizionario delle frequenze della lingua russa il compito iniziale del progetto presentato.

Sulla base del materiale della lingua russa, ci sono 5 dizionari di frequenza (senza contare i dizionari di filiale). Notiamo solo alcune carenze generali dei dizionari esistenti.

Tutti i dizionari di frequenza conosciuti della lingua russa si basano sull'elaborazione di matrici di testi scritti (stampati). In parte per questo motivo, quando l'identità di una parola si basa in gran parte su coincidenze formali, grafiche, la semantica non viene presa sufficientemente in considerazione. Di conseguenza, anche le caratteristiche di frequenza vengono spostate, distorte; ad esempio, se il compilatore del dizionario delle frequenze include parole dalla combinazione "l'un l'altro" nelle statistiche generali dell'uso della parola "amico", allora questo è difficilmente giustificato: data la semantica, dobbiamo ammettere che queste sono già parole diverse, o meglio, che un'unità di dizionario indipendente è solo la combinazione nel suo insieme.

Inoltre, in tutti i dizionari esistenti, le parole sono poste solo nelle loro forme base: sostantivi al singolare, nominativo, verbi all'infinito, ecc. Alcuni dizionari forniscono informazioni sulla frequenza delle forme delle parole, ma di solito non lo fanno in modo abbastanza coerente, non in modo esaustivo. Le frequenze di diverse forme di parola della stessa parola ovviamente non corrispondono. Lo sviluppatore del modello di percezione del parlato deve tenere conto del fatto che in un processo percettivo reale è proprio una specifica forma di parola che è "immersa" nel testo che è soggetta a riconoscimento: sulla base dell'analisi della sezione iniziale dell'esponente di la forma della parola, si forma un insieme di parole con un inizio identico e la sezione iniziale della forma della parola non è necessariamente identica alla sezione iniziale della forma del dizionario. È la forma della parola che ha una struttura ritmica specifica, che è anche un parametro estremamente importante per la selezione percettiva delle parole. Infine, nella rappresentazione finale dell'enunciato riconosciuto, ancora una volta, le parole sono rappresentate dalle corrispondenti forme verbali.

Ci sono molte opere che dimostrano l'importanza della frequenza nel processo di percezione del parlato. Ma non siamo a conoscenza di opere in cui verrebbe utilizzata la frequenza delle forme delle parole - al contrario, tutti gli autori ignorano praticamente la frequenza delle singole forme delle parole, riferendosi esclusivamente ai lessemi. Se i risultati ottenuti da loro non sono considerati artefatti, si deve presumere che il madrelingua abbia in qualche modo accesso alle informazioni sul rapporto tra le frequenze delle forme delle parole e delle forme del dizionario, cioè, appunto, lessemi. Inoltre, una tale transizione da una forma verbale a un lessema, ovviamente, non può essere spiegata dalla conoscenza naturale del paradigma corrispondente, poiché le informazioni sulla frequenza devono essere utilizzate prima dell'identificazione finale della parola, altrimenti perde semplicemente il suo significato.

Secondo le caratteristiche statistiche primarie, è possibile determinare con un dato errore relativo quella parte del dizionario, che include parole con un'alta frequenza di occorrenza, indipendentemente dal tipo di testo. È anche possibile, introducendo nel dizionario l'ordinamento per gradi, ottenere una serie di dizionari che coprano le prime 100, 1000, 5000, ecc. di parole frequenti. Le caratteristiche statistiche del dizionario sono di interesse in connessione con l'analisi semantica del vocabolario. Lo studio dei gruppi soggetto-ideologici e dei campi semantici mostra che le associazioni lessicali sono supportate da collegamenti semantici che si concentrano attorno ai lessemi con il significato più comune. La descrizione dei significati all'interno del campo lessico-semantico può essere effettuata identificando le parole con i lessemi più astratti di significato. Apparentemente, le unità di dizionario "vuote" (dal punto di vista delle potenze nominative) costituiscono uno strato statisticamente omogeneo.

I vocabolari per i singoli generi non sono meno preziosi. Lo studio della misura della loro somiglianza e della natura delle distribuzioni statistiche fornirà informazioni interessanti sulla stratificazione qualitativa del vocabolario in funzione della sfera d'uso del discorso.

La compilazione di grandi dizionari di frequenza richiede l'uso della tecnologia informatica. L'introduzione della meccanizzazione e dell'automazione parziali nel processo di lavoro su un dizionario è interessante come esperimento nell'elaborazione meccanica di dizionari per testi diversi. Un tale dizionario richiede un sistema più rigoroso per l'elaborazione e l'accumulo di materiale lessicale. In miniatura, si tratta di un sistema di recupero informazioni in grado di fornire informazioni su vari aspetti del testo e del vocabolario. A questo sistema sono previste fin dall'inizio alcune richieste fondamentali: il numero totale delle parole dell'inventario, le caratteristiche statistiche di una singola parola e di interi dizionari, l'ordinamento delle zone frequenti e rare del dizionario, ecc. per creare automaticamente dizionari inversi per singoli generi e fonti. Molte altre utili informazioni statistiche sulla lingua verranno estratte dalla matrice di informazioni accumulate. Il dizionario delle frequenze del computer crea una base sperimentale per il passaggio a un'automazione più ampia del lavoro sul vocabolario.

I dati statistici dei dizionari di frequenza possono anche essere ampiamente utilizzati per risolvere altri problemi linguistici, ad esempio per analizzare e determinare i mezzi attivi di formazione delle parole della lingua russa moderna, risolvere problemi di miglioramento della grafica e dell'ortografia, che sono associati alla presa in considerazione tenere conto delle informazioni statistiche sul vocabolario (è importante tenere conto delle caratteristiche probabilistiche delle combinazioni di grafemi, dei tipi di combinazioni di lettere realizzate nelle parole), della trascrizione pratica e della traslitterazione. I parametri statistici del dizionario saranno utili anche per risolvere problemi di automatizzazione della digitazione, del riconoscimento e della lettura automatica del testo letterale.

I moderni dizionari esplicativi e le grammatiche della lingua russa sono costruiti principalmente sulla base di testi letterari e artistici. Esistono dizionari di frequenza della lingua di A.S. Puskin, A.S. Griboedova, F.M. Dostoevskij, V.V. Vysotsky e molti altri autori. Presso il Dipartimento di Storia e Teoria della Letteratura dello Stato di Smolensk. L'Università Pedagogica lavora da diversi anni alla compilazione di dizionari di frequenza di testi poetici e in prosa. Per questo studio sono stati selezionati dizionari di frequenza di tutti i testi di Pushkin e di altri due poeti dell'età dell'oro: "Woe from Wit" di Griboedov e tutta la poesia di Lermontov; Pasternak e altri cinque poeti della Silver Age - Balmont 1894-1903, "Poems about the Beautiful Lady" di Blok, "Stone" di Mandelstam, "Pillar of Fire" di Gumilyov, "Anno Domini MCMXXI" di Akhmatova e "Sisters of My Life" di Pasternak e altri quattro poeti dell'età del ferro - "Poesie di Yuri Zhivago", "Quando si chiarisce", l'intero corpus di testi di M. Petrovs, "La strada è lontana", "Windshield", "Addio alla neve" e "Ferri di cavallo" di Mezhirov, "Antimirov" di Voznesensky e "Snezhnitsa » Rylenkova.

Va notato che questi dizionari sono di natura diversa: alcuni rappresentano il vocabolario di un'opera drammatica, altri - libri di testi, o più libri, o l'intero corpus delle poesie del poeta. I risultati dell'analisi presentati in questo documento dovrebbero essere presi con cautela, non possono essere considerati assoluti. Tuttavia, con l'aiuto di misure speciali, la differenza nella natura ontologica dei testi può essere ridotta in una certa misura.

Negli ultimi anni, l'opposizione tra discorso colloquiale e libro si è realizzata sempre più chiaramente. Questo problema è discusso in modo particolarmente acuto tra i metodologi che richiedono una svolta nell'insegnamento verso la lingua parlata. Tuttavia, la specificità del discorso colloquiale rimane ancora inspiegabile.

I dizionari sono stati elaborati creando un'applicazione utente nell'ambiente del programma per ufficio EXCEL97. L'applicazione include quattro fogli di lavoro del libro EXCEL: "Foglio del titolo", foglio "Dizionari" con i dati iniziali, "Prossimità" e "Distanze" con i risultati, nonché una serie di macro.

Le informazioni iniziali vengono inserite nel foglio "Dizionari". I dizionari dei testi studiati sono scritti in celle EXCEL, l'ultima colonna S è formata dai risultati ottenuti ed è uguale al numero di parole trovate in altri dizionari. Le tabelle "Prossimità" e "Distanze" contengono misure calcolate di prossimità M, correlazione R e distanza D.

Le macro applicative sono procedure di programmazione basate su eventi scritte in Visual Basic for Application (VBA). Le procedure si basano sugli oggetti della libreria VBA e sui relativi metodi di elaborazione. Pertanto, per le operazioni con i fogli di lavoro dell'applicazione, vengono utilizzati l'oggetto chiave Foglio di lavoro (foglio di lavoro) e il metodo corrispondente di attivazione del foglio Attiva (attiva). L'impostazione dell'intervallo dei dati di origine analizzati sul foglio Dizionario viene eseguita dal metodo Select dell'oggetto Range (intervallo) e il trasferimento delle parole come valori alle variabili viene eseguito come proprietà Value (valore) dello stesso Range oggetto.

Nonostante il fatto che l'analisi della correlazione per rango ci renda cauti sulla dipendenza degli argomenti tra testi diversi, la maggior parte delle parole più frequenti in ogni testo hanno corrispondenze in uno o più altri testi. La colonna S mostra il numero di tali parole tra le 15 parole più frequenti per ciascun autore. Le parole in grassetto compaiono solo nelle parole di un poeta nella nostra tabella. Blok, Akhmatova e Petrovs non hanno affatto parole evidenziate, hanno S = 15. Questi tre poeti hanno le stesse 15 parole più frequenti, differiscono solo per il posto nell'elenco. Ma anche Pushkin, il cui vocabolario è il più originale, ha S = 8, e ci sono 7 parole evidenziate.

I risultati mostrano che esiste un certo strato di vocabolario che concentra i temi principali della poesia. Di norma, queste parole sono brevi: sul numero totale (225) di usi delle parole di una sillaba 88, due sillabe 127, tre sillabe 10. Spesso queste parole rappresentano i principali mitologemmi e possono cadere in coppia: notte - giorno, terra - cielo (sole), Dio - uomo (persone), vita - morte, corpo - anima, Roma - mondo(a Mandel'stam); possono essere combinati in mitologemi di livello superiore: cielo, stella, sole, terra; in una persona, di regola, spiccano il corpo, il cuore, il sangue, il braccio, la gamba, la guancia, gli occhi. Tra gli stati umani, la preferenza è data al sonno e all'amore. La casa e le città appartengono al mondo umano: Mosca, Roma, Parigi. La creatività è rappresentata da lessemi parola E canzone.

Griboedov e Lermontov non hanno quasi parole che denotino la natura tra le parole più frequenti. Hanno tre volte più parole che denotano una persona, parti del suo corpo, elementi del suo mondo spirituale. Pushkin e poeti del ventesimo secolo. le designazioni di uomo e natura sono approssimativamente uguali. In questo importante aspetto dell'argomento, possiamo dire che il ventesimo secolo. seguì Pushkin.

Tema minimo caso tra le parole più frequenti, si trova solo in Griboedov e Pushkin. Lermontov e poeti del ventesimo secolo. lascia il posto a un tema minimale parola. La parola non esclude le azioni (l'interpretazione biblica dell'argomento: nel Nuovo Testamento, tutti gli insegnamenti di Gesù Cristo sono considerati la parola di Dio o la parola di Gesù, e gli apostoli a volte si definiscono ministri della Parola). Il significato sacro della parola lessema si manifesta in modo convincente, ad esempio, nel verso di Pasternak "E l'immagine del mondo, rivelata nella Parola". Il significato sacro del lessema parola in congiunzione e in contrasto con le vicende umane, si manifesta in modo convincente nell'omonima poesia di Gumilyov.

I token che si trovano in un solo testo caratterizzano l'originalità di un determinato libro o di una raccolta di libri. Ad esempio, la parola "mente" è la più frequente nella commedia di Griboedov "Woe from Wit" - ma non ricorre tra le parole frequenti di altri testi. Il tema della mente è di gran lunga il più significativo nella commedia. Questo lessema accompagna l'immagine di Chatsky, e il nome di Chatsky è il più frequente nella commedia. Pertanto, l'opera combina organicamente il nome comune più frequente con il nome proprio più frequente.

Il più alto coefficiente di correlazione collega i temi dei libri tragici "The Pillar of Fire" di Gumilyov e "Anno Domini MCMXXI" di Akhmatova. Tra i 15 sostantivi più frequenti ce ne sono 10 comuni, tra cui sangue, cuore, anima, amore, parola, cielo. Ricordiamo che il libro di Akhmatova includeva una miniatura "Non sarai vivo ...", scritta tra l'arresto di Gumilyov e la sua esecuzione.

I temi della candela e della folla nel materiale studiato si trovano solo nelle "Poesie di Yuri Zhivago". Il tema della candela nei versi del romanzo ha molti significati contestuali: è associato all'immagine di Gesù Cristo, ai temi della fede, dell'immortalità, della creatività, della data dell'amore. La candela è la fonte di luce più importante nelle scene centrali del romanzo. Il tema della folla si sviluppa in connessione con l'idea principale del romanzo, in cui la vita privata di una persona con i suoi valori incrollabili si contrappone all'immoralità del nuovo stato, costruito sui principi del piacere alla folla .

Il lavoro coinvolge anche la terza fase, anch'essa riflessa nel programma, ovvero il calcolo della differenza nei numeri ordinali di parole comuni a due dizionari e la distanza media tra le stesse parole di due dizionari. Questa fase consente di passare dalle tendenze generali nell'interazione dei dizionari identificate con l'aiuto delle statistiche a un livello che si avvicina al testo. Ad esempio, i libri di Gumilyov e Akhmatova sono correlati statisticamente in modo significativo. Osserviamo quali parole si sono rivelate comuni per i loro dizionari e, prima di tutto, scegliamo quelle i cui numeri di serie differiscono minimamente o uguali a zero. Sono queste parole che hanno lo stesso numero di rango e, di conseguenza, sono questi temi minimi nella mente dei due poeti che sono ugualmente importanti. Successivamente, dovresti passare al livello di testi e contesti.

I metodi quantitativi aiutano anche a studiare le caratteristiche dei popoli: i madrelingua. Supponiamo che ci siano 6 casi in russo, non ci sono casi in inglese e in alcune lingue dei popoli del Daghestan il numero di casi raggiunge i 40. L. Perlovsky nel suo articolo "Coscienza, lingua e cultura" correla questi caratteristiche con la tendenza dei popoli all'individualismo o al collettivismo, con la percezione di cose e fenomeni separatamente o in connessione con altri. Dopotutto, è stato nel mondo anglofono (non ci sono casi - la cosa è percepita "da sola") che sono apparsi concetti come libertà individuale, liberalismo e democrazia (noto che uso questi concetti solo in connessione con il lingua, senza alcuna caratteristica valutativa). Nonostante il fatto che tali ipotesi rimangano ancora solo a livello di audaci ipotesi scientifiche, aiutano a guardare i fenomeni già familiari in un modo nuovo.

Come possiamo vedere, le caratteristiche quantitative possono essere applicate in aree linguistiche completamente diverse, il che offusca sempre più i confini tra metodi "esatti" e "umanitari". La linguistica ricorre sempre più all'aiuto non solo della matematica, ma anche della tecnologia informatica per risolvere i suoi problemi.

2.3 Apprendimento della lingua con metodi di logica formale

Con i metodi non quantitativi della matematica, in particolare con la logica, la moderna linguistica teorica interagisce non meno fruttuosamente che con quelli quantitativi. Il rapido sviluppo delle tecnologie informatiche e la crescita del loro ruolo nel mondo moderno hanno richiesto una revisione dell'approccio all'interazione del linguaggio e della logica in generale.

I metodi della logica sono ampiamente utilizzati nello sviluppo di linguaggi formalizzati, in particolare linguaggi di programmazione, i cui elementi sono alcuni simboli (simili a matematici), scelti (o costruiti da simboli precedentemente selezionati) e interpretati in un certo modo, associati senza uso "tradizionale", comprensione e comprensione delle funzioni degli stessi simboli in altri contesti. Un programmatore si occupa costantemente di logica nel suo lavoro. Il significato della programmazione è proprio quello di insegnare al computer a ragionare (nel senso più ampio del termine). Allo stesso tempo, i metodi di "ragionamento" risultano essere molto diversi. Ogni programmatore passa una certa quantità di tempo alla ricerca di bug nei programmi propri e di altre persone. Cioè, cercare errori nel ragionamento, nella logica. E anche questo lascia il segno. È molto più facile rilevare errori logici nel linguaggio ordinario. La relativa semplicità delle lingue studiate dai logici consente loro di chiarire le strutture di queste lingue in modo più chiaro di quanto sia possibile ai linguisti che analizzano esclusivamente linguaggi naturali complessi. In considerazione del fatto che le lingue studiate dai logici utilizzano relazioni copiate dai linguaggi naturali, i logici possono dare contributi significativi alla teoria generale del linguaggio. La situazione qui è simile a quella che si verifica in fisica: il fisico formula anche teoremi per casi idealmente semplificati che non si verificano affatto in natura - formula leggi per gas ideali, liquidi ideali, parla di moto in assenza di attrito, eccetera. Per questi casi idealizzati si possono stabilire leggi semplici che contribuirebbero enormemente alla comprensione di ciò che sta accadendo nella realtà e di ciò che probabilmente rimarrebbe sconosciuto alla fisica se provasse a considerare la realtà direttamente, in tutta la sua complessità.

Nello studio delle lingue naturali, vengono utilizzati metodi logici in modo che gli studenti di lingue non possano stupidamente "memorizzare" quante più parole possibili, ma comprenderne meglio la struttura. L. Shcherba ha anche usato nelle sue lezioni un esempio di una frase costruita secondo le leggi della lingua russa: "Lo scintillante kuzdra shteko ha bocciato il bokra e arriccia il bokra", e poi ha chiesto agli studenti cosa significasse. Nonostante il significato delle parole nella frase rimanesse poco chiaro (semplicemente non esistono in russo), è stato possibile rispondere chiaramente: "kuzdra" è il soggetto, un sostantivo femminile, al singolare, nominativo, " bokr” è animato, e così via. La traduzione della frase risulta essere qualcosa del genere: "Qualcosa di femminile in una volta ha fatto qualcosa su una specie di creatura maschile, e poi ha iniziato a fare qualcosa del genere per un lungo, graduale con il suo cucciolo". Un esempio simile di testo (artistico) da parole inesistenti, costruito interamente secondo le leggi del linguaggio, è Jabberwock di Lewis Carroll (in Alice nel paese delle meraviglie, Carroll, attraverso il suo personaggio Humpty Dumpty, spiega il significato delle parole che inventato: "cotto" - le otto di sera, quando è ora di cucinare la cena, "chlivky" - fragile e abile, "shorek" - un incrocio tra un furetto, un tasso e un cavatappi, "tuffo" - ​salta, tuffati, gira, "nava" - erba sotto la meridiana (si estende un po' a destra, un po' a sinistra e un po' indietro), "grunt" - grugnisce e ride, "zelyuk" - un tacchino verde, "myumzik" - un uccello; le sue piume sono arruffate e sporgono in tutte le direzioni, come una scopa, "mova" - lontano da casa) .

Uno dei concetti principali della logica moderna e della linguistica teorica, utilizzato nello studio delle lingue di vario calcolo logico e matematico, lingue naturali, per descrivere la relazione tra lingue di diversi "livelli" e per caratterizzare la relazione tra il lingue in esame e le aree tematiche descritte con il loro aiuto, è il concetto di metalinguaggio. Un metalinguaggio è un linguaggio usato per esprimere giudizi su un altro linguaggio, l'oggetto linguaggio. Con l'aiuto di un metalinguaggio, studiano la struttura delle combinazioni di caratteri (espressioni) dell'oggetto linguaggio, dimostrano teoremi sulle sue proprietà espressive, sulla sua relazione con altre lingue, ecc. La lingua studiata è anche chiamata lingua del soggetto in rapporto con questo metalinguaggio. Sia la lingua soggetto che il metalinguaggio possono essere lingue ordinarie (naturali). Il metalinguaggio può differire dal linguaggio oggetto (ad esempio, in un libro di testo inglese per russi, il russo è il metalinguaggio e l'inglese è il linguaggio oggetto), ma può anche coincidere con esso o differire solo parzialmente, ad esempio, nella terminologia speciale (La terminologia linguistica russa è un elemento del metalinguaggio per descrivere la lingua russa, i cosiddetti fattori semantici fanno parte del metalinguaggio per descrivere la semantica delle lingue naturali).

Il concetto di "metalinguage" è diventato molto fruttuoso in connessione con lo studio dei linguaggi formalizzati costruiti nell'ambito della logica matematica. A differenza delle lingue soggetto formalizzate, in questo caso il metalinguaggio, per mezzo del quale la metateoria viene formulata (studiando le proprietà della teoria soggetto formulata nella lingua soggetto), è, di regola, una lingua naturale ordinaria, in qualche modo speciale un frammento di un linguaggio naturale limitato in modo speciale, non contenente alcun tipo di ambiguità , metafore, concetti "metafisici", ecc. elementi del linguaggio ordinario che ne impediscono l'uso come strumento per un'accurata ricerca scientifica. Allo stesso tempo, il metalinguaggio stesso può essere formalizzato e (a prescindere da ciò) diventare oggetto di ricerca svolta per mezzo del metametalinguaggio, e tale serie può essere “pensata” come crescente all'infinito.

La logica ci insegna una fruttuosa distinzione tra l'oggetto-linguaggio e il metalinguaggio. L'oggetto-linguaggio è il soggetto stesso della ricerca logica, e il metalinguaggio è quel linguaggio inevitabilmente artificiale in cui tale ricerca si svolge. Il pensiero logico consiste solo nel formulare le relazioni e la struttura di un linguaggio reale (linguaggio oggetto) nel linguaggio dei simboli (metalinguaggio).

Il metalinguaggio deve comunque essere “non più povero” del suo linguaggio obiettivo (cioè per ogni espressione di quest'ultimo nel metalinguaggio ci deve essere il suo nome, “traduzione”) - altrimenti, se questi requisiti non sono soddisfatti (il che richiede certamente posto nelle lingue naturali, se accordi speciali non prevedono diversamente) sorgono paradossi semantici (antinomie).

Man mano che venivano creati sempre più nuovi linguaggi di programmazione, in connessione con il problema della programmazione dei traduttori, c'era un urgente bisogno di creare metalinguaggi. Attualmente, il metalinguaggio della forma Backus-Naur (abbreviato in BNF) è il più comunemente usato per descrivere la sintassi dei linguaggi di programmazione. È una forma compatta sotto forma di alcune formule simili a quelle matematiche. Per ogni concetto della lingua esiste una metaformula unica (formula normale). Consiste di parti sinistra e destra. Il lato sinistro specifica il concetto definito e il lato destro specifica l'insieme di costrutti linguistici ammissibili che sono combinati in questo concetto. La formula utilizza metacaratteri speciali sotto forma di parentesi angolari, che contengono il concetto in fase di definizione (sul lato sinistro della formula) o un concetto precedentemente definito (sul lato destro), ed è indicata la separazione delle parti sinistra e destra dal metacarattere "::=", il cui significato è equivalente alle parole "per definizione c'è". Le formule metalinguistiche sono incorporate nei traduttori in qualche forma; con il loro aiuto, i costrutti utilizzati dal programmatore vengono verificati per verificarne la conformità formale con uno qualsiasi dei costrutti sintatticamente validi in questo linguaggio. Esistono anche metalingue separate di varie scienze, quindi la conoscenza esiste sotto forma di varie metalingue.

I metodi logici sono serviti anche come base per la creazione di sistemi di intelligenza artificiale basati sul concetto di connessionismo. Il connessionismo è una tendenza speciale nella scienza filosofica, il cui oggetto sono le questioni della conoscenza. Nell'ambito di questa tendenza, si stanno tentando di spiegare le capacità intellettuali di una persona utilizzando reti neurali artificiali. Composte da un gran numero di unità strutturali simili ai neuroni, con un peso assegnato a ciascun elemento che determina la forza della connessione con altri elementi, le reti neurali sono modelli semplificati del cervello umano. Esperimenti con reti neurali di questo tipo hanno dimostrato la loro capacità di imparare a svolgere compiti come il riconoscimento di schemi, la lettura e l'identificazione di semplici strutture grammaticali.

I filosofi iniziarono a interessarsi al connessionismo, poiché l'approccio connessionista prometteva di fornire un'alternativa alla teoria classica della mente e all'idea ampiamente diffusa all'interno di questa teoria che il funzionamento della mente fosse simile all'elaborazione del linguaggio simbolico da parte di un computer digitale. computer. Questo concetto è molto controverso, ma negli ultimi anni ha trovato sempre più sostenitori.

Lo studio logico del linguaggio continua il concetto di linguaggio come sistema di Saussure. Il fatto che continui costantemente conferma ancora una volta l'audacia delle congetture scientifiche dell'inizio del secolo scorso. Dedicherò l'ultima sezione del mio lavoro alle prospettive per lo sviluppo dei metodi matematici in linguistica oggi.

2.4 Prospettive per l'applicazione dei metodi matematici in linguistica

Nell'era della tecnologia informatica, i metodi della linguistica matematica hanno ricevuto una nuova prospettiva di sviluppo. La ricerca di soluzioni ai problemi dell'analisi linguistica è ora sempre più implementata a livello di sistemi informativi. Allo stesso tempo, l'automazione del processo di elaborazione del materiale linguistico, fornendo al ricercatore opportunità e vantaggi significativi, pone inevitabilmente nuove esigenze e compiti per lui.

La combinazione di conoscenza "esatta" e "umanitaria" è diventata terreno fertile per nuove scoperte nel campo della linguistica, dell'informatica e della filosofia.

La traduzione automatica da una lingua all'altra rimane un ramo in rapida crescita della tecnologia dell'informazione. Nonostante il fatto che la traduzione assistita da computer non possa mai essere paragonata in qualità alla traduzione umana (soprattutto per i testi letterari), la macchina è diventata un assistente indispensabile per una persona nella traduzione di grandi volumi di testo. Si ritiene che nel prossimo futuro verranno creati sistemi di traduzione più avanzati, basati principalmente sull'analisi semantica del testo.

Un'area altrettanto promettente è l'interazione tra linguistica e logica, che funge da base filosofica per comprendere la tecnologia dell'informazione e la cosiddetta "realtà virtuale". Nel prossimo futuro, continueranno i lavori per la creazione di sistemi di intelligenza artificiale, anche se, ancora una volta, non sarà mai uguale all'umano nelle sue capacità. Tale competizione non ha senso: ai nostri tempi, la macchina dovrebbe diventare (e diventa) non una rivale, ma un'assistente dell'uomo, non qualcosa del regno della fantasia, ma parte del mondo reale.

Continua lo studio della lingua con metodi statistici, che consente di determinarne con maggiore precisione le proprietà qualitative. È importante che le ipotesi più ardite sul linguaggio trovino la loro dimostrazione matematica, e quindi logica.

La cosa più significativa è che vari rami dell'applicazione della matematica in linguistica, prima abbastanza isolati, negli ultimi anni sono stati correlati tra loro, collegandosi in un sistema coerente, per analogia con il sistema linguistico scoperto un secolo fa da Ferdinand de Saussure e Yvan Baudouin de Courtenay. Questa è la continuità della conoscenza scientifica.

La linguistica nel mondo moderno è diventata la base per lo sviluppo della tecnologia dell'informazione. Finché l'informatica rimarrà una branca in rapido sviluppo dell'attività umana, l'unione di matematica e linguistica continuerà a svolgere il suo ruolo nello sviluppo della scienza.

Conclusione

Nel corso del XX secolo, le tecnologie informatiche hanno fatto molta strada: dall'uso militare a quello pacifico, da una gamma ristretta di obiettivi alla penetrazione in tutti i rami della vita umana. La matematica come scienza ha trovato un significato pratico sempre nuovo con lo sviluppo della tecnologia informatica. Questo processo continua ancora oggi.

Il "tandem" precedentemente impensabile di "fisici" e "parolieri" è diventato una realtà. Per la piena interazione della matematica e dell'informatica con le discipline umanistiche, erano richiesti specialisti qualificati da entrambe le parti. Mentre gli informatici hanno sempre più bisogno di conoscenze umanitarie sistematiche (linguistiche, culturali, filosofiche) per comprendere i cambiamenti nella realtà che li circonda, nell'interazione tra uomo e tecnologia, per sviluppare sempre più nuovi concetti linguistici e mentali, per scrivere programmi, quindi qualsiasi "Lettere" nel nostro tempo per la loro crescita professionale deve padroneggiare almeno le basi del lavoro con un computer.

La matematica, essendo strettamente interconnessa con l'informatica, continua a svilupparsi e ad interagire con le scienze naturali e umanistiche. Nel nuovo secolo, la tendenza alla matematizzazione della scienza non si indebolisce, ma anzi aumenta. Sulla base di dati quantitativi si comprendono le leggi dello sviluppo della lingua, le sue caratteristiche storiche e filosofiche.

Il formalismo matematico è più adatto per descrivere modelli in linguistica (come, in effetti, in altre scienze - sia umanistiche che naturali). La situazione a volte si sviluppa nella scienza in modo tale che senza l'uso di un linguaggio matematico appropriato è impossibile comprendere la natura fisica, chimica, ecc. processo non è possibile. Creare un modello planetario dell'atomo, il famoso fisico inglese del XX secolo. E. Rutherford ha incontrato difficoltà matematiche. All'inizio la sua teoria non fu accettata: non suonava convincente, e la ragione di ciò era l'ignoranza di Rutherford della teoria della probabilità, sulla base del meccanismo di cui era possibile comprendere solo la rappresentazione del modello delle interazioni atomiche. Rendendosi conto di ciò, già a quel tempo uno scienziato eccezionale, detentore del Premio Nobel, si iscrisse al seminario del matematico Professor Lamb e per due anni, insieme agli studenti, frequentò un corso ed elaborò un seminario sulla teoria della probabilità . Sulla base di ciò, Rutherford è stato in grado di descrivere il comportamento dell'elettrone, conferendo al suo modello strutturale un'accuratezza convincente e ottenendo riconoscimenti. Lo stesso è con la linguistica.

Ciò pone la domanda, cosa c'è di così matematico nei fenomeni oggettivi, grazie al quale possono essere descritti nel linguaggio della matematica, nel linguaggio delle caratteristiche quantitative? Si tratta di unità omogenee di materia distribuite nello spazio e nel tempo. Quelle scienze che sono andate più lontano di altre verso l'isolamento dell'omogeneità, e risultano essere più adatte per l'uso della matematica in esse.

Internet, che si è sviluppato rapidamente negli anni '90, ha riunito rappresentanti di vari paesi, popoli e culture. Nonostante il fatto che l'inglese continui ad essere la lingua principale della comunicazione internazionale, Internet è diventato multilingue ai nostri tempi. Ciò ha portato allo sviluppo di sistemi di traduzione automatica di successo commerciale ampiamente utilizzati in vari campi dell'attività umana.

Le reti di computer sono diventate oggetto di riflessione filosofica: sono stati creati sempre più nuovi concetti linguistici, logici, di visione del mondo che aiutano a comprendere la "realtà virtuale". In molte opere d'arte sono stati creati scenari - più spesso pessimistici - sul dominio delle macchine su una persona e della realtà virtuale - sul mondo esterno. Lungi dall'essere sempre tali previsioni si sono rivelate prive di significato. La tecnologia dell'informazione non è solo un'industria promettente per investire la conoscenza umana, è anche un modo per controllare le informazioni e, di conseguenza, il pensiero umano.

Questo fenomeno ha sia un lato negativo che uno positivo. Negativo - perché il controllo sulle informazioni è contrario al diritto umano inalienabile al libero accesso ad esse. Positivo - perché la mancanza di questo controllo può portare a conseguenze catastrofiche per l'umanità. Basti ricordare uno dei film più saggi dell'ultimo decennio - "Quando il mondo finisce" di Wim Wenders, i cui personaggi sono completamente immersi nella "realtà virtuale" dei propri sogni registrati su un computer. Tuttavia, né un singolo scienziato né un singolo artista può dare una risposta univoca alla domanda: cosa attende la scienza e la tecnologia in futuro.

L'attenzione al "futuro", a volte apparentemente fantastica, era una caratteristica distintiva della scienza a metà del XX secolo, quando gli inventori cercavano di creare modelli perfetti di tecnologia che potessero funzionare senza l'intervento umano. Il tempo ha mostrato la natura utopica di tale ricerca. Tuttavia, sarebbe superfluo condannare gli scienziati per questo - senza il loro entusiasmo negli anni '50 -'60, la tecnologia dell'informazione non avrebbe fatto un salto così potente negli anni '90 e non avremmo quello che abbiamo adesso.

Gli ultimi decenni del ventesimo secolo hanno cambiato le priorità della scienza: la ricerca, il pathos inventivo hanno lasciato il posto all'interesse commerciale. Ancora una volta, questo non è né buono né cattivo. Questa è una realtà in cui la scienza è sempre più integrata nella vita di tutti i giorni.

Il 21 ° secolo ha continuato questa tendenza e ai nostri tempi dietro le invenzioni non ci sono solo fama e riconoscimento, ma, prima di tutto, denaro. Questo è anche il motivo per cui è importante garantire che le ultime conquiste della scienza e della tecnologia non cadano nelle mani di gruppi terroristici o regimi dittatoriali. Il compito è difficile fino all'impossibilità; realizzarlo il più possibile è compito dell'intera comunità mondiale.

L'informazione è un'arma e le armi non sono meno pericolose delle armi nucleari o chimiche, solo che non agiscono fisicamente, ma piuttosto psicologicamente. L'umanità ha bisogno di pensare a ciò che è più importante per lei in questo caso: libertà o controllo.

Gli ultimi concetti filosofici relativi allo sviluppo delle tecnologie dell'informazione e un tentativo di comprenderle hanno mostrato i limiti sia del materialismo delle scienze naturali, che ha dominato durante il XIX e l'inizio del XX secolo, sia dell'idealismo estremo, che nega il significato del mondo materiale . È importante per il pensiero moderno, in particolare il pensiero occidentale, superare questo dualismo nel pensare, quando il mondo circostante è chiaramente diviso in materiale e ideale. Il percorso per questo è un dialogo di culture, un confronto di diversi punti di vista sui fenomeni circostanti.

Paradossalmente, la tecnologia dell'informazione può svolgere un ruolo importante in questo processo. Le reti di computer, e in particolare Internet, non sono solo una risorsa per l'intrattenimento e una vigorosa attività commerciale, sono anche un mezzo di comunicazione significativa e controversa tra rappresentanti di varie civiltà nel mondo moderno, nonché per un dialogo tra passato e il presente. Possiamo dire che Internet spinge i confini spaziali e temporali.

E nel dialogo delle culture attraverso la tecnologia dell'informazione, il ruolo della lingua come il più antico mezzo di comunicazione universale è ancora importante. Ecco perché la linguistica, in interazione con la matematica, la filosofia e l'informatica, ha vissuto la sua seconda nascita e continua a svilupparsi ancora oggi. La tendenza del presente continuerà in futuro - "fino alla fine del mondo", come predisse lo stesso V. Wenders 15 anni fa. È vero, non si sa quando avverrà questa fine, ma è importante adesso, perché il futuro prima o poi diventerà comunque presente.

Allegato 1

Ferdinando di Saussure

Il linguista svizzero Ferdinand de Saussure (1857-1913) è ampiamente considerato il fondatore della linguistica moderna nei suoi tentativi di descrivere la struttura del linguaggio piuttosto che la storia di particolari lingue e forme linguistiche. Infatti, il metodo dello strutturalismo negli studi linguistici e letterari e un ramo significativo della semiotica trovano il loro principale punto di partenza nel suo lavoro all'inizio del XX secolo. È stato persino sostenuto che il complesso di strategie e concezioni che è stato chiamato "poststrutturalismo" - il lavoro di Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e altri - è suggerito dal lavoro di Saussure in linguistica e letture anagrammatiche della tarda poesia latina, dal modernismo letterario alla psicoanalisi e alla filosofia del primo Novecento. Come sostengono Algirdas Julien Greimas e Joseph Courtés in Semiotics and Language: An Analytic Dictionary, sotto il titolo "Interpretazione", all'inizio del XX secolo sorse una nuova modalità di interpretazione che essi identificano con la linguistica saussuriana, la fenomenologia husserliana e la psicoanalisi freudiana. In questa modalità, "l'interpretazione non è più questione di attribuire un dato contenuto a una forma che altrimenti ne sarebbe sprovvista; è piuttosto una parafrasi che formula in altro modo il contenuto equivalente di un elemento significante all'interno di un dato sistema semiotico" ( 159). in questa concezione di "interpretazione", forma e contenuto non sono distinti; anzi, ogni "forma" è, alternativamente, anche un "contenuto" semantico, una "forma significante", cosicché l'interpretazione offre una parafrasi analogica di qualcosa che già significa all'interno di qualche altro sistema di significazione.

Tale reinterpretazione della forma e della comprensione - che Claude Lévi-Strauss descrive in una delle sue articolazioni più programmatiche del concetto di strutturalismo, in "Struttura e forma: riflessioni su un'opera di Vladimir Propp" - è implicita nel Corso postumo di Saussure in Linguistica generale (1916, trad., 1959, 1983). Durante la sua vita, Saussure pubblicò relativamente poco, e la sua opera principale, il Corso, fu la trascrizione da parte dei suoi studenti di diversi corsi di linguistica generale che tenne nel 1907-11. Nel Corso Saussure invocava lo studio "scientifico" del linguaggio in contrapposizione al lavoro di linguistica storica che era stato svolto nel diciannovesimo secolo. Quel lavoro è una delle grandi conquiste dell'intelletto occidentale: prendere parole particolari come elementi costitutivi di linguistica, linguistica storica (o "diacronica") ha tracciato l'origine e lo sviluppo delle lingue occidentali da una presunta fonte linguistica comune, prima una lingua "indoeuropea" e poi una precedente "p lingua roto-indoeuropea".

È proprio questo studio delle occorrenze uniche delle parole, con il concomitante presupposto che l'"unità" fondamentale del linguaggio sia, in effetti, l'esistenza positiva di questi "elementi-parola", che Saussure ha messo in discussione. Il suo lavoro è stato un tentativo di ridurre la massa di fatti sul linguaggio, studiati così minuziosamente dalla linguistica storica, a un numero gestibile di proposizioni. La "scuola comparata" della filologia ottocentesca, dice Saussure nel Corso, "non è riuscita a fondare la vera scienza della linguistica" perché "non è riuscita a ricercare la natura del suo oggetto di studio" ( 3). Quella "natura", sostiene, si trova non semplicemente nelle parole "elementari" che un linguaggio comprende - gli apparenti fatti "positivi" (o "sostanze") del linguaggio - ma nelle relazioni formali che danno origine a quelle "sostanze".

Il riesame sistematico del linguaggio operato da Saussure si basa su tre presupposti: il primo è che lo studio scientifico del linguaggio ha bisogno di sviluppare e studiare il sistema piuttosto che la storia dei fenomeni linguistici, per questo egli distingue tra le occorrenze particolari del linguaggio - il suo particolare "eventi-discorso", che designa come parole - e l'oggetto proprio della linguistica, il sistema (o "codice") che governa quegli eventi, che designa come langue. Un tale studio sistematico, inoltre, richiede un "sincronico" concezione del rapporto tra gli elementi del linguaggio in un determinato istante piuttosto che lo studio "diacronico" dello sviluppo del linguaggio attraverso la storia.

Da questo presupposto nacque quello che Roman Jakobson nel 1929 venne a designare come "strutturalismo", in cui "qualsiasi insieme di fenomeni esaminati dalla scienza contemporanea è trattato non come un agglomerato meccanico ma come un tutto strutturale la concezione meccanica dei processi cede alla questione della loro funzione" ("Romantico" 711). In questo passaggio Jakobson sta articolando l'intenzione di Saussure di definire la linguistica come un sistema scientifico in opposizione a un semplice resoconto "meccanico" degli incidenti storici. ora chiamiamolo "strutturale" - linguistica: che gli elementi di base del linguaggio possono essere studiati solo in relazione alle loro funzioni piuttosto che in relazione alle loro cause. Le "parole") europee, quegli eventi ed entità devono essere situati all'interno di un quadro sistemico in cui sono messi in relazione con altri cosiddetti eventi ed entità.Si tratta di un radicale riorientamento nella concezione dell'esperienza e dei fenomeni, la cui importanza il filosofo Ernst Cassirer ha paragonato alla "nuova scienza di Galileo che nel XVII secolo cambiò tutto il nostro concetto del mondo fisico" (citato in Culler, Pursuit 2 4). Questo cambiamento, come notano Greimas e Courtés, riconcepisce "l'interpretazione" e quindi riconcepisce la spiegazione e la comprensione stesse. Invece di spiegare "essendo in termini di cause di un fenomeno, così che, come "effetto", è in qualche modo subordinato alle sue cause, la spiegazione qui consiste nel subordinare un fenomeno alla sua "funzione" orientata al futuro o "scopo." La spiegazione non è più indipendente dalle intenzioni o dagli scopi umani (anche se tali intenzioni possono essere impersonali, comunitarie o, in termini freudiani, "inconsce").

Nella sua linguistica Saussure compie questa trasformazione proprio nella ridefinizione della "parola" linguistica, che descrive come il "segno" linguistico e definisce in termini funzionalistici. Il segno, sostiene, è l'unione di "un concetto e un'immagine sonora", che ha chiamato "significato e significante" (66-67; la traduzione di Roy Harris del 1983 offre i termini "significazione" e "segnale"). La natura della loro "combinazione" è "funzionale" in quanto né il significato né il significante sono la "causa" dell'altro, ma "ciascuno i suoi valori dall'altro" (8). elemento del linguaggio, il segno , relazionale e sottopone ad analisi rigorosa l'assunto di base della linguistica storica, vale a dire l'identità delle unità elementari del linguaggio e del significato (cioè le "parole"). la parola "albero" come la "stessa" parola non è perché la parola è definita da qualità intrinseche - non è un "agglomerato meccanico" di tali qualità - ma perché è definita come un elemento di un sistema, il "tutto strutturale", "del linguaggio.

Tale definizione relazionale (o "diacritica") di un'entità governa la concezione di tutti gli elementi del linguaggio nella linguistica strutturale. Ciò è più evidente nel risultato più impressionante della linguistica saussuriana, lo sviluppo dei concetti di "fonemi" e "caratteristiche distintive" del linguaggio. I fonemi sono le più piccole unità articolate e significanti di una lingua. Non sono i suoni che ricorrono nel linguaggio, ma le "immagini sonore" menzionate da Saussure, che vengono percepite dai parlanti - apprese fenomenicamente - come portatrici di significato. (Così, Elmar Holenstein descrive la linguistica di Jakobson, che segue Saussure in modi importanti, come "strutturalismo fenomenologico"). . . è una realtà fenomenologica e non empirica; non è l'opera in sé, ma un insieme di relazioni funzionali che si situano nella coscienza di un collettivo (generazione, ambiente, ecc.)" (citato in Galan 35). Allo stesso modo, Lévi-Strauss, il principale portavoce dello strutturalismo francese , osservava nel 1960 che "la struttura non ha un contenuto distinto; esso stesso è contenuto, e l'organizzazione logica in cui è contenuto è concepito come una proprietà del reale» (167; vedi anche Jakobson, Fundamentals 27-28).

I fonemi, dunque, i più piccoli elementi percepibili del linguaggio, non sono oggetti positivi ma una "realtà fenomenologica". In inglese, ad esempio, il fonema /t/ può essere pronunciato in molti modi diversi, ma in tutti i casi un anglofono lo riconoscerà come funzionante come /t/. Una t aspirata (cioè una t pronunciata con un respiro simile ad una h dopo di essa), un suono t acuto o basso, un suono t esteso e così via, funzioneranno tutti allo stesso modo nel distinguere il significato di "to" e "do" in inglese. Inoltre, le differenze tra le lingue sono tali che le variazioni fonologiche in una lingua possono costituire fonemi distinti in un'altra; quindi, l'inglese distingue tra /l/ e /r/, mentre altre lingue sono strutturate in modo tale che queste articolazioni sono considerate variazioni dello stesso fonema (come la t aspirata e non aspirata in inglese). In ogni linguaggio naturale, il vasto numero di parole possibili è una combinazione di un piccolo numero di fonemi. L'inglese, ad esempio, possiede meno di 40 fonemi che si combinano per formare oltre un milione di parole diverse.

I fonemi del linguaggio sono essi stessi strutture sistematicamente organizzate di caratteristiche. Negli anni '20 e '30, seguendo l'esempio di Saussure, Jakobson e N. S. Trubetzkoy isolarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura fisiologica degli organi del linguaggio - lingua, denti, corde vocali e così via - che Saussure menziona nel Corso e che Harris descrive come "fonetica fisiologica" ( 39; la precedente traduzione di Baskin usa il termine "fonologia" [(1959) 38]) - e si combinano in "fasci" di opposizioni binarie per formare fonemi. Ad esempio, in inglese la differenza tra /t/ e /d/ è la presenza o l'assenza di "voce" (l'impegno delle corde vocali), e sul piano della sonorizzazione questi fonemi si definiscono reciprocamente. In questo modo, la fonologia è un esempio specifico di una regola generale del linguaggio descritta da Saussure: Nel linguaggio ci sono solo differenze. ancora più importante: una differenza implica generalmente termini positivi tra i quali si stabilisce la differenza; ma nella lingua ci sono solo differenze senza termini positivi. Sia che prendiamo il significato o il significante, la lingua non ha né idee né suoni che esistevano prima del sistema linguistico. (120)

In questo quadro, le identità linguistiche sono determinate non da qualità intrinseche ma da relazioni sistemiche ("strutturali").

Ho detto che la fonologia "ha seguito l'esempio" di Saussure, perché anche se la sua analisi della fisiologia della produzione linguistica "sarebbe oggi chiamata", come dice Harris, "fisica", in opposizione a "psicologica" o "funzionale". "" (Lettura 49), di conseguenza nel Corso ha articolato la direzione e le linee di un'analisi funzionale del linguaggio. Allo stesso modo, la sua unica opera pubblicata estesa, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoria sul sistema primitivo delle vocali nelle lingue indoeuropee), apparsa nel 1878, si collocava pienamente all'interno del progetto ottocentesco. linguistica storica del sec. Tuttavia, all'interno di questo lavoro, come ha sostenuto Jonathan Culler, Saussure ha dimostrato "la fecondità di pensare il linguaggio come un sistema di elementi puramente relazionali, anche quando lavora al compito di ricostruzione storica" ​​(Saussure 66). Analizzando le relazioni strutturali sistematiche tra i fonemi per tenere conto dei modelli di alternanza vocalica nelle lingue indoeuropee esistenti, Saussure suggerì che oltre a diversi fonemi diversi /a/, doveva esserci un altro fonema che poteva essere descritto formalmente. "Ciò che rende il lavoro di Saussure così impressionante", conclude Culler, "è il fatto che quasi cinquant'anni dopo, quando l'ittita cuneiforme fu scoperto e decifrato, si scoprì che conteneva un fonema, scritto h, che si comportava come aveva predetto Saussure. . Aveva scoperto, con un'analisi puramente formale, quelli che oggi sono conosciuti come i laringei dell'indoeuropeo" (66).

Questa concezione della determinazione relazionale o diacritica degli elementi di significazione, implicita ed esplicita nel Corso, suggerisce un terzo assunto che governa la linguistica strutturale, ciò che Saussure chiama "l'arbitrarietà del segno". Con ciò intende che la relazione tra significante e significato nel linguaggio non è mai necessaria (o "motivata"): si potrebbe facilmente trovare il suono significante arbre come l'albero significante da unire al concetto "albero". Ma più di questo, significa che anche il significato è arbitrario: si potrebbe facilmente definire il concetto di "albero" per la sua qualità legnosa (che escluderebbe le palme) come per la sua dimensione (che esclude le "basse piante legnose" che noi chiama cespugli). Ciò dovrebbe chiarire che la numerazione delle ipotesi che ho presentato non rappresenta un ordine di priorità: ciascuna assunzione - la natura sistemica della significazione (compresa meglio studiando il linguaggio "in modo sincrono"), la natura relazionale o "diacritica" degli elementi della significazione, l'arbitrarietà dei segni - deriva il suo valore dagli altri.

Cioè, la linguistica saussuriana i fenomeni che studia nelle relazioni generali di combinazione e contrasto nel linguaggio. In questa concezione, il linguaggio è sia il processo di articolazione del significato (significazione) sia il suo prodotto (comunicazione), e queste due funzioni del linguaggio non sono né identiche né pienamente congruenti (vedi Schleifer, "Deconstruction"). Qui possiamo vedere l'alternanza tra forma e contenuto che Greimas e Courtés descrivono nell'interpretazione modernista: il linguaggio presenta contrasti che definiscono formalmente le sue unità, e queste unità si combinano su livelli successivi per creare il contenuto significante. Poiché gli elementi del linguaggio sono arbitrari, inoltre, né il contrasto né la combinazione possono dirsi fondamentali. Così, nel linguaggio i tratti distintivi si combinano per formare fonemi contrastanti su un altro livello di apprensione, i fonemi si combinano per formare morfemi contrastanti, i morfemi si combinano per formare parole, le parole si combinano per formare frasi e così via. In ogni caso, l'intero fonema, o parola, o frase, e così via, è maggiore della somma delle sue parti (proprio come l'acqua, H2O, nell'esempio di Saussure [(1959) 103] è più dell'agglomerato meccanico di idrogeno e ossigeno).

I tre presupposti del Corso di Linguistica Generale hanno portato Saussure a invocare una nuova scienza del XX secolo che andasse oltre la scienza linguistica per studiare "la vita dei segni all'interno della società". Saussure chiamò questa scienza "semiologia (dal greco semeîon "segno")" (16). La "scienza" della semiotica, così come venne praticata nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, allargò lo studio del linguaggio e delle strutture linguistiche agli artefatti letterari costituiti (o articolati) da quelle strutture. Per tutta l'ultima parte della sua carriera, inoltre, anche mentre teneva i corsi di linguistica generale, Saussure proseguì la propria analisi "semiotica" della tarda poesia latina nel tentativo di scoprire anagrammi deliberatamente nascosti di nomi propri. Il metodo di studio era per molti versi l'opposto del razionalismo funzionale delle sue analisi linguistiche: esso tentava, come accenna Saussure in uno dei 99 quaderni in cui proseguiva questo studio, di esaminare sistematicamente il problema del "caso", che " diventa il fondamento inevitabile di tutto" (citato in Starobinski 101). Tale studio, come afferma lo stesso Saussure, si concentra sul "fatto materiale" del caso e del significato (cit. 101), cosicché la "parola-tema" di cui Saussure cerca l'anagramma, come sostiene Jean Starobinski, "è, per il poeta , uno strumento, e non un germe vitale del poema. Il poema è tenuto a reimpiegare i materiali fonici della parola-tema" (45). In questa analisi, Starobinski afferma: "Saussure non si è perso nella ricerca di significati nascosti". Invece, il suo lavoro sembra dimostrare un desiderio di eludere tutti i problemi che sorgono dalla coscienza: "Poiché la poesia non si realizza solo in parole ma è qualcosa che nasce dalle parole, sfugge al controllo arbitrario della coscienza per dipendere esclusivamente da una sorta di legalità linguistica "(121).

Cioè, il tentativo di Saussure di scoprire i nomi propri nella tarda poesia latina - ciò che Tzvetan Todorov chiama la riduzione di una "parola". . . al suo significante” (266) – sottolinea uno degli elementi che governavano la sua analisi linguistica, l'arbitrarietà del segno. una sostanza" - che eliminano effettivamente la semantica come principale oggetto di analisi.) Come conclude Todorov, il lavoro di Saussure appare oggi notevolmente omogeneo nel suo rifiuto di accettare i fenomeni simbolici. . . . Nella sua ricerca sugli anagrammi presta attenzione solo ai fenomeni di ripetizione, non a quelli di evocazione. . . . Nei suoi studi sui Nibelunghi riconosce i simboli solo per attribuirli a letture errate: poiché non sono intenzionali, i simboli non esistono. Infine nei suoi corsi di linguistica generale contempla l'esistenza della semiologia, e quindi dei segni diversi da quelli linguistici; ma questa affermazione è subito limitata dal fatto che la semiologia si dedica a un solo tipo di segni: quelli arbitrari. (269-70)

Se questo è vero, è perché Saussure non poteva concepire l'"intenzione" senza soggetto; non poteva del tutto sfuggire all'opposizione tra forma e contenuto che il suo lavoro tanto metteva in discussione. Invece, ha fatto ricorso alla "legalità linguistica". Situato tra, da un lato, le concezioni ottocentesche della storia, della soggettività e del modo di interpretazione causale governato da queste concezioni e, dall'altro, le concezioni "strutturaliste" novecentesche di quello che Lévi-Strauss chiamava "kantismo senza un soggetto trascendentale" (citato in Connerton 23) - concetti che cancellano l'opposizione tra forma e contenuto (o soggetto e oggetto) e la gerarchia tra primo piano e sfondo nello strutturalismo in piena regola, nella psicoanalisi e persino nella meccanica quantistica - opera di Ferdinand de Saussure in linguistica e semiotica circoscrive un momento significativo nello studio del significato e della cultura.

Ronald Schleifer

Allegato 2

Ferdinand de Saussure (traduzione)

Il linguista svizzero Ferdinand de Saussure (1857-1913) è considerato il fondatore della linguistica moderna, grazie ai suoi tentativi di descrivere la struttura della lingua, piuttosto che la storia delle singole lingue e delle forme delle parole. In generale, le basi dei metodi strutturali nella linguistica e nella critica letteraria e, in larga misura, la semiotica furono poste nelle sue opere all'inizio del ventesimo secolo. È dimostrato che i metodi e i concetti del cosiddetto "post-strutturalismo", sviluppati nelle opere di Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes e altri, risalgono alle opere linguistiche di Saussure e Letture anagrammatiche della poesia tardoromana. Va notato che il lavoro di Saussure sulla linguistica e l'interpretazione linguistica aiuta a collegare un'ampia gamma di discipline intellettuali - dalla fisica alle innovazioni letterarie, alla psicoanalisi e alla filosofia del primo Novecento. A. J. Greimas e J. Kurte scrivono in Semiotics and Language: “Un dizionario analitico dal titolo “Interpretazione” come nuovo tipo di interpretazione è apparso all'inizio del XX secolo insieme alla linguistica di Saussure, alla fenomenologia di Husserl e alla psicoanalisi di Freud. In tal caso, «l'interpretazione non è l'attribuzione di un dato contenuto a una forma che altrimenti ne sarebbe priva, ma è una parafrasi che formula in altro modo lo stesso contenuto di un elemento significante all'interno di un dato sistema semiotico» (159). ). In questa concezione di "interpretazione", forma e contenuto sono inseparabili; al contrario, ogni forma è piena di significato semantico ("forma significativa"), quindi l'interpretazione offre una nuova, simile rivisitazione di qualcosa di significativo in un altro sistema di segni.

Una simile comprensione della forma e del contenuto, presentata da Claude Lévi-Strauss in una delle opere programmatiche dello strutturalismo, ("Struttura e forma: riflessioni sulle opere di Vladimir Propp"), può essere vista nel libro postumo di Saussure, A Course in Linguistica generale (1916, trad., 1959, 1983). Durante la sua vita, Saussure pubblicò poco, "Corso" - la sua opera principale - fu raccolto dagli appunti degli studenti che frequentarono le sue lezioni di linguistica generale nel 1907-11. Nel Corso, Saussure invocava uno studio "scientifico" del linguaggio, contrapponendolo alla linguistica storico-comparativa ottocentesca. Quest'opera può essere considerata una delle più grandi conquiste del pensiero occidentale: prendendo come base singole parole come elementi strutturali della lingua, la linguistica storica (o "diacronica") ha dimostrato l'origine e lo sviluppo delle lingue dell'Europa occidentale a partire una lingua comune, indoeuropea - e un precedente proto-indoeuropeo.

È proprio questo studio delle occorrenze uniche delle parole, con il concomitante presupposto che l'"unità" fondamentale del linguaggio sia, in effetti, l'esistenza positiva di questi "elementi verbali" che Saussure ha messo in discussione. Il suo lavoro è stato un tentativo di ridurre a un piccolo numero di teoremi i molti fatti sulla lingua studiati casualmente dalla linguistica comparata. La scuola filologica comparata dell'Ottocento, scrive Saussure, "non è riuscita a creare una vera e propria scuola di linguistica" perché "non ha compreso l'essenza dell'oggetto di studio" (3). Questa "essenza", sostiene, risiede non solo nelle singole parole - le "sostanze positive" del linguaggio - ma anche nelle connessioni formali che aiutano queste sostanze ad esistere.

Il "test" del linguaggio di Saussure si basa su tre presupposti. In primo luogo, la comprensione scientifica del linguaggio non si basa su un fenomeno storico, ma su un fenomeno strutturale. Pertanto, ha distinto tra i singoli fenomeni del linguaggio - "eventi del discorso", che definisce "parole" - e il proprio, a suo avviso, oggetto di studio della linguistica, il sistema (codice, struttura) che controlla questi eventi ( "lingua"). Uno studio così sistematico, inoltre, richiede una concezione "sincrona" del rapporto tra gli elementi del linguaggio in un dato momento, piuttosto che uno studio "diacronico" dello sviluppo del linguaggio attraverso la sua storia.

Questa ipotesi è stata l'antesignana di quello che Roman Jakobson nel 1929 chiamerà "strutturalismo" - una teoria in cui "qualsiasi insieme di fenomeni indagati dalla scienza moderna è considerato non come un accumulo meccanico, ma come un insieme strutturale in cui la componente costruttiva è correlata con la funzione" ("Romantico" 711). In questo passaggio Jakobson formulava l'idea di Saussure di definire il linguaggio come una struttura, in contrapposizione all'enumerazione "meccanica" degli eventi storici. Inoltre, Jakobson sviluppa un'altra ipotesi saussuriana, che divenne il precursore della linguistica strutturale: gli elementi di base del linguaggio dovrebbero essere studiati in connessione non tanto con le loro cause, ma con le loro funzioni. Fenomeni ed eventi separati (diciamo, la storia dell'origine delle singole parole indoeuropee) dovrebbero essere studiati non da soli, ma in un sistema in cui sono correlati con componenti simili. Questa fu una svolta radicale nel confronto dei fenomeni con la realtà circostante, il cui significato il filosofo Ernst Cassirer paragonò alla "scienza di Galileo, che nel XVII secolo capovolse le idee sul mondo materiale", di conseguenza, le spiegazioni stesse. I fenomeni iniziarono ad essere interpretati non in relazione alle cause del loro verificarsi, ma in relazione all'effetto che possono avere nel presente e futuro... L'interpretazione ha cessato di essere indipendente dalle intenzioni di una persona (nonostante il fatto che le intenzioni possano essere impersonali, “inconscio” nel senso freudiano del termine).

Nella sua linguistica, Saussure mostra questa svolta soprattutto nel mutamento del concetto di parola in linguistica, che definisce come segno e descrive in funzione delle sue funzioni. Un segno per lui è una combinazione di suono e significato, "significato e designazione" (66-67; nella traduzione inglese del 1983 di Roy Harris - "significazione" e "segnale"). La natura di questo composto è "funzionale" (né l'uno né l'altro elemento possono esistere l'uno senza l'altro); inoltre, "l'uno prende in prestito qualità dall'altro" (8). Così, Saussure definisce il principale elemento strutturale del linguaggio - il segno - e pone alla base della linguistica storica l'identità dei segni alle parole, che richiede un'analisi particolarmente rigorosa. Pertanto, possiamo comprendere diversi significati, diciamo, della stessa parola "albero" - non perché la parola sia solo un insieme di determinate qualità, ma perché è definita come un elemento nel sistema dei segni, nel "tutto strutturale", nella lingua.

Tale concetto di unità relativo ("diacritico") è alla base del concetto di tutti gli elementi del linguaggio nella linguistica strutturale. Ciò è particolarmente evidente nella scoperta più originale della linguistica saussuriana, nello sviluppo del concetto di "fonemi" e di "tratti distintivi" del linguaggio. I fonemi sono la più piccola delle unità linguistiche parlate e significative. Non sono solo suoni che ricorrono nella lingua, ma "immagini sonore", osserva Saussure, che sono percepite dai madrelingua come dotate di significato. (Va notato che Elmar Holenstein chiama la linguistica di Jakobson, che continua le idee ei concetti di Saussure nelle sue disposizioni principali, "strutturalismo fenomenologico"). Ecco perché il principale oratore della Scuola di strutturalismo di Praga, Jan Mukarowski, osservò nel 1937 che “la struttura. . . non un concetto empirico, ma fenomenologico; non è il risultato in sé, ma un insieme di relazioni significative della coscienza collettiva (generazione, altri, ecc.)”. Un pensiero simile fu espresso nel 1960 da Lévi-Strauss, capofila dello strutturalismo francese: “La struttura non ha un contenuto definito; è di per sé significativo, e la costruzione logica in cui è racchiuso è l'impronta della realtà.

A loro volta, i fonemi, in quanto i più piccoli elementi linguistici accettabili per la percezione, rappresentano una "realtà fenomenologica" integrale separata. Ad esempio, in inglese, il suono "t" può essere pronunciato in modo diverso, ma in tutti i casi una persona che parla inglese lo percepirà come "t". Aspirato, alzato o abbassato, un suono "t" lungo, ecc. distinguerà ugualmente il significato delle parole "to" e "do". Inoltre, le differenze tra le lingue sono tali che varietà di un suono in una lingua possono corrispondere a diversi fonemi in un'altra; ad esempio, "l" e "r" in inglese sono diverse, mentre in altre lingue sono varietà dello stesso fonema (come la "t" inglese, pronunciata con e senza aspirazione). Il vasto vocabolario di qualsiasi linguaggio naturale è un insieme di combinazioni di un numero molto minore di fonemi. In inglese, ad esempio, vengono utilizzati solo 40 fonemi per pronunciare e scrivere circa un milione di parole.

I suoni di una lingua sono un insieme di caratteristiche sistematicamente organizzato. Negli anni '20 -'30, seguendo Saussure, Jacobson e N.S. Trubetskoy individuarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura degli organi della parola - lingua, denti, corde vocali - Saussure lo nota nel "Corso di linguistica generale", e Harris lo chiama "fonetica fisiologica" (nella precedente traduzione di Baskin, il termine "fonologia " è usato) - sono collegati in "nodi » durg contro un amico per emettere suoni. Ad esempio, in inglese, la differenza tra "t" e "d" è la presenza o l'assenza di "voce" (la tensione delle corde vocali), e il livello di voce che distingue un fonema da un altro. Pertanto, la fonologia può essere considerata un esempio della regola linguistica generale descritta da Saussure: "Ci sono solo differenze nella lingua". Ancora più importante non è questo: la differenza di solito implica le condizioni esatte tra le quali si trova; ma nella lingua ci sono solo differenze senza condizioni precise. Che si tratti di "designazione" o "significato", nella lingua non ci sono né concetti né suoni che sarebbero esistiti prima dello sviluppo del sistema linguistico.

In una tale struttura, le analogie linguistiche sono definite non con l'aiuto delle loro qualità intrinseche, ma con l'aiuto di relazioni di sistema ("strutturali").

Ho già accennato al fatto che la fonologia nel suo sviluppo si basava sulle idee di Saussure. Sebbene la sua analisi della fisiologia linguistica nei tempi moderni, dice Harris, "sarebbe chiamata 'fisica', in contrapposizione a 'psicologica' o 'funzionale', in The Course ha chiaramente articolato la direzione e i principi di base dell'analisi funzionale del linguaggio. La sua unica opera pubblicata durante la sua vita, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Note sul sistema vocale originale nelle lingue indoeuropee), pubblicata nel 1878, era completamente in linea con la linguistica storica comparata del 19esimo secolo. Tuttavia, in quest'opera, dice Jonathan Culler, Saussure ha mostrato "la fecondità dell'idea di linguaggio come sistema di fenomeni interconnessi, anche con la sua ricostruzione storica". Analizzando la relazione tra i fonemi, spiegando l'alternanza delle vocali nelle lingue moderne del gruppo indoeuropeo, Saussure suggerì che oltre a diversi suoni diversi "a", dovevano esserci altri fonemi descritti formalmente. “Ciò che fa un'impressione speciale nel lavoro di Saussure”, conclude Kaller, “è che quasi 50 anni dopo, quando fu scoperto e decifrato il cuneiforme ittita, fu trovato un fonema, nella scrittura denotata da “h”, che si comportò come previsto da Saussure. Attraverso l'analisi formale, ha scoperto quello che oggi è noto come suono gutturale nelle lingue indoeuropee.

Nel concetto di definizione relativa (diacritica) dei segni, sia esplicita che implicita nel Corso, c'è un terzo assunto chiave della linguistica strutturale, chiamato da Saussure la "natura arbitraria del segno". Con ciò si intende che la relazione tra suono e significato nel linguaggio non è motivata da nulla: altrettanto facilmente si può collegare la parola "arbre" e la parola "albero" con il concetto di "albero". Inoltre, ciò significa che anche il suono è arbitrario: si può definire il concetto di "albero" dalla presenza della corteccia (ad eccezione delle palme) e dalle dimensioni (ad eccezione delle "piante legnose basse" - arbusti). Da ciò dovrebbe essere chiaro che tutte le ipotesi che presento non sono divise in più e meno importanti: ognuna di esse - la natura sistemica dei segni (più comprensibile nello studio "sincrono" della lingua), la loro essenza relativa (diacritica) , l'arbitrarietà dei segni - deriva dal resto.

Pertanto, nella linguistica saussuriana, il fenomeno studiato è inteso come un insieme di confronti e opposizioni del linguaggio. La lingua è sia un'espressione del significato delle parole (designazione) sia il loro risultato (comunicazione) - e queste due funzioni non coincidono mai (vedi "Deconstruction of Language" di Shleifer). Possiamo vedere l'alternanza di forma e contenuto che Greimas e Kurte descrivono nell'ultima versione dell'interpretazione: i contrasti linguistici definiscono le sue unità strutturali, e queste unità interagiscono su livelli successivi per creare un certo contenuto significativo. Poiché gli elementi del linguaggio sono casuali, né il contrasto né la combinazione possono essere la base. Ciò significa che in una lingua, le caratteristiche distintive formano un contrasto fonetico a un diverso livello di comprensione, i fonemi sono combinati in morfemi contrastanti, morfemi - in parole, parole - in frasi, ecc. In ogni caso, un intero fonema, parola, frase, ecc. è più della somma delle sue parti (proprio come l'acqua, nell'esempio di Saussure, è più della combinazione di idrogeno e ossigeno).

Tre presupposti del "Corso di linguistica generale" hanno portato Saussure all'idea di una nuova scienza del XX secolo, separata dalla linguistica, che studia "la vita dei segni nella società". Saussure chiamò questa scienza semiologia (dal greco "semeîon" - un segno). La "scienza" della semiotica, sviluppatasi nell'Europa orientale negli anni '20 e '30 ea Parigi negli anni '50 e '60, ha ampliato lo studio del linguaggio e delle strutture linguistiche in reperti letterari composti (o formulati) con queste strutture. Inoltre, al tramonto della sua carriera, parallelamente al suo corso di linguistica generale, Saussure si impegnò in un'analisi "semiotica" della tarda poesia romana, cercando di scoprire anagrammi deliberatamente composti di nomi propri. Questo metodo era per molti versi l'opposto del razionalismo nella sua analisi linguistica: era un tentativo, come scrive Saussure in uno dei 99 quaderni, di studiare nel sistema il problema della "probabilità", che "diventa la base di tutto. " Tale indagine, sostiene lo stesso Saussure, aiuta a mettere a fuoco il "lato reale" della probabilità; La “parola chiave” per la quale Saussure cerca un anagramma è, secondo Jean Starobinsky, “uno strumento per il poeta, e non la fonte di vita per la poesia. La poesia serve a invertire i suoni della parola chiave. Secondo Starobinsky, in questa analisi, "Saussure non approfondisce la ricerca di significati nascosti". Al contrario, nelle sue opere si nota la volontà di evitare domande legate alla coscienza: “poiché la poesia si esprime non solo nelle parole, ma anche in ciò che queste parole danno origine, va oltre il controllo della coscienza e dipende solo da le leggi del linguaggio”.

Il tentativo di Saussure di studiare i nomi propri nella poesia tardo romana (Tsvetan Todorov lo definì un'abbreviazione di "una parola ... solo prima che sia scritta") sottolinea una delle componenti della sua analisi linguistica: la natura arbitraria dei segni, così come l'essenza formale della linguistica saussuriana ("Lingua", afferma, "l'essenza della forma, non il fenomeno"), che esclude la possibilità di analizzare il significato. Todorov conclude che oggi gli scritti di Saussure sembrano notevolmente coerenti nella loro riluttanza a studiare i simboli [fenomeni che hanno un significato ben definito]. . . . Esplorando gli anagrammi, Saussure presta attenzione solo alla ripetizione, ma non alle opzioni precedenti. . . . Studiando i Nibelunghi, definisce i simboli solo per assegnarli a letture errate: se non sono intenzionali, i simboli non esistono. Del resto, nei suoi scritti di linguistica generale, ipotizza l'esistenza di una semiologia che descriva non solo i segni linguistici; ma questa ipotesi è limitata dal fatto che la semilogia può descrivere solo segni casuali e arbitrari.

Se è davvero così, è solo perché non potrebbe immaginare "l'intenzione" senza un oggetto; non riusciva a colmare completamente il divario tra forma e contenuto - nei suoi scritti questo si trasformava in una domanda. Invece, si è rivolto alla "legittimità linguistica". Tra, da un lato, i concetti ottocenteschi basati sulla storia e sulle congetture soggettive, e i metodi di interpretazione accidentale basati su questi concetti, e, dall'altro, i concetti strutturalisti che Lévi-Strauss chiamavano "kantismo senza trascendente attore" - cancellando il confronto tra forma e contenuto (soggetto e oggetto), significato e origine nello strutturalismo, nella psicoanalisi e persino nella meccanica quantistica - le opere di Ferlinand de Saussure sulla linguistica e la semiotica segnano una svolta nello studio dei significati nel linguaggio e cultura.

Ronald Shleifer

Letteratura

1. Admoni V.G. Fondamenti di teoria della grammatica / V.G. Ammoni; Accademia delle scienze dell'URSS.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metodi matematici in linguistica. M., 1974.

4. Arnold I.V. La struttura semantica della parola nell'inglese moderno e la metodologia per il suo studio. /IV. Arnold-L.: Istruzione, 1966. - 187 p.

6.Bashlykov A.M. Sistema di traduzione automatica. / SONO. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 p.

7. Baudouin de Courtenay: Eredità teorica e modernità: Riassunti delle relazioni della conferenza scientifica internazionale / Ed.I.G. Kondratyev. - Kazan: KGU, 1995. - 224 p.

8. A. V. Gladkiy, Elementi di linguistica matematica. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 p.

9. Golovin, B.N. Lingua e statistica. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. Linguistica teorica e applicata. /V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. Semantica. Sintassi. Morfologia. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. Introduzione al linguaggio formale della linguistica / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., riprod.

13. L'eredità linguistica di Baudouin de Courtenay alla fine del XX secolo: abstract della conferenza scientifica e pratica internazionale del 15-18 marzo 2000. - Krasnoyarsk, 2000. - 125 p.

Matveeva G.G. Significati grammaticali nascosti e identificazione della persona sociale (“ritratto”) del parlante / G.G. Matveev. - Rostov, 1999. - 174 p.

14. Melchuk, I.A. Esperienza nella costruzione di modelli linguistici "Significato Testo"./ I.A. Melchuk. - M., 1974. - 145 pag.

15. Nelyubin L.L. Traduzione e linguistica applicata / L.L. Nelyubin. - M.: Scuola superiore, 1983. - 207 p.

16. Sui metodi esatti della ricerca linguistica: sulla cosiddetta "linguistica matematica" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva e altri - M., 1961. - 162 p.

17. Piotrovsky L.G. Linguistica matematica: libro di testo / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M .: Scuola superiore, 1977. - 160 p.

18. Lo è. Testo, macchina, persona. - L., 1975. - 213 p.

19. Lo è. Linguistica applicata / Ed. AS Gerda. - L., 1986. - 176 p.

20. Revzin, I.I. modelli linguistici. M., 1963. Revzin, I.I. Linguistica strutturale moderna. Problemi e metodi. M., 1977. - 239 p.

21. Revzin, II, Rozentsveig, V.Yu. Fondamenti di traduzione generale e automatica / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 pag.

22. Slyusareva N.A. La teoria di F. de Saussure alla luce della linguistica moderna / N.A. Slyusareva. - M.: Nauka, 1975. - 156 p.

23. Gufo, L.Z. Linguistica analitica / L.Z. Gufo - M., 1970. - 192 p.

24. Saussure F. de. Appunti di linguistica generale / F. de Saussure; Per. da p. - M.: Progresso, 2000. - 187 p.

25. Lo è. Corso di Linguistica Generale / Per. da p. - Ekaterinburg, 1999. -426 p.

26. Statistiche vocali e analisi automatica del testo / Ed. ed. R.G. Piotrovskij. L., 1980. - 223 p.

27. Stoll, P. Imposta. Logica. Teorie assiomatiche / R. Stoll; Per. dall'inglese. - M., 1968. - 180 pag.

28. Tenier, L. Fondamenti di sintassi strutturale. M., 1988.

29. Ubin II. Automazione delle attività di traduzione in URSS / I.I. Ubin, L. Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 p.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematica moderna. M., 1966.

31. Shenk, R. Elaborazione di informazioni concettuali. M., 1980.

32. Shikhanovich, Yu.A. Introduzione alla matematica moderna (concetti iniziali). M., 1965

33. Shcherba L.V. Vocali russe in termini qualitativi e quantitativi / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. Cittadino del mondo // Spark - 1996. - N. 5. - pag.13

35. VA Uspensky. Preliminare per i lettori della "New Literary Review" ai messaggi semiotici di Andrei Nikolaevich Kolmogorov. - Nuova rassegna letteraria. -1997. - N. 24. - S. 18-23

36. Perlovsky L. Coscienza, lingua e cultura. - Sapere è potere. -2000. №4 - S. 20-33

37. Frumkina R.M. Chi siamo - obliquamente. // Giornale russo. - 2000. - N. 1. - pagina 12

38. Fizialov, S.Ya. Sulla modellazione della sintassi nella linguistica strutturale // Problemi di linguistica strutturale. M., 1962.

39. Lo è. Sull'equivalenza della grammatica NN e della grammatica delle dipendenze // Problemi di linguistica strutturale. M., 1967.

40. Chomsky, N. Fondamenti logici della teoria linguistica // Nuovo in linguistica. Problema. 4. M., 1965

41. Schleifer R. Ferdinand de Saussure//stampa. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. premere. jhu.ru

46. ​​​​en.wikipedia.org

Nel corso dell'ultimo secolo, la linguistica è sempre stata citata come esempio di una scienza che si è sviluppata rapidamente e ha raggiunto molto rapidamente la maturità metodologica. Già a metà del secolo scorso, la giovane scienza si collocava con fiducia nel circolo delle scienze che aveva una tradizione millenaria, e uno dei suoi rappresentanti più in vista - A. Schleicher - ebbe il coraggio di credere che con le sue opere stava già riassumendo la riga finale.<113>La storia della linguistica, tuttavia, ha dimostrato che tale opinione era troppo frettolosa e ingiustificata. Alla fine del secolo la linguistica subì il suo primo grande shock legato alla critica dei principi neogrammatici, cui ne seguirono altri. Va notato che tutte le crisi che possiamo scoprire nella storia della scienza del linguaggio, di regola, non ne hanno scosso le fondamenta, ma, al contrario, hanno contribuito al rafforzamento e alla fine hanno portato con sé un affinamento e un miglioramento dei metodi della ricerca linguistica, ampliandosi con temi e questioni scientifiche.

Ma accanto alla linguistica vissero e si svilupparono anche altre scienze, tra cui un gran numero di nuove. Le scienze fisiche, chimiche e tecniche (le cosiddette "esatte") hanno ricevuto uno sviluppo particolarmente rapido nel nostro tempo e la loro base teorica, la matematica, ha regnato su tutte. Le scienze esatte non solo hanno fortemente sollecitato tutte le discipline umanistiche, ma attualmente si sforzano di "portarle nella loro fede", di subordinarle ai loro costumi, di imporre loro i loro metodi di ricerca. Nella situazione attuale, usando un'espressione giapponese, si può dire che ora i linguisti-filologi stanno contaminando il bordo stesso del tappeto, dove le scienze esatte, guidate dalla matematica, si trovano trionfalmente e liberamente.

Non sarebbe più opportuno, dal punto di vista degli interessi scientifici generali, arrendersi alla matematica, arrendersi interamente alla potenza dei suoi metodi, a cui alcune voci richiamano apertamente 59 , e quindi, forse, acquisire nuova forza? Per rispondere a queste domande, dobbiamo prima esaminare cosa afferma la matematica in questo caso, in quale area della linguistica i metodi matematici trovano la loro applicazione, fino a che punto sono coerenti con le specificità del materiale linguistico e se sono in grado di fornire o anche solo suggerire risposte a quelle domande poste dalla scienza del linguaggio.

Fin dall'inizio, va notato che tra gli appassionati della nuova tendenza matematica in linguistica<114>Non c'è unanimità di opinioni riguardo ai suoi scopi e obiettivi nella ricerca statica. Acad. A. A. Markov, che per primo applicò i metodi matematici al linguaggio, Boldrini, Yul, Mariotti considerano gli elementi del linguaggio come idoneo materiale illustrativo per costruire metodi quantitativi, o per teoremi statistici, senza affatto chiedersi se i risultati di un tale studio siano interessanti ai linguisti 6 0 . Ross ritiene che la teoria della probabilità e la statistica matematica forniscano uno strumento o, come ora preferiscono dire, un modello matematico per testare e confermare quelle conclusioni linguistiche che consentono l'interpretazione numerica. Pertanto, i metodi matematici sono concepiti solo come mezzi ausiliari della ricerca linguistica 6 1 . Molto di più afferma Herdan, che nel suo libro non solo ha riassunto e sistematizzato tutti i tentativi di studio matematico dei problemi linguistici, ma ha anche cercato di dare loro un chiaro orientamento in relazione a ulteriori lavori. Incentra la presentazione dell'intero materiale del suo libro sulla "comprensione della statistica letteraria (come chiama lo studio dei testi con metodi di statistica matematica". - ALLE 3.) come parte integrante della linguistica” 6 2 , e formula l'essenza ei compiti di questa nuova sezione della linguistica con le seguenti parole: “La statistica letteraria come filosofia quantitativa del linguaggio è applicabile a tutti i rami della linguistica. A nostro avviso, la statistica letteraria è una linguistica strutturale elevata al livello di una scienza quantitativa o di una filosofia quantitativa. Pertanto, è ugualmente errato definire i suoi risultati come fuori ambito<115>linguistica o trattarla come uno strumento ausiliario per la ricerca” 6 3 .

Non è consigliabile addentrarsi in teorizzazioni sulla legittimità, in questo caso, di parlare dell'emergere di una nuova branca della linguistica e risolvere la questione delle sue pretese, senza prima riferirsi alla considerazione di quanto effettivamente è stato fatto in questo settore, ea chiarire in quale direzione l'applicazione dei nuovi metodi 6 4 . Questo ci aiuterà a capire le differenze di opinione.

L'uso di criteri matematici (o, più precisamente, statistici) per risolvere problemi linguistici non è affatto nuovo nella scienza del linguaggio e, in un modo o nell'altro, è stato a lungo utilizzato dai linguisti. Dopotutto, infatti, concetti tradizionali della linguistica come la legge fonetica (e relativi<116>nee con esso - un'eccezione alla legge), la produttività degli elementi grammaticali (ad esempio, i suffissi derivazionali), o anche i criteri per le relazioni correlate tra le lingue, in una certa misura, si basano su caratteristiche statistiche relative. Dopotutto, più netta e distinta è l'opposizione statistica dei casi osservati, più ragioni abbiamo per parlare di suffissi produttivi e improduttivi, della legge fonetica e delle sue eccezioni, della presenza o assenza di parentela tra le lingue. Ma se in tali casi il principio statistico è stato utilizzato più o meno spontaneamente, in futuro ha iniziato ad essere applicato consapevolmente e già con una certa definizione degli obiettivi. Così, ai nostri tempi, si sono diffusi i cosiddetti dizionari di frequenza del vocabolario e delle espressioni delle singole lingue 6 5 o anche i significati delle parole multilingue con un "focus generale sulla realtà" 6 6. I dati di questi dizionari vengono utilizzati per compilare libri di testo in lingua straniera (i cui testi sono costruiti sul vocabolario più comunemente usato) e dizionari minimi. Il calcolo statistico ha trovato un uso linguistico speciale nel metodo della lessicostatistica o glottocronologia di M. Swadesh, dove, sulla base di formule statistiche che tengono conto dei casi di scomparsa di parole dalle lingue del fondo principale, è possibile stabilire la cronologia assoluta della divisione delle famiglie linguistiche 6 7 .

Negli ultimi anni, i casi di applicazione di metodi matematici al materiale linguistico sono aumentati in modo significativo e nella massa di tali tentativi sono state delineate direzioni più o meno definite. Giriamo<117>alla loro considerazione sequenziale, senza entrare nei dettagli.

Cominciamo con la direzione a cui è stato dato il nome di stilostatistica. Si tratta in questo caso della definizione e caratterizzazione dei tratti stilistici di singole opere o autori attraverso le relazioni quantitative degli elementi linguistici utilizzati. L'approccio statistico allo studio dei fenomeni stilistici si basa sulla comprensione dello stile letterario come un modo individuale di padroneggiare i mezzi del linguaggio. Allo stesso tempo, il ricercatore è completamente distratto dalla questione del significato qualitativo degli elementi linguistici numerabili, concentrando tutta la sua attenzione solo sul lato quantitativo; il lato semantico delle unità linguistiche studiate, il loro carico emotivo ed espressivo, nonché la loro partecipazione al tessuto di un'opera d'arte - tutto ciò rimane fuori conto, si riferisce ai cosiddetti fenomeni ridondanti. Così, un'opera d'arte appare sotto forma di un aggregato meccanico, la cui specificità costruttiva trova la sua espressione solo attraverso le relazioni numeriche dei suoi elementi. I rappresentanti della stilostatistica non chiudono un occhio davanti a tutte le circostanze rilevate, opponendo ai metodi della stilistica tradizionale, che indubbiamente includono elementi di soggettività, con un'unica qualità del metodo matematico, che, a loro avviso, compensa tutti i suoi difetti - l'obiettività dei risultati raggiunti. “Ci sforziamo”, scrive, ad esempio, V. Fuchs, “... di caratterizzare lo stile dell'espressione linguistica con mezzi matematici. A tal fine, dovrebbero essere creati metodi i cui risultati dovrebbero avere la stessa oggettività dei risultati delle scienze esatte ... Ciò suggerisce che, almeno inizialmente, ci occuperemo solo di qualità strutturali formali, e non del semantico contenuto delle espressioni linguistiche. Otterremo così un sistema di relazioni ordinali, che nel suo insieme sarà la base e il punto di partenza della teoria matematica dello stile” 6 8 .<118>

Il tipo più semplice di approccio statistico allo studio della lingua degli scrittori o delle singole opere è contare le parole utilizzate, poiché la ricchezza del dizionario, a quanto pare, dovrebbe caratterizzare in un certo modo l'autore stesso. Tuttavia, i risultati di tali calcoli danno risultati alquanto inaspettati al riguardo e non contribuiscono in alcun modo alla conoscenza estetica e alla valutazione di un'opera letteraria, che non è ultimo uno dei compiti della stilistica. Ecco alcuni dati sul numero totale di parole utilizzate in una serie di opere:

Bibbia (latino). . . . . . . . . . 5649 parole

Bibbia (ebraico). . . . 5642 parole

Demostene (discorso). . . . . . . . . . . . 4972 parole

Sallustio. . . . . . . . . . . . . . . . . 3394 parole

Orazio. . . . . . . . . . . . . . . . . . . .6084 parole

Dante (Divina Commedia) 5860 parole

(questo include 1615 nomi propri e nomi geografici)

Tasso (Orland furioso). . . . 8474 parole

Milton. . . . . . . . . . . . . . . . . . . . .8000 parole (circa dato)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 parole

(circa, secondo altre fonti 20.000 parole)

O. Jespersen fa notare che il dizionario di Zola, Kipling e Jack London supera notevolmente il dizionario di Milton, cioè il numero è 8000 6 9 . Il calcolo del dizionario dei discorsi del presidente degli Stati Uniti W. Wilson ha scoperto che è più ricco di quello di Shakespeare. A questo vanno aggiunti i dati degli psicologi. Pertanto, Terman, sulla base delle osservazioni di un gran numero di casi, ha scoperto che il vocabolario di un bambino medio è di circa 3600 parole, e all'età di 14 anni - già 9000. L'adulto medio usa 11700 parole e una persona di "maggiore intelligenza" fino a 13500 7 0 . Pertanto, tali dati numerici di per sé non forniscono alcun motivo per identificare le qualità stilistiche delle opere e solo "oggettivamente"<119>affermano l'uso di un numero diverso di parole da parte di autori diversi, che, come mostrano i calcoli di cui sopra, non è correlato al valore artistico relativo delle loro opere.

I calcoli della frequenza relativa dell'uso delle parole da parte dei singoli autori sono costruiti in modo leggermente diverso. In questo caso, non viene presa in considerazione solo la quantità totale di parole, ma anche la frequenza di utilizzo delle singole parole. L'elaborazione statistica del materiale così ottenuto consiste nel raggruppare in classi (o ranghi) parole con uguale frequenza d'uso, il che porta a stabilire la distribuzione di frequenza di tutte le parole usate da un dato autore. Un caso speciale di questo tipo di calcolo è la determinazione della frequenza relativa di parole speciali (ad esempio, il vocabolario romanzesco nelle opere di Chaucer, come è stato fatto da Mersand 7 1). La frequenza relativa delle parole utilizzate dagli autori contiene le stesse informazioni oggettive sullo stile dei singoli autori dei calcoli totali di cui sopra, con l'unica differenza che il risultato è dati numerici più accurati. Ma serve anche per datare singole opere dello stesso autore sulla base di un calcolo preliminare della frequenza relativa del suo uso delle parole in diversi periodi della sua vita (secondo opere datate dall'autore stesso). Un altro tipo di utilizzo dei dati provenienti da tali calcoli è stabilire l'autenticità della paternità di opere per le quali questa domanda sembra dubbia 7 2 . In quest'ultimo caso, tutto si basa su un confronto di formule statistiche per la frequenza d'uso in opere autentiche e controverse. Non c'è bisogno di parlare della grandissima relatività e approssimazione dei risultati ottenuti con tali metodi. Dopotutto, la relativa frequenza d'uso cambia non solo con l'età dell'autore, ma anche a seconda del genere, della trama e anche dell'ambiente storico dell'azione dell'opera (confronta, ad esempio, "Bread" e "Peter I" di A. Tolstoj).<120>

Approfondendo il metodo sopra descritto, la stilostatistica come caratteristica di stile cominciò a ricorrere al criterio della stabilità della frequenza relativa delle parole più comunemente usate. Il metodo utilizzato in questo caso può essere illustrato dall'elaborazione statistica del racconto di Pushkin "La figlia del capitano" di Esselson ed Epstein presso l'Istituto di lingue slave dell'Università di Detroit (USA) 7 3 . All'indagine è stato sottoposto l'intero testo del racconto (circa 30.000 occorrenze di parole), quindi brani contenenti circa 10.000 e 5.000 occorrenze. Inoltre, al fine di determinare la stabilità della frequenza relativa dell'uso delle parole, le 102 parole più comunemente usate (con una frequenza da 1160 volte a 35) sono state confrontate con la frequenza relativa calcolata (realizzata sulla base di passaggi selettivi) con quello reale. Ad esempio, l'unione "e" è stata usata 1.160 volte nel corso della storia. In un passaggio contenente 5.000 occorrenze di tutte le parole, questa congiunzione dovrebbe essere usata 5.000 x 1.160:30.000, o arrotondata per eccesso 193 volte, e in un passaggio contenente 10.000 occorrenze di tutte le parole, dovrebbe essere usata 10.000 x 1.160 : 30.000 o 386 volte. Il confronto dei dati ottenuti utilizzando questo tipo di calcoli con i dati effettivi mostra una deviazione molto lieve (entro il 5%). Sulla base di tali calcoli, si è scoperto che in questa storia di Pushkin, la preposizione "k" è usata due volte più spesso di "y", e il pronome "tu" è usato tre volte più spesso di "loro", ecc. , nonostante tutte le vicissitudini della trama, sia nel corso della storia che nelle sue singole parti, c'è una stabilità nella frequenza relativa dell'uso delle parole. Quanto osservato in relazione ad alcune parole (più comuni) è presumibilmente applicabile a tutte le parole utilizzate nell'opera. Ne consegue che lo stile dell'autore può essere caratterizzato da un certo rapporto tra la variabilità della frequenza media di utilizzo di una parola e la frequenza generale per una data lingua.<121>la frequenza del suo utilizzo. Questo rapporto è considerato come una caratteristica quantitativa oggettiva dello stile dell'autore.

Altri elementi formali della struttura linguistica vengono studiati in modo analogo. Così, ad esempio, V. Fuchs sottoponeva a una considerazione comparativo-statistica i caratteri metrici delle opere di Goethe, Rilke, Cesare, Sallustio, ecc.

Il criterio della stabilità della frequenza relativa dell'uso delle parole, pur chiarendo la tecnica della caratterizzazione quantitativa dello stile, non introduce nulla di fondamentalmente nuovo rispetto ai metodi più primitivi sopra analizzati. Tutti i metodi di stilostatistica alla fine producono risultati "oggettivi" ugualmente spassionati, scivolando sulla superficie della lingua e aggrappandosi solo a segni puramente esterni. I metodi quantitativi, a quanto pare, non sono in grado di mettere a fuoco le differenze qualitative nel materiale oggetto di studio e di fatto livellano tutti gli oggetti oggetto di studio.

Laddove è necessaria la massima specificazione, vengono offerti i criteri più generalizzati; le caratteristiche qualitative sono espresse nel linguaggio della quantità. Questa non è solo una contraddizione logica, ma anche un disaccordo con la natura delle cose. In effetti, cosa succede se proviamo a ottenere una caratteristica stilistica comparativa (cioè qualitativa) delle opere di Alexander Gerasimov e Rembrandt basata sul rapporto quantitativo della pittura rossa e nera sulle loro tele? Sembra essere un'assoluta assurdità. Fino a che punto informazioni quantitative del tutto “oggettive” sui dati fisici di una persona possono darci un'idea di tutto ciò che caratterizza una persona e ne costituisce la vera essenza? Ovviamente nessuno. Possono servire solo come segno individuale che distingue una persona da un'altra, come un'impronta di circonvoluzioni sul pollice. La situazione è simile con le caratteristiche quantitative dello stile letterario. Se guardi da vicino, forniscono dati altrettanto scarsi per giudicare lo stile reale<122>qualità del linguaggio dell'autore, nonché una descrizione delle circonvoluzioni sul dito per lo studio della psicologia umana.

A quanto detto va aggiunto che in passato, nella cosiddetta scuola formale della critica letteraria, si era già tentato di studiare quantitativamente lo stile degli scrittori, quando epiteti, metafore ed elementi ritmico-melodici di versi sono stati contati. Tuttavia, questo tentativo non è stato ulteriormente sviluppato.

Un'altra area di applicazione dei metodi matematici per lo studio dei fenomeni linguistici può essere raggruppata sotto il nome di statistica linguistica. Cerca di intromettersi nelle questioni fondamentali della teoria del linguaggio e di ottenere così una vocazione nella propria sfera linguistica. Per conoscere questa direzione, è meglio rivolgersi al già citato lavoro di Herdan, nelle parole di uno dei suoi numerosi revisori, "un libro mostruosamente pretenzioso" 7 5 , ha ricevuto, tuttavia, un'ampia risposta tra i linguisti 7 6 . In considerazione del fatto che Kherdan (come già accennato in precedenza) ha cercato di raccogliere nel suo libro tutto ciò che è più significativo nel campo dell'applicazione dei metodi matematici ai problemi linguistici, nel suo libro si tratta in realtà non tanto di Kherdan quanto di un intero tendenza. Come mostra il titolo stesso del libro, “Language as Choice and Probability”, il suo obiettivo principale è chiarire cosa nella lingua è lasciato alla libera scelta del parlante e cosa è dovuto alla struttura immanente della lingua, proprio come sulla determinazione del rapporto quantitativo degli elementi del primo e del secondo ordine. Il libro di Kherdan fornisce informazioni quasi esaurienti su tutto il lavoro in quest'area svolto da rappresentanti di varie specialità.<123>(filosofi, linguisti, matematici, tecnici), ma non si limita a questo e comprende molte osservazioni, considerazioni e conclusioni originali dell'autore stesso. Come lavoro riassuntivo, dà una buona idea dei metodi quantitativi utilizzati e dei risultati raggiunti con il loro aiuto. Le domande che combiniamo condizionalmente nella sezione della statistica linguistica sono trattate nella seconda e quarta parte del libro.

Dei tanti casi di applicazione dei metodi della statistica matematica allo studio delle questioni linguistiche, ci concentreremo su quelli più generali, che allo stesso tempo possono essere considerati i più tipici. Utilizzo di dati di altri autori - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 e altri, oltre a citare i propri studi che determinano la frequenza relativa della distribuzione di fonemi, lettere, lunghezza delle parole (misurata dal numero di lettere e sillabe) , forme grammaticali ed elementi metrici in esametro latino e greco, Herdan stabilisce il fatto della stabilità della frequenza relativa degli elementi linguistici come caratteristica comune a tutte le strutture linguistiche. Ne deriva la seguente regola: “Le proporzioni degli elementi linguistici appartenenti all'uno o all'altro livello o sfera di codificazione linguistica - fonologia, grammatica, metrica - rimangono più o meno costanti per una data lingua, in un dato periodo del suo sviluppo e all'interno del limiti di osservazioni sufficientemente ampie e imparziali.» 8 2 . Questa regola, che Herdan chiama la legge fondamentale del linguaggio, cerca di interpretarla ed espanderla in un certo modo. "Egli", scrive Herdan a proposito di questa legge, "è un'espressione del fatto che anche qui, dove la volontà umana e la libertà di scelta sono concesse<124>il quadro più ampio, dove scelta consapevole e gioco spensierato si alternano vividamente, in generale c'è una notevole stabilità... nella grammatica, ma anche in relazione alla frequenza d'uso di specifici fonemi, unità lessicali (parole) e fonemi grammaticali e costruzioni; in altre parole, la somiglianza non sta solo in cosa si usa, ma anche in quanto spesso si usa” 8 3 . Questa situazione è dovuta a ragioni comprensibili, ma ciò dà origine a nuove conclusioni. Quando si esaminano diversi testi o segmenti di una data lingua, ad esempio, si scopre che le frequenze relative di utilizzo di un dato particolare fonema (o altri elementi del discorso) da parte di persone diverse rimangono sostanzialmente le stesse. Ciò porta all'interpretazione delle singole forme di discorso come alcune fluttuazioni nella probabilità costante di utilizzare il fonema considerato in una data lingua. Pertanto, risulta che nella sua attività linguistica una persona è soggetta a determinate leggi di probabilità in relazione al numero di elementi linguistici utilizzati. E poi, quando osserviamo un numero enorme di elementi linguistici in un grande insieme di testi o segmenti di discorso, abbiamo l'impressione di dipendenza causale nel senso che in questo caso c'è determinazione anche in relazione all'uso di alcuni elementi linguistici. In altre parole, risulta lecito affermare che ciò che sembra essere una relazione causale da un punto di vista intuitivo, è quantitativamente una probabilità 8 4 . È chiaro che maggiore è il totale<125>la specificità dei testi o dei segmenti del discorso esaminati, tanto più chiaramente si manifesterà la stabilità della frequenza relativa dell'uso degli elementi linguistici anche nell'uso individuale (legge dei grandi numeri). Da ciò si trae una nuova conclusione generale che il linguaggio è un fenomeno di massa e dovrebbe essere trattato come tale.

Queste conclusioni, raggiunte sulla base di calcoli di frequenza di elementi fonetici, parole e forme grammaticali, che insieme costituiscono una lingua, vengono poi applicate alla "interpretazione statistica" della divisione di Saussure in "lingua" (lalangue) e "discorso" (laparole ). Secondo Saussure, la "lingua" è un insieme di abitudini linguistiche che rendono possibile la comunicazione tra i membri di una data comunità linguistica. Questa è una realtà sociale, un "fenomeno di massa", obbligatorio per tutte le persone che parlano questa lingua. Herdan, come indicato, dimostra che i membri di una stessa comunità linguistica sono simili tra loro non solo perché usano gli stessi fonemi, unità lessicali e forme grammaticali, ma anche perché tutti questi elementi sono usati con la stessa frequenza. Pertanto, la sua definizione statistica di "lingua" assume la seguente forma: "lingua" (lalangue) è la totalità degli elementi linguistici comuni più la loro relativa probabilità di essere usati.

Questa definizione di "linguaggio" è anche il punto di partenza per la corrispondente interpretazione statistica del "discorso", che, secondo Saussure, è un enunciato individuale. Contrapponendo il “linguaggio” come fenomeno sociale al “discorso” come fenomeno individuale, Saussure scriveva: “Il discorso è un atto individuale di volontà e comprensione, in cui è necessario distinguere: 1. combinazioni con cui il soggetto parlante usa il linguaggio codice per esprimere il suo pensiero personale; 2. un meccanismo psicofisico che gli permetta di oggettivare queste combinazioni” 8 5 . Poiché la "lingua" nelle statistiche linguistiche è considerata come un insieme di elementi con un certo relativo<126>certa probabilità del loro uso, in quanto include la totalità statistica o insieme (popolazione) come la caratteristica più essenziale e può essere considerata in questo aspetto. In accordo con ciò, il "discorso" si trasforma in un campione separato prelevato dal "linguaggio" come aggregato statistico. La probabilità in questo caso è determinata dalla relazione tra "discorso" e "linguaggio" (nella loro comprensione "quantitativa"), e la distribuzione della frequenza relativa dell'uso di diversi elementi del linguaggio è interpretata come il risultato di un "scelta" collettiva (scelta) in un certo periodo cronologico dell'esistenza della lingua. Rendendosi conto che una tale interpretazione delle differenze tra “linguaggio” e “discorso” è comunque costruita su basi completamente diverse da quelle di Saussure, Herdan scrive a questo proposito: “Questa modifica apparentemente minore del concetto di Saussure ha l'importante conseguenza che “linguaggio” ) acquista ora una caratteristica essenziale sotto forma di aggregato statistico (popolazione). Questa popolazione è caratterizzata da determinate frequenze relative o probabilità di fluttuazione, il che significa che ogni elemento linguistico appartiene a un certo livello linguistico. In questo caso, "discorso" (laparole), secondo il suo significato, risulta essere un termine per definire campioni statistici tratti da "lingua" come popolazione statistica. Diventa ovvio che la scelta (scelta) appare qui sotto forma del rapporto tra "discorso" e "lingua", essendo il rapporto tra un campione preso a caso e un aggregato statistico (popolazione). L'ordine stesso della distribuzione delle frequenze, in quanto deposito dell'attività linguistica di una comunità linguistica nel corso dei secoli, è un elemento di scelta (scelta), ma non di scelta individuale, come nello stile, ma di scelta collettiva. Usando una metafora, possiamo parlare qui della scelta fatta dallo spirito della lingua, se intendiamo con ciò i principi della comunicazione linguistica, che sono conformi al complesso dei dati mentali dei membri di una particolare comunità linguistica. La stabilità delle serie è il risultato della probabilità (caso)» 8 6 .

Un caso particolare dell'applicazione del principio dichiarato<127>pa è la delimitazione nel linguaggio dei fenomeni normativi dalle "eccezioni" (deviazioni). La statistica linguistica afferma che il metodo statistico consente di eliminare la sfocatura esistente in questo problema e stabilire criteri chiari per distinguere tra questi fenomeni. Se la norma è intesa come una popolazione statistica (nel senso di cui sopra), e l'eccezione (o errore) è una deviazione dalle frequenze mostrate dalla popolazione statistica, allora si suggerisce una soluzione quantitativa della questione. Tutto si riduce a una relazione statistica tra "popolazione" e "valore anomalo". Se le frequenze osservate in un singolo campione si discostano dalle probabilità dovute alla popolazione statistica più di quanto è determinato da una serie di conteggi campionari, allora abbiamo motivo di concludere che la linea di demarcazione tra "la stessa" (norma) e "non lo stesso" (eccezione) è violato.

Le differenze quantitative tra "lingua" e "discorso" sono utilizzate anche per distinguere due tipi di elementi linguistici: grammaticali e lessicali. Il punto di partenza per risolvere questo problema, che presenta spesso grosse difficoltà dal punto di vista linguistico, è l'assunto che il grado di frequenza degli elementi grammaticali sia diverso da quello delle unità lessicali. Ciò è presumibilmente associato alla "generalizzazione" degli elementi grammaticali, al modo in cui differiscono dai concetti fissati dalle unità lessicali. Inoltre, gli elementi grammaticali sono presumibilmente, di regola, di volume molto più piccolo: in quanto parole indipendenti (includono pronomi, preposizioni, congiunzioni e parole ausiliarie) di solito consistono in un piccolo numero di fonemi e sotto forma di "forme connesse " - da uno o due fonemi 8 7 . Più piccolo è l'elemento linguistico, meno la sua "lunghezza" (momento quantitativo) può servire come caratteristica distintiva, e più importante diventa la "qualità" dei fonemi a questo scopo. Quali metodi vengono proposti per risolvere il problema in esame? Si risolve facendo riferimento al concetto puramente quantitativo di grammaticale<128>caricare, "Supponiamo", scrive Herdan a questo proposito, "che ci interessa confrontare due lingue a questo riguardo. Come determiniamo con un certo grado di obiettività il "carico grammaticale" che porta una lingua? È chiaro che questo carico dipenderà dalla posizione della linea di demarcazione che separa la grammatica dal vocabolario. La prima considerazione che può venirci in mente è determinare quanto sia "complessa" la grammatica di una data lingua. Dopotutto, la "complessità" è una caratteristica qualitativa e il concetto di "carico grammaticale" è una caratteristica quantitativa. È vero, il carico in una certa misura dipende dalla complessità, ma non del tutto. Una lingua può essere ricompensata con una grammatica estremamente complessa, ma solo una parte relativamente piccola di essa viene utilizzata nell'attività della lingua. Definiamo "carico grammaticale" l'insieme della grammatica che una lingua porta quando è in azione, il che porta immediatamente il nostro problema nell'ambito della linguistica strutturale nel senso in cui la disciplina è stata definita da Saussure. Nella presentazione che segue, vengono utilizzati metodi quantitativi per determinare la differenza tra le lingue, a seconda di dove si trova il confine, separando la grammatica dal vocabolario” 8 8 . In altre parole, le differenze linguistiche in questo caso dovrebbero essere ridotte a differenze nelle relazioni numeriche tra elementi grammaticali e lessicali.

I materiali a nostra disposizione dipingono il quadro seguente. In inglese (sono state prese in considerazione solo le “parole grammaticali”: pronomi, o, come vengono anche chiamati, “sostituti”, preposizioni, congiunzioni e verbi ausiliari), in un segmento che comprende 78633 casi dell'uso di tutte le parole (1027 parole diverse), 53.102 il caso dell'uso di elementi grammaticali, o più precisamente di "parole grammaticali" (149 parole diverse), che è del 67,53% con il 15,8% di parole diverse. Tali sono i dati di Deway 8 9 . Altri dati mostrano una percentuale diversa<129>rapporto: 57,1% con il 5,4% di parole diverse 9 0 . Questa significativa discrepanza è spiegata dalla differenza tra lingua scritta e parlata. Le forme scritte della lingua (primo dato) presumibilmente utilizzano più elementi grammaticali di quelle orali (secondo caso). Nella Divina Commedia di Dante (dopo l'originale italiano), Mariotti ha stabilito il 54,4% delle occorrenze di "parole grammaticali".

Un altro e, apparentemente, un modo più perfetto per determinare il carico grammaticale di una lingua è contare i fonemi inclusi negli elementi grammaticali. In questo caso, non vengono prese in considerazione solo le parole grammaticali indipendenti, ma anche le forme correlate. Ci sono varie opzioni qui. Ad esempio, determinando la frequenza relativa dell'uso dei singoli fonemi consonantici negli elementi grammaticali e confrontandoli con la frequenza dell'uso totale di questi stessi fonemi (i dati finali di tale rapporto in inglese danno una proporzione del 99,9% a 100.000 - uso totale); o un simile confronto di consonanti secondo gruppi di classificazione separati (labiale, palatale, velare e altri fonemi). Il rapporto finale qui assume la forma di una proporzione del 56,47% (in elementi grammaticali) al 60,25% (in uso totale); o lo stesso confronto dei fonemi consonantici iniziali (in questo caso, il rapporto era 100,2% in parole grammaticali a 99,95 in uso totale). Sono possibili anche altre operazioni statistiche più complesse, che però si traducono in analoghe espressioni quantitative del problema in esame.

I dati quantitativi forniti servono come base per una conclusione generale. Si riduce al fatto che la distribuzione dei fonemi in elementi grammaticali determina la natura della distribuzione (in termini numerici, ovviamente) dei fonemi nella lingua nel suo insieme. E questo, a sua volta, ci permette di concludere che l'uso degli elementi grammaticali dipende in misura minima dalla scelta individuale e costituisce quella parte dell'espressione linguistica che è controllata dalle probabilità.<130>ness. Questa conclusione speculativa è confermata dal calcolo delle forme grammaticali in lingua russa, effettuato da Esselson 9 1 . Lo studio è stato sottoposto a 46896 parole tratte da II fonti (opere di Griboedov, Dostoevskij, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov e N. Ostrovsky). Erano divisi in parole colloquiali (17.756 parole o 37,9%) e non colloquiali (29140 parole o 62,1%). Quindi l'intero insieme di parole è stato suddiviso in 4 gruppi a seconda della loro natura grammaticale: il 1° gruppo comprendeva sostantivi, aggettivi, aggettivi in ​​funzione di sostantivi, pronomi e numerali flessi; nel 2 ° gruppo - verbi; nel 3 ° gruppo - participi verbali, participi in funzione di aggettivi e nomi e gerundi; nel 4 ° gruppo - forme invariabili di avverbi, preposizioni, congiunzioni e particelle. I risultati di sintesi (vengono fornite anche tabelle con i dati per i singoli autori) danno il seguente rapporto:

1° gruppo

2° gruppo

3° gruppo

4° gruppo

colloquiale

taciturno

Herdan caratterizza la considerazione dei dati quantitativi così ottenuti con le seguenti parole: “Essi giustificano la conclusione che gli elementi grammaticali dovrebbero essere considerati come un fattore che determina la verosimiglianza di un'espressione linguistica. Una tale conclusione evita l'onerosa qualificazione di ogni parola usata. È chiaro che, dal momento che la grammatica e il vocabolario non sono immagazzinati in involucri stagni, non lo sono nemmeno la pura "scelta" o il puro "caso". Sia la grammatica che il vocabolario contengono entrambi gli elementi, sebbene in proporzioni notevolmente variabili” 9 2 .<131>

Un'ampia sezione del libro di Herdan è dedicata allo studio della dualità o dualità nel linguaggio, e il concetto stesso di dualità si basa su caratteristiche matematiche.

Pertanto, i teoremi in geometria proiettiva possono essere disposti in due serie, in modo che ogni teorema di una serie possa essere ottenuto da qualche teorema di un'altra serie sostituendo le parole punto E Dritto. Ad esempio, se viene data un'affermazione: "qualsiasi punto diverso appartiene a una e una sola linea", allora possiamo ricavarne l'affermazione corrispondente: "due qualsiasi linea diversa appartengono a uno e solo un punto". Un altro metodo per determinare la dualità consiste nel tracciare diversi piani del fenomeno in studio lungo l'ascissa e le ordinate. Così, come fa ad esempio Yul 9 3, lungo l'asse delle ascisse si contano le diverse frequenze d'uso, e lungo l'asse delle ordinate il numero di unità lessicali di cui si determina la frequenza, ecc.. ricerca linguistica.

Sotto il concetto di dualità così definito, che in tutti i casi ha in realtà il carattere di un codice binario e che è considerato anche il tratto più essenziale della struttura linguistica, vengono portati fenomeni di qualità estremamente diverse, che consentono l'opposizione su due piani : la distribuzione dell'uso delle parole secondo la natura delle unità lessicali e la distribuzione delle unità lessicali secondo la frequenza l'uso delle parole; forme di discorso scritte e orali; elementi lessicali e grammaticali; sinonimi e contrari; fonema e sua rappresentazione grafica; definibile e definente (significante e significante di Saussure), ecc.

Dopo uno studio quantitativo della dualità dell'uno o dell'altro fenomeno linguistico particolare o "testo" limitato, di norma si trae una conclusione, alla quale vengono attribuite le qualità dell'universalità linguistica. La natura di tali conclusioni e il modo in cui sono giustificate possono essere viste nell'esempio<132>studi sulla dualità della parola e del concetto (si tratta infatti del rapporto tra la lunghezza della parola e il volume del concetto - va tenuto presente che l'uso estremamente libero di termini linguistici e di altro tipo in tali opere spesso rendono molto difficile la comprensione). È importante notare che come materiale che è servito come fonte di osservazioni di questo tipo di dualità linguistica, sono stati utilizzati: la nomenclatura internazionale delle malattie (circa 1000 nomi) e il registro generale delle malattie in Inghilterra e Wells per il 1949 In questo caso si giunge alla seguente conclusione generale: “Ogni concetto che denota un'idea generale possiede ciò che può essere chiamato una "sfera" o un "volume". Permette attraverso il suo mezzo di pensare a molti oggetti o altri concetti che si trovano all'interno della sua "sfera". D'altra parte, tutti gli elementi necessari per definire un concetto costituiscono quello che viene chiamato il suo "contenuto". Volume e contenuto sono reciprocamente correlati: più piccolo è il contenuto e, di conseguenza, più astratto è il concetto, maggiore è la sua portata o volume, cioè più oggetti vengono portati sotto di esso. Ciò può essere visto come un'analogia (in ambito concettuale) con i principi della codifica, secondo i quali la lunghezza di un simbolo e la frequenza d'uso sono interdipendenti” 9 4 .

Il principio di dualità si applica anche a problemi particolari. Ad esempio, quando si stabilisce l'equivalenza dei significati delle parole in due lingue diverse. Come risultato dello studio del dizionario inglese-tedesco di Muret-Zanders utilizzando il metodo dell'iterazione matematica, si conclude che la probabilità di utilizzare una parola inglese con uno o più significati nella traduzione tedesca rimane costante per ogni lettera iniziale nell'intero dizionario 9 5 . La considerazione dell'ordine delle parole nei dizionari cinesi porta alla conclusione che è di natura tassonomica, poiché il numero di tratti nel carattere indica il suo posto (come radicale indipendente o una certa sottoclasse subordinata al radicale). La tassonomia è un principio subordinante di classificazione utilizzato in zoologia e botanica. Kherdan lo sostiene<133>le basi della lessicografia cinese sono costruite anche sui principi della tassonomia 9 6, ecc.

Facendo una valutazione generale di quest'area di applicazione dei metodi matematici allo studio dei problemi linguistici (cioè della statistica linguistica), è necessario, a quanto pare, procedere dalla posizione formulata da Ettinger: “La matematica può essere efficacemente utilizzata al servizio della linguistica solo quando ai linguisti siano chiari i reali limiti della sua applicazione, nonché le possibilità dei modelli matematici utilizzati” 9 7 . In altre parole, si può parlare di linguistica matematica quando i metodi matematici dimostrano la loro idoneità a risolvere quei problemi linguistici veri e propri, che nel loro insieme costituiscono la scienza del linguaggio. In caso contrario, sebbene ciò possa aprire nuovi aspetti della ricerca scientifica, allora in questo caso possiamo parlare di qualsiasi cosa, ma non di linguistica - in questo caso non intendiamo diversi tipi di linguistica applicata (parleremo di it dopo). discorso sotto), ma linguistica scientifica, o teorica. Sulla base di questa posizione, va notato che dal punto di vista di un linguista, molto nelle statistiche linguistiche è dubbioso e persino sconcertante.

Passiamo all'analisi di due soli esempi (per non ingombrare la presentazione), stabilendo che a ciascuno di essi possono essere mosse obiezioni molto significative. Qui abbiamo una distinzione quantitativa tra unità grammaticali e lessicali. Si scopre che per fare una tale distinzione è necessario sapere già in anticipo cosa appartiene al campo della grammatica e cosa al vocabolario, poiché il "carico grammaticale" della lingua (cioè la totalità degli elementi grammaticali usato nel discorso), come indicato sopra citato, "dipende dalla linea di demarcazione che separa il vocabolario dalla grammatica". Senza sapere dove si trova questa linea, è quindi impossibile tracciare la distinzione indicata. Qual è allora il significato del metodo quantitativo di distinguere il lessicale dalla grammatica?<134>matico? Tuttavia, per quanto riguarda Herdan, non pensa particolarmente a questo problema e classifica audacemente gli elementi linguistici, riferendosi agli elementi grammaticali "forme connesse", che, a giudicare dalla presentazione, dovrebbero essere intesi come inflessione esterna, e "parole grammaticali", che comprendono preposizioni, congiunzioni, verbi ausiliari e pronomi - questi ultimi in virtù del fatto che sono "sostituti". Ma se parliamo solo di questa qualità dei pronomi e su questa base li colleghiamo a elementi grammaticali, allora, ovviamente, dovrebbero essere attribuiti anche a loro parole come "summenzionato", "chiamato", "dato", ecc. come anche loro agiscono come deputati. In connessione con il metodo di separazione degli elementi grammaticali utilizzato nella statistica linguistica, sorge spontanea la questione di come affrontare in questo caso fenomeni grammaticali "non formali" come l'ordine delle parole, i toni, i morfemi zero, le relazioni paradigmatiche (alcuni di questi fenomeni , a proposito, trova riflesso in quelle lingue studiate con metodi matematici)? Come tracciare una distinzione in lingue con ricca inflessione interna (come, ad esempio, nelle lingue semitiche), dove non solo modifica grammaticalmente la radice (radicale), ma le dà anche esistenza lessicale, poiché la radice senza permutazioni ha nessuna reale esistenza nella lingua? Cosa si deve intendere per complessità grammaticale di una lingua, in base a quale criterio viene determinata? Se il punto quantitativo, che in questo caso è enfatizzato in ogni modo possibile, allora una delle lingue grammaticalmente più difficili sarà l'inglese, che ha costruzioni come Ishallhavebeencalling o Hewouldhavebeencalling. In queste frasi, solo la chiamata può essere classificata come lessicale, e tutto il resto, quindi, deve essere considerato grammaticale. Quali motivi esistono per collegare la frequenza d'uso degli elementi grammaticali con la generalità o l'astrattezza dei significati delle parole grammaticali? Dopotutto, è abbastanza ovvio che la frequenza relativamente ampia di utilizzo degli elementi grammaticali è determinata dalla loro funzione nella costruzione delle frasi, e per quanto riguarda l'astrattezza dei significati, è molto facile trovare una grande<135>il numero di elementi lessicali che possono facilmente competere con gli elementi grammaticali in questo senso, essendo largamente inferiori ad essi in frequenza (ad esempio, essere, esistenza, estensione, spazio, sostanza eccetera).

Un tipo simile di assurdità si presenta davanti a noi nel caso della definizione di dualità (dualità) della parola e del concetto. È necessario avere una comprensione estremamente peculiare dell'essenza strutturale della lingua per sottoporla a ricerche utilizzando la nomenclatura delle malattie e il registro ospedaliero delle malattie, che, come indicato sopra, è servito da materiale di partenza per importantissimi studi linguistici conclusioni. Senza soffermarsi sull'uso del tutto oscuro di termini che non hanno esistenza linguistica, come la sfera, il volume e il contenuto di un concetto (a proposito, il significato lessicale della parola e il concetto denotato dal termine scientifico sono grossolanamente confuso), passiamo alla conclusione che si fa in questo caso. Come affermato sopra, abbiamo a che fare con l'affermazione che "la portata e il contenuto sono reciprocamente correlati". L'intero corso del ragionamento che dà fondamento a tale conclusione, così come il metodo di operazione matematica dei fatti linguistici, mostra chiaramente che in questo caso viene completamente ignorata una qualità molto essenziale della lingua, che sconvolge tutti i calcoli che vengono eseguiti : la capacità di esprimere la stessa cosa "contenuto" per unità linguistiche di diverso "volume", che hanno indubbiamente, inoltre, diversa frequenza d'uso relativa. Quindi, possiamo designare la stessa persona di Petrov, un mio conoscente, lui, un moscovita, un giovane, un impiegato universitario, il fratello di mia moglie, un uomo che abbiamo incontrato sul ponte, ecc. si tratta senza dubbio solo di conclusioni private, alle quali però, come è stato rilevato, si attribuisce un significato universale, ma anche dell'opportunità di applicare gli stessi metodi quantitativi a tali problemi linguistici.

Ma a volte ai linguisti vengono offerte conclusioni la cui validità non è in dubbio. Questa è la "legge fondamentale del linguaggio", che consiste nel fatto che nella lingua c'è una certa stabilità dei suoi elementi e la relativa frequenza della loro menzione.<136>consumo. Il problema con questo tipo di scoperte, tuttavia, è che sono note da tempo ai linguisti. Dopotutto, è abbastanza ovvio che se la lingua non avesse una certa stabilità e ogni membro di una data comunità linguistica variasse liberamente gli elementi della lingua, allora la comunicazione reciproca non sarebbe possibile e l'esistenza stessa della lingua diventerebbe priva di significato . Per quanto riguarda la distribuzione della frequenza relativa dell'uso dei singoli elementi della lingua, ha trovato la sua espressione in linguistica sotto forma di assegnazione di categorie di vocabolario e grammatica passivi e attivi, a cui L. V. Shcherba ha prestato tanta attenzione. In questo caso, i metodi statistici possono solo aiutare i linguisti nella distribuzione di specifici elementi linguistici secondo le categorie della frequenza relativa del loro uso, ma non hanno motivo di pretendere di scoprire nuovi modelli che abbiano valore per la linguistica teorica.

D'altra parte, la statistica linguistica offre una serie di conclusioni veramente "originali" che sono estremamente indicative della natura del pensiero scientifico dei suoi aderenti. Pertanto, il "vocabolario politico" nelle opere di Churchill, Benes, Halifax, Stresemann e altri viene studiato con metodi statistici complessi e le traduzioni delle loro opere in inglese vengono utilizzate nei calcoli per autori non anglofoni. I risultati del calcolo sono presentati sotto forma di numerose tabelle, formule matematiche ed equazioni. L'interpretazione linguistica dei dati quantitativi in ​​questo caso si riduce al fatto che l'uso del "vocabolario politico" da parte di Churchill è il più tipico (?) per questo gruppo di autori e che l'uso delle parole da parte di Churchill nei casi in cui tratta questioni politiche è tipico del gruppo di lingua inglese 9 8 .

In un altro caso, dopo opportune manipolazioni statistiche, si conclude che Hitler ha violato la dualità tra "linguaggio" e "discorso" nel senso quantitativo di questi termini nell'uso della Germania nazista. Un caso speciale della distruzione di questa dualità è la comprensione letterale<137>svolte metaforiche (ad esempio, "versa sale nelle ferite aperte"). La Germania nazista si è bollata con così tanti atti disumani che non c'è quasi bisogno di condannarla per questa atrocità linguistica 9 9 . Secondo Kherdan, la definizione di Marx del linguaggio come realtà immediata del pensiero porta anche alla violazione della dualità linguistica, e la legge della dialettica sulla transizione di un fenomeno nel suo opposto è, a suo avviso, la legge linguistica fraintesa della dualità di lingua. Tali interpretazioni parlano da sole.

Infine, un difetto comune inerente a tutti i suddetti casi del metodo quantitativo di studiare il materiale linguistico e quindi di acquisire un carattere metodologico è l'approccio agli elementi linguistici come un insieme meccanico di fatti assolutamente indipendenti l'uno dall'altro, in conformità con il quale, se del caso o modelli, si riferiscono solo alle relazioni numeriche della distribuzione di fatti autonomi, al di fuori delle loro dipendenze sistemiche. È vero, J. Watmou cerca in ogni modo possibile di assicurare che sia la matematica a essere migliore di qualsiasi tipo di analisi strutturale linguistica, in grado di rivelare le caratteristiche strutturali di una lingua. “La matematica moderna”, scrive, “non si occupa di misurazione e calcolo, la cui accuratezza è limitata dalla loro stessa natura, ma principalmente di struttura. Questo è il motivo per cui la matematica è altamente favorevole all'accuratezza dell'apprendimento delle lingue - nella misura in cui una descrizione separata, anche di natura più limitata, non è in grado di ... Proprio come in fisica, gli elementi matematici sono usati per descrivere il mondo fisico, poiché si suppone corrispondano a elementi del mondo fisico, così in linguistica matematica si suppone che gli elementi matematici corrispondano agli elementi del mondo della parola” 101 . Ma una tale formulazione della domanda non salva affatto la situazione, poiché nella migliore delle ipotesi può farlo<138>dare un'analisi del linguaggio o come struttura fisica, che è ancora lungi dall'essere sufficiente per il linguaggio, e in ultima analisi ha ancora lo stesso carattere meccanicistico, o come struttura logico-matematica, e questo trasferisce il linguaggio su un piano diverso, e per molti aspetti gli è estraneo. Non è superfluo notare che Watmow prevede i successi della linguistica matematica solo nel futuro, e quanto ai loro effettivi risultati li valuta con le seguenti parole: “...quasi tutto il lavoro svolto fino ad oggi da Herdan, Zipf, Yul, Giro (Guiraux) e altri, non è affatto estraneo alla critica sia della linguistica che della matematica; sa in gran parte di dilettantismo” 103 . Pertanto, se non proviamo a prevedere il futuro dei metodi matematici nella ricerca linguistica, ma proviamo ad apprezzare ciò che abbiamo oggi, allora dovremo ammettere che la matematica è stata effettivamente limitata nel campo della linguistica solo a "misurare e contare ”, e non ho potuto fare un'analisi qualitativa della lingua, approfondendo la sua struttura.<139>

Cerchiamo di essere il più obiettivi possibile. In una certa parte, i dati quantitativi, apparentemente, possono essere utilizzati dalla linguistica, ma solo come ausiliari e principalmente in problemi che hanno un orientamento pratico. Per quanto riguarda la maggior parte dei metodi quantitativi di studio dei singoli fenomeni linguistici, la conclusione generale di R. Brown è senza dubbio giustificata: "Possono essere considerati come li considera Kherdan, ma qual è il significato di tutto questo?" 104 . Immaginiamo di porre la domanda: "Quali sono gli alberi in questo giardino?". E in risposta otteniamo: "Ci sono cento alberi in questo giardino". È questa la risposta alla nostra domanda e ha davvero senso? Ma per quanto riguarda molte domande linguistiche, i metodi matematici danno proprio queste risposte.

Tuttavia, esiste un ampio campo di attività di ricerca, utilizzando principalmente metodi matematici e allo stesso tempo orientandoli al materiale linguistico, dove l'opportunità di tale combinazione è fuori dubbio. Il "significato" di questa attività di ricerca, il suo significato è determinato dagli obiettivi a cui aspira. È già stato testato nella pratica. In questo caso, stiamo parlando dei problemi associati alla creazione di macchine informatiche, strutture per la traduzione automatica di testi scientifici scritti, automazione della traduzione del discorso orale da una lingua all'altra e con l'intera gamma di compiti che sono combinati nelle questioni linguistiche della cibernetica. L'intero insieme di tali problemi viene generalmente chiamato con il nome generico di linguistica applicata. Pertanto, si distingue dalla cosiddetta linguistica matematica, che comprende quelle aree di lavoro che sono state designate sopra come stilostatistica e statistica linguistica, sebbene non eviti affatto l'elaborazione statistica del materiale linguistico. Forse la caratteristica più importante della linguistica applicata, che la separa dalla linguistica matematica, come delineato sopra, è che la prima ha la direzione opposta: non la matematica per la linguistica, ma la linguistica.<140>(formalizzato con metodi matematici) per una vasta gamma di problemi pratici.

Non è necessario divulgare il contenuto dei singoli problemi che sono ormai inclusi nell'area estremamente ampia della linguistica applicata. Contrariamente alla linguistica matematica, questi problemi sono discussi attivamente nella letteratura linguistica sovietica e iniziano giustamente ad occupare un posto sempre più importante nei problemi scientifici degli istituti di ricerca 105 . Pertanto, sono già ben noti alla nostra comunità linguistica. Questa circostanza, tuttavia, non ci esonera dalla necessità di sottoporli a riflessione, in particolare, dal punto di vista dei principi della scienza del linguaggio. Ciò contribuirà indubbiamente ad eliminare le incomprensioni che sempre più spesso sorgono tra esponenti di scienze molto distanti tra loro e che partecipano ai lavori sui problemi della linguistica applicata, e delineerà vie per la loro convergenza, da un lato , e la delimitazione delle aree di ricerca, dall'altro. Va da sé che le seguenti considerazioni rappresenteranno il punto di vista del linguista, ed è necessario che i matematici non solo cerchino di assimilarlo, ma, in relazione alle questioni sollevate, ne diano la loro interpretazione.

Il linguista-teorico non può in alcun modo accontentarsi del fatto che in tutti i casi<141>lingua per gli scopi fissati dalla linguistica applicata, la loro base è un modello matematico. In accordo con ciò, le osservazioni sui fenomeni del linguaggio e i risultati così ottenuti sono espressi in termini e concetti della matematica, cioè attraverso equazioni e formule matematiche. Facciamo un esempio per chiarezza. Condon 1 06 e Zipf 1 07 hanno stabilito che i logaritmi della frequenza ( F) le occorrenze di parole in un testo di grandi dimensioni si trovano quasi in linea retta, se sono correlate nel diagramma con i logaritmi di rango o rango ( R) di queste parole. L'equazione f=c:r, Dove Conè una costante riflette questa relazione nel senso limitato che c:r per valore impostato R riproduce la frequenza osservata con grande approssimazione. Relazione tra F E R, espresso da una formula matematica, è un modello per il rapporto tra i valori osservati della frequenza d'uso e il rango, o rango, delle parole. Questo è uno dei casi di modellazione matematica. 

L'intera teoria dell'informazione è interamente basata sul modello matematico del processo comunicativo sviluppato da C. Shannon 108 . È definita come "una disciplina matematica dedicata ai metodi di calcolo e stima della quantità di informazioni contenute in qualsiasi dato, e allo studio dei processi di memorizzazione e trasmissione delle informazioni" (TSB, vol. 51, p. 128). Di conseguenza, i concetti di base della teoria dell'informazione ricevono un'espressione matematica L'informazione è misurata in binit o unità binarie (un codice, che è paragonato a una lingua, con due segnali condizionali ugualmente probabili trasmette un'unità binaria di informazioni durante la trasmissione di ogni carattere ).-il codice e la quantità media di informazioni trasmesse<142>formazioni. La ridondanza è espressa come percentuale della capacità trasmissiva totale del codice”, 1 09 ecc. Allo stesso modo, la traduzione automatica richiede lo sviluppo algoritmico della mappatura di elementi di una lingua in un'altra, ecc. 1 10 . Questi sono altri casi di modellazione.

L'uso di modelli privi di significato può essere di grande aiuto, in particolare, con ogni probabilità, nella soluzione dei problemi che la linguistica applicata si pone. Tuttavia, per la linguistica teorica, è molto importante che un modello astratto, di regola, non riproduca tutte le caratteristiche di un fenomeno reale, tutte le sue qualità funzionali. Quindi, un architetto, prima di costruire una casa, può realizzare il suo modello, che riproduce nei minimi dettagli la casa che si sta progettando, e questo lo aiuta a risolvere una serie di problemi pratici legati alla costruzione della casa stessa. Ma un tale modello di casa, per quanto accurato possa essere, è privo di quella "funzione" e di quello scopo per cui tutte le case sono generalmente costruite - non è in grado di fornire alloggio a una persona. La situazione è simile con la lingua, dove il modello non è sempre in grado di riprodurre tutte le sue qualità. In questo caso, la questione è ulteriormente complicata dal fatto che per costruire il modello vengono utilizzati criteri non linguistici, ma matematici. “I modelli matematici ... - scrive A. Ettinger, - svolgono un ruolo estremamente importante in tutte le aree della tecnologia, ma poiché sono uno strumento di sintesi, il loro significato per la linguistica, che è principalmente una disciplina storica e descrittiva, è naturalmente limitato ” 1 11 .<143>

La modellazione matematica di una lingua è in realtà applicabile solo al suo stato statico, che è condizionale per un linguista e di fatto è in diretto conflitto con la qualità fondamentale di una lingua, la cui stessa forma di esistenza è lo sviluppo. Va da sé che lo studio statico di una lingua non è affatto escluso dalla linguistica e costituisce la base per la compilazione di grammatiche e dizionari normativi, grammatiche descrittive, grammatiche pratiche e dizionari che servono da guida per lo studio pratico delle lingue straniere, ecc. Tuttavia, in tutti questi lavori, che sono prevalentemente applicati in natura, i linguisti limitano consapevolmente il campo di ricerca e non chiudono in alcun modo gli occhi su altri aspetti della lingua 1 12 . Con un esame statico della lingua, in particolare, tali qualità della lingua associate alla sua natura dinamica, come la produttività, la dipendenza dalle forme di pensiero e l'ampia interazione con fattori culturali, sociali, politici, storici e di altro tipo, scompaiono completamente da campo visivo del ricercatore. Solo sul piano sincronico il linguaggio può essere considerato come un sistema di segni o codici convenzionali, che però si rivela del tutto ingiustificato non appena si adotta un punto di vista dinamico più adatto al linguaggio. È nei processi di sviluppo che si sviluppano qualità linguistiche come la motivazione, la polisemia delle parole che non hanno confini stabili, la non autonomia del significato di una parola e del suo involucro sonoro, il potenziale creativo di una parola associato al contesto manifestato, e tutto ciò è in netta contraddizione con le caratteristiche principali di un codice o di un segno 1 13 . Ovviamente, in linguistica applicata, si può pensare anche a tutte queste qualità della lingua e, ai fini pratici, accontentarsi, per così dire, di una “istantanea” della lingua, capace comunque di dare un'idea abbastanza approssimativa di il meccanismo del suo funzionamento.<144>nirovaniya. Tuttavia, ciascuna di queste "istantanee", se considerata come un fatto del linguaggio, e non come un fatto di un sistema di codici convenzionali, deve essere inclusa nell'infinito processo di movimento in cui il linguaggio esiste sempre 1 14 . Non può essere studiato al di fuori di quelle condizioni specifiche che caratterizzano questo movimento, che lascia il segno nello stato dato della lingua e determina il potenziale per il suo ulteriore sviluppo. Qui c'è la stessa differenza che c'è tra una fotografia momentanea di una persona e il suo ritratto dipinto con il pennello di un vero artista. Nell'opera dell'artista abbiamo davanti a noi un'immagine generalizzante di una persona in tutta l'originalità non solo del suo aspetto fisico, ma anche del suo contenuto spirituale interiore. Da un ritratto artistico possiamo anche leggere il passato della persona raffigurata su di esso e determinare di cosa è capace nelle sue azioni. E un'istantanea, sebbene capace di dare un'immagine più precisa dell'aspetto dell'originale, è priva di queste qualità e spesso cattura sia un brufolo accidentale che è saltato sul naso sia<145>una posa o un'espressione completamente insolita, che alla fine porta a una distorsione dell'originale.

Va notato che il metodo delle "istantanee" può, ovviamente, essere applicato ai fatti dello sviluppo del linguaggio. Ma in questo caso, in realtà, ci occuperemo solo di stati separati della lingua, che, nella loro caratterizzazione quantitativa, risultano essere collegati non più di una caratterizzazione quantitativa comparativa di lingue diverse. Questo tipo di "dinamica" quantitativa non conterrà nulla di organico, e la connessione tra i singoli stati della lingua poggerà solo sul confronto delle relazioni numeriche. Se anche in questo caso si ricorre a un'analogia, allora si può fare riferimento alla crescita del bambino. Il suo sviluppo, ovviamente, può essere rappresentato sotto forma di dinamica di dati numerici sul suo peso, altezza, rapporti mutevoli del volume delle parti del suo corpo, ma tutti questi dati sono assolutamente distaccati da tutto ciò che costituisce principalmente l'essenza individuale di una persona - il suo carattere, inclinazioni, abitudini. , sapori, ecc.

Un altro lato negativo della "modellazione" matematica della lingua è il fatto che non può servire come principio generale sulla base del quale è possibile effettuare una descrizione completa ed esaustiva - sistematica della lingua. Solo un approccio matematico ai fenomeni del linguaggio, ad esempio, non consentirà di rispondere nemmeno a domande così fondamentali (senza le quali l'esistenza stessa della scienza del linguaggio è impensabile), come: cos'è il linguaggio, quali fenomeni dovrebbero essere classificati come linguistici propri, come si definisce una parola o una frase, quali sono i concetti e le categorie di base del linguaggio, ecc. Prima di passare ai metodi matematici di studio del linguaggio, è necessario avere già delle risposte (anche sotto forma di ipotesi) a tutte queste domande in anticipo. Non c'è bisogno di chiudere un occhio sul fatto che in tutti i casi a noi noti dello studio dei fenomeni linguistici con metodi matematici, tutti questi concetti e categorie dovevano inevitabilmente essere accettati così come erano definiti dai tradizionali o, relativamente parlando, metodi qualitativi.

Questa caratteristica dei metodi matematici nella loro applicazione linguistica fu notata da Spang-Hanssen quando pi greco<146>sal: “Va tenuto presente che i fatti osservati che ricevono un'espressione quantitativa ... non hanno valore se non fanno parte della descrizione, e ai fini linguistici dovrebbe essere una descrizione sistematica, strettamente correlata a una descrizione linguistica qualitativa descrizione e teoria” 1 15 . In un altro discorso di Spang-Hanssen troviamo un chiarimento di questa idea: “Finché non sarà dimostrata la possibilità di costruire un sistema quantitativo, e fintanto che esiste un sistema qualitativo generalmente accettato per un dato campo di studio, calcoli di frequenza e altri caratteristiche numeriche dal punto di vista linguistico non hanno alcun senso" 1 16 . Idee simili sono espresse da Uldall, collegandole in qualche modo inaspettatamente con lo sviluppo dei fondamenti teorici generali della glossematica: “Quando un linguista considera o misura tutto ciò che considera e misura, non è esso stesso determinato quantitativamente; per esempio, le parole, quando vengono contate, sono definite, se lo sono affatto, in termini del tutto diversi.<147>

Pertanto, risulta che sia in termini teorici che nella loro applicazione pratica, i metodi matematici dipendono direttamente da concetti e categorie linguistici definiti da metodi tradizionali, filologici o, come accennato in precedenza, qualitativi. In termini di linguistica applicata, è importante rendersi conto di questa dipendenza e, di conseguenza, conoscere la totalità delle principali categorie della linguistica tradizionale.

È vero, non c'è motivo di rimproverare ai rappresentanti delle scienze esatte che lavorano nel campo della linguistica applicata di non aver utilizzato i dati della linguistica moderna. Ciò non corrisponde allo stato effettivo delle cose. Non solo conoscono perfettamente, ma usano anche ampiamente nel loro lavoro i sistemi di caratteristiche differenziali stabiliti dai linguisti che sono caratteristici delle diverse lingue, la distribuzione e la disposizione degli elementi linguistici all'interno di sistemi linguistici specifici, i risultati della fonetica acustica, ecc. in questo caso è necessaria una riserva molto significativa. In effetti, i rappresentanti delle scienze esatte utilizzano i dati di una sola direzione in linguistica: la cosiddetta linguistica descrittiva, che si è deliberatamente distinta dai problemi tradizionali della linguistica teorica, lungi dal coprire l'intero campo della ricerca linguistica, da una vera e propria dal punto di vista linguistico, presenta notevoli carenze metodologiche, che l'hanno portata alla crisi recentemente rivelata 1 18 , e, inoltre, ha un orientamento puramente pratico, corrispondente agli interessi della linguistica applicata. Alla linguistica descrittiva valgono tutte le riserve ei rimproveri che sono stati fatti sopra alla considerazione statica del linguaggio. Un simile approccio unilaterale della linguistica descrittiva può, il ricercatore<148>Tuttavia, può essere giustificato solo dai compiti che la linguistica applicata si pone, ma è lungi dall'esaurire l'intero contenuto della scienza del linguaggio.

Nel processo di sviluppo di questioni di linguistica applicata, possono sorgere nuovi problemi teorici, e di fatto sono già sorti. Alcuni di questi problemi sono strettamente correlati ai compiti specifici della linguistica applicata e mirano a superare le difficoltà che sorgono nella risoluzione di questi problemi. Altri problemi sono direttamente correlati alla linguistica teorica, consentendo una nuova prospettiva sulle idee tradizionali o aprendo nuove aree di ricerca linguistica, nuovi concetti e teorie. Tra questi ultimi, ad esempio, c'è il problema della creazione di un linguaggio "macchina" (o linguaggio intermedio), che è il più strettamente correlato a un insieme complesso di questioni cardinali della linguistica teorica come la relazione di concetti e significati lessicali, logica e grammatica, diacronia e sincronia, la natura segnica della lingua, l'essenza del significato linguistico, i principi di costruzione delle lingue artificiali, ecc. 1 19 . In questo caso, è particolarmente importante stabilire la comprensione reciproca e il commonwealth nel lavoro comune dei rappresentanti delle discipline linguistiche e delle scienze esatte. Per quanto riguarda il lato linguistico, in questo caso, a quanto pare, non si dovrebbe parlare di limitare già in anticipo gli sforzi, ad esempio, dei progettisti di macchine di traduzione” e di provare a stabilire le capacità lavorative di tali macchine con i versi di N. Gribachev o la prosa di V. Kochetov 1 20 . La macchina stessa troverà i limiti delle sue capacità e la redditività - i limiti del suo utilizzo. Ma i linguisti, come loro contributo alla causa comune, devono portare la loro conoscenza delle caratteristiche della struttura della lingua, della sua versatilità, delle relazioni intersecanti interne dei suoi elementi, così come delle connessioni ampie e multilaterali del linguaggio con il fisico, fisiologico , mentale e logico<149>fenomeni mi, modelli specifici di funzionamento e sviluppo del linguaggio. La totalità di questa conoscenza è necessaria ai progettisti delle macchine corrispondenti per non vagare in direzioni sbagliate, ma per rendere la ricerca mirata e chiaramente orientata. Anche la brevissima rassegna dei casi di applicazione di metodi matematici a problemi linguistici, che è stata fatta in questo saggio, convince che tale conoscenza non sarà affatto superflua per i rappresentanti delle scienze esatte.

Sulla base di tutte le precedenti considerazioni, si può ovviamente giungere ad alcune conclusioni generali.

Quindi, linguistica matematica? Se ciò significa l'uso di metodi matematici come chiave universale per risolvere tutti i problemi linguistici, allora tali affermazioni dovrebbero essere riconosciute come assolutamente ingiustificate. Tutto ciò che è stato fatto in questa direzione ha finora fatto poco o niente per risolvere i tradizionali problemi della scienza del linguaggio. Nel peggiore dei casi, l'applicazione di metodi matematici è accompagnata da ovvie assurdità o, dal punto di vista linguistico, è assolutamente priva di significato. Nel migliore dei casi, i metodi matematici possono essere utilizzati come metodi ausiliari della ricerca linguistica, essendo posti al servizio di problemi linguistici specifici e limitati. In questo caso non si può parlare di alcuna "filosofia quantitativa del linguaggio". La fisica, la psicologia, la fisiologia, la logica, la sociologia e l'etnologia nel loro tempo hanno invaso l'indipendenza della scienza del linguaggio, ma non hanno potuto soggiogare la linguistica. È accaduto il contrario: la linguistica ha approfittato dei risultati di queste scienze e, nella misura necessaria per se stessa, ha iniziato a utilizzare il loro aiuto, arricchendo così l'arsenale dei suoi metodi di ricerca. Ora, a quanto pare, è il turno della matematica. È auspicabile che questa nuova comunità contribuisca anche al rafforzamento della scienza del linguaggio, al miglioramento dei suoi metodi di lavoro e all'aumento della loro diversità. È quindi altrettanto legittimo parlare di linguistica matematica come di linguistica fisica, linguistica fisiologica, linguistica logica, linguistica psicologica, e<150>ecc. Non esiste una linguistica del genere, esiste solo una linguistica, che utilizza proficuamente i dati di altre scienze come strumenti di ricerca ausiliari. Pertanto, non c'è motivo di ritirarsi davanti all'assalto della nuova scienza e di cedere facilmente ad essa le posizioni che ha conquistato. Qui è molto appropriato ricordare le parole di A. Martinet: “Forse si è tentati di unire l'uno o l'altro grande movimento di pensiero usando alcuni termini ben scelti, o dichiarare con qualche formula matematica il rigore del proprio ragionamento. Tuttavia, è giunto il momento per i linguisti di realizzare l'indipendenza della loro scienza e di liberarsi da quel complesso di inferiorità che li fa associare a qualsiasi loro azione con l'uno o l'altro principio scientifico generale, per cui i contorni della realtà diventano sempre solo più vago, invece di diventare più chiaro 21 .

Dunque matematica in sé e linguistica in sé. Ciò non esclude affatto la loro reciproca assistenza o un incontro amichevole nel lavoro congiunto su problemi comuni. Questo tipo di luogo di applicazione degli sforzi concertati delle due scienze è l'intera vasta gamma di problemi che fanno parte della linguistica applicata e sono di grande importanza economica nazionale. Si dovrebbe solo desiderare che nel loro lavoro congiunto entrambe le scienze abbiano mostrato la massima comprensione reciproca, che, senza dubbio, contribuirebbe anche alla massima fecondità della loro cooperazione.<151>

Quanto costa scrivere il tuo articolo?

Scegli il tipo di lavoro Tesi (laurea triennale / specialistica) Parte della tesi Diploma di master Corsi con pratica Teoria del corso Saggio Saggio Compiti d'esame Lavoro di attestazione (VAR / WQR) Business plan Domande d'esame Diploma MBA Tesi (università / istituto tecnico) Altri casi Lavoro di laboratorio , RGR Guida in linea Relazione pratica Ricerca informazioni Presentazione in PowerPoint Estratto post-laurea Materiale di accompagnamento al diploma Articolo Prova Disegni altro »

Grazie, ti è stata inviata un'email. Controlla la tua posta.

Vuoi un codice promozionale del 15% di sconto?

Ricevi SMS
con codice promozionale

Con successo!

?Dì il codice promozionale durante una conversazione con il manager.
Il codice promozionale può essere utilizzato solo una volta sul tuo primo ordine.
Tipo di codice promozionale - " lavoro di laurea".

Interazione di matematica e linguistica


introduzione

Capitolo 1. La storia dell'applicazione dei metodi matematici in linguistica

1.1. La formazione della linguistica strutturale a cavallo tra XIX e XX secolo

1.2. Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento

Capitolo 2. Esempi selezionati dell'uso della matematica in linguistica

2.1. Traduzione automatica

2.2.Metodi statistici nell'apprendimento delle lingue

2.3. Imparare una lingua con metodi di logica formale

2.4. Prospettive per l'applicazione dei metodi matematici in linguistica

Conclusione

Letteratura

Appendice 1. Ronald Schleifer. Ferdinando di Saussure

Appendice 2. Ferdinand de Saussure (traduzione)

introduzione


Nel XX secolo c'è stata una tendenza continua verso l'interazione e la compenetrazione di vari campi della conoscenza. I confini tra le singole scienze si sfumano gradualmente; ci sono sempre più rami dell'attività mentale che sono "all'incrocio" della conoscenza umanitaria, tecnica e delle scienze naturali.

Un'altra caratteristica evidente della modernità è il desiderio di studiare le strutture ei loro elementi costitutivi. Pertanto, un posto crescente, sia nella teoria scientifica che nella pratica, è dato alla matematica. Entrando in contatto, da un lato, con la logica e la filosofia, dall'altro, con la statistica (e, di conseguenza, con le scienze sociali), la matematica penetra sempre più in profondità in quegli ambiti che per lungo tempo sono stati considerati puramente "umanitari", ampliando il loro potenziale euristico (la risposta alla domanda "quanto" spesso aiuta a rispondere alle domande "cosa" e "come"). La linguistica non ha fatto eccezione.

Lo scopo del mio corso è di evidenziare brevemente la connessione tra la matematica e un ramo della linguistica come la linguistica. Dagli anni '50, la matematica è stata utilizzata in linguistica per creare un apparato teorico per descrivere la struttura delle lingue (sia naturali che artificiali). Tuttavia, va detto che non ha trovato immediatamente per sé un'applicazione così pratica. Inizialmente, i metodi matematici in linguistica iniziarono ad essere utilizzati per chiarire i concetti di base della linguistica, tuttavia, con lo sviluppo della tecnologia informatica, tale premessa teorica iniziò a trovare applicazione nella pratica. La risoluzione di compiti come la traduzione automatica, il recupero automatico delle informazioni, l'elaborazione automatica del testo richiedeva un approccio fondamentalmente nuovo alla lingua. I linguisti hanno affrontato la questione: come imparare a rappresentare i modelli linguistici nella forma in cui possono essere applicati direttamente alla tecnologia. Il termine "linguistica matematica", popolare ai nostri tempi, si riferisce a qualsiasi ricerca linguistica che utilizza metodi esatti (e il concetto di metodi esatti nella scienza è sempre strettamente correlato alla matematica). Alcuni scienziati degli ultimi anni ritengono che l'espressione stessa non possa essere elevata al rango di termine, poiché non significa alcuna "linguistica" speciale, ma solo una nuova direzione focalizzata sul miglioramento, l'aumento dell'accuratezza e l'affidabilità dei metodi di ricerca linguistica . La linguistica utilizza metodi sia quantitativi (algebrici) che non quantitativi, il che la avvicina alla logica matematica e, di conseguenza, alla filosofia e persino alla psicologia. Anche Schlegel ha notato l'interazione tra linguaggio e coscienza, e Ferdinand de Saussure, un eminente linguista dell'inizio del XX secolo (racconterò più avanti della sua influenza sullo sviluppo dei metodi matematici in linguistica), ha collegato la struttura della lingua con la sua appartenenza alle persone. Il ricercatore moderno L. Perlovsky va oltre, identificando le caratteristiche quantitative della lingua (ad esempio, il numero di sessi, casi) con le peculiarità della mentalità nazionale (maggiori informazioni su questo nella sezione 2.2, "Metodi statistici in linguistica").

L'interazione tra matematica e linguistica è un argomento poliedrico e nel mio lavoro non mi soffermerò su tutto, ma, prima di tutto, sui suoi aspetti applicati.

Capitolo I. Storia dell'applicazione dei metodi matematici in linguistica


1.1 La formazione della linguistica strutturale a cavallo tra il XIX e il XX secolo


La descrizione matematica del linguaggio si basa sull'idea del linguaggio come meccanismo, che risale al famoso linguista svizzero del primo Novecento, Ferdinand de Saussure.

Il collegamento iniziale del suo concetto è la teoria del linguaggio come sistema costituito da tre parti (lingua stessa - langue, discorso - parole e attività linguistica - langage), in cui ogni parola (membro del sistema) è considerata non in sé , ma in connessione con altri membri. Come notò in seguito un altro eminente linguista, il danese Louis Hjelmslev, Saussure "fu il primo a richiedere un approccio strutturale al linguaggio, cioè una descrizione scientifica del linguaggio registrando le relazioni tra le unità".

Comprendendo la lingua come una struttura gerarchica, Saussure fu il primo a porre il problema del valore e del significato delle unità linguistiche. Fenomeni ed eventi separati (diciamo, la storia dell'origine delle singole parole indoeuropee) dovrebbero essere studiati non da soli, ma in un sistema in cui sono correlati con componenti simili.

L'unità strutturale del linguaggio di Saussure considerava la parola, "segno", in cui si univano suono e significato. Nessuno di questi elementi esiste l'uno senza l'altro: quindi, il madrelingua comprende le varie sfumature del significato di una parola polisemantica come un elemento separato nell'insieme strutturale, nella lingua.

Così, nella teoria di F. de Saussure si può vedere l'interazione della linguistica, da un lato, con la sociologia e la psicologia sociale (va notato che allo stesso tempo si stanno sviluppando la fenomenologia di Husserl, la psicoanalisi di Freud, la teoria della relatività di Einstein , sperimentazioni su forma e contenuto in letteratura, musica e belle arti), dall'altro, con la matematica (il concetto di consistenza corrisponde al concetto algebrico di linguaggio). Tale concetto ha cambiato il concetto di interpretazione linguistica in quanto tale: i fenomeni hanno cominciato a essere interpretati non in relazione alle cause del loro verificarsi, ma in relazione al presente e al futuro. L'interpretazione ha cessato di essere indipendente dalle intenzioni di una persona (nonostante il fatto che le intenzioni possano essere impersonali, "inconsce" nel senso freudiano del termine).

Il funzionamento del meccanismo linguistico si manifesta attraverso l'attività linguistica dei madrelingua. Il risultato del discorso sono i cosiddetti "testi corretti" - sequenze di unità vocali che obbediscono a determinati schemi, molti dei quali consentono una descrizione matematica. La teoria dei modi per descrivere la struttura sintattica si occupa dello studio dei metodi per la descrizione matematica di testi corretti (principalmente frasi). In una tale struttura, le analogie linguistiche sono definite non con l'aiuto delle loro qualità intrinseche, ma con l'aiuto di relazioni di sistema ("strutturali").

In Occidente, le idee di Saussure sono sviluppate dai giovani contemporanei del grande linguista svizzero: in Danimarca - L. Hjelmslev, da me già citato, che ha dato origine alla teoria algebrica del linguaggio nella sua opera "Fondamenti di teoria linguistica", in negli USA - E. Sapir, L. Bloomfield, C. Harris, nella Repubblica Ceca - lo scienziato-emigrante russo N. Trubetskoy.

Le regolarità statistiche nello studio del linguaggio iniziarono ad essere affrontate nientemeno che dal fondatore della genetica, Georg Mendel. Fu solo nel 1968 che i filologi scoprirono che, negli ultimi anni della sua vita, era affascinato dallo studio dei fenomeni linguistici con i metodi della matematica. Mendel ha portato questo metodo alla linguistica dalla biologia; negli anni '90, solo i linguisti ei biologi più audaci rivendicavano la fattibilità di tale analisi. Negli archivi del monastero di S. Tomasz a Brno, il cui abate era Mendel, sono stati trovati fogli con colonne di cognomi terminanti in "mann", "bauer", "mayer", e con alcune frazioni e calcoli. Nel tentativo di scoprire le leggi formali dell'origine dei cognomi, Mendel fa calcoli complessi, in cui tiene conto del numero di vocali e consonanti nella lingua tedesca, del numero totale di parole che considera, del numero di cognomi, eccetera.

Nel nostro paese, la linguistica strutturale ha iniziato a svilupparsi all'incirca nello stesso periodo dell'Occidente, a cavallo tra il XIX e il XX secolo. Contemporaneamente a F. de Saussure, il concetto di lingua come sistema è stato sviluppato nelle loro opere dai professori dell'Università di Kazan F.F. Fortunatov e I.A. Baldovino di Courtenay. Quest'ultimo ha corrisposto a lungo con de Saussure, rispettivamente, le scuole di linguistica di Ginevra e Kazan hanno collaborato tra loro. Se Saussure può essere definito l'ideologo dei metodi "esatti" in linguistica, allora Baudouin de Courtenay ha gettato le basi pratiche per la loro applicazione. Fu il primo a separare la linguistica (come scienza esatta che utilizza metodi statistici e dipendenza funzionale) dalla filologia (una comunità di discipline umanitarie che studiano la cultura spirituale attraverso la lingua e la parola). Lo stesso scienziato riteneva che "la linguistica possa essere utile nel prossimo futuro, liberata solo dall'unione obbligatoria con la filologia e la storia letteraria" . La fonologia divenne il "banco di prova" per l'introduzione dei metodi matematici nella linguistica: i suoni come "atomi" del sistema linguistico, dotati di un numero limitato di proprietà facilmente misurabili, erano il materiale più conveniente per metodi di descrizione formali e rigorosi. La fonologia nega l'esistenza del significato nel suono, quindi il fattore "umano" è stato eliminato negli studi. In questo senso, i fonemi sono come oggetti fisici o biologici.

I fonemi, come i più piccoli elementi linguistici accettabili per la percezione, rappresentano una sfera separata, una "realtà fenomenologica" separata. Ad esempio, in inglese, il suono "t" può essere pronunciato in modo diverso, ma in tutti i casi una persona che parla inglese lo percepirà come "t". La cosa principale è che il fonema svolga la sua funzione principale, significativa. Inoltre, le differenze tra le lingue sono tali che varietà di un suono in una lingua possono corrispondere a diversi fonemi in un'altra; ad esempio, "l" e "r" in inglese sono diverse, mentre in altre lingue sono varietà dello stesso fonema (come la "t" inglese, pronunciata con o senza aspirazione). Il vasto vocabolario di qualsiasi linguaggio naturale è un insieme di combinazioni di un numero molto minore di fonemi. In inglese, ad esempio, vengono utilizzati solo 40 fonemi per pronunciare e scrivere circa un milione di parole.

I suoni di una lingua sono un insieme di caratteristiche sistematicamente organizzato. Negli anni '20 e '30, seguendo Saussure, Jacobson e N.S. Trubetskoy individuarono le "caratteristiche distintive" dei fonemi. Queste caratteristiche si basano sulla struttura degli organi della parola: lingua, denti, corde vocali. Ad esempio, in inglese la differenza tra "t" e "d" è la presenza o l'assenza di una "voce" (la tensione delle corde vocali) e il livello di voce che distingue un fonema da un altro. Pertanto, la fonologia può essere considerata un esempio della regola linguistica generale descritta da Saussure: "Ci sono solo differenze nella lingua". Ancora più importante non è questo: la differenza di solito implica le condizioni esatte tra le quali si trova; ma nella lingua ci sono solo differenze senza condizioni precise. Che si tratti di "designazione" o "significato", nella lingua non ci sono né concetti né suoni che sarebbero esistiti prima dello sviluppo del sistema linguistico.

Pertanto, nella linguistica saussuriana, il fenomeno studiato è inteso come un insieme di confronti e opposizioni del linguaggio. La lingua è sia un'espressione del significato delle parole che un mezzo di comunicazione, e queste due funzioni non coincidono mai. Possiamo notare l'alternanza di forma e contenuto: i contrasti linguistici ne definiscono le unità strutturali, e queste unità interagiscono per creare un certo contenuto significativo. Poiché gli elementi del linguaggio sono casuali, né il contrasto né la combinazione possono essere la base. Ciò significa che in una lingua, i tratti distintivi formano un contrasto fonetico a un diverso livello di comprensione, i fonemi si combinano in morfemi, i morfemi in parole, le parole in frasi, ecc. In ogni caso, un intero fonema, parola, frase, ecc. è più della semplice somma delle sue parti.

Saussure ha proposto l'idea di una nuova scienza del XX secolo, separata dalla linguistica, che studia il ruolo dei segni nella società. Saussure chiamò questa scienza semiologia (dal greco "semeon" - un segno). La "scienza" della semiotica, sviluppatasi nell'Europa orientale negli anni '20-'30 ea Parigi negli anni '50-'60, ha ampliato lo studio del linguaggio e delle strutture linguistiche in scoperte letterarie composte (o articolate) in termini di queste strutture. Inoltre, al tramonto della sua carriera, parallelamente al suo corso di linguistica generale, Saussure si impegnò in un'analisi "semiotica" della tarda poesia romana, cercando di scoprire anagrammi deliberatamente composti di nomi propri. Questo metodo era per molti versi l'opposto del razionalismo nella sua analisi linguistica: era un tentativo di studiare in un sistema il problema della "probabilità" nel linguaggio. Tale ricerca aiuta a concentrarsi sul "lato reale" della probabilità; la "parola chiave" per la quale Saussure cerca un anagramma è, secondo Jean Starobinsky, "uno strumento per il poeta, non la fonte della vita del poema". La poesia serve a scambiare i suoni della parola chiave. Secondo Starobinsky, in questa analisi, "Saussure non approfondisce la ricerca di significati nascosti". Al contrario, nelle sue opere si nota la volontà di evitare domande legate alla coscienza: “poiché la poesia si esprime non solo nelle parole, ma anche in ciò che queste parole danno origine, va oltre il controllo della coscienza e dipende solo da le leggi della lingua” (cfr. Allegato 1).

Il tentativo di Saussure di studiare i nomi propri nella poesia tardo romana sottolinea una delle componenti della sua analisi linguistica: la natura arbitraria dei segni, nonché l'essenza formale della linguistica di Saussure, che esclude la possibilità di analizzare il significato. Todorov conclude che oggi le opere di Saussure sembrano essere estremamente coerenti nella loro riluttanza a studiare i simboli di un fenomeno che hanno un significato chiaramente definito [Appendice 1]. Esplorando gli anagrammi, Saussure presta attenzione solo alla ripetizione, ma non alle opzioni precedenti. . . . Studiando i Nibelunghi, definisce i simboli solo per assegnarli a letture errate: se non sono intenzionali, i simboli non esistono. Del resto, nei suoi scritti di linguistica generale, ipotizza l'esistenza di una semiologia che descriva non solo i segni linguistici; ma questa ipotesi è limitata dal fatto che la semiologia può descrivere solo segni casuali e arbitrari.

Se è davvero così, è solo perché non potrebbe immaginare "l'intenzione" senza un oggetto; non riusciva a colmare completamente il divario tra forma e contenuto - nei suoi scritti questo si trasformava in una domanda. Invece, si è rivolto alla "legittimità linguistica". Tra, da un lato, concetti ottocenteschi basati sulla storia e su congetture soggettive, e metodi di interpretazione aleatoria basati su questi concetti, e, dall'altro, concetti strutturalisti che cancellano l'opposizione tra forma e contenuto (soggetto e oggetto), significato e origini nello strutturalismo, nella psicoanalisi e persino nella meccanica quantistica, gli scritti di Ferdinand de Saussure sulla linguistica e la semiotica segnano un punto di svolta nello studio dei significati nella lingua e nella cultura.

Gli scienziati russi erano anche rappresentati al Primo Congresso Internazionale dei Linguisti all'Aia nel 1928. S. Kartsevsky, R. Yakobson e N. Trubetskoy hanno redatto un rapporto che ha esaminato la struttura gerarchica della lingua, nello spirito delle idee più moderne dell'inizio del secolo scorso. Jakobson nei suoi scritti sviluppò le idee di Saussure secondo cui gli elementi fondamentali di una lingua dovrebbero essere studiati, prima di tutto, in connessione con le loro funzioni, e non con le ragioni del loro verificarsi.

Sfortunatamente, dopo l'ascesa al potere di Stalin nel 1924, la linguistica russa, come molte altre scienze, viene respinta. Molti scienziati di talento furono costretti a emigrare, furono espulsi dal paese o morirono nei campi. Non è stato fino alla metà degli anni Cinquanta che è diventato possibile un certo pluralismo di teorie, ne parleremo più dettagliatamente nella sezione 1.2.


1.2 Applicazione dei metodi matematici alla linguistica nella seconda metà del Novecento


Entro la metà del ventesimo secolo si erano formate quattro scuole linguistiche mondiali, ognuna delle quali si rivelò l'antenata di un certo metodo "esatto". La scuola fonologica di Leningrado (il suo antenato era uno studente di Baudouin de Courtenay L.V. Shcherba) ha utilizzato un esperimento psicolinguistico basato sull'analisi del discorso dei madrelingua come criterio principale per generalizzare il suono sotto forma di fonema.

Gli scienziati del circolo linguistico di Praga, in particolare il suo fondatore N.S. Trubetskoy, emigrato dalla Russia, sviluppò la teoria delle opposizioni: la struttura semantica della lingua fu da loro descritta come un insieme di unità semantiche costruite in modo opposto - Sem. Questa teoria è stata applicata nello studio non solo della lingua, ma anche della cultura artistica.

Gli ideologi del descrittivismo americano erano i linguisti L. Bloomfield ed E. Sapir. La lingua è stata presentata ai descrittivisti come un insieme di dichiarazioni vocali, che erano l'oggetto principale del loro studio. Il loro focus era sulle regole della descrizione scientifica (da cui il nome) dei testi: lo studio dell'organizzazione, disposizione e classificazione dei loro elementi. La formalizzazione di procedure analitiche nel campo della fonologia e della morfologia (sviluppo di principi per lo studio della lingua a diversi livelli, analisi distributiva, metodo dei costituenti diretti, ecc.) ha portato alla formulazione di questioni generali di modellazione linguistica. La disattenzione al piano del contenuto della lingua, così come il lato paradigmatico della lingua, non ha permesso ai descrittivisti di interpretare la lingua come sistema in modo sufficientemente completo.

Negli anni '60 si sviluppò la teoria delle grammatiche formali, nata principalmente grazie al lavoro del filosofo e linguista americano N. Chomsky. È giustamente considerato uno dei più famosi scienziati e personaggi pubblici moderni, a lui sono dedicati molti articoli, monografie e persino un documentario a figura intera. Con il nome di un modo fondamentalmente nuovo di descrivere la struttura sintattica inventata da Chomsky - grammatica generativa (generativa) - la tendenza corrispondente in linguistica era chiamata generativismo.

Chomsky, discendente di immigrati dalla Russia, ha studiato linguistica, matematica e filosofia all'Università della Pennsylvania dal 1945, fortemente influenzato dal suo maestro Zelig Harris - come Harris, Chomsky considerava e considera ancora le sue opinioni politiche vicine all'anarchismo (è ancora noto come critico dell'attuale sistema politico statunitense e come uno dei leader spirituali dell'anti-globalismo).

Il primo grande lavoro scientifico di Chomsky, la sua tesi di master Morphology of Modern Hebrew (1951), rimase inedito. Chomsky ha conseguito il dottorato presso l'Università della Pennsylvania nel 1955, ma gran parte della ricerca alla base della sua dissertazione (pubblicata integralmente solo nel 1975 con il titolo The Logical Structure of Linguistic Theory) e della sua prima monografia, Syntactic Structures (1957, Rus. trans . 1962), è stato eseguito presso l'Università di Harvard nel 1951-1955. Nello stesso 1955, lo scienziato si trasferì al Massachusetts Institute of Technology, dove divenne professore nel 1962.

La teoria di Chomsky ha attraversato diverse fasi del suo sviluppo.

Nella prima monografia "Syntactic Structures", lo scienziato ha presentato il linguaggio come un meccanismo per generare un insieme infinito di frasi utilizzando un insieme finito di mezzi grammaticali. Per descrivere le proprietà linguistiche, ha proposto i concetti di strutture grammaticali profonde (nascoste alla percezione diretta e generate da un sistema di regole ricorsive, cioè applicabili ripetutamente) e superficiali (direttamente percepite), nonché trasformazioni che descrivono la transizione dalle strutture profonde a quelle superficiali. A una struttura profonda possono corrispondere più strutture superficiali (ad esempio, la costruzione passiva Il decreto è firmato dal presidente deriva dalla stessa struttura profonda della costruzione attiva il presidente firma il decreto) e viceversa (ad esempio, l'ambiguità Madre ama la figlia è descritta come il risultato della coincidenza di strutture superficiali che risalgono a due diversi profondi, in uno dei quali la madre è colei che ama la figlia, e nell'altro, colei che la figlia ama).

La teoria standard di Chomsky è considerata il modello "Aspects" esposto nel libro di Chomsky "Aspects of the Theory of Syntax". In questo modello, per la prima volta, sono state introdotte regole di interpretazione semantica nella teoria formale, attribuendo significato a strutture profonde. In Aspects, la competenza linguistica è contrapposta all'uso del linguaggio (prestazione), viene adottata la cosiddetta ipotesi di Katz-Postal sulla conservazione del significato durante la trasformazione, in relazione alla quale viene escluso il concetto di trasformazione facoltativa, e un apparato di vengono introdotte caratteristiche sintattiche che descrivono la compatibilità lessicale.

Negli anni '70, Chomsky ha lavorato alla teoria della governance e del legame (teoria GB - dalle parole governo e legame) - più generale della precedente. In esso, lo scienziato ha abbandonato le regole specifiche che descrivono le strutture sintattiche di lingue specifiche. Tutte le trasformazioni sono state sostituite con una trasformazione di movimento universale. Nell'ambito della teoria GB, ci sono anche moduli privati, ognuno dei quali è responsabile della propria parte della grammatica.

Già di recente, nel 1995, Chomsky ha presentato un programma minimalista, in cui il linguaggio umano è descritto come il linguaggio macchina. È solo un programma, non un modello o una teoria. In esso, Chomsky identifica due sottosistemi principali dell'apparato linguistico umano: il lessico e il sistema informatico, nonché due interfacce: fonetica e logica.

Le grammatiche formali di Chomsky sono diventate classiche per descrivere non solo i linguaggi naturali ma anche quelli artificiali, in particolare i linguaggi di programmazione. Lo sviluppo della linguistica strutturale nella seconda metà del XX secolo può essere giustamente considerato una "rivoluzione chomskiana".

La Scuola fonologica di Mosca, i cui rappresentanti erano A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, ha utilizzato una teoria simile per studiare la fonetica. A poco a poco, i metodi "esatti" iniziano ad essere applicati non solo alla fonetica, ma anche alla sintassi. Sia i linguisti che i matematici, sia qui che all'estero, stanno iniziando a studiare la struttura della lingua. Negli anni '50 e '60 iniziò in URSS una nuova fase nell'interazione tra matematica e linguistica, associata allo sviluppo dei sistemi di traduzione automatica.

L'impulso per l'inizio di questi lavori nel nostro paese sono stati i primi sviluppi nel campo della traduzione automatica negli Stati Uniti (sebbene il primo dispositivo di traduzione meccanizzato di P.P. Smirnov-Troyansky sia stato inventato nell'URSS nel 1933, essendo primitivo, non si è diffuso). Nel 1947, A. Butt e D. Britten elaborarono un codice per la traduzione parola per parola usando un computer, un anno dopo R. Richens propose una regola per dividere le parole in radici e desinenze nella traduzione automatica. Quegli anni erano molto diversi da oggi. Si trattava di macchine molto grandi e costose che occupavano intere stanze e richiedevano un grande staff di ingegneri, operatori e programmatori per mantenerle. Fondamentalmente, questi computer venivano utilizzati per eseguire calcoli matematici per le esigenze delle istituzioni militari: il nuovo in matematica, fisica e tecnologia serviva, prima di tutto, agli affari militari. Nelle prime fasi, lo sviluppo del parlamentare era attivamente sostenuto dai militari, mentre (nelle condizioni della Guerra Fredda) si sviluppava la direzione russo-inglese negli Stati Uniti e la direzione anglo-russa nell'URSS.

Nel gennaio 1954, presso la Massachusetts Technical University, ebbe luogo il Georgetown Experiment, la prima dimostrazione pubblica di traduzione dal russo all'inglese sulla macchina IBM-701. Estratto del messaggio sul passaggio riuscito dell'esperimento, realizzato da D.Yu. Panov, apparso in RJ "Mathematics", 1954, n. 10: "Traduzione da una lingua all'altra usando una macchina: un rapporto sul primo test riuscito".

D. Yu Panov (a quel tempo direttore dell'Istituto di informazione scientifica - INI, poi VINITI) ha coinvolto I. K. Belskaya, che in seguito ha diretto il gruppo di traduzione automatica presso l'Istituto di matematica precisa e ingegneria informatica dell'Accademia delle scienze dell'URSS, per lavorare sulla traduzione automatica. Alla fine del 1955 risale la prima esperienza di traduzione dall'inglese al russo con l'ausilio della macchina BESM. I programmi per BESM sono stati compilati da N.P. Trifonov e L.N. Korolev, la cui tesi di dottorato era dedicata ai metodi per costruire dizionari per la traduzione automatica.

Parallelamente, il lavoro sulla traduzione automatica è stato svolto presso il Dipartimento di matematica applicata dell'Istituto di matematica dell'Accademia delle scienze dell'URSS (ora M.V. Keldysh Institute of Applied Mathematics dell'Accademia delle scienze russa). Su iniziativa del matematico A.A. Lyapunov. Ha coinvolto O.S. Kulagin e i suoi studenti T.D. Wentzel e N.N. Ricco. Le idee di Lyapunov e Kulagina sulla possibilità di utilizzare la tecnologia per tradurre da una lingua all'altra sono state pubblicate sulla rivista Nature, 1955, n. 8. Dalla fine del 1955, T.N. Moloshnaya, che ha poi iniziato a lavorare in modo indipendente sull'algoritmo di traduzione inglese-russo.

R. Frumkina, che a quel tempo era impegnato nell'algoritmo di traduzione dallo spagnolo, ricorda che in questa fase del lavoro era difficile compiere passi coerenti. Molto più spesso ho dovuto seguire l'esperienza euristica, la mia o quella dei colleghi.

Tuttavia, la prima generazione di sistemi di traduzione automatica era molto imperfetta. Tutti erano basati su algoritmi di traduzione sequenziale "parola per parola", "frase per frase" - le connessioni semantiche tra parole e frasi non sono state prese in considerazione in alcun modo. Ad esempio, possiamo citare le frasi: “Giovanni cercava la sua scatola dei giocattoli. Finalmente l'ha trovato. La scatola era nella penna. Giovanni era molto felice. (John stava cercando la sua scatola dei giocattoli. Alla fine l'ha trovata. La scatola era nel box. John era molto felice.). "Penna" in questo contesto non è una "penna" (strumento di scrittura), ma una "penna" (penna da gioco). La conoscenza di sinonimi, contrari e significati figurativi è difficile da inserire in un computer. Una direzione promettente era lo sviluppo di sistemi informatici incentrati sull'uso di un traduttore umano.

Nel tempo, i sistemi di traduzione diretta sono stati sostituiti dai sistemi T (dalla parola inglese "transfer" - trasformazione), in cui la traduzione è stata effettuata a livello di strutture sintattiche. Gli algoritmi dei sistemi T hanno utilizzato un meccanismo che ha permesso di costruire una struttura sintattica secondo le regole grammaticali della lingua della frase in ingresso (simile a come viene insegnata una lingua straniera al liceo), e quindi sintetizzare la frase in uscita trasformando la struttura sintattica e sostituendo le parole necessarie dal dizionario.

Lyapunov ha parlato di traduzione estraendo il significato del testo tradotto e presentandolo in un'altra lingua. L'approccio alla costruzione di sistemi di traduzione automatica basati sull'ottenimento della rappresentazione semantica della frase di input mediante analisi semantica e sintesi della frase di input in base alla rappresentazione semantica ottenuta è ancora considerato il più perfetto. Tali sistemi sono chiamati sistemi I (dalla parola "interlingua"). Tuttavia, il compito di crearli, arretrato tra la fine degli anni '50 e l'inizio degli anni '60, non è stato finora completamente risolto, nonostante gli sforzi della Federazione internazionale dell'IFIP, la comunità mondiale degli scienziati nel campo dell'elaborazione delle informazioni.

Gli scienziati hanno pensato a come formalizzare e costruire algoritmi per lavorare con i testi, quali dizionari dovrebbero essere inseriti nella macchina, quali schemi linguistici dovrebbero essere usati nella traduzione automatica. La linguistica tradizionale non aveva tali idee, non solo in termini di semantica, ma anche in termini di sintassi. A quel tempo non esistevano elenchi di costruzioni sintattiche per nessuna lingua, le condizioni per la loro compatibilità e intercambiabilità non erano state studiate, le regole per costruire grandi unità di struttura sintattica da elementi costitutivi più piccoli non erano state sviluppate.

La necessità di creare le basi teoriche della traduzione automatica ha portato alla formazione e allo sviluppo della linguistica matematica. Il ruolo principale in questa materia in URSS è stato svolto dai matematici A.A. Lyapunov, O.S. Kulagina, VA Uspensky, linguisti V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. La dissertazione di Kulagina era dedicata allo studio della teoria formale delle grammatiche (contemporaneamente a N. Khomsky negli Stati Uniti), Kuznetsov proponeva il compito dell'assiomatizzazione della linguistica, che risale alle opere di F.F. Fortunatov.

Il 6 maggio 1960 fu adottato il decreto del Presidio dell'Accademia delle scienze dell'URSS "Sullo sviluppo di metodi strutturali e matematici per lo studio del linguaggio" e furono create le corrispondenti divisioni presso l'Istituto di linguistica e l'Istituto di la lingua russa. Dal 1960, nelle principali università umanitarie del paese - la facoltà di filologia dell'Università statale di Mosca, Leninrad, le università di Novosibirsk, l'Istituto statale di lingue straniere di Mosca - ha iniziato la formazione nel campo dell'elaborazione automatica del testo.

Tuttavia, le opere di traduzione automatica di questo periodo, chiamate "classiche", sono di interesse teorico piuttosto che pratico. I sistemi di traduzione automatica convenienti iniziarono a essere creati solo negli anni ottanta del secolo scorso. Ne parlerò più avanti nella Sezione 2.1, Traduzione automatica.

Gli anni '60 e '70 includono profondi sviluppi teorici utilizzando i metodi della teoria degli insiemi e della logica matematica, come la teoria dei campi e la teoria degli insiemi fuzzy.

L'autore della teoria del campo in linguistica era il poeta, traduttore e linguista sovietico V.G. Ammoni. Inizialmente ha sviluppato la sua teoria sulla base della lingua tedesca. Per Admoni, il concetto di "campo" denota un insieme arbitrario non vuoto di elementi linguistici (ad esempio, "campo lessicale", "campo semantico").

La struttura del campo è eterogenea: è costituita da un nucleo, i cui elementi hanno un insieme completo di caratteristiche che definiscono un insieme, e una periferia, i cui elementi possono avere entrambe le caratteristiche di un dato insieme (non tutto) e quelli limitrofi. Darò un esempio che illustra questa affermazione: ad esempio, in inglese, il campo delle parole composte ("sogno ad occhi aperti" - "sogno" è difficile da separare dal campo delle frasi ("gas lacrimogeno" - "gas lacrimogeno") .

La teoria degli insiemi fuzzy già menzionata sopra è strettamente correlata alla teoria dei campi. In URSS, i linguisti V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, tuttavia, il suo antenato era il matematico americano L. Zadeh, che nel 1965 pubblicò l'articolo "Fuzzy Logic". Fornendo una giustificazione matematica alla teoria degli insiemi fuzzy, Zade li considerò sulla base del materiale linguistico.

In questa teoria, non stiamo parlando tanto dell'appartenenza di elementi a un dato insieme (АОа), quanto del grado di questa appartenenza (mАОа), poiché gli elementi periferici possono appartenere a più campi in un grado o nell'altro. Zade (Lofti-zade) era originario dell'Azerbaigian, fino all'età di 12 anni aveva la pratica di comunicare in quattro lingue - azero, russo, inglese e persiano - e usava tre diversi alfabeti: cirillico, latino, arabo. Quando a uno scienziato viene chiesto cosa c'è in comune tra la teoria degli insiemi fuzzy e la linguistica, non nega questa connessione, ma chiarisce: “Non sono sicuro che lo studio di queste lingue abbia avuto una grande influenza sul mio pensiero. Se così fosse, allora solo inconsciamente. In gioventù, Zadeh ha studiato in una scuola presbiteriana a Teheran e dopo la seconda guerra mondiale è emigrato negli Stati Uniti. "La domanda non è se sono americano, russo, azero o altro", ha detto.

Abstract simili:

Lingua e parola come uno dei problemi fondamentali della stilistica. Il concetto di fonema e livello fonologico. Il concetto di lingua come sistema ei livelli del sistema linguistico. Il concetto di morfemi e loro tipi. Una frase come unità sintattica di un testo. Segni del sistema linguistico.


Superiore