Sejarah penerapan metode matematika dalam linguistik. Refleksi pada interaksi linguistik dan matematika

Pembentukan Linguistik Struktural pada Pergantian Abad 19-20. Metode statistik dalam pembelajaran bahasa. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh. Mempelajari bahasa dengan metode logika formal. Fitur terjemahan mesin.

PERKENALAN

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Pembentukan Linguistik Struktural pada Pergantian Abad 19 - 20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinan de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

PERKENALAN

Pada abad ke-20, telah terjadi kecenderungan yang berkelanjutan terhadap interaksi dan interpenetrasi berbagai bidang ilmu pengetahuan. Batas-batas antara ilmu-ilmu individual secara bertahap kabur; semakin banyak cabang aktivitas mental yang "berada di persimpangan" pengetahuan kemanusiaan, teknis, dan ilmu alam.

Ciri lain yang jelas dari modernitas adalah keinginan untuk mempelajari struktur dan elemen penyusunnya. Oleh karena itu, semakin banyak tempat, baik dalam teori ilmiah maupun dalam praktik, diberikan kepada matematika. Bersentuhan, di satu sisi, dengan logika dan filsafat, di sisi lain, dengan statistik (dan, akibatnya, dengan ilmu sosial), matematika menembus semakin dalam ke bidang-bidang yang sejak lama dianggap murni. "kemanusiaan", memperluas potensi heuristik mereka (jawaban atas pertanyaan "berapa banyak" akan sering membantu menjawab pertanyaan "apa" dan "bagaimana"). Linguistik tidak terkecuali.

Tujuan dari kursus saya adalah untuk menyoroti secara singkat hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat alat teoretis untuk mendeskripsikan struktur bahasa (baik alami maupun buatan). Pada saat yang sama, harus dikatakan bahwa itu tidak segera menemukan aplikasi praktis untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan penerapannya dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan bahasa yang baru secara fundamental. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar merepresentasikan pola linguistik dalam bentuk yang dapat diterapkan langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, merujuk pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan beberapa tahun terakhir percaya bahwa ungkapan itu sendiri tidak dapat diangkat ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa. . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka di awal abad ke-20 (saya akan menceritakan tentang pengaruhnya terhadap perkembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan kepemilikannya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang memiliki banyak segi, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab ISejarah penerapan metode matematika dalam linguistik

1.1 Pembentukan linguistik strukturalpada pergantian abad XIX - XX

Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss terkenal di awal abad ke-20, Ferdinand de Saussure.

Tautan awal konsepnya adalah teori bahasa sebagai suatu sistem yang terdiri dari tiga bagian (bahasa itu sendiri adalah bahasa, pidato - kata sandi, dan aktivitas bicara - bahasa), di mana setiap kata (anggota sistem) dianggap tidak dengan sendirinya, tetapi dalam kaitannya dengan anggota lainnya. Sebagai ahli bahasa terkemuka lainnya, Dane Louis Hjelmslev, kemudian mencatat, Saussure "adalah orang pertama yang menuntut pendekatan struktural terhadap bahasa, yaitu deskripsi ilmiah bahasa dengan merekam hubungan antar unit."

Memahami bahasa sebagai struktur hierarkis, Saussure adalah orang pertama yang mengajukan masalah nilai dan pentingnya unit linguistik. Fenomena dan peristiwa terpisah (katakanlah, sejarah asal mula kata-kata Indo-Eropa individu) harus dipelajari bukan dengan sendirinya, tetapi dalam suatu sistem yang berkorelasi dengan komponen serupa.

Unit struktural bahasa Saussure menganggap kata, "tanda", di mana bunyi dan makna digabungkan. Tak satu pun dari elemen-elemen ini ada tanpa satu sama lain: oleh karena itu, penutur asli memahami berbagai corak makna kata polisemantik sebagai elemen terpisah dalam keseluruhan struktural, dalam bahasa.

Jadi, dalam teori F. de Saussure orang dapat melihat interaksi linguistik, di satu sisi, dengan sosiologi dan psikologi sosial (perlu dicatat bahwa pada saat yang sama fenomenologi Husserl, psikoanalisis Freud, teori relativitas Einstein sedang berkembang. , percobaan terjadi pada bentuk dan konten dalam sastra, musik dan seni rupa), di sisi lain, dengan matematika (konsep sistemikitas sesuai dengan konsep aljabar bahasa). Konsep seperti itu mengubah konsep interpretasi linguistik seperti itu: Fenomena mulai ditafsirkan bukan dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan masa kini dan masa depan. Interpretasi tidak lagi terlepas dari niat seseorang (terlepas dari kenyataan bahwa niat mungkin impersonal, "tidak sadar" dalam arti kata Freudian).

Fungsi mekanisme linguistik dimanifestasikan melalui aktivitas bicara penutur asli. Hasil ucapan adalah apa yang disebut "teks yang benar" - urutan unit ucapan yang mengikuti pola tertentu, banyak di antaranya memungkinkan deskripsi matematis. Teori cara mendeskripsikan struktur sintaksis berkaitan dengan studi tentang metode deskripsi matematis dari teks yang benar (terutama kalimat). Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Di Barat, ide-ide Saussure dikembangkan oleh orang-orang muda sezaman dari ahli bahasa Swiss yang hebat: di Denmark - L. Hjelmslev, yang telah saya sebutkan, yang memunculkan teori bahasa aljabar dalam karyanya "Fundamentals of Linguistic Theory", di AS - E. Sapir, L. Bloomfield, C. Harris, di Republik Ceko - ilmuwan emigran Rusia N. Trubetskoy.

Keteraturan statistik dalam studi bahasa mulai ditangani tidak lain oleh pendiri genetika, Georg Mendel. Baru pada tahun 1968 para ahli filologi menemukan bahwa, pada tahun-tahun terakhir hidupnya, dia terpesona oleh studi fenomena linguistik dengan menggunakan metode matematika. Mendel membawa metode ini ke linguistik dari biologi; pada 1990-an, hanya ahli bahasa dan biologi paling berani yang mengklaim kelayakan analisis semacam itu. Di arsip biara St. Tomasz di Brno, yang kepala biaranya adalah Mendel, ditemukan lembaran dengan kolom nama belakang yang diakhiri dengan "mann", "bauer", "mayer", dan dengan beberapa pecahan dan perhitungan. Dalam upaya untuk menemukan hukum formal asal usul nama keluarga, Mendel membuat perhitungan yang rumit, di mana ia memperhitungkan jumlah vokal dan konsonan dalam bahasa Jerman, jumlah kata yang dianggapnya, jumlah nama keluarga, dll.

Di negara kita, linguistik struktural mulai berkembang pada waktu yang hampir bersamaan dengan di Barat - pada pergantian abad ke-19 hingga ke-20. Bersamaan dengan F. de Saussure, konsep bahasa sebagai suatu sistem dikembangkan dalam karyanya oleh profesor Universitas Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berkorespondensi untuk waktu yang lama dengan de Saussure, masing-masing, sekolah linguistik Jenewa dan Kazan berkolaborasi satu sama lain. Jika Saussure dapat disebut sebagai ideolog metode "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan dasar praktis untuk penerapannya. Dia adalah orang pertama yang memisahkan linguistik (seperti tepat ilmu yang menggunakan metode statistik dan ketergantungan fungsional) dari filologi (komunitas disiplin kemanusiaan yang mempelajari budaya spiritual melalui bahasa dan ucapan). Ilmuwan itu sendiri percaya bahwa "linguistik dapat berguna dalam waktu dekat, hanya dibebaskan dari persatuan wajib dengan filologi dan sejarah sastra" . Fonologi menjadi "tempat pengujian" untuk pengenalan metode matematika ke dalam linguistik - terdengar sebagai "atom" dari sistem bahasa, yang memiliki sejumlah sifat yang mudah diukur, adalah bahan yang paling nyaman untuk metode deskripsi yang formal dan ketat. Fonologi menyangkal keberadaan makna dalam bunyi, sehingga faktor "manusia" dihilangkan dalam kajian. Dalam pengertian ini, fonem seperti objek fisik atau biologis.

Fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili bidang yang terpisah, "realitas fenomenologis" yang terpisah. Misalnya, dalam bahasa Inggris, bunyi "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, orang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Hal utama adalah bahwa fonem akan menjalankan fungsi utamanya - bermakna -. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi satu bunyi dalam satu bahasa dapat sesuai dengan fonem yang berbeda di bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain keduanya adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan atau tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah sekumpulan kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi bahasa adalah seperangkat fitur yang diatur secara sistematis. Pada 1920-an -1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur alat bicara - lidah, gigi, pita suara. Misalnya, dalam bahasa Inggris perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara) dan tingkat suara yang membedakan satu fonem dari fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa". Yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa syarat yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Jadi, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai sekumpulan perbandingan dan pertentangan bahasa. Bahasa adalah ekspresi makna kata dan alat komunikasi, dan kedua fungsi ini tidak pernah bersamaan. Kita dapat melihat pergantian bentuk dan isi: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Artinya dalam suatu bahasa, ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem, morfem - menjadi kata, kata - menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari sekedar penjumlahan dari bagian-bagiannya.

Saussure mengusulkan gagasan ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari peran tanda dalam masyarakat. Saussure menyebut sains ini semiologi (dari bahasa Yunani "semeion" - tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada tahun 1920-an dan 1930-an dan di Paris pada tahun 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan-temuan sastra yang disusun (atau diartikulasikan) dalam kerangka struktur-struktur ini. Selain itu, di masa senja karirnya, sejalan dengan kursusnya di bidang linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini adalah upaya untuk mempelajari masalah "probabilitas" dalam bahasa dalam suatu sistem. Penelitian semacam itu membantu memusatkan perhatian pada "sisi nyata" dari probabilitas; "kata kunci" yang dicari anagramnya oleh Saussure, menurut Jean Starobinsky, "alat bagi penyair, bukan sumber kehidupan puisi." Puisi itu berfungsi untuk menukar bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, terlihat keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran: “karena puisi diekspresikan tidak hanya dengan kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa” (lihat . Lampiran 1).

Upaya Saussure untuk mempelajari nama yang tepat dalam puisi Romawi akhir menekankan salah satu komponen analisis linguistiknya - sifat tanda yang sewenang-wenang, serta esensi formal linguistik Saussure, yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa saat ini karya-karya Saussure tampaknya sangat konsisten dalam keengganannya untuk mempelajari simbol-simbol fenomena yang memiliki makna yang jelas [Lampiran 1]. Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, dia mendefinisikan simbol hanya untuk menetapkannya ke pembacaan yang salah: jika tidak disengaja, simbol itu tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang tidak hanya menggambarkan tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semiologi hanya dapat menjelaskan tanda-tanda yang acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak dapat membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya hal ini berubah menjadi sebuah pertanyaan. Sebaliknya, dia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas berdasarkan sejarah dan dugaan subjektif, dan metode interpretasi acak berdasarkan konsep ini, dan, di sisi lain, konsep strukturalis yang menghapus pertentangan antara bentuk dan isi (subjek dan objek), makna dan asal usul dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum - tulisan Ferdinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi tentang makna dalam bahasa dan budaya.

Ilmuwan Rusia juga diwakili di Kongres Ahli Bahasa Internasional Pertama di Den Haag pada tahun 1928. S. Kartsevsky, R. Yakobson, dan N. Trubetskoy membuat laporan yang meneliti struktur hierarki bahasa - dalam semangat gagasan paling modern di awal abad terakhir. Jakobson dalam tulisannya mengembangkan gagasan Saussure bahwa unsur-unsur dasar suatu bahasa harus dipelajari, pertama-tama, sehubungan dengan fungsinya, dan bukan dengan alasan kemunculannya.

Sayangnya, setelah Stalin berkuasa pada tahun 1924, linguistik Rusia, seperti banyak ilmu lainnya, terlempar kembali. Banyak ilmuwan berbakat terpaksa beremigrasi, diusir dari negara atau meninggal di kamp. Hanya sejak pertengahan 1950-an pluralisme teori tertentu menjadi mungkin - lebih lanjut tentang ini di Bagian 1.2.

1.2 Penerapan metode matematika dalam linguistik pada paruh kedua abad ke-20

Pada pertengahan abad ke-20, empat aliran linguistik dunia telah terbentuk, yang masing-masing ternyata merupakan nenek moyang dari metode "tepat" tertentu. Sekolah Fonologi Leningrad(nenek moyangnya adalah murid Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis tuturan penutur asli sebagai kriteria utama untuk menggeneralisasi bunyi dalam bentuk fonem.

Ilmuwan Lingkaran Linguistik Praha, khususnya - pendirinya N.S. Trubetskoy, yang beremigrasi dari Rusia, mengembangkan teori oposisi - struktur semantik bahasa tersebut dijelaskan oleh mereka sebagai sekumpulan unit semantik yang dibangun secara berlawanan - Sem. Teori ini diterapkan dalam studi tidak hanya bahasa, tetapi juga budaya artistik.

Ideolog deskriptivisme Amerika adalah ahli bahasa L. Bloomfield dan E. Sapir. Bahasa disajikan kepada para deskriptivis sebagai seperangkat pernyataan ucapan, yang merupakan objek utama studi mereka. Fokus mereka adalah pada aturan deskripsi ilmiah (karena itu namanya) teks: studi tentang organisasi, pengaturan, dan klasifikasi elemen-elemennya. Formalisasi prosedur analitik di bidang fonologi dan morfologi (pengembangan prinsip-prinsip untuk mempelajari bahasa pada tingkat yang berbeda, analisis distributif, metode konstituen langsung, dll.) Mengarah pada perumusan pertanyaan umum pemodelan linguistik. Kurangnya perhatian terhadap rencana isi bahasa, serta sisi paradigmatik bahasa, tidak memungkinkan para deskriptivis untuk menafsirkan bahasa sebagai suatu sistem dengan cukup lengkap.

Pada 1960-an, teori tata bahasa formal berkembang, yang muncul terutama karena karya filsuf dan ahli bahasa Amerika N. Chomsky. Dia dianggap sebagai salah satu ilmuwan dan tokoh masyarakat modern paling terkenal, banyak artikel, monograf, dan bahkan film dokumenter berdurasi penuh dikhususkan untuknya. Dengan nama cara yang secara fundamental baru untuk mendeskripsikan struktur sintaksis yang ditemukan oleh Chomsky - tata bahasa generatif (menghasilkan) - tren yang sesuai dalam linguistik disebut generativisme.

Chomsky, seorang keturunan imigran dari Rusia, belajar linguistik, matematika dan filsafat di University of Pennsylvania sejak 1945, sangat dipengaruhi oleh gurunya Zelig Harris - seperti Harris, Chomsky menganggap dan masih menganggap pandangan politiknya dekat dengan anarkisme (dia masih dikenal sebagai pengkritik sistem politik AS yang ada dan sebagai salah satu pemimpin spiritual anti-globalisme).

Karya ilmiah besar pertama Chomsky, tesis master "Morphology of Modern Hebrew » (1951) tetap tidak dipublikasikan. Chomsky menerima gelar doktor dari University of Pennsylvania pada tahun 1955, tetapi banyak penelitian mendasari disertasinya (diterbitkan secara penuh hanya pada tahun 1975 dengan judul The Logical Structure of Linguistic Theory) dan monograf pertamanya, Syntactic Structures (1957, Rus. trans .1962), dilakukan di Universitas Harvard pada tahun 1951-1955. Pada tahun 1955 yang sama, ilmuwan tersebut pindah ke Massachusetts Institute of Technology, di mana ia menjadi profesor pada tahun 1962.

Teori Chomsky telah melalui beberapa tahapan dalam perkembangannya.

Dalam monograf pertama "Syntactic Structures", ilmuwan menampilkan bahasa sebagai mekanisme untuk menghasilkan rangkaian kalimat yang tak terbatas menggunakan seperangkat sarana tata bahasa yang terbatas. Untuk mendeskripsikan sifat linguistik, ia mengusulkan konsep struktur tata bahasa yang dalam (tersembunyi dari persepsi langsung dan dihasilkan oleh sistem rekursif, yaitu, dapat diterapkan berulang kali, aturan) dan permukaan (dipersepsikan langsung), serta transformasi yang menggambarkan transisi. dari struktur dalam ke struktur permukaan. Beberapa struktur permukaan dapat berhubungan dengan satu struktur dalam (misalnya, struktur pasif Keputusan tersebut ditandatangani oleh Presiden berasal dari Deep Structure yang sama dengan konstruksi aktif Presiden menandatangani keputusan tersebut) dan sebaliknya (dengan demikian, ambiguitas ibu mencintai anak perempuan digambarkan sebagai hasil dari kebetulan struktur permukaan yang kembali ke dua kedalaman yang berbeda, di mana ibu adalah orang yang mencintai anak perempuan, dan yang lain, orang yang dicintai oleh anak perempuan).

Teori standar Chomsky dianggap sebagai model "Aspek" yang ditetapkan dalam buku Chomsky "Aspek Teori Sintaks". Dalam model ini, untuk pertama kalinya, aturan interpretasi semantik diperkenalkan ke dalam teori formal, menghubungkan makna dengan struktur yang dalam. Dalam Aspek, kompetensi linguistik bertentangan dengan penggunaan bahasa (kinerja), yang disebut hipotesis Katz-Postal tentang pelestarian makna selama transformasi diadopsi, sehubungan dengan konsep transformasi opsional yang dikecualikan, dan aparatur fitur sintaksis yang menjelaskan kompatibilitas leksikal diperkenalkan.

Pada tahun 1970-an, Chomsky mengerjakan teori kontrol dan pengikatan (GB-theory - dari kata pemerintah Dan mengikat) lebih umum dari yang sebelumnya. Di dalamnya, ilmuwan meninggalkan aturan khusus yang menggambarkan struktur sintaksis bahasa tertentu. Semua transformasi telah diganti dengan satu transformasi gerakan universal. Dalam kerangka teori GB, ada juga modul pribadi, yang masing-masing bertanggung jawab atas bagian tata bahasanya sendiri.

Baru-baru ini, pada tahun 1995, Chomsky mengajukan program minimalis, di mana bahasa manusia digambarkan seperti bahasa mesin. Ini hanyalah sebuah program - bukan model atau teori. Di dalamnya, Chomsky mengidentifikasi dua subsistem utama dari perangkat bahasa manusia: leksikon dan sistem komputasi, serta dua antarmuka - fonetis dan logis.

Tata bahasa formal Chomsky telah menjadi klasik untuk mendeskripsikan tidak hanya bahasa alami tetapi juga bahasa buatan - khususnya bahasa pemrograman. Perkembangan linguistik struktural pada paruh kedua abad ke-20 dapat dianggap sebagai "revolusi Chomskian".

Sekolah Fonologi Moskow, yang perwakilannya adalah A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, menggunakan teori serupa untuk mempelajari fonetik. Secara bertahap, metode "tepat" mulai diterapkan tidak hanya pada fonetik, tetapi juga pada sintaksis. Baik ahli bahasa maupun ahli matematika, baik di sini maupun di luar negeri, mulai mempelajari struktur bahasa. Pada 1950-an dan 60-an, tahap baru interaksi antara matematika dan linguistik dimulai di Uni Soviet, terkait dengan pengembangan sistem terjemahan mesin.

Dorongan untuk dimulainya karya-karya ini di negara kita adalah perkembangan pertama di bidang terjemahan mesin di Amerika Serikat (meskipun perangkat terjemahan mekanis pertama oleh P.P. Smirnov-Troyansky ditemukan di Uni Soviet pada tahun 1933, karena primitif, tidak meluas). Pada tahun 1947, A. Butt dan D. Britten menemukan kode untuk terjemahan kata demi kata menggunakan komputer, setahun kemudian, R. Richens mengusulkan aturan untuk membagi kata menjadi batang dan akhiran dalam terjemahan mesin. Tahun-tahun itu sangat berbeda dengan hari ini. Ini adalah mesin yang sangat besar dan mahal yang menempati seluruh ruangan dan membutuhkan banyak staf insinyur, operator, dan pemrogram untuk memeliharanya. Pada dasarnya, komputer ini digunakan untuk melakukan kalkulasi matematis untuk kebutuhan institusi militer - yang baru dalam matematika, fisika, dan teknologi melayani, pertama-tama, urusan militer. Pada tahap awal, pengembangan MP didukung secara aktif oleh militer, dengan semua ini (dalam kondisi Perang Dingin), arah Rusia-Inggris berkembang di AS, dan arah Anglo-Rusia di Uni Soviet.

Pada bulan Januari 1954, "Eksperimen Georgetown" berlangsung di Massachusetts Technical University - demonstrasi publik pertama tentang terjemahan dari bahasa Rusia ke bahasa Inggris pada mesin IBM-701. Abstrak pesan tentang keberhasilan percobaan, dibuat oleh D.Yu. Panov, muncul di RJ "Mathematics", 1954, No. 10: "Translation from one language to another using a machine: a report on the first success test."

D. Yu. Panov (pada waktu itu direktur Institut Informasi Ilmiah - INI, kemudian VINITI) menarik I. K. Belskaya, yang kemudian mengepalai kelompok terjemahan mesin di Institut Matematika Precise dan Teknik Komputer Akademi Ilmu Pengetahuan Uni Soviet, untuk mengerjakan terjemahan mesin. Pada akhir tahun 1955, pengalaman pertama menerjemahkan dari bahasa Inggris ke bahasa Rusia dengan bantuan mesin BESM sudah ada sejak lama. Program untuk BESM disusun oleh N.P. Trifonov dan L.N. Korolev, yang tesis Ph.D.-nya dikhususkan untuk metode menyusun kamus untuk terjemahan mesin.

Secara paralel, pekerjaan terjemahan mesin dilakukan di Departemen Matematika Terapan Institut Matematika Akademi Ilmu Pengetahuan Uni Soviet (sekarang Institut Matematika Terapan M.V. Keldysh dari Akademi Ilmu Pengetahuan Rusia). Atas prakarsa ahli matematika A.A. Lyapunov. Dia melibatkan O.S. Kulagin dan murid-muridnya T.D. Wenzel dan N.N. Ricco. Gagasan Lyapunov dan Kulagina tentang kemungkinan menggunakan teknologi untuk menerjemahkan dari satu bahasa ke bahasa lain diterbitkan dalam jurnal Nature, 1955, No. 8. Sejak akhir tahun 1955, T.N. Moloshnaya, yang kemudian memulai pekerjaan mandiri pada algoritme terjemahan Inggris-Rusia.

R. Frumkina, yang saat itu terlibat dalam algoritme terjemahan dari bahasa Spanyol, mengenang bahwa pada tahap pekerjaan ini sulit untuk mengambil langkah yang konsisten. Jauh lebih sering saya harus mengikuti pengalaman heuristik - pengalaman saya sendiri atau rekan kerja.

Pada saat yang sama, sistem terjemahan mesin generasi pertama sangat tidak sempurna. Semuanya didasarkan pada algoritme terjemahan berurutan "kata demi kata", "frasa demi frasa" - koneksi semantik antara kata dan kalimat tidak diperhitungkan sama sekali. Misalnya kalimatnya adalah: John sedang mencari kotak mainannya.Akhirnya dia menemukannya. Kotak itu ada di dalam pena.Yohanes sangat senang. (John sedang mencari kotak mainannya. Akhirnya ia menemukannya. Kotak itu ada di dalam playpen. John sangat senang.).” "Pena" dalam konteks ini bukanlah "pena" (alat tulis), melainkan "playpen" ( boks). Pengetahuan tentang sinonim, antonim, dan makna kiasan sulit untuk dimasukkan ke dalam komputer. Arah yang menjanjikan adalah pengembangan sistem komputer yang berfokus pada penggunaan penerjemah manusia.

Seiring waktu, sistem terjemahan langsung digantikan oleh sistem-T (dari kata bahasa Inggris "transfer" - transformasi), di mana terjemahan dilakukan pada tingkat struktur sintaksis. Algoritma sistem-T menggunakan mekanisme yang memungkinkan untuk membangun struktur sintaksis sesuai dengan aturan tata bahasa kalimat masukan (mirip dengan bagaimana bahasa asing diajarkan di sekolah menengah), dan kemudian mensintesis kalimat keluaran dengan mengubah struktur sintaksis dan mengganti kata-kata yang diperlukan dari kamus.

Lyapunov berbicara tentang penerjemahan dengan mengekstraksi makna teks terjemahan dan menyajikannya dalam bahasa lain. Pendekatan untuk membangun sistem terjemahan mesin berdasarkan perolehan representasi semantik dari kalimat input dengan analisis semantik dan sintesis kalimat input sesuai dengan representasi semantik yang diperoleh masih dianggap paling sempurna. Sistem seperti itu disebut sistem-I (dari kata "interlingua"). Pada saat yang sama, tugas untuk membuatnya, yang dimulai pada akhir 50-an dan awal 60-an, sejauh ini belum sepenuhnya terselesaikan, terlepas dari upaya Federasi Internasional IFIP - komunitas ilmuwan dunia di bidang pemrosesan informasi .

Para ilmuwan berpikir tentang bagaimana memformalkan dan membangun algoritme untuk bekerja dengan teks, kamus apa yang harus dimasukkan ke dalam mesin, pola linguistik apa yang harus digunakan dalam terjemahan mesin. Linguistik tradisional tidak memiliki gagasan seperti itu - tidak hanya dari segi semantik, tetapi juga dari segi sintaksis. Pada saat itu, tidak ada daftar konstruksi sintaksis untuk bahasa apa pun, kondisi kompatibilitas dan pertukarannya tidak dipelajari, aturan untuk membangun unit besar struktur sintaksis dari elemen penyusun yang lebih kecil tidak dikembangkan.

Kebutuhan untuk menciptakan landasan teoretis terjemahan mesin mengarah pada pembentukan dan pengembangan linguistik matematika. Peran utama dalam hal ini di Uni Soviet dimainkan oleh matematikawan A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, ahli bahasa V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Disertasi Kulagina dikhususkan untuk studi teori tata bahasa formal (bersamaan dengan N. Khomsky di AS), Kuznetsov mengedepankan tugas aksiomatisasi linguistik, yang kembali ke karya F.F. Fortunatov.

Pada tanggal 6 Mei 1960, Keputusan Presidium Akademi Ilmu Pengetahuan Uni Soviet "Tentang pengembangan metode struktural dan matematika untuk mempelajari bahasa" diadopsi, dan divisi yang sesuai dibuat di Institut Linguistik dan Institut Bahasa. Bahasa Rusia. Sejak 1960, universitas kemanusiaan terkemuka di negara itu - Fakultas Filologi Universitas Negeri Moskow, Leninrad, Universitas Novosibirsk, Institut Bahasa Asing Negeri Moskow - mulai melatih personel di bidang pemrosesan teks otomatis.

Pada saat yang sama, karya terjemahan mesin pada periode ini, yang disebut "klasik", lebih bersifat teoretis daripada kepentingan praktis. Sistem terjemahan mesin yang hemat biaya mulai dibuat hanya pada tahun delapan puluhan abad yang lalu. Saya akan membicarakannya nanti di Bagian 2.1, Terjemahan Mesin.

Tahun 1960-an - 70-an termasuk perkembangan teori yang mendalam dengan menggunakan metode teori himpunan dan logika matematika, seperti teori medan dan teori himpunan fuzzy.

Penulis teori lapangan dalam linguistik adalah penyair, penerjemah, dan ahli bahasa Soviet V.G. Nasihat. Dia awalnya mengembangkan teorinya berdasarkan bahasa Jerman. Bagi Admoni, konsep "bidang" menunjukkan sekumpulan elemen linguistik yang tidak kosong (misalnya, "bidang leksikal", "bidang semantik").

Struktur bidangnya heterogen: terdiri dari inti, yang elemen-elemennya memiliki serangkaian fitur lengkap yang mendefinisikan suatu himpunan, dan pinggiran, elemen-elemen yang dapat memiliki kedua fitur dari himpunan tertentu (tidak semua) dan yang tetangga. Saya akan memberikan contoh yang mengilustrasikan pernyataan ini: misalnya, dalam bahasa Inggris, bidang kata majemuk ("day-dream" - "dream" sulit dipisahkan dari bidang frasa ("gas air mata" - "gas air mata") .

Teori himpunan fuzzy yang telah disebutkan di atas berkaitan erat dengan teori medan. Di Uni Soviet, ahli bahasa V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, bagaimanapun, leluhurnya adalah ahli matematika Amerika L. Zadeh, yang pada tahun 1965 menerbitkan artikel "Fuzzy Logic". Memberikan pembenaran matematis untuk teori himpunan fuzzy, Zade mempertimbangkannya berdasarkan materi linguistik.

Dalam teori ini, kita tidak berbicara banyak tentang kepemilikan elemen pada himpunan tertentu (Aa), tetapi tentang derajat keanggotaan ini (Aa), karena elemen periferal dapat menjadi bagian dari beberapa bidang pada satu derajat atau lainnya. Zade (Lofti-zade) adalah penduduk asli Azerbaijan, hingga usia 12 tahun ia memiliki kebiasaan berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggris, dan Persia - dan menggunakan tiga huruf berbeda: Sirilik, Latin, Arab. Ketika seorang ilmuwan ditanya apa kesamaan antara teori himpunan fuzzy dan linguistik, dia tidak menyangkal hubungan ini, tetapi mengklarifikasi: “Saya tidak yakin bahwa mempelajari bahasa-bahasa ini memiliki pengaruh besar pada pemikiran saya. Jika demikian, maka hanya secara tidak sadar. Di masa mudanya, Zadeh belajar di sekolah Presbiterian di Teheran, dan setelah Perang Dunia II dia beremigrasi ke Amerika Serikat. “Pertanyaannya bukanlah apakah saya orang Amerika, Rusia, Azerbaijan, atau orang lain,” katanya dalam salah satu percakapan, “Saya dibentuk oleh semua budaya dan bangsa ini dan merasa cukup nyaman di antara mereka masing-masing.” Dalam kata-kata ini ada sesuatu yang mirip dengan apa yang mencirikan teori himpunan fuzzy - penyimpangan dari definisi yang tidak ambigu dan kategori tajam.

Di negara kita, pada tahun 70-an, karya ahli bahasa Barat abad ke-20 diterjemahkan dan dipelajari. I.A. Melchuk menerjemahkan karya N. Chomsky ke dalam bahasa Rusia. DI ATAS. Slyusareva dalam bukunya "The Theory of F. de Saussure in the Light of Modern Linguistics" menghubungkan postulat ajaran Saussure dengan masalah linguistik aktual tahun 70-an. Ada kecenderungan matematisasi linguistik lebih lanjut. Universitas dalam negeri terkemuka melatih personel dalam "linguistik Matematika (teoretis, terapan)" khusus. Pada saat yang sama di Barat terjadi lompatan tajam dalam perkembangan teknologi komputer, yang membutuhkan landasan linguistik yang semakin banyak.

Pada 1980-an, Profesor Institut Studi Oriental dari Akademi Ilmu Pengetahuan Yu.K. Lekomtsev, saat menganalisis bahasa linguistik melalui analisis skema, tabel, dan jenis notasi lain yang digunakan dalam deskripsi linguistik, menganggap sistem matematika cocok untuk tujuan ini (terutama sistem aljabar matriks).

Jadi, sepanjang abad ke-20, terjadi konvergensi antara yang tepat dan humaniora. Interaksi matematika dengan linguistik semakin menemukan penerapan praktisnya. Lebih lanjut tentang ini di bab berikutnya.

Bab 2. Contoh penggunaan matematika dalam linguistik

2.1 Terjemahan mesin

Gagasan menerjemahkan dari satu bahasa ke bahasa lain dengan bantuan mekanisme universal muncul beberapa abad sebelum perkembangan pertama di bidang ini dimulai - pada tahun 1649, Rene Descartes mengusulkan gagasan bahasa di mana gagasan yang setara dari bahasa yang berbeda akan diungkapkan oleh satu simbol. Upaya pertama untuk mengimplementasikan ide ini pada tahun 1930-an-40-an, awal perkembangan teoretis pada pertengahan abad ini, peningkatan sistem terjemahan dengan bantuan teknologi pada tahun 1970-an-80-an, perkembangan pesat teknologi terjemahan pada tahun terakhir. dekade - ini adalah tahapan dalam pengembangan terjemahan mesin sebagai sebuah industri. Dari karya terjemahan mesin itulah linguistik komputer sebagai ilmu berkembang.

Dengan perkembangan teknologi komputer di akhir tahun 70-an dan awal 80-an, para peneliti menetapkan tujuan yang lebih realistis dan hemat biaya - mesin tidak menjadi pesaing (seperti yang diasumsikan sebelumnya), tetapi menjadi asisten penerjemah manusia. Terjemahan mesin tidak lagi melayani tugas-tugas militer secara eksklusif (semua penemuan dan penelitian Soviet dan Amerika, yang berfokus terutama pada bahasa Rusia dan Inggris, berkontribusi pada Perang Dingin dengan satu atau lain cara). Pada tahun 1978, kata-kata bahasa alami ditransmisikan melalui jaringan interkoneksi Arpa, dan enam tahun kemudian, program terjemahan komputer mikro pertama muncul di Amerika Serikat.

Pada tahun 70-an, Komisi Komunitas Eropa membeli penerjemah komputer Systran versi Inggris-Prancis, memesan juga versi Prancis-Inggris dan Italia-Inggris, dan sistem terjemahan Rusia-ke-Inggris yang digunakan oleh Angkatan Bersenjata AS. Beginilah fondasi proyek EUROTRA diletakkan.

Tentang kebangkitan terjemahan mesin di tahun 70-80an. fakta-fakta berikut bersaksi: Komisi Komunitas Eropa (CEC) membeli Systran versi Inggris-Prancis, serta sistem terjemahan dari bahasa Rusia ke bahasa Inggris (yang terakhir dikembangkan setelah laporan ALPAC dan terus digunakan oleh US Air Angkatan dan NASA); selain itu, CEC memerintahkan pengembangan versi Prancis-Inggris dan Italia-Inggris. Bersamaan dengan itu, ada perluasan yang cepat dari aktivitas penerjemahan mesin di Jepang; di AS, Organisasi Kesehatan Pan Amerika (PAHO) memerintahkan pengembangan arah Spanyol-Inggris (sistem SPANAM); Angkatan Udara AS mendanai pengembangan sistem terjemahan mesin di Pusat Penelitian Linguistik di University of Texas di Austin; Grup TAUM di Kanada membuat kemajuan penting dalam mengembangkan sistem METEO (meteorological translation) mereka. Sejumlah proyek dimulai pada tahun 70-an dan 80-an. kemudian berkembang menjadi sistem komersial penuh.

Selama periode 1978-93, 20 juta dolar dihabiskan untuk penelitian di bidang terjemahan mesin di AS, 70 juta di Eropa, dan 200 juta di Jepang.

Salah satu perkembangan baru adalah teknologi TM (memori terjemahan), yang bekerja berdasarkan prinsip akumulasi: selama proses penerjemahan, segmen asli (kalimat) dan terjemahannya disimpan, menghasilkan pembentukan basis data linguistik; jika segmen yang identik atau serupa ditemukan dalam teks yang baru diterjemahkan, itu ditampilkan bersama terjemahan dan indikasi persentase kecocokan. Penerjemah kemudian membuat keputusan (untuk mengedit, menolak atau menerima terjemahan), yang hasilnya disimpan oleh sistem, sehingga tidak perlu menerjemahkan kalimat yang sama dua kali. Sistem komersial terkenal berdasarkan teknologi TM saat ini dikembangkan oleh sistem TRADOS (didirikan pada tahun 1984).

Saat ini, beberapa lusin perusahaan sedang mengembangkan sistem terjemahan mesin komersial, termasuk: Systran, IBM, L&H (Lernout & Hauspie), Bahasa Transparan, Bahasa Lintas, Perangkat Lunak Trident, Atril, Trados, Caterpillar Co., LingoWare; Perangkat Lunak Ata; Linguistik b.v. dan lainnya Sekarang Anda dapat menggunakan layanan penerjemah otomatis langsung di Web: alphaWorks; Penerjemah Online PROMT, LogoMedia.net, Layanan Terjemahan Ikan Babel AltaVista; InfiniT.com; Menerjemahkan Internet.

Sistem terjemahan yang efektif secara komersial juga muncul di paruh kedua tahun 80-an di negara kita. Konsep terjemahan mesin telah berkembang (mulai mencakup "pembuatan sejumlah sistem dan perangkat otomatis dan otomatis yang secara otomatis atau semi-otomatis melakukan seluruh siklus terjemahan atau tugas individu dalam dialog dengan seseorang"), dan alokasi pemerintah untuk pengembangan industri ini telah meningkat.

Rusia, Inggris, Jerman, Prancis, dan Jepang menjadi bahasa utama sistem terjemahan domestik. All-Union Translation Center (VTsP) mengembangkan sistem untuk menerjemahkan dari bahasa Inggris dan Jerman ke bahasa Rusia di komputer ES-1035-ANRAP. Itu terdiri dari tiga kamus - masukan bahasa Inggris dan Jerman dan keluaran Rusia - di bawah satu perangkat lunak. Ada beberapa kamus khusus yang dapat dipertukarkan - untuk teknologi komputer, pemrograman, elektronik radio, teknik mesin, pertanian, metalurgi. Sistem dapat bekerja dalam dua mode - otomatis dan interaktif, saat layar menampilkan teks sumber dan terjemahan per frasa, yang dapat diedit oleh seseorang. Kecepatan menerjemahkan teks ke dalam ANRAP (dari awal pengetikan hingga akhir pencetakan) kira-kira 100 halaman per jam.

Pada tahun 1989, keluarga penerjemah komersial jenis SPRINT dibentuk, bekerja dengan bahasa Rusia, Inggris, Jerman, dan Jepang. Keuntungan utama mereka adalah kompatibilitasnya dengan PC IBM - dengan demikian, sistem terjemahan mesin domestik mencapai tingkat kualitas internasional. Pada saat yang sama, sistem terjemahan mesin dari FRAP Prancis ke Rusia sedang dikembangkan, yang mencakup 4 tahap analisis teks: grafematik, morfologis, sintaksis, dan semantik. Di LGPI mereka. Herzen, pekerjaan sedang dilakukan pada sistem SILOD-MP empat bahasa (Inggris, Prancis, Spanyol, Rusia) (kamus Inggris-Rusia dan Perancis-Rusia digunakan dalam mode industri.

Untuk terjemahan teks khusus tentang teknik kelistrikan, sistem ETAP-2 ada. Analisis teks masukan di dalamnya dilakukan pada dua tingkatan - morfologis dan sintaksis. Kamus ETAP-2 berisi sekitar 4 ribu entri; tahap transformasi teks - sekitar 1000 aturan (96 umum, 342 pribadi, sisanya adalah kamus). Semua ini memastikan kualitas terjemahan yang memuaskan (katakanlah, judul paten "Pengaturan jaringan fase optik dan perangkat penghubung yang memiliki pengaturan seperti itu" diterjemahkan sebagai "Perangkat jaringan fase optik dan perangkat penghubung dengan perangkat semacam itu" - meskipun tautologi, artinya dipertahankan).

Di Institut Pedagogi Bahasa Asing Minsk, berdasarkan kamus bentuk kata dan frasa bahasa Inggris-Rusia, sebuah sistem untuk terjemahan mesin judul ditemukan, di Institut Studi Oriental Akademi Ilmu Pengetahuan - sebuah sistem untuk menerjemahkan dari bahasa Jepang ke bahasa Rusia. Layanan kosakata dan terminologi otomatis pertama (SLOTHERM) untuk komputasi dan pemrograman, dibuat di Moscow Research Institute of Automation Systems, berisi sekitar 20.000 istilah dalam kamus penjelasan dan kamus khusus untuk penelitian linguistik.

Sistem terjemahan mesin secara bertahap mulai digunakan tidak hanya untuk tujuan yang dimaksudkan, tetapi juga sebagai komponen penting dari sistem pembelajaran otomatis (untuk mengajar terjemahan, memeriksa ejaan, dan pengetahuan tata bahasa).

Tahun 90-an membawa perkembangan pesat pasar PC (dari desktop ke saku) dan teknologi informasi, meluasnya penggunaan Internet (yang menjadi lebih internasional dan multibahasa). Semua ini membuat pengembangan lebih lanjut dari sistem terjemahan otomatis menjadi permintaan. Sejak awal 1990-an Pengembang domestik juga memasuki pasar sistem PC.

Pada Juli 1990, sistem terjemahan mesin komersial pertama di Rusia yang disebut PROMT (PROgrammer's Machine Translation) dipresentasikan di Forum PC di Moskow. Pada tahun 1991, ZAO [!!! Sesuai dengan Hukum Federal-99 tanggal 05.05.2014, formulir ini digantikan oleh perusahaan saham gabungan non-publik] "Proyek MT", dan sudah pada tahun 1992, perusahaan PROMT memenangkan kompetisi NASA untuk penyediaan sistem MP (PROMT adalah satu-satunya perusahaan non-Amerika dalam kompetisi ini). seluruh keluarga sistem dengan nama baru STYLUS untuk menerjemahkan dari bahasa Inggris, Jerman, Prancis, Italia, dan Spanyol ke Rusia dan dari Rusia ke Inggris, dan pada tahun 1993 sistem terjemahan mesin pertama di dunia untuk Windows dibuat berdasarkan STYLUS. untuk Windows 3.X/95/NT dirilis, dan pada 1995-1996 generasi ketiga dari sistem terjemahan mesin, STYLUS 3.0 32-bit penuh untuk Windows 95/NT, diperkenalkan, pada saat yang sama, pengembangan sepenuhnya baru, sistem terjemahan mesin Rusia-Jerman dan Rusia-Prancis pertama di dunia.

Pada tahun 1997, sebuah perjanjian ditandatangani dengan perusahaan Prancis Softissimo tentang pembuatan sistem terjemahan dari bahasa Prancis ke bahasa Jerman dan Inggris dan sebaliknya, dan pada bulan Desember tahun ini, sistem terjemahan Jerman-Prancis pertama di dunia dirilis. Pada tahun yang sama, PROMT merilis sistem yang diimplementasikan menggunakan teknologi Gigant, yang mendukung beberapa arahan bahasa dalam satu shell, serta penerjemah khusus untuk bekerja di Internet WebTranSite.

Pada tahun 1998, seluruh konstelasi program dirilis dengan nama baru PROMT 98. Setahun kemudian, PROMT merilis dua produk baru: paket perangkat lunak unik untuk bekerja di Internet - PROMT Internet, dan penerjemah untuk sistem surat perusahaan - PROMT Mail Penerjemah. Pada November 1999, PROMT diakui sebagai sistem penerjemahan mesin terbaik yang diuji oleh majalah Prancis, PC Expert, mengungguli para pesaingnya sebesar 30 persen. Solusi server khusus juga telah dikembangkan untuk klien korporat - server terjemahan korporat PROMT Translation Server (PTS) dan solusi Internet PROMT Internet Translation Server (PITS). Pada tahun 2000, PROMT memperbarui seluruh lini produk perangkat lunaknya dengan merilis sistem MT generasi baru: PROMT Translation Office 2000, PROMT Internet 2000 dan Magic Gooddy 2000.

Terjemahan online dengan dukungan sistem PROMT digunakan di sejumlah situs dalam dan luar negeri: Penerjemah Online PROMT, InfiniT.com, Translate.Ru, Lycos, dll., serta di institusi berbagai profil untuk menerjemahkan dokumen bisnis, artikel dan surat (ada sistem terjemahan yang dibangun langsung ke Outlook Express dan klien email lainnya).

Saat ini, teknologi terjemahan mesin baru muncul berdasarkan penggunaan sistem kecerdasan buatan dan metode statistik. Tentang yang terakhir - di bagian selanjutnya.

2.2 Ekstrametode ical dalam pembelajaran bahasa

Perhatian yang cukup besar dalam linguistik modern diberikan untuk mempelajari fenomena linguistik dengan menggunakan metode matematika kuantitatif. Data kuantitatif seringkali membantu untuk lebih memahami fenomena yang diteliti, tempat dan perannya dalam sistem fenomena terkait. Jawaban atas pertanyaan "berapa banyak" membantu menjawab pertanyaan "apa", "bagaimana", "mengapa" - begitulah potensi heuristik dari karakteristik kuantitatif.

Metode statistik memainkan peran penting dalam pengembangan sistem terjemahan mesin (lihat Bagian 2.1). Dalam pendekatan statistik, masalah translasi dianggap sebagai kanal yang berisik. Bayangkan kita perlu menerjemahkan kalimat dari bahasa Inggris ke bahasa Rusia. Prinsip saluran bising memberi kita penjelasan berikut tentang hubungan antara kalimat bahasa Inggris dan Rusia: kalimat bahasa Inggris tidak lain adalah kalimat Rusia yang terdistorsi oleh semacam kebisingan. Untuk memulihkan kalimat asli bahasa Rusia, kita perlu mengetahui apa yang biasanya dikatakan orang dalam bahasa Rusia dan bagaimana frasa bahasa Rusia diubah menjadi bahasa Inggris. Terjemahan dilakukan dengan mencari kalimat Rusia yang memaksimalkan produk dari probabilitas tak bersyarat dari kalimat Rusia dan probabilitas kalimat bahasa Inggris (asli) yang diberikan kalimat Rusia yang diberikan. Menurut teorema Bayes, kalimat Rusia ini adalah terjemahan bahasa Inggris yang paling mungkin:

di mana e adalah kalimat terjemahan dan f adalah kalimat aslinya

Jadi kita membutuhkan model sumber dan model saluran, atau model bahasa dan model terjemahan. Model bahasa harus menetapkan skor probabilitas untuk setiap kalimat dalam bahasa target (dalam kasus kami, bahasa Rusia), dan model terjemahan ke kalimat aslinya. (lihat tabel 1)

Secara umum, sistem terjemahan mesin beroperasi dalam dua mode:

1. Pelatihan sistem: korpus pelatihan teks paralel diambil, dan menggunakan pemrograman linier, nilai tabel korespondensi terjemahan dicari yang memaksimalkan kemungkinan (misalnya) bagian Rusia dari korpus dengan bahasa Inggris yang tersedia sesuai dengan model terjemahan yang dipilih. Model bahasa Rusia dibangun di atas bagian Rusia dari korpus yang sama.

2. Eksploitasi: berdasarkan data yang diperoleh untuk kalimat bahasa Inggris yang tidak dikenal, dicari bahasa Rusia yang memaksimalkan produk probabilitas yang ditetapkan oleh model bahasa dan model terjemahan. Program yang digunakan untuk pencarian semacam itu disebut decoder.

Model penerjemahan statistik yang paling sederhana adalah model penerjemahan literal. Model ini mengasumsikan bahwa untuk menerjemahkan kalimat dari satu bahasa ke bahasa lain, cukup menerjemahkan semua kata (membuat "kantong kata"), dan model akan menyediakan penempatannya dalam urutan yang benar. Untuk mengurangi P( a, f | e) ke P(a | e , f), mis. probabilitas dari keselarasan yang diberikan diberikan sepasang kalimat, masing-masing probabilitas P(a, f | e) dinormalisasi dengan jumlah dari probabilitas semua keberpihakan dari sepasang kalimat yang diberikan:

Implementasi algoritma Viterbi yang digunakan untuk melatih Model #1 adalah sebagai berikut:

1. Seluruh tabel peluang korespondensi translasi diisi dengan nilai yang sama.

2. Untuk semua varian yang mungkin dari hubungan berpasangan kata-kata, probabilitas P(a, f | e) dihitung:

3. Nilai P(a,f|e) dinormalisasi untuk mendapatkan nilai P(a|e,f).

4. Frekuensi setiap pasangan translasi dihitung, dibobotkan dengan probabilitas setiap opsi penyelarasan.

5. Frekuensi tertimbang yang dihasilkan dinormalisasi dan membentuk tabel baru probabilitas korespondensi translasi

6. Algoritme diulang dari langkah 2.

Pertimbangkan, sebagai contoh, pelatihan model serupa pada korpus dua pasang kalimat (Gbr. 2):

gedung Putih

Setelah iterasi dalam jumlah yang banyak, kita akan mendapatkan tabel (Tabel 2) yang menunjukkan bahwa terjemahan dilakukan dengan akurasi yang tinggi.

Juga, metode statistik banyak digunakan dalam studi kosakata, morfologi, sintaksis, dan gaya. Ilmuwan dari Perm State University melakukan penelitian berdasarkan pernyataan bahwa frasa stereotip merupakan "bahan bangunan" penting dari teks. Frasa-frasa ini terdiri dari kata-kata berulang "nuklir" dan penentu kata-kata yang bergantung dan memiliki pewarnaan gaya yang diucapkan.

Dalam gaya ilmiah, kata "nuklir" dapat disebut: penelitian, studi, tugas, masalah, pertanyaan, fenomena, fakta, observasi, analisis dll. Dalam jurnalisme, kata lain adalah "nuklir", yang memiliki nilai tambah khusus untuk teks surat kabar: waktu, orang, kekuatan, bisnis, tindakan, hukum, kehidupan, sejarah, tempat dll. (total 29)

Yang menarik bagi ahli bahasa juga adalah diferensiasi profesional bahasa nasional, orisinalitas penggunaan kosa kata dan tata bahasa, tergantung pada jenis pekerjaan. Diketahui bahwa driver dalam pidato profesional menggunakan bentuk w HAI fer, kata petugas medis k HAI klub bukannya koktail Yu sh - contoh seperti itu dapat diberikan. Tugas statistik adalah melacak variabilitas pengucapan dan perubahan norma bahasa.

Perbedaan profesional menyebabkan perbedaan tidak hanya tata bahasa, tetapi juga leksikal. Universitas Negeri Yakut dinamai demikian MK Ammosov, 50 kuesioner dianalisis dengan reaksi paling umum terhadap kata-kata tertentu di antara dokter dan tukang bangunan (Tabel 3).

Pembangun

Manusia

sabar (10), kepribadian (5)

laki-laki (5)

Bagus

bantuan (8), bantuan (7)

jahat (16)

kehidupan

kematian (10)

indah (5)

kematian

mayat (8)

hidup (6)

api

panas (8), bakar (6)

api (7)

jari

tangan (14), panaritium (5)

besar (7), indeks (6)

mata

penglihatan (6), pupil, dokter mata (masing-masing 5)

coklat (10), besar (6)

kepala

pikiran (14), otak (5)

besar (9), pintar (8), pintar (6)

kehilangan

kesadaran, kehidupan (masing-masing 4)

uang (5), temukan (4)

Dapat dicatat bahwa dokter lebih sering daripada pembangun memberikan asosiasi yang berkaitan dengan kegiatan profesional mereka, karena kata-rangsangan yang diberikan dalam kuesioner lebih berkaitan dengan profesi mereka daripada dengan profesi pembangun.

Keteraturan statistik dalam suatu bahasa digunakan untuk membuat kamus frekuensi - kamus yang memberikan karakteristik numerik dari frekuensi kata (bentuk kata, frasa) dari bahasa apa pun - bahasa penulis, karya apa pun, dll. sebuah kata digunakan sebagai ciri penggunaan dalam teks volume tertentu

Model persepsi ucapan tidak mungkin tanpa kamus sebagai komponen esensialnya. Dalam persepsi tuturan, unit operasional dasarnya adalah kata. Dari sini dapat disimpulkan, khususnya, bahwa setiap kata dari teks yang dirasakan harus diidentifikasi dengan unit kosakata internal pendengar (atau pembaca) yang sesuai. Wajar untuk berasumsi bahwa sejak awal pencarian terbatas pada beberapa subdomain kamus. Menurut sebagian besar teori persepsi ucapan modern, analisis fonetik yang sebenarnya dari teks yang terdengar dalam kasus tipikal hanya memberikan sebagian informasi tentang kemungkinan penampilan fonologis kata tersebut, dan informasi semacam ini tidak sesuai dengan satu, tetapi BANYAK kata tertentu. dari kamus; Oleh karena itu, muncul dua masalah:

(a) memilih set yang sesuai menurut parameter tertentu;

(b) dalam batas-batas himpunan yang digariskan (jika dialokasikan secara memadai) untuk "menghilangkan" semua kata, kecuali satu-satunya yang paling sesuai dengan kata yang diberikan dari teks yang dikenali. Salah satu strategi "putus sekolah" adalah mengecualikan kata-kata berfrekuensi rendah. Oleh karena itu, kosakata untuk persepsi ucapan adalah kamus frekuensi. Ini adalah pembuatan kamus frekuensi bahasa Rusia versi komputer yang merupakan tugas awal dari proyek yang disajikan.

Berdasarkan materi bahasa Rusia, ada 5 kamus frekuensi (tidak termasuk kamus cabang). Mari kita perhatikan hanya beberapa kekurangan umum dari kamus yang ada.

Semua kamus frekuensi yang diketahui dari bahasa Rusia didasarkan pada pemrosesan susunan teks tertulis (cetak). Sebagian karena alasan ini, ketika identitas sebuah kata sebagian besar didasarkan pada kebetulan grafis formal, semantik tidak cukup diperhitungkan. Akibatnya, karakteristik frekuensi juga bergeser, terdistorsi; misalnya, jika penyusun kamus frekuensi memasukkan kata-kata dari kombinasi "satu sama lain" dalam statistik umum penggunaan kata "teman", maka ini hampir tidak dapat dibenarkan: mengingat semantiknya, kita harus mengakui bahwa ini sudah kata yang berbeda, atau lebih tepatnya, bahwa unit kamus independen hanyalah kombinasi secara keseluruhan.

Juga, di semua kamus yang ada, kata-kata ditempatkan hanya dalam bentuk dasarnya: kata benda dalam bentuk tunggal, kasus nominatif, kata kerja dalam bentuk infinitif, dll. Beberapa kamus memberikan informasi tentang frekuensi bentuk kata, tetapi biasanya mereka tidak melakukannya dengan cukup konsisten, tidak lengkap. Frekuensi bentuk kata yang berbeda dari kata yang sama jelas tidak cocok. Pengembang model persepsi ucapan harus mempertimbangkan bahwa dalam proses persepsi nyata justru bentuk kata tertentu yang "terbenam" dalam teks yang dapat dikenali: berdasarkan analisis bagian awal eksponen dari bentuk kata, sekumpulan kata dengan permulaan yang identik terbentuk, dan bagian awal bentuk kata belum tentu identik dengan bagian awal bentuk kamus . Ini adalah bentuk kata yang memiliki struktur ritmis tertentu, yang juga merupakan parameter yang sangat penting untuk pemilihan kata secara perseptual. Akhirnya, dalam representasi terakhir dari ucapan yang dikenali, kata-kata tersebut direpresentasikan oleh bentuk kata yang sesuai.

Ada banyak karya yang menunjukkan pentingnya frekuensi dalam proses persepsi ucapan. Tetapi kami tidak mengetahui karya-karya di mana frekuensi bentuk kata akan digunakan - sebaliknya, semua penulis secara praktis mengabaikan frekuensi bentuk kata individu, mengacu secara eksklusif pada leksem. Jika hasil yang diperoleh tidak dianggap sebagai artefak, orang harus berasumsi bahwa penutur asli entah bagaimana memiliki akses ke informasi tentang rasio frekuensi bentuk kata dan bentuk kamus, yaitu, pada kenyataannya, leksem. Selain itu, transisi dari bentuk kata ke leksem seperti itu, tentu saja, tidak dapat dijelaskan dengan pengetahuan alami dari paradigma yang sesuai, karena informasi frekuensi harus digunakan sebelum identifikasi akhir kata, jika tidak maka akan kehilangan artinya.

Menurut karakteristik statistik utama, adalah mungkin untuk menentukan dengan kesalahan relatif tertentu bagian dari kamus, yang mencakup kata-kata dengan frekuensi kemunculan yang tinggi, apa pun jenis teksnya. Dimungkinkan juga, dengan memperkenalkan pengurutan bertahap ke dalam kamus, untuk mendapatkan serangkaian kamus yang mencakup 100, 1000, 5000, dll. Karakteristik statistik kamus menarik sehubungan dengan analisis semantik kosakata. Studi tentang kelompok subjek-ideologis dan bidang semantik menunjukkan bahwa asosiasi leksikal didukung oleh tautan semantik yang terkonsentrasi di sekitar leksem dengan makna yang paling umum. Penggambaran makna dalam bidang leksiko-semantik dapat dilakukan dengan mengidentifikasi kata-kata yang memiliki makna leksem paling abstrak. Rupanya, unit kamus "kosong" (dari sudut pandang potensi nominatif) merupakan lapisan yang homogen secara statistik.

Kosakata untuk genre individu juga tidak kalah berharganya. Mempelajari ukuran kemiripannya dan sifat distribusi statistik akan memberikan informasi menarik tentang stratifikasi kualitatif kosa kata tergantung pada bidang penggunaan ucapan.

Penyusunan kamus frekuensi besar membutuhkan penggunaan teknologi komputer. MEMPERKENALKAN mekanisasi dan otomasi parsial ke dalam proses pengerjaan kamus menarik sebagai percobaan dalam pemrosesan mesin kamus untuk berbagai teks. Kamus semacam itu membutuhkan sistem yang lebih ketat untuk memproses dan mengumpulkan materi kosakata. Secara mini, ini adalah sistem pencarian informasi yang mampu memberikan informasi tentang berbagai aspek teks dan kosa kata. Beberapa permintaan dasar untuk sistem ini direncanakan sejak awal: jumlah total kata inventaris, karakteristik statistik dari satu kata dan seluruh kamus, urutan zona kamus yang sering dan langka, dll. File kartu mesin memungkinkan Anda untuk secara otomatis membuat kamus terbalik untuk genre dan sumber individual. Banyak informasi statistik berguna lainnya tentang bahasa tersebut akan diekstraksi dari kumpulan informasi yang terakumulasi. Kamus frekuensi komputer menciptakan dasar eksperimental untuk transisi ke otomatisasi pekerjaan kosa kata yang lebih luas.

Data statistik kamus frekuensi juga dapat digunakan secara luas dalam memecahkan masalah linguistik lainnya - misalnya, dalam menganalisis dan menentukan cara aktif pembentukan kata dari bahasa Rusia modern, menyelesaikan masalah peningkatan grafik dan ejaan, yang terkait dengan pertimbangan akun informasi statistik tentang kosakata (dengan semua ini, penting untuk mempertimbangkan karakteristik probabilistik kombinasi grafem, jenis kombinasi huruf yang diwujudkan dalam kata-kata), transkripsi praktis, dan transliterasi. Parameter statistik kamus juga akan berguna dalam menyelesaikan masalah pengetikan otomatis, pengenalan, dan pembacaan otomatis teks literal.

Kamus dan tata bahasa penjelasan modern dari bahasa Rusia sebagian besar dibangun berdasarkan teks sastra dan artistik. Ada kamus frekuensi bahasa A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky dan banyak penulis lainnya. Di Departemen Sejarah dan Teori Sastra Negara Bagian Smolensk. Universitas Pedagogis telah bekerja selama beberapa tahun untuk menyusun kamus frekuensi teks puisi dan prosa. Untuk penelitian ini, kamus frekuensi dari semua lirik Pushkin dan dua penyair lagi dari zaman keemasan - "Woe from Wit" oleh Griboyedov dan semua puisi Lermontov dipilih; Pasternak dan lima penyair Zaman Perak lainnya - Balmont 1894-1903, "Puisi tentang Wanita Cantik" oleh Blok, "Batu" oleh Mandelstam, "Tiang Api" oleh Gumilyov, "Anno Domini MCMXXI" oleh Akhmatova dan "Sisters of My Life" oleh Pasternak dan empat penyair lain dari Zaman Besi - "Puisi oleh Yuri Zhivago", "Saat sudah bersih", seluruh kumpulan lirik oleh M. Petrovs, "Jalannya jauh", "Kaca depan", "Perpisahan dengan salju" dan "Horseshoes" oleh Mezhirov, "Antimirov" oleh Voznesensky dan "Snezhnitsa » Rylenkova.

Perlu dicatat bahwa kamus ini berbeda sifatnya: beberapa mewakili kosakata dari satu karya dramatis, yang lain - buku lirik, atau beberapa buku, atau seluruh kumpulan puisi penyair. Hasil analisis yang disajikan dalam makalah ini harus diambil dengan hati-hati, tidak dapat dianggap mutlak. Pada saat yang sama, dengan bantuan langkah-langkah khusus, perbedaan sifat ontologis teks dapat dikurangi sampai batas tertentu.

Dalam beberapa tahun terakhir, pertentangan antara bahasa sehari-hari dan pidato buku menjadi semakin jelas. Masalah ini secara khusus dibahas dengan tajam di antara para ahli metodologi yang menuntut pergantian pengajaran ke arah bahasa lisan. Pada saat yang sama, kekhususan pidato sehari-hari masih belum dapat dijelaskan.

Kamus diproses dengan membuat aplikasi pengguna di lingkungan program perkantoran EXCEL97. Aplikasi ini mencakup empat lembar kerja buku EXCEL - lembar "Judul", lembar "Kamus" dengan data awal, "Kedekatan" dan "Jarak" dengan hasil, serta sekumpulan makro.

Informasi awal dimasukkan pada lembar "Kamus". Kamus teks yang dipelajari ditulis ke dalam sel EXCEL, kolom terakhir S dibentuk dari hasil yang diperoleh dan sama dengan jumlah kata yang ditemukan di kamus lain. Tabel "Kedekatan" dan "Jarak" berisi pengukuran kedekatan M, korelasi R, dan jarak D yang dihitung.

Makro aplikasi adalah prosedur pemrograman berbasis peristiwa yang ditulis dalam Visual Basic for Application (VBA). Prosedur didasarkan pada objek pustaka VBA dan metode pemrosesannya. Jadi, untuk operasi dengan lembar kerja aplikasi, lembar kerja objek kunci (lembar kerja) dan metode yang sesuai untuk mengaktifkan lembar Aktifkan (aktifkan) digunakan. Mengatur rentang data sumber yang dianalisis pada lembar Kamus dilakukan dengan metode Pilih objek Rentang (rentang), dan transfer kata sebagai nilai ke variabel dilakukan sebagai properti Nilai (nilai) dari Rentang yang sama obyek.

Terlepas dari kenyataan bahwa analisis korelasi peringkat membuat kita berhati-hati tentang ketergantungan topik antara teks yang berbeda, sebagian besar kata yang paling sering di setiap teks memiliki kecocokan dalam satu atau lebih teks lainnya. Kolom S menunjukkan jumlah kata-kata tersebut di antara 15 kata yang paling sering muncul untuk setiap penulis. Kata-kata dalam huruf tebal hanya muncul dalam satu kata penyair di tabel kami. Blok, Akhmatova dan Petrov sama sekali tidak memiliki kata yang disorot, mereka memiliki S = 15. Ketiga penyair ini memiliki 15 kata yang paling sering sama, hanya berbeda tempat dalam daftar. Tetapi bahkan Pushkin, yang kosakatanya paling orisinal, memiliki S = 8, dan ada 7 kata yang disorot.

Hasil penelitian menunjukkan bahwa terdapat lapisan kosa kata tertentu yang memusatkan tema-tema utama puisi. Biasanya, kata-kata ini pendek: dari jumlah total (225) penggunaan kata satu suku kata 88, dua suku kata 127, tiga suku kata 10. Seringkali kata-kata ini mewakili mitologem utama dan dapat berpasangan: malam - siang, bumi - langit (matahari), Tuhan - manusia (manusia), hidup - mati, tubuh - jiwa, Roma - dunia(di Mandelstam); dapat digabungkan menjadi mitologem tingkat yang lebih tinggi: langit, bintang, matahari, bumi; pada seseorang, sebagai aturan, tubuh, jantung, darah, lengan, kaki, pipi, mata menonjol. Dari keadaan manusia, preferensi diberikan pada tidur dan cinta. Rumah dan kota milik dunia manusia - Moskow, Roma, Paris. Kreativitas diwakili oleh leksem kata Dan lagu.

Griboedov dan Lermontov hampir tidak memiliki kata yang menunjukkan alam di antara kata-kata yang paling sering. Mereka memiliki kata tiga kali lebih banyak yang menunjukkan seseorang, bagian tubuhnya, elemen dunia spiritualnya. Pushkin dan penyair abad kedua puluh. sebutan manusia dan alam kira-kira sama. Dalam aspek penting dari subjek ini, kita dapat mengatakan bahwa abad kedua puluh. mengikuti Pushkin.

Minim Tema kasus di antara kata-kata yang paling sering, hanya ditemukan di Griboyedov dan Pushkin. Lermontov dan penyair abad kedua puluh. itu memberi jalan ke tema minimal kata. Kata itu tidak mengecualikan perbuatan (penafsiran alkitabiah tentang topik: dalam Perjanjian Baru, semua ajaran Yesus Kristus dianggap sebagai firman Tuhan atau firman Yesus, dan para rasul terkadang menyebut diri mereka pelayan Firman). Makna sakral kata leksem dimanifestasikan secara meyakinkan, misalnya dalam syair Pasternak "Dan gambaran dunia, terungkap dalam Sabda". Makna sakral dari leksem kata dalam hubungannya dengan dan kontras dengan urusan manusia, hal itu secara meyakinkan dimanifestasikan dalam puisi berjudul sama oleh Gumilyov.

Token yang hanya ditemukan dalam satu teks menjadi ciri orisinalitas buku atau kumpulan buku tertentu. Misalnya, kata "pikiran" adalah yang paling sering muncul dalam komedi Griboedov "Celakalah dari Kecerdasan" - tetapi tidak muncul di antara kata-kata frekuensi dari teks lain. Tema pikiran sejauh ini merupakan yang paling signifikan dalam komedi. Lexeme ini mengiringi citra Chatsky, dan nama Chatsky paling sering muncul dalam komedi. Dengan demikian, karya tersebut secara organik menggabungkan kata benda umum yang paling sering dengan nama diri yang paling sering.

Koefisien korelasi tertinggi menghubungkan tema buku tragis "The Pillar of Fire" oleh Gumilyov dan "Anno Domini MCMXXI" oleh Akhmatova. Di antara 15 kata benda yang paling sering, ada 10 kata umum, termasuk darah, hati, jiwa, cinta, kata, langit. Ingatlah bahwa buku Akhmatova menyertakan miniatur "Kamu tidak akan hidup ...", yang ditulis antara penangkapan Gumilyov dan eksekusinya.

Tema lilin dan keramaian dalam materi yang dipelajari hanya ditemukan di "Puisi Yuri Zhivago". Tema lilin dalam ayat-ayat novel memiliki banyak makna kontekstual: dikaitkan dengan citra Yesus Kristus, dengan tema iman, keabadian, kreativitas, kencan cinta. Lilin adalah sumber cahaya terpenting dalam adegan sentral novel. Tema keramaian berkembang sehubungan dengan gagasan utama novel, di mana kehidupan pribadi seseorang dengan nilai-nilainya yang tak tergoyahkan bertentangan dengan amoralitas negara baru, dibangun di atas prinsip menyenangkan orang banyak. .

Pekerjaan itu juga melibatkan tahap ketiga, juga tercermin dalam program, - ini adalah perhitungan selisih nomor urut kata-kata yang umum untuk dua kamus dan jarak rata-rata antara kata yang sama dari dua kamus. Tahap ini memungkinkan perpindahan dari tren umum dalam interaksi kamus yang diidentifikasi dengan bantuan statistik ke tingkat yang mendekati teks. Misalnya, buku Gumilyov dan Akhmatova berkorelasi secara signifikan secara statistik. Kami melihat kata-kata mana yang ternyata umum untuk kamus mereka, dan, pertama-tama, kami memilih kata-kata yang nomor serinya berbeda minimal atau sama dengan nol. Kata-kata inilah yang memiliki nomor peringkat yang sama dan, oleh karena itu, tema minimal dalam benak kedua penyair inilah yang sama pentingnya. Selanjutnya, Anda harus pindah ke tingkat teks dan konteks.

Metode kuantitatif juga membantu mempelajari karakteristik masyarakat - penutur asli. Katakanlah, ada 6 kasus dalam bahasa Rusia, tidak ada kasus dalam bahasa Inggris, dan dalam beberapa bahasa masyarakat Dagestan, jumlah kasus mencapai 40. L. Perlovsky dalam artikelnya "Kesadaran, Bahasa dan Budaya" menghubungkan ini ciri-ciri dengan kecenderungan masyarakat pada individualisme atau kolektivisme, dengan persepsi benda dan fenomena secara terpisah atau sehubungan dengan orang lain. Lagi pula, di dunia berbahasa Inggris (tidak ada kasus - hal itu dianggap "dengan sendirinya") konsep-konsep seperti kebebasan individu, liberalisme dan demokrasi muncul (saya perhatikan bahwa saya menggunakan konsep-konsep ini hanya sehubungan dengan bahasa, tanpa karakteristik evaluatif). Terlepas dari kenyataan bahwa tebakan semacam itu masih hanya pada tingkat hipotesis ilmiah yang berani, tebakan tersebut membantu untuk melihat fenomena yang sudah dikenal dengan cara baru.

Seperti yang dapat kita lihat, karakteristik kuantitatif dapat diterapkan di bidang linguistik yang sangat berbeda, yang semakin mengaburkan batas antara metode "tepat" dan "kemanusiaan". Linguistik semakin banyak menggunakan bantuan tidak hanya matematika, tetapi juga teknologi komputer untuk memecahkan masalahnya.

2.3 Pembelajaran Ibahasa dengan metode logika formal

Dengan metode matematika non-kuantitatif, khususnya, dengan logika, linguistik teoretis modern berinteraksi tidak kalah bermanfaatnya dengan metode kuantitatif. Pesatnya perkembangan teknologi komputer dan pertumbuhan perannya di dunia modern membutuhkan revisi pendekatan interaksi bahasa dan logika secara umum.

Metode logika banyak digunakan dalam pengembangan bahasa formal, khususnya bahasa pemrograman, yang unsur-unsurnya adalah beberapa simbol (mirip dengan matematika), dipilih (atau dibangun dari simbol yang dipilih sebelumnya) dan ditafsirkan dengan cara tertentu, terkait tanpa penggunaan, pemahaman, dan pemahaman "tradisional" dari simbol yang sama dalam konteks lain. Seorang programmer terus-menerus berurusan dengan logika dalam pekerjaannya. Arti pemrograman hanyalah untuk mengajari komputer untuk bernalar (dalam arti kata yang paling luas). Pada saat yang sama, metode "penalaran" ternyata sangat berbeda. Setiap programmer menghabiskan sejumlah waktu untuk mencari bug di program mereka sendiri dan program orang lain. Artinya, mencari kesalahan dalam penalaran, dalam logika. Dan ini juga meninggalkan bekas. Jauh lebih mudah untuk mendeteksi kesalahan logis dalam ucapan biasa. Kesederhanaan relatif dari bahasa yang dipelajari oleh ahli logika memungkinkan mereka untuk menjelaskan struktur bahasa ini lebih jelas daripada yang dapat dicapai oleh ahli bahasa yang menganalisis bahasa alami yang kompleks secara eksklusif. Mengingat fakta bahwa bahasa yang dipelajari oleh ahli logika menggunakan hubungan yang disalin dari bahasa alami, ahli logika dapat memberikan kontribusi yang signifikan pada teori umum bahasa. Situasi di sini mirip dengan yang terjadi dalam fisika: fisikawan juga merumuskan teorema untuk kasus yang disederhanakan secara ideal yang sama sekali tidak terjadi di alam - ia merumuskan hukum untuk gas ideal, cairan ideal, berbicara tentang gerak tanpa gesekan, dll. Untuk kasus-kasus ideal ini, hukum sederhana dapat ditetapkan yang akan sangat berkontribusi pada pemahaman tentang apa yang terjadi dalam kenyataan dan apa yang mungkin tetap tidak diketahui oleh fisika jika ia mencoba mempertimbangkan realitas secara langsung, dengan segala kerumitannya.

Dalam studi bahasa alami, metode logis digunakan agar pembelajar bahasa tidak bisa dengan bodohnya “menghafal” kata sebanyak mungkin, tetapi lebih memahami strukturnya. L. Shcherba juga menggunakan dalam ceramahnya sebuah contoh kalimat yang dibuat menurut hukum bahasa Rusia: “Kuzdra shteko yang berkilau mem-bok bokra dan menggulung bokra,” dan kemudian bertanya kepada siswa apa artinya ini. Terlepas dari kenyataan bahwa arti kata-kata dalam kalimat tetap tidak jelas (tidak ada dalam bahasa Rusia), adalah mungkin untuk menjawab dengan jelas: "kuzdra" adalah subjek, kata benda feminin, dalam kasus nominatif tunggal, " bokr” dianimasikan, dan lain-lain. Terjemahan frasa tersebut ternyata seperti ini: "Sesuatu yang feminin dalam sekali jalan melakukan sesuatu pada sejenis makhluk jantan, dan kemudian mulai melakukan sesuatu seperti ini untuk waktu yang lama dan bertahap dengan anaknya." Contoh serupa dari teks (artistik) dari kata-kata yang tidak ada, dibangun sepenuhnya sesuai dengan hukum bahasa, adalah Jabberwock karya Lewis Carroll (dalam Alice in Wonderland, Carroll, melalui karakternya Humpty Dumpty, menjelaskan arti kata-kata yang dia ditemukan: "dimasak" - jam delapan malam, saat waktunya memasak makan malam, "chlivky" - tipis dan cekatan, "shorek" - persilangan antara musang, musang dan pembuka botol, "menyelam" - ​​melompat, menyelam, berputar, "nava" - rumput di bawah jam matahari (memanjang sedikit ke kanan , sedikit ke kiri dan sedikit ke belakang), "mendengus" - mendengus dan tertawa, "zelyuk" - kalkun hijau, "myumzik" - seekor burung; bulunya acak-acakan dan menonjol ke segala arah, seperti sapu, "mova" - jauh dari rumah) .

Salah satu konsep utama logika modern dan linguistik teoretis, digunakan dalam studi bahasa dari berbagai kalkulus logis dan matematika, bahasa alami, untuk menggambarkan hubungan antara bahasa dari "tingkat" yang berbeda dan untuk mengkarakterisasi hubungan antara bahasa yang dipertimbangkan dan bidang studi yang dijelaskan dengan bantuan mereka, adalah konsep metabahasa. Metabahasa adalah bahasa yang digunakan untuk mengungkapkan penilaian tentang bahasa lain, bahasa-objek. Dengan bantuan metabahasa, mereka mempelajari struktur kombinasi karakter (ekspresi) bahasa-objek, membuktikan teorema tentang sifat ekspresifnya, tentang hubungannya dengan bahasa lain, dll. Bahasa yang dipelajari juga disebut bahasa subjek di kaitannya dengan metabahasa ini. Baik bahasa subjek maupun metabahasa dapat berupa bahasa biasa (alami). Metabahasa mungkin berbeda dari bahasa objek (misalnya, dalam buku teks bahasa Inggris untuk bahasa Rusia, bahasa Rusia adalah bahasa meta, dan bahasa Inggris adalah bahasa objek), tetapi mungkin juga bertepatan dengannya atau hanya berbeda sebagian, misalnya, dalam terminologi khusus. (Terminologi linguistik Rusia adalah elemen metabahasa untuk mendeskripsikan bahasa Rusia, yang disebut faktor semantik adalah bagian dari metabahasa untuk mendeskripsikan semantik bahasa alami).

Konsep "metalinguage" menjadi sangat bermanfaat sehubungan dengan studi bahasa formal yang dibangun dalam kerangka logika matematika. Tidak seperti bahasa subjek yang diformalkan, dalam hal ini metabahasa, yang dengannya metateori dirumuskan (mempelajari sifat-sifat teori subjek yang dirumuskan dalam bahasa subjek), biasanya adalah bahasa alami biasa, dalam beberapa cara khusus. penggalan bahasa alami yang dibatasi dengan cara khusus, tidak mengandung ambiguitas apa pun. , metafora, konsep "metafisik", dll. elemen bahasa biasa yang mencegah penggunaannya sebagai alat untuk penelitian ilmiah yang akurat. Pada saat yang sama, metabahasa itu sendiri dapat diformalkan dan (terlepas dari ini) menjadi subjek penelitian yang dilakukan melalui bahasa metameta, dan rangkaian semacam itu dapat "dianggap" tumbuh tanpa batas.

Logika mengajarkan kita perbedaan yang bermanfaat antara bahasa-objek dan metabahasa. Objek bahasa adalah subjek penelitian logis, dan metabahasa adalah bahasa buatan yang tak terelakkan di mana penelitian semacam itu dilakukan. Pemikiran logis hanya terdiri dari merumuskan hubungan dan struktur bahasa nyata (bahasa objek) dalam bahasa simbol (metalanguage).

Bagaimanapun, metabahasa harus "tidak lebih buruk" dari bahasa objektifnya (yaitu, untuk setiap ekspresi yang terakhir dalam metabahasa harus ada namanya, "terjemahan") - jika tidak, jika persyaratan ini tidak terpenuhi (yang tentunya membutuhkan tempatkan dalam bahasa alami, jika kesepakatan khusus tidak memberikan sebaliknya) paradoks semantik (antinomi) muncul.

Karena semakin banyak bahasa pemrograman baru yang dibuat, sehubungan dengan masalah penerjemah pemrograman, ada kebutuhan mendesak untuk membuat bahasa meta. Saat ini, metalanguage bentuk Backus-Naur (disingkat BNF) adalah yang paling umum digunakan untuk mendeskripsikan sintaks bahasa pemrograman. Ini adalah bentuk kompak dalam bentuk beberapa rumus yang mirip dengan rumus matematika. Untuk setiap konsep bahasa ada metaformula (formula normal) yang unik. Terdiri dari bagian kiri dan kanan. Sisi kiri menentukan konsep yang didefinisikan, dan sisi kanan menentukan kumpulan konstruksi bahasa yang dapat diterima yang digabungkan ke dalam konsep ini. Rumus menggunakan metakarakter khusus dalam bentuk kurung sudut, yang berisi konsep yang didefinisikan (di sisi kiri rumus) atau konsep yang telah ditentukan sebelumnya (di sisi kanannya), dan pemisahan bagian kiri dan kanan ditunjukkan dengan metakarakter "::=", yang artinya setara dengan kata "menurut definisi ada". Rumus metalinguistik disematkan pada penerjemah dalam beberapa bentuk; dengan bantuan mereka, konstruksi yang digunakan oleh pemrogram diperiksa untuk kesesuaian formal dengan salah satu konstruksi yang secara sintaksis valid dalam bahasa ini. Ada juga metabahasa terpisah dari berbagai ilmu - jadi, pengetahuan ada dalam bentuk berbagai metabahasa.

Metode logis juga menjadi dasar pembuatan sistem kecerdasan buatan berdasarkan konsep koneksionisme. Connectionism adalah tren khusus dalam ilmu filsafat, yang subjeknya adalah pertanyaan tentang pengetahuan. Dalam kerangka tren ini, upaya dilakukan untuk menjelaskan kemampuan intelektual seseorang yang menggunakan jaringan saraf tiruan. Terdiri dari sejumlah besar unit struktural yang mirip dengan neuron, dengan bobot yang ditetapkan untuk setiap elemen yang menentukan kekuatan koneksi dengan elemen lain, jaringan saraf adalah model otak manusia yang disederhanakan. Eksperimen dengan jaringan saraf semacam ini telah menunjukkan kemampuan mereka untuk belajar melakukan tugas-tugas seperti pengenalan pola, membaca, dan mengidentifikasi struktur tata bahasa sederhana.

Filsuf mulai menaruh minat pada koneksionisme, karena pendekatan koneksionis berjanji untuk memberikan alternatif terhadap teori pikiran klasik dan gagasan yang dipegang secara luas dalam teori ini bahwa cara kerja pikiran serupa dengan pemrosesan bahasa simbolik oleh digital. komputer. Konsep ini sangat kontroversial, tetapi dalam beberapa tahun terakhir semakin banyak pendukungnya.

Kajian logis bahasa melanjutkan konsep Saussure tentang bahasa sebagai suatu sistem. Fakta bahwa itu terus-menerus menegaskan sekali lagi keberanian dugaan ilmiah awal abad terakhir. Saya akan mengabdikan bagian terakhir dari pekerjaan saya untuk prospek pengembangan metode matematika dalam linguistik saat ini.

2.4 Prospek penerapan metode matematika dalam linguistik

Di era teknologi komputer, metode linguistik matematika telah mendapat perspektif perkembangan baru. Pencarian solusi atas permasalahan analisis linguistik kini semakin banyak diimplementasikan pada tataran sistem informasi. Pada saat yang sama, otomatisasi proses pemrosesan materi linguistik, yang memberikan peluang dan keuntungan yang signifikan bagi peneliti, pasti mengedepankan persyaratan dan tugas baru untuknya.

Kombinasi pengetahuan "tepat" dan "kemanusiaan" telah menjadi lahan subur bagi penemuan-penemuan baru di bidang linguistik, ilmu komputer, dan filsafat.

Terjemahan mesin dari satu bahasa ke bahasa lain tetap menjadi cabang teknologi informasi yang berkembang pesat. Terlepas dari kenyataan bahwa terjemahan dengan bantuan komputer tidak pernah dapat dibandingkan kualitasnya dengan terjemahan manusia (terutama untuk teks sastra), mesin telah menjadi asisten yang sangat diperlukan bagi seseorang dalam menerjemahkan teks dalam jumlah besar. Dipercayai bahwa dalam waktu dekat sistem terjemahan yang lebih maju akan dibuat, terutama berdasarkan analisis semantik teks.

Area yang sama-sama menjanjikan adalah interaksi linguistik dan logika, yang berfungsi sebagai landasan filosofis untuk memahami teknologi informasi dan apa yang disebut "realitas virtual". Dalam waktu dekat, pekerjaan akan dilanjutkan pada pembuatan sistem kecerdasan buatan - meskipun, sekali lagi, itu tidak akan pernah setara dengan manusia dalam kemampuannya. Persaingan seperti itu tidak ada artinya: di zaman kita, mesin seharusnya menjadi (dan menjadi) bukan saingan, tetapi asisten manusia, bukan sesuatu dari dunia fantasi, tetapi bagian dari dunia nyata.

Studi bahasa dengan metode statistik berlanjut, yang memungkinkan untuk menentukan sifat kualitatifnya dengan lebih akurat. Penting bahwa hipotesis yang paling berani tentang bahasa menemukan bukti matematis, dan karenanya logis.

Hal yang paling signifikan adalah bahwa berbagai cabang penerapan matematika dalam linguistik, yang sebelumnya cukup terisolasi, dalam beberapa tahun terakhir telah berkorelasi satu sama lain, terhubung ke dalam sistem yang koheren, dengan analogi dengan sistem bahasa yang ditemukan seabad yang lalu oleh Ferdinand de Saussure. dan Yvan Baudouin de Courtenay. Inilah kesinambungan pengetahuan ilmiah.

Linguistik di dunia modern telah menjadi landasan bagi perkembangan teknologi informasi. Selama ilmu komputer tetap menjadi cabang aktivitas manusia yang berkembang pesat, penyatuan matematika dan linguistik akan terus memainkan perannya dalam perkembangan sains.

Kesimpulan

Selama abad ke-20, teknologi komputer telah berkembang jauh - dari penggunaan militer hingga penggunaan damai, dari jangkauan tujuan yang sempit hingga penetrasi ke semua cabang kehidupan manusia. Matematika sebagai ilmu menemukan signifikansi praktis baru dengan perkembangan teknologi komputer. Proses ini berlanjut hari ini.

"Tandem" "fisikawan" dan "penulis lirik" yang sebelumnya tidak terpikirkan telah menjadi kenyataan. Untuk interaksi penuh matematika dan ilmu komputer dengan humaniora, diperlukan spesialis yang berkualifikasi dari kedua sisi. Sementara ilmuwan komputer semakin membutuhkan pengetahuan kemanusiaan yang sistematis (linguistik, budaya, filosofis) untuk memahami perubahan realitas di sekitarnya, dalam interaksi manusia dan teknologi, untuk mengembangkan konsep linguistik dan mental yang semakin baru, untuk menulis program, maka setiap "Humaniora" di zaman kita untuk pertumbuhan profesionalnya harus menguasai setidaknya dasar-dasar bekerja dengan komputer.

Matematika, yang saling terkait erat dengan informatika, terus berkembang dan berinteraksi dengan ilmu alam dan humaniora. Di abad baru, kecenderungan matematisasi sains tidak melemah, tetapi justru meningkat. Berdasarkan data kuantitatif, hukum perkembangan bahasa, karakteristik historis dan filosofisnya dipahami.

Formalisme matematika paling cocok untuk mendeskripsikan pola dalam linguistik (seperti, memang, dalam ilmu lain - baik humaniora maupun alam). Situasi terkadang berkembang dalam sains sedemikian rupa sehingga tanpa menggunakan bahasa matematika yang tepat, tidak mungkin untuk memahami sifat fisika, kimia, dll. proses tidak mungkin. Menciptakan model atom planet, fisikawan Inggris terkenal abad XX. E. Rutherford mengalami kesulitan matematika. Pada awalnya, teorinya tidak diterima: kedengarannya tidak meyakinkan, dan alasannya adalah ketidaktahuan Rutherford tentang teori probabilitas, berdasarkan mekanisme yang hanya memungkinkan untuk memahami representasi model interaksi atom. Menyadari hal ini, pada saat itu seorang ilmuwan terkemuka, pemilik Hadiah Nobel, mendaftar di seminar ahli matematika Profesor Lamb dan selama dua tahun, bersama dengan para siswa, mengikuti kursus dan mengadakan lokakarya tentang teori probabilitas. . Berdasarkan itu, Rutherford mampu mendeskripsikan perilaku elektron, memberikan model strukturalnya dengan akurasi yang meyakinkan dan mendapatkan pengakuan. Begitu pula dengan linguistik.

Ini menimbulkan pertanyaan, apa yang begitu matematis dalam fenomena objektif, berkat itu mereka dapat dijelaskan dalam bahasa matematika, dalam bahasa karakteristik kuantitatif? Ini adalah unit materi homogen yang didistribusikan dalam ruang dan waktu. Ilmu-ilmu yang telah melangkah lebih jauh dari yang lain menuju isolasi homogenitas, dan ternyata lebih cocok untuk penggunaan matematika di dalamnya.

Internet, yang berkembang pesat pada 1990-an, menyatukan perwakilan dari berbagai negara, masyarakat, dan budaya. Terlepas dari kenyataan bahwa bahasa Inggris terus menjadi bahasa utama komunikasi internasional, Internet telah menjadi multibahasa di zaman kita. Hal ini menyebabkan pengembangan sistem terjemahan mesin yang sukses secara komersial yang banyak digunakan di berbagai bidang aktivitas manusia.

Jaringan komputer telah menjadi objek refleksi filosofis - semakin banyak konsep linguistik, logis, pandangan dunia baru telah dibuat yang membantu untuk memahami "realitas virtual". Dalam banyak karya seni, skenario dibuat - lebih sering pesimistis - tentang dominasi mesin atas seseorang, dan realitas virtual - atas dunia luar. Jauh dari biasanya ramalan seperti itu ternyata tidak ada artinya. Teknologi informasi bukan hanya industri yang menjanjikan untuk menginvestasikan pengetahuan manusia, tetapi juga merupakan cara untuk mengontrol informasi, dan akibatnya, atas pemikiran manusia.

Fenomena ini memiliki sisi negatif dan positif. Negatif - karena kendali atas informasi bertentangan dengan hak asasi manusia yang tidak dapat dicabut untuk akses bebas ke sana. Positif - karena kurangnya kontrol ini dapat menyebabkan konsekuensi bencana bagi umat manusia. Cukuplah untuk mengingat salah satu film paling bijak dalam dekade terakhir - "When the World Ends" oleh Wim Wenders, yang karakternya benar-benar tenggelam dalam "realitas virtual" dari mimpi mereka sendiri yang direkam di komputer. Pada saat yang sama, tidak ada satu pun ilmuwan dan seniman yang dapat memberikan jawaban yang pasti untuk pertanyaan: apa yang menanti sains dan teknologi di masa depan.

Berfokus pada "masa depan", terkadang tampak fantastis, adalah ciri khas sains di pertengahan abad ke-20, ketika para penemu berusaha menciptakan model teknologi yang sempurna yang dapat bekerja tanpa campur tangan manusia. Waktu telah menunjukkan sifat utopis dari penelitian semacam itu. Pada saat yang sama, akan berlebihan untuk mengutuk para ilmuwan untuk ini - tanpa antusiasme mereka di tahun 1950-an - 60-an, teknologi informasi tidak akan membuat lompatan yang begitu kuat di tahun 90-an, dan kita tidak akan memiliki apa yang kita miliki sekarang.

Dekade terakhir abad ke-20 mengubah prioritas sains - penelitian, kesedihan inventif digantikan oleh kepentingan komersial. Sekali lagi, ini tidak baik atau buruk. Ini adalah realitas di mana sains semakin terintegrasi ke dalam kehidupan sehari-hari.

Abad ke-21 melanjutkan tren ini, dan di zaman kita di belakang penemuan tidak hanya ketenaran dan pengakuan, tetapi, pertama-tama, uang. Ini juga mengapa penting untuk memastikan bahwa pencapaian terbaru ilmu pengetahuan dan teknologi tidak jatuh ke tangan kelompok teroris atau rezim diktator. Tugas itu sulit sampai pada titik ketidakmungkinan; mewujudkannya semaksimal mungkin adalah tugas seluruh masyarakat dunia.

Informasi adalah senjata, dan senjata tidak kalah berbahayanya dengan senjata nuklir atau kimia - hanya saja tidak bekerja secara fisik, melainkan secara psikologis. Umat ​​\u200b\u200bmanusia perlu memikirkan apa yang lebih penting baginya dalam hal ini - kebebasan atau kendali.

Konsep filosofis terbaru yang berkaitan dengan perkembangan teknologi informasi dan upaya untuk memahaminya telah menunjukkan keterbatasan materialisme ilmu alam, yang mendominasi selama abad ke-19 dan awal abad ke-20, dan idealisme ekstrem, yang menyangkal pentingnya dunia material. . Penting bagi pemikiran modern, terutama pemikiran Barat, untuk mengatasi dualisme pemikiran ini, ketika dunia sekitarnya jelas terbagi menjadi material dan ideal. Jalan menuju ini adalah dialog budaya, perbandingan berbagai sudut pandang tentang fenomena di sekitarnya.

Paradoksnya, teknologi informasi dapat memainkan peran penting dalam proses ini. Jaringan komputer, dan terutama Internet, tidak hanya menjadi sumber hiburan dan aktivitas komersial yang kuat, tetapi juga merupakan sarana komunikasi yang bermakna dan kontroversial antara perwakilan dari berbagai peradaban di dunia modern, serta untuk dialog antara masa lalu dan masa lalu. saat ini. Kita dapat mengatakan bahwa Internet mendorong batas spasial dan temporal.

Dan dalam dialog budaya melalui teknologi informasi, peran bahasa sebagai alat komunikasi universal tertua masih penting. Itulah sebabnya linguistik, dalam interaksinya dengan matematika, filsafat, dan ilmu komputer, mengalami kelahiran keduanya dan terus berkembang hingga saat ini. Tren saat ini akan berlanjut di masa depan - "hingga akhir dunia", seperti yang diprediksi oleh V. Wenders 15 tahun lalu. Benar, tidak diketahui kapan akhir ini akan terjadi - tetapi apakah itu penting sekarang, karena bagaimanapun juga masa depan cepat atau lambat akan menjadi saat ini.

Lampiran 1

Ferdinan de Saussure

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) secara luas dianggap sebagai pendiri linguistik modern dalam upayanya untuk mendeskripsikan struktur bahasa daripada sejarah bahasa dan bentuk bahasa tertentu. Faktanya, metode Strukturalisme dalam studi linguistik dan sastra dan cabang penting Semiotika menemukan titik awal utama mereka dalam karyanya pada pergantian abad ke-20. Bahkan dikatakan bahwa kompleks strategi dan konsepsi yang kemudian disebut "poststrukturalisme" - karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, dan lainnya - disarankan oleh karya Saussure dalam pembacaan linguistik dan anagrammatik puisi Latin akhir, modernisme sastra hingga psikoanalisis dan filsafat pada awal abad ke-20. Seperti yang diperdebatkan oleh Algirdas Julien Greimas dan Joseph Courtes dalam Semiotics and Language: An Analytic Dictionary, di bawah judul "Interpretation", sebuah mode interpretasi baru muncul pada awal abad ke-20 yang mereka identifikasikan dengan linguistik Saussurean, Fenomenologi Husserlian, dan psikoanalisis Freudian. Dalam mode ini, “penafsiran tidak lagi merupakan masalah mengaitkan konten tertentu dengan suatu bentuk yang jika tidak ada akan kekurangan satu; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang setara dari elemen penanda dalam sistem semiotik tertentu” ( 159). dalam pemahaman "penafsiran" ini, bentuk dan isi tidak berbeda; sebaliknya, setiap "bentuk", sebagai alternatif, adalah "isi" semantik juga, "bentuk penanda", sehingga interpretasi menawarkan parafrase analogis dari sesuatu yang sudah menandakan dalam beberapa sistem penandaan lainnya.

Penafsiran ulang bentuk dan pemahaman seperti itu - yang dijelaskan Claude Levi-Strauss dalam salah satu artikulasinya yang paling terprogram tentang konsep strukturalisme, dalam "Struktur dan Bentuk: Refleksi pada Karya oleh Vladimir Propp" - tersirat dalam Kursus anumerta Saussure dalam General Linguistics (1916, trans., 1959, 1983). Di masa hidupnya, Saussure menerbitkan relatif sedikit, dan karya utamanya, Kursus, adalah transkripsi oleh murid-muridnya dari beberapa kursus linguistik umum yang dia tawarkan pada tahun 1907-11. Dalam Kursus Saussure menyerukan studi bahasa "ilmiah" sebagai lawan dari karya linguistik historis yang telah dilakukan pada abad ke-19. Karya itu adalah salah satu pencapaian besar kecerdasan Barat: menggunakan kata-kata tertentu sebagai blok bangunan dari bahasa, sejarah (atau "diakronis") linguistik menelusuri asal dan perkembangan bahasa Barat dari sumber bahasa umum diduga, pertama bahasa "Indo-Eropa" dan kemudian "p" sebelumnya. bahasa roto-Indo-Eropa".

Tepatnya studi tentang kemunculan kata-kata yang unik ini, dengan asumsi bersamaan bahwa "unit" dasar bahasa, pada kenyataannya, adalah keberadaan positif dari "elemen-elemen kata" ini, yang dipertanyakan oleh Saussure. Karyanya merupakan upaya untuk mereduksi banyak fakta tentang bahasa, yang dipelajari dengan cermat oleh linguistik historis, menjadi sejumlah proposisi yang dapat dikelola. "Mazhab komparatif" Filologi abad ke-19, kata Saussure dalam Kursus, "tidak berhasil membangun ilmu linguistik yang sebenarnya" karena "gagal mencari sifat objek studinya" (3). "Sifat" itu, menurutnya, dapat ditemukan tidak hanya dalam kata-kata "elemental" yang terdiri dari suatu bahasa - fakta (atau "substansi") bahasa yang tampak "positif" - tetapi dalam hubungan formal yang memunculkannya. "zat."

Pemeriksaan ulang sistematis bahasa Saussure didasarkan pada tiga asumsi. Yang pertama adalah bahwa studi ilmiah bahasa perlu mengembangkan dan mempelajari sistem daripada sejarah fenomena linguistik. Untuk alasan ini, dia membedakan antara kejadian bahasa tertentu - khususnya "peristiwa-bicara", yang ia tunjuk sebagai parole - dan objek linguistik yang tepat, sistem (atau "kode") yang mengatur peristiwa-peristiwa itu, yang ia tunjuk sebagai langue. Studi sistematis semacam itu, terlebih lagi, membutuhkan "sinkronis" konsepsi hubungan antara unsur-unsur bahasa pada saat tertentu daripada studi "diakronis" perkembangan bahasa melalui sejarah.

Asumsi ini memunculkan apa yang Roman Jakobson pada tahun 1929 datang untuk menunjuk sebagai "strukturalisme," di mana "setiap rangkaian fenomena yang diperiksa oleh sains kontemporer diperlakukan bukan sebagai aglomerasi mekanis tetapi sebagai keseluruhan struktural konsepsi proses mekanis menghasilkan pertanyaan. dari fungsinya" ("Romantis" 711). Dalam bagian ini Jakobson mengartikulasikan niat Saussure untuk mendefinisikan linguistik sebagai sistem ilmiah sebagai lawan dari akuntansi "mekanis" sederhana dari kecelakaan sejarah. Selain itu, Jakobson juga menjelaskan asumsi dasar kedua dalam Saussurean - kita dapat sekarang menyebutnya "struktural" - linguistik: bahwa unsur-unsur dasar bahasa hanya dapat dipelajari dalam kaitannya dengan fungsi mereka daripada dalam kaitannya dengan penyebabnya. "Kata-kata" Eropa, peristiwa dan entitas itu harus ditempatkan dalam kerangka sistemik di mana mereka terkait dengan apa yang disebut peristiwa dan entitas lain.Ini adalah reorientasi radikal dalam memahami pengalaman dan fenomena, yang kepentingannya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu baru Galileo yang pada abad ketujuh belas mengubah seluruh kita. konsep dunia fisik" (dikutip dalam Culler, Pursuit 2 4). Perubahan ini, seperti yang dicatat oleh Greimas dan Courtes, memahami kembali "interpretasi" dan dengan demikian memahami kembali penjelasan dan pemahaman itu sendiri. Alih-alih penjelasan "berada dalam kerangka sebab-sebab suatu fenomena, sehingga, sebagai suatu "akibat", ia dalam beberapa hal berada di bawah sebab-sebabnya, penjelasan di sini terdiri dari mensubordinasikan suatu fenomena ke "fungsi" berorientasi masa depan atau "tujuan." Penjelasan tidak lagi terlepas dari niat atau tujuan manusia (walaupun niat itu bisa bersifat impersonal, komunal, atau, dalam istilah Freudian, "tidak sadar").

Dalam linguistiknya, Saussure menyelesaikan transformasi ini secara khusus dalam redefinisi "kata" linguistik, yang ia gambarkan sebagai "tanda" linguistik dan didefinisikan dalam istilah fungsionalis. Tanda, menurutnya, adalah penyatuan "sebuah konsep dan citra suara," yang disebutnya "petanda dan penanda" (66-67; terjemahan Roy Harris tahun 1983 menawarkan istilah "penandaan" dan "sinyal"). Sifat dari "kombinasi" mereka adalah "fungsional" karena baik petanda maupun penanda bukanlah "penyebab" dari yang lain; melainkan, "masing-masing nilainya dari yang lain" (8). , secara relasional dan membuat asumsi dasar linguistik historis, yaitu, identitas unit unsur bahasa dan penandaan (yaitu, "kata"), tunduk pada analisis yang ketat. kata "pohon" sebagai kata "sama" bukan karena kata itu didefinisikan oleh kualitas-kualitas yang melekat - itu bukan "penggumpalan mekanis" dari kualitas-kualitas semacam itu - tetapi karena itu didefinisikan sebagai elemen dalam suatu sistem, "keseluruhan struktural" dari bahasa.

Definisi entitas relasional (atau "diakritik") seperti itu mengatur konsepsi semua elemen bahasa dalam linguistik struktural. Ini paling jelas dalam pencapaian linguistik Saussurean yang paling mengesankan, pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah unit terkecil yang diartikulasikan dan menandakan bahasa. Itu bukanlah bunyi-bunyi yang muncul dalam bahasa, melainkan "citra-citra bunyi" yang disebutkan Saussure, yang ditangkap oleh penutur - ditangkap secara fenomenal - sebagai penyampaian makna. (Dengan demikian, Elmar Holenstein menggambarkan linguistik Jakobson, yang mengikuti Saussure dengan cara yang penting, sebagai "strukturalisme fenomenologis.") Karena alasan inilah juru bicara terkemuka untuk Strukturalisme Sekolah Praha, Jan Mukarovsky, mencatat pada tahun 1937 bahwa "struktur . . . adalah fenomenologis dan bukan realitas empiris; itu bukan kerja itu sendiri, tetapi seperangkat hubungan fungsional yang terletak dalam kesadaran kolektif (generasi, lingkungan, dll.)" (dikutip dalam Galan 35). Demikian pula, Levi-Strauss, juru bicara terkemuka untuk strukturalisme Prancis , mencatat pada tahun 1960 bahwa "struktur tidak memiliki konten yang berbeda; itu adalah konten itu sendiri, dan organisasi logis di mana ia ditangkap dipahami sebagai properti yang nyata" (167; lihat juga Jakobson, Fundamentals 27-28).

Dengan demikian, fonem, elemen bahasa yang paling kecil dan dapat dicerap, bukanlah objek positif, melainkan sebuah "realitas fenomenologis". Dalam bahasa Inggris, misalnya, fonem /t/ dapat dilafalkan dengan berbagai cara, tetapi dalam semua kasus penutur bahasa Inggris akan mengenalinya berfungsi sebagai a /t/. Suara t yang disedot (yaitu, t diucapkan dengan nafas seperti huruf h setelahnya), suara t bernada tinggi atau rendah, suara t yang diperpanjang, dan seterusnya, semuanya akan berfungsi dengan cara yang sama dalam membedakan arti dari "to" dan "do" dalam bahasa Inggris. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi fonologis dalam satu bahasa dapat menjadi fonem yang berbeda di bahasa lain; dengan demikian, bahasa Inggris membedakan antara /l/ dan /r/, sedangkan bahasa lain sangat terstruktur sehingga artikulasi ini dianggap sebagai variasi dari fonem yang sama (seperti t yang diaspirasi dan tidak diaspirasi dalam bahasa Inggris). Dalam setiap bahasa alami, sejumlah besar kemungkinan kata merupakan kombinasi dari sejumlah kecil fonem. Bahasa Inggris, misalnya, memiliki kurang dari 40 fonem yang bergabung membentuk lebih dari satu juta kata yang berbeda.

Fonem bahasa itu sendiri merupakan struktur fitur yang terorganisir secara sistematis. Pada tahun 1920-an dan 1930-an, mengikuti petunjuk Saussure, Jakobson dan N. S. Trubetzkoy mengisolasi "ciri-ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur fisiologis alat bicara - lidah, gigi, pita suara, dan sebagainya - yang Saussure menyebutkan dalam Kursus dan yang digambarkan Harris sebagai "fonetik fisiologis" (39; terjemahan awal Baskin menggunakan istilah "fonologi" [(1959) 38]) - dan mereka bergabung dalam "kumpulan" oposisi biner untuk membentuk fonem. Misalnya, dalam bahasa Inggris perbedaan antara /t/ dan /d/ adalah ada atau tidak adanya "suara" (keterikatan pita suara), dan pada tingkat menyuarakan fonem-fonem ini secara timbal balik menentukan satu sama lain. Dengan cara ini, fonologi adalah contoh spesifik dari aturan umum bahasa yang dijelaskan oleh Saussure: Dalam bahasa hanya ada perbedaan. bahkan lebih penting lagi: suatu perbedaan umumnya mengimplikasikan istilah-istilah positif di mana perbedaan itu dibuat; tetapi dalam bahasa hanya ada perbedaan tanpa istilah positif. Apakah kita mengambil petanda atau penanda, bahasa tidak memiliki gagasan atau bunyi yang ada sebelum sistem linguistik. ( 120)

Dalam kerangka ini, identitas linguistik ditentukan bukan oleh kualitas yang melekat tetapi oleh hubungan sistemik ("struktural").

Saya telah mengatakan bahwa fonologi "mengikuti jejak" Saussure, karena meskipun analisisnya tentang fisiologi produksi bahasa "saat ini," seperti kata Harris, "disebut" fisik ", bukan "psikologis" atau "fungsional". "" (Bacaan 49), akibatnya dalam Kursus ia mengartikulasikan arah dan garis besar analisis fungsional bahasa. Demikian pula, satu-satunya karya terbitannya yang diperluas, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Memoir tentang sistem vokal primitif dalam bahasa Indo-Eropa), yang muncul pada tahun 1878, sepenuhnya terletak di dalam proyek abad ke-19. linguistik sejarah abad. Namun demikian, dalam karya ini, seperti yang dikatakan Jonathan Culler, Saussure menunjukkan "kesuburan pemikiran bahasa sebagai sistem item relasional murni, bahkan ketika mengerjakan tugas rekonstruksi sejarah" (Saussure 66). Dengan menganalisis hubungan struktural sistematis di antara fonem untuk memperhitungkan pola pergantian vokal dalam bahasa Indo-Eropa yang ada, Saussure menyarankan bahwa selain beberapa fonem berbeda /a/, pasti ada fonem lain yang dapat dijelaskan secara formal. "Apa yang membuat karya Saussure begitu mengesankan," Culler menyimpulkan, "adalah kenyataan bahwa hampir lima puluh tahun kemudian, ketika paku Het ditemukan dan diuraikan, ditemukan mengandung fonem, ditulis h, yang berperilaku seperti prediksi Saussure. . Dia telah menemukan, dengan analisis murni formal, apa yang sekarang dikenal sebagai laring Indo-Eropa" (66).

Konsepsi penentuan relasional atau diakritik dari unsur-unsur penandaan, yang tersirat dan eksplisit dalam Kursus, menunjukkan asumsi ketiga yang mengatur linguistik struktural, yang disebut Saussure sebagai "sifat tanda yang sewenang-wenang". Dengan ini dia bermaksud bahwa hubungan antara penanda dan petanda dalam bahasa tidak pernah diperlukan (atau "termotivasi"): seseorang dapat dengan mudah menemukan penanda suara arbre sebagai pohon penanda untuk bersatu dengan konsep "pohon". Tetapi lebih dari itu, ini berarti bahwa yang ditandakan juga arbitrer: seseorang dapat dengan mudah mendefinisikan konsep "pohon" berdasarkan kualitas kayunya (yang akan mengecualikan pohon palem) maupun ukurannya (yang mengecualikan "tanaman berkayu rendah" yang kita semak panggilan). Ini harus memperjelas bahwa penomoran asumsi yang telah saya sajikan tidak mewakili urutan prioritas: setiap asumsi - sifat sistemik dari penandaan (paling baik dipahami dengan mempelajari bahasa "secara sinkron"), sifat relasional atau "diakritik" dari unsur-unsur tersebut penandaan, sifat tanda yang sewenang-wenang - mendapatkan nilainya dari yang lain.

Artinya, linguistik Saussurean fenomena yang dipelajarinya dalam hubungan kombinasi dan kontras yang menyeluruh dalam bahasa. Dalam konsepsi ini, bahasa adalah proses mengartikulasikan makna (penandaan) dan produknya (komunikasi), dan kedua fungsi bahasa ini tidak identik atau sepenuhnya kongruen (lihat Schleifer, "Dekonstruksi"). Di sini, kita dapat melihat pergantian antara bentuk dan isi yang dijelaskan oleh Greimas dan Courtes dalam interpretasi modernis: bahasa menghadirkan kontras yang secara formal mendefinisikan unit-unitnya, dan unit-unit ini bergabung pada tingkat-tingkat berikutnya untuk menciptakan konten yang menandakan. Karena unsur-unsur bahasa bersifat arbitrer, maka baik kontras maupun kombinasi tidak dapat dikatakan mendasar. Dengan demikian, dalam bahasa gabungan ciri-ciri khas membentuk fonem kontras pada tingkat pemahaman yang lain, fonem bergabung membentuk morfem kontras, morfem bergabung membentuk kata, kata bergabung membentuk kalimat, dan seterusnya. Dalam setiap contoh, seluruh fonem, atau kata, atau kalimat, dan seterusnya, lebih besar dari jumlah bagian-bagiannya (seperti air, H2O, dalam contoh Saussure [(1959) 103] lebih dari aglomerasi mekanik). hidrogen dan oksigen).

Tiga asumsi Kursus Linguistik Umum membuat Saussure menyerukan ilmu baru abad kedua puluh yang akan melampaui ilmu linguistik untuk mempelajari "kehidupan tanda-tanda dalam masyarakat." Saussure menamai ilmu ini "semiologi (dari bahasa Yunani semeion "tanda")" (16). "Ilmu" semiotika, seperti yang dipraktikkan di Eropa Timur pada 1920-an dan 1930-an dan Paris pada 1950-an dan 1960-an, memperluas studi struktur bahasa dan linguistik ke artefak sastra yang dibentuk (atau diartikulasikan) oleh struktur tersebut. Selain itu, sepanjang bagian akhir karirnya, bahkan ketika dia menawarkan kursus linguistik umum, Saussure mengejar analisis "semiotik" miliknya sendiri tentang puisi Latin akhir dalam upaya untuk menemukan anagram nama diri yang sengaja disembunyikan. Metode penelitiannya dalam banyak hal berlawanan dengan rasionalisme fungsional dari analisis linguistiknya: ia berusaha, seperti yang disebutkan Saussure dalam salah satu dari 99 buku catatan tempat ia melakukan penelitian ini, untuk memeriksa secara sistematis masalah "kebetulan", yang " menjadi fondasi yang tak terhindarkan dari segalanya" (dikutip dalam Starobinski 101). Studi semacam itu, seperti yang dikatakan Saussure sendiri, berfokus pada "fakta material" tentang kebetulan dan makna (dikutip 101), sehingga "kata-tema" yang anagramnya dicari Saussure, seperti yang dikatakan Jean Starobinski, "adalah, untuk penyair. , instrumen, dan bukan kuman vital puisi. Puisi itu diharuskan menggunakan kembali bahan fonik dari kata-tema" (45). Dalam analisis ini, Starobinski mengatakan, "Saussure tidak tersesat dalam pencarian makna tersembunyi." Sebaliknya, karyanya tampaknya menunjukkan keinginan untuk menghindari semua masalah yang timbul dari kesadaran: "Karena puisi tidak hanya diwujudkan dalam kata-kata tetapi merupakan sesuatu yang lahir dari kata-kata, ia lolos dari kendali kesadaran yang sewenang-wenang untuk bergantung hanya pada semacam legalitas linguistik. "(121).

Yaitu, upaya Saussure untuk menemukan nama yang tepat dalam puisi Latin akhir - apa yang disebut Tzvetan Todorov sebagai reduksi dari "kata . . . ke penandanya" (266) - menekankan salah satu elemen yang mengatur analisis linguistiknya, sifat tanda yang sewenang-wenang. (Ini juga menekankan sifat formal linguistik Saussurean - "Bahasa," tegasnya, "adalah bentuk dan bukan suatu substansi" - yang menghilangkan semantik secara efektif sebagai objek utama analisis.) Seperti yang disimpulkan Todorov, karya Saussure saat ini tampak sangat homogen dalam penolakannya untuk menerima fenomena simbolik. . . . Dalam penelitiannya tentang anagram, dia hanya memperhatikan fenomena pengulangan, bukan fenomena pembangkitan. . . . Dalam studinya tentang Nibelungen, dia mengenali simbol hanya untuk mengaitkannya dengan pembacaan yang salah: karena tidak disengaja, simbol tidak ada. Akhirnya dalam kursusnya tentang linguistik umum, dia merenungkan keberadaan semiologi, dan dengan demikian tanda-tanda selain yang linguistik; tetapi penegasan ini sekaligus dibatasi oleh fakta semiologi dikhususkan untuk satu jenis tanda: yang arbitrer. (269-70)

Jika ini benar, itu karena Saussure tidak dapat memahami "niat" tanpa subjek; dia tidak bisa lepas dari pertentangan antara bentuk dan konten yang karyanya banyak dipertanyakan. Sebaliknya, dia menggunakan "legalitas linguistik". Terletak di antara, di satu sisi, konsepsi sejarah abad ke-19, subjektivitas, dan cara interpretasi kausal yang diatur oleh konsepsi-konsepsi ini dan, di sisi lain, konsepsi "strukturalis" abad ke-20 tentang apa yang disebut Levi-Strauss sebagai "Kantianisme tanpa subjek transendental" (dikutip dalam Connerton 23) - konsep yang menghapus pertentangan antara bentuk dan isi (atau subjek dan objek) dan hierarki latar depan dan latar belakang dalam strukturalisme penuh, psikoanalisis, dan bahkan mekanika kuantum - karya Ferdinand de Saussure dalam linguistik dan semiotika membatasi momen sinyal dalam studi tentang makna dan budaya.

Ronald Schleifer

Lampiran 2

Ferdinand de Saussure (terjemahan)

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) dianggap sebagai pendiri linguistik modern - berkat usahanya untuk mendeskripsikan struktur bahasa, daripada sejarah bahasa individu dan bentuk kata. Pada umumnya, fondasi metode struktural dalam linguistik dan kritik sastra dan, sebagian besar, semiotika diletakkan dalam karya-karyanya pada awal abad ke-20. Terbukti bahwa metode dan konsep yang disebut "post-strukturalisme", yang dikembangkan dalam karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes dan lainnya, kembali ke karya linguistik Saussure dan pembacaan anagramtik puisi Romawi akhir. Perlu dicatat bahwa karya Saussure tentang linguistik dan interpretasi linguistik membantu menghubungkan berbagai disiplin intelektual - dari fisika hingga inovasi sastra, psikoanalisis, dan filsafat awal abad ke-20. A. J. Greimas dan J. Kurte menulis dalam Semiotika dan Bahasa: “Kamus analitis dengan judul “Interpretasi” sebagai jenis interpretasi baru muncul pada awal abad ke-20 bersama dengan linguistik Saussure, fenomenologi Husserl dan psikoanalisis dari Freud. Dalam kasus seperti itu, "penafsiran bukanlah atribusi konten tertentu ke bentuk yang tidak memilikinya; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang sama dari elemen penting dalam sistem semiotik tertentu" (159 ). Dalam pengertian "penafsiran" ini, bentuk dan isi tidak dapat dipisahkan; sebaliknya, setiap bentuk diisi dengan makna semantik ("bentuk bermakna"), sehingga interpretasi menawarkan penceritaan kembali yang baru dan serupa tentang sesuatu yang bermakna dalam sistem tanda lain.

Pemahaman serupa tentang bentuk dan isi, dikemukakan oleh Claude Lévi-Strauss dalam salah satu karya terprogram strukturalisme, ("Struktur dan Bentuk: Refleksi pada Karya Vladimir Propp"), dapat dilihat dalam buku anumerta Saussure, A Course in Linguistik Umum (1916, trans., 1959, 1983). Selama masa hidupnya, Saussure menerbitkan sedikit, "Kursus" - pekerjaan utamanya - dikumpulkan dari catatan siswa yang menghadiri kuliahnya tentang linguistik umum pada tahun 1907-11. Dalam Kursus, Saussure menyerukan studi bahasa "ilmiah", membandingkannya dengan linguistik sejarah komparatif abad ke-19. Karya ini dapat dianggap sebagai salah satu pencapaian terbesar pemikiran Barat: berdasarkan kata-kata individu sebagai elemen struktural bahasa, linguistik historis (atau "diakronis") membuktikan asal dan perkembangan bahasa-bahasa Eropa Barat dari bahasa Indo-Eropa yang umum - dan Proto-Indo-Eropa sebelumnya.

Justru studi tentang kemunculan unik kata-kata ini, dengan asumsi bersamaan bahwa "unit" dasar bahasa sebenarnya adalah keberadaan positif dari "elemen kata" inilah yang dipertanyakan Saussure. Karyanya adalah upaya untuk mereduksi banyak fakta tentang bahasa yang dipelajari dengan santai oleh linguistik komparatif menjadi sejumlah kecil teorema. Sekolah filologi komparatif abad ke-19, tulis Saussure, "tidak berhasil menciptakan sekolah linguistik yang nyata" karena "tidak memahami esensi objek studi" (3). "Esensi" ini, menurutnya, tidak hanya terletak pada kata-kata individual - "substansi positif" bahasa - tetapi juga pada koneksi formal yang membantu keberadaan substansi ini.

"Ujian" bahasa Saussure didasarkan pada tiga asumsi. Pertama, pemahaman ilmiah tentang bahasa tidak didasarkan pada sejarah, tetapi pada fenomena struktural. Oleh karena itu, ia membedakan antara fenomena individu bahasa - "peristiwa ucapan", yang ia definisikan sebagai "parole" - dan yang tepat, menurut pendapatnya, objek studi linguistik, sistem (kode, struktur) yang mengontrol peristiwa ini ( "bahasa"). Kajian yang sistematis seperti itu, apalagi, membutuhkan konsepsi "sinkron" tentang hubungan antara unsur-unsur bahasa pada saat tertentu, daripada kajian "diakronis" tentang perkembangan bahasa melalui sejarahnya.

Hipotesis ini adalah pendahulu dari apa yang oleh Roman Jakobson pada tahun 1929 disebut "strukturalisme" - sebuah teori di mana "serangkaian fenomena apa pun yang diselidiki oleh sains modern dianggap bukan sebagai akumulasi mekanis, tetapi sebagai keseluruhan struktural di mana komponen konstruktif berkorelasi dengan fungsi" ("Romantis "711). Dalam bagian ini, Jakobson merumuskan gagasan Saussure tentang mendefinisikan bahasa sebagai struktur, sebagai lawan dari pencacahan "mekanis" peristiwa sejarah. Selain itu, Jakobson mengembangkan asumsi Saussurean lain, yang menjadi cikal bakal linguistik struktural: elemen dasar bahasa harus dipelajari tidak begitu banyak hubungannya dengan penyebabnya, tetapi dengan fungsinya. Fenomena dan peristiwa terpisah (katakanlah, sejarah asal mula kata-kata Indo-Eropa individu) harus dipelajari bukan dengan sendirinya, tetapi dalam suatu sistem yang berkorelasi dengan komponen serupa. Ini adalah perubahan radikal dalam membandingkan fenomena dengan realitas di sekitarnya, yang signifikansinya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu Galileo, yang pada abad ketujuh belas menjungkirbalikkan gagasan tentang dunia material." akibatnya, penjelasannya sendiri. Fenomena mulai diinterpretasikan bukan dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan efek yang dapat ditimbulkannya di masa sekarang dan masa depan.Interpretasi tidak lagi terlepas dari niat seseorang (terlepas dari kenyataan bahwa niat dapat bersifat impersonal, "tidak sadar" dalam arti kata Freudian).

Dalam linguistiknya, Saussure secara khusus menunjukkan pergantian konsep kata dalam linguistik, yang ia definisikan sebagai tanda dan dijelaskan dalam kaitannya dengan fungsinya. Tanda baginya adalah kombinasi antara bunyi dan makna, "signified and designation" (66-67; dalam terjemahan bahasa Inggris tahun 1983 oleh Roy Harris - "signification" dan "signal"). Sifat senyawa ini adalah "fungsional" (baik salah satu maupun unsur lainnya tidak dapat ada tanpa satu sama lain); selain itu, "yang satu meminjam kualitas dari yang lain" (8). Jadi, Saussure mendefinisikan elemen struktural utama bahasa - tanda - dan menjadikan dasar linguistik historis sebagai identitas tanda pada kata-kata, yang membutuhkan analisis yang sangat ketat. Oleh karena itu, kita dapat memahami arti yang berbeda dari, katakanlah, kata "pohon" yang sama - bukan karena kata tersebut hanya sekumpulan kualitas tertentu, tetapi karena kata tersebut didefinisikan sebagai elemen dalam sistem tanda, dalam "keseluruhan struktural", dalam bahasa.

Konsep kesatuan relatif ("diakritik") seperti itu mendasari konsep semua elemen bahasa dalam linguistik struktural. Ini sangat jelas dalam penemuan linguistik Saussurean yang paling orisinal, dalam pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah unit bahasa terkecil yang diucapkan dan bermakna. Itu bukan hanya suara yang muncul dalam bahasa, tetapi "gambaran suara", kata Saussure, yang dianggap oleh penutur asli memiliki makna. (Perlu dicatat bahwa Elmar Holenstein menyebut linguistik Jakobson, yang melanjutkan gagasan dan konsep Saussure dalam ketentuan utamanya, "strukturalisme fenomenologis"). Itulah sebabnya pembicara terkemuka dari Sekolah Strukturalisme Praha, Jan Mukarowski, mengamati pada tahun 1937 bahwa “struktur. . . bukan konsep empiris, tapi fenomenologis; itu bukanlah hasil itu sendiri, tetapi serangkaian hubungan signifikan dari kesadaran kolektif (generasi, orang lain, dll.)”. Pemikiran serupa diungkapkan pada tahun 1960 oleh Lévi-Strauss, pemimpin strukturalisme Prancis: “Struktur tidak memiliki isi yang pasti; itu sendiri bermakna, dan konstruksi logis yang melingkupinya adalah jejak realitas.

Pada gilirannya, fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili "realitas fenomenologis" integral yang terpisah. Misalnya, dalam bahasa Inggris, bunyi "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, orang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Disedot, dinaikkan atau diturunkan, bunyi "t" yang panjang, dll. Akan sama-sama membedakan arti kata "to" dan "do". Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi satu bunyi dalam satu bahasa dapat sesuai dengan fonem yang berbeda di bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain keduanya adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan dan tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah sekumpulan kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi bahasa adalah seperangkat fitur yang diatur secara sistematis. Pada 1920-an -1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara - Saussure memperhatikan hal ini dalam "Kursus Linguistik Umum", dan Harris menyebutnya "fonetik fisiologis" (dalam terjemahan Baskin sebelumnya, istilah "fonologi " digunakan) - mereka terhubung dalam "simpul » durg melawan teman untuk membuat suara. Misalnya, dalam bahasa Inggris, perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara), dan tingkat suara yang membedakan satu fonem dari fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa." Yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa syarat yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Saya telah menyebutkan bahwa fonologi dalam perkembangannya bersandar pada pemikiran Saussure. Meskipun analisisnya tentang fisiologi linguistik di zaman modern, kata Harris, "akan disebut 'fisik', berlawanan dengan 'psikologis' atau 'fungsional', dalam The Course dia dengan jelas mengartikulasikan arah dan prinsip dasar analisis fungsional bahasa. Satu-satunya karyanya yang diterbitkan selama hidupnya, Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes (Catatan tentang sistem vokal asli dalam bahasa Indo-Eropa), diterbitkan pada tahun 1878, sepenuhnya sejalan dengan linguistik historis komparatif dari abad ke-19. Namun demikian, dalam karya ini, kata Jonathan Culler, Saussure menunjukkan "keberhasilan gagasan bahasa sebagai sistem fenomena yang saling berhubungan, bahkan dengan rekonstruksi sejarahnya." Menganalisis hubungan antar fonem, menjelaskan pergantian vokal dalam bahasa modern kelompok Indo-Eropa, Saussure menyarankan bahwa selain beberapa bunyi "a" yang berbeda, harus ada fonem lain yang dijelaskan secara formal. “Apa yang membuat kesan khusus dalam karya Saussure,” Kaller menyimpulkan, “adalah bahwa hampir 50 tahun kemudian, ketika kuneiform Het ditemukan dan diuraikan, sebuah fonem ditemukan, dalam tulisan yang dilambangkan dengan “h”, yang berperilaku seperti prediksi Saussure. Melalui analisis formal, ia menemukan apa yang sekarang dikenal sebagai suara parau dalam bahasa Indo-Eropa.

Dalam konsep definisi tanda relatif (diakritik), baik eksplisit maupun tersirat dalam Kursus, ada asumsi kunci ketiga dari linguistik struktural, yang disebut oleh Saussure sebagai "sifat tanda yang sewenang-wenang". Artinya, hubungan antara bunyi dan makna dalam bahasa tidak dimotivasi oleh apa pun: seseorang dapat dengan mudah menghubungkan kata "arbre" dan kata "pohon" dengan konsep "pohon". Selain itu, ini berarti bahwa bunyinya juga sewenang-wenang: seseorang dapat mendefinisikan konsep "pohon" dengan adanya kulit kayu (kecuali pohon palem) dan ukurannya (kecuali untuk "tumbuhan berkayu rendah" - semak). Dari sini harus jelas bahwa semua asumsi yang saya sajikan tidak dibagi menjadi lebih dan kurang penting: masing-masing - sifat sistemik tanda (paling dapat dipahami dalam studi bahasa "sinkron"), esensi relatif (diakritik) mereka , sifat tanda yang sewenang-wenang - berasal dari yang lain.

Jadi, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai sekumpulan perbandingan dan pertentangan bahasa. Bahasa adalah ekspresi dari arti kata (penunjukan) dan hasilnya (komunikasi) - dan kedua fungsi ini tidak pernah bersamaan (lihat "Dekonstruksi Bahasa" Shleifer). Kita dapat melihat pergantian bentuk dan isi yang dijelaskan oleh Greimas dan Kurte dalam interpretasi versi terbaru: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi pada tingkat yang berurutan untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Artinya dalam suatu bahasa, ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem kontras, morfem - menjadi kata, kata - menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari jumlah bagian-bagiannya (seperti air, dalam contoh Saussure, lebih dari kombinasi hidrogen dan oksigen).

Tiga asumsi dari "Kursus Linguistik Umum" mengarahkan Saussure pada gagasan tentang ilmu baru abad ke-20, terpisah dari linguistik, mempelajari "kehidupan tanda dalam masyarakat". Saussure menyebut sains ini semiologi (dari bahasa Yunani "semeion" - tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada tahun 1920-an dan 1930-an dan di Paris pada tahun 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan-temuan sastra yang disusun (atau dirumuskan) dengan struktur tersebut. Selain itu, di masa senja karirnya, sejalan dengan kursusnya di bidang linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini adalah upaya, seperti yang ditulis Saussure di salah satu dari 99 buku catatan, untuk mempelajari dalam sistem masalah "probabilitas", yang "menjadi dasar dari segalanya. " Investigasi semacam itu, klaim Saussure sendiri, membantu untuk fokus pada "sisi nyata" dari probabilitas; "Kata kunci" yang dicari anagramnya oleh Saussure, menurut Jean Starobinsky, "alat bagi penyair, dan bukan sumber kehidupan bagi puisi itu." Puisi berfungsi untuk membalikkan bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, terlihat keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran: “karena puisi diekspresikan tidak hanya dengan kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa.”

Upaya Saussure untuk mempelajari nama yang tepat dalam puisi Romawi akhir (Tsvetan Todorov menyebut ini singkatan dari "sebuah kata ... hanya sebelum ditulis") menekankan salah satu komponen analisis linguistiknya - sifat tanda yang sewenang-wenang, serta esensi formal linguistik Saussurean ("Bahasa," klaimnya, "inti dari bentuk, bukan fenomena"), yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa tulisan-tulisan Saussure saat ini tampaknya sangat konsisten dalam keengganan mereka untuk mempelajari simbol [fenomena yang memiliki makna yang terdefinisi dengan baik]. . . . Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, dia mendefinisikan simbol hanya untuk menetapkannya ke pembacaan yang salah: jika tidak disengaja, simbol itu tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang tidak hanya menggambarkan tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semilogi hanya dapat mendeskripsikan tanda-tanda yang acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak dapat membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya hal ini berubah menjadi sebuah pertanyaan. Sebaliknya, dia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas yang didasarkan pada sejarah dan dugaan subyektif, dan metode interpretasi yang tidak disengaja berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis yang oleh Lévi-Strauss disebut "Kantianisme tanpa transenden". aktor" - menghapus konfrontasi antara bentuk dan isi (subjek dan objek), makna dan asal dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum - karya Ferlinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi makna dalam bahasa dan budaya.

Ronald Shleifer

literatur

1.Admoni V.G. Dasar-dasar teori tata bahasa / V.G. Nasihat; Akademi Ilmu Pengetahuan Uni Soviet.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metode matematika dalam linguistik. M., 1974.

4.Arnold I.V. Struktur semantik kata dalam bahasa Inggris modern dan metodologi untuk mempelajarinya. /I.V. Arnold-L .: Pendidikan, 1966. - 187 hal.

6.Bashlykov A.M. Sistem terjemahan otomatis. / SAYA. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 hal.

7.Baudouin de Courtenay: Warisan teoretis dan modernitas: Abstrak laporan konferensi ilmiah internasional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 hal.

8. A. V. Gladkiy, Unsur Linguistik Matematika. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 hal.

9. Golovin, B.N. Bahasa dan statistik. /B.N. Golovin - M., 1971. - 210 hal.

10. Zvegintsev, V.A. Linguistik teoretis dan terapan. / V.A. Zvegintsev - M., 1969. - 143 hal.

11. Kasevich, V.B. Semantik. Sintaksis. Morfologi. // V.B. Kasevich - M., 1988. - 292 hal.

12. Lekomtsev Yu.K. PENGANTAR bahasa formal linguistik / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 hal., sakit.

13. Warisan Linguistik Baudouin de Courtenay di Akhir Abad ke-20: Abstrak Konferensi Ilmiah dan Praktis Internasional 15-18 Maret 2000. - Krasnoyarsk, 2000. - 125 hal.

Matveeva G.G. Makna gramatikal tersembunyi dan identifikasi orang sosial ("potret") pembicara / G.G. Matveev. - Rostov, 1999. - 174 hal.

14. Melchuk, I.A. Pengalaman dalam membangun model linguistik “Arti<-->Teks". / I.A. Melchuk. - M., 1974. - 145 hal.

15. Nelyubin L.L. Terjemahan dan linguistik terapan / L.L. Nelyubin. - M.: Sekolah Tinggi, 1983. - 207 hal.

16. Tentang metode penelitian bahasa yang tepat: tentang apa yang disebut "linguistik matematika" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva dan lainnya - M., 1961. - 162 hal.

17. Piotrovsky L.G. Linguistik Matematika: Buku Teks / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Sekolah Tinggi, 1977. - 160 hal.

18. Dia. Teks, mesin, orang. - L., 1975. - 213 hal.

19. Dia. Linguistik Terapan / Ed. A.S.Gerda. - L., 1986. - 176 hal.

20. Revzin, I.I. model bahasa. M., 1963. Revzin, I.I. Linguistik struktural modern. Masalah dan metode. M., 1977. - 239 hal.

21. Revzin, I.I., Rozentsveig, V.Yu. Dasar-dasar terjemahan umum dan mesin / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 hal.

22. Slyusareva N.A. Teori F. de Saussure dalam terang linguistik modern / N.A. Slyusareva. - M.: Nauka, 1975. - 156 hal.

23. Burung Hantu, L.Z. Linguistik analitis / L.Z. Burung Hantu - M., 1970. - 192 hal.

24. Saussure F.de. Catatan tentang Linguistik Umum / F. de Saussure; Per. dari fr. - M.: Kemajuan, 2000. - 187 hal.

25. Dia. Kursus Linguistik Umum / Per. dari fr. - Yekaterinburg, 1999. -426 hal.

26. Statistik ucapan dan analisis teks otomatis / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 hal.

27. Stoll, P. Set. Logika. teori aksiomatik./ R. Stoll; Per. dari bahasa Inggris. - M., 1968. - 180 hal.

28. Tenier, L. Dasar-dasar sintaks struktural. M., 1988.

29. Ubin I.I. Otomasi kegiatan penerjemahan di USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 hal.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematika Modern. M., 1966.

31. Shenk, R. Pemrosesan informasi konseptual. M., 1980.

32. Shikhanovich, Yu.A. PENGANTAR matematika modern (konsep awal). M., 1965

33. Shcherba L.V. Vokal Rusia dalam istilah kualitatif dan kuantitatif / L.V. Shcherba - L.: Nauka, 1983. - 159 hal.

34. Abdullah-zade F. Warga dunia // Spark - 1996. - No.5. - hal.13

35.V.A. Uspensky. Pendahuluan bagi pembaca "New Literary Review" untuk pesan semiotik Andrei Nikolaevich Kolmogorov. - Tinjauan Sastra Baru. -1997. - Nomor 24. - S. 18-23

36. Perlovsky L. Kesadaran, bahasa dan budaya. - Pengetahuan adalah kekuatan. -2000. №4 - S.20-33

Perkenalan? Teori Terjemahan Kuliah

2.4 Prospek penerapan metode matematika dalam linguistik

Di era teknologi komputer, metode linguistik matematika telah mendapat perspektif perkembangan baru. Pencarian solusi atas permasalahan analisis linguistik kini semakin banyak diimplementasikan pada tataran sistem informasi. Pada saat yang sama, otomatisasi proses pemrosesan materi linguistik, yang memberikan peluang dan keuntungan yang signifikan bagi peneliti, pasti mengedepankan persyaratan dan tugas baru untuknya.

Kombinasi pengetahuan "tepat" dan "kemanusiaan" telah menjadi lahan subur bagi penemuan-penemuan baru di bidang linguistik, ilmu komputer, dan filsafat.

Terjemahan mesin dari satu bahasa ke bahasa lain tetap menjadi cabang teknologi informasi yang berkembang pesat. Terlepas dari kenyataan bahwa terjemahan dengan bantuan komputer tidak pernah dapat dibandingkan kualitasnya dengan terjemahan manusia (terutama untuk teks sastra), mesin telah menjadi asisten yang sangat diperlukan bagi seseorang dalam menerjemahkan teks dalam jumlah besar. Dipercayai bahwa dalam waktu dekat sistem terjemahan yang lebih maju akan dibuat, terutama berdasarkan analisis semantik teks.

Area yang sama-sama menjanjikan adalah interaksi linguistik dan logika, yang berfungsi sebagai landasan filosofis untuk memahami teknologi informasi dan apa yang disebut "realitas virtual". Dalam waktu dekat, pekerjaan akan dilanjutkan pada pembuatan sistem kecerdasan buatan - meskipun, sekali lagi, itu tidak akan pernah setara dengan manusia dalam kemampuannya. Persaingan seperti itu tidak ada artinya: di zaman kita, mesin seharusnya menjadi (dan menjadi) bukan saingan, tetapi asisten manusia, bukan sesuatu dari dunia fantasi, tetapi bagian dari dunia nyata.

Studi bahasa dengan metode statistik berlanjut, yang memungkinkan untuk menentukan sifat kualitatifnya dengan lebih akurat. Penting bahwa hipotesis yang paling berani tentang bahasa menemukan bukti matematis, dan karenanya logis.

Hal yang paling signifikan adalah bahwa berbagai cabang penerapan matematika dalam linguistik, yang sebelumnya cukup terisolasi, dalam beberapa tahun terakhir telah berkorelasi satu sama lain, terhubung ke dalam sistem yang koheren, dengan analogi dengan sistem bahasa yang ditemukan seabad yang lalu oleh Ferdinand de Saussure. dan Yvan Baudouin de Courtenay. Inilah kesinambungan pengetahuan ilmiah.

Linguistik di dunia modern telah menjadi landasan bagi perkembangan teknologi informasi. Selama ilmu komputer tetap menjadi cabang aktivitas manusia yang berkembang pesat, penyatuan matematika dan linguistik akan terus memainkan perannya dalam perkembangan sains.


Kesimpulan

Selama abad ke-20, teknologi komputer telah berkembang pesat - dari militer hingga penggunaan damai, dari jangkauan tujuan yang sempit hingga penetrasi ke semua bidang kehidupan manusia. Matematika sebagai ilmu menemukan signifikansi praktis baru dengan perkembangan teknologi komputer. Proses ini berlanjut hari ini.

"Tandem" "fisikawan" dan "penulis lirik" yang sebelumnya tidak terpikirkan telah menjadi kenyataan. Untuk interaksi penuh matematika dan ilmu komputer dengan humaniora, diperlukan spesialis yang berkualifikasi dari kedua sisi. Sementara ilmuwan komputer semakin membutuhkan pengetahuan kemanusiaan yang sistematis (linguistik, budaya, filosofis) untuk memahami perubahan realitas di sekitarnya, dalam interaksi manusia dan teknologi, untuk mengembangkan konsep linguistik dan mental yang semakin baru, untuk menulis program, maka setiap "Humaniora" di zaman kita untuk pertumbuhan profesionalnya harus menguasai setidaknya dasar-dasar bekerja dengan komputer.

Matematika, yang saling terkait erat dengan informatika, terus berkembang dan berinteraksi dengan ilmu alam dan humaniora. Di abad baru, kecenderungan matematisasi sains tidak melemah, tetapi justru meningkat. Berdasarkan data kuantitatif, hukum perkembangan bahasa, karakteristik historis dan filosofisnya dipahami.

Formalisme matematika paling cocok untuk mendeskripsikan pola dalam linguistik (seperti, memang, dalam ilmu lain, baik humaniora maupun ilmu alam). Situasi terkadang berkembang dalam sains sedemikian rupa sehingga tanpa menggunakan bahasa matematika yang tepat, tidak mungkin untuk memahami sifat fisika, kimia, dll. proses tidak mungkin. Menciptakan model atom planet, fisikawan Inggris terkenal abad XX. E. Rutherford mengalami kesulitan matematika. Pada awalnya, teorinya tidak diterima: kedengarannya tidak meyakinkan, dan alasannya adalah ketidaktahuan Rutherford tentang teori probabilitas, berdasarkan mekanisme yang hanya memungkinkan untuk memahami representasi model interaksi atom. Menyadari hal ini, pada saat itu seorang ilmuwan terkemuka, pemilik Hadiah Nobel, mendaftar di seminar ahli matematika Profesor Lamb dan selama dua tahun, bersama dengan para siswa, mengikuti kursus dan mengadakan lokakarya tentang teori probabilitas. . Berdasarkan itu, Rutherford mampu mendeskripsikan perilaku elektron, memberikan model strukturalnya dengan akurasi yang meyakinkan dan mendapatkan pengakuan. Begitu pula dengan linguistik.

Ini menimbulkan pertanyaan, apa yang begitu matematis dalam fenomena objektif, berkat itu mereka dapat dijelaskan dalam bahasa matematika, dalam bahasa karakteristik kuantitatif? Ini adalah unit materi homogen yang didistribusikan dalam ruang dan waktu. Ilmu-ilmu yang telah melangkah lebih jauh dari yang lain menuju isolasi homogenitas, dan ternyata lebih cocok untuk penggunaan matematika di dalamnya.

Internet, yang berkembang pesat pada 1990-an, menyatukan perwakilan dari berbagai negara, masyarakat, dan budaya. Terlepas dari kenyataan bahwa bahasa Inggris terus menjadi bahasa utama komunikasi internasional, Internet telah menjadi multibahasa di zaman kita. Hal ini menyebabkan pengembangan sistem terjemahan mesin yang sukses secara komersial yang banyak digunakan di berbagai bidang aktivitas manusia.

Jaringan komputer telah menjadi objek refleksi filosofis - semakin banyak konsep linguistik, logis, pandangan dunia baru telah dibuat yang membantu untuk memahami "realitas virtual". Dalam banyak karya seni, skenario dibuat - lebih sering pesimistis - tentang dominasi mesin atas seseorang, dan realitas virtual - atas dunia luar. Jauh dari biasanya ramalan seperti itu ternyata tidak ada artinya. Teknologi informasi bukan hanya industri yang menjanjikan untuk menginvestasikan pengetahuan manusia, tetapi juga merupakan cara untuk mengontrol informasi, dan akibatnya, atas pemikiran manusia.

Fenomena ini memiliki sisi negatif dan positif. Negatif - karena kendali atas informasi bertentangan dengan hak asasi manusia yang tidak dapat dicabut untuk akses bebas ke sana. Positif - karena kurangnya kontrol ini dapat menyebabkan konsekuensi bencana bagi umat manusia. Cukuplah untuk mengingat salah satu film paling bijak dalam dekade terakhir - "When the World Ends" oleh Wim Wenders, yang karakternya benar-benar tenggelam dalam "realitas virtual" dari mimpi mereka sendiri yang direkam di komputer. Namun, tidak ada satu pun ilmuwan atau seniman yang dapat memberikan jawaban tegas atas pertanyaan: apa yang menanti sains dan teknologi di masa depan.

Berfokus pada "masa depan", terkadang tampak fantastis, adalah ciri khas sains di pertengahan abad ke-20, ketika para penemu berusaha menciptakan model teknologi yang sempurna yang dapat bekerja tanpa campur tangan manusia. Waktu telah menunjukkan sifat utopis dari penelitian semacam itu. Namun, akan berlebihan untuk mengutuk para ilmuwan untuk ini - tanpa antusiasme mereka di tahun 1950-an - teknologi informasi tahun 60-an tidak akan membuat lompatan yang begitu kuat di tahun 90-an, dan kita tidak akan memiliki apa yang kita miliki sekarang.

Dekade terakhir abad ke-20 telah mengubah prioritas sains - penelitian, kesedihan inventif telah digantikan oleh kepentingan komersial. Sekali lagi, ini tidak baik atau buruk. Ini adalah realitas di mana sains semakin terintegrasi ke dalam kehidupan sehari-hari.

Abad ke-21 melanjutkan tren ini, dan di zaman kita di belakang penemuan tidak hanya ketenaran dan pengakuan, tetapi, pertama-tama, uang. Ini juga mengapa penting untuk memastikan bahwa pencapaian terbaru ilmu pengetahuan dan teknologi tidak jatuh ke tangan kelompok teroris atau rezim diktator. Tugas itu sulit sampai pada titik ketidakmungkinan; mewujudkannya secara maksimal adalah tugas seluruh masyarakat dunia.

Informasi adalah senjata, dan senjata tidak kalah berbahayanya dengan senjata nuklir atau kimia - hanya saja tidak bekerja secara fisik, melainkan secara psikologis. Umat ​​\u200b\u200bmanusia perlu memikirkan apa yang lebih penting baginya dalam hal ini - kebebasan atau kendali.

Konsep filosofis terbaru yang berkaitan dengan perkembangan teknologi informasi dan upaya untuk memahaminya telah menunjukkan keterbatasan materialisme ilmu alam, yang mendominasi selama abad ke-19 dan awal abad ke-20, dan idealisme ekstrem, yang menyangkal pentingnya dunia material. . Penting bagi pemikiran modern, terutama pemikiran Barat, untuk mengatasi dualisme pemikiran ini, ketika dunia sekitarnya jelas terbagi menjadi material dan ideal. Jalan menuju ini adalah dialog budaya, perbandingan berbagai sudut pandang tentang fenomena di sekitarnya.

Paradoksnya, teknologi informasi dapat memainkan peran penting dalam proses ini. Jaringan komputer, dan terutama Internet, tidak hanya menjadi sumber hiburan dan aktivitas komersial yang kuat, tetapi juga merupakan sarana komunikasi yang bermakna dan kontroversial antara perwakilan dari berbagai peradaban di dunia modern, serta untuk dialog antara masa lalu dan masa lalu. saat ini. Kita dapat mengatakan bahwa Internet mendorong batas spasial dan temporal.

Dan dalam dialog budaya melalui teknologi informasi, peran bahasa sebagai alat komunikasi universal tertua masih penting. Itulah sebabnya linguistik, dalam interaksinya dengan matematika, filsafat, dan ilmu komputer, mengalami kelahiran keduanya dan terus berkembang hingga saat ini. Tren saat ini akan berlanjut di masa depan - "hingga akhir dunia", seperti yang diprediksi oleh V. Wenders 15 tahun lalu. Benar, tidak diketahui kapan akhir ini akan terjadi - tetapi apakah itu penting sekarang, karena bagaimanapun juga masa depan cepat atau lambat akan menjadi saat ini.


Lampiran 1

Ferdinan de Saussure

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) secara luas dianggap sebagai pendiri linguistik modern dalam upayanya untuk mendeskripsikan struktur bahasa daripada sejarah bahasa dan bentuk bahasa tertentu. Faktanya, metode Strukturalisme dalam studi linguistik dan sastra dan cabang penting Semiotika menemukan titik awal utama mereka dalam karyanya pada pergantian abad ke-20. Bahkan dikatakan bahwa kompleks strategi dan konsepsi yang kemudian disebut "poststrukturalisme" - karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, dan lain-lain - disarankan oleh karya Saussure. dalam pembacaan linguistik dan anagrammatik puisi Latin akhir, modernisme sastra hingga psikoanalisis dan filsafat pada awal abad ke-20. Seperti yang diperdebatkan oleh Algirdas Julien Greimas dan Joseph Courtés dalam Semiotics and Language: An Analytic Dictionary, di bawah judul "Interpretation", sebuah mode interpretasi baru muncul pada awal abad ke-20 yang mereka identifikasikan dengan linguistik Saussurean, Fenomenologi Husserlian, dan psikoanalisis Freudian. Dalam mode ini, “penafsiran tidak lagi merupakan masalah mengaitkan konten tertentu dengan suatu bentuk yang jika tidak ada akan kekurangan satu; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang setara dari elemen penanda dalam sistem semiotik tertentu” ( 159). dalam pemahaman "penafsiran" ini, bentuk dan isi tidak berbeda; sebaliknya, setiap "bentuk", sebagai alternatif, adalah "isi" semantik juga, "bentuk penanda", sehingga interpretasi menawarkan parafrase analogis dari sesuatu yang sudah menandakan dalam beberapa sistem penandaan lainnya.

Penafsiran ulang bentuk dan pemahaman seperti itu – yang dijelaskan Claude Lévi-Strauss dalam salah satu artikulasinya yang paling terprogram tentang konsep strukturalisme, dalam “Struktur dan Bentuk: Refleksi pada Karya oleh Vladimir Propp” – tersirat dalam Kursus anumerta Saussure. dalam General Linguistics (1916, trans., 1959, 1983). Di masa hidupnya, Saussure menerbitkan relatif sedikit, dan karya utamanya, Kursus, adalah transkripsi oleh murid-muridnya dari beberapa kursus linguistik umum yang dia tawarkan pada tahun 1907-11. Dalam Kursus Saussure menyerukan studi bahasa "ilmiah" sebagai lawan dari karya linguistik historis yang telah dilakukan pada abad ke-19. Karya itu adalah salah satu pencapaian besar kecerdasan Barat: menggunakan kata-kata tertentu sebagai blok bangunan dari bahasa, sejarah (atau "diakronis") linguistik menelusuri asal dan perkembangan bahasa Barat dari sumber bahasa umum diduga, pertama bahasa "Indo-Eropa" dan kemudian "p" sebelumnya. bahasa roto-Indo-Eropa".

Tepatnya studi tentang kemunculan kata-kata yang unik ini, dengan asumsi bersamaan bahwa "unit" dasar bahasa, pada kenyataannya, adalah keberadaan positif dari "elemen-elemen kata" ini, yang dipertanyakan oleh Saussure. Karyanya merupakan upaya untuk mereduksi banyak fakta tentang bahasa, yang dipelajari dengan cermat oleh linguistik historis, menjadi sejumlah proposisi yang dapat dikelola. "Mazhab komparatif" Filologi abad ke-19, kata Saussure dalam Kursus, "tidak berhasil membangun ilmu linguistik yang sebenarnya" karena "gagal mencari sifat objek studinya" (3). "Sifat" itu, menurutnya, dapat ditemukan tidak hanya dalam kata-kata "elemental" yang terdiri dari bahasa - fakta (atau "substansi") bahasa yang tampak "positif" - tetapi dalam hubungan formal yang memunculkannya. "zat."

Pemeriksaan ulang sistematis bahasa Saussure didasarkan pada tiga asumsi. Yang pertama adalah bahwa studi ilmiah bahasa perlu mengembangkan dan mempelajari sistem daripada sejarah fenomena linguistik. Untuk alasan ini, dia membedakan antara kejadian khusus bahasa - "peristiwa-bicara" khususnya, yang ia tunjuk sebagai parole - dan objek linguistik yang tepat, sistem (atau "kode") yang mengatur peristiwa-peristiwa itu, yang ia tunjuk sebagai langue. Studi sistematis semacam itu, apalagi, membutuhkan " sinkronis" konsepsi hubungan antara unsur-unsur bahasa pada saat tertentu daripada studi "diakronis" perkembangan bahasa melalui sejarah.

Asumsi ini memunculkan apa yang Roman Jakobson pada tahun 1929 datang untuk menunjuk sebagai "strukturalisme," di mana "setiap rangkaian fenomena yang diperiksa oleh sains kontemporer diperlakukan bukan sebagai aglomerasi mekanis tetapi sebagai keseluruhan struktural konsepsi proses mekanis menghasilkan pertanyaan. dari fungsinya" ("Romantis" 711). Dalam bagian ini Jakobson mengartikulasikan niat Saussure untuk mendefinisikan linguistik sebagai sistem ilmiah sebagai lawan dari akuntansi "mekanis" sederhana dari kecelakaan sejarah. Selain itu, Jakobson juga menjelaskan asumsi dasar kedua dalam Saussurean - kita dapat sekarang menyebutnya "struktural" – linguistik: bahwa unsur-unsur dasar bahasa hanya dapat dipelajari dalam kaitannya dengan fungsinya daripada dalam hubungannya dengan penyebabnya. "Kata-kata" Eropa, peristiwa dan entitas itu harus ditempatkan dalam kerangka sistematik di mana mereka terkait dengan apa yang disebut peristiwa dan entitas lain.Ini adalah reorientasi radikal dalam memahami pengalaman dan fenomena, yang kepentingannya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu baru Galileo yang pada abad ketujuh belas mengubah seluruh kita. konsep dunia fisik" (dikutip dalam Culler, Pursuit 2 4). Perubahan ini, seperti dicatat oleh Greimas dan Courtés, membentuk kembali "interpretasi" dan dengan demikian membentuk kembali penjelasan dan pemahaman itu sendiri. Alih-alih penjelasan "berada dalam kerangka sebab-sebab suatu fenomena, sehingga, sebagai suatu "akibat", ia dalam beberapa hal berada di bawah sebab-sebabnya, penjelasan di sini terdiri dari mensubordinasikan suatu fenomena ke "fungsi" berorientasi masa depan atau "tujuan." Penjelasan tidak lagi terlepas dari niat atau tujuan manusia (walaupun niat itu bisa bersifat impersonal, komunal, atau, dalam istilah Freudian, "tidak sadar").

Dalam linguistiknya, Saussure menyelesaikan transformasi ini secara khusus dalam redefinisi "kata" linguistik, yang ia gambarkan sebagai "tanda" linguistik dan didefinisikan dalam istilah fungsionalis. Tanda, menurutnya, adalah penyatuan "sebuah konsep dan citra suara," yang disebutnya "petanda dan penanda" (66-67; terjemahan Roy Harris tahun 1983 menawarkan istilah "penandaan" dan "sinyal"). Sifat dari "kombinasi" mereka adalah "fungsional" karena baik petanda maupun penanda bukanlah "penyebab" dari yang lain; melainkan, "masing-masing nilainya dari yang lain" (8). , secara relasional dan membuat asumsi dasar linguistik historis, yaitu, identitas unit unsur bahasa dan penandaan (yaitu, "kata"), tunduk pada analisis yang ketat. kata "pohon" sebagai kata "sama" bukan karena kata itu didefinisikan oleh kualitas-kualitas yang melekat – itu bukan “penggumpalan mekanis” dari kualitas-kualitas semacam itu – tetapi karena itu didefinisikan sebagai elemen dalam suatu sistem, “keseluruhan struktural” dari bahasa.

Definisi entitas relasional (atau "diakritik") seperti itu mengatur konsepsi semua elemen bahasa dalam linguistik struktural. Ini paling jelas dalam pencapaian linguistik Saussurean yang paling mengesankan, pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah unit terkecil yang diartikulasikan dan menandakan bahasa. Itu bukanlah bunyi-bunyi yang muncul dalam bahasa, melainkan "citra-citra bunyi" yang disebut Saussure, yang ditangkap oleh penutur – ditangkap secara fenomenal – sebagai penyampaian makna. (Dengan demikian, Elmar Holenstein menggambarkan linguistik Jakobson, yang mengikuti Saussure dengan cara yang penting, sebagai "strukturalisme fenomenologis.") Karena alasan inilah juru bicara terkemuka untuk Strukturalisme Sekolah Praha, Jan Mukarovsky, mencatat pada tahun 1937 bahwa "struktur . . . adalah fenomenologis dan bukan realitas empiris; itu bukan kerja itu sendiri, tetapi seperangkat hubungan fungsional yang terletak dalam kesadaran kolektif (generasi, lingkungan, dll.)" (dikutip dalam Galan 35). Demikian pula, Lévi-Strauss, juru bicara terkemuka untuk strukturalisme Prancis , mencatat pada tahun 1960 bahwa "struktur tidak memiliki konten yang berbeda; itu adalah konten itu sendiri, dan organisasi logis di mana ia ditangkap dipahami sebagai properti yang nyata" (167; lihat juga Jakobson, Fundamentals 27-28).

Dengan demikian, fonem, elemen bahasa yang paling kecil dan dapat dicerap, bukanlah objek positif, melainkan sebuah "realitas fenomenologis". Dalam bahasa Inggris, misalnya, fonem /t/ dapat dilafalkan dengan berbagai cara, tetapi dalam semua kasus penutur bahasa Inggris akan mengenalinya berfungsi sebagai a /t/. Suara t yang disedot (yaitu, t diucapkan dengan nafas seperti huruf h setelahnya), suara t bernada tinggi atau rendah, suara t yang diperpanjang, dan seterusnya, semuanya akan berfungsi dengan cara yang sama dalam membedakan arti dari "to" dan "do" dalam bahasa Inggris. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi fonologis dalam satu bahasa dapat menjadi fonem yang berbeda di bahasa lain; dengan demikian, bahasa Inggris membedakan antara /l/ dan /r/, sedangkan bahasa lain sangat terstruktur sehingga artikulasi ini dianggap sebagai variasi dari fonem yang sama (seperti t yang diaspirasi dan tidak diaspirasi dalam bahasa Inggris). Dalam setiap bahasa alami, sejumlah besar kemungkinan kata merupakan kombinasi dari sejumlah kecil fonem. Bahasa Inggris, misalnya, memiliki kurang dari 40 fonem yang bergabung membentuk lebih dari satu juta kata yang berbeda.

Fonem bahasa itu sendiri merupakan struktur fitur yang terorganisir secara sistematis. Pada tahun 1920-an dan 1930-an, mengikuti petunjuk Saussure, Jakobson dan N. S. Trubetzkoy mengisolasi "ciri-ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur fisiologis alat bicara - lidah, gigi, pita suara, dan sebagainya - yang Saussure menyebutkan dalam Kursus dan yang digambarkan Harris sebagai "fonetik fisiologis" (39; terjemahan awal Baskin menggunakan istilah "fonologi" [(1959) 38]) – dan mereka bergabung dalam "kumpulan" oposisi biner untuk membentuk fonem. Misalnya, dalam bahasa Inggris perbedaan antara /t/ dan /d/ adalah ada atau tidak adanya "suara" (keterikatan pita suara), dan pada tingkat menyuarakan fonem-fonem ini secara timbal balik menentukan satu sama lain. Dengan cara ini, fonologi adalah contoh spesifik dari aturan umum bahasa yang dijelaskan oleh Saussure: Dalam bahasa hanya ada perbedaan. bahkan lebih penting lagi: suatu perbedaan umumnya mengimplikasikan istilah-istilah positif di mana perbedaan itu dibuat; tetapi dalam bahasa hanya ada perbedaan tanpa istilah positif. Apakah kita mengambil petanda atau penanda, bahasa tidak memiliki gagasan atau bunyi yang ada sebelum sistem linguistik. ( 120)

Dalam kerangka ini, identitas linguistik ditentukan bukan oleh kualitas yang melekat tetapi oleh hubungan sistemik ("struktural").

Saya telah mengatakan bahwa fonologi "mengikuti jejak" Saussure, karena meskipun analisisnya tentang fisiologi produksi bahasa "saat ini," seperti kata Harris, "disebut" fisik ", bukan "psikologis" atau "fungsional". "" (Bacaan 49), akibatnya dalam Kursus ia mengartikulasikan arah dan garis besar analisis fungsional bahasa. Demikian pula, satu-satunya karya terbitannya yang diperluas, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir tentang sistem vokal primitif dalam bahasa Indo-Eropa), yang muncul pada tahun 1878, sepenuhnya berada dalam proyek abad ke-19. linguistik sejarah abad. Namun demikian, dalam karya ini, seperti yang dikatakan Jonathan Culler, Saussure menunjukkan "kesuburan pemikiran bahasa sebagai sistem item relasional murni, bahkan ketika mengerjakan tugas rekonstruksi sejarah" (Saussure 66). Dengan menganalisis hubungan struktural sistematis di antara fonem untuk memperhitungkan pola pergantian vokal dalam bahasa Indo-Eropa yang ada, Saussure menyarankan bahwa selain beberapa fonem berbeda /a/, pasti ada fonem lain yang dapat dijelaskan secara formal. "Apa yang membuat karya Saussure begitu mengesankan," Culler menyimpulkan, "adalah kenyataan bahwa hampir lima puluh tahun kemudian, ketika paku Het ditemukan dan diuraikan, ditemukan mengandung fonem, ditulis h, yang berperilaku seperti prediksi Saussure. . Dia telah menemukan, dengan analisis murni formal, apa yang sekarang dikenal sebagai laring Indo-Eropa" (66).

Konsepsi penentuan relasional atau diakritik dari unsur-unsur penandaan, yang tersirat dan eksplisit dalam Kursus, menunjukkan asumsi ketiga yang mengatur linguistik struktural, yang disebut Saussure sebagai "sifat tanda yang sewenang-wenang". Dengan ini dia bermaksud bahwa hubungan antara penanda dan petanda dalam bahasa tidak pernah diperlukan (atau "termotivasi"): seseorang dapat dengan mudah menemukan penanda suara arbre sebagai pohon penanda untuk bersatu dengan konsep "pohon". Tetapi lebih dari itu, ini berarti bahwa yang ditandakan juga arbitrer: seseorang dapat dengan mudah mendefinisikan konsep "pohon" berdasarkan kualitas kayunya (yang akan mengecualikan pohon palem) maupun ukurannya (yang mengecualikan "tanaman berkayu rendah" yang kita semak panggilan). Ini harus memperjelas bahwa penomoran asumsi yang telah saya sajikan tidak mewakili urutan prioritas: setiap asumsi – sifat sistemik dari penandaan (paling baik dipahami dengan mempelajari bahasa "secara sinkron"), sifat relasional atau "diakritik" dari unsur-unsur penandaan, sifat tanda yang sewenang-wenang - mendapatkan nilainya dari yang lain.

Artinya, linguistik Saussurean fenomena yang dipelajarinya dalam hubungan kombinasi dan kontras yang menyeluruh dalam bahasa. Dalam konsepsi ini, bahasa adalah proses mengartikulasikan makna (penandaan) dan produknya (komunikasi), dan kedua fungsi bahasa ini tidak identik atau sepenuhnya kongruen (lihat Schleifer, "Dekonstruksi"). Di sini, kita dapat melihat pergantian antara bentuk dan isi yang dijelaskan oleh Greimas dan Courtés dalam interpretasi modernis: bahasa menghadirkan kontras yang secara formal mendefinisikan unit-unitnya, dan unit-unit ini bergabung pada tingkat-tingkat berikutnya untuk menciptakan konten yang menandakan. Karena unsur-unsur bahasa bersifat arbitrer, maka baik kontras maupun kombinasi tidak dapat dikatakan mendasar. Dengan demikian, dalam bahasa gabungan ciri-ciri khas membentuk fonem kontras pada tingkat pemahaman yang lain, fonem bergabung membentuk morfem kontras, morfem bergabung membentuk kata, kata bergabung membentuk kalimat, dan seterusnya. Dalam setiap contoh, seluruh fonem, atau kata, atau kalimat, dan seterusnya, lebih besar dari jumlah bagian-bagiannya (seperti air, H2O, dalam contoh Saussure [(1959) 103] lebih dari aglomerasi mekanik). hidrogen dan oksigen).

Tiga asumsi Kursus Linguistik Umum membuat Saussure menyerukan ilmu baru abad kedua puluh yang akan melampaui ilmu linguistik untuk mempelajari "kehidupan tanda-tanda dalam masyarakat." Saussure menamai ilmu ini "semiologi (dari bahasa Yunani semeîon "tanda")" (16). "Ilmu" semiotika, seperti yang dipraktikkan di Eropa Timur pada 1920-an dan 1930-an dan Paris pada 1950-an dan 1960-an, memperluas studi struktur bahasa dan linguistik ke artefak sastra yang dibentuk (atau diartikulasikan) oleh struktur tersebut. Selain itu, sepanjang bagian akhir karirnya, bahkan ketika dia menawarkan kursus linguistik umum, Saussure mengejar analisis "semiotik" miliknya sendiri tentang puisi Latin akhir dalam upaya untuk menemukan anagram nama diri yang sengaja disembunyikan. Metode penelitiannya dalam banyak hal berlawanan dengan rasionalisme fungsional dari analisis linguistiknya: ia berusaha, seperti yang disebutkan Saussure dalam salah satu dari 99 buku catatan tempat ia melakukan penelitian ini, untuk memeriksa secara sistematis masalah "kebetulan", yang " menjadi fondasi yang tak terhindarkan dari segalanya" (dikutip dalam Starobinski 101). Studi semacam itu, seperti yang dikatakan Saussure sendiri, berfokus pada "fakta material" tentang kebetulan dan makna (dikutip 101), sehingga "kata-tema" yang anagramnya dicari Saussure, seperti yang dikatakan Jean Starobinski, "adalah, untuk penyair. , instrumen, dan bukan kuman vital puisi. Puisi itu diharuskan menggunakan kembali bahan fonik dari kata-tema" (45). Dalam analisis ini, Starobinski mengatakan, "Saussure tidak tersesat dalam pencarian makna tersembunyi." Sebaliknya, karyanya tampaknya menunjukkan keinginan untuk menghindari semua masalah yang timbul dari kesadaran: "Karena puisi tidak hanya diwujudkan dalam kata-kata tetapi merupakan sesuatu yang lahir dari kata-kata, ia lolos dari kendali kesadaran yang sewenang-wenang untuk bergantung hanya pada semacam legalitas linguistik. "(121).

Yaitu, upaya Saussure untuk menemukan nama yang tepat dalam puisi Latin akhir - apa yang disebut Tzvetan Todorov sebagai pengurangan "kata". . . ke penandanya" (266) – menekankan salah satu elemen yang mengatur analisis linguistiknya, sifat tanda yang sewenang-wenang. (Ini juga menekankan sifat formal linguistik Saussurean – "Bahasa," tegasnya, "adalah bentuk dan bukan substansi" – yang menghilangkan semantik secara efektif sebagai objek utama analisis.) Seperti yang disimpulkan Todorov, karya Saussure saat ini tampak sangat homogen dalam penolakannya untuk menerima fenomena simbolik. . . . Dalam penelitiannya tentang anagram, dia hanya memperhatikan fenomena pengulangan, bukan fenomena pembangkitan. . . . Dalam studinya tentang Nibelungen, dia mengenali simbol hanya untuk mengaitkannya dengan pembacaan yang salah: karena tidak disengaja, simbol tidak ada. Akhirnya dalam kursusnya tentang linguistik umum, dia merenungkan keberadaan semiologi, dan dengan demikian tanda-tanda selain yang linguistik; tetapi penegasan ini sekaligus dibatasi oleh fakta semiologi dikhususkan untuk satu jenis tanda: yang arbitrer. (269-70)

Jika ini benar, itu karena Saussure tidak dapat memahami "niat" tanpa subjek; dia tidak bisa lepas dari pertentangan antara bentuk dan konten yang karyanya banyak dipertanyakan. Sebaliknya, dia menggunakan "legalitas linguistik". Terletak di antara, di satu sisi, konsepsi sejarah abad ke-19, subjektivitas, dan cara interpretasi kausal yang diatur oleh konsepsi-konsepsi ini dan, di sisi lain, konsepsi "strukturalis" abad ke-20 tentang apa yang oleh Lévi-Strauss disebut "Kantianisme tanpa subjek transendental" (dikutip dalam Connerton 23) – konsep yang menghapus pertentangan antara bentuk dan isi (atau subjek dan objek) dan hierarki latar depan dan latar belakang dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum yang lengkap – karya Ferdinand de Saussure dalam linguistik dan semiotika membatasi momen sinyal dalam studi tentang makna dan budaya.

Ronald Schleifer


Lampiran 2

Ferdinand de Saussure (terjemahan)

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) dianggap sebagai pendiri linguistik modern, berkat upayanya untuk mendeskripsikan struktur bahasa, bukan sejarah bahasa individu dan bentuk kata. Pada umumnya, fondasi metode struktural dalam linguistik dan kritik sastra dan, sebagian besar, semiotika diletakkan dalam karya-karyanya pada awal abad ke-20. Terbukti bahwa metode dan konsep yang disebut "post-strukturalisme", yang dikembangkan dalam karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes dan lainnya, kembali ke karya linguistik Saussure dan pembacaan anagramtik puisi Romawi akhir. Perlu dicatat bahwa karya Saussure tentang linguistik dan interpretasi linguistik membantu menghubungkan berbagai disiplin intelektual, dari fisika hingga inovasi sastra, psikoanalisis, dan filsafat awal abad ke-20. A. J. Greimas dan J. Kurte menulis dalam Semiotika dan Bahasa: “Kamus analitis dengan judul “Interpretasi” sebagai jenis interpretasi baru muncul pada awal abad ke-20 bersama dengan linguistik Saussure, fenomenologi Husserl dan psikoanalisis dari Freud. Dalam kasus seperti itu, "penafsiran bukanlah atribusi konten tertentu ke bentuk yang tidak memilikinya; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang sama dari elemen penting dalam sistem semiotik tertentu" (159 ). Dalam pengertian "penafsiran" ini, bentuk dan isi tidak dapat dipisahkan; sebaliknya, setiap bentuk diisi dengan makna semantik ("bentuk bermakna"), sehingga interpretasi menawarkan penceritaan kembali yang baru dan serupa tentang sesuatu yang bermakna dalam sistem tanda lain.

Pemahaman serupa tentang bentuk dan isi, yang disajikan oleh Claude Lévi-Strauss dalam salah satu karya utama strukturalisme, ("Struktur dan Bentuk: Refleksi pada Karya Vladimir Propp"), dapat dilihat dalam buku Saussure yang diterbitkan secara anumerta A Course in Linguistik Umum (1916, trans., 1959, 1983). Selama masa hidupnya, Saussure menerbitkan sedikit, "Kursus" - pekerjaan utamanya - dikumpulkan dari catatan siswa yang menghadiri kuliahnya tentang linguistik umum pada tahun 1907-11. Dalam Kursus, Saussure menyerukan studi bahasa "ilmiah", membandingkannya dengan linguistik sejarah komparatif abad ke-19. Karya ini dapat dianggap sebagai salah satu pencapaian terbesar pemikiran Barat: mengambil kata-kata individu sebagai elemen struktural bahasa sebagai dasar, linguistik historis (atau "diakronis") membuktikan asal dan perkembangan bahasa-bahasa Eropa Barat dari umum, bahasa Indo-Eropa - dan Proto-Indo-Eropa sebelumnya.

Justru studi tentang kemunculan unik kata-kata ini, dengan asumsi bersamaan bahwa "unit" dasar bahasa sebenarnya adalah keberadaan positif dari "elemen kata" inilah yang dipertanyakan Saussure. Karyanya adalah upaya untuk mereduksi banyak fakta tentang bahasa yang dipelajari dengan santai oleh linguistik komparatif menjadi sejumlah kecil teorema. Sekolah filologi komparatif abad ke-19, tulis Saussure, "tidak berhasil menciptakan sekolah linguistik yang nyata" karena "tidak memahami esensi objek studi" (3). "Esensi" ini, menurutnya, tidak hanya terletak pada kata-kata individu - "substansi positif" dari bahasa - tetapi juga pada koneksi formal yang membantu keberadaan substansi ini.

"Ujian" bahasa Saussure didasarkan pada tiga asumsi. Pertama, pemahaman ilmiah tentang bahasa tidak didasarkan pada sejarah, tetapi pada fenomena struktural. Oleh karena itu, ia membedakan antara fenomena individu bahasa - "peristiwa ucapan", yang ia definisikan sebagai "parole" - dan yang tepat, menurut pendapatnya, objek studi linguistik, sistem (kode, struktur) yang mengontrol peristiwa ini ( "bahasa"). Kajian yang sistematis seperti itu, apalagi, membutuhkan konsepsi "sinkron" tentang hubungan antara unsur-unsur bahasa pada saat tertentu, daripada kajian "diakronis" tentang perkembangan bahasa melalui sejarahnya.

Hipotesis ini adalah pendahulu dari apa yang oleh Roman Jakobson pada tahun 1929 disebut "strukturalisme" - sebuah teori di mana "serangkaian fenomena apa pun yang diselidiki oleh sains modern dianggap bukan sebagai akumulasi mekanis, tetapi sebagai keseluruhan struktural di mana komponen konstruktif berkorelasi dengan fungsi" ("Romantis "711). Dalam bagian ini, Jakobson merumuskan gagasan Saussure tentang mendefinisikan bahasa sebagai struktur, sebagai lawan dari pencacahan "mekanis" peristiwa sejarah. Selain itu, Jakobson mengembangkan asumsi Saussurean lain, yang menjadi cikal bakal linguistik struktural: elemen dasar bahasa harus dipelajari tidak begitu banyak hubungannya dengan penyebabnya, tetapi dengan fungsinya. Fenomena dan peristiwa terpisah (katakanlah, sejarah asal mula kata-kata Indo-Eropa individu) harus dipelajari bukan dengan sendirinya, tetapi dalam suatu sistem yang berkorelasi dengan komponen serupa. Ini adalah perubahan radikal dalam membandingkan fenomena dengan realitas di sekitarnya, yang signifikansinya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu Galileo, yang pada abad ketujuh belas menjungkirbalikkan gagasan tentang dunia material." akibatnya, penjelasannya sendiri. Fenomena mulai diinterpretasikan bukan dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan efek yang dapat ditimbulkannya di masa sekarang dan masa depan.Interpretasi tidak lagi terlepas dari niat seseorang (terlepas dari kenyataan bahwa niat dapat bersifat impersonal, "tidak sadar" dalam arti kata Freudian).

Dalam linguistiknya, Saussure secara khusus menunjukkan pergantian konsep kata dalam linguistik, yang ia definisikan sebagai tanda dan dijelaskan dalam kaitannya dengan fungsinya. Tanda baginya adalah kombinasi antara bunyi dan makna, "signified and designation" (66-67; dalam terjemahan bahasa Inggris tahun 1983 oleh Roy Harris - "signification" dan "signal"). Sifat senyawa ini adalah “fungsional” (tidak ada satu atau unsur lainnya yang dapat ada tanpa satu sama lain); selain itu, "yang satu meminjam kualitas dari yang lain" (8). Jadi, Saussure mendefinisikan elemen struktural utama bahasa - tanda - dan menjadikan dasar linguistik historis sebagai identitas tanda pada kata-kata, yang membutuhkan analisis yang sangat ketat. Oleh karena itu, kita dapat memahami arti yang berbeda dari, katakanlah, kata "pohon" yang sama - bukan karena kata tersebut hanya sekumpulan kualitas tertentu, tetapi karena kata tersebut didefinisikan sebagai elemen dalam sistem tanda, dalam "keseluruhan struktural", dalam bahasa.

Konsep kesatuan relatif ("diakritik") seperti itu mendasari konsep semua elemen bahasa dalam linguistik struktural. Ini sangat jelas dalam penemuan linguistik Saussurean yang paling orisinal, dalam pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah unit bahasa terkecil yang diucapkan dan bermakna. Itu bukan hanya suara yang muncul dalam bahasa, tetapi "gambaran suara", kata Saussure, yang dianggap oleh penutur asli memiliki makna. (Perlu dicatat bahwa Elmar Holenstein menyebut linguistik Jakobson, yang melanjutkan gagasan dan konsep Saussure dalam ketentuan utamanya, "strukturalisme fenomenologis"). Itulah sebabnya pembicara terkemuka dari Sekolah Strukturalisme Praha, Jan Mukarowski, mengamati pada tahun 1937 bahwa “struktur. . . bukan konsep empiris, tapi fenomenologis; itu bukanlah hasil itu sendiri, tetapi serangkaian hubungan signifikan dari kesadaran kolektif (generasi, orang lain, dll.)”. Pemikiran serupa diungkapkan pada tahun 1960 oleh Lévi-Strauss, pemimpin strukturalisme Prancis: “Struktur tidak memiliki isi yang pasti; itu sendiri bermakna, dan konstruksi logis yang melingkupinya adalah jejak realitas.

Pada gilirannya, fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili "realitas fenomenologis" integral yang terpisah. Misalnya, dalam bahasa Inggris, bunyi "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, orang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Disedot, dinaikkan atau diturunkan, bunyi "t" yang panjang, dll. Akan sama-sama membedakan arti kata "to" dan "do". Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi satu bunyi dalam satu bahasa dapat sesuai dengan fonem yang berbeda di bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain keduanya adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan dan tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah sekumpulan kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi bahasa adalah seperangkat fitur yang diatur secara sistematis. Pada 1920-an-1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara - Saussure mencatat ini dalam "Kursus Linguistik Umum", dan Harris menyebutnya "fonetik fisiologis" (dalam terjemahan Baskin sebelumnya, istilah "fonologi " digunakan) - mereka terhubung dalam "simpul » durg melawan teman untuk membuat suara. Misalnya, dalam bahasa Inggris, perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara), dan tingkat suara yang membedakan satu fonem dari fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa." Yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa syarat yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Saya telah menyebutkan bahwa fonologi dalam perkembangannya bersandar pada pemikiran Saussure. Meskipun analisisnya tentang fisiologi linguistik di zaman modern, kata Harris, "akan disebut 'fisik', berlawanan dengan 'psikologis' atau 'fungsional', dalam The Course dia dengan jelas mengartikulasikan arah dan prinsip dasar analisis fungsional bahasa. Satu-satunya karyanya yang diterbitkan selama hidupnya, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Catatan tentang sistem vokal asli dalam bahasa Indo-Eropa), diterbitkan pada tahun 1878, sepenuhnya sejalan dengan linguistik historis komparatif dari abad ke-19. Namun demikian, dalam karya ini, kata Jonathan Culler, Saussure menunjukkan "keberhasilan gagasan bahasa sebagai sistem fenomena yang saling berhubungan, bahkan dengan rekonstruksi sejarahnya." Menganalisis hubungan antar fonem, menjelaskan pergantian vokal dalam bahasa modern kelompok Indo-Eropa, Saussure menyarankan bahwa selain beberapa bunyi "a" yang berbeda, harus ada fonem lain yang dijelaskan secara formal. “Apa yang membuat karya Saussure sangat mengesankan,” Kaller menyimpulkan, “adalah bahwa hampir 50 tahun kemudian, ketika kuneiform Het ditemukan dan diuraikan, sebuah fonem ditemukan, dalam tulisan yang dilambangkan dengan “h”, yang berperilaku seperti prediksi Saussure. Melalui analisis formal, ia menemukan apa yang sekarang dikenal sebagai suara parau dalam bahasa Indo-Eropa.

Dalam konsep definisi tanda relatif (diakritik), baik eksplisit maupun tersirat dalam Kursus, ada asumsi kunci ketiga dari linguistik struktural, yang disebut oleh Saussure sebagai "sifat tanda yang sewenang-wenang". Artinya, hubungan antara bunyi dan makna dalam bahasa tidak dimotivasi oleh apa pun: seseorang dapat dengan mudah menghubungkan kata "arbre" dan kata "pohon" dengan konsep "pohon". Selain itu, ini berarti bahwa bunyinya juga sewenang-wenang: seseorang dapat mendefinisikan konsep "pohon" dengan adanya kulit kayu (kecuali pohon palem) dan ukurannya (kecuali untuk "tumbuhan berkayu rendah" - semak). Dari sini harus jelas bahwa semua asumsi yang saya sajikan tidak dibagi menjadi lebih dan kurang penting: masing-masing - sifat sistemik tanda (paling dapat dipahami dalam studi bahasa "sinkron"), relatif mereka (diakritik) esensi, sifat tanda yang sewenang-wenang - berasal dari yang lain.

Jadi, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai sekumpulan perbandingan dan pertentangan bahasa. Bahasa adalah ekspresi dari arti kata (penunjukan) dan hasilnya (komunikasi) - dan kedua fungsi ini tidak pernah bersamaan (lihat "Dekonstruksi Bahasa" Shleifer). Kita dapat melihat pergantian bentuk dan isi yang dijelaskan oleh Greimas dan Kurte dalam interpretasi versi terbaru: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi pada tingkat yang berurutan untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Artinya, dalam suatu bahasa, ciri-ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem kontras, morfem menjadi kata, kata menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari jumlah bagian-bagiannya (seperti air, dalam contoh Saussure, lebih dari kombinasi hidrogen dan oksigen).

Tiga asumsi dari "Kursus Linguistik Umum" mengarahkan Saussure pada gagasan tentang ilmu baru abad ke-20, terpisah dari linguistik, mempelajari "kehidupan tanda dalam masyarakat". Saussure menyebut ilmu ini semiologi (dari bahasa Yunani "semeîon" - tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada tahun 1920-an dan 1930-an dan di Paris pada tahun 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan sastra yang disusun (atau dirumuskan) dengan bantuan struktur tersebut. Selain itu, di masa senja karirnya, sejalan dengan kursusnya di bidang linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini adalah upaya, seperti yang ditulis Saussure di salah satu dari 99 buku catatan, untuk mempelajari dalam sistem masalah "probabilitas", yang "menjadi dasar dari segalanya. " Investigasi semacam itu, klaim Saussure sendiri, membantu untuk fokus pada "sisi nyata" dari probabilitas; "Kata kunci" yang dicari anagramnya oleh Saussure, menurut Jean Starobinsky, "alat bagi penyair, dan bukan sumber kehidupan bagi puisi itu." Puisi berfungsi untuk membalikkan bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, terlihat keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran: “karena puisi diekspresikan tidak hanya dengan kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa.”

Upaya Saussure untuk mempelajari nama yang tepat dalam puisi Romawi akhir (Tsvetan Todorov menyebut ini singkatan dari "sebuah kata ... hanya sebelum ditulis") menekankan salah satu komponen analisis linguistiknya - sifat tanda yang sewenang-wenang, serta esensi formal linguistik Saussurean ("Bahasa," katanya, "inti dari bentuk, bukan fenomena"), yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa tulisan-tulisan Saussure saat ini tampaknya sangat konsisten dalam keengganan mereka untuk mempelajari simbol [fenomena yang memiliki makna yang terdefinisi dengan baik]. . . . Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, dia mendefinisikan simbol hanya untuk menetapkannya ke pembacaan yang salah: jika tidak disengaja, simbol itu tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang tidak hanya menggambarkan tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semilogi hanya dapat mendeskripsikan tanda-tanda yang acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak dapat membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya hal ini berubah menjadi sebuah pertanyaan. Sebaliknya, dia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas yang didasarkan pada sejarah dan dugaan subyektif, dan metode interpretasi yang tidak disengaja berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis yang oleh Lévi-Strauss disebut "Kantianisme tanpa transenden". aktor" - menghapus oposisi antara bentuk dan isi (subjek dan objek), makna dan asal dalam strukturalisme, psikoanalisis dan bahkan mekanika kuantum, tulisan Ferlinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi tentang makna dalam bahasa dan budaya.

Ronald Shleifer

literatur

1.Admoni V.G. Dasar-dasar teori tata bahasa / V.G. Nasihat; Akademi Ilmu Pengetahuan Uni Soviet.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metode matematika dalam linguistik. M., 1974.

4.Arnold I.V. Struktur semantik kata dalam bahasa Inggris modern dan metodologi untuk mempelajarinya. /I.V. Arnold - L .: Pendidikan, 1966. - 187 hal.

6.Bashlykov A.M. Sistem terjemahan otomatis. / SAYA. Bashlykov, A.A. Sokolov. - M .: FIMA LLC, 1997. - 20 hal.

7.Baudouin de Courtenay: Warisan teoretis dan modernitas: Abstrak laporan konferensi ilmiah internasional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 hal.

8. A. V. Gladkiy, Unsur Linguistik Matematika. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 hal.

9. Golovin, B.N. Bahasa dan statistik. /B.N. Golovin - M., 1971. - 210 hal.

10. Zvegintsev, V.A. Linguistik teoretis dan terapan. / V.A. Zvegintsev - M., 1969. - 143 hal.

11. Kasevich, V.B. Semantik. Sintaksis. Morfologi. // V.B. Kasevich -M., 1988. - 292 hal.

12. Lekomtsev Yu.K. Pengantar bahasa formal linguistik / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 hal., sakit.

13. Warisan Linguistik Baudouin de Courtenay di Akhir Abad ke-20: Abstrak Konferensi Ilmiah dan Praktis Internasional 15-18 Maret 2000. - Krasnoyarsk, 2000. - 125 hal.

Matveeva G.G. Makna gramatikal tersembunyi dan identifikasi orang sosial ("potret") pembicara / G.G. Matveev. - Rostov, 1999. - 174 hal.

14. Melchuk, I.A. Pengalaman dalam membangun model linguistik “Arti<-->Teks". / I.A. Melchuk. - M., 1974. - 145 hal.

15. Nelyubin L.L. Terjemahan dan linguistik terapan / L.L. Nelyubin. - M. : SMA, 1983. - 207 hal.

16. Tentang metode penelitian bahasa yang tepat: tentang apa yang disebut "linguistik matematika" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva dan lainnya - M., 1961. - 162 hal.

17. Piotrovsky L.G. Linguistik Matematika: Buku Teks / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Sekolah Tinggi, 1977. - 160 hal.

18. Dia. Teks, mesin, orang. - L., 1975. - 213 hal.

19. Dia. Linguistik Terapan / Ed. A.S.Gerda. - L., 1986. - 176 hal.

20. Revzin, I.I. model bahasa. M., 1963. Revzin, I.I. Linguistik struktural modern. Masalah dan metode. M., 1977. - 239 hal.

21. Revzin, I.I., Rozentsveig, V.Yu. Dasar-dasar terjemahan umum dan mesin / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 hal.

22. Slyusareva N.A. Teori F. de Saussure dalam terang linguistik modern / N.A. Slyusareva. - M.: Nauka, 1975. - 156 hal.

23. Burung Hantu, L.Z. Linguistik analitis / L.Z. Burung Hantu - M., 1970. - 192 hal.

24. Saussure F.de. Catatan tentang Linguistik Umum / F. de Saussure; Per. dari fr. – M.: Kemajuan, 2000. – 187 hal.

25. Dia. Kursus Linguistik Umum / Per. dari fr. - Yekaterinburg, 1999. -426 hal.

26. Statistik ucapan dan analisis teks otomatis / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 hal.

27. Stoll, P. Set. Logika. teori aksiomatik./ R. Stoll; Per. dari bahasa Inggris. - M., 1968. - 180 hal.

28. Tenier, L. Dasar-dasar sintaks struktural. M., 1988.

29. Ubin I.I. Otomasi kegiatan penerjemahan di USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 hal.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematika Modern. M., 1966.

31. Shenk, R. Pemrosesan informasi konseptual. M., 1980.

32. Shikhanovich, Yu.A. Pengantar matematika modern (konsep awal). M., 1965

33. Shcherba L.V. Vokal Rusia dalam istilah kualitatif dan kuantitatif / L.V. Shcherba - L.: Nauka, 1983. - 159 hal.

34. Abdullah-zade F. Warga dunia // Ogonyok - 1996. - No.5. – hal.13

35.V.A. Uspensky. Pendahuluan bagi pembaca "New Literary Review" untuk pesan semiotik Andrei Nikolaevich Kolmogorov. - Sebuah tinjauan sastra baru. –1997. - Nomor 24. - S. 18-23

36. Perlovsky L. Kesadaran, bahasa dan budaya. - Pengetahuan adalah kekuatan. –2000. Nomor 4 - S. 20-33

37. Frumkina R.M. Tentang kami - miring. // Jurnal Rusia. - 2000. - No.1. – hal.12

38. Fitialov, S.Ya. Tentang Pemodelan Sintaks dalam Linguistik Struktural // Masalah Linguistik Struktural. M., 1962.

39. Dia. Tentang kesetaraan tata bahasa NN dan tata bahasa ketergantungan // Masalah Linguistik Struktural. M., 1967.

40. Chomsky, N. Fondasi logis dari teori linguistik // Baru dalam linguistik. Masalah. 4.M., 1965

41. Schleifer R. Ferdinand de Saussure//tekan. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. tekan. jhu.ru

46. ​​​​en.wikipedia.org

47. www.smolensk.ru


Cryptanalysis adalah ilmu (dan praktik penerapannya) tentang metode dan cara memecahkan sandi. Kriptografi dan kriptoanalisis merupakan satu bidang pengetahuan - kriptologi, yang saat ini merupakan bidang matematika modern, yang memiliki penerapan penting dalam teknologi informasi modern. Istilah "kriptografi" diperkenalkan oleh D. Vallis. Kebutuhan untuk mengenkripsi pesan muncul sejak lama. V-...

Apakah yang terdekat, bukan arti kata yang lebih jauh. Dengan demikian, arahan psikologis, dan khususnya tata bahasa muda, menjawab banyak pertanyaan yang dihadapi linguistik di pertengahan abad ke-19. Metodologi linguistik sejarah komparatif diklarifikasi, masalah utama semasiologi dan tata bahasa fungsional-semantik diajukan, hubungan antara bahasa dan ucapan dianalisis, ...

Kontak", "Multilingualisme dalam aspek sosiologis". Studi mereka dilakukan oleh sosiolinguistik (linguistik sosial), yang muncul di persimpangan linguistik dan sosiologi, serta etnolinguistik, etnografi ucapan, gaya bahasa, retorika, pragmatik, teori komunikasi linguistik, teori komunikasi massa, dll. Bahasa menjalankan fungsi sosial berikut dalam masyarakat: komunikatif / informatif (...

Pada bagian dan komposisi Linguistik. Bagian Linguistik yang dibentuk secara empiris, yang sebagian berpotongan dan karena itu tidak membentuk sistem yang disatukan secara logis, dapat direpresentasikan sebagai saling berkorelasi menurut beberapa parameter yang berbeda. Linguistik umum dan sebagian ilmu bahasa. Bagian Linguistik yang paling umum dan khusus dibedakan. Salah satu bagian utama Linguistik adalah teori ...

Perkenalan

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Pembentukan Linguistik Struktural pada Pergantian Abad 19 - 20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinan de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

Perkenalan

Pada abad ke-20, telah terjadi kecenderungan yang berkelanjutan terhadap interaksi dan interpenetrasi berbagai bidang ilmu pengetahuan. Batas-batas antara ilmu-ilmu individual secara bertahap kabur; semakin banyak cabang aktivitas mental yang "berada di persimpangan" pengetahuan kemanusiaan, teknis, dan ilmu alam.

Ciri lain yang jelas dari modernitas adalah keinginan untuk mempelajari struktur dan elemen penyusunnya. Oleh karena itu, semakin banyak tempat, baik dalam teori ilmiah maupun dalam praktik, diberikan kepada matematika. Bersentuhan, di satu sisi, dengan logika dan filsafat, di sisi lain, dengan statistik (dan, akibatnya, dengan ilmu sosial), matematika menembus semakin dalam ke bidang-bidang yang sejak lama dianggap murni. "kemanusiaan", memperluas potensi heuristik mereka (jawaban atas pertanyaan "berapa banyak" akan sering membantu menjawab pertanyaan "apa" dan "bagaimana"). Linguistik tidak terkecuali.

Tujuan dari kursus saya adalah untuk menyoroti secara singkat hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat alat teoretis untuk mendeskripsikan struktur bahasa (baik alami maupun buatan). Namun, harus dikatakan bahwa itu tidak segera menemukan aplikasi praktis untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan penerapannya dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan bahasa yang baru secara fundamental. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar merepresentasikan pola linguistik dalam bentuk yang dapat diterapkan langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, merujuk pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan beberapa tahun terakhir percaya bahwa ungkapan itu sendiri tidak dapat diangkat ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa. . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka di awal abad ke-20 (saya akan menceritakan tentang pengaruhnya terhadap perkembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan kepemilikannya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang memiliki banyak segi, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab I. Sejarah Penerapan Metode Matematika dalam Linguistik

1.1 Pembentukan linguistik struktural pada pergantian abad XIX - XX

Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss terkenal di awal abad ke-20, Ferdinand de Saussure.

Tautan awal konsepnya adalah teori bahasa sebagai suatu sistem yang terdiri dari tiga bagian (bahasa itu sendiri adalah bahasa, pidato - kata sandi, dan aktivitas bicara - bahasa), di mana setiap kata (anggota sistem) dianggap tidak dengan sendirinya, tetapi dalam kaitannya dengan anggota lainnya. Sebagai ahli bahasa terkemuka lainnya, Dane Louis Hjelmslev, kemudian mencatat, Saussure "adalah orang pertama yang menuntut pendekatan struktural terhadap bahasa, yaitu deskripsi ilmiah bahasa dengan merekam hubungan antar unit."

Memahami bahasa sebagai struktur hierarkis, Saussure adalah orang pertama yang mengajukan masalah nilai dan pentingnya unit linguistik. Fenomena dan peristiwa terpisah (katakanlah, sejarah asal mula kata-kata Indo-Eropa individu) harus dipelajari bukan dengan sendirinya, tetapi dalam suatu sistem yang berkorelasi dengan komponen serupa.

Unit struktural bahasa Saussure menganggap kata, "tanda", di mana bunyi dan makna digabungkan. Tak satu pun dari elemen-elemen ini ada tanpa satu sama lain: oleh karena itu, penutur asli memahami berbagai corak makna kata polisemantik sebagai elemen terpisah dalam keseluruhan struktural, dalam bahasa.

Jadi, dalam teori F. de Saussure orang dapat melihat interaksi linguistik, di satu sisi, dengan sosiologi dan psikologi sosial (perlu dicatat bahwa pada saat yang sama fenomenologi Husserl, psikoanalisis Freud, teori relativitas Einstein sedang berkembang. , percobaan terjadi pada bentuk dan konten dalam sastra, musik dan seni rupa), di sisi lain, dengan matematika (konsep sistemikitas sesuai dengan konsep aljabar bahasa). Konsep seperti itu mengubah konsep interpretasi linguistik seperti itu: Fenomena mulai ditafsirkan bukan dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan masa kini dan masa depan. Interpretasi tidak lagi terlepas dari niat seseorang (terlepas dari kenyataan bahwa niat mungkin impersonal, "tidak sadar" dalam arti kata Freudian).

Fungsi mekanisme linguistik dimanifestasikan melalui aktivitas bicara penutur asli. Hasil ucapan adalah apa yang disebut "teks yang benar" - urutan unit ucapan yang mengikuti pola tertentu, banyak di antaranya memungkinkan deskripsi matematis. Teori cara mendeskripsikan struktur sintaksis berkaitan dengan studi tentang metode deskripsi matematis dari teks yang benar (terutama kalimat). Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Di Barat, ide-ide Saussure dikembangkan oleh orang-orang muda sezaman dari ahli bahasa Swiss yang hebat: di Denmark - L. Hjelmslev, yang telah saya sebutkan, yang memunculkan teori bahasa aljabar dalam karyanya "Fundamentals of Linguistic Theory", di AS - E. Sapir, L. Bloomfield, C. Harris, di Republik Ceko - ilmuwan emigran Rusia N. Trubetskoy.

Keteraturan statistik dalam studi bahasa mulai ditangani tidak lain oleh pendiri genetika, Georg Mendel. Baru pada tahun 1968 para ahli filologi menemukan bahwa, pada tahun-tahun terakhir hidupnya, dia terpesona oleh studi fenomena linguistik dengan menggunakan metode matematika. Mendel membawa metode ini ke linguistik dari biologi; pada 1990-an, hanya ahli bahasa dan biologi paling berani yang mengklaim kelayakan analisis semacam itu. Di arsip biara St. Tomasz di Brno, yang kepala biaranya adalah Mendel, ditemukan lembaran dengan kolom nama belakang yang diakhiri dengan "mann", "bauer", "mayer", dan dengan beberapa pecahan dan perhitungan. Dalam upaya untuk menemukan hukum formal asal usul nama keluarga, Mendel membuat perhitungan yang rumit, di mana ia memperhitungkan jumlah vokal dan konsonan dalam bahasa Jerman, jumlah kata yang dianggapnya, jumlah nama keluarga, dll.

Di negara kita, linguistik struktural mulai berkembang pada waktu yang hampir bersamaan dengan di Barat - pada pergantian abad ke-19 hingga ke-20. Bersamaan dengan F. de Saussure, konsep bahasa sebagai suatu sistem dikembangkan dalam karyanya oleh profesor Universitas Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berkorespondensi untuk waktu yang lama dengan de Saussure, masing-masing, sekolah linguistik Jenewa dan Kazan berkolaborasi satu sama lain. Jika Saussure dapat disebut sebagai ideolog metode "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan dasar praktis untuk penerapannya. Dia adalah orang pertama yang memisahkan linguistik (seperti tepat ilmu yang menggunakan metode statistik dan ketergantungan fungsional) dari filologi (komunitas disiplin kemanusiaan yang mempelajari budaya spiritual melalui bahasa dan ucapan). Ilmuwan itu sendiri percaya bahwa "linguistik dapat berguna dalam waktu dekat, hanya dibebaskan dari persatuan wajib dengan filologi dan sejarah sastra" . Fonologi menjadi "tempat pengujian" untuk pengenalan metode matematika ke dalam linguistik - terdengar sebagai "atom" dari sistem bahasa, yang memiliki sejumlah sifat yang mudah diukur, adalah bahan yang paling nyaman untuk metode deskripsi yang formal dan ketat. Fonologi menyangkal keberadaan makna dalam bunyi, sehingga faktor "manusia" dihilangkan dalam kajian. Dalam pengertian ini, fonem seperti objek fisik atau biologis.

Fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili bidang yang terpisah, "realitas fenomenologis" yang terpisah. Misalnya, dalam bahasa Inggris, bunyi "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, orang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Hal utama adalah bahwa fonem akan menjalankan fungsi utamanya - bermakna -. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi satu bunyi dalam satu bahasa dapat sesuai dengan fonem yang berbeda di bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain keduanya adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan atau tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah sekumpulan kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi bahasa adalah seperangkat fitur yang diatur secara sistematis. Pada 1920-an -1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur alat bicara - lidah, gigi, pita suara. Misalnya, dalam bahasa Inggris perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara) dan tingkat suara yang membedakan satu fonem dari fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa". Yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa syarat yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Jadi, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai sekumpulan perbandingan dan pertentangan bahasa. Bahasa adalah ekspresi makna kata dan alat komunikasi, dan kedua fungsi ini tidak pernah bersamaan. Kita dapat melihat pergantian bentuk dan isi: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Artinya dalam suatu bahasa, ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem, morfem - menjadi kata, kata - menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari sekedar penjumlahan dari bagian-bagiannya.

Saussure mengusulkan gagasan ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari peran tanda dalam masyarakat. Saussure menyebut ilmu ini semiologi (dari bahasa Yunani "semeîon" - tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada tahun 1920-an dan 1930-an dan di Paris pada tahun 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan-temuan sastra yang disusun (atau diartikulasikan) dalam kerangka struktur-struktur ini. Selain itu, di masa senja karirnya, sejalan dengan kursusnya di bidang linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini adalah upaya untuk mempelajari masalah "probabilitas" dalam bahasa dalam suatu sistem. Penelitian semacam itu membantu memusatkan perhatian pada "sisi nyata" dari probabilitas; "kata kunci" yang dicari anagramnya oleh Saussure, menurut Jean Starobinsky, "alat bagi penyair, bukan sumber kehidupan puisi." Puisi itu berfungsi untuk menukar bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, terlihat keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran: “karena puisi diekspresikan tidak hanya dengan kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa” (lihat . Lampiran 1).

Upaya Saussure untuk mempelajari nama yang tepat dalam puisi Romawi akhir menekankan salah satu komponen analisis linguistiknya - sifat tanda yang sewenang-wenang, serta esensi formal linguistik Saussure, yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa saat ini karya-karya Saussure tampaknya sangat konsisten dalam keengganannya untuk mempelajari simbol-simbol fenomena yang memiliki makna yang jelas [Lampiran 1]. Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, dia mendefinisikan simbol hanya untuk menetapkannya ke pembacaan yang salah: jika tidak disengaja, simbol itu tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang tidak hanya menggambarkan tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semiologi hanya dapat menjelaskan tanda-tanda yang acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak dapat membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya hal ini berubah menjadi sebuah pertanyaan. Sebaliknya, dia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas berdasarkan sejarah dan dugaan subjektif, dan metode interpretasi acak berdasarkan konsep ini, dan, di sisi lain, konsep strukturalis yang menghapus pertentangan antara bentuk dan isi (subjek dan objek), makna dan asal usul dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum - tulisan Ferdinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi tentang makna dalam bahasa dan budaya.

Ilmuwan Rusia juga diwakili di Kongres Ahli Bahasa Internasional Pertama di Den Haag pada tahun 1928. S. Kartsevsky, R. Yakobson, dan N. Trubetskoy membuat laporan yang meneliti struktur hierarki bahasa - dalam semangat gagasan paling modern di awal abad terakhir. Jakobson dalam tulisannya mengembangkan gagasan Saussure bahwa unsur-unsur dasar suatu bahasa harus dipelajari, pertama-tama, sehubungan dengan fungsinya, dan bukan dengan alasan kemunculannya.

Sayangnya, setelah Stalin berkuasa pada tahun 1924, linguistik Rusia, seperti banyak ilmu lainnya, terlempar kembali. Banyak ilmuwan berbakat terpaksa beremigrasi, diusir dari negara atau meninggal di kamp. Hanya sejak pertengahan 1950-an pluralisme teori tertentu menjadi mungkin - lebih lanjut tentang ini di Bagian 1.2.

1.2 Penerapan metode matematika dalam linguistik pada paruh kedua abad ke-20

Pada pertengahan abad ke-20, empat aliran linguistik dunia telah terbentuk, yang masing-masing ternyata merupakan nenek moyang dari metode "tepat" tertentu. Sekolah Fonologi Leningrad(nenek moyangnya adalah murid Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis tuturan penutur asli sebagai kriteria utama untuk menggeneralisasi bunyi dalam bentuk fonem.

Ilmuwan Lingkaran Linguistik Praha, khususnya - pendirinya N.S. Trubetskoy, yang beremigrasi dari Rusia, mengembangkan teori oposisi - struktur semantik bahasa tersebut dijelaskan oleh mereka sebagai sekumpulan unit semantik yang dibangun secara berlawanan - Sem. Teori ini diterapkan dalam studi tidak hanya bahasa, tetapi juga budaya artistik.

Ideolog deskriptivisme Amerika adalah ahli bahasa L. Bloomfield dan E. Sapir. Bahasa disajikan kepada para deskriptivis sebagai seperangkat pernyataan ucapan, yang merupakan objek utama studi mereka. Fokus mereka adalah pada aturan deskripsi ilmiah (karena itu namanya) teks: studi tentang organisasi, pengaturan, dan klasifikasi elemen-elemennya. Formalisasi prosedur analitik di bidang fonologi dan morfologi (pengembangan prinsip-prinsip untuk mempelajari bahasa pada tingkat yang berbeda, analisis distributif, metode konstituen langsung, dll.) Mengarah pada perumusan pertanyaan umum pemodelan linguistik. Kurangnya perhatian terhadap rencana isi bahasa, serta sisi paradigmatik bahasa, tidak memungkinkan para deskriptivis untuk menafsirkan bahasa sebagai suatu sistem dengan cukup lengkap.

Pada 1960-an, teori tata bahasa formal berkembang, yang muncul terutama karena karya filsuf dan ahli bahasa Amerika N. Chomsky. Dia dianggap sebagai salah satu ilmuwan dan tokoh masyarakat modern paling terkenal, banyak artikel, monograf, dan bahkan film dokumenter berdurasi penuh dikhususkan untuknya. Dengan nama cara yang secara fundamental baru untuk mendeskripsikan struktur sintaksis yang ditemukan oleh Chomsky - tata bahasa generatif (menghasilkan) - tren yang sesuai dalam linguistik disebut generativisme.

Chomsky, seorang keturunan imigran dari Rusia, belajar linguistik, matematika dan filsafat di University of Pennsylvania sejak 1945, sangat dipengaruhi oleh gurunya Zelig Harris - seperti Harris, Chomsky menganggap dan masih menganggap pandangan politiknya dekat dengan anarkisme (dia masih dikenal sebagai pengkritik sistem politik AS yang ada dan sebagai salah satu pemimpin spiritual anti-globalisme).

Karya ilmiah besar pertama Chomsky, tesis master "Morphology of Modern Hebrew » (1951) tetap tidak dipublikasikan. Chomsky menerima gelar doktor dari University of Pennsylvania pada tahun 1955, tetapi banyak penelitian mendasari disertasinya (diterbitkan secara penuh hanya pada tahun 1975 dengan judul The Logical Structure of Linguistic Theory) dan monograf pertamanya, Syntactic Structures (1957, Rus. trans .1962), dilakukan di Universitas Harvard pada tahun 1951-1955. Pada tahun 1955 yang sama, ilmuwan tersebut pindah ke Massachusetts Institute of Technology, di mana ia menjadi profesor pada tahun 1962.

Teori Chomsky telah melalui beberapa tahapan dalam perkembangannya.

Dalam monograf pertama "Syntactic Structures", ilmuwan menampilkan bahasa sebagai mekanisme untuk menghasilkan rangkaian kalimat yang tak terbatas menggunakan seperangkat sarana tata bahasa yang terbatas. Untuk mendeskripsikan sifat linguistik, ia mengusulkan konsep struktur tata bahasa yang dalam (tersembunyi dari persepsi langsung dan dihasilkan oleh sistem rekursif, yaitu, dapat diterapkan berulang kali, aturan) dan permukaan (dipersepsikan langsung), serta transformasi yang menggambarkan transisi. dari struktur dalam ke struktur permukaan. Beberapa struktur permukaan dapat berhubungan dengan satu struktur dalam (misalnya, struktur pasif Keputusan tersebut ditandatangani oleh Presiden berasal dari Deep Structure yang sama dengan konstruksi aktif Presiden menandatangani keputusan tersebut) dan sebaliknya (dengan demikian, ambiguitas ibu mencintai anak perempuan digambarkan sebagai hasil dari kebetulan struktur permukaan yang kembali ke dua kedalaman yang berbeda, di mana ibu adalah orang yang mencintai anak perempuan, dan yang lain, orang yang dicintai oleh anak perempuan).

Teori standar Chomsky dianggap sebagai model "Aspek" yang ditetapkan dalam buku Chomsky "Aspek Teori Sintaks". Dalam model ini, untuk pertama kalinya, aturan interpretasi semantik diperkenalkan ke dalam teori formal, menghubungkan makna dengan struktur yang dalam. Dalam Aspek, kompetensi linguistik bertentangan dengan penggunaan bahasa (kinerja), yang disebut hipotesis Katz-Postal tentang pelestarian makna selama transformasi diadopsi, sehubungan dengan konsep transformasi opsional yang dikecualikan, dan aparatur fitur sintaksis yang menjelaskan kompatibilitas leksikal diperkenalkan.

Pada tahun 1970-an, Chomsky mengerjakan teori kontrol dan pengikatan (GB-theory - dari kata pemerintah Dan mengikat) lebih umum dari yang sebelumnya. Di dalamnya, ilmuwan meninggalkan aturan khusus yang menggambarkan struktur sintaksis bahasa tertentu. Semua transformasi telah diganti dengan satu transformasi gerakan universal. Dalam kerangka teori GB, ada juga modul pribadi, yang masing-masing bertanggung jawab atas bagian tata bahasanya sendiri.

Baru-baru ini, pada tahun 1995, Chomsky mengajukan program minimalis, di mana bahasa manusia digambarkan seperti bahasa mesin. Ini hanyalah sebuah program - bukan model atau teori. Di dalamnya, Chomsky mengidentifikasi dua subsistem utama dari perangkat bahasa manusia: leksikon dan sistem komputasi, serta dua antarmuka - fonetis dan logis.

Tata bahasa formal Chomsky telah menjadi klasik untuk mendeskripsikan tidak hanya bahasa alami tetapi juga bahasa buatan - khususnya bahasa pemrograman. Perkembangan linguistik struktural pada paruh kedua abad ke-20 dapat dianggap sebagai "revolusi Chomskian".

Sekolah Fonologi Moskow, yang perwakilannya adalah A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, menggunakan teori serupa untuk mempelajari fonetik. Secara bertahap, metode "tepat" mulai diterapkan tidak hanya pada fonetik, tetapi juga pada sintaksis. Baik ahli bahasa maupun ahli matematika, baik di sini maupun di luar negeri, mulai mempelajari struktur bahasa. Pada 1950-an dan 60-an, tahap baru interaksi antara matematika dan linguistik dimulai di Uni Soviet, terkait dengan pengembangan sistem terjemahan mesin.

Dorongan untuk dimulainya karya-karya ini di negara kita adalah perkembangan pertama di bidang terjemahan mesin di Amerika Serikat (meskipun perangkat terjemahan mekanis pertama oleh P.P. Smirnov-Troyansky ditemukan di Uni Soviet pada tahun 1933, karena primitif, tidak meluas). Pada tahun 1947, A. Butt dan D. Britten menemukan kode untuk terjemahan kata demi kata menggunakan komputer, setahun kemudian, R. Richens mengusulkan aturan untuk membagi kata menjadi batang dan akhiran dalam terjemahan mesin. Tahun-tahun itu sangat berbeda dengan hari ini. Ini adalah mesin yang sangat besar dan mahal yang menempati seluruh ruangan dan membutuhkan banyak staf insinyur, operator, dan pemrogram untuk memeliharanya. Pada dasarnya, komputer ini digunakan untuk melakukan kalkulasi matematis untuk kebutuhan institusi militer - yang baru dalam matematika, fisika, dan teknologi melayani, pertama-tama, urusan militer. Pada tahap awal, pengembangan MP didukung secara aktif oleh militer, sementara (dalam kondisi Perang Dingin) arah Rusia-Inggris berkembang di AS, dan arah Anglo-Rusia di Uni Soviet.

Pada bulan Januari 1954, "Eksperimen Georgetown" berlangsung di Massachusetts Technical University - demonstrasi publik pertama tentang terjemahan dari bahasa Rusia ke bahasa Inggris pada mesin IBM-701. Abstrak pesan tentang keberhasilan percobaan, dibuat oleh D.Yu. Panov, muncul di RJ "Mathematics", 1954, No. 10: "Translation from one language to another using a machine: a report on the first success test."

D. Yu. Panov (pada waktu itu direktur Institut Informasi Ilmiah - INI, kemudian VINITI) menarik I. K. Belskaya, yang kemudian mengepalai kelompok terjemahan mesin di Institut Matematika Precise dan Teknik Komputer Akademi Ilmu Pengetahuan Uni Soviet, untuk mengerjakan terjemahan mesin. Pada akhir tahun 1955, pengalaman pertama menerjemahkan dari bahasa Inggris ke bahasa Rusia dengan bantuan mesin BESM sudah ada sejak lama. Program untuk BESM disusun oleh N.P. Trifonov dan L.N. Korolev, yang tesis Ph.D.-nya dikhususkan untuk metode menyusun kamus untuk terjemahan mesin.

Secara paralel, pekerjaan terjemahan mesin dilakukan di Departemen Matematika Terapan Institut Matematika Akademi Ilmu Pengetahuan Uni Soviet (sekarang Institut Matematika Terapan M.V. Keldysh dari Akademi Ilmu Pengetahuan Rusia). Atas prakarsa ahli matematika A.A. Lyapunov. Dia melibatkan O.S. Kulagin dan murid-muridnya T.D. Wenzel dan N.N. Ricco. Gagasan Lyapunov dan Kulagina tentang kemungkinan menggunakan teknologi untuk menerjemahkan dari satu bahasa ke bahasa lain diterbitkan dalam jurnal Nature, 1955, No. 8. Sejak akhir tahun 1955, T.N. Moloshnaya, yang kemudian memulai pekerjaan mandiri pada algoritme terjemahan Inggris-Rusia.

R. Frumkina, yang saat itu terlibat dalam algoritme terjemahan dari bahasa Spanyol, mengenang bahwa pada tahap pekerjaan ini sulit untuk mengambil langkah yang konsisten. Jauh lebih sering saya harus mengikuti pengalaman heuristik - pengalaman saya sendiri atau rekan kerja.

Namun, sistem terjemahan mesin generasi pertama sangat tidak sempurna. Semuanya didasarkan pada algoritme terjemahan berurutan "kata demi kata", "frasa demi frasa" - koneksi semantik antara kata dan kalimat tidak diperhitungkan sama sekali. Misalnya kalimatnya adalah: John sedang mencari kotak mainannya.Akhirnya dia menemukannya. Kotak itu ada di dalam pena.Yohanes sangat senang. (John sedang mencari kotak mainannya. Akhirnya ia menemukannya. Kotak itu ada di dalam playpen. John sangat senang.).” "Pena" dalam konteks ini bukanlah "pena" (alat tulis), melainkan "playpen" ( boks). Pengetahuan tentang sinonim, antonim, dan makna kiasan sulit untuk dimasukkan ke dalam komputer. Arah yang menjanjikan adalah pengembangan sistem komputer yang berfokus pada penggunaan penerjemah manusia.

Seiring waktu, sistem terjemahan langsung digantikan oleh sistem-T (dari kata bahasa Inggris "transfer" - transformasi), di mana terjemahan dilakukan pada tingkat struktur sintaksis. Algoritma sistem-T menggunakan mekanisme yang memungkinkan untuk membangun struktur sintaksis sesuai dengan aturan tata bahasa kalimat masukan (mirip dengan bagaimana bahasa asing diajarkan di sekolah menengah), dan kemudian mensintesis kalimat keluaran dengan mengubah struktur sintaksis dan mengganti kata-kata yang diperlukan dari kamus.

Lyapunov berbicara tentang penerjemahan dengan mengekstraksi makna teks terjemahan dan menyajikannya dalam bahasa lain. Pendekatan untuk membangun sistem terjemahan mesin berdasarkan perolehan representasi semantik dari kalimat input dengan analisis semantik dan sintesis kalimat input sesuai dengan representasi semantik yang diperoleh masih dianggap paling sempurna. Sistem seperti itu disebut sistem-I (dari kata "interlingua"). Namun, tugas untuk membuatnya, yang dimulai pada akhir 50-an dan awal 60-an, sejauh ini belum sepenuhnya terselesaikan, terlepas dari upaya Federasi Internasional IFIP - komunitas ilmuwan dunia di bidang pemrosesan informasi.

Para ilmuwan berpikir tentang bagaimana memformalkan dan membangun algoritme untuk bekerja dengan teks, kamus apa yang harus dimasukkan ke dalam mesin, pola linguistik apa yang harus digunakan dalam terjemahan mesin. Linguistik tradisional tidak memiliki gagasan seperti itu - tidak hanya dari segi semantik, tetapi juga dari segi sintaksis. Pada saat itu, tidak ada daftar konstruksi sintaksis untuk bahasa apa pun, kondisi kompatibilitas dan pertukarannya tidak dipelajari, aturan untuk membangun unit besar struktur sintaksis dari elemen penyusun yang lebih kecil tidak dikembangkan.

Kebutuhan untuk menciptakan landasan teoretis terjemahan mesin mengarah pada pembentukan dan pengembangan linguistik matematika. Peran utama dalam hal ini di Uni Soviet dimainkan oleh matematikawan A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, ahli bahasa V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Disertasi Kulagina dikhususkan untuk studi teori tata bahasa formal (bersamaan dengan N. Khomsky di AS), Kuznetsov mengedepankan tugas aksiomatisasi linguistik, yang kembali ke karya F.F. Fortunatov.

Pada tanggal 6 Mei 1960, Keputusan Presidium Akademi Ilmu Pengetahuan Uni Soviet "Tentang pengembangan metode struktural dan matematika untuk mempelajari bahasa" diadopsi, dan divisi yang sesuai dibuat di Institut Linguistik dan Institut Bahasa. Bahasa Rusia. Sejak 1960, universitas kemanusiaan terkemuka di negara itu - Fakultas Filologi Universitas Negeri Moskow, Leninrad, Universitas Novosibirsk, Institut Bahasa Asing Negeri Moskow - mulai melatih personel di bidang pemrosesan teks otomatis.

Namun, karya terjemahan mesin pada periode ini, yang disebut "klasik", lebih bersifat teoretis daripada kepentingan praktis. Sistem terjemahan mesin yang hemat biaya mulai dibuat hanya pada tahun delapan puluhan abad yang lalu. Saya akan membicarakannya nanti di Bagian 2.1, Terjemahan Mesin.

Tahun 1960-an - 70-an termasuk perkembangan teori yang mendalam dengan menggunakan metode teori himpunan dan logika matematika, seperti teori medan dan teori himpunan fuzzy.

Penulis teori lapangan dalam linguistik adalah penyair, penerjemah, dan ahli bahasa Soviet V.G. Nasihat. Dia awalnya mengembangkan teorinya berdasarkan bahasa Jerman. Bagi Admoni, konsep "bidang" menunjukkan sekumpulan elemen linguistik yang tidak kosong (misalnya, "bidang leksikal", "bidang semantik").

Struktur bidangnya heterogen: terdiri dari inti, yang elemen-elemennya memiliki serangkaian fitur lengkap yang mendefinisikan suatu himpunan, dan pinggiran, elemen-elemen yang dapat memiliki kedua fitur dari himpunan tertentu (tidak semua) dan yang tetangga. Saya akan memberikan contoh yang mengilustrasikan pernyataan ini: misalnya, dalam bahasa Inggris, bidang kata majemuk ("day-dream" - "dream" sulit dipisahkan dari bidang frasa ("gas air mata" - "gas air mata") .

Teori himpunan fuzzy yang telah disebutkan di atas berkaitan erat dengan teori medan. Di Uni Soviet, ahli bahasa V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, bagaimanapun, leluhurnya adalah ahli matematika Amerika L. Zadeh, yang pada tahun 1965 menerbitkan artikel "Fuzzy Logic". Memberikan pembenaran matematis untuk teori himpunan fuzzy, Zade mempertimbangkannya berdasarkan materi linguistik.

Dalam teori ini, kita tidak berbicara banyak tentang kepemilikan elemen ke himpunan tertentu (АОа), melainkan tentang derajat keanggotaan ini (mАОа), karena elemen periferal dapat menjadi bagian dari beberapa bidang pada satu derajat atau lainnya. Zade (Lofti-zade) adalah penduduk asli Azerbaijan, hingga usia 12 tahun ia memiliki kebiasaan berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggris, dan Persia - dan menggunakan tiga huruf berbeda: Sirilik, Latin, Arab. Ketika seorang ilmuwan ditanya apa kesamaan antara teori himpunan fuzzy dan linguistik, dia tidak menyangkal hubungan ini, tetapi mengklarifikasi: “Saya tidak yakin bahwa mempelajari bahasa-bahasa ini memiliki pengaruh besar pada pemikiran saya. Jika demikian, maka hanya secara tidak sadar. Di masa mudanya, Zadeh belajar di sekolah Presbiterian di Teheran, dan setelah Perang Dunia II dia beremigrasi ke Amerika Serikat. “Pertanyaannya bukanlah apakah saya orang Amerika, Rusia, Azerbaijan, atau orang lain,” katanya dalam salah satu percakapan, “Saya dibentuk oleh semua budaya dan bangsa ini dan merasa cukup nyaman di antara mereka masing-masing.” Dalam kata-kata ini ada sesuatu yang mirip dengan apa yang mencirikan teori himpunan fuzzy - penyimpangan dari definisi yang tidak ambigu dan kategori tajam.

Di negara kita, pada tahun 70-an, karya ahli bahasa Barat abad ke-20 diterjemahkan dan dipelajari. I.A. Melchuk menerjemahkan karya N. Chomsky ke dalam bahasa Rusia. DI ATAS. Slyusareva dalam bukunya "The Theory of F. de Saussure in the Light of Modern Linguistics" menghubungkan postulat ajaran Saussure dengan masalah linguistik aktual tahun 70-an. Ada kecenderungan matematisasi linguistik lebih lanjut. Universitas dalam negeri terkemuka melatih personel dalam "linguistik Matematika (teoretis, terapan)" khusus. Pada saat yang sama di Barat terjadi lompatan tajam dalam perkembangan teknologi komputer, yang membutuhkan landasan linguistik yang semakin banyak.

Pada 1980-an, Profesor Institut Studi Oriental dari Akademi Ilmu Pengetahuan Yu.K. Lekomtsev, saat menganalisis bahasa linguistik melalui analisis skema, tabel, dan jenis notasi lain yang digunakan dalam deskripsi linguistik, menganggap sistem matematika cocok untuk tujuan ini (terutama sistem aljabar matriks).

Jadi, sepanjang abad ke-20, terjadi konvergensi antara yang tepat dan humaniora. Interaksi matematika dengan linguistik semakin menemukan penerapan praktisnya. Lebih lanjut tentang ini di bab berikutnya.

Bab 2. Contoh penggunaan matematika dalam linguistik

2.1 Terjemahan mesin

Gagasan menerjemahkan dari satu bahasa ke bahasa lain dengan bantuan mekanisme universal muncul beberapa abad sebelum perkembangan pertama di bidang ini dimulai - pada tahun 1649, Rene Descartes mengusulkan gagasan bahasa di mana gagasan yang setara dari bahasa yang berbeda akan diungkapkan oleh satu simbol. Upaya pertama untuk mengimplementasikan ide ini pada tahun 1930-an-40-an, awal perkembangan teoretis pada pertengahan abad ini, peningkatan sistem terjemahan dengan bantuan teknologi pada tahun 1970-an-80-an, perkembangan pesat teknologi terjemahan pada tahun terakhir. dekade - ini adalah tahapan dalam pengembangan terjemahan mesin sebagai sebuah industri. Dari karya terjemahan mesin itulah linguistik komputer sebagai ilmu berkembang.

Dengan perkembangan teknologi komputer di akhir tahun 70-an dan awal 80-an, para peneliti menetapkan tujuan yang lebih realistis dan hemat biaya - mesin tidak menjadi pesaing (seperti yang diasumsikan sebelumnya), tetapi menjadi asisten penerjemah manusia. Terjemahan mesin tidak lagi melayani tugas-tugas militer secara eksklusif (semua penemuan dan penelitian Soviet dan Amerika, yang berfokus terutama pada bahasa Rusia dan Inggris, berkontribusi pada Perang Dingin dengan satu atau lain cara). Pada tahun 1978, kata-kata bahasa alami ditransmisikan melalui jaringan interkoneksi Arpa, dan enam tahun kemudian, program terjemahan komputer mikro pertama muncul di Amerika Serikat.

Pada tahun 70-an, Komisi Komunitas Eropa membeli penerjemah komputer Systran versi Inggris-Prancis, memesan juga versi Prancis-Inggris dan Italia-Inggris, dan sistem terjemahan Rusia-ke-Inggris yang digunakan oleh Angkatan Bersenjata AS. Beginilah fondasi proyek EUROTRA diletakkan.

Tentang kebangkitan terjemahan mesin di tahun 70-80an. fakta-fakta berikut bersaksi: Komisi Komunitas Eropa (CEC) membeli Systran versi Inggris-Prancis, serta sistem terjemahan dari bahasa Rusia ke bahasa Inggris (yang terakhir dikembangkan setelah laporan ALPAC dan terus digunakan oleh US Air Angkatan dan NASA); selain itu, CEC memerintahkan pengembangan versi Prancis-Inggris dan Italia-Inggris. Bersamaan dengan itu, ada perluasan yang cepat dari aktivitas penerjemahan mesin di Jepang; di AS, Organisasi Kesehatan Pan Amerika (PAHO) memerintahkan pengembangan arah Spanyol-Inggris (sistem SPANAM); Angkatan Udara AS mendanai pengembangan sistem terjemahan mesin di Pusat Penelitian Linguistik di University of Texas di Austin; Grup TAUM di Kanada membuat kemajuan penting dalam mengembangkan sistem METEO (meteorological translation) mereka. Sejumlah proyek dimulai pada tahun 70-an dan 80-an. kemudian berkembang menjadi sistem komersial penuh.

Selama periode 1978-93, 20 juta dolar dihabiskan untuk penelitian di bidang terjemahan mesin di AS, 70 juta di Eropa, dan 200 juta di Jepang.

Salah satu perkembangan baru adalah teknologi TM (memori terjemahan), yang bekerja berdasarkan prinsip akumulasi: selama proses penerjemahan, segmen asli (kalimat) dan terjemahannya disimpan, menghasilkan pembentukan basis data linguistik; jika segmen yang identik atau serupa ditemukan dalam teks yang baru diterjemahkan, itu ditampilkan bersama terjemahan dan indikasi persentase kecocokan. Penerjemah kemudian membuat keputusan (untuk mengedit, menolak atau menerima terjemahan), yang hasilnya disimpan oleh sistem, sehingga tidak perlu menerjemahkan kalimat yang sama dua kali. Sistem komersial terkenal berdasarkan teknologi TM saat ini dikembangkan oleh sistem TRADOS (didirikan pada tahun 1984).

Saat ini, beberapa lusin perusahaan sedang mengembangkan sistem terjemahan mesin komersial, termasuk: Systran, IBM, L&H (Lernout & Hauspie), Bahasa Transparan, Bahasa Lintas, Perangkat Lunak Trident, Atril, Trados, Caterpillar Co., LingoWare; Perangkat Lunak Ata; Linguistik b.v. dan lainnya Sekarang Anda dapat menggunakan layanan penerjemah otomatis langsung di Web: alphaWorks; Penerjemah Online PROMT, LogoMedia.net, Layanan Terjemahan Ikan Babel AltaVista; InfiniT.com; Menerjemahkan Internet.

Sistem terjemahan yang efektif secara komersial juga muncul di paruh kedua tahun 80-an di negara kita. Konsep terjemahan mesin telah berkembang (mulai mencakup "pembuatan sejumlah sistem dan perangkat otomatis dan otomatis yang secara otomatis atau semi-otomatis melakukan seluruh siklus terjemahan atau tugas individu dalam dialog dengan seseorang"), dan alokasi pemerintah untuk pengembangan industri ini telah meningkat.

Rusia, Inggris, Jerman, Prancis, dan Jepang menjadi bahasa utama sistem terjemahan domestik. All-Union Translation Center (VTsP) mengembangkan sistem untuk menerjemahkan dari bahasa Inggris dan Jerman ke bahasa Rusia di komputer ES-1035-ANRAP. Itu terdiri dari tiga kamus - masukan bahasa Inggris dan Jerman dan keluaran Rusia - di bawah satu perangkat lunak. Ada beberapa kamus khusus yang dapat dipertukarkan - untuk teknologi komputer, pemrograman, elektronik radio, teknik mesin, pertanian, metalurgi. Sistem dapat bekerja dalam dua mode - otomatis dan interaktif, saat layar menampilkan teks sumber dan terjemahan per frasa, yang dapat diedit oleh seseorang. Kecepatan menerjemahkan teks ke dalam ANRAP (dari awal pengetikan hingga akhir pencetakan) kira-kira 100 halaman per jam.

Pada tahun 1989, keluarga penerjemah komersial jenis SPRINT dibentuk, bekerja dengan bahasa Rusia, Inggris, Jerman, dan Jepang. Keuntungan utama mereka adalah kompatibilitasnya dengan PC IBM - dengan demikian, sistem terjemahan mesin domestik mencapai tingkat kualitas internasional. Pada saat yang sama, sistem terjemahan mesin dari FRAP Prancis ke Rusia sedang dikembangkan, yang mencakup 4 tahap analisis teks: grafematik, morfologis, sintaksis, dan semantik. Di LGPI mereka. Herzen, pekerjaan sedang dilakukan pada sistem SILOD-MP empat bahasa (Inggris, Prancis, Spanyol, Rusia) (kamus Inggris-Rusia dan Perancis-Rusia digunakan dalam mode industri.

Untuk terjemahan teks khusus tentang teknik kelistrikan, sistem ETAP-2 ada. Analisis teks masukan di dalamnya dilakukan pada dua tingkatan - morfologis dan sintaksis. Kamus ETAP-2 berisi sekitar 4 ribu entri; tahap transformasi teks - sekitar 1000 aturan (96 umum, 342 pribadi, sisanya adalah kamus). Semua ini memastikan kualitas terjemahan yang memuaskan (katakanlah, judul paten "Pengaturan jaringan fase optik dan perangkat penghubung yang memiliki pengaturan seperti itu" diterjemahkan sebagai "Perangkat jaringan fase optik dan perangkat penghubung dengan perangkat semacam itu" - meskipun tautologi, artinya dipertahankan).

Di Institut Pedagogi Bahasa Asing Minsk, berdasarkan kamus bentuk kata dan frasa bahasa Inggris-Rusia, sebuah sistem untuk terjemahan mesin judul ditemukan, di Institut Studi Oriental Akademi Ilmu Pengetahuan - sebuah sistem untuk menerjemahkan dari bahasa Jepang ke bahasa Rusia. Layanan kosakata dan terminologi otomatis pertama (SLOTHERM) untuk komputasi dan pemrograman, dibuat di Moscow Research Institute of Automation Systems, berisi sekitar 20.000 istilah dalam kamus penjelasan dan kamus khusus untuk penelitian linguistik.

Sistem terjemahan mesin secara bertahap mulai digunakan tidak hanya untuk tujuan yang dimaksudkan, tetapi juga sebagai komponen penting dari sistem pembelajaran otomatis (untuk mengajar terjemahan, memeriksa ejaan, dan pengetahuan tata bahasa).

Tahun 90-an membawa perkembangan pesat pasar PC (dari desktop ke saku) dan teknologi informasi, meluasnya penggunaan Internet (yang menjadi lebih internasional dan multibahasa). Semua ini membuat pengembangan lebih lanjut dari sistem terjemahan otomatis menjadi permintaan. Sejak awal 1990-an Pengembang domestik juga memasuki pasar sistem PC.

Pada bulan Juli 1990, sistem terjemahan mesin komersial pertama di Rusia yang disebut PROMT (PROgrammer's Machine Translation) dipresentasikan di Forum PC di Moskow.PROMT memenangkan tender NASA untuk penyediaan sistem MP (PROMT adalah satu-satunya perusahaan non-Amerika dalam hal ini). tender). Pada tahun 1992, PROMT merilis seluruh keluarga sistem dengan nama baru STYLUS untuk terjemahan dari bahasa Inggris, Jerman, Prancis, Italia, dan Spanyol ke Rusia dan dari Rusia ke Inggris, dan sistem terjemahan mesin pertama di dunia untuk Windows dibuat pada dasar STYLUS pada tahun 1993. Pada tahun 1994, STYLUS 2.0 dirilis untuk Windows 3.X/95/NT, dan pada tahun 1995-1996 generasi ketiga dari sistem terjemahan mesin, sepenuhnya 32-bit STYLUS 3.0 untuk Windows 95/NT, sedangkan pengembangan sistem terjemahan mesin Rusia-Jerman dan Rusia-Prancis pertama di dunia yang benar-benar baru berhasil diselesaikan.

Pada tahun 1997, sebuah perjanjian ditandatangani dengan perusahaan Prancis Softissimo tentang pembuatan sistem terjemahan dari bahasa Prancis ke bahasa Jerman dan Inggris dan sebaliknya, dan pada bulan Desember tahun ini, sistem terjemahan Jerman-Prancis pertama di dunia dirilis. Pada tahun yang sama, PROMT merilis sistem yang diimplementasikan menggunakan teknologi Gigant, yang mendukung beberapa arahan bahasa dalam satu shell, serta penerjemah khusus untuk bekerja di Internet WebTranSite.

Pada tahun 1998, seluruh konstelasi program dirilis dengan nama baru PROMT 98. Setahun kemudian, PROMT merilis dua produk baru: paket perangkat lunak unik untuk bekerja di Internet - PROMT Internet, dan penerjemah untuk sistem surat perusahaan - PROMT Mail Penerjemah. Pada November 1999, PROMT diakui sebagai sistem penerjemahan mesin terbaik yang diuji oleh majalah Prancis, PC Expert, mengungguli para pesaingnya sebesar 30 persen. Solusi server khusus juga telah dikembangkan untuk klien korporat - server terjemahan korporat PROMT Translation Server (PTS) dan solusi Internet PROMT Internet Translation Server (PITS). Pada tahun 2000, PROMT memperbarui seluruh lini produk perangkat lunaknya dengan merilis sistem MT generasi baru: PROMT Translation Office 2000, PROMT Internet 2000 dan Magic Gooddy 2000.

Terjemahan online dengan dukungan sistem PROMT digunakan di sejumlah situs dalam dan luar negeri: Penerjemah Online PROMT, InfiniT.com, Translate.Ru, Lycos, dll., serta di institusi berbagai profil untuk menerjemahkan dokumen bisnis, artikel dan surat (ada sistem terjemahan yang dibangun langsung ke Outlook Express dan klien email lainnya).

Saat ini, teknologi terjemahan mesin baru muncul berdasarkan penggunaan sistem kecerdasan buatan dan metode statistik. Tentang yang terakhir - di bagian selanjutnya.

2.2 Metode statistik dalam pembelajaran bahasa

Perhatian yang cukup besar dalam linguistik modern diberikan untuk mempelajari fenomena linguistik dengan menggunakan metode matematika kuantitatif. Data kuantitatif seringkali membantu untuk lebih memahami fenomena yang diteliti, tempat dan perannya dalam sistem fenomena terkait. Jawaban atas pertanyaan "berapa banyak" membantu menjawab pertanyaan "apa", "bagaimana", "mengapa" - begitulah potensi heuristik dari karakteristik kuantitatif.

Metode statistik memainkan peran penting dalam pengembangan sistem terjemahan mesin (lihat Bagian 2.1). Dalam pendekatan statistik, masalah translasi dianggap sebagai kanal yang berisik. Bayangkan kita perlu menerjemahkan kalimat dari bahasa Inggris ke bahasa Rusia. Prinsip saluran bising memberi kita penjelasan berikut tentang hubungan antara kalimat bahasa Inggris dan Rusia: kalimat bahasa Inggris tidak lain adalah kalimat Rusia yang terdistorsi oleh semacam kebisingan. Untuk memulihkan kalimat asli bahasa Rusia, kita perlu mengetahui apa yang biasanya dikatakan orang dalam bahasa Rusia dan bagaimana frasa bahasa Rusia diubah menjadi bahasa Inggris. Terjemahan dilakukan dengan mencari kalimat Rusia yang memaksimalkan produk dari probabilitas tak bersyarat dari kalimat Rusia dan probabilitas kalimat bahasa Inggris (asli) yang diberikan kalimat Rusia yang diberikan. Menurut teorema Bayes, kalimat Rusia ini adalah terjemahan bahasa Inggris yang paling mungkin:

di mana e adalah kalimat terjemahan dan f adalah kalimat aslinya

Jadi kita membutuhkan model sumber dan model saluran, atau model bahasa dan model terjemahan. Model bahasa harus menetapkan skor probabilitas untuk setiap kalimat dalam bahasa target (dalam kasus kami, bahasa Rusia), dan model terjemahan ke kalimat aslinya. (lihat tabel 1)

Secara umum, sistem terjemahan mesin beroperasi dalam dua mode:

1. Pelatihan sistem: korpus pelatihan teks paralel diambil, dan menggunakan pemrograman linier, nilai tabel korespondensi terjemahan dicari yang memaksimalkan kemungkinan (misalnya) bagian Rusia dari korpus dengan bahasa Inggris yang tersedia sesuai dengan model terjemahan yang dipilih. Model bahasa Rusia dibangun di atas bagian Rusia dari korpus yang sama.

2. Eksploitasi: berdasarkan data yang diperoleh untuk kalimat bahasa Inggris yang tidak dikenal, dicari bahasa Rusia yang memaksimalkan produk probabilitas yang ditetapkan oleh model bahasa dan model terjemahan. Program yang digunakan untuk pencarian semacam itu disebut decoder.

Model penerjemahan statistik yang paling sederhana adalah model penerjemahan literal. Model ini mengasumsikan bahwa untuk menerjemahkan kalimat dari satu bahasa ke bahasa lain, cukup menerjemahkan semua kata (membuat "kantong kata"), dan model akan menyediakan penempatannya dalam urutan yang benar. Untuk mengurangi P( a, f | e) ke P(a | e , f), mis. probabilitas dari keselarasan yang diberikan diberikan sepasang kalimat, masing-masing probabilitas P(a, f | e) dinormalisasi dengan jumlah dari probabilitas semua keberpihakan dari sepasang kalimat yang diberikan:

Implementasi algoritma Viterbi yang digunakan untuk melatih Model #1 adalah sebagai berikut:

1. Seluruh tabel peluang korespondensi translasi diisi dengan nilai yang sama.

2. Untuk semua varian yang mungkin dari hubungan berpasangan kata-kata, probabilitas P(a, f | e) dihitung:

3. Nilai P(a,f|e) dinormalisasi untuk mendapatkan nilai P(a|e,f).

4. Frekuensi setiap pasangan translasi dihitung, dibobotkan dengan probabilitas setiap opsi penyelarasan.

5. Frekuensi tertimbang yang dihasilkan dinormalisasi dan membentuk tabel baru probabilitas korespondensi translasi

6. Algoritme diulang dari langkah 2.

Pertimbangkan, sebagai contoh, pelatihan model serupa pada korpus dua pasang kalimat (Gbr. 2):

gedung Putih

  • Rumah/Rumah

Setelah iterasi dalam jumlah yang banyak, kita akan mendapatkan tabel (Tabel 2) yang menunjukkan bahwa terjemahan dilakukan dengan akurasi yang tinggi.

Juga, metode statistik banyak digunakan dalam studi kosakata, morfologi, sintaksis, dan gaya. Ilmuwan dari Perm State University melakukan penelitian berdasarkan pernyataan bahwa frasa stereotip merupakan "bahan bangunan" penting dari teks. Frasa-frasa ini terdiri dari kata-kata berulang "nuklir" dan penentu kata-kata yang bergantung dan memiliki pewarnaan gaya yang diucapkan.

Dalam gaya ilmiah, kata "nuklir" dapat disebut: penelitian, studi, tugas, masalah, pertanyaan, fenomena, fakta, observasi, analisis dll. Dalam jurnalisme, kata lain adalah "nuklir", yang memiliki nilai tambah khusus untuk teks surat kabar: waktu, orang, kekuatan, bisnis, tindakan, hukum, kehidupan, sejarah, tempat dll. (total 29)

Yang menarik bagi ahli bahasa juga adalah diferensiasi profesional bahasa nasional, orisinalitas penggunaan kosa kata dan tata bahasa, tergantung pada jenis pekerjaan. Diketahui bahwa driver dalam pidato profesional menggunakan bentuk w HAI fer, kata petugas medis k HAI klub bukannya koktail Yu sh - contoh seperti itu dapat diberikan. Tugas statistik adalah melacak variabilitas pengucapan dan perubahan norma bahasa.

Perbedaan profesional menyebabkan perbedaan tidak hanya tata bahasa, tetapi juga leksikal. Universitas Negeri Yakut dinamai demikian MK Ammosov, 50 kuesioner dianalisis dengan reaksi paling umum terhadap kata-kata tertentu di antara dokter dan tukang bangunan (Tabel 3).

Pembangun

Manusia

sabar (10), kepribadian (5)

laki-laki (5)

Bagus

bantuan (8), bantuan (7)

jahat (16)

kehidupan

kematian (10)

indah (5)

kematian

mayat (8)

hidup (6)

api

panas (8), bakar (6)

api (7)

jari

tangan (14), panaritium (5)

besar (7), indeks (6)

mata

penglihatan (6), pupil, dokter mata (masing-masing 5)

coklat (10), besar (6)

kepala

pikiran (14), otak (5)

besar (9), pintar (8), pintar (6)

kehilangan

kesadaran, kehidupan (masing-masing 4)

uang (5), temukan (4)

Dapat dicatat bahwa dokter lebih sering daripada pembangun memberikan asosiasi yang berkaitan dengan kegiatan profesional mereka, karena kata-rangsangan yang diberikan dalam kuesioner lebih berkaitan dengan profesi mereka daripada dengan profesi pembangun.

Keteraturan statistik dalam suatu bahasa digunakan untuk membuat kamus frekuensi - kamus yang memberikan karakteristik numerik dari frekuensi kata (bentuk kata, frasa) dari bahasa apa pun - bahasa penulis, karya apa pun, dll. sebuah kata digunakan sebagai ciri penggunaan dalam teks volume tertentu

Model persepsi ucapan tidak mungkin tanpa kamus sebagai komponen esensialnya. Dalam persepsi tuturan, unit operasional dasarnya adalah kata. Dari sini dapat disimpulkan, khususnya, bahwa setiap kata dari teks yang dirasakan harus diidentifikasi dengan unit kosakata internal pendengar (atau pembaca) yang sesuai. Wajar untuk berasumsi bahwa sejak awal pencarian terbatas pada beberapa subdomain kamus. Menurut sebagian besar teori persepsi ucapan modern, analisis fonetik yang sebenarnya dari teks yang terdengar dalam kasus tipikal hanya memberikan sebagian informasi tentang kemungkinan penampilan fonologis kata tersebut, dan informasi semacam ini tidak sesuai dengan satu, tetapi BANYAK kata tertentu. dari kamus; Oleh karena itu, muncul dua masalah:

(a) memilih set yang sesuai menurut parameter tertentu;

(b) dalam batas-batas himpunan yang digariskan (jika dialokasikan secara memadai) untuk "menghilangkan" semua kata, kecuali satu-satunya yang paling sesuai dengan kata yang diberikan dari teks yang dikenali. Salah satu strategi "putus sekolah" adalah mengecualikan kata-kata berfrekuensi rendah. Oleh karena itu, kosakata untuk persepsi ucapan adalah kamus frekuensi. Ini adalah pembuatan kamus frekuensi bahasa Rusia versi komputer yang merupakan tugas awal dari proyek yang disajikan.

Berdasarkan materi bahasa Rusia, ada 5 kamus frekuensi (tidak termasuk kamus cabang). Mari kita perhatikan hanya beberapa kekurangan umum dari kamus yang ada.

Semua kamus frekuensi yang diketahui dari bahasa Rusia didasarkan pada pemrosesan susunan teks tertulis (cetak). Sebagian karena alasan ini, ketika identitas sebuah kata sebagian besar didasarkan pada kebetulan grafis formal, semantik tidak cukup diperhitungkan. Akibatnya, karakteristik frekuensi juga bergeser, terdistorsi; misalnya, jika penyusun kamus frekuensi memasukkan kata-kata dari kombinasi "satu sama lain" dalam statistik umum penggunaan kata "teman", maka ini hampir tidak dapat dibenarkan: mengingat semantiknya, kita harus mengakui bahwa ini sudah kata yang berbeda, atau lebih tepatnya, bahwa unit kamus independen hanyalah kombinasi secara keseluruhan.

Juga, di semua kamus yang ada, kata-kata ditempatkan hanya dalam bentuk dasarnya: kata benda dalam bentuk tunggal, kasus nominatif, kata kerja dalam bentuk infinitif, dll. Beberapa kamus memberikan informasi tentang frekuensi bentuk kata, tetapi biasanya mereka tidak melakukannya dengan cukup konsisten, tidak lengkap. Frekuensi bentuk kata yang berbeda dari kata yang sama jelas tidak cocok. Pengembang model persepsi ucapan harus mempertimbangkan bahwa dalam proses persepsi nyata justru bentuk kata tertentu yang "terbenam" dalam teks yang dapat dikenali: berdasarkan analisis bagian awal eksponen dari bentuk kata, sekumpulan kata dengan permulaan yang identik terbentuk, dan bagian awal bentuk kata belum tentu identik dengan bagian awal bentuk kamus . Ini adalah bentuk kata yang memiliki struktur ritmis tertentu, yang juga merupakan parameter yang sangat penting untuk pemilihan kata secara perseptual. Akhirnya, dalam representasi terakhir dari ucapan yang dikenali, kata-kata tersebut direpresentasikan oleh bentuk kata yang sesuai.

Ada banyak karya yang menunjukkan pentingnya frekuensi dalam proses persepsi ucapan. Tetapi kami tidak mengetahui karya-karya di mana frekuensi bentuk kata akan digunakan - sebaliknya, semua penulis secara praktis mengabaikan frekuensi bentuk kata individu, mengacu secara eksklusif pada leksem. Jika hasil yang diperoleh tidak dianggap sebagai artefak, orang harus berasumsi bahwa penutur asli entah bagaimana memiliki akses ke informasi tentang rasio frekuensi bentuk kata dan bentuk kamus, yaitu, pada kenyataannya, leksem. Selain itu, transisi dari bentuk kata ke leksem seperti itu, tentu saja, tidak dapat dijelaskan dengan pengetahuan alami dari paradigma yang sesuai, karena informasi frekuensi harus digunakan sebelum identifikasi akhir kata, jika tidak maka akan kehilangan artinya.

Menurut karakteristik statistik utama, adalah mungkin untuk menentukan dengan kesalahan relatif tertentu bagian dari kamus, yang mencakup kata-kata dengan frekuensi kemunculan yang tinggi, apa pun jenis teksnya. Dimungkinkan juga, dengan memperkenalkan pengurutan bertahap ke dalam kamus, untuk mendapatkan serangkaian kamus yang mencakup 100, 1000, 5000, dll. Karakteristik statistik kamus menarik sehubungan dengan analisis semantik kosakata. Studi tentang kelompok subjek-ideologis dan bidang semantik menunjukkan bahwa asosiasi leksikal didukung oleh tautan semantik yang terkonsentrasi di sekitar leksem dengan makna yang paling umum. Penggambaran makna dalam bidang leksiko-semantik dapat dilakukan dengan mengidentifikasi kata-kata yang memiliki makna leksem paling abstrak. Rupanya, unit kamus "kosong" (dari sudut pandang potensi nominatif) merupakan lapisan yang homogen secara statistik.

Kosakata untuk genre individu juga tidak kalah berharganya. Mempelajari ukuran kemiripannya dan sifat distribusi statistik akan memberikan informasi menarik tentang stratifikasi kualitatif kosa kata tergantung pada bidang penggunaan ucapan.

Penyusunan kamus frekuensi besar membutuhkan penggunaan teknologi komputer. Pengenalan mekanisasi parsial dan otomasi dalam proses pengerjaan kamus menarik sebagai percobaan dalam pemrosesan mesin kamus untuk berbagai teks. Kamus semacam itu membutuhkan sistem yang lebih ketat untuk memproses dan mengumpulkan materi kosakata. Secara mini, ini adalah sistem pencarian informasi yang mampu memberikan informasi tentang berbagai aspek teks dan kosa kata. Beberapa permintaan dasar untuk sistem ini direncanakan sejak awal: jumlah total kata inventaris, karakteristik statistik dari satu kata dan seluruh kamus, urutan zona kamus yang sering dan langka, dll. File kartu mesin memungkinkan Anda untuk secara otomatis membuat kamus terbalik untuk genre dan sumber individual. Banyak informasi statistik berguna lainnya tentang bahasa tersebut akan diekstraksi dari kumpulan informasi yang terakumulasi. Kamus frekuensi komputer menciptakan dasar eksperimental untuk transisi ke otomatisasi pekerjaan kosa kata yang lebih luas.

Data statistik kamus frekuensi juga dapat digunakan secara luas dalam memecahkan masalah linguistik lainnya - misalnya, dalam menganalisis dan menentukan sarana aktif pembentukan kata bahasa Rusia modern, menyelesaikan masalah peningkatan grafik dan ejaan, yang terkait dengan pertimbangan akun informasi statistik tentang kosakata (penting untuk mempertimbangkan karakteristik probabilistik dari kombinasi grafem, jenis kombinasi huruf yang diwujudkan dalam kata-kata), transkripsi dan transliterasi praktis. Parameter statistik kamus juga akan berguna dalam menyelesaikan masalah pengetikan otomatis, pengenalan, dan pembacaan otomatis teks literal.

Kamus dan tata bahasa penjelasan modern dari bahasa Rusia sebagian besar dibangun berdasarkan teks sastra dan artistik. Ada kamus frekuensi bahasa A.S. Pushkin, A.S. Griboedova, F.M. Dostoevsky, V.V. Vysotsky dan banyak penulis lainnya. Di Departemen Sejarah dan Teori Sastra Negara Bagian Smolensk. Universitas Pedagogis telah bekerja selama beberapa tahun untuk menyusun kamus frekuensi teks puisi dan prosa. Untuk penelitian ini, kamus frekuensi dari semua lirik Pushkin dan dua penyair lagi dari zaman keemasan - "Woe from Wit" oleh Griboyedov dan semua puisi Lermontov dipilih; Pasternak dan lima penyair Zaman Perak lainnya - Balmont 1894-1903, "Puisi tentang Wanita Cantik" oleh Blok, "Batu" oleh Mandelstam, "Tiang Api" oleh Gumilyov, "Anno Domini MCMXXI" oleh Akhmatova dan "Sisters of My Life" oleh Pasternak dan empat penyair lain dari Zaman Besi - "Puisi oleh Yuri Zhivago", "Saat sudah bersih", seluruh kumpulan lirik oleh M. Petrovs, "Jalannya jauh", "Kaca depan", "Perpisahan dengan salju" dan "Horseshoes" oleh Mezhirov, "Antimirov" oleh Voznesensky dan "Snezhnitsa » Rylenkova.

Perlu dicatat bahwa kamus ini berbeda sifatnya: beberapa mewakili kosakata dari satu karya dramatis, yang lain - buku lirik, atau beberapa buku, atau seluruh kumpulan puisi penyair. Hasil analisis yang disajikan dalam makalah ini harus diambil dengan hati-hati, tidak dapat dianggap mutlak. Namun, dengan bantuan langkah-langkah khusus, perbedaan sifat ontologis teks dapat dikurangi sampai batas tertentu.

Dalam beberapa tahun terakhir, pertentangan antara bahasa sehari-hari dan pidato buku menjadi semakin jelas. Masalah ini secara khusus dibahas dengan tajam di antara para ahli metodologi yang menuntut pergantian pengajaran ke arah bahasa lisan. Namun, kekhususan pidato sehari-hari masih belum dapat dijelaskan.

Kamus diproses dengan membuat aplikasi pengguna di lingkungan program perkantoran EXCEL97. Aplikasi ini mencakup empat lembar kerja buku EXCEL - lembar "Judul", lembar "Kamus" dengan data awal, "Kedekatan" dan "Jarak" dengan hasil, serta sekumpulan makro.

Informasi awal dimasukkan pada lembar "Kamus". Kamus teks yang dipelajari ditulis ke dalam sel EXCEL, kolom terakhir S dibentuk dari hasil yang diperoleh dan sama dengan jumlah kata yang ditemukan di kamus lain. Tabel "Kedekatan" dan "Jarak" berisi pengukuran kedekatan M, korelasi R, dan jarak D yang dihitung.

Makro aplikasi adalah prosedur pemrograman berbasis peristiwa yang ditulis dalam Visual Basic for Application (VBA). Prosedur didasarkan pada objek pustaka VBA dan metode pemrosesannya. Jadi, untuk operasi dengan lembar kerja aplikasi, lembar kerja objek kunci (lembar kerja) dan metode yang sesuai untuk mengaktifkan lembar Aktifkan (aktifkan) digunakan. Mengatur rentang data sumber yang dianalisis pada lembar Kamus dilakukan dengan metode Pilih objek Rentang (rentang), dan transfer kata sebagai nilai ke variabel dilakukan sebagai properti Nilai (nilai) dari Rentang yang sama obyek.

Terlepas dari kenyataan bahwa analisis korelasi peringkat membuat kita berhati-hati tentang ketergantungan topik antara teks yang berbeda, sebagian besar kata yang paling sering di setiap teks memiliki kecocokan dalam satu atau lebih teks lainnya. Kolom S menunjukkan jumlah kata-kata tersebut di antara 15 kata yang paling sering muncul untuk setiap penulis. Kata-kata dalam huruf tebal hanya muncul dalam satu kata penyair di tabel kami. Blok, Akhmatova dan Petrov sama sekali tidak memiliki kata yang disorot, mereka memiliki S = 15. Ketiga penyair ini memiliki 15 kata yang paling sering sama, hanya berbeda tempat dalam daftar. Tetapi bahkan Pushkin, yang kosakatanya paling orisinal, memiliki S = 8, dan ada 7 kata yang disorot.

Hasil penelitian menunjukkan bahwa terdapat lapisan kosa kata tertentu yang memusatkan tema-tema utama puisi. Biasanya, kata-kata ini pendek: dari jumlah total (225) penggunaan kata satu suku kata 88, dua suku kata 127, tiga suku kata 10. Seringkali kata-kata ini mewakili mitologem utama dan dapat berpasangan: malam - siang, bumi - langit (matahari), Tuhan - manusia (manusia), hidup - mati, tubuh - jiwa, Roma - dunia(di Mandelstam); dapat digabungkan menjadi mitologem tingkat yang lebih tinggi: langit, bintang, matahari, bumi; pada seseorang, sebagai aturan, tubuh, jantung, darah, lengan, kaki, pipi, mata menonjol. Dari keadaan manusia, preferensi diberikan pada tidur dan cinta. Rumah dan kota milik dunia manusia - Moskow, Roma, Paris. Kreativitas diwakili oleh leksem kata Dan lagu.

Griboedov dan Lermontov hampir tidak memiliki kata yang menunjukkan alam di antara kata-kata yang paling sering. Mereka memiliki kata tiga kali lebih banyak yang menunjukkan seseorang, bagian tubuhnya, elemen dunia spiritualnya. Pushkin dan penyair abad kedua puluh. sebutan manusia dan alam kira-kira sama. Dalam aspek penting dari subjek ini, kita dapat mengatakan bahwa abad kedua puluh. mengikuti Pushkin.

Minim Tema kasus di antara kata-kata yang paling sering, hanya ditemukan di Griboyedov dan Pushkin. Lermontov dan penyair abad kedua puluh. itu memberi jalan ke tema minimal kata. Kata itu tidak mengecualikan perbuatan (penafsiran alkitabiah tentang topik: dalam Perjanjian Baru, semua ajaran Yesus Kristus dianggap sebagai firman Tuhan atau firman Yesus, dan para rasul terkadang menyebut diri mereka pelayan Firman). Makna sakral kata leksem dimanifestasikan secara meyakinkan, misalnya dalam syair Pasternak "Dan gambaran dunia, terungkap dalam Sabda". Makna sakral dari leksem kata dalam hubungannya dengan dan kontras dengan urusan manusia, hal itu secara meyakinkan dimanifestasikan dalam puisi berjudul sama oleh Gumilyov.

Token yang hanya ditemukan dalam satu teks menjadi ciri orisinalitas buku atau kumpulan buku tertentu. Misalnya, kata "pikiran" adalah yang paling sering muncul dalam komedi Griboedov "Celakalah dari Kecerdasan" - tetapi tidak muncul di antara kata-kata frekuensi dari teks lain. Tema pikiran sejauh ini merupakan yang paling signifikan dalam komedi. Lexeme ini mengiringi citra Chatsky, dan nama Chatsky paling sering muncul dalam komedi. Dengan demikian, karya tersebut secara organik menggabungkan kata benda umum yang paling sering dengan nama diri yang paling sering.

Koefisien korelasi tertinggi menghubungkan tema buku tragis "The Pillar of Fire" oleh Gumilyov dan "Anno Domini MCMXXI" oleh Akhmatova. Di antara 15 kata benda yang paling sering, ada 10 kata umum, termasuk darah, hati, jiwa, cinta, kata, langit. Ingatlah bahwa buku Akhmatova menyertakan miniatur "Kamu tidak akan hidup ...", yang ditulis antara penangkapan Gumilyov dan eksekusinya.

Tema lilin dan keramaian dalam materi yang dipelajari hanya ditemukan di "Puisi Yuri Zhivago". Tema lilin dalam ayat-ayat novel memiliki banyak makna kontekstual: dikaitkan dengan citra Yesus Kristus, dengan tema iman, keabadian, kreativitas, kencan cinta. Lilin adalah sumber cahaya terpenting dalam adegan sentral novel. Tema keramaian berkembang sehubungan dengan gagasan utama novel, di mana kehidupan pribadi seseorang dengan nilai-nilainya yang tak tergoyahkan bertentangan dengan amoralitas negara baru, dibangun di atas prinsip menyenangkan orang banyak. .

Pekerjaan itu juga melibatkan tahap ketiga, juga tercermin dalam program, - ini adalah perhitungan selisih nomor urut kata-kata yang umum untuk dua kamus dan jarak rata-rata antara kata yang sama dari dua kamus. Tahap ini memungkinkan perpindahan dari tren umum dalam interaksi kamus yang diidentifikasi dengan bantuan statistik ke tingkat yang mendekati teks. Misalnya, buku Gumilyov dan Akhmatova berkorelasi secara signifikan secara statistik. Kami melihat kata-kata mana yang ternyata umum untuk kamus mereka, dan, pertama-tama, kami memilih kata-kata yang nomor serinya berbeda minimal atau sama dengan nol. Kata-kata inilah yang memiliki nomor peringkat yang sama dan, oleh karena itu, tema minimal dalam benak kedua penyair inilah yang sama pentingnya. Selanjutnya, Anda harus pindah ke tingkat teks dan konteks.

Metode kuantitatif juga membantu mempelajari karakteristik masyarakat - penutur asli. Katakanlah, ada 6 kasus dalam bahasa Rusia, tidak ada kasus dalam bahasa Inggris, dan dalam beberapa bahasa masyarakat Dagestan, jumlah kasus mencapai 40. L. Perlovsky dalam artikelnya "Kesadaran, Bahasa dan Budaya" menghubungkan ini ciri-ciri dengan kecenderungan masyarakat pada individualisme atau kolektivisme, dengan persepsi benda dan fenomena secara terpisah atau sehubungan dengan orang lain. Lagi pula, di dunia berbahasa Inggris (tidak ada kasus - hal itu dianggap "dengan sendirinya") konsep-konsep seperti kebebasan individu, liberalisme dan demokrasi muncul (saya perhatikan bahwa saya menggunakan konsep-konsep ini hanya sehubungan dengan bahasa, tanpa karakteristik evaluatif). Terlepas dari kenyataan bahwa tebakan semacam itu masih hanya pada tingkat hipotesis ilmiah yang berani, tebakan tersebut membantu untuk melihat fenomena yang sudah dikenal dengan cara baru.

Seperti yang dapat kita lihat, karakteristik kuantitatif dapat diterapkan di bidang linguistik yang sangat berbeda, yang semakin mengaburkan batas antara metode "tepat" dan "kemanusiaan". Linguistik semakin banyak menggunakan bantuan tidak hanya matematika, tetapi juga teknologi komputer untuk memecahkan masalahnya.

2.3 Mempelajari bahasa dengan metode logika formal

Dengan metode matematika non-kuantitatif, khususnya, dengan logika, linguistik teoretis modern berinteraksi tidak kalah bermanfaatnya dengan metode kuantitatif. Pesatnya perkembangan teknologi komputer dan pertumbuhan perannya di dunia modern membutuhkan revisi pendekatan interaksi bahasa dan logika secara umum.

Metode logika banyak digunakan dalam pengembangan bahasa formal, khususnya bahasa pemrograman, yang unsur-unsurnya adalah beberapa simbol (mirip dengan matematika), dipilih (atau dibangun dari simbol yang dipilih sebelumnya) dan ditafsirkan dengan cara tertentu, terkait tanpa penggunaan, pemahaman, dan pemahaman "tradisional" dari simbol yang sama dalam konteks lain. Seorang programmer terus-menerus berurusan dengan logika dalam pekerjaannya. Arti pemrograman hanyalah untuk mengajari komputer untuk bernalar (dalam arti kata yang paling luas). Pada saat yang sama, metode "penalaran" ternyata sangat berbeda. Setiap programmer menghabiskan sejumlah waktu untuk mencari bug di program mereka sendiri dan program orang lain. Artinya, mencari kesalahan dalam penalaran, dalam logika. Dan ini juga meninggalkan bekas. Jauh lebih mudah untuk mendeteksi kesalahan logis dalam ucapan biasa. Kesederhanaan relatif dari bahasa yang dipelajari oleh ahli logika memungkinkan mereka untuk menjelaskan struktur bahasa ini lebih jelas daripada yang dapat dicapai oleh ahli bahasa yang menganalisis bahasa alami yang kompleks secara eksklusif. Mengingat fakta bahwa bahasa yang dipelajari oleh ahli logika menggunakan hubungan yang disalin dari bahasa alami, ahli logika dapat memberikan kontribusi yang signifikan pada teori umum bahasa. Situasi di sini mirip dengan yang terjadi dalam fisika: fisikawan juga merumuskan teorema untuk kasus yang disederhanakan secara ideal yang sama sekali tidak terjadi di alam - ia merumuskan hukum untuk gas ideal, cairan ideal, berbicara tentang gerak tanpa gesekan, dll. Untuk kasus-kasus ideal ini, hukum sederhana dapat ditetapkan yang akan sangat berkontribusi pada pemahaman tentang apa yang terjadi dalam kenyataan dan apa yang mungkin tetap tidak diketahui oleh fisika jika ia mencoba mempertimbangkan realitas secara langsung, dengan segala kerumitannya.

Dalam studi bahasa alami, metode logis digunakan agar pembelajar bahasa tidak bisa dengan bodohnya “menghafal” kata sebanyak mungkin, tetapi lebih memahami strukturnya. L. Shcherba juga menggunakan dalam ceramahnya sebuah contoh kalimat yang dibuat menurut hukum bahasa Rusia: “Kuzdra shteko yang berkilau mem-bok bokra dan menggulung bokra,” dan kemudian bertanya kepada siswa apa artinya ini. Terlepas dari kenyataan bahwa arti kata-kata dalam kalimat tetap tidak jelas (tidak ada dalam bahasa Rusia), adalah mungkin untuk menjawab dengan jelas: "kuzdra" adalah subjek, kata benda feminin, dalam kasus nominatif tunggal, " bokr” dianimasikan, dan lain-lain. Terjemahan frasa tersebut ternyata seperti ini: "Sesuatu yang feminin dalam sekali jalan melakukan sesuatu pada sejenis makhluk jantan, dan kemudian mulai melakukan sesuatu seperti ini untuk waktu yang lama dan bertahap dengan anaknya." Contoh serupa dari teks (artistik) dari kata-kata yang tidak ada, dibangun sepenuhnya sesuai dengan hukum bahasa, adalah Jabberwock karya Lewis Carroll (dalam Alice in Wonderland, Carroll, melalui karakternya Humpty Dumpty, menjelaskan arti kata-kata yang dia ditemukan: "dimasak" - jam delapan malam, saat waktunya memasak makan malam, "chlivky" - tipis dan cekatan, "shorek" - persilangan antara musang, musang dan pembuka botol, "menyelam" - ​​melompat, menyelam, berputar, "nava" - rumput di bawah jam matahari (memanjang sedikit ke kanan , sedikit ke kiri dan sedikit ke belakang), "mendengus" - mendengus dan tertawa, "zelyuk" - kalkun hijau, "myumzik" - seekor burung; bulunya acak-acakan dan menonjol ke segala arah, seperti sapu, "mova" - jauh dari rumah) .

Salah satu konsep utama logika modern dan linguistik teoretis, digunakan dalam studi bahasa dari berbagai kalkulus logis dan matematika, bahasa alami, untuk menggambarkan hubungan antara bahasa dari "tingkat" yang berbeda dan untuk mengkarakterisasi hubungan antara bahasa yang dipertimbangkan dan bidang studi yang dijelaskan dengan bantuan mereka, adalah konsep metabahasa. Metabahasa adalah bahasa yang digunakan untuk mengungkapkan penilaian tentang bahasa lain, bahasa-objek. Dengan bantuan metabahasa, mereka mempelajari struktur kombinasi karakter (ekspresi) bahasa-objek, membuktikan teorema tentang sifat ekspresifnya, tentang hubungannya dengan bahasa lain, dll. Bahasa yang dipelajari juga disebut bahasa subjek di kaitannya dengan metabahasa ini. Baik bahasa subjek maupun metabahasa dapat berupa bahasa biasa (alami). Metabahasa mungkin berbeda dari bahasa objek (misalnya, dalam buku teks bahasa Inggris untuk bahasa Rusia, bahasa Rusia adalah bahasa meta, dan bahasa Inggris adalah bahasa objek), tetapi mungkin juga bertepatan dengannya atau hanya berbeda sebagian, misalnya, dalam terminologi khusus. (Terminologi linguistik Rusia adalah elemen metabahasa untuk mendeskripsikan bahasa Rusia, yang disebut faktor semantik adalah bagian dari metabahasa untuk mendeskripsikan semantik bahasa alami).

Konsep "metalinguage" menjadi sangat bermanfaat sehubungan dengan studi bahasa formal yang dibangun dalam kerangka logika matematika. Tidak seperti bahasa subjek yang diformalkan, dalam hal ini metabahasa, yang dengannya metateori dirumuskan (mempelajari sifat-sifat teori subjek yang dirumuskan dalam bahasa subjek), biasanya adalah bahasa alami biasa, dalam beberapa cara khusus. penggalan bahasa alami yang dibatasi dengan cara khusus, tidak mengandung ambiguitas apa pun. , metafora, konsep "metafisik", dll. elemen bahasa biasa yang mencegah penggunaannya sebagai alat untuk penelitian ilmiah yang akurat. Pada saat yang sama, metabahasa itu sendiri dapat diformalkan dan (terlepas dari ini) menjadi subjek penelitian yang dilakukan melalui bahasa metameta, dan rangkaian semacam itu dapat "dianggap" tumbuh tanpa batas.

Logika mengajarkan kita perbedaan yang bermanfaat antara bahasa-objek dan metabahasa. Objek bahasa adalah subjek penelitian logis, dan metabahasa adalah bahasa buatan yang tak terelakkan di mana penelitian semacam itu dilakukan. Pemikiran logis hanya terdiri dari merumuskan hubungan dan struktur bahasa nyata (bahasa objek) dalam bahasa simbol (metalanguage).

Bagaimanapun, metabahasa harus "tidak lebih buruk" dari bahasa objektifnya (yaitu, untuk setiap ekspresi yang terakhir dalam metabahasa harus ada namanya, "terjemahan") - jika tidak, jika persyaratan ini tidak terpenuhi (yang tentunya membutuhkan tempatkan dalam bahasa alami, jika kesepakatan khusus tidak memberikan sebaliknya) paradoks semantik (antinomi) muncul.

Karena semakin banyak bahasa pemrograman baru yang dibuat, sehubungan dengan masalah penerjemah pemrograman, ada kebutuhan mendesak untuk membuat bahasa meta. Saat ini, metalanguage bentuk Backus-Naur (disingkat BNF) adalah yang paling umum digunakan untuk mendeskripsikan sintaks bahasa pemrograman. Ini adalah bentuk kompak dalam bentuk beberapa rumus yang mirip dengan rumus matematika. Untuk setiap konsep bahasa ada metaformula (formula normal) yang unik. Terdiri dari bagian kiri dan kanan. Sisi kiri menentukan konsep yang didefinisikan, dan sisi kanan menentukan kumpulan konstruksi bahasa yang dapat diterima yang digabungkan ke dalam konsep ini. Rumus menggunakan metakarakter khusus dalam bentuk kurung sudut, yang berisi konsep yang didefinisikan (di sisi kiri rumus) atau konsep yang telah ditentukan sebelumnya (di sisi kanannya), dan pemisahan bagian kiri dan kanan ditunjukkan dengan metakarakter "::=", yang artinya setara dengan kata "menurut definisi ada". Rumus metalinguistik disematkan pada penerjemah dalam beberapa bentuk; dengan bantuan mereka, konstruksi yang digunakan oleh pemrogram diperiksa untuk kesesuaian formal dengan salah satu konstruksi yang secara sintaksis valid dalam bahasa ini. Ada juga metabahasa terpisah dari berbagai ilmu - jadi, pengetahuan ada dalam bentuk berbagai metabahasa.

Metode logis juga menjadi dasar pembuatan sistem kecerdasan buatan berdasarkan konsep koneksionisme. Connectionism adalah tren khusus dalam ilmu filsafat, yang subjeknya adalah pertanyaan tentang pengetahuan. Dalam kerangka tren ini, upaya dilakukan untuk menjelaskan kemampuan intelektual seseorang yang menggunakan jaringan saraf tiruan. Terdiri dari sejumlah besar unit struktural yang mirip dengan neuron, dengan bobot yang ditetapkan untuk setiap elemen yang menentukan kekuatan koneksi dengan elemen lain, jaringan saraf adalah model otak manusia yang disederhanakan. Eksperimen dengan jaringan saraf semacam ini telah menunjukkan kemampuan mereka untuk belajar melakukan tugas-tugas seperti pengenalan pola, membaca, dan mengidentifikasi struktur tata bahasa sederhana.

Filsuf mulai menaruh minat pada koneksionisme, karena pendekatan koneksionis berjanji untuk memberikan alternatif terhadap teori pikiran klasik dan gagasan yang dipegang secara luas dalam teori ini bahwa cara kerja pikiran serupa dengan pemrosesan bahasa simbolik oleh digital. komputer. Konsep ini sangat kontroversial, tetapi dalam beberapa tahun terakhir semakin banyak pendukungnya.

Kajian logis bahasa melanjutkan konsep Saussure tentang bahasa sebagai suatu sistem. Fakta bahwa itu terus-menerus menegaskan sekali lagi keberanian dugaan ilmiah awal abad terakhir. Saya akan mengabdikan bagian terakhir dari pekerjaan saya untuk prospek pengembangan metode matematika dalam linguistik saat ini.

2.4 Prospek penerapan metode matematika dalam linguistik

Di era teknologi komputer, metode linguistik matematika telah mendapat perspektif perkembangan baru. Pencarian solusi atas permasalahan analisis linguistik kini semakin banyak diimplementasikan pada tataran sistem informasi. Pada saat yang sama, otomatisasi proses pemrosesan materi linguistik, yang memberikan peluang dan keuntungan yang signifikan bagi peneliti, pasti mengedepankan persyaratan dan tugas baru untuknya.

Kombinasi pengetahuan "tepat" dan "kemanusiaan" telah menjadi lahan subur bagi penemuan-penemuan baru di bidang linguistik, ilmu komputer, dan filsafat.

Terjemahan mesin dari satu bahasa ke bahasa lain tetap menjadi cabang teknologi informasi yang berkembang pesat. Terlepas dari kenyataan bahwa terjemahan dengan bantuan komputer tidak pernah dapat dibandingkan kualitasnya dengan terjemahan manusia (terutama untuk teks sastra), mesin telah menjadi asisten yang sangat diperlukan bagi seseorang dalam menerjemahkan teks dalam jumlah besar. Dipercayai bahwa dalam waktu dekat sistem terjemahan yang lebih maju akan dibuat, terutama berdasarkan analisis semantik teks.

Area yang sama-sama menjanjikan adalah interaksi linguistik dan logika, yang berfungsi sebagai landasan filosofis untuk memahami teknologi informasi dan apa yang disebut "realitas virtual". Dalam waktu dekat, pekerjaan akan dilanjutkan pada pembuatan sistem kecerdasan buatan - meskipun, sekali lagi, itu tidak akan pernah setara dengan manusia dalam kemampuannya. Persaingan seperti itu tidak ada artinya: di zaman kita, mesin seharusnya menjadi (dan menjadi) bukan saingan, tetapi asisten manusia, bukan sesuatu dari dunia fantasi, tetapi bagian dari dunia nyata.

Studi bahasa dengan metode statistik berlanjut, yang memungkinkan untuk menentukan sifat kualitatifnya dengan lebih akurat. Penting bahwa hipotesis yang paling berani tentang bahasa menemukan bukti matematis, dan karenanya logis.

Hal yang paling signifikan adalah bahwa berbagai cabang penerapan matematika dalam linguistik, yang sebelumnya cukup terisolasi, dalam beberapa tahun terakhir telah berkorelasi satu sama lain, terhubung ke dalam sistem yang koheren, dengan analogi dengan sistem bahasa yang ditemukan seabad yang lalu oleh Ferdinand de Saussure. dan Yvan Baudouin de Courtenay. Inilah kesinambungan pengetahuan ilmiah.

Linguistik di dunia modern telah menjadi landasan bagi perkembangan teknologi informasi. Selama ilmu komputer tetap menjadi cabang aktivitas manusia yang berkembang pesat, penyatuan matematika dan linguistik akan terus memainkan perannya dalam perkembangan sains.

Kesimpulan

Selama abad ke-20, teknologi komputer telah berkembang jauh - dari penggunaan militer hingga penggunaan damai, dari jangkauan tujuan yang sempit hingga penetrasi ke semua cabang kehidupan manusia. Matematika sebagai ilmu menemukan signifikansi praktis baru dengan perkembangan teknologi komputer. Proses ini berlanjut hari ini.

"Tandem" "fisikawan" dan "penulis lirik" yang sebelumnya tidak terpikirkan telah menjadi kenyataan. Untuk interaksi penuh matematika dan ilmu komputer dengan humaniora, diperlukan spesialis yang berkualifikasi dari kedua sisi. Sementara ilmuwan komputer semakin membutuhkan pengetahuan kemanusiaan yang sistematis (linguistik, budaya, filosofis) untuk memahami perubahan realitas di sekitarnya, dalam interaksi manusia dan teknologi, untuk mengembangkan konsep linguistik dan mental yang semakin baru, untuk menulis program, maka setiap "Humaniora" di zaman kita untuk pertumbuhan profesionalnya harus menguasai setidaknya dasar-dasar bekerja dengan komputer.

Matematika, yang saling terkait erat dengan informatika, terus berkembang dan berinteraksi dengan ilmu alam dan humaniora. Di abad baru, kecenderungan matematisasi sains tidak melemah, tetapi justru meningkat. Berdasarkan data kuantitatif, hukum perkembangan bahasa, karakteristik historis dan filosofisnya dipahami.

Formalisme matematika paling cocok untuk mendeskripsikan pola dalam linguistik (seperti, memang, dalam ilmu lain - baik humaniora maupun alam). Situasi terkadang berkembang dalam sains sedemikian rupa sehingga tanpa menggunakan bahasa matematika yang tepat, tidak mungkin untuk memahami sifat fisika, kimia, dll. proses tidak mungkin. Menciptakan model atom planet, fisikawan Inggris terkenal abad XX. E. Rutherford mengalami kesulitan matematika. Pada awalnya, teorinya tidak diterima: kedengarannya tidak meyakinkan, dan alasannya adalah ketidaktahuan Rutherford tentang teori probabilitas, berdasarkan mekanisme yang hanya memungkinkan untuk memahami representasi model interaksi atom. Menyadari hal ini, pada saat itu seorang ilmuwan terkemuka, pemilik Hadiah Nobel, mendaftar di seminar ahli matematika Profesor Lamb dan selama dua tahun, bersama dengan para siswa, mengikuti kursus dan mengadakan lokakarya tentang teori probabilitas. . Berdasarkan itu, Rutherford mampu mendeskripsikan perilaku elektron, memberikan model strukturalnya dengan akurasi yang meyakinkan dan mendapatkan pengakuan. Begitu pula dengan linguistik.

Ini menimbulkan pertanyaan, apa yang begitu matematis dalam fenomena objektif, berkat itu mereka dapat dijelaskan dalam bahasa matematika, dalam bahasa karakteristik kuantitatif? Ini adalah unit materi homogen yang didistribusikan dalam ruang dan waktu. Ilmu-ilmu yang telah melangkah lebih jauh dari yang lain menuju isolasi homogenitas, dan ternyata lebih cocok untuk penggunaan matematika di dalamnya.

Internet, yang berkembang pesat pada 1990-an, menyatukan perwakilan dari berbagai negara, masyarakat, dan budaya. Terlepas dari kenyataan bahwa bahasa Inggris terus menjadi bahasa utama komunikasi internasional, Internet telah menjadi multibahasa di zaman kita. Hal ini menyebabkan pengembangan sistem terjemahan mesin yang sukses secara komersial yang banyak digunakan di berbagai bidang aktivitas manusia.

Jaringan komputer telah menjadi objek refleksi filosofis - semakin banyak konsep linguistik, logis, pandangan dunia baru telah dibuat yang membantu untuk memahami "realitas virtual". Dalam banyak karya seni, skenario dibuat - lebih sering pesimistis - tentang dominasi mesin atas seseorang, dan realitas virtual - atas dunia luar. Jauh dari biasanya ramalan seperti itu ternyata tidak ada artinya. Teknologi informasi bukan hanya industri yang menjanjikan untuk menginvestasikan pengetahuan manusia, tetapi juga merupakan cara untuk mengontrol informasi, dan akibatnya, atas pemikiran manusia.

Fenomena ini memiliki sisi negatif dan positif. Negatif - karena kendali atas informasi bertentangan dengan hak asasi manusia yang tidak dapat dicabut untuk akses bebas ke sana. Positif - karena kurangnya kontrol ini dapat menyebabkan konsekuensi bencana bagi umat manusia. Cukuplah untuk mengingat salah satu film paling bijak dalam dekade terakhir - "When the World Ends" oleh Wim Wenders, yang karakternya benar-benar tenggelam dalam "realitas virtual" dari mimpi mereka sendiri yang direkam di komputer. Namun, tidak ada satu pun ilmuwan atau seniman yang dapat memberikan jawaban tegas atas pertanyaan: apa yang menanti sains dan teknologi di masa depan.

Berfokus pada "masa depan", terkadang tampak fantastis, adalah ciri khas sains di pertengahan abad ke-20, ketika para penemu berusaha menciptakan model teknologi yang sempurna yang dapat bekerja tanpa campur tangan manusia. Waktu telah menunjukkan sifat utopis dari penelitian semacam itu. Namun, akan berlebihan untuk mengutuk para ilmuwan untuk ini - tanpa antusiasme mereka di tahun 1950-an - 60-an, teknologi informasi tidak akan membuat lompatan yang begitu kuat di tahun 90-an, dan kita tidak akan memiliki apa yang kita miliki sekarang.

Dekade terakhir abad ke-20 mengubah prioritas sains - penelitian, kesedihan inventif digantikan oleh kepentingan komersial. Sekali lagi, ini tidak baik atau buruk. Ini adalah realitas di mana sains semakin terintegrasi ke dalam kehidupan sehari-hari.

Abad ke-21 melanjutkan tren ini, dan di zaman kita di belakang penemuan tidak hanya ketenaran dan pengakuan, tetapi, pertama-tama, uang. Ini juga mengapa penting untuk memastikan bahwa pencapaian terbaru ilmu pengetahuan dan teknologi tidak jatuh ke tangan kelompok teroris atau rezim diktator. Tugas itu sulit sampai pada titik ketidakmungkinan; mewujudkannya semaksimal mungkin adalah tugas seluruh masyarakat dunia.

Informasi adalah senjata, dan senjata tidak kalah berbahayanya dengan senjata nuklir atau kimia - hanya saja tidak bekerja secara fisik, melainkan secara psikologis. Umat ​​\u200b\u200bmanusia perlu memikirkan apa yang lebih penting baginya dalam hal ini - kebebasan atau kendali.

Konsep filosofis terbaru yang berkaitan dengan perkembangan teknologi informasi dan upaya untuk memahaminya telah menunjukkan keterbatasan materialisme ilmu alam, yang mendominasi selama abad ke-19 dan awal abad ke-20, dan idealisme ekstrem, yang menyangkal pentingnya dunia material. . Penting bagi pemikiran modern, terutama pemikiran Barat, untuk mengatasi dualisme pemikiran ini, ketika dunia sekitarnya jelas terbagi menjadi material dan ideal. Jalan menuju ini adalah dialog budaya, perbandingan berbagai sudut pandang tentang fenomena di sekitarnya.

Paradoksnya, teknologi informasi dapat memainkan peran penting dalam proses ini. Jaringan komputer, dan terutama Internet, tidak hanya menjadi sumber hiburan dan aktivitas komersial yang kuat, tetapi juga merupakan sarana komunikasi yang bermakna dan kontroversial antara perwakilan dari berbagai peradaban di dunia modern, serta untuk dialog antara masa lalu dan masa lalu. saat ini. Kita dapat mengatakan bahwa Internet mendorong batas spasial dan temporal.

Dan dalam dialog budaya melalui teknologi informasi, peran bahasa sebagai alat komunikasi universal tertua masih penting. Itulah sebabnya linguistik, dalam interaksinya dengan matematika, filsafat, dan ilmu komputer, mengalami kelahiran keduanya dan terus berkembang hingga saat ini. Tren saat ini akan berlanjut di masa depan - "hingga akhir dunia", seperti yang diprediksi oleh V. Wenders 15 tahun lalu. Benar, tidak diketahui kapan akhir ini akan terjadi - tetapi apakah itu penting sekarang, karena bagaimanapun juga masa depan cepat atau lambat akan menjadi saat ini.

Lampiran 1

Ferdinan de Saussure

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) secara luas dianggap sebagai pendiri linguistik modern dalam upayanya untuk mendeskripsikan struktur bahasa daripada sejarah bahasa dan bentuk bahasa tertentu. Faktanya, metode Strukturalisme dalam studi linguistik dan sastra dan cabang penting Semiotika menemukan titik awal utama mereka dalam karyanya pada pergantian abad ke-20. Bahkan dikatakan bahwa kompleks strategi dan konsepsi yang kemudian disebut "poststrukturalisme" - karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, dan lainnya - disarankan oleh karya Saussure dalam pembacaan linguistik dan anagrammatik puisi Latin akhir, modernisme sastra hingga psikoanalisis dan filsafat pada awal abad ke-20. Seperti yang diperdebatkan oleh Algirdas Julien Greimas dan Joseph Courtés dalam Semiotics and Language: An Analytic Dictionary, di bawah judul "Interpretation", sebuah mode interpretasi baru muncul pada awal abad ke-20 yang mereka identifikasikan dengan linguistik Saussurean, Fenomenologi Husserlian, dan psikoanalisis Freudian. Dalam mode ini, “penafsiran tidak lagi merupakan masalah mengaitkan konten tertentu dengan suatu bentuk yang jika tidak ada akan kekurangan satu; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang setara dari elemen penanda dalam sistem semiotik tertentu” ( 159). dalam pemahaman "penafsiran" ini, bentuk dan isi tidak berbeda; sebaliknya, setiap "bentuk", sebagai alternatif, adalah "isi" semantik juga, "bentuk penanda", sehingga interpretasi menawarkan parafrase analogis dari sesuatu yang sudah menandakan dalam beberapa sistem penandaan lainnya.

Penafsiran ulang bentuk dan pemahaman seperti itu - yang dijelaskan Claude Lévi-Strauss dalam salah satu artikulasinya yang paling terprogram tentang konsep strukturalisme, dalam "Struktur dan Bentuk: Refleksi pada Karya oleh Vladimir Propp" - tersirat dalam Kursus anumerta Saussure dalam General Linguistics (1916, trans., 1959, 1983). Di masa hidupnya, Saussure menerbitkan relatif sedikit, dan karya utamanya, Kursus, adalah transkripsi oleh murid-muridnya dari beberapa kursus linguistik umum yang dia tawarkan pada tahun 1907-11. Dalam Kursus Saussure menyerukan studi bahasa "ilmiah" sebagai lawan dari karya linguistik historis yang telah dilakukan pada abad ke-19. Karya itu adalah salah satu pencapaian besar kecerdasan Barat: menggunakan kata-kata tertentu sebagai blok bangunan dari bahasa, sejarah (atau "diakronis") linguistik menelusuri asal dan perkembangan bahasa Barat dari sumber bahasa umum diduga, pertama bahasa "Indo-Eropa" dan kemudian "p" sebelumnya. bahasa roto-Indo-Eropa".

Tepatnya studi tentang kemunculan kata-kata yang unik ini, dengan asumsi bersamaan bahwa "unit" dasar bahasa, pada kenyataannya, adalah keberadaan positif dari "elemen-elemen kata" ini, yang dipertanyakan oleh Saussure. Karyanya merupakan upaya untuk mereduksi banyak fakta tentang bahasa, yang dipelajari dengan cermat oleh linguistik historis, menjadi sejumlah proposisi yang dapat dikelola. "Mazhab komparatif" Filologi abad ke-19, kata Saussure dalam Kursus, "tidak berhasil membangun ilmu linguistik yang sebenarnya" karena "gagal mencari sifat objek studinya" (3). "Sifat" itu, menurutnya, dapat ditemukan tidak hanya dalam kata-kata "elemental" yang terdiri dari suatu bahasa - fakta (atau "substansi") bahasa yang tampak "positif" - tetapi dalam hubungan formal yang memunculkannya. "zat."

Pemeriksaan ulang sistematis bahasa Saussure didasarkan pada tiga asumsi. Yang pertama adalah bahwa studi ilmiah bahasa perlu mengembangkan dan mempelajari sistem daripada sejarah fenomena linguistik. Untuk alasan ini, dia membedakan antara kejadian bahasa tertentu - khususnya "peristiwa-bicara", yang ia tunjuk sebagai parole - dan objek linguistik yang tepat, sistem (atau "kode") yang mengatur peristiwa-peristiwa itu, yang ia tunjuk sebagai langue. Studi sistematis semacam itu, terlebih lagi, membutuhkan "sinkronis" konsepsi hubungan antara unsur-unsur bahasa pada saat tertentu daripada studi "diakronis" perkembangan bahasa melalui sejarah.

Asumsi ini memunculkan apa yang Roman Jakobson pada tahun 1929 datang untuk menunjuk sebagai "strukturalisme," di mana "setiap rangkaian fenomena yang diperiksa oleh sains kontemporer diperlakukan bukan sebagai aglomerasi mekanis tetapi sebagai keseluruhan struktural konsepsi proses mekanis menghasilkan pertanyaan. dari fungsinya" ("Romantis" 711). Dalam bagian ini Jakobson mengartikulasikan niat Saussure untuk mendefinisikan linguistik sebagai sistem ilmiah sebagai lawan dari akuntansi "mekanis" sederhana dari kecelakaan sejarah. Selain itu, Jakobson juga menjelaskan asumsi dasar kedua dalam Saussurean - kita dapat sekarang menyebutnya "struktural" - linguistik: bahwa unsur-unsur dasar bahasa hanya dapat dipelajari dalam kaitannya dengan fungsi mereka daripada dalam kaitannya dengan penyebabnya. "Kata-kata" Eropa, peristiwa dan entitas itu harus ditempatkan dalam kerangka sistemik di mana mereka terkait dengan apa yang disebut peristiwa dan entitas lain.Ini adalah reorientasi radikal dalam memahami pengalaman dan fenomena, yang kepentingannya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu baru Galileo yang pada abad ketujuh belas mengubah seluruh kita. konsep dunia fisik" (dikutip dalam Culler, Pursuit 2 4). Perubahan ini, seperti dicatat oleh Greimas dan Courtés, membentuk kembali "interpretasi" dan dengan demikian membentuk kembali penjelasan dan pemahaman itu sendiri. Alih-alih penjelasan "berada dalam kerangka sebab-sebab suatu fenomena, sehingga, sebagai suatu "akibat", ia dalam beberapa hal berada di bawah sebab-sebabnya, penjelasan di sini terdiri dari mensubordinasikan suatu fenomena ke "fungsi" berorientasi masa depan atau "tujuan." Penjelasan tidak lagi terlepas dari niat atau tujuan manusia (walaupun niat itu bisa bersifat impersonal, komunal, atau, dalam istilah Freudian, "tidak sadar").

Dalam linguistiknya, Saussure menyelesaikan transformasi ini secara khusus dalam redefinisi "kata" linguistik, yang ia gambarkan sebagai "tanda" linguistik dan didefinisikan dalam istilah fungsionalis. Tanda, menurutnya, adalah penyatuan "sebuah konsep dan citra suara," yang disebutnya "petanda dan penanda" (66-67; terjemahan Roy Harris tahun 1983 menawarkan istilah "penandaan" dan "sinyal"). Sifat dari "kombinasi" mereka adalah "fungsional" karena baik petanda maupun penanda bukanlah "penyebab" dari yang lain; melainkan, "masing-masing nilainya dari yang lain" (8). , secara relasional dan membuat asumsi dasar linguistik historis, yaitu, identitas unit unsur bahasa dan penandaan (yaitu, "kata"), tunduk pada analisis yang ketat. kata "pohon" sebagai kata "sama" bukan karena kata itu didefinisikan oleh kualitas-kualitas yang melekat - itu bukan "penggumpalan mekanis" dari kualitas-kualitas semacam itu - tetapi karena itu didefinisikan sebagai elemen dalam suatu sistem, "keseluruhan struktural" dari bahasa.

Definisi entitas relasional (atau "diakritik") seperti itu mengatur konsepsi semua elemen bahasa dalam linguistik struktural. Ini paling jelas dalam pencapaian linguistik Saussurean yang paling mengesankan, pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah unit terkecil yang diartikulasikan dan menandakan bahasa. Itu bukanlah bunyi-bunyi yang muncul dalam bahasa, melainkan "citra-citra bunyi" yang disebutkan Saussure, yang ditangkap oleh penutur - ditangkap secara fenomenal - sebagai penyampaian makna. (Dengan demikian, Elmar Holenstein menggambarkan linguistik Jakobson, yang mengikuti Saussure dengan cara yang penting, sebagai "strukturalisme fenomenologis.") Karena alasan inilah juru bicara terkemuka untuk Strukturalisme Sekolah Praha, Jan Mukarovsky, mencatat pada tahun 1937 bahwa "struktur . . . adalah fenomenologis dan bukan realitas empiris; itu bukan kerja itu sendiri, tetapi seperangkat hubungan fungsional yang terletak dalam kesadaran kolektif (generasi, lingkungan, dll.)" (dikutip dalam Galan 35). Demikian pula, Lévi-Strauss, juru bicara terkemuka untuk strukturalisme Prancis , mencatat pada tahun 1960 bahwa "struktur tidak memiliki konten yang berbeda; itu adalah konten itu sendiri, dan organisasi logis di mana ia ditangkap dipahami sebagai properti yang nyata" (167; lihat juga Jakobson, Fundamentals 27-28).

Dengan demikian, fonem, elemen bahasa yang paling kecil dan dapat dicerap, bukanlah objek positif, melainkan sebuah "realitas fenomenologis". Dalam bahasa Inggris, misalnya, fonem /t/ dapat dilafalkan dengan berbagai cara, tetapi dalam semua kasus penutur bahasa Inggris akan mengenalinya berfungsi sebagai a /t/. Suara t yang disedot (yaitu, t diucapkan dengan nafas seperti huruf h setelahnya), suara t bernada tinggi atau rendah, suara t yang diperpanjang, dan seterusnya, semuanya akan berfungsi dengan cara yang sama dalam membedakan arti dari "to" dan "do" dalam bahasa Inggris. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi fonologis dalam satu bahasa dapat menjadi fonem yang berbeda di bahasa lain; dengan demikian, bahasa Inggris membedakan antara /l/ dan /r/, sedangkan bahasa lain sangat terstruktur sehingga artikulasi ini dianggap sebagai variasi dari fonem yang sama (seperti t yang diaspirasi dan tidak diaspirasi dalam bahasa Inggris). Dalam setiap bahasa alami, sejumlah besar kemungkinan kata merupakan kombinasi dari sejumlah kecil fonem. Bahasa Inggris, misalnya, memiliki kurang dari 40 fonem yang bergabung membentuk lebih dari satu juta kata yang berbeda.

Fonem bahasa itu sendiri merupakan struktur fitur yang terorganisir secara sistematis. Pada tahun 1920-an dan 1930-an, mengikuti petunjuk Saussure, Jakobson dan N. S. Trubetzkoy mengisolasi "ciri-ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur fisiologis alat bicara - lidah, gigi, pita suara, dan sebagainya - yang Saussure menyebutkan dalam Kursus dan yang digambarkan Harris sebagai "fonetik fisiologis" (39; terjemahan awal Baskin menggunakan istilah "fonologi" [(1959) 38]) - dan mereka bergabung dalam "kumpulan" oposisi biner untuk membentuk fonem. Misalnya, dalam bahasa Inggris perbedaan antara /t/ dan /d/ adalah ada atau tidak adanya "suara" (keterikatan pita suara), dan pada tingkat menyuarakan fonem-fonem ini secara timbal balik menentukan satu sama lain. Dengan cara ini, fonologi adalah contoh spesifik dari aturan umum bahasa yang dijelaskan oleh Saussure: Dalam bahasa hanya ada perbedaan. bahkan lebih penting lagi: suatu perbedaan umumnya mengimplikasikan istilah-istilah positif di mana perbedaan itu dibuat; tetapi dalam bahasa hanya ada perbedaan tanpa istilah positif. Apakah kita mengambil petanda atau penanda, bahasa tidak memiliki gagasan atau bunyi yang ada sebelum sistem linguistik. ( 120)

Dalam kerangka ini, identitas linguistik ditentukan bukan oleh kualitas yang melekat tetapi oleh hubungan sistemik ("struktural").

Saya telah mengatakan bahwa fonologi "mengikuti jejak" Saussure, karena meskipun analisisnya tentang fisiologi produksi bahasa "saat ini," seperti kata Harris, "disebut" fisik ", bukan "psikologis" atau "fungsional". "" (Bacaan 49), akibatnya dalam Kursus ia mengartikulasikan arah dan garis besar analisis fungsional bahasa. Demikian pula, satu-satunya karya terbitannya yang diperluas, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir tentang sistem vokal primitif dalam bahasa Indo-Eropa), yang muncul pada tahun 1878, sepenuhnya berada dalam proyek abad ke-19. linguistik sejarah abad. Namun demikian, dalam karya ini, seperti yang dikatakan Jonathan Culler, Saussure menunjukkan "kesuburan pemikiran bahasa sebagai sistem item relasional murni, bahkan ketika mengerjakan tugas rekonstruksi sejarah" (Saussure 66). Dengan menganalisis hubungan struktural sistematis di antara fonem untuk memperhitungkan pola pergantian vokal dalam bahasa Indo-Eropa yang ada, Saussure menyarankan bahwa selain beberapa fonem berbeda /a/, pasti ada fonem lain yang dapat dijelaskan secara formal. "Apa yang membuat karya Saussure begitu mengesankan," Culler menyimpulkan, "adalah kenyataan bahwa hampir lima puluh tahun kemudian, ketika paku Het ditemukan dan diuraikan, ditemukan mengandung fonem, ditulis h, yang berperilaku seperti prediksi Saussure. . Dia telah menemukan, dengan analisis murni formal, apa yang sekarang dikenal sebagai laring Indo-Eropa" (66).

Konsepsi penentuan relasional atau diakritik dari unsur-unsur penandaan, yang tersirat dan eksplisit dalam Kursus, menunjukkan asumsi ketiga yang mengatur linguistik struktural, yang disebut Saussure sebagai "sifat tanda yang sewenang-wenang". Dengan ini dia bermaksud bahwa hubungan antara penanda dan petanda dalam bahasa tidak pernah diperlukan (atau "termotivasi"): seseorang dapat dengan mudah menemukan penanda suara arbre sebagai pohon penanda untuk bersatu dengan konsep "pohon". Tetapi lebih dari itu, ini berarti bahwa yang ditandakan juga arbitrer: seseorang dapat dengan mudah mendefinisikan konsep "pohon" berdasarkan kualitas kayunya (yang akan mengecualikan pohon palem) maupun ukurannya (yang mengecualikan "tanaman berkayu rendah" yang kita semak panggilan). Ini harus memperjelas bahwa penomoran asumsi yang telah saya sajikan tidak mewakili urutan prioritas: setiap asumsi - sifat sistemik dari penandaan (paling baik dipahami dengan mempelajari bahasa "secara sinkron"), sifat relasional atau "diakritik" dari unsur-unsur tersebut penandaan, sifat tanda yang sewenang-wenang - mendapatkan nilainya dari yang lain.

Artinya, linguistik Saussurean fenomena yang dipelajarinya dalam hubungan kombinasi dan kontras yang menyeluruh dalam bahasa. Dalam konsepsi ini, bahasa adalah proses mengartikulasikan makna (penandaan) dan produknya (komunikasi), dan kedua fungsi bahasa ini tidak identik atau sepenuhnya kongruen (lihat Schleifer, "Dekonstruksi"). Di sini, kita dapat melihat pergantian antara bentuk dan isi yang dijelaskan oleh Greimas dan Courtés dalam interpretasi modernis: bahasa menghadirkan kontras yang secara formal mendefinisikan unit-unitnya, dan unit-unit ini bergabung pada tingkat-tingkat berikutnya untuk menciptakan konten yang menandakan. Karena unsur-unsur bahasa bersifat arbitrer, maka baik kontras maupun kombinasi tidak dapat dikatakan mendasar. Dengan demikian, dalam bahasa gabungan ciri-ciri khas membentuk fonem kontras pada tingkat pemahaman yang lain, fonem bergabung membentuk morfem kontras, morfem bergabung membentuk kata, kata bergabung membentuk kalimat, dan seterusnya. Dalam setiap contoh, seluruh fonem, atau kata, atau kalimat, dan seterusnya, lebih besar dari jumlah bagian-bagiannya (seperti air, H2O, dalam contoh Saussure [(1959) 103] lebih dari aglomerasi mekanik). hidrogen dan oksigen).

Tiga asumsi Kursus Linguistik Umum membuat Saussure menyerukan ilmu baru abad kedua puluh yang akan melampaui ilmu linguistik untuk mempelajari "kehidupan tanda-tanda dalam masyarakat." Saussure menamai ilmu ini "semiologi (dari bahasa Yunani semeîon "tanda")" (16). "Ilmu" semiotika, seperti yang dipraktikkan di Eropa Timur pada 1920-an dan 1930-an dan Paris pada 1950-an dan 1960-an, memperluas studi struktur bahasa dan linguistik ke artefak sastra yang dibentuk (atau diartikulasikan) oleh struktur tersebut. Selain itu, sepanjang bagian akhir karirnya, bahkan ketika dia menawarkan kursus linguistik umum, Saussure mengejar analisis "semiotik" miliknya sendiri tentang puisi Latin akhir dalam upaya untuk menemukan anagram nama diri yang sengaja disembunyikan. Metode penelitiannya dalam banyak hal berlawanan dengan rasionalisme fungsional dari analisis linguistiknya: ia berusaha, seperti yang disebutkan Saussure dalam salah satu dari 99 buku catatan tempat ia melakukan penelitian ini, untuk memeriksa secara sistematis masalah "kebetulan", yang " menjadi fondasi yang tak terhindarkan dari segalanya" (dikutip dalam Starobinski 101). Studi semacam itu, seperti yang dikatakan Saussure sendiri, berfokus pada "fakta material" tentang kebetulan dan makna (dikutip 101), sehingga "kata-tema" yang anagramnya dicari Saussure, seperti yang dikatakan Jean Starobinski, "adalah, untuk penyair. , instrumen, dan bukan kuman vital puisi. Puisi itu diharuskan menggunakan kembali bahan fonik dari kata-tema" (45). Dalam analisis ini, Starobinski mengatakan, "Saussure tidak tersesat dalam pencarian makna tersembunyi." Sebaliknya, karyanya tampaknya menunjukkan keinginan untuk menghindari semua masalah yang timbul dari kesadaran: "Karena puisi tidak hanya diwujudkan dalam kata-kata tetapi merupakan sesuatu yang lahir dari kata-kata, ia lolos dari kendali kesadaran yang sewenang-wenang untuk bergantung hanya pada semacam legalitas linguistik. "(121).

Yaitu, upaya Saussure untuk menemukan nama yang tepat dalam puisi Latin akhir - apa yang disebut Tzvetan Todorov sebagai reduksi dari "kata . . . ke penandanya" (266) - menekankan salah satu elemen yang mengatur analisis linguistiknya, sifat tanda yang sewenang-wenang. (Ini juga menekankan sifat formal linguistik Saussurean - "Bahasa," tegasnya, "adalah bentuk dan bukan suatu substansi" - yang menghilangkan semantik secara efektif sebagai objek utama analisis.) Seperti yang disimpulkan Todorov, karya Saussure saat ini tampak sangat homogen dalam penolakannya untuk menerima fenomena simbolik. . . . Dalam penelitiannya tentang anagram, dia hanya memperhatikan fenomena pengulangan, bukan fenomena pembangkitan. . . . Dalam studinya tentang Nibelungen, dia mengenali simbol hanya untuk mengaitkannya dengan pembacaan yang salah: karena tidak disengaja, simbol tidak ada. Akhirnya dalam kursusnya tentang linguistik umum, dia merenungkan keberadaan semiologi, dan dengan demikian tanda-tanda selain yang linguistik; tetapi penegasan ini sekaligus dibatasi oleh fakta semiologi dikhususkan untuk satu jenis tanda: yang arbitrer. (269-70)

Jika ini benar, itu karena Saussure tidak dapat memahami "niat" tanpa subjek; dia tidak bisa lepas dari pertentangan antara bentuk dan konten yang karyanya banyak dipertanyakan. Sebaliknya, dia menggunakan "legalitas linguistik". Terletak di antara, di satu sisi, konsepsi sejarah abad ke-19, subjektivitas, dan cara interpretasi kausal yang diatur oleh konsepsi-konsepsi ini dan, di sisi lain, konsepsi "strukturalis" abad ke-20 tentang apa yang oleh Lévi-Strauss disebut "Kantianisme tanpa subjek transendental" (dikutip dalam Connerton 23) - konsep yang menghapus pertentangan antara bentuk dan isi (atau subjek dan objek) dan hierarki latar depan dan latar belakang dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum sepenuhnya - karya Ferdinand de Saussure dalam linguistik dan semiotika membatasi momen sinyal dalam studi tentang makna dan budaya.

Ronald Schleifer

Lampiran 2

Ferdinand de Saussure (terjemahan)

Ahli bahasa Swiss Ferdinand de Saussure (1857-1913) dianggap sebagai pendiri linguistik modern - berkat usahanya untuk mendeskripsikan struktur bahasa, daripada sejarah bahasa individu dan bentuk kata. Pada umumnya, fondasi metode struktural dalam linguistik dan kritik sastra dan, sebagian besar, semiotika diletakkan dalam karya-karyanya pada awal abad ke-20. Terbukti bahwa metode dan konsep yang disebut "post-strukturalisme", yang dikembangkan dalam karya Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes dan lainnya, kembali ke karya linguistik Saussure dan pembacaan anagramtik puisi Romawi akhir. Perlu dicatat bahwa karya Saussure tentang linguistik dan interpretasi linguistik membantu menghubungkan berbagai disiplin intelektual - dari fisika hingga inovasi sastra, psikoanalisis, dan filsafat awal abad ke-20. A. J. Greimas dan J. Kurte menulis dalam Semiotika dan Bahasa: “Kamus analitis dengan judul “Interpretasi” sebagai jenis interpretasi baru muncul pada awal abad ke-20 bersama dengan linguistik Saussure, fenomenologi Husserl dan psikoanalisis dari Freud. Dalam kasus seperti itu, "penafsiran bukanlah atribusi konten tertentu ke bentuk yang tidak memilikinya; melainkan, itu adalah parafrase yang merumuskan dengan cara lain konten yang sama dari elemen penting dalam sistem semiotik tertentu" (159 ). Dalam pengertian "penafsiran" ini, bentuk dan isi tidak dapat dipisahkan; sebaliknya, setiap bentuk diisi dengan makna semantik ("bentuk bermakna"), sehingga interpretasi menawarkan penceritaan kembali yang baru dan serupa tentang sesuatu yang bermakna dalam sistem tanda lain.

Pemahaman serupa tentang bentuk dan isi, dikemukakan oleh Claude Lévi-Strauss dalam salah satu karya terprogram strukturalisme, ("Struktur dan Bentuk: Refleksi pada Karya Vladimir Propp"), dapat dilihat dalam buku anumerta Saussure, A Course in Linguistik Umum (1916, trans., 1959, 1983). Selama masa hidupnya, Saussure menerbitkan sedikit, "Kursus" - pekerjaan utamanya - dikumpulkan dari catatan siswa yang menghadiri kuliahnya tentang linguistik umum pada tahun 1907-11. Dalam Kursus, Saussure menyerukan studi bahasa "ilmiah", membandingkannya dengan linguistik sejarah komparatif abad ke-19. Karya ini dapat dianggap sebagai salah satu pencapaian terbesar pemikiran Barat: berdasarkan kata-kata individu sebagai elemen struktural bahasa, linguistik historis (atau "diakronis") membuktikan asal dan perkembangan bahasa-bahasa Eropa Barat dari bahasa Indo-Eropa yang umum - dan Proto-Indo-Eropa sebelumnya.

Justru studi tentang kemunculan unik kata-kata ini, dengan asumsi bersamaan bahwa "unit" dasar bahasa sebenarnya adalah keberadaan positif dari "elemen kata" inilah yang dipertanyakan Saussure. Karyanya adalah upaya untuk mereduksi banyak fakta tentang bahasa yang dipelajari dengan santai oleh linguistik komparatif menjadi sejumlah kecil teorema. Sekolah filologi komparatif abad ke-19, tulis Saussure, "tidak berhasil menciptakan sekolah linguistik yang nyata" karena "tidak memahami esensi objek studi" (3). "Esensi" ini, menurutnya, tidak hanya terletak pada kata-kata individual - "substansi positif" bahasa - tetapi juga pada koneksi formal yang membantu keberadaan substansi ini.

"Ujian" bahasa Saussure didasarkan pada tiga asumsi. Pertama, pemahaman ilmiah tentang bahasa tidak didasarkan pada sejarah, tetapi pada fenomena struktural. Oleh karena itu, ia membedakan antara fenomena individu bahasa - "peristiwa ucapan", yang ia definisikan sebagai "parole" - dan yang tepat, menurut pendapatnya, objek studi linguistik, sistem (kode, struktur) yang mengontrol peristiwa ini ( "bahasa"). Kajian yang sistematis seperti itu, apalagi, membutuhkan konsepsi "sinkron" tentang hubungan antara unsur-unsur bahasa pada saat tertentu, daripada kajian "diakronis" tentang perkembangan bahasa melalui sejarahnya.

Hipotesis ini adalah pendahulu dari apa yang oleh Roman Jakobson pada tahun 1929 disebut "strukturalisme" - sebuah teori di mana "serangkaian fenomena apa pun yang diselidiki oleh sains modern dianggap bukan sebagai akumulasi mekanis, tetapi sebagai keseluruhan struktural di mana komponen konstruktif berkorelasi dengan fungsi" ("Romantis "711). Dalam bagian ini, Jakobson merumuskan gagasan Saussure tentang mendefinisikan bahasa sebagai struktur, sebagai lawan dari pencacahan "mekanis" peristiwa sejarah. Selain itu, Jakobson mengembangkan asumsi Saussurean lain, yang menjadi cikal bakal linguistik struktural: elemen dasar bahasa harus dipelajari tidak begitu banyak hubungannya dengan penyebabnya, tetapi dengan fungsinya. Fenomena dan peristiwa terpisah (katakanlah, sejarah asal mula kata-kata Indo-Eropa individu) harus dipelajari bukan dengan sendirinya, tetapi dalam suatu sistem yang berkorelasi dengan komponen serupa. Ini adalah perubahan radikal dalam membandingkan fenomena dengan realitas di sekitarnya, yang signifikansinya dibandingkan oleh filsuf Ernst Cassirer dengan "ilmu Galileo, yang pada abad ketujuh belas menjungkirbalikkan gagasan tentang dunia material." akibatnya, penjelasannya sendiri. Fenomena mulai diinterpretasikan bukan dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan efek yang dapat ditimbulkannya di masa sekarang dan masa depan.Interpretasi tidak lagi terlepas dari niat seseorang (terlepas dari kenyataan bahwa niat dapat bersifat impersonal, "tidak sadar" dalam arti kata Freudian).

Dalam linguistiknya, Saussure secara khusus menunjukkan pergantian konsep kata dalam linguistik, yang ia definisikan sebagai tanda dan dijelaskan dalam kaitannya dengan fungsinya. Tanda baginya adalah kombinasi antara bunyi dan makna, "signified and designation" (66-67; dalam terjemahan bahasa Inggris tahun 1983 oleh Roy Harris - "signification" dan "signal"). Sifat senyawa ini adalah "fungsional" (baik salah satu maupun unsur lainnya tidak dapat ada tanpa satu sama lain); selain itu, "yang satu meminjam kualitas dari yang lain" (8). Jadi, Saussure mendefinisikan elemen struktural utama bahasa - tanda - dan menjadikan dasar linguistik historis sebagai identitas tanda pada kata-kata, yang membutuhkan analisis yang sangat ketat. Oleh karena itu, kita dapat memahami arti yang berbeda dari, katakanlah, kata "pohon" yang sama - bukan karena kata tersebut hanya sekumpulan kualitas tertentu, tetapi karena kata tersebut didefinisikan sebagai elemen dalam sistem tanda, dalam "keseluruhan struktural", dalam bahasa.

Konsep kesatuan relatif ("diakritik") seperti itu mendasari konsep semua elemen bahasa dalam linguistik struktural. Ini sangat jelas dalam penemuan linguistik Saussurean yang paling orisinal, dalam pengembangan konsep "fonem" dan "ciri khas" bahasa. Fonem adalah unit bahasa terkecil yang diucapkan dan bermakna. Itu bukan hanya suara yang muncul dalam bahasa, tetapi "gambaran suara", kata Saussure, yang dianggap oleh penutur asli memiliki makna. (Perlu dicatat bahwa Elmar Holenstein menyebut linguistik Jakobson, yang melanjutkan gagasan dan konsep Saussure dalam ketentuan utamanya, "strukturalisme fenomenologis"). Itulah sebabnya pembicara terkemuka dari Sekolah Strukturalisme Praha, Jan Mukarowski, mengamati pada tahun 1937 bahwa “struktur. . . bukan konsep empiris, tapi fenomenologis; itu bukanlah hasil itu sendiri, tetapi serangkaian hubungan signifikan dari kesadaran kolektif (generasi, orang lain, dll.)”. Pemikiran serupa diungkapkan pada tahun 1960 oleh Lévi-Strauss, pemimpin strukturalisme Prancis: “Struktur tidak memiliki isi yang pasti; itu sendiri bermakna, dan konstruksi logis yang melingkupinya adalah jejak realitas.

Pada gilirannya, fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili "realitas fenomenologis" integral yang terpisah. Misalnya, dalam bahasa Inggris, bunyi "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, orang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Disedot, dinaikkan atau diturunkan, bunyi "t" yang panjang, dll. Akan sama-sama membedakan arti kata "to" dan "do". Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi satu bunyi dalam satu bahasa dapat sesuai dengan fonem yang berbeda di bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain keduanya adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan dan tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah sekumpulan kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi bahasa adalah seperangkat fitur yang diatur secara sistematis. Pada 1920-an -1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara - Saussure memperhatikan hal ini dalam "Kursus Linguistik Umum", dan Harris menyebutnya "fonetik fisiologis" (dalam terjemahan Baskin sebelumnya, istilah "fonologi " digunakan) - mereka terhubung dalam "simpul » durg melawan teman untuk membuat suara. Misalnya, dalam bahasa Inggris, perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara), dan tingkat suara yang membedakan satu fonem dari fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa." Yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa syarat yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Saya telah menyebutkan bahwa fonologi dalam perkembangannya bersandar pada pemikiran Saussure. Meskipun analisisnya tentang fisiologi linguistik di zaman modern, kata Harris, "akan disebut 'fisik', berlawanan dengan 'psikologis' atau 'fungsional', dalam The Course dia dengan jelas mengartikulasikan arah dan prinsip dasar analisis fungsional bahasa. Satu-satunya karyanya yang diterbitkan selama hidupnya, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Catatan tentang sistem vokal asli dalam bahasa Indo-Eropa), diterbitkan pada tahun 1878, sepenuhnya sejalan dengan linguistik historis komparatif dari abad ke-19. Namun demikian, dalam karya ini, kata Jonathan Culler, Saussure menunjukkan "keberhasilan gagasan bahasa sebagai sistem fenomena yang saling berhubungan, bahkan dengan rekonstruksi sejarahnya." Menganalisis hubungan antar fonem, menjelaskan pergantian vokal dalam bahasa modern kelompok Indo-Eropa, Saussure menyarankan bahwa selain beberapa bunyi "a" yang berbeda, harus ada fonem lain yang dijelaskan secara formal. “Apa yang membuat kesan khusus dalam karya Saussure,” Kaller menyimpulkan, “adalah bahwa hampir 50 tahun kemudian, ketika kuneiform Het ditemukan dan diuraikan, sebuah fonem ditemukan, dalam tulisan yang dilambangkan dengan “h”, yang berperilaku seperti prediksi Saussure. Melalui analisis formal, ia menemukan apa yang sekarang dikenal sebagai suara parau dalam bahasa Indo-Eropa.

Dalam konsep definisi tanda relatif (diakritik), baik eksplisit maupun tersirat dalam Kursus, ada asumsi kunci ketiga dari linguistik struktural, yang disebut oleh Saussure sebagai "sifat tanda yang sewenang-wenang". Artinya, hubungan antara bunyi dan makna dalam bahasa tidak dimotivasi oleh apa pun: seseorang dapat dengan mudah menghubungkan kata "arbre" dan kata "pohon" dengan konsep "pohon". Selain itu, ini berarti bahwa bunyinya juga sewenang-wenang: seseorang dapat mendefinisikan konsep "pohon" dengan adanya kulit kayu (kecuali pohon palem) dan ukurannya (kecuali untuk "tumbuhan berkayu rendah" - semak). Dari sini harus jelas bahwa semua asumsi yang saya sajikan tidak dibagi menjadi lebih dan kurang penting: masing-masing - sifat sistemik tanda (paling dapat dipahami dalam studi bahasa "sinkron"), esensi relatif (diakritik) mereka , sifat tanda yang sewenang-wenang - berasal dari yang lain.

Jadi, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai sekumpulan perbandingan dan pertentangan bahasa. Bahasa adalah ekspresi dari arti kata (penunjukan) dan hasilnya (komunikasi) - dan kedua fungsi ini tidak pernah bersamaan (lihat "Dekonstruksi Bahasa" Shleifer). Kita dapat melihat pergantian bentuk dan isi yang dijelaskan oleh Greimas dan Kurte dalam interpretasi versi terbaru: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi pada tingkat yang berurutan untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Artinya dalam suatu bahasa, ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem kontras, morfem - menjadi kata, kata - menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari jumlah bagian-bagiannya (seperti air, dalam contoh Saussure, lebih dari kombinasi hidrogen dan oksigen).

Tiga asumsi dari "Kursus Linguistik Umum" mengarahkan Saussure pada gagasan tentang ilmu baru abad ke-20, terpisah dari linguistik, mempelajari "kehidupan tanda dalam masyarakat". Saussure menyebut ilmu ini semiologi (dari bahasa Yunani "semeîon" - tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada tahun 1920-an dan 1930-an dan di Paris pada tahun 1950-an dan 1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan-temuan sastra yang disusun (atau dirumuskan) dengan struktur tersebut. Selain itu, di masa senja karirnya, sejalan dengan kursusnya di bidang linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini adalah upaya, seperti yang ditulis Saussure di salah satu dari 99 buku catatan, untuk mempelajari dalam sistem masalah "probabilitas", yang "menjadi dasar dari segalanya. " Investigasi semacam itu, klaim Saussure sendiri, membantu untuk fokus pada "sisi nyata" dari probabilitas; "Kata kunci" yang dicari anagramnya oleh Saussure, menurut Jean Starobinsky, "alat bagi penyair, dan bukan sumber kehidupan bagi puisi itu." Puisi berfungsi untuk membalikkan bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, terlihat keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran: “karena puisi diekspresikan tidak hanya dengan kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa.”

Upaya Saussure untuk mempelajari nama yang tepat dalam puisi Romawi akhir (Tsvetan Todorov menyebut ini singkatan dari "sebuah kata ... hanya sebelum ditulis") menekankan salah satu komponen analisis linguistiknya - sifat tanda yang sewenang-wenang, serta esensi formal linguistik Saussurean ("Bahasa," klaimnya, "inti dari bentuk, bukan fenomena"), yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa tulisan-tulisan Saussure saat ini tampaknya sangat konsisten dalam keengganan mereka untuk mempelajari simbol [fenomena yang memiliki makna yang terdefinisi dengan baik]. . . . Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, dia mendefinisikan simbol hanya untuk menetapkannya ke pembacaan yang salah: jika tidak disengaja, simbol itu tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang tidak hanya menggambarkan tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semilogi hanya dapat mendeskripsikan tanda-tanda yang acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak dapat membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya hal ini berubah menjadi sebuah pertanyaan. Sebaliknya, dia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad kesembilan belas yang didasarkan pada sejarah dan dugaan subyektif, dan metode interpretasi yang tidak disengaja berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis yang oleh Lévi-Strauss disebut "Kantianisme tanpa transenden". aktor" - menghapus konfrontasi antara bentuk dan isi (subjek dan objek), makna dan asal dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum - karya Ferlinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi makna dalam bahasa dan budaya.

Ronald Shleifer

literatur

1.Admoni V.G. Dasar-dasar teori tata bahasa / V.G. Nasihat; Akademi Ilmu Pengetahuan Uni Soviet.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. Metode matematika dalam linguistik. M., 1974.

4.Arnold I.V. Struktur semantik kata dalam bahasa Inggris modern dan metodologi untuk mempelajarinya. /I.V. Arnold-L .: Pendidikan, 1966. - 187 hal.

6.Bashlykov A.M. Sistem terjemahan otomatis. / SAYA. Bashlykov, A.A. Sokolov. - M.: LLC "FIMA", 1997. - 20 hal.

7.Baudouin de Courtenay: Warisan teoretis dan modernitas: Abstrak laporan konferensi ilmiah internasional / Ed.I.G. Kondratiev. - Kazan: KGU, 1995. - 224 hal.

8. A. V. Gladkiy, Unsur Linguistik Matematika. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198 hal.

9. Golovin, B.N. Bahasa dan statistik. /B.N. Golovin - M., 1971. - 210 hal.

10. Zvegintsev, V.A. Linguistik teoretis dan terapan. / V.A. Zvegintsev - M., 1969. - 143 hal.

11. Kasevich, V.B. Semantik. Sintaksis. Morfologi. // V.B. Kasevich - M., 1988. - 292 hal.

12. Lekomtsev Yu.K. Pengantar bahasa formal linguistik / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 hal., sakit.

13. Warisan Linguistik Baudouin de Courtenay di Akhir Abad ke-20: Abstrak Konferensi Ilmiah dan Praktis Internasional 15-18 Maret 2000. - Krasnoyarsk, 2000. - 125 hal.

Matveeva G.G. Makna gramatikal tersembunyi dan identifikasi orang sosial ("potret") pembicara / G.G. Matveev. - Rostov, 1999. - 174 hal.

14. Melchuk, I.A. Pengalaman dalam membangun model linguistik "Meaning Text"./ I.A. Melchuk. - M., 1974. - 145 hal.

15. Nelyubin L.L. Terjemahan dan linguistik terapan / L.L. Nelyubin. - M.: Sekolah Tinggi, 1983. - 207 hal.

16. Tentang metode penelitian bahasa yang tepat: tentang apa yang disebut "linguistik matematika" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva dan lainnya - M., 1961. - 162 hal.

17. Piotrovsky L.G. Linguistik Matematika: Buku Teks / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. - M.: Sekolah Tinggi, 1977. - 160 hal.

18. Dia. Teks, mesin, orang. - L., 1975. - 213 hal.

19. Dia. Linguistik Terapan / Ed. A.S.Gerda. - L., 1986. - 176 hal.

20. Revzin, I.I. model bahasa. M., 1963. Revzin, I.I. Linguistik struktural modern. Masalah dan metode. M., 1977. - 239 hal.

21. Revzin, I.I., Rozentsveig, V.Yu. Dasar-dasar terjemahan umum dan mesin / Revzin I.I., Rozentsveig, V.Yu. - M., 1964. - 401 hal.

22. Slyusareva N.A. Teori F. de Saussure dalam terang linguistik modern / N.A. Slyusareva. - M.: Nauka, 1975. - 156 hal.

23. Burung Hantu, L.Z. Linguistik analitis / L.Z. Burung Hantu - M., 1970. - 192 hal.

24. Saussure F.de. Catatan tentang Linguistik Umum / F. de Saussure; Per. dari fr. - M.: Kemajuan, 2000. - 187 hal.

25. Dia. Kursus Linguistik Umum / Per. dari fr. - Yekaterinburg, 1999. -426 hal.

26. Statistik ucapan dan analisis teks otomatis / Ed. ed. R.G. Piotrovsky. L., 1980. - 223 hal.

27. Stoll, P. Set. Logika. teori aksiomatik./ R. Stoll; Per. dari bahasa Inggris. - M., 1968. - 180 hal.

28. Tenier, L. Dasar-dasar sintaks struktural. M., 1988.

29. Ubin I.I. Otomasi kegiatan penerjemahan di USSR / I.I. Ubin, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28 hal.

30. Faure, R., Kofman, A., Denis-Papin, M. Matematika Modern. M., 1966.

31. Shenk, R. Pemrosesan informasi konseptual. M., 1980.

32. Shikhanovich, Yu.A. Pengantar matematika modern (konsep awal). M., 1965

33. Shcherba L.V. Vokal Rusia dalam istilah kualitatif dan kuantitatif / L.V. Shcherba - L.: Nauka, 1983. - 159 hal.

34. Abdullah-zade F. Warga dunia // Spark - 1996. - No.5. - hal.13

35.V.A. Uspensky. Pendahuluan bagi pembaca "New Literary Review" untuk pesan semiotik Andrei Nikolaevich Kolmogorov. - Tinjauan Sastra Baru. -1997. - Nomor 24. - S. 18-23

36. Perlovsky L. Kesadaran, bahasa dan budaya. - Pengetahuan adalah kekuatan. -2000. №4 - S.20-33

37. Frumkina R.M. Tentang kami - miring. // Jurnal Rusia. - 2000. - No.1. - hal.12

38. Fitialov, S.Ya. Tentang Pemodelan Sintaks dalam Linguistik Struktural // Masalah Linguistik Struktural. M., 1962.

39. Dia. Tentang kesetaraan tata bahasa NN dan tata bahasa ketergantungan // Masalah Linguistik Struktural. M., 1967.

40. Chomsky, N. Fondasi logis dari teori linguistik // Baru dalam linguistik. Masalah. 4.M., 1965

41. Schleifer R. Ferdinand de Saussure//tekan. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. tekan. jhu.ru

46. ​​​​en.wikipedia.org

Selama abad terakhir, linguistik selalu dikutip sebagai contoh ilmu yang berkembang pesat dan sangat cepat mencapai kematangan metodologis. Sudah di pertengahan abad terakhir, sains muda dengan percaya diri mengambil tempatnya di lingkaran sains yang memiliki tradisi seribu tahun, dan salah satu perwakilannya yang paling menonjol - A. Schleicher - memiliki keberanian untuk percaya bahwa dengan karyanya dia sudah menyimpulkan baris terakhir.<113>Namun, sejarah linguistik telah menunjukkan bahwa pendapat seperti itu terlalu terburu-buru dan tidak dapat dibenarkan. Pada akhir abad ini, linguistik mengalami kejutan besar pertama terkait dengan kritik terhadap prinsip-prinsip neo-tata bahasa, diikuti oleh yang lainnya. Perlu dicatat bahwa semua krisis yang dapat kita temukan dalam sejarah ilmu bahasa, sebagai suatu peraturan, tidak menggoyahkan fondasinya, tetapi, sebaliknya, berkontribusi pada penguatan dan pada akhirnya membawa penyempurnaan dan peningkatan. metode penelitian linguistik, berkembang seiring dengan tema dan isu ilmiah.

Namun di samping linguistik, ilmu-ilmu lain juga hidup dan berkembang, termasuk sejumlah besar ilmu baru. Ilmu fisika, kimia, dan teknis (yang disebut "tepat") telah menerima perkembangan yang sangat pesat di zaman kita, dan landasan teoretisnya, matematika, telah menguasai semuanya. Ilmu eksakta tidak hanya sangat menekan semua humaniora, tetapi saat ini mereka berusaha untuk "membawa mereka ke dalam keyakinan mereka", untuk menundukkan mereka pada kebiasaan mereka, untuk memaksakan metode penelitian mereka pada mereka. Dalam situasi saat ini, dengan menggunakan ungkapan bahasa Jepang, dapat dikatakan bahwa sekarang ahli bahasa-filolog sedang mengotori ujung tikar, di mana ilmu eksakta, yang dipimpin oleh matematika, ditempatkan dengan penuh kemenangan dan bebas.

Bukankah lebih bijaksana dari sudut pandang kepentingan ilmiah umum untuk menyerah pada matematika, untuk menyerah sepenuhnya pada kekuatan metodenya, yang secara terbuka disebut oleh beberapa suara 59 , dan dengan demikian, mungkin, mendapatkan kekuatan baru? Untuk menjawab pertanyaan-pertanyaan ini, pertama-tama kita harus melihat apa yang diklaim matematika dalam kasus ini, di bidang apa metode matematika linguistik menemukan penerapannya, sejauh mana mereka konsisten dengan spesifikasi materi bahasa dan apakah mereka mampu memberikan atau bahkan sekadar menyarankan jawaban atas pertanyaan-pertanyaan itu, yang ditetapkan oleh ilmu bahasa.

Sejak awal, perlu dicatat bahwa di antara para peminat tren matematika baru dalam linguistik<114>Tidak ada kebulatan pendapat mengenai tujuan dan sasarannya dalam penelitian statis. Acad. A. A. Markov, yang pertama kali menerapkan metode matematika pada bahasa, Boldrini, Yul, Mariotti menganggap elemen bahasa sebagai bahan ilustrasi yang cocok untuk membangun metode kuantitatif, atau untuk teorema statistik, tanpa bertanya-tanya apakah hasil penelitian semacam itu menarik. untuk ahli bahasa 6 0 . Ross percaya bahwa teori probabilitas dan statistik matematika menyediakan alat atau, seperti yang sekarang lebih suka mereka katakan, model matematika untuk menguji dan mengonfirmasi kesimpulan linguistik yang memungkinkan interpretasi numerik. Dengan demikian, metode matematika dipahami hanya sebagai alat bantu penelitian linguistik 6 1 . Lebih banyak lagi yang diklaim oleh Herdan, yang dalam bukunya tidak hanya merangkum dan mensistematisasikan semua upaya studi matematika masalah bahasa, tetapi juga mencoba memberi mereka orientasi yang jelas dalam kaitannya dengan pekerjaan selanjutnya. Dia memfokuskan penyajian seluruh materi bukunya pada “memahami statistik sastra (sebagaimana dia menyebut studi teks dengan metode statistik matematika. - DI 3.) sebagai bagian integral dari linguistik” 6 2 , dan merumuskan esensi dan tugas dari bagian baru ini dalam linguistik dengan kata-kata berikut: “Statistik sastra sebagai filosofi kuantitatif bahasa berlaku untuk semua cabang linguistik. Menurut pendapat kami, statistik sastra adalah linguistik struktural yang diangkat ke tingkat ilmu kuantitatif atau filsafat kuantitatif. Jadi, sama salahnya untuk mendefinisikan hasilnya sebagai di luar ruang lingkup<115>linguistik atau memperlakukannya sebagai alat bantu untuk penelitian” 6 3 .

Hampir tidak disarankan untuk berteori apakah sah dalam kasus ini untuk berbicara tentang kemunculan cabang linguistik baru dan menyelesaikan masalah klaimnya, tanpa terlebih dahulu mengacu pada pertimbangan tentang apa yang sebenarnya telah dilakukan dalam hal ini. daerah, dan untuk mengklarifikasi ke arah mana penerapan metode baru 6 4 . Ini akan membantu kita memahami perbedaan pendapat.

Penggunaan kriteria matematika (atau, lebih tepatnya, statistik) untuk memecahkan masalah linguistik sama sekali bukan hal baru dalam ilmu bahasa dan, pada tingkat tertentu, telah lama digunakan oleh ahli bahasa. Bagaimanapun, pada kenyataannya, konsep linguistik tradisional seperti hukum fonetik (dan terkait<116>nee dengan itu - pengecualian terhadap hukum), produktivitas elemen tata bahasa (misalnya, sufiks turunan), atau bahkan kriteria untuk hubungan terkait antar bahasa, sampai batas tertentu, didasarkan pada fitur statistik relatif. Lagipula, semakin tajam dan jelas pertentangan statistik dari kasus-kasus yang diamati, semakin banyak alasan kita harus berbicara tentang sufiks yang produktif dan tidak produktif, tentang hukum fonetik dan pengecualiannya, tentang ada atau tidak adanya hubungan kekerabatan antar bahasa. Tetapi jika dalam kasus seperti itu prinsip statistik digunakan kurang lebih secara spontan, maka di masa depan mulai diterapkan secara sadar dan sudah dengan penetapan tujuan tertentu. Jadi, di zaman kita, apa yang disebut kamus frekuensi kosakata dan ekspresi bahasa individu 6 5 atau bahkan arti kata multibahasa dengan "fokus umum pada realitas" 6 6 telah tersebar luas. Data kamus ini digunakan untuk menyusun buku teks bahasa asing (teks yang dibuat berdasarkan kosakata yang paling umum digunakan) dan kamus minimum. Kalkulus statistik menemukan penggunaan linguistik khusus dalam metode leksikostatistik atau glotokronologi oleh M. Swadesh, di mana, berdasarkan rumus statistik yang memperhitungkan kasus hilangnya kata-kata dari bahasa dana utama, dimungkinkan menetapkan kronologi mutlak pembagian rumpun bahasa 6 7 .

Dalam beberapa tahun terakhir, kasus penerapan metode matematika pada materi linguistik telah meningkat secara signifikan, dan dalam banyak upaya semacam itu, arah yang kurang lebih pasti telah diuraikan. Ayo berbelok<117>untuk pertimbangan berurutan mereka, tanpa merinci.

Mari kita mulai dengan arah yang diberi nama stilostatistik. Dalam hal ini, kita berbicara tentang definisi dan karakterisasi ciri-ciri gaya karya individu atau pengarang melalui hubungan kuantitatif unsur linguistik yang digunakan. Pendekatan statistik untuk mempelajari fenomena stilistika didasarkan pada pemahaman gaya sastra sebagai cara individu dalam menguasai sarana bahasa. Pada saat yang sama, peneliti benar-benar teralihkan dari pertanyaan tentang signifikansi kualitatif dari elemen linguistik yang dapat dihitung, memfokuskan semua perhatiannya hanya pada sisi kuantitatif; sisi semantik dari unit bahasa yang dipelajari, muatan emosional dan ekspresifnya, serta bagiannya dalam jalinan sebuah karya seni - semua ini tetap tidak diperhitungkan, merujuk pada apa yang disebut fenomena berlebihan. Dengan demikian, sebuah karya seni muncul dalam bentuk agregat mekanis, yang kekhususan konstruksinya diekspresikan hanya melalui hubungan numerik unsur-unsurnya. Perwakilan stilostatistik tidak menutup mata terhadap semua keadaan yang dicatat, menentang metode gaya tradisional, yang tidak diragukan lagi memasukkan unsur subjektivitas, dengan satu kualitas metode matematika, yang, menurut pendapat mereka, mengkompensasi semua kekurangannya - objektivitas hasil yang dicapai. “Kami berusaha,” tulis, misalnya, V. Fuchs, “... untuk mengkarakterisasi gaya ekspresi linguistik dengan cara matematis. Untuk tujuan ini, metode harus dibuat, yang hasilnya harus memiliki objektivitas yang sama dengan hasil ilmu eksakta ... Ini menunjukkan bahwa kita, setidaknya pada awalnya, hanya akan berurusan dengan kualitas struktural formal, dan bukan dengan semantik kandungan ungkapan linguistik. Dengan cara ini kita akan memperoleh suatu sistem hubungan ordinal, yang secara totalitasnya akan menjadi dasar dan titik tolak teori gaya matematika” 6 8 .<118>

Jenis pendekatan statistik yang paling sederhana untuk mempelajari bahasa penulis atau karya individu adalah menghitung kata-kata yang digunakan, karena kekayaan kamus, tampaknya, harus mencirikan penulis itu sendiri dengan cara tertentu. Namun, hasil perhitungan tersebut memberikan hasil yang agak tidak terduga dalam hal ini dan sama sekali tidak berkontribusi pada pengetahuan estetika dan evaluasi sebuah karya sastra, yang tidak lain merupakan salah satu tugas stilistika. Berikut beberapa data jumlah kata yang digunakan dalam sejumlah karya:

Alkitab (Latin). . . . . . . . . . 5649 kata

Alkitab (Ibrani). . . . 5642 kata

Demosthenes (bicara). . . . . . . . . . . . 4972 kata

Salam. . . . . . . . . . . . . . . . . 3394 kata

Horace. . . . . . . . . . . . . . . . . . . 0,6084 kata

Dante (Divine Comedy) 5860 kata

(ini termasuk 1615 nama diri dan nama geografis)

Tasso (Orland yang Marah). . . . 8474 kata

Milton. . . . . . . . . . . . . . . . . . . . 0,8000 kata (kira-kira diberikan)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 kata

(kurang lebih menurut sumber lain 20.000 kata)

O. Jespersen menunjukkan bahwa kamus Zola, Kipling dan Jack London secara signifikan melebihi kamus Milton, yaitu jumlahnya 8000 6 9 . Perhitungan kamus pidato Presiden AS W. Wilson menemukan bahwa kamus itu lebih kaya daripada kamus Shakespeare. Untuk ini harus ditambahkan data psikolog. Jadi, Terman, berdasarkan pengamatan sejumlah besar kasus, menemukan bahwa rata-rata kosakata anak adalah sekitar 3600 kata, dan pada usia 14 - sudah 9000. Rata-rata orang dewasa menggunakan 11700 kata, dan seseorang "meningkat kecerdasan" hingga 13500 7 0 . Dengan demikian, data numerik semacam itu sendiri tidak memberikan dasar apa pun untuk mengidentifikasi kualitas gaya karya dan hanya con "objektif".<119>mereka menyatakan penggunaan jumlah kata yang berbeda oleh penulis yang berbeda, yang, seperti yang ditunjukkan oleh perhitungan di atas, tidak terkait dengan nilai artistik relatif dari karya mereka.

Perhitungan frekuensi relatif penggunaan kata oleh masing-masing penulis dibuat agak berbeda. Dalam hal ini, tidak hanya jumlah total kata yang diperhitungkan, tetapi juga frekuensi penggunaan masing-masing kata. Pemrosesan statistik materi yang diperoleh dengan cara ini terdiri dari fakta bahwa kata-kata dengan frekuensi penggunaan yang sama dikelompokkan ke dalam kelas (atau peringkat), yang mengarah pada pembentukan distribusi frekuensi semua kata yang digunakan oleh penulis tertentu. Kasus khusus dari perhitungan semacam ini adalah penentuan frekuensi relatif dari kata-kata khusus (misalnya, kosakata Roman dalam karya Chaucer, seperti yang dilakukan oleh Mersand 7 1). Frekuensi relatif dari kata-kata yang digunakan oleh penulis berisi informasi objektif yang sama tentang gaya masing-masing penulis seperti perhitungan total di atas, dengan satu-satunya perbedaan adalah hasilnya adalah data numerik yang lebih akurat. Tetapi ini juga digunakan untuk menentukan tanggal karya individu dari penulis yang sama berdasarkan perhitungan awal dari frekuensi relatif penggunaan kata-katanya dalam periode yang berbeda dalam hidupnya (menurut karya yang diberi tanggal oleh penulisnya sendiri). Jenis lain dari penggunaan data dari perhitungan tersebut adalah untuk menetapkan keaslian kepenulisan karya yang pertanyaan ini tampaknya diragukan 7 2 . Dalam kasus terakhir ini, semuanya didasarkan pada perbandingan rumus statistik untuk frekuensi penggunaan dalam karya asli dan kontroversial. Tidak perlu berbicara tentang relativitas dan perkiraan yang sangat besar dari hasil yang diperoleh dengan metode tersebut. Bagaimanapun, frekuensi penggunaan relatif berubah tidak hanya dengan usia pengarang, tetapi juga bergantung pada genre, plot, dan juga lingkungan historis dari karya tersebut (bandingkan, misalnya, "Roti" dan "Peter I" oleh A. Tolstoy).<120>

Memperdalam metode yang dijelaskan di atas, stilostatistik sebagai karakteristik gaya mulai menggunakan kriteria stabilitas frekuensi relatif dari kata-kata yang paling umum digunakan. Metode yang digunakan dalam kasus ini dapat diilustrasikan dengan pemrosesan statistik cerita Pushkin "The Captain's Daughter" oleh Esselson dan Epstein di Institute of Slavic Languages ​​​​di University of Detroit (USA) 7 3 . Seluruh teks cerita (sekitar 30.000 kemunculan kata) menjadi sasaran survei, dan kemudian bagian yang berisi sekitar 10.000 dan 5.000 kemunculan. Selanjutnya, untuk menentukan stabilitas frekuensi relatif penggunaan kata, 102 kata yang paling umum digunakan (dengan frekuensi 1160 kali hingga 35) dibandingkan dengan frekuensi relatif yang dihitung (dibuat berdasarkan bagian selektif) dengan yang sebenarnya. Misalnya, penyatuan "dan" digunakan 1.160 kali di sepanjang cerita. Dalam bagian yang berisi 5.000 kemunculan semua kata, konjungsi ini diharapkan digunakan 5.000 x 1.160:30.000, atau dibulatkan 193 kali, dan dalam bagian yang berisi 10.000 kemunculan semua kata, diharapkan digunakan 10.000 x 1.160 : 30.000, atau 386 kali. Perbandingan data yang diperoleh dengan menggunakan perhitungan semacam ini dengan data sebenarnya menunjukkan penyimpangan yang sangat tipis (dalam 5%). Berdasarkan perhitungan tersebut, ditemukan bahwa dalam cerita Pushkin ini, preposisi "k" digunakan dua kali lebih sering daripada "y", dan kata ganti "kamu" digunakan tiga kali lebih sering daripada "mereka", dll. , terlepas dari semua perubahan plot, baik di sepanjang cerita maupun di bagian-bagian individualnya, terdapat stabilitas dalam frekuensi relatif penggunaan kata-kata. Apa yang diamati dalam kaitannya dengan beberapa kata (paling umum) mungkin berlaku untuk semua kata yang digunakan dalam karya tersebut. Oleh karena itu, gaya pengarang dapat dicirikan oleh rasio tertentu dari variabilitas frekuensi rata-rata penggunaan kata dengan frekuensi umum untuk bahasa tertentu.<121>frekuensi penggunaannya. Rasio ini dianggap sebagai karakteristik kuantitatif objektif dari gaya pengarang.

Elemen formal lain dari struktur bahasa dipelajari dengan cara yang sama. Jadi, misalnya, V. Fuchs menjadikan ciri-ciri metrik dari karya-karya Goethe, Rilke, Caesar, Sallust, dll.

Kriteria stabilitas frekuensi relatif penggunaan kata-kata, sambil mengklarifikasi teknik karakterisasi gaya kuantitatif, tidak memperkenalkan sesuatu yang baru secara fundamental dibandingkan dengan metode yang lebih primitif yang dianalisis di atas. Semua metode stilostatistik pada akhirnya menghasilkan hasil "objektif" yang sama tidak memihaknya, meluncur di atas permukaan lidah dan hanya bergantung pada tanda-tanda eksternal murni. Metode kuantitatif ternyata tidak mampu memusatkan perhatian pada perbedaan kualitatif materi yang diteliti dan justru meratakan semua objek yang diteliti.

Dimana spesifikasi maksimum dibutuhkan, kriteria yang paling umum ditawarkan; karakteristik kualitatif dinyatakan dalam bahasa kuantitas. Ini bukan hanya kontradiksi logis, tetapi juga ketidaksepakatan dengan sifat benda. Memang, apa yang terjadi jika kita mencoba mendapatkan karakteristik gaya komparatif (yaitu, kualitatif) dari karya Alexander Gerasimov dan Rembrandt berdasarkan rasio kuantitatif cat merah dan hitam pada kanvas mereka? Tampaknya itu benar-benar omong kosong. Sejauh mana informasi kuantitatif yang sepenuhnya "objektif" tentang data fisik seseorang dapat memberi kita gambaran tentang segala sesuatu yang menjadi ciri seseorang dan merupakan esensi sejatinya? Jelas tidak ada. Mereka hanya dapat berfungsi sebagai tanda individu yang membedakan satu orang dari orang lain, seperti jejak belitan di ibu jari. Situasinya mirip dengan karakteristik kuantitatif gaya sastra. Jika Anda melihat lebih dekat, mereka memberikan data yang sangat sedikit untuk menilai gaya yang sebenarnya<122>kualitas bahasa penulis, serta deskripsi belitan di jari untuk studi psikologi manusia.

Untuk semua yang telah dikatakan, harus ditambahkan bahwa di masa lalu, di apa yang disebut sekolah formal kritik sastra, telah dilakukan upaya untuk mempelajari gaya penulis secara kuantitatif, ketika julukan, metafora, dan elemen ritmis-melodi ayat dihitung. Namun, upaya ini tidak dikembangkan lebih lanjut.

Area lain penerapan metode matematika untuk mempelajari fenomena linguistik dapat dikelompokkan dengan nama statistik linguistik. Ini berusaha untuk mengganggu pertanyaan mendasar dari teori bahasa dan dengan demikian untuk mendapatkan panggilan di bidang linguistik yang tepat. Untuk mengenal arah ini, yang terbaik adalah beralih ke karya Herdan yang telah disebutkan, dalam kata-kata salah satu dari banyak pengulasnya, "buku yang sangat megah" 7 5 , menerima, bagaimanapun, tanggapan yang luas di kalangan ahli bahasa 7 6 . Mengingat fakta bahwa Kherdan (sebagaimana telah disebutkan di atas) berusaha mengumpulkan dalam bukunya segala sesuatu yang paling penting di bidang penerapan metode matematika untuk masalah linguistik, dalam bukunya kita sebenarnya tidak terlalu banyak membahas Kherdan melainkan dengan keseluruhan kecenderungan. Seperti yang ditunjukkan oleh judul buku, "Bahasa sebagai Pilihan dan Probabilitas", fokus utamanya adalah untuk mengklarifikasi apa yang tersisa dalam bahasa untuk pilihan bebas pembicara dan apa yang disebabkan oleh struktur bahasa yang imanen, seperti halnya menentukan perbandingan kuantitatif unsur-unsur orde pertama dan kedua. Buku Kherdan memberikan informasi yang hampir lengkap tentang semua pekerjaan di bidang ini yang dilakukan oleh perwakilan dari berbagai spesialisasi.<123>(filsuf, ahli bahasa, ahli matematika, teknisi), tetapi tidak terbatas pada ini dan mencakup banyak pengamatan, pertimbangan, dan kesimpulan asli dari penulis sendiri. Sebagai karya ringkasan, ini memberikan gambaran bagus tentang metode kuantitatif yang digunakan, dan hasil yang dicapai dengan bantuannya. Pertanyaan-pertanyaan yang kami gabungkan secara kondisional ke dalam bagian statistik linguistik dibahas di bagian kedua dan keempat buku ini.

Dari sekian banyak kasus penerapan metode statistik matematika untuk mempelajari masalah linguistik, kami akan fokus pada yang paling umum, yang pada saat yang sama dapat dianggap sebagai yang paling khas. Menggunakan data dari penulis lain - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 dan lain-lain, serta mengutip penelitiannya sendiri yang menentukan frekuensi relatif sebaran fonem, huruf, panjang kata (diukur dengan jumlah huruf dan suku kata) , bentuk tata bahasa dan elemen metrik dalam heksameter Latin dan Yunani, Herdan menetapkan fakta stabilitas frekuensi relatif elemen linguistik sebagai karakteristik umum dari semua struktur linguistik. Dia menurunkan aturan berikut: “Proporsi elemen linguistik yang termasuk dalam satu atau beberapa tingkat atau bidang pengkodean linguistik - fonologi, tata bahasa, metrik - tetap kurang lebih konstan untuk bahasa tertentu, dalam periode perkembangan tertentu dan dalam batas observasi yang cukup luas dan dilakukan secara tidak memihak. » 8 2 . Aturan ini, yang disebut Herdan sebagai hukum dasar bahasa, ia berusaha untuk menafsirkan dan memperluasnya dengan cara tertentu. “Dia,” tulis Herdan tentang hukum ini, “adalah ekspresi dari fakta bahwa bahkan di sini, di mana kehendak manusia dan kebebasan memilih diberikan<124>kerangka kerja terluas, di mana pilihan sadar dan permainan riang bergantian satu sama lain, secara umum ada stabilitas yang cukup besar... dalam tata bahasa, tetapi juga dalam kaitannya dengan frekuensi penggunaan fonem tertentu, unit leksikal (kata) dan fonem tata bahasa dan konstruksi; dengan kata lain kesamaannya tidak hanya pada apa yang digunakan, tetapi juga pada seberapa sering digunakan” 8 3 . Situasi ini disebabkan oleh alasan yang dapat dimengerti, tetapi ini menimbulkan kesimpulan baru. Ketika memeriksa teks atau segmen yang berbeda dari bahasa tertentu, misalnya, ditemukan bahwa frekuensi relatif penggunaan fonem tertentu (atau elemen ucapan lainnya) oleh orang yang berbeda pada dasarnya tetap sama. Hal ini mengarah pada interpretasi bentuk ucapan individu sebagai beberapa fluktuasi dalam kemungkinan konstan menggunakan fonem yang dipertimbangkan dalam bahasa tertentu. Dengan demikian, ternyata dalam kegiatan berbicara seseorang tunduk pada hukum probabilitas tertentu dalam kaitannya dengan jumlah unsur linguistik yang digunakan. Dan kemudian, ketika kita mengamati sejumlah besar unsur linguistik dalam sekumpulan besar teks atau segmen tuturan, kita mendapat kesan ketergantungan kausal dalam arti bahwa dalam hal ini juga terdapat determinasi dalam kaitannya dengan penggunaan unsur linguistik tertentu. Dengan kata lain, ternyata dapat diterima untuk menyatakan bahwa apa yang tampaknya menjadi hubungan sebab akibat dari sudut pandang intuitif, secara kuantitatif adalah sebuah probabilitas 8 4 . Jelas bahwa semakin besar totalnya<125>kekhususan teks atau segmen tuturan yang diteliti, akan semakin jelas kestabilan frekuensi relatif penggunaan unsur linguistik akan terwujud juga dalam penggunaan individu (hukum bilangan besar). Dari sini, ditarik kesimpulan umum baru bahwa bahasa adalah fenomena massa dan harus diperlakukan seperti itu.

Kesimpulan ini, yang dicapai berdasarkan perhitungan frekuensi unsur-unsur fonetik, kata-kata dan bentuk-bentuk gramatikal, yang bersama-sama membentuk bahasa, kemudian diterapkan pada "penafsiran statistik" pembagian Saussure menjadi "bahasa" (lalangue) dan "ucapan" (laparole). ). Menurut Saussure, "bahasa" adalah seperangkat kebiasaan linguistik yang memungkinkan komunikasi antara anggota komunitas linguistik tertentu. Ini adalah realitas sosial, sebuah "fenomena massa", wajib bagi semua orang yang berbicara bahasa ini. Herdan, seperti yang ditunjukkan, membuktikan bahwa anggota komunitas satu bahasa mirip satu sama lain tidak hanya karena mereka menggunakan fonem, satuan leksikal, dan bentuk tata bahasa yang sama, tetapi juga karena semua elemen ini digunakan dengan frekuensi yang sama. Dengan demikian, definisi statistiknya tentang "bahasa" mengambil bentuk berikut: "bahasa" (lalangue) adalah totalitas unsur-unsur linguistik umum ditambah kemungkinan relatifnya untuk digunakan.

Definisi "bahasa" ini juga merupakan titik awal untuk interpretasi statistik yang sesuai dari "ucapan", yang menurut Saussure, merupakan ucapan individu. Membandingkan "bahasa" sebagai fenomena sosial dari "ucapan" sebagai fenomena individu, Saussure menulis: "Ucapan adalah tindakan individu dari kemauan dan pemahaman, di mana perlu untuk membedakan: 1. kombinasi dengan mana subjek yang berbicara menggunakan bahasa kode untuk mengungkapkan pemikiran pribadinya; 2. suatu mekanisme psikofisik yang memungkinkannya mengobjektifkan kombinasi-kombinasi ini” 8 5 . Karena "bahasa" dalam statistik linguistik dianggap sebagai sekumpulan elemen dengan kerabat tertentu<126>probabilitas tertentu penggunaannya, sejauh itu mencakup totalitas statistik atau ansambel (populasi) sebagai karakteristik paling esensial dan dapat dipertimbangkan dalam aspek ini. Sejalan dengan itu, "ucapan" berubah menjadi sampel terpisah yang diambil dari "bahasa" sebagai agregat statistik. Probabilitas dalam hal ini ditentukan oleh hubungan "ucapan" dengan "bahasa" (dalam pemahaman "kuantitatif" mereka), dan distribusi frekuensi relatif dari penggunaan elemen bahasa yang berbeda ditafsirkan sebagai hasil dari a "pilihan" kolektif (pilihan) dalam periode kronologis tertentu dari keberadaan bahasa. Menyadari bahwa interpretasi tentang perbedaan antara "bahasa" dan "ucapan" seperti itu dibangun di atas dasar yang sama sekali berbeda dari interpretasi Saussure, Herdan menulis dalam hal ini: "Modifikasi kecil yang tampaknya dari konsep Saussure ini memiliki konsekuensi penting bahwa "bahasa" ( lalangue ) sekarang memperoleh karakteristik penting dalam bentuk agregat statistik (populasi). Populasi ini dicirikan oleh frekuensi relatif tertentu atau probabilitas fluktuasi, artinya setiap unsur linguistik termasuk dalam tingkatan linguistik tertentu. Dalam hal ini, "ucapan" (laparole), sesuai dengan artinya, ternyata merupakan istilah untuk mendefinisikan sampel statistik yang diambil dari "bahasa" sebagai populasi statistik. Menjadi jelas bahwa pilihan (pilihan) muncul di sini dalam bentuk rasio "ucapan" dengan "bahasa", yaitu rasio sampel yang diambil secara acak dengan agregat statistik (populasi). Urutan distribusi frekuensi itu sendiri, sebagai deposit aktivitas bicara komunitas linguistik selama berabad-abad, merupakan elemen pilihan (pilihan), tetapi bukan pilihan individu, seperti dalam gaya, tetapi pilihan kolektif. Dengan menggunakan metafora, di sini kita dapat berbicara tentang pilihan yang dibuat oleh semangat bahasa, jika kita memahami prinsip-prinsip komunikasi linguistik, yang sesuai dengan kompleks data mental anggota komunitas linguistik tertentu. Kestabilan deret adalah hasil dari probabilitas (peluang)» 8 6 .

Kasus khusus dari penerapan prinsip yang disebutkan<127>pa adalah batasan dalam bahasa fenomena normatif dari "pengecualian" (penyimpangan). Statistik linguistik menyatakan bahwa metode statistik memungkinkan untuk menghilangkan ketidakjelasan yang ada dalam masalah ini dan menetapkan kriteria yang jelas untuk membedakan antara fenomena ini. Jika norma dipahami sebagai populasi statistik (dalam pengertian di atas), dan pengecualian (atau kesalahan) adalah penyimpangan dari frekuensi yang ditunjukkan oleh populasi statistik, maka solusi kuantitatif dari pertanyaan tersebut akan muncul dengan sendirinya. Semuanya bermuara pada hubungan statistik antara "populasi" dan "outlier". Jika frekuensi yang diamati dalam sampel individu menyimpang dari probabilitas karena populasi statistik lebih dari yang ditentukan oleh serangkaian jumlah sampel, maka kami memiliki alasan untuk menyimpulkan bahwa garis demarkasi antara "sama" (norma) dan "tidak sama" (pengecualian) dilanggar.

Perbedaan kuantitatif antara "bahasa" dan "ucapan" juga digunakan untuk membedakan dua jenis elemen linguistik: gramatikal dan leksikal. Titik awal untuk memecahkan masalah ini, yang seringkali menimbulkan kesulitan besar dari sudut pandang linguistik, adalah asumsi bahwa tingkat frekuensi elemen gramatikal berbeda dengan unit leksikal. Hal ini diduga terkait dengan "generalisasi" elemen tata bahasa, perbedaannya dari konsep yang ditetapkan oleh unit leksikal. Selain itu, unsur-unsur tata bahasa seharusnya, sebagai aturan, volumenya jauh lebih kecil: sebagai kata-kata independen (termasuk kata ganti, preposisi, kata sambung dan kata bantu) mereka biasanya terdiri dari sejumlah kecil fonem, dan dalam bentuk "bentuk terhubung " - dari satu atau dua fonem 8 7 . Semakin kecil unsur linguistiknya, semakin kecil kemampuan "panjangnya" (momen kuantitatif) untuk berfungsi sebagai ciri yang menentukan, dan semakin penting "kualitas" fonem yang diperoleh untuk tujuan ini. Metode apa yang diusulkan untuk memecahkan masalah yang sedang dipertimbangkan? Ini diselesaikan dengan merujuk pada konsep gramatikal yang murni kuantitatif<128>memuat, “Misalkan,” tulis Herdan sehubungan dengan ini, “bahwa kami tertarik untuk membandingkan dua bahasa dalam hal ini. Bagaimana kita menentukan dengan tingkat objektivitas tertentu "beban gramatikal" yang dibawa oleh suatu bahasa? Jelas bahwa muatan ini akan bergantung pada posisi garis demarkasi yang memisahkan tata bahasa dari kosa kata. Pertimbangan pertama yang mungkin muncul di benak kita adalah menentukan seberapa "kompleks" tata bahasa suatu bahasa. Bagaimanapun, "kompleksitas" adalah karakteristik kualitatif, dan konsep "beban gramatikal" adalah karakteristik kuantitatif. Benar, beban sampai batas tertentu bergantung pada kerumitannya, tetapi tidak sepenuhnya. Suatu bahasa dapat dihargai dengan tata bahasa yang sangat kompleks, tetapi hanya sebagian kecil yang digunakan dalam aktivitas bahasa. Kami mendefinisikan "beban gramatikal" sebagai totalitas tata bahasa yang dibawa oleh suatu bahasa ketika ia beraksi, yang segera membawa masalah kami ke ranah linguistik struktural dalam pengertian disiplin yang didefinisikan oleh Saussure. Dalam pemaparan berikut, metode kuantitatif digunakan untuk menentukan perbedaan antara bahasa, tergantung di mana letak batasnya, memisahkan tata bahasa dari kosakata” 8 8 . Dengan kata lain, perbedaan bahasa dalam hal ini harus direduksi menjadi perbedaan hubungan numerik antara unsur gramatikal dan leksikal.

Bahan-bahan yang kami miliki melukis gambar berikut. Dalam bahasa Inggris (hanya "kata-kata tata bahasa" yang diperhitungkan: kata ganti, atau, sebagaimana mereka juga disebut, "pengganti", kata depan, kata sambung dan kata kerja bantu), dalam segmen yang mencakup 78633 kasus penggunaan semua kata (1027 kata yang berbeda), 53.102 kasus penggunaan unsur tata bahasa, atau lebih tepatnya, "kata tata bahasa" (149 kata yang berbeda), yaitu 67,53% dengan 15,8% kata yang berbeda. Demikian data Deway 8 9 . Data lain menunjukkan persentase yang berbeda<129>rasio: 57,1% dengan 5,4% kata berbeda 9 0 . Perbedaan yang signifikan ini dijelaskan oleh perbedaan antara bahasa tertulis dan lisan. Bentuk bahasa tertulis (data pertama) diduga menggunakan lebih banyak unsur gramatikal daripada bahasa lisan (kasus kedua). Dalam Divine Comedy Dante (setelah aslinya Italia), Mariotti menetapkan 54,4% dari kemunculan "kata-kata tata bahasa".

Cara lain dan, tampaknya, cara yang lebih sempurna untuk menentukan muatan tata bahasa suatu bahasa adalah dengan menghitung fonem yang termasuk dalam unsur tata bahasa. Dalam hal ini, tidak hanya kata tata bahasa independen yang diperhitungkan, tetapi juga bentuk terkait. Ada berbagai pilihan di sini. Misalnya, menentukan frekuensi relatif penggunaan fonem konsonan individu dalam elemen tata bahasa dan membandingkannya dengan frekuensi penggunaan total fonem yang sama ini (data akhir dari rasio semacam itu dalam bahasa Inggris memberikan proporsi 99,9% hingga 100.000 - penggunaan total); atau perbandingan konsonan serupa menurut kelompok klasifikasi terpisah (labial, palatal, velar dan fonem lainnya). Rasio akhir di sini berbentuk proporsi 56,47% (dalam unsur gramatikal) sampai 60,25% (dalam pemakaian total); atau perbandingan yang sama dari fonem konsonan awal (dalam hal ini, rasionya adalah 100,2% dalam kata gramatikal dengan 99,95 dalam penggunaan total). Operasi statistik lain yang lebih kompleks juga dimungkinkan, yang, bagaimanapun, menghasilkan ekspresi kuantitatif yang serupa dari masalah yang diteliti.

Data kuantitatif yang diberikan berfungsi sebagai dasar untuk kesimpulan umum. Itu bermuara pada fakta bahwa distribusi fonem dalam elemen tata bahasa menentukan sifat distribusi (dalam istilah numerik, tentu saja) fonem dalam bahasa secara keseluruhan. Dan ini, pada gilirannya, memungkinkan kita untuk menyimpulkan bahwa penggunaan elemen tata bahasa bergantung pada pilihan individu dan merupakan bagian dari ekspresi linguistik yang dikendalikan oleh probabilitas.<130>ness. Kesimpulan spekulatif ini diperkuat dengan perhitungan bentuk tata bahasa dalam bahasa Rusia yang dibuat oleh Esselson 9 1 . Studi ini menjadi sasaran 46896 kata yang diambil dari sumber II (karya Griboedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov dan N. Ostrovsky). Mereka dibagi menjadi kata sehari-hari (17.756 kata atau 37,9%) dan non-sehari-hari (29140 kata atau 62,1%). Kemudian seluruh rangkaian kata dibagi menjadi 4 kelompok tergantung pada sifat gramatikalnya: kelompok pertama memasukkan kata benda, kata sifat, kata sifat dalam fungsi kata benda, kata ganti, dan angka infleksi; di grup ke-2 - kata kerja; dalam kelompok ke-3 - participle verbal, partisip dalam fungsi kata sifat dan kata benda dan gerund; pada kelompok ke-4 - bentuk kata keterangan, preposisi, konjungsi dan partikel yang tidak berubah-ubah. Hasil ringkasan (juga tabel dengan data untuk masing-masing penulis diberikan) memberikan rasio berikut:

kelompok pertama

kelompok ke-2

kelompok ke-3

kelompok ke-4

bahasa sehari-hari

pendiam

Herdan mencirikan pertimbangan data kuantitatif yang diperoleh dengan kata-kata berikut: “Mereka membenarkan kesimpulan bahwa elemen tata bahasa harus dipertimbangkan sebagai faktor yang menentukan kemungkinan ekspresi linguistik. Kesimpulan seperti itu menghindari kualifikasi yang memberatkan dari setiap kata yang digunakan. Jelas bahwa, karena tata bahasa dan kosa kata tidak disimpan dalam cangkang kedap air, tidak ada "pilihan" murni atau "kebetulan" murni. Baik tata bahasa maupun kosa kata mengandung kedua elemen tersebut, meskipun dalam proporsi yang sangat bervariasi” 9 2 .<131>

Sebagian besar buku Herdan dikhususkan untuk mempelajari dualitas atau dualitas dalam bahasa, dan konsep dualitas itu sendiri didasarkan pada karakteristik matematika.

Dengan demikian, teorema dalam geometri projektif dapat disusun dalam dua deret, sehingga setiap teorema deret yang satu dapat diperoleh dari beberapa teorema deret lainnya dengan mengganti kata-kata tersebut. dot Dan lurus. Misalnya, jika sebuah pernyataan diberikan: "setiap titik yang berbeda milik satu dan hanya satu garis," maka kita dapat menurunkan pernyataan yang sesuai darinya: "setiap dua garis berbeda milik satu dan hanya satu titik." Metode lain untuk menentukan dualitas adalah memplot berbagai bidang dari fenomena yang dipelajari di sepanjang absis dan ordinat. Jadi, seperti yang dilakukan Yul 9 3, misalnya, frekuensi penggunaan yang berbeda dihitung sepanjang sumbu absis, dan jumlah unit leksikal yang frekuensinya ditentukan, dll., dihitung sepanjang sumbu ordinat penelitian linguistik.

Di bawah konsep dualitas yang didefinisikan dengan cara ini, yang dalam semua kasus sebenarnya memiliki karakter kode biner dan yang juga dianggap sebagai fitur paling esensial dari struktur linguistik, fenomena dengan kualitas yang sangat berbeda dibawa masuk, memungkinkan pertentangan di sepanjang dua bidang. : pembagian penggunaan kata menurut sifat satuan leksikal dan pembagian satuan leksikal menurut frekuensi penggunaan kata; bentuk ucapan tertulis dan lisan; elemen leksikal dan tata bahasa; Sinonim dan antonim; fonem dan representasi grafisnya; dapat didefinisikan dan didefinisikan (signifiant dan signifiy Saussure), dll.

Setelah studi kuantitatif tentang dualitas tertentu, fenomena linguistik atau "teks" terbatas, sebagai suatu peraturan, sebuah kesimpulan ditarik, yang dikaitkan dengan kualitas universalitas linguistik. Sifat dari kesimpulan tersebut dan cara mereka dibenarkan dapat dilihat pada contoh<132>studi tentang dualitas kata dan konsep (sebenarnya, kita berbicara tentang rasio panjang kata dan volume konsep - harus diingat bahwa penggunaan istilah linguistik dan istilah lain yang sangat bebas di karya seperti itu sering membuat pemahaman menjadi sangat sulit). Penting untuk dicatat bahwa sebagai bahan yang menjadi sumber pengamatan jenis dualitas linguistik ini, berikut ini digunakan: nomenklatur penyakit internasional (sekitar 1000 nama) dan daftar umum penyakit di Inggris dan Wells untuk tahun 1949 Dalam hal ini, kesimpulan umum berikut dibuat: “ Setiap konsep yang menunjukkan gagasan umum memiliki apa yang disebut "bola" atau "volume". Ia memungkinkan melalui mediumnya untuk memikirkan banyak objek atau konsep lain yang berada di dalam “ruang”nya. Di sisi lain, semua item yang diperlukan untuk mendefinisikan sebuah konsep merupakan apa yang disebut "isinya". Volume dan konten saling berkorelasi - semakin kecil kontennya dan, karenanya, semakin abstrak konsepnya, semakin besar ruang lingkup atau volumenya, yaitu, semakin banyak objek yang dibawa di bawahnya. Ini dapat dilihat sebagai analogi (dalam bidang konseptual) dengan prinsip-prinsip pengkodean, yang menurutnya panjang simbol dan frekuensi penggunaan saling bergantung” 9 4 .

Prinsip dualitas juga berlaku untuk masalah-masalah tertentu. Misalnya, ketika menetapkan padanan makna kata-kata dalam dua bahasa yang berbeda. Sebagai hasil dari mempelajari kamus Inggris-Jerman oleh Muret-Zanders menggunakan metode iterasi matematis, disimpulkan bahwa probabilitas penggunaan kata bahasa Inggris dengan satu atau lebih arti dalam terjemahan bahasa Jerman tetap konstan untuk setiap huruf awal di seluruh kamus 9 5 . Pertimbangan urutan kata dalam kamus Cina mengarah pada kesimpulan bahwa itu bersifat taksonomi, karena jumlah goresan dalam karakter menunjukkan tempatnya (sebagai radikal independen atau subkelas tertentu yang berada di bawah radikal). Taksonomi adalah prinsip subordinasi klasifikasi yang digunakan dalam zoologi dan botani. Kherdan mengklaim itu<133>dasar leksikografi Cina juga dibangun di atas prinsip taksonomi 9 6, dll.

Membuat penilaian umum bidang penerapan metode matematika ini untuk mempelajari masalah linguistik (yaitu, statistik linguistik), tampaknya, perlu untuk melanjutkan dari posisi yang dirumuskan oleh Ettinger: “Matematika dapat digunakan secara efektif dalam layanan linguistik hanya ketika ahli bahasa jelas batas nyata penerapannya, serta kemungkinan model matematika yang digunakan” 9 7 . Dengan kata lain, kita dapat berbicara tentang linguistik matematika ketika metode matematika membuktikan kesesuaiannya untuk memecahkan masalah linguistik yang tepat, yang secara keseluruhan merupakan ilmu bahasa. Jika tidak demikian, meskipun ini dapat membuka aspek baru dari penelitian ilmiah, maka dalam hal ini kita dapat berbicara tentang apa saja, tetapi bukan tentang linguistik - dalam hal ini, yang kami maksud bukan berbagai jenis linguistik terapan (kita akan berbicara tentang itu nanti). pidato di bawah), tetapi ilmiah, atau teoretis, linguistik. Berdasarkan posisi ini, perlu dicatat bahwa dari sudut pandang ahli bahasa, banyak statistik linguistik yang diragukan bahkan membingungkan.

Mari kita beralih ke analisis hanya dua contoh (agar tidak mengacaukan presentasi), menetapkan bahwa keberatan yang sangat signifikan dapat dibuat untuk masing-masing contoh. Di sini kita memiliki perbedaan kuantitatif antara satuan gramatikal dan leksikal. Ternyata untuk membuat perbedaan seperti itu, perlu diketahui terlebih dahulu apa yang termasuk dalam bidang tata bahasa, dan apa yang termasuk dalam kosa kata, karena "beban gramatikal" bahasa (yaitu, totalitas elemen gramatikal). digunakan dalam ucapan), seperti ditunjukkan dalam kutipan di atas, "bergantung pada garis demarkasi yang memisahkan kosa kata dari tata bahasa." Tanpa mengetahui di mana garis ini terletak, oleh karena itu tidak mungkin untuk menarik perbedaan yang ditunjukkan. Lalu apa arti dari metode kuantitatif membedakan leksikal dari tata bahasa?<134>matic? Namun, untuk Herdan, dia tidak terlalu memikirkan masalah ini dan dengan berani mengklasifikasikan elemen linguistik, merujuk pada elemen tata bahasa "bentuk yang terhubung", yang dilihat dari penyajiannya, harus dipahami sebagai infleksi eksternal, dan "kata tata bahasa", yang meliputi preposisi , konjungsi, kata kerja bantu dan kata ganti - yang terakhir berdasarkan fakta bahwa mereka adalah "pengganti". Tetapi jika kita hanya berbicara tentang kualitas kata ganti ini dan atas dasar ini menghubungkannya dengan elemen tata bahasa, maka, jelas, kata-kata seperti "disebutkan sebelumnya", "bernama", "diberikan", dll., Juga harus dikaitkan dengannya, jadi bagaimana mereka juga bertindak sebagai deputi. Sehubungan dengan metode pemisahan elemen tata bahasa yang digunakan dalam statistik linguistik, pertanyaan yang muncul secara alami tentang bagaimana menangani dalam kasus ini dengan fenomena tata bahasa "non-formal" seperti urutan kata, nada, morfem nol, hubungan paradigmatik (beberapa dari fenomena ini , omong-omong, temukan refleksi dalam bahasa-bahasa yang dipelajari dengan metode matematika)? Cara menggambar perbedaan dalam bahasa dengan infleksi internal yang kaya (seperti, misalnya, dalam bahasa Semit), di mana tidak hanya secara tata bahasa mengubah akar (radikal), tetapi juga memberinya keberadaan leksikal, karena akar tanpa permutasi memiliki tidak ada keberadaan nyata dalam bahasa? Apa yang harus dipahami dengan kompleksitas tata bahasa suatu bahasa, dengan kriteria apa yang ditentukan? Jika poin kuantitatif, yang dalam hal ini ditekankan dengan segala cara yang mungkin, maka salah satu bahasa yang paling sulit secara tata bahasa adalah bahasa Inggris, yang memiliki konstruksi seperti Ishallhavebeencalling atau Hewouldhavebeencalling. Dalam kalimat-kalimat ini, hanya panggilan yang dapat diklasifikasikan sebagai leksikal, dan oleh karena itu, yang lainnya harus dianggap tata bahasa. Dasar apa yang ada untuk menghubungkan frekuensi penggunaan unsur-unsur tata bahasa dengan generalitas atau keabstrakan makna kata-kata tata bahasa? Bagaimanapun, cukup jelas bahwa frekuensi penggunaan unsur-unsur tata bahasa yang relatif besar ditentukan oleh fungsinya dalam konstruksi kalimat, dan untuk keabstrakan makna, sangat mudah untuk menemukan yang besar.<135>jumlah elemen leksikal yang dapat dengan mudah bersaing dengan elemen tata bahasa dalam hal ini, sebagian besar lebih rendah dari frekuensinya (misalnya, makhluk, keberadaan, ekstensi, ruang, substansi dll).

Absurditas serupa muncul di hadapan kita dalam kasus definisi dualitas (dualitas) kata dan konsep. Penting untuk memiliki pemahaman yang sangat aneh tentang esensi struktural bahasa untuk menelitinya menggunakan nomenklatur penyakit dan daftar penyakit rumah sakit, yang, seperti ditunjukkan di atas, berfungsi sebagai bahan sumber untuk linguistik yang sangat penting. kesimpulan. Tanpa memikirkan penggunaan istilah-istilah yang sama sekali tidak jelas yang tidak memiliki keberadaan linguistik, seperti bidang, volume, dan isi suatu konsep (omong-omong, makna leksikal dari kata dan konsep yang ditunjukkan oleh istilah ilmiah itu terlalu kasar). bingung), mari kita beralih ke kesimpulan yang dibuat dalam kasus ini. Sebagaimana dinyatakan di atas, kita berurusan dengan pernyataan bahwa "cakupan dan isi saling berkorelasi." Seluruh rangkaian penalaran yang memberikan dasar untuk kesimpulan seperti itu, serta metode operasi matematika dari fakta linguistik, dengan jelas menunjukkan bahwa dalam hal ini satu kualitas bahasa yang sangat esensial diabaikan sama sekali, yang mengganggu semua perhitungan yang sedang dilakukan. : kemampuan untuk mengungkapkan hal yang sama " konten" oleh unit linguistik dari "volume" yang berbeda, yang tidak diragukan lagi memiliki frekuensi penggunaan relatif yang berbeda. Jadi, kami dapat menunjuk orang yang sama dengan Petrov, kenalan saya, dia, seorang Moskow, seorang pemuda, seorang pegawai universitas, saudara laki-laki istri saya, seorang pria yang kami temui di jembatan, dll. tidak diragukan lagi hanya kesimpulan pribadi, yang, bagaimanapun, seperti yang ditunjukkan, signifikansi universal melekat, tetapi juga kelayakan penerapan metode kuantitatif itu sendiri untuk masalah linguistik semacam itu.

Namun terkadang ahli bahasa ditawari kesimpulan yang validitasnya tidak diragukan lagi. Inilah "hukum dasar bahasa", yang terdiri dari fakta bahwa dalam bahasa terdapat stabilitas tertentu dari unsur-unsurnya dan frekuensi relatif penyebutannya.<136>konsumsi. Masalah dengan penemuan semacam ini, bagaimanapun, adalah bahwa mereka telah lama dikenal oleh para ahli bahasa. Lagi pula, sangat jelas bahwa jika bahasa tidak memiliki stabilitas tertentu dan setiap anggota komunitas linguistik tertentu dengan bebas memvariasikan unsur-unsur bahasa, maka komunikasi timbal balik tidak akan mungkin terjadi dan keberadaan bahasa itu sendiri akan menjadi tidak berarti. . Adapun distribusi frekuensi relatif dari penggunaan elemen individu bahasa, ia menemukan ekspresinya dalam linguistik dalam bentuk alokasi kategori kosakata dan tata bahasa pasif dan aktif, yang sangat diperhatikan oleh L. V. Shcherba. Dalam hal ini, metode statistik hanya dapat membantu ahli bahasa dalam mendistribusikan elemen linguistik tertentu sesuai dengan kategori frekuensi relatif penggunaannya, tetapi mereka tidak memiliki alasan untuk mengklaim menemukan pola baru yang bernilai bagi linguistik teoretis.

Di sisi lain, statistik linguistik menawarkan sejumlah kesimpulan yang benar-benar "asli" yang sangat menunjukkan sifat pemikiran ilmiah para penganutnya. Jadi, "kosa kata politik" dalam karya Churchill, Benes, Halifax, Stresemann, dan lainnya dipelajari dengan metode statistik yang kompleks, dan terjemahan karya mereka ke dalam bahasa Inggris digunakan dalam perhitungan untuk penulis yang tidak berbahasa Inggris. Hasil perhitungan disajikan dalam bentuk banyak tabel, rumus matematika dan persamaan. Interpretasi linguistik dari data kuantitatif dalam kasus ini direduksi menjadi fakta bahwa penggunaan "kosakata politik" Churchill adalah yang paling khas (?) untuk kelompok penulis ini dan bahwa penggunaan kata-kata Churchill dalam kasus-kasus di mana dia berurusan dengan masalah politik adalah tipikal. dari kelompok pidato bahasa Inggris.9 8 .

Dalam kasus lain, setelah manipulasi statistik yang tepat, disimpulkan bahwa Hitler melanggar dualitas antara "bahasa" dan "ucapan" dalam pengertian kuantitatif istilah-istilah ini dalam penggunaan Nazi Jerman. Kasus khusus penghancuran dualitas ini adalah pemahaman literal<137>putaran metaforis (misalnya, "tuangkan garam ke luka terbuka"). Nazi Jerman mencap dirinya dengan begitu banyak tindakan tidak manusiawi sehingga hampir tidak perlu untuk menghukumnya atas kekejaman bahasa ini 9 9 . Menurut Kherdan, definisi Marx tentang bahasa sebagai realitas langsung dari pemikiran juga mengarah pada pelanggaran dualitas linguistik, dan hukum dialektika tentang transisi suatu fenomena menjadi kebalikannya, menurut pendapatnya, hukum linguistik yang disalahpahami tentang dualitas. bahasa. Penafsiran seperti itu berbicara sendiri.

Akhirnya, kelemahan umum yang melekat dalam semua kasus di atas dari metode kuantitatif mempelajari materi linguistik dan dengan demikian memperoleh karakter metodologis adalah pendekatan elemen linguistik sebagai seperangkat fakta mekanis yang benar-benar independen satu sama lain, yang sesuai dengan itu, jika ada. atau pola, mereka hanya merujuk pada hubungan numerik dari distribusi fakta otonom, di luar ketergantungan sistemiknya. Benar, J. Watmou mencoba dengan segala cara yang mungkin untuk memastikan bahwa matematikalah yang lebih baik daripada analisis struktural linguistik apa pun, yang mampu mengungkap ciri-ciri struktural suatu bahasa. “Matematika modern,” tulisnya, “tidak berurusan dengan pengukuran dan kalkulus, yang keakuratannya dibatasi oleh sifatnya, tetapi terutama dengan struktur. Inilah sebabnya mengapa matematika sangat kondusif untuk keakuratan pembelajaran bahasa - sejauh deskripsi terpisah, bahkan lebih terbatas sifatnya, tidak mampu ... Sama seperti dalam fisika, elemen matematika digunakan untuk menggambarkan dunia fisik, karena mereka dianggap sesuai dengan unsur-unsur dunia fisik, maka dalam linguistik matematika unsur-unsur matematika dianggap sesuai dengan unsur-unsur dunia bicara” 101 . Tetapi rumusan pertanyaan seperti itu sama sekali tidak menyelamatkan situasi, karena paling-paling bisa<138>memberikan analisis bahasa baik sebagai struktur fisik, yang masih jauh dari cukup untuk bahasa, dan pada akhirnya analisis masih bersifat mekanistik yang sama, atau sebagai struktur logis-matematis, dan ini memindahkan bahasa ke bidang yang berbeda, dan dalam banyak hal asing baginya. Tidaklah berlebihan untuk dicatat bahwa Watmow meramalkan keberhasilan linguistik matematika hanya di masa depan, dan untuk hasil nyata mereka, dia mengevaluasinya dengan kata-kata berikut: “... hampir semua pekerjaan yang dilakukan hingga saat ini oleh Herdan, Zipf, Yul, Giro (Guiraux) dan lainnya, sama sekali tidak berada di luar ruang lingkup kritik baik dari linguistik maupun matematika; dia sangat terkesan amatir” 103 . Jadi, jika kita tidak mencoba untuk memprediksi masa depan metode matematika dalam penelitian linguistik, tetapi mencoba untuk menghargai apa yang kita miliki saat ini, maka kita harus mengakui bahwa matematika sebenarnya telah terbatas pada bidang linguistik hanya untuk “mengukur dan menghitung”. ”, dan saya tidak dapat memberikan analisis kualitatif bahasa tersebut, mempelajari strukturnya.<139>

Mari kita coba seobjektif mungkin. Pada bagian tertentu, data kuantitatif ternyata dapat digunakan oleh linguistik, tetapi hanya sebagai tambahan dan terutama pada masalah yang berorientasi praktis. Berkenaan dengan sebagian besar metode kuantitatif untuk mempelajari fenomena linguistik individu, kesimpulan umum R. Brown tidak diragukan lagi dapat dibenarkan: "Mereka dapat dianggap sebagai Kherdan menganggap mereka, tetapi apa arti dari semua ini?" 104 . Bayangkan kita mengajukan pertanyaan: "Apa saja pohon di taman ini?". Dan sebagai tanggapan kita mendapatkan: "Ada seratus pohon di taman ini." Apakah ini jawaban atas pertanyaan kita, dan apakah itu benar-benar masuk akal? Tetapi sehubungan dengan banyak pertanyaan linguistik, metode matematika hanya memberikan jawaban seperti itu.

Namun, ada bidang kegiatan penelitian yang luas, terutama menggunakan metode matematika dan pada saat yang sama mengarahkannya ke materi linguistik, di mana kelayakan kombinasi semacam itu tidak diragukan lagi. “Makna” dari kegiatan penelitian ini, signifikansinya ditentukan oleh tujuan yang dicita-citakan. Itu sudah diuji dalam praktik. Dalam hal ini, kita berbicara tentang masalah yang terkait dengan pembuatan mesin informasi, struktur untuk terjemahan mesin teks ilmiah tertulis, otomatisasi terjemahan ucapan lisan dari satu bahasa ke bahasa lain, dan dengan berbagai macam tugas yang digabungkan dalam masalah linguistik sibernetika. Seluruh rangkaian masalah seperti itu biasanya diberi nama umum linguistik terapan. Dengan demikian, ini dibedakan dari apa yang disebut linguistik matematika, yang mencakup bidang kerja yang telah ditetapkan di atas sebagai stilostatistik dan statistik linguistik, meskipun sama sekali tidak menghindari pemrosesan statistik materi linguistik. Mungkin ciri linguistik terapan yang paling penting, memisahkannya dari linguistik matematika, seperti diuraikan di atas, adalah bahwa yang pertama memiliki arah yang berlawanan: bukan matematika untuk linguistik, tetapi linguistik.<140>(diformalkan dengan metode matematika) untuk berbagai masalah praktis.

Tidak perlu mengungkapkan isi masalah individu yang sekarang termasuk dalam wilayah linguistik terapan yang sangat luas. Berbeda dengan linguistik matematika, masalah ini secara aktif dibahas dalam literatur linguistik Soviet dan mulai menempati tempat yang semakin menonjol dalam masalah ilmiah lembaga penelitian 105 . Jadi, mereka sudah dikenal oleh komunitas linguistik kita. Namun, keadaan ini tidak membebaskan kita dari kebutuhan untuk merefleksinya, khususnya, dari sudut pandang prinsip-prinsip ilmu bahasa. Ini tidak diragukan lagi akan membantu menghilangkan kesalahpahaman yang semakin sering muncul antara perwakilan ilmu yang sangat jauh satu sama lain dan mengambil bagian dalam pekerjaan pada masalah linguistik terapan, dan akan menguraikan cara konvergensi mereka, di satu sisi. , dan pembatasan bidang penelitian, di sisi lain. Tak perlu dikatakan bahwa pertimbangan berikut akan mewakili sudut pandang ahli bahasa, dan matematikawan perlu tidak hanya mencoba mengasimilasinya, tetapi, sehubungan dengan pertanyaan yang diajukan, berikan interpretasi mereka.

Ahli teori bahasa sama sekali tidak dapat puas dengan fakta bahwa dalam semua kasus<141>bahasa untuk tujuan yang ditetapkan oleh linguistik terapan, dasarnya adalah model matematika. Sejalan dengan itu, pengamatan terhadap fenomena bahasa dan hasil yang diperoleh dengan cara ini diungkapkan dalam istilah dan konsep matematika, yaitu melalui persamaan dan rumus matematika. Mari kita lihat contoh untuk kejelasan. Condon 1 06 dan Zipf 1 07 menetapkan bahwa logaritma frekuensi ( F) kemunculan kata-kata dalam teks besar terletak hampir dalam garis lurus, jika dikorelasikan dalam diagram dengan logaritma pangkat atau pangkat ( R) dari kata-kata ini. Persamaan f=c:r, Di mana Dengan adalah konstanta mencerminkan hubungan ini dalam arti terbatas itu c:r untuk nilai yang ditetapkan R mereproduksi frekuensi yang diamati dengan perkiraan yang bagus. Hubungan antara F Dan R, diungkapkan oleh rumus matematika, adalah model hubungan antara nilai yang diamati dari frekuensi penggunaan dan peringkat, atau peringkat, kata-kata. Ini adalah salah satu kasus pemodelan matematika. 

Seluruh teori informasi seluruhnya didasarkan pada model matematis dari proses komunikasi yang dikembangkan oleh C. Shannon 108 . Ini didefinisikan sebagai "suatu disiplin matematika yang dikhususkan untuk metode menghitung dan memperkirakan jumlah informasi yang terkandung dalam data apa pun, dan studi tentang proses penyimpanan dan pengiriman informasi" (TSB, vol. 51, hal. 128). Dengan demikian, konsep dasar teori informasi menerima ekspresi matematis Informasi diukur dalam binit atau unit biner (kode yang bahasanya disamakan, dengan dua sinyal bersyarat yang sama-sama mungkin mentransmisikan satu unit informasi biner selama transmisi setiap simbol ).-baik kode dan jumlah rata-rata informasi yang dikirimkan<142>formasi. Redundansi dinyatakan sebagai persentase dari total kemampuan mentransmisikan kode”, 1 09 dst. Dengan cara yang sama, terjemahan mesin membutuhkan pengembangan algoritme untuk menampilkan elemen dari satu bahasa ke bahasa lain, dst. 1 10 . Ini adalah kasus pemodelan lainnya.

Penggunaan model tanpa makna dapat menjadi bantuan yang sangat signifikan, khususnya, kemungkinan besar, dalam memecahkan masalah yang ditetapkan oleh linguistik terapan itu sendiri. Namun, untuk linguistik teoretis, sangat penting bahwa model abstrak, sebagai suatu peraturan, tidak mereproduksi semua fitur dari fenomena nyata, semua kualitas fungsionalnya. Jadi, seorang arsitek, sebelum membangun rumah, dapat membuat modelnya sendiri, yang mereproduksi rumah yang dirancang dengan detail terkecil, dan ini membantunya memecahkan sejumlah masalah praktis terkait pembangunan rumah itu sendiri. Tetapi model rumah seperti itu, betapapun akuratnya, tidak memiliki "fungsi" itu dan tujuan semua rumah dibangun secara umum - tidak mampu menyediakan perumahan bagi seseorang. Situasinya mirip dengan bahasa, di mana model tidak selalu mampu mereproduksi semua kualitasnya. Dalam hal ini, masalahnya semakin diperumit oleh fakta bahwa bukan linguistik, tetapi kriteria matematis yang digunakan untuk membangun model. “Model matematika ... - tulis A. Ettinger, - memainkan peran yang sangat penting dalam semua bidang teknologi, tetapi karena model tersebut adalah alat sintesis, signifikansinya untuk linguistik, yang terutama merupakan disiplin sejarah dan deskriptif, secara alami terbatas ” 1 11 .<143>

Pemodelan matematika suatu bahasa sebenarnya hanya dapat diterapkan pada keadaan statisnya, yang bersyarat bagi seorang ahli bahasa dan pada kenyataannya bertentangan langsung dengan kualitas dasar suatu bahasa, yang bentuk keberadaannya adalah pengembangan. Tak perlu dikatakan bahwa studi statis suatu bahasa sama sekali tidak dikecualikan dari linguistik dan merupakan dasar untuk menyusun tata bahasa dan kamus normatif, tata bahasa deskriptif, tata bahasa praktis dan kamus yang berfungsi sebagai panduan untuk studi praktis bahasa asing, dll. Namun, dalam semua karya semacam itu, yang sebagian besar diterapkan di alam, para ahli bahasa secara sadar membatasi bidang penelitian dan sama sekali tidak menutup mata terhadap aspek lain dari bahasa 1 12 . Dengan pemeriksaan statis terhadap bahasa, khususnya, kualitas bahasa yang terkait dengan sifatnya yang dinamis, seperti produktivitas, ketergantungan pada bentuk pemikiran, dan interaksi yang luas dengan faktor budaya, sosial, politik, sejarah, dan lainnya, benar-benar hilang dari bidang pandang peneliti. Hanya pada bidang sinkronis bahasa dapat dianggap sebagai sistem tanda atau kode konvensional, yang, bagaimanapun, ternyata sepenuhnya tidak dapat dibenarkan segera setelah kita mengadopsi sudut pandang dinamis yang lebih cocok untuk bahasa. Dalam proses perkembangan itulah kualitas bahasa seperti motivasi, polisemi kata yang tidak memiliki batas yang stabil, non-otonomi makna kata dan cangkang bunyinya, dan potensi kreatif kata yang terkait dengan konteksnya. terwujud, dan semua ini sangat bertentangan dengan ciri utama kode atau tanda 1 13 . Jelas, dalam linguistik terapan, seseorang juga dapat memikirkan semua kualitas bahasa ini dan, untuk tujuan praktis, puas dengan, boleh dikatakan, "potret" bahasa tersebut, yang masih mampu memberikan gambaran yang cukup mendekati tentang mekanisme fungsinya.<144>nirovaniya. Namun, setiap "snapshot", jika dianggap sebagai fakta bahasa, dan bukan sebagai fakta sistem kode konvensional, harus dimasukkan dalam proses pergerakan tanpa akhir di mana bahasa selalu ada 1 14 . Itu tidak dapat dipelajari di luar kondisi khusus yang menjadi ciri gerakan ini, yang meninggalkan jejaknya pada keadaan bahasa tertentu dan menentukan potensi perkembangannya lebih lanjut. Di sini ada perbedaan yang sama antara foto sesaat seseorang dan potretnya yang dilukis dengan kuas dari seorang seniman sejati. Dalam karya seniman, di hadapan kita ada gambaran umum tentang seseorang dalam semua orisinalitas tidak hanya penampilan fisiknya, tetapi juga konten spiritual batinnya. Dari potret artistik, kita juga bisa membaca masa lalu orang yang tergambar di dalamnya dan menentukan kemampuannya dalam tindakannya. Dan snapshot, meskipun mampu memberikan gambaran yang lebih akurat tentang penampilan aslinya, tidak memiliki kualitas ini dan sering kali menangkap jerawat yang tidak disengaja yang muncul di hidung dan<145>pose atau ekspresi yang sama sekali tidak seperti biasanya, yang pada akhirnya mengarah pada distorsi dari aslinya.

Perlu dicatat bahwa metode "snapshot" tentu saja dapat diterapkan pada fakta perkembangan bahasa. Tetapi dalam kasus ini, kita sebenarnya hanya akan berurusan dengan keadaan bahasa yang terpisah, yang, dalam karakterisasi kuantitatifnya, ternyata tidak lebih dari karakterisasi kuantitatif komparatif dari bahasa yang berbeda. "Dinamika" kuantitatif semacam ini tidak akan mengandung apa pun yang organik, dan hubungan antara masing-masing negara bagian bahasa hanya akan bertumpu pada perbandingan hubungan numerik. Jika dalam hal ini juga menggunakan analogi, maka kita bisa mengacu pada pertumbuhan anak. Perkembangannya tentu saja dapat direpresentasikan dalam bentuk dinamika data numerik tentang berat badan, tinggi badan, perubahan rasio volume bagian-bagian tubuhnya, namun semua data tersebut sama sekali terlepas dari segala sesuatu yang terutama merupakan esensi individu. seseorang - karakternya, kecenderungannya, kebiasaannya. , rasa, dll.

Sisi negatif lain dari "pemodelan" matematika bahasa adalah kenyataan bahwa ia tidak dapat berfungsi sebagai prinsip umum yang menjadi dasar yang memungkinkan untuk melakukan deskripsi bahasa yang komprehensif dan komprehensif - sistematis. Hanya pendekatan matematis terhadap fenomena bahasa, misalnya, tidak akan memungkinkan untuk menjawab bahkan pertanyaan mendasar seperti itu (tanpanya keberadaan ilmu bahasa tidak terpikirkan), seperti: apa itu bahasa, fenomena apa yang seharusnya diklasifikasikan sebagai linguistik yang tepat, bagaimana suatu kata atau kalimat didefinisikan, apa konsep dasar dan kategori bahasa, dll. Sebelum beralih ke metode matematika mempelajari bahasa, perlu sudah memiliki jawaban (bahkan dalam bentuk kerja hipotesis) untuk semua pertanyaan ini sebelumnya. Tidak perlu menutup mata terhadap fakta bahwa dalam semua kasus yang kita ketahui tentang studi fenomena linguistik dengan metode matematika, semua konsep dan kategori ini mau tidak mau harus diterima sebagaimana didefinisikan oleh tradisional atau, secara relatif, metode kualitatif.

Fitur metode matematika dalam aplikasi linguistik mereka dicatat oleh Spang-Hanssen ketika pi<146>sal: “Perlu diingat bahwa fakta-fakta yang diamati yang menerima ekspresi kuantitatif ... tidak memiliki nilai jika tidak menjadi bagian dari deskripsi, dan untuk tujuan linguistik itu harus merupakan deskripsi sistematis, terkait erat dengan linguistik kualitatif deskripsi dan teori” 1 15 . Dalam pidato lain oleh Spang-Hanssen, kami menemukan klarifikasi dari gagasan ini: “Sampai kemungkinan membangun sistem kuantitatif terbukti, dan selama ada sistem kualitatif yang diterima secara umum untuk bidang studi tertentu, perhitungan frekuensi dan lainnya karakteristik numerik dari sudut pandang linguistik visi tidak masuk akal" 1 16 . Gagasan serupa diungkapkan oleh Uldall, yang agak tidak terduga menghubungkannya dengan pengembangan landasan teoretis umum glosematik: “Ketika seorang ahli bahasa mempertimbangkan atau mengukur segala sesuatu yang dia pertimbangkan dan ukur, itu sendiri tidak ditentukan secara kuantitatif; misalnya, kata-kata, ketika dihitung, didefinisikan, jika didefinisikan sama sekali, dalam istilah yang sangat berbeda.<147>

Dengan demikian, ternyata baik dalam istilah teoretis maupun dalam penerapan praktisnya, metode matematika secara langsung bergantung pada konsep dan kategori linguistik yang didefinisikan oleh metode tradisional, filologis, atau, sebagaimana disebutkan di atas, metode kualitatif. Dalam istilah linguistik terapan, penting untuk menyadari ketergantungan ini, dan akibatnya, mengenal totalitas kategori utama linguistik tradisional.

Benar, tidak ada alasan untuk mencela perwakilan ilmu eksakta yang bekerja di bidang linguistik terapan karena tidak menggunakan data linguistik modern. Ini tidak sesuai dengan keadaan sebenarnya. Mereka tidak hanya mengetahui dengan sangat baik, tetapi juga secara luas menggunakan sistem fitur diferensial yang ditetapkan oleh ahli bahasa yang merupakan karakteristik bahasa yang berbeda, distribusi dan pengaturan elemen linguistik dalam sistem bahasa tertentu, pencapaian fonetik akustik, dll. Tetapi dalam hal ini diperlukan reservasi yang sangat signifikan. . Faktanya, perwakilan ilmu eksakta menggunakan data hanya satu arah dalam linguistik - yang disebut linguistik deskriptif, yang dengan sengaja membedakan dirinya dari masalah tradisional linguistik teoretis, jauh dari mencakup seluruh bidang penelitian linguistik, dari yang tepat. Dari sudut pandang linguistik, ia memiliki kekurangan metodologis yang signifikan, yang menyebabkan krisis yang baru terungkap 1 18 , dan, terlebih lagi, memiliki orientasi praktis murni, sesuai dengan kepentingan linguistik terapan. Semua reservasi dan celaan yang dibuat di atas terhadap pertimbangan statis bahasa berlaku untuk linguistik deskriptif. Pendekatan linguistik deskriptif sepihak seperti itu dapat dilakukan oleh penyelidik<148>Namun, hal itu dapat dibenarkan hanya dengan tugas-tugas yang ditetapkan oleh linguistik terapan itu sendiri, tetapi jauh dari menghabiskan seluruh isi ilmu bahasa.

Dalam proses mengembangkan pertanyaan linguistik terapan, masalah teoretis baru mungkin muncul, dan sebenarnya sudah muncul. Beberapa masalah ini terkait erat dengan tugas spesifik linguistik terapan dan ditujukan untuk mengatasi kesulitan yang muncul dalam menyelesaikan masalah tersebut. Masalah lain terkait langsung dengan linguistik teoretis, memungkinkan perspektif baru tentang ide-ide tradisional atau membuka bidang baru penelitian linguistik, konsep dan teori baru. Di antara yang terakhir ini, misalnya, adalah masalah menciptakan bahasa "mesin" (atau bahasa perantara), yang paling erat kaitannya dengan serangkaian masalah kardinal linguistik teoretis yang kompleks seperti hubungan konsep dan makna leksikal, logika dan tata bahasa, diakroni dan sinkroni, sifat tanda bahasa, esensi makna linguistik, prinsip-prinsip membangun bahasa buatan, dll. 1 19 . Dalam hal ini, sangat penting untuk membangun saling pengertian dan persemakmuran dalam pekerjaan bersama perwakilan disiplin linguistik dan ilmu eksakta. Adapun sisi linguistik, dalam hal ini, tampaknya, kita tidak boleh berbicara tentang membatasi upaya, misalnya, perancang mesin terjemahan terlebih dahulu” dan mencoba menetapkan kemampuan kerja mesin tersebut dengan ayat-ayat N. Gribachev atau prosa V. Kochetov 1 20 . Mesin itu sendiri akan menemukan batas kemampuannya, dan profitabilitas - batas penggunaannya. Tetapi ahli bahasa, sebagai kontribusi mereka pada tujuan bersama, harus membawa pengetahuan mereka tentang ciri-ciri struktur bahasa, keserbagunaannya, hubungan perpotongan internal unsur-unsurnya, serta hubungan bahasa yang luas dan multilateral dengan fisik, fisiologis. , mental dan logis<149>fenomena mi, pola spesifik fungsi dan perkembangan bahasa. Totalitas pengetahuan ini diperlukan bagi para perancang mesin yang sesuai agar tidak berkeliaran ke arah yang salah, tetapi untuk membuat pencarian terarah dan berorientasi dengan jelas. Bahkan ulasan yang sangat singkat tentang kasus penerapan metode matematika untuk masalah linguistik, yang dibuat dalam esai ini, meyakinkan bahwa pengetahuan semacam itu tidak akan berlebihan bagi perwakilan ilmu eksakta.

Atas dasar semua pertimbangan di atas, seseorang jelas dapat sampai pada beberapa kesimpulan umum.

Jadi, linguistik matematika? Jika ini berarti penggunaan metode matematika sebagai kunci utama universal untuk menyelesaikan semua masalah linguistik, maka klaim semacam itu harus diakui sama sekali tidak dapat dibenarkan. Segala sesuatu yang telah dilakukan ke arah ini sejauh ini hanya sedikit atau bahkan tidak menyelesaikan masalah tradisional ilmu bahasa. Paling buruk, penerapan metode matematika disertai dengan absurditas yang jelas atau, dari sudut pandang linguistik, sama sekali tidak berarti. Paling-paling, metode matematika dapat digunakan sebagai metode tambahan penelitian linguistik, ditempatkan untuk melayani masalah linguistik yang spesifik dan terbatas. Tidak ada pertanyaan tentang "filsafat kuantitatif bahasa" dalam kasus ini. Fisika, psikologi, fisiologi, logika, sosiologi, dan etnologi pada masanya melanggar kemerdekaan ilmu bahasa, tetapi mereka tidak dapat menaklukkan linguistik. Kebalikannya terjadi - linguistik memanfaatkan pencapaian ilmu-ilmu ini dan, sejauh yang diperlukan untuk dirinya sendiri, mulai menggunakan bantuan mereka, dengan demikian memperkaya gudang metode penelitiannya. Sekarang, tampaknya, giliran matematika. Diharapkan komunitas baru ini juga akan berkontribusi pada penguatan ilmu bahasa, perbaikan metode kerjanya, dan peningkatan keragamannya. Oleh karena itu, berbicara tentang linguistik matematika sama sahnya dengan linguistik fisik, linguistik fisiologis, linguistik logis, linguistik psikologis, dan linguistik psikologis.<150>dll. Tidak ada linguistik seperti itu, hanya ada satu linguistik yang secara menguntungkan menggunakan data ilmu lain sebagai alat penelitian tambahan. Dengan demikian, tidak ada alasan untuk mundur sebelum serangan ilmu baru dan dengan mudah menyerah pada posisi yang telah dimenangkannya. Di sini sangat tepat untuk mengingat kata-kata A. Martinet: “Mungkin tergoda untuk bergabung dengan satu atau gerakan pemikiran besar lainnya dengan menggunakan beberapa istilah yang dipilih dengan baik, atau untuk menyatakan dengan beberapa rumus matematika kekakuan penalaran seseorang. Namun, saatnya telah tiba bagi para ahli bahasa untuk menyadari kemandirian sains mereka dan membebaskan diri dari kompleks inferioritas yang membuat mereka mengasosiasikan tindakan mereka dengan satu atau beberapa prinsip ilmiah umum, akibatnya kontur realitas selalu menjadi hanya semakin kabur, bukannya semakin jelas.

Oleh karena itu, matematika itu sendiri dan linguistik itu sendiri. Ini sama sekali tidak mengecualikan bantuan timbal balik mereka atau pertemuan persahabatan dalam kerja bersama tentang masalah bersama. Tempat penerapan upaya bersama dari kedua ilmu semacam ini adalah seluruh rangkaian masalah yang merupakan bagian dari linguistik terapan dan memiliki signifikansi ekonomi nasional yang besar. Seseorang seharusnya hanya berharap bahwa dalam kerja bersama mereka, kedua ilmu menunjukkan saling pengertian yang maksimal, yang, tidak diragukan lagi, juga akan berkontribusi pada hasil maksimal dari kerja sama mereka.<151>

Berapa biaya untuk menulis makalah Anda?

Pilih jenis pekerjaan Tesis (sarjana / spesialis) Bagian dari tesis Diploma master Kursus dengan praktik Teori kursus Esai Tugas ujian Esai Pekerjaan pengesahan (VAR / WQR) Rencana bisnis Pertanyaan ujian Diploma MBA Tesis (perguruan tinggi / sekolah teknik) Kasus lain Pekerjaan laboratorium , RGR On-line help Laporan latihan Pencarian informasi Presentasi dalam PowerPoint Abstrak Pascasarjana Materi pelengkap diploma Artikel Gambar Ujian selengkapnya »

Terima kasih, email telah dikirimkan kepada Anda. Periksa surat Anda.

Apakah Anda ingin kode promo diskon 15%?

Terima SMS
dengan kode promo

Berhasil!

?Beri tahu kode promo selama percakapan dengan pengelola.
Kode promo hanya dapat digunakan satu kali pada pesanan pertama Anda.
Jenis kode promosi - " pekerjaan lulusan".

Interaksi matematika dan linguistik


Perkenalan

Bab 1. Sejarah penerapan metode matematika dalam linguistik

1.1. Pembentukan Linguistik Struktural pada Pergantian Abad 19-20

1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Bab 2. Contoh penggunaan matematika dalam linguistik

2.1. Terjemahan mesin

2.2.Metode statistik dalam pembelajaran bahasa

2.3. Belajar bahasa dengan metode logika formal

2.4. Prospek penerapan metode matematika dalam linguistik

Kesimpulan

literatur

Lampiran 1. Ronald Schleifer. Ferdinan de Saussure

Lampiran 2. Ferdinand de Saussure (terjemahan)

Perkenalan


Pada abad ke-20, telah terjadi kecenderungan yang berkelanjutan terhadap interaksi dan interpenetrasi berbagai bidang ilmu pengetahuan. Batas-batas antara ilmu-ilmu individual secara bertahap kabur; semakin banyak cabang aktivitas mental yang "berada di persimpangan" pengetahuan kemanusiaan, teknis, dan ilmu alam.

Ciri lain yang jelas dari modernitas adalah keinginan untuk mempelajari struktur dan elemen penyusunnya. Oleh karena itu, semakin banyak tempat, baik dalam teori ilmiah maupun dalam praktik, diberikan kepada matematika. Bersentuhan, di satu sisi, dengan logika dan filsafat, di sisi lain, dengan statistik (dan, akibatnya, dengan ilmu sosial), matematika menembus semakin dalam ke bidang-bidang yang sejak lama dianggap murni. "kemanusiaan", memperluas potensi heuristik mereka (jawaban atas pertanyaan "berapa banyak" akan sering membantu menjawab pertanyaan "apa" dan "bagaimana"). Linguistik tidak terkecuali.

Tujuan dari kursus saya adalah untuk menyoroti secara singkat hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat alat teoretis untuk mendeskripsikan struktur bahasa (baik alami maupun buatan). Namun, harus dikatakan bahwa itu tidak segera menemukan aplikasi praktis untuk dirinya sendiri. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun dengan perkembangan teknologi komputer, premis teoretis semacam itu mulai menemukan penerapannya dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan bahasa yang baru secara fundamental. Para ahli bahasa menghadapi pertanyaan: bagaimana belajar merepresentasikan pola linguistik dalam bentuk yang dapat diterapkan langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, merujuk pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan beberapa tahun terakhir percaya bahwa ungkapan itu sendiri tidak dapat diangkat ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa. . Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan Ferdinand de Saussure, seorang ahli bahasa terkemuka di awal abad ke-20 (saya akan menceritakan tentang pengaruhnya terhadap perkembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan kepemilikannya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").

Interaksi matematika dan linguistik adalah topik yang memiliki banyak segi, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.

Bab I. Sejarah Penerapan Metode Matematika dalam Linguistik


1.1 Pembentukan linguistik struktural pada pergantian abad XIX - XX


Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang kembali ke ahli bahasa Swiss terkenal di awal abad ke-20, Ferdinand de Saussure.

Tautan awal dari konsepnya adalah teori bahasa sebagai suatu sistem yang terdiri dari tiga bagian (bahasa itu sendiri - bahasa, ucapan - parole, dan aktivitas bicara - bahasa), di mana setiap kata (anggota sistem) dianggap tidak dengan sendirinya. , tetapi sehubungan dengan anggota lain. Sebagai ahli bahasa terkemuka lainnya, Dane Louis Hjelmslev, kemudian mencatat, Saussure "adalah orang pertama yang menuntut pendekatan struktural terhadap bahasa, yaitu deskripsi ilmiah bahasa dengan merekam hubungan antar unit."

Memahami bahasa sebagai struktur hierarkis, Saussure adalah orang pertama yang mengajukan masalah nilai dan pentingnya unit linguistik. Fenomena dan peristiwa terpisah (katakanlah, sejarah asal mula kata-kata Indo-Eropa individu) harus dipelajari bukan dengan sendirinya, tetapi dalam suatu sistem yang berkorelasi dengan komponen serupa.

Unit struktural bahasa Saussure menganggap kata, "tanda", di mana bunyi dan makna digabungkan. Tak satu pun dari elemen-elemen ini ada tanpa satu sama lain: oleh karena itu, penutur asli memahami berbagai corak makna kata polisemantik sebagai elemen terpisah dalam keseluruhan struktural, dalam bahasa.

Jadi, dalam teori F. de Saussure orang dapat melihat interaksi linguistik, di satu sisi, dengan sosiologi dan psikologi sosial (perlu dicatat bahwa pada saat yang sama fenomenologi Husserl, psikoanalisis Freud, teori relativitas Einstein sedang berkembang. , eksperimen berlangsung pada bentuk dan konten dalam sastra, musik, dan seni rupa), di sisi lain, dengan matematika (konsep konsistensi sesuai dengan konsep aljabar bahasa). Konsep seperti itu mengubah konsep interpretasi linguistik seperti itu: Fenomena mulai ditafsirkan bukan dalam kaitannya dengan penyebab kemunculannya, tetapi dalam kaitannya dengan masa kini dan masa depan. Interpretasi tidak lagi terlepas dari niat seseorang (terlepas dari kenyataan bahwa niat mungkin impersonal, "tidak sadar" dalam arti kata Freudian).

Fungsi mekanisme linguistik dimanifestasikan melalui aktivitas bicara penutur asli. Hasil ucapan adalah apa yang disebut "teks yang benar" - urutan unit ucapan yang mengikuti pola tertentu, banyak di antaranya memungkinkan deskripsi matematis. Teori cara mendeskripsikan struktur sintaksis berkaitan dengan studi tentang metode deskripsi matematis dari teks yang benar (terutama kalimat). Dalam struktur seperti itu, analogi linguistik didefinisikan bukan dengan bantuan kualitas bawaannya, tetapi dengan bantuan hubungan sistem ("struktural").

Di Barat, ide-ide Saussure dikembangkan oleh orang-orang muda sezaman dari ahli bahasa Swiss yang hebat: di Denmark - L. Hjelmslev, yang telah saya sebutkan, yang memunculkan teori bahasa aljabar dalam karyanya "Fundamentals of Linguistic Theory", di AS - E. Sapir, L. Bloomfield, C. Harris, di Republik Ceko - ilmuwan-emigran Rusia N. Trubetskoy.

Keteraturan statistik dalam studi bahasa mulai ditangani tidak lain oleh pendiri genetika, Georg Mendel. Baru pada tahun 1968 para ahli filologi menemukan bahwa, pada tahun-tahun terakhir hidupnya, dia terpesona oleh studi fenomena linguistik dengan menggunakan metode matematika. Mendel membawa metode ini ke linguistik dari biologi; pada 1990-an, hanya ahli bahasa dan biologi paling berani yang mengklaim kelayakan analisis semacam itu. Di arsip biara St. Tomasz di Brno, yang kepala biaranya adalah Mendel, ditemukan lembaran dengan kolom nama belakang yang diakhiri dengan "mann", "bauer", "mayer", dan dengan beberapa pecahan dan perhitungan. Dalam upaya untuk menemukan hukum formal asal usul nama keluarga, Mendel membuat perhitungan yang rumit, di mana ia memperhitungkan jumlah vokal dan konsonan dalam bahasa Jerman, jumlah kata yang dianggapnya, jumlah nama keluarga, dll.

Di negara kita, linguistik struktural mulai berkembang pada waktu yang hampir bersamaan dengan di Barat - pada pergantian abad ke-19 hingga ke-20. Bersamaan dengan F. de Saussure, konsep bahasa sebagai suatu sistem dikembangkan dalam karyanya oleh profesor Universitas Kazan F.F. Fortunatov dan I.A. Baudouin de Courtenay. Yang terakhir berkorespondensi untuk waktu yang lama dengan de Saussure, masing-masing, sekolah linguistik Jenewa dan Kazan berkolaborasi satu sama lain. Jika Saussure dapat disebut sebagai ideolog metode "tepat" dalam linguistik, maka Baudouin de Courtenay meletakkan dasar praktis untuk penerapannya. Dia adalah orang pertama yang memisahkan linguistik (sebagai ilmu pasti yang menggunakan metode statistik dan ketergantungan fungsional) dari filologi (komunitas disiplin kemanusiaan yang mempelajari budaya spiritual melalui bahasa dan ucapan). Ilmuwan itu sendiri percaya bahwa "linguistik dapat berguna dalam waktu dekat, hanya dibebaskan dari persatuan wajib dengan filologi dan sejarah sastra" . Fonologi menjadi "tempat pengujian" untuk pengenalan metode matematika ke dalam linguistik - terdengar sebagai "atom" dari sistem bahasa, yang memiliki sejumlah sifat yang mudah diukur, adalah bahan yang paling nyaman untuk metode deskripsi yang formal dan ketat. Fonologi menyangkal keberadaan makna dalam bunyi, sehingga faktor "manusia" dihilangkan dalam kajian. Dalam pengertian ini, fonem seperti objek fisik atau biologis.

Fonem, sebagai elemen linguistik terkecil yang dapat diterima untuk persepsi, mewakili bidang yang terpisah, "realitas fenomenologis" yang terpisah. Misalnya, dalam bahasa Inggris, bunyi "t" dapat diucapkan secara berbeda, tetapi dalam semua kasus, orang yang berbicara bahasa Inggris akan menganggapnya sebagai "t". Hal utama adalah bahwa fonem akan menjalankan fungsi utamanya - bermakna -. Selain itu, perbedaan antar bahasa sedemikian rupa sehingga variasi satu bunyi dalam satu bahasa dapat sesuai dengan fonem yang berbeda di bahasa lain; misalnya, "l" dan "r" dalam bahasa Inggris berbeda, sedangkan dalam bahasa lain keduanya adalah varietas dari fonem yang sama (seperti bahasa Inggris "t", diucapkan dengan atau tanpa aspirasi). Kosakata yang luas dari bahasa alami apa pun adalah sekumpulan kombinasi dari jumlah fonem yang jauh lebih kecil. Dalam bahasa Inggris, misalnya, hanya 40 fonem yang digunakan untuk mengucapkan dan menulis sekitar satu juta kata.

Bunyi bahasa adalah seperangkat fitur yang diatur secara sistematis. Pada 1920-an-1930-an, mengikuti Saussure, Jacobson dan N.S. Trubetskoy memilih "ciri khas" fonem. Ciri-ciri ini didasarkan pada struktur organ bicara - lidah, gigi, pita suara. Misalnya, dalam bahasa Inggris perbedaan antara "t" dan "d" adalah ada tidaknya "suara" (ketegangan pita suara) dan tingkat suara yang membedakan satu fonem dari fonem lainnya. Dengan demikian, fonologi dapat dianggap sebagai contoh aturan bahasa umum yang dijelaskan oleh Saussure: "Hanya ada perbedaan dalam bahasa". Yang lebih penting bukanlah ini: perbedaan biasanya menyiratkan kondisi yang tepat di mana ia berada; tetapi dalam bahasa hanya ada perbedaan tanpa syarat yang tepat. Apakah kita sedang mempertimbangkan "penunjukan" atau "petanda" - dalam bahasa tidak ada konsep atau suara yang akan ada sebelum pengembangan sistem bahasa.

Jadi, dalam linguistik Saussurean, fenomena yang dipelajari dipahami sebagai sekumpulan perbandingan dan pertentangan bahasa. Bahasa adalah ekspresi makna kata dan alat komunikasi, dan kedua fungsi ini tidak pernah bersamaan. Kita dapat melihat pergantian bentuk dan isi: kontras linguistik menentukan unit strukturalnya, dan unit-unit ini berinteraksi untuk menciptakan konten bermakna tertentu. Karena unsur-unsur bahasa bersifat acak, baik kontras maupun kombinasi tidak dapat menjadi dasarnya. Artinya, dalam suatu bahasa, ciri-ciri khas membentuk kontras fonetik pada tingkat pemahaman yang berbeda, fonem digabungkan menjadi morfem, morfem menjadi kata, kata menjadi kalimat, dll. Bagaimanapun, seluruh fonem, kata, kalimat, dll. lebih dari sekedar penjumlahan dari bagian-bagiannya.

Saussure mengusulkan gagasan ilmu baru abad kedua puluh, terpisah dari linguistik, mempelajari peran tanda dalam masyarakat. Saussure menyebut sains ini semiologi (dari bahasa Yunani "semeon" - tanda). "Ilmu" semiotika, yang berkembang di Eropa Timur pada 1920-an-1930-an dan di Paris pada 1950-an-1960-an, memperluas studi bahasa dan struktur linguistik menjadi temuan sastra yang disusun (atau diartikulasikan) dalam kerangka struktur tersebut. Selain itu, di masa senja karirnya, sejalan dengan kursusnya di bidang linguistik umum, Saussure terlibat dalam analisis "semiotik" puisi Romawi akhir, mencoba menemukan anagram yang sengaja disusun dari nama diri. Metode ini dalam banyak hal merupakan kebalikan dari rasionalisme dalam analisis linguistiknya: ini adalah upaya untuk mempelajari masalah "probabilitas" dalam bahasa dalam suatu sistem. Penelitian semacam itu membantu memusatkan perhatian pada "sisi nyata" dari probabilitas; "kata kunci" yang dicari anagramnya oleh Saussure, menurut Jean Starobinsky, "alat bagi penyair, bukan sumber kehidupan puisi." Puisi itu berfungsi untuk menukar bunyi kata kunci. Menurut Starobinsky, dalam analisis ini, "Saussure tidak menyelidiki pencarian makna tersembunyi." Sebaliknya, dalam karya-karyanya, terlihat keinginan untuk menghindari pertanyaan yang berkaitan dengan kesadaran: “karena puisi diekspresikan tidak hanya dengan kata-kata, tetapi juga dalam apa yang ditimbulkan oleh kata-kata ini, ia melampaui kendali kesadaran dan hanya bergantung pada hukum bahasa” (lihat . Lampiran 1).

Upaya Saussure untuk mempelajari nama yang tepat dalam puisi Romawi akhir menekankan salah satu komponen analisis linguistiknya - sifat tanda yang sewenang-wenang, serta esensi formal linguistik Saussure, yang mengecualikan kemungkinan menganalisis makna. Todorov menyimpulkan bahwa saat ini karya-karya Saussure tampaknya sangat konsisten dalam keengganannya untuk mempelajari simbol-simbol fenomena yang memiliki makna yang jelas [Lampiran 1]. Menjelajahi anagram, Saussure hanya memperhatikan pengulangan, tetapi tidak pada opsi sebelumnya. . . . Mempelajari Nibelungenlied, dia mendefinisikan simbol hanya untuk menetapkannya ke pembacaan yang salah: jika tidak disengaja, simbol itu tidak ada. Lagi pula, dalam tulisannya tentang linguistik umum, ia membuat asumsi tentang keberadaan semiologi yang tidak hanya menggambarkan tanda-tanda linguistik; tetapi asumsi ini dibatasi oleh fakta bahwa semiologi hanya dapat menjelaskan tanda-tanda yang acak dan arbitrer.

Jika memang demikian, itu hanya karena dia tidak dapat membayangkan "niat" tanpa objek; dia tidak bisa sepenuhnya menjembatani kesenjangan antara bentuk dan isi - dalam tulisannya hal ini berubah menjadi sebuah pertanyaan. Sebaliknya, dia beralih ke "legitimasi linguistik". Antara, di satu sisi, konsep abad ke-19 berdasarkan sejarah dan dugaan subyektif, dan metode interpretasi acak berdasarkan konsep-konsep ini, dan, di sisi lain, konsep strukturalis yang menghapus pertentangan antara bentuk dan isi (subjek dan objek), makna dan asal mula dalam strukturalisme, psikoanalisis, dan bahkan mekanika kuantum, tulisan Ferdinand de Saussure tentang linguistik dan semiotika menandai titik balik dalam studi tentang makna dalam bahasa dan budaya.

Ilmuwan Rusia juga diwakili di Kongres Ahli Bahasa Internasional Pertama di Den Haag pada tahun 1928. S. Kartsevsky, R. Yakobson, dan N. Trubetskoy membuat laporan yang meneliti struktur hierarki bahasa - dalam semangat gagasan paling modern di awal abad terakhir. Jakobson dalam tulisannya mengembangkan gagasan Saussure bahwa unsur-unsur dasar suatu bahasa harus dipelajari, pertama-tama, sehubungan dengan fungsinya, dan bukan dengan alasan kemunculannya.

Sayangnya, setelah Stalin berkuasa pada tahun 1924, linguistik Rusia, seperti banyak ilmu lainnya, terlempar kembali. Banyak ilmuwan berbakat terpaksa beremigrasi, diusir dari negara atau meninggal di kamp. Baru pada pertengahan 1950-an pluralisme teori tertentu menjadi mungkin—lebih lanjut tentang itu di Bagian 1.2.


1.2 Penerapan metode matematika dalam linguistik pada paruh kedua abad ke-20


Pada pertengahan abad ke-20, empat aliran linguistik dunia telah terbentuk, yang masing-masing ternyata merupakan nenek moyang dari metode "tepat" tertentu. Sekolah fonologi Leningrad (nenek moyangnya adalah murid Baudouin de Courtenay L.V. Shcherba) menggunakan eksperimen psikolinguistik berdasarkan analisis tuturan penutur asli sebagai kriteria utama untuk menggeneralisasi bunyi dalam bentuk fonem.

Para ilmuwan dari Lingkaran Linguistik Praha, khususnya, pendirinya N.S. Trubetskoy, yang beremigrasi dari Rusia, mengembangkan teori oposisi - struktur semantik bahasa tersebut dijelaskan oleh mereka sebagai sekumpulan unit semantik yang dibangun secara berlawanan - Sem. Teori ini diterapkan dalam studi tidak hanya bahasa, tetapi juga budaya artistik.

Ideologis deskriptivisme Amerika adalah ahli bahasa L. Bloomfield dan E. Sapir. Bahasa disajikan kepada para deskriptivis sebagai seperangkat pernyataan ucapan, yang merupakan objek utama studi mereka. Fokus mereka adalah pada aturan deskripsi ilmiah (karena itu namanya) teks: studi tentang organisasi, pengaturan, dan klasifikasi elemen-elemennya. Formalisasi prosedur analitik di bidang fonologi dan morfologi (pengembangan prinsip-prinsip untuk mempelajari bahasa pada tingkat yang berbeda, analisis distributif, metode konstituen langsung, dll.) Mengarah pada perumusan pertanyaan umum pemodelan linguistik. Kurangnya perhatian terhadap rencana isi bahasa, serta sisi paradigmatik bahasa, tidak memungkinkan para deskriptivis untuk menafsirkan bahasa sebagai suatu sistem dengan cukup lengkap.

Pada 1960-an, teori tata bahasa formal berkembang, yang muncul terutama karena karya filsuf dan ahli bahasa Amerika N. Chomsky. Dia dianggap sebagai salah satu ilmuwan dan tokoh masyarakat modern paling terkenal, banyak artikel, monograf, dan bahkan film dokumenter berdurasi penuh dikhususkan untuknya. Dengan nama cara yang secara fundamental baru untuk mendeskripsikan struktur sintaksis yang ditemukan oleh Chomsky - tata bahasa generatif (generatif) - tren yang sesuai dalam linguistik disebut generativisme.

Chomsky, seorang keturunan imigran dari Rusia, belajar linguistik, matematika dan filsafat di University of Pennsylvania sejak 1945, sangat dipengaruhi oleh gurunya Zelig Harris - seperti Harris, Chomsky menganggap dan masih menganggap pandangan politiknya dekat dengan anarkisme (dia masih dikenal sebagai pengkritik sistem politik AS yang ada dan sebagai salah satu pemimpin spiritual anti-globalisme).

Karya ilmiah besar pertama Chomsky, tesis masternya Morfologi Bahasa Ibrani Modern (1951), tetap tidak dipublikasikan. Chomsky menerima gelar doktor dari University of Pennsylvania pada tahun 1955, tetapi banyak penelitian mendasari disertasinya (diterbitkan secara penuh hanya pada tahun 1975 dengan judul The Logical Structure of Linguistic Theory) dan monograf pertamanya, Syntactic Structures (1957, Rus. trans .1962), dilakukan di Universitas Harvard pada tahun 1951-1955. Pada tahun 1955 yang sama, ilmuwan tersebut pindah ke Massachusetts Institute of Technology, di mana ia menjadi profesor pada tahun 1962.

Teori Chomsky telah melalui beberapa tahapan dalam perkembangannya.

Dalam monograf pertama "Syntactic Structures", ilmuwan menampilkan bahasa sebagai mekanisme untuk menghasilkan rangkaian kalimat yang tak terbatas menggunakan seperangkat sarana tata bahasa yang terbatas. Untuk mendeskripsikan sifat linguistik, ia mengusulkan konsep struktur tata bahasa yang dalam (tersembunyi dari persepsi langsung dan dihasilkan oleh sistem rekursif, yaitu, dapat diterapkan berulang kali, aturan) dan permukaan (dipersepsikan langsung), serta transformasi yang menggambarkan transisi. dari struktur dalam ke struktur permukaan. Beberapa struktur permukaan dapat sesuai dengan satu struktur dalam (misalnya, konstruksi pasif Keputusan ditandatangani oleh presiden berasal dari struktur dalam yang sama dengan konstruksi aktif yang ditandatangani presiden keputusan) dan sebaliknya (misalnya, ambiguitas Ibu cinta anak perempuan digambarkan sebagai hasil dari kebetulan struktur permukaan yang kembali ke dua kedalaman yang berbeda, di mana ibu adalah orang yang mencintai anak perempuan, dan di sisi lain, orang yang dicintai anak perempuan).

Teori standar Chomsky dianggap sebagai model "Aspek" yang ditetapkan dalam buku Chomsky "Aspek Teori Sintaks". Dalam model ini, untuk pertama kalinya, aturan interpretasi semantik diperkenalkan ke dalam teori formal, menghubungkan makna dengan struktur yang dalam. Dalam Aspek, kompetensi linguistik bertentangan dengan penggunaan bahasa (kinerja), yang disebut hipotesis Katz-Postal tentang pelestarian makna selama transformasi diadopsi, sehubungan dengan konsep transformasi opsional yang dikecualikan, dan aparatur fitur sintaksis yang menjelaskan kompatibilitas leksikal diperkenalkan.

Pada tahun 1970-an, Chomsky mengerjakan teori pemerintahan dan pengikatan (GB-theory - dari kata government and binding) - lebih umum dari yang sebelumnya. Di dalamnya, ilmuwan meninggalkan aturan khusus yang menggambarkan struktur sintaksis bahasa tertentu. Semua transformasi telah diganti dengan satu transformasi gerakan universal. Dalam kerangka teori GB, ada juga modul pribadi, yang masing-masing bertanggung jawab atas bagian tata bahasanya sendiri.

Baru-baru ini, pada tahun 1995, Chomsky mengajukan program minimalis, di mana bahasa manusia digambarkan seperti bahasa mesin. Itu hanya program, bukan model atau teori. Di dalamnya, Chomsky mengidentifikasi dua subsistem utama dari perangkat bahasa manusia: leksikon dan sistem komputasi, serta dua antarmuka - fonetis dan logis.

Tata bahasa formal Chomsky telah menjadi klasik untuk mendeskripsikan tidak hanya bahasa alami tetapi juga bahasa buatan - khususnya bahasa pemrograman. Perkembangan linguistik struktural pada paruh kedua abad ke-20 dapat dianggap sebagai "revolusi Chomskian".

Sekolah Fonologi Moskow, yang perwakilannya adalah A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov, menggunakan teori serupa untuk mempelajari fonetik. Secara bertahap, metode "tepat" mulai diterapkan tidak hanya pada fonetik, tetapi juga pada sintaksis. Baik ahli bahasa maupun ahli matematika, baik di sini maupun di luar negeri, mulai mempelajari struktur bahasa. Pada 1950-an dan 60-an, tahap baru interaksi antara matematika dan linguistik dimulai di Uni Soviet, terkait dengan pengembangan sistem terjemahan mesin.

Dorongan untuk dimulainya karya-karya ini di negara kita adalah perkembangan pertama di bidang terjemahan mesin di Amerika Serikat (meskipun perangkat terjemahan mekanis pertama oleh P.P. Smirnov-Troyansky ditemukan di Uni Soviet pada tahun 1933, karena primitif, tidak meluas). Pada tahun 1947, A. Butt dan D. Britten menemukan kode untuk terjemahan kata demi kata menggunakan komputer, setahun kemudian, R. Richens mengusulkan aturan untuk membagi kata menjadi batang dan akhiran dalam terjemahan mesin. Tahun-tahun itu sangat berbeda dengan hari ini. Ini adalah mesin yang sangat besar dan mahal yang menempati seluruh ruangan dan membutuhkan banyak staf insinyur, operator, dan pemrogram untuk memeliharanya. Pada dasarnya, komputer ini digunakan untuk melakukan kalkulasi matematis untuk kebutuhan institusi militer - yang baru dalam matematika, fisika, dan teknologi melayani, pertama-tama, urusan militer. Pada tahap awal, pengembangan MP didukung secara aktif oleh militer, sementara (dalam kondisi Perang Dingin) arah Rusia-Inggris berkembang di AS, dan arah Anglo-Rusia di Uni Soviet.

Pada bulan Januari 1954, Eksperimen Georgetown, demonstrasi publik pertama terjemahan dari bahasa Rusia ke bahasa Inggris pada mesin IBM-701, berlangsung di Universitas Teknik Massachusetts. Abstrak pesan tentang keberhasilan percobaan, dibuat oleh D.Yu. Panov, muncul di RJ "Mathematics", 1954, No. 10: "Translation from one language to another using a machine: a report on the first success test."

D. Yu. Panov (saat itu direktur Institut Informasi Ilmiah - INI, kemudian VINITI) melibatkan I. K. Belskaya, yang kemudian mengepalai kelompok terjemahan mesin di Institut Matematika Precise dan Teknik Komputer Akademi Ilmu Pengetahuan Uni Soviet, untuk mengerjakan terjemahan mesin. Pada akhir tahun 1955, pengalaman pertama menerjemahkan dari bahasa Inggris ke bahasa Rusia dengan bantuan mesin BESM sudah ada sejak lama. Program untuk BESM disusun oleh N.P. Trifonov dan L.N. Korolev, yang tesis Ph.D.-nya dikhususkan untuk metode menyusun kamus untuk terjemahan mesin.

Secara paralel, pekerjaan terjemahan mesin dilakukan di Departemen Matematika Terapan Institut Matematika Akademi Ilmu Pengetahuan Uni Soviet (sekarang Institut Matematika Terapan M.V. Keldysh dari Akademi Ilmu Pengetahuan Rusia). Atas prakarsa ahli matematika A.A. Lyapunov. Dia melibatkan O.S. Kulagin dan murid-muridnya T.D. Wenzel dan N.N. Ricco. Gagasan Lyapunov dan Kulagina tentang kemungkinan menggunakan teknologi untuk menerjemahkan dari satu bahasa ke bahasa lain diterbitkan dalam jurnal Nature, 1955, No. 8. Sejak akhir tahun 1955, T.N. Moloshnaya, yang kemudian memulai pekerjaan mandiri pada algoritme terjemahan Inggris-Rusia.

R. Frumkina, yang saat itu terlibat dalam algoritme terjemahan dari bahasa Spanyol, mengenang bahwa pada tahap pekerjaan ini sulit untuk mengambil langkah yang konsisten. Jauh lebih sering saya harus mengikuti pengalaman heuristik - pengalaman saya sendiri atau rekan kerja.

Namun, sistem terjemahan mesin generasi pertama sangat tidak sempurna. Semuanya didasarkan pada algoritme terjemahan berurutan "kata demi kata", "frasa demi frasa" - koneksi semantik antara kata dan kalimat tidak diperhitungkan sama sekali. Misalnya, kita dapat mengutip kalimat: “John sedang mencari kotak mainannya. Akhirnya dia menemukannya. Kotak itu ada di dalam pena. Yohanes sangat senang. (John sedang mencari kotak mainannya. Akhirnya ia menemukannya. Kotak itu ada di dalam playpen. John sangat senang.).” “Pen” dalam konteks ini bukanlah “pen” (alat tulis), melainkan “playpen” (pena bermain). Pengetahuan tentang sinonim, antonim, dan makna kiasan sulit untuk dimasukkan ke dalam komputer. Arah yang menjanjikan adalah pengembangan sistem komputer yang berfokus pada penggunaan penerjemah manusia.

Seiring waktu, sistem terjemahan langsung digantikan oleh sistem-T (dari kata bahasa Inggris "transfer" - transformasi), di mana terjemahan dilakukan pada tingkat struktur sintaksis. Algoritma sistem-T menggunakan mekanisme yang memungkinkan untuk membangun struktur sintaksis sesuai dengan aturan tata bahasa kalimat masukan (mirip dengan bagaimana bahasa asing diajarkan di sekolah menengah), dan kemudian mensintesis kalimat keluaran dengan mengubah struktur sintaksis dan mengganti kata-kata yang diperlukan dari kamus.

Lyapunov berbicara tentang penerjemahan dengan mengekstraksi makna teks terjemahan dan menyajikannya dalam bahasa lain. Pendekatan untuk membangun sistem terjemahan mesin berdasarkan perolehan representasi semantik dari kalimat input dengan analisis semantik dan sintesis kalimat input sesuai dengan representasi semantik yang diperoleh masih dianggap paling sempurna. Sistem seperti itu disebut sistem-I (dari kata "interlingua"). Namun, tugas untuk membuatnya, yang dimulai pada akhir 50-an dan awal 60-an, sejauh ini belum sepenuhnya terselesaikan, terlepas dari upaya Federasi Internasional IFIP, komunitas ilmuwan dunia di bidang pemrosesan informasi.

Para ilmuwan berpikir tentang bagaimana memformalkan dan membangun algoritme untuk bekerja dengan teks, kamus apa yang harus dimasukkan ke dalam mesin, pola linguistik apa yang harus digunakan dalam terjemahan mesin. Linguistik tradisional tidak memiliki gagasan seperti itu - tidak hanya dari segi semantik, tetapi juga dari segi sintaksis. Pada saat itu, tidak ada daftar konstruksi sintaksis untuk bahasa apa pun, kondisi kompatibilitas dan pertukarannya tidak dipelajari, aturan untuk membangun unit besar struktur sintaksis dari elemen penyusun yang lebih kecil tidak dikembangkan.

Kebutuhan untuk menciptakan landasan teoretis terjemahan mesin mengarah pada pembentukan dan pengembangan linguistik matematika. Peran utama dalam hal ini di Uni Soviet dimainkan oleh matematikawan A.A. Lyapunov, O.S. Kulagina, V.A. Uspensky, ahli bahasa V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. Ivanov. Disertasi Kulagina dikhususkan untuk studi teori tata bahasa formal (bersamaan dengan N. Khomsky di AS), Kuznetsov mengedepankan tugas aksiomatisasi linguistik, yang kembali ke karya F.F. Fortunatov.

Pada tanggal 6 Mei 1960, Keputusan Presidium Akademi Ilmu Pengetahuan Uni Soviet "Tentang pengembangan metode struktural dan matematika untuk mempelajari bahasa" diadopsi, dan divisi yang sesuai dibuat di Institut Linguistik dan Institut Bahasa. Bahasa Rusia. Sejak 1960, di universitas kemanusiaan terkemuka di negara itu - fakultas filologi Universitas Negeri Moskow, Leninrad, universitas Novosibirsk, Institut Bahasa Asing Negeri Moskow - memulai pelatihan di bidang pemrosesan teks otomatis.

Namun, karya terjemahan mesin pada periode ini, yang disebut "klasik", lebih bersifat teoretis daripada kepentingan praktis. Sistem terjemahan mesin yang hemat biaya mulai dibuat hanya pada tahun delapan puluhan abad yang lalu. Saya akan membicarakannya nanti di Bagian 2.1, Terjemahan Mesin.

Tahun 1960-an - 70-an termasuk perkembangan teori yang mendalam dengan menggunakan metode teori himpunan dan logika matematika, seperti teori medan dan teori himpunan fuzzy.

Penulis teori lapangan dalam linguistik adalah penyair, penerjemah, dan ahli bahasa Soviet V.G. Nasihat. Dia awalnya mengembangkan teorinya berdasarkan bahasa Jerman. Bagi Admoni, konsep "bidang" menunjukkan sekumpulan elemen linguistik yang tidak kosong (misalnya, "bidang leksikal", "bidang semantik").

Struktur bidangnya heterogen: terdiri dari inti, yang elemen-elemennya memiliki serangkaian fitur lengkap yang mendefinisikan suatu himpunan, dan pinggiran, elemen-elemen yang dapat memiliki kedua fitur dari himpunan tertentu (tidak semua) dan yang tetangga. Saya akan memberikan contoh yang mengilustrasikan pernyataan ini: misalnya, dalam bahasa Inggris, bidang kata majemuk ("day-dream" - "dream" sulit dipisahkan dari bidang frasa ("gas air mata" - "gas air mata") .

Teori himpunan fuzzy yang telah disebutkan di atas berkaitan erat dengan teori medan. Di Uni Soviet, ahli bahasa V.G. Admoni, I.P. Ivanova, G.G. Pochentsov, bagaimanapun, leluhurnya adalah ahli matematika Amerika L. Zadeh, yang pada tahun 1965 menerbitkan artikel "Fuzzy Logic". Memberikan pembenaran matematis untuk teori himpunan fuzzy, Zade mempertimbangkannya berdasarkan materi linguistik.

Dalam teori ini, kita tidak berbicara banyak tentang kepemilikan elemen pada himpunan tertentu (АОа), melainkan tentang tingkat kepemilikan ini (mАОа), karena elemen periferal dapat dimiliki oleh beberapa bidang pada satu derajat atau lainnya. Zade (Lofti-zade) adalah penduduk asli Azerbaijan, hingga usia 12 tahun ia memiliki kebiasaan berkomunikasi dalam empat bahasa - Azerbaijan, Rusia, Inggris, dan Persia - dan menggunakan tiga huruf berbeda: Sirilik, Latin, Arab. Ketika seorang ilmuwan ditanya apa kesamaan antara teori himpunan fuzzy dan linguistik, dia tidak menyangkal hubungan ini, tetapi mengklarifikasi: “Saya tidak yakin bahwa mempelajari bahasa-bahasa ini memiliki pengaruh besar pada pemikiran saya. Jika demikian, maka hanya secara tidak sadar. Di masa mudanya, Zadeh belajar di sekolah Presbiterian di Teheran, dan setelah Perang Dunia II dia beremigrasi ke Amerika Serikat. “Pertanyaannya bukan apakah saya orang Amerika, Rusia, Azerbaijan atau apa pun,” katanya.

Abstrak serupa:

Bahasa dan ucapan sebagai salah satu masalah mendasar dalam stilistika. Konsep fonem dan tingkat fonologis. Konsep bahasa sebagai sistem dan tingkatan sistem bahasa. Konsep morfem dan jenisnya. Sebuah kalimat sebagai unit sintaksis dari sebuah teks. Tanda-tanda sistem bahasa.


Atas