Sejarah penerapan metode matematika dalam linguistik. Prospek penerapan metode matematika dalam linguistik

Penetrasi ke dalam linguistik metode matematika dan "semangat matematika" berkontribusi pada pengembangan linguistik ke arah akurasi dan objektivitas. Namun, dalam perjalanannya pengembangan lebih lanjut ada hambatan serius ke arah ini. Penulis merefleksikan alasan konvergensi linguistik dan matematika, pada batasan penerapan metode matematika dalam linguistik, dan pada sifat faktor yang mencegah saling pengertian antara ahli matematika dan ahli bahasa.

Ketika, pada paruh kedua tahun 1950-an, beberapa ahli bahasa muda berpikir untuk menerapkan metode matematika untuk mempelajari struktur bahasa dan mulai bekerja sama dengan ahli matematika, hal ini menimbulkan kejutan dan bahkan keterkejutan di antara banyak rekan mereka - lagipula, mereka yakin dari kecil itu ilmu kemanusiaan, salah satunya adalah linguistik, tidak memiliki dan tidak dapat memiliki kesamaan dengan matematika dan ilmu "eksakta" lainnya.

Sementara itu, adanya keterkaitan yang erat antara bahasa alam dan matematika sama sekali bukan merupakan penemuan baru pada masa itu. L. S. Vygotsky menulis dalam bukunya "Thinking and Speech" yang diterbitkan pada tahun 1934: "Orang pertama yang melihat dalam pemikiran matematika yang berasal dari bahasa, tetapi mengatasinya, tampaknya, adalah Descartes" dan melanjutkan: "Kebiasaan kami bahasa sehari-hari karena fluktuasi yang melekat dan ketidakkonsistenan tata bahasa dan psikologis, ia berada dalam keadaan keseimbangan bergerak antara cita-cita harmoni matematis dan fantastis dan dalam gerakan tanpa henti, yang kita sebut evolusi.

Timbul di Yunani kuno doktrin kategori tata bahasa sudah merupakan deskripsi dari sejumlah aspek terpenting dari struktur bahasa dengan bantuan model abstrak yang mirip dengan model yang dibuat oleh ahli matematika Yunani kuno untuk mendeskripsikan bentuk spasial; hanya keakraban konsep seperti kasus, jenis kelamin, dll., yang telah menjadi, seperti yang ditulis H. Steinthal, "sifat kedua kita", menghalangi kita untuk memahami betapa tinggi pemikiran abstrak yang diperlukan untuk kreasi mereka. Jadi Anda harus terkejut daripada bahwa upaya pertama untuk menggunakan cara matematika nyata untuk menggambarkan "harmoni matematika ideal" linguistik dilakukan hanya di pertengahan abad ke-20.

Ada dua alasan untuk "penundaan" ini. Pertama, ilmu bahasa, setelah diambil langkah-langkah signifikan jaman dahulu, mulai benar-benar berkembang kembali hanya pada abad ke-19, tetapi sepanjang abad ini perhatian utama para ahli bahasa beralih ke sejarah bahasa, dan baru pada abad berikutnya, yang pada umumnya merupakan zaman strukturalisme bagi humaniora, barulah linguistik untuk pertama kalinya setelah periode kuno beralih ke studi tentang struktur bahasa, tetapi pada tingkat yang baru. Ketika ahli bahasa menyadari bahwa bahasa, dalam kata-kata F. de Saussure, adalah "sistem hubungan murni", yaitu sistem tanda, yang sifat fisiknya tidak signifikan, dan hanya hubungan di antara mereka yang signifikan, kesejajaran antara konstruksi bahasa dan matematika menjadi sangat jelas , yang juga merupakan "sistem hubungan murni", dan sudah di awal abad ke-20, de Saussure yang sama bermimpi mempelajari bahasa dengan cara matematika.

Kedua, metode kuantitatif mengemuka dalam matematika pada awal Zaman Baru, dan baru pada abad ke-19 matematikawan kembali membangun model abstrak non-kuantitatif yang lebih berbeda dari model kuno. level tinggi abstraksi, dan juga - yang sangat penting untuk topik kita - oleh fakta bahwa abstraksi dapat digunakan untuk mendeskripsikan fenomena yang jauh lebih luas daripada bentuk spasial; seringkali model seperti itu ternyata nyaman dan rata sarana yang diperlukan untuk mempelajari fenomena yang tidak dipikirkan oleh ahli matematika yang membangunnya sama sekali dan bahkan tidak mengetahui keberadaannya. Di antara model-model ini adalah yang kemudian menerima aplikasi dalam linguistik; perkembangan disiplin matematika yang sangat intensif, yang isinya adalah konstruksinya, terjadi pada paruh pertama abad ke-20. Oleh karena itu, pertemuan matematika dan linguistik di pertengahan abad ini sangatlah wajar.

Salah satu hasil dari pertemuan tersebut adalah munculnya disiplin matematika baru - linguistik matematika, yang pokok bahasannya adalah pengembangan perangkat matematika untuk penelitian linguistik. Tempat sentral dalam linguistik matematika ditempati oleh teori tata bahasa formal, yang, berdasarkan sifat peralatan yang digunakan di dalamnya, terkait dengan logika matematika dan, khususnya, dengan teori algoritme. Ini menyediakan metode formal untuk menggambarkan unit bahasa yang benar. berbagai tingkatan, dan juga, yang sangat penting, metode formal untuk mendeskripsikan transformasi unit bahasa - baik pada level yang sama maupun antar level. Teori struktur sintaksis berdampingan dengan teori tata bahasa formal, yang jauh lebih sederhana dalam hal peralatan, tetapi tidak kalah pentingnya untuk aplikasi linguistik. Dalam linguistik matematika, model analitik bahasa juga sedang dikembangkan, di mana, atas dasar tertentu - dianggap diketahui - data tentang "teks yang benar", konstruksi formal dibuat, yang hasilnya adalah deskripsi dari beberapa " bagian penyusun» mekanisme bahasa. Dengan cara ini, seseorang dapat memperoleh deskripsi formal dari beberapa konsep gramatikal tradisional. Ini juga harus mencakup deskripsi makna kalimat menggunakan alat logika intensional ("semantik Montagu").

Tentu saja, dengan bantuan peralatan matematika, hanya satu dari dua cita-cita bahasa yang dibicarakan Vygotsky yang dapat dijelaskan; oleh karena itu, keberatan yang sering terdengar terhadap penggunaan satu atau beberapa model matematika (atau model matematika pada umumnya) dengan alasan tidak mencakup kasus khusus ini dan itu tidak masuk akal: untuk menggambarkan "fluktuasi dan ketidakkonsistenan" yang melekat pada bahasa, seseorang benar-benar membutuhkan cara non-matematis lainnya, dan hanya deskripsi yang jelas tentang "cita-cita matematika" dapat membantu menemukannya, karena itu akan memungkinkan untuk secara jelas membatasi "fantastis" dari "matematis" di bahasa. Tapi ini masih soal masa depan.

Tidak kurang, dan mungkin lebih penting daripada munculnya linguistik matematika, adalah penetrasi langsung ke dalam linguistik ide dan konsep matematika dasar - seperti himpunan, fungsi, isomorfisme. Dalam semantik linguistik modern, konsep predikat dan kuantor yang berasal dari logika matematika memainkan peran penting. (Yang pertama muncul dalam logika bahkan ketika itu tidak dibedakan dari linguistik, dan sekarang telah kembali ke linguistik dalam bentuk yang digeneralisasikan dan diproses secara matematis.)

Dan akhirnya, sangat sangat penting memiliki penyempurnaan bahasa penelitian linguistik, yang terjadi karena penetrasi "roh matematika" ke dalam linguistik, tidak hanya di bidang-bidang yang memungkinkan untuk menggunakan ide dan metode matematika. Semua ini dapat diringkas secara singkat sebagai berikut: linguistik menjadi ilmu pengetahuan yang semakin akurat dan objektif - tanpa henti, tentu saja, menjadi ilmu humaniora.

Namun, dalam hal ini cara alami Perkembangan linguistik menghadapi kendala serius yang dapat memperlambatnya dalam waktu yang lama. Yang utama adalah “pemisahan fakultas” yang muncul pada awal Zaman Baru: ilmuwan alam dan matematikawan, di satu sisi, dan ilmuwan kemanusiaan, di sisi lain, tidak tertarik dengan pekerjaan rekan kerja “di fakultas lain ” dan, terlebih lagi, jauh di lubuk hati, dan sering kali secara terbuka membenci mereka. . Matematikawan dan ilmuwan alam (dan bahkan lebih banyak "teknisi") cenderung melihat penelitian humaniora hanya sebagai semacam "hiasan" atau bahkan "obrolan kosong", sementara "humaniora" siap untuk mentolerir matematika dan ilmu alam hanya untuk kepentingan praktis. manfaat dan yakin bahwa mereka tidak ada dapat membantu untuk memahami sifat dari jiwa manusia.

Hanya di tengah abad ke-19 dalam hal ini, dalam kata-kata ahli biologi dan pemikir besar Konrad Lorenz, "tembok jahat antara ilmu alam dan humaniora (die böse Mauer zwischen Naturend Geistwissenschaften)" pelanggaran pertama dibuat di tempat tertipis yang memisahkan logika dari matematika. Pada abad ke-20, celah lain muncul - di antaranya yang dilubangi dari kedua sisi oleh ahli matematika dan ahli bahasa - tetapi jumlahnya masih sedikit, temboknya masih kuat, dan tidak ada kekurangan upaya dari kedua sisi untuk memperkuatnya lebih lanjut. dan menambal lubang. Seringkali upaya ini cukup berhasil; "pencapaian" terbaru dalam arah ini adalah "pendidikan profil" di sekolah menengah atas yang sudah di masa kanak-kanak membagi orang yang mampu dan tertarik menjadi "fakultas" dan mengajari mereka untuk bangga akan ketidaktahuan dalam ilmu "asing" - dapat sangat menghambat konvergensi lebih lanjut dari ilmu alam dan manusia, yang sangat diperlukan untuk perkembangan normal keduanya . Salah satu konsekuensi dari mendirikan tembok adalah bahwa "humaniora", termasuk sebagian besar ahli bahasa, tidak tahu apa-apa bahkan tentang dasar-dasar bagian matematika yang memiliki nilai tertinggi untuk humaniora (dan bayangkan seorang ahli matematika sebagai orang yang secara eksklusif sibuk dengan perhitungan).

Rintangan lain adalah karakteristik ras panik dari keadaan sains saat ini, pengejaran tanpa henti untuk semakin banyak "hasil" baru, mempersempit cakrawala dan tidak menyisakan waktu untuk memikirkan masalah yang lebih dalam atau terlibat dalam studi serius terkait dan, apalagi, tidak terlalu berhubungan disiplin ilmu. Ini berlaku sama untuk ahli bahasa dan matematikawan - seperti, memang, untuk semua orang yang secara profesional terlibat dalam sains.

Dan yang ketiga adalah kelembaman, atau, lebih sederhananya, kemalasan. Sekilas, kemalasan dan ras yang panik tidak cocok, tetapi pada kenyataannya mereka rukun satu sama lain dan, terlebih lagi, saling mendukung dan merangsang. Ketika seseorang terlalu malas untuk melakukan tugas yang sulit, dia mengambil tugas yang lebih mudah dan lebih "dapat diandalkan", kesuksesan yang membenarkan dan mendorong kelembamannya. sikap sombong terhadap saudara yang lebih kecil, berkerumun di sisi lain tembok, juga mendorong kemalasan dan didorong olehnya. Ketika, misalnya, seorang ahli matematika mengusulkan untuk mempertimbangkan kembali semua gagasan tentang sejarah kuno, tanpa bersusah payah untuk mengenal bahasa kuno setidaknya sedikit, ibu malas yang sama sebagian besar bertanggung jawab untuk ini.

Bahaya bagi perkembangan sains yang ditimbulkan oleh hambatan-hambatan ini jauh lebih serius daripada yang terlihat pada pandangan pertama. Ketika ketidaktahuan dalam ilmu "asing" menjadi masalah kebanggaan, ini secara alami mengarah pada kedangkalan dan ketidaktahuan pada ilmu "kita" juga. Sudah lama ada lebih dari dua "fakultas", jumlahnya terus bertambah dari tahun ke tahun, dan masing-masing dipagari tembok satu sama lain; dinding muncul di dalam fakultas juga. Cakrawala peneliti secara bertahap menyempit; memang benar bahwa alat penelitian menjadi semakin halus dan halus, tetapi hampir secara eksklusif barang-barang kecil, dan gagasan diperkuat bahwa mereka adalah satu-satunya yang layak dipelajari. Ada banyak alasan untuk membicarakan krisis dalam sains, dan linguistik tidak terkecuali. Sekarang, menurut saya, inilah saatnya untuk melihat ke belakang dan berpikir.

Di sini berkumpul ahli bahasa dari arah, yang dikaitkan dengan model "Arti - Teks". Model ini, dibuat pada tahun 60-an abad lalu, adalah salah satu yang pertama dan hasil terbaik pertemuan linguistik dan matematika, setelah itu dua generasi ahli bahasa telah tumbuh, terbiasa dengan pemikiran yang tepat sejak masa mahasiswa mereka. Namun sayangnya, mereka tidak terbebas dari kelembaman, yang menghalangi mereka untuk menyadari adanya krisis dan memikirkan cara untuk mengatasinya. Sementara itu, di antara semua ahli bahasa - dan mungkin bahkan di antara semua yang terlibat dalam humaniora - mereka memiliki peluang paling objektif untuk pemahaman seperti itu, dan saya berharap mereka akan menggunakan peluang ini.

Teks laporan tersebut dengan baik hati disediakan oleh A.V. Gladkiy dan penerbit

Sejarah penerapan metode matematika dalam linguistik KULIAH No.1

rencana

Pembentukan
linguistik struktural
pada pergantian XIX- abad XX.
Penerapan metode matematika
dalam linguistik di paruh kedua abad kedua puluh
abad.
prospek
aplikasi
metode matematika di
ilmu bahasa.

Ferdinand de Saussure (1857-1913) bahasa sebagai suatu sistem

bahasa yang tepat
pidato - pembebasan bersyarat
aktivitas bicara
- bahasa

I.A. Baudouin de Courtenay (1845 - 1929)

“Suara adalah “atom” bahasa
sistem yang memiliki
nomer terbatas
sifat yang mudah diukur.
Ini yang paling nyaman
bahan formal,
metode yang ketat
deskripsi."

Linguistik struktural -

itu adalah seperangkat pandangan tentang bahasa dan
metode penelitiannya, berdasarkan
yang terletak pengertian bahasa sebagai
sistem tanda dengan jelas dibedakan
elemen struktural (unit
bahasa, kelas mereka, dll.) dan keinginan untuk
ketat (mendekati tepat
ilmu) deskripsi formal bahasa.

Leningradskaya
sekolah fonologi
(L.V. Shcherba) digunakan sebagai
kriteria utama untuk generalisasi suara di
sebagai psikolinguistik fonem
percobaan berbasis analisis
ucapan penutur asli.
Lingkaran Linguistik Praha
(N.S. Trubetskoy) mengembangkan teori tersebut
oposisi - struktur semantik
bahasa digambarkan oleh mereka sebagai satu set
dibangun secara oposisional
unit semantik - fam.

Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh

Amerika
deskriptivisme
(L. Bloomfield dan E. Sapir). Bahasa
disajikan kepada deskriptivis sebagai
kumpulan ujaran pidato.
Tata bahasa formal N. Chomsky.
Moskow
sekolah fonologi,
yang perwakilannya adalah A.A.
Reformatsky, V.N. Sidorov, P.S.
Kuznetsov, A.M. Sukhotin, R.I. Avanesov.

sistem terjemahan mesin

Algoritma
terjemahan berturut-turut
kata demi kata, frase demi frase.
T-sistem (dari kata Bahasa Inggris transfer
- transformasi), di mana terjemahannya
dilakukan pada tataran sintaksis
struktur.
I-sistem (dari kata "interlingua") memperoleh representasi semantik
masukan kalimat melalui its
analisis semantik dan sintesis
masukkan penawaran pada yang diterima
presentasi semantik.

10. Linguistik praktis

studi
bukan bahasa dalam keadaannya (mis.
sistem), dan bahasa dalam tindakan (yaitu dalam
komunikasi);
memecahkan masalah aplikasi tertentu,
membuat model bahasa tanpa
klaim untuk menjelaskan fakta-fakta bahasa
(sebagai linguistik teoretis);
menargetkan subbahasa tertentu
(yaitu pengetahuan bahasa yang selektif), dan tidak
untuk seluruh bahasa.

11. linguistik kuantitatif

- arah interdisipliner di
penelitian terapan, yang
sebagai alat belajar utama
bahasa dan ucapan digunakan
kuantitatif atau statistik
metode analisis.

12. linguistik komputasi

– pengembangan metode, teknologi dan
sistem tertentu yang menyediakan
komunikasi antara seseorang dan komputer secara alami
atau bahasa alami yang terbatas.

13. linguistik komputasi

penciptaan sistem untuk memproses alami
bahasa (misalnya, sistem pemrosesan komunikasi
teks);
pengembangan sistem pencarian informasi
(dokumenter, yaitu, di mana
teks, dan faktual, yaitu di mana
fakta disimpan, disajikan tidak hanya di
bentuk tekstual, maupun dalam bentuk tabel,
formula, dll);
pembuatan sistem hypertext (mis.
set teks dengan menghubungkan mereka
hubungan);
perkembangan teknologi komputer
penyusunan dan penggunaan kamus.

14. Terima kasih atas perhatian Anda!

15. Laporan:

Hukum
alam dan hukum "kemanusiaan".
Revolusi matematika dalam linguistik.
Sekolah Struktural Kopenhagen
ilmu bahasa.
Pembentukan linguistik terapan sebagai
disiplin ilmu.

16. Sesi Praktikum:

Deskripsi sejarah penerapan matematika
metode dalam linguistik dari zaman kuno hingga kita
hari.
Manifestasi tren integrasi
matematika, linguistik dan pengetahuan lainnya di
sejarah perkembangan ilmu bahasa.
Karakteristik komparatif dari terapan dan
linguistik teoretis (isi tabel
Karakteristik komparatif dari terapan dan
linguistik teoretis).
Corpus linguistik sebagai bagian terapan
ilmu bahasa.
Aspek terapan linguistik kuantitatif.
Linguistik komputasi dan alat-alatnya.

Selama abad terakhir, linguistik selalu dikutip sebagai contoh ilmu yang berkembang pesat dan sangat cepat mencapai kematangan metodologis. Sudah di pertengahan abad terakhir, sains muda dengan percaya diri mengambil tempatnya di lingkaran sains yang memiliki tradisi seribu tahun, dan salah satu perwakilannya yang paling menonjol - A. Schleicher - memiliki keberanian untuk percaya bahwa dengan karyanya dia sudah menyimpulkan baris terakhir.<113>Namun, sejarah linguistik telah menunjukkan bahwa pendapat seperti itu terlalu terburu-buru dan tidak dapat dibenarkan. Pada akhir abad ini, linguistik mengalami kejutan besar pertama terkait dengan kritik terhadap prinsip-prinsip neo-tata bahasa, diikuti oleh yang lainnya. Perlu dicatat bahwa semua krisis yang dapat kita temukan dalam sejarah ilmu bahasa, sebagai suatu peraturan, tidak menggoyahkan fondasinya, tetapi, sebaliknya, berkontribusi pada penguatan dan pada akhirnya membawa penyempurnaan dan peningkatan. metode penelitian linguistik, berkembang seiring dengan tema dan isu ilmiah.

Namun di samping linguistik, ilmu-ilmu lain juga hidup dan berkembang, termasuk banyak ilmu baru. Ilmu fisika, kimia, dan teknis (yang disebut "tepat") telah menerima perkembangan yang sangat pesat di zaman kita, dan landasan teoretisnya, matematika, telah menguasai semuanya. Ilmu eksakta tidak hanya sangat menekan semua humaniora, tetapi saat ini mereka berusaha untuk "membawa mereka ke dalam keyakinan mereka", untuk menundukkan mereka pada kebiasaan mereka, untuk memaksakan metode penelitian mereka pada mereka. Dalam situasi saat ini, dengan menggunakan ungkapan bahasa Jepang, dapat dikatakan bahwa sekarang ahli bahasa-filolog sedang mengotori ujung tikar, di mana ilmu eksakta, yang dipimpin oleh matematika, ditempatkan dengan penuh kemenangan dan bebas.

Bukankah lebih bijaksana dari sudut pandang kepentingan ilmiah umum untuk menyerah pada matematika, untuk menyerah sepenuhnya pada kekuatan metodenya, yang secara terbuka disebut oleh beberapa suara 59 , dan dengan demikian, mungkin, mendapatkan kekuatan baru? Untuk menjawab pertanyaan-pertanyaan ini, pertama-tama kita harus melihat apa yang diklaim oleh matematika kasus ini di bidang linguistik mana metode matematika menemukan penerapannya, sejauh mana metode tersebut konsisten dengan kekhususan materi linguistik dan apakah metode tersebut mampu memberikan atau bahkan sekadar menyarankan jawaban atas pertanyaan yang diajukan ilmu bahasa.

Sejak awal, perlu dicatat bahwa di antara para peminat tren matematika baru dalam linguistik<114>Tidak ada kebulatan pendapat mengenai tujuan dan sasarannya dalam penelitian statis. Acad. A. A. Markov, yang pertama kali menerapkan metode matematika pada bahasa, Boldrini, Yul, Mariotti menganggap elemen bahasa sebagai bahan ilustrasi yang cocok untuk membangun metode kuantitatif, atau untuk teorema statistik, tanpa bertanya-tanya apakah hasil penelitian semacam itu menarik. untuk ahli bahasa 6 0 . Ross percaya bahwa teori probabilitas dan statistik matematika menyediakan alat atau, seperti yang sekarang lebih suka mereka katakan, model matematika untuk menguji dan mengonfirmasi kesimpulan linguistik yang memungkinkan interpretasi numerik. Dengan demikian, metode matematika dipahami hanya sebagai alat bantu penelitian linguistik 6 1 . Lebih banyak lagi yang diklaim oleh Herdan, yang dalam bukunya tidak hanya merangkum dan mensistematisasikan semua upaya studi matematika masalah bahasa, tetapi juga mencoba memberi mereka orientasi yang jelas dalam kaitannya dengan pekerjaan selanjutnya. Dia memfokuskan penyajian seluruh materi bukunya pada “memahami statistik sastra (sebagaimana dia menyebut studi teks dengan metode statistik matematika. - DI 3.) sebagai bagian integral dari linguistik” 6 2 , dan merumuskan esensi dan tugas dari bagian baru ini dalam linguistik dengan kata-kata berikut: “Statistik sastra sebagai filosofi kuantitatif bahasa berlaku untuk semua cabang linguistik. Menurut pendapat kami, statistik sastra adalah linguistik struktural yang diangkat ke tingkat ilmu kuantitatif atau filsafat kuantitatif. Jadi, sama salahnya untuk mendefinisikan hasilnya sebagai di luar ruang lingkup<115>linguistik atau memperlakukannya sebagai alat bantu untuk penelitian” 6 3 .

Hampir tidak disarankan untuk berteori apakah sah dalam kasus ini untuk berbicara tentang kemunculan cabang linguistik baru dan menyelesaikan masalah klaimnya, tanpa terlebih dahulu mengacu pada pertimbangan tentang apa yang sebenarnya telah dilakukan dalam hal ini. daerah, dan untuk mengklarifikasi ke arah mana penerapan metode baru 6 4 . Ini akan membantu kita memahami perbedaan pendapat.

Penggunaan kriteria matematika (atau, lebih tepatnya, statistik) untuk memecahkan masalah linguistik sama sekali bukan hal baru dalam ilmu bahasa dan, pada tingkat tertentu, telah lama digunakan oleh ahli bahasa. Bagaimanapun, pada kenyataannya, konsep linguistik tradisional seperti hukum fonetik (dan terkait<116>nee dengan itu - pengecualian terhadap hukum), produktivitas elemen tata bahasa (misalnya, sufiks turunan), atau bahkan kriteria untuk hubungan terkait antar bahasa, sampai batas tertentu, didasarkan pada fitur statistik relatif. Lagipula, semakin tajam dan jelas pertentangan statistik dari kasus-kasus yang diamati, semakin banyak alasan kita harus berbicara tentang sufiks yang produktif dan tidak produktif, tentang hukum fonetik dan pengecualiannya, tentang ada atau tidak adanya hubungan kekerabatan antar bahasa. Tetapi jika dalam kasus seperti itu prinsip statistik digunakan kurang lebih secara spontan, maka di masa depan mulai diterapkan secara sadar dan sudah dengan penetapan tujuan tertentu. Jadi, di zaman kita, apa yang disebut kamus frekuensi kosakata dan ekspresi bahasa individu 6 5 atau bahkan arti kata multibahasa dengan "fokus umum pada realitas" 6 6 telah tersebar luas. Data kamus ini digunakan untuk menyusun buku teks bahasa asing (teks yang dibuat berdasarkan kosakata yang paling umum digunakan) dan kamus minimum. Kalkulus statistik menemukan penggunaan linguistik khusus dalam metode leksikostatistik atau glotokronologi oleh M. Swadesh, di mana, berdasarkan rumus statistik yang memperhitungkan kasus hilangnya kata-kata dari bahasa dana utama, dimungkinkan menetapkan kronologi mutlak pembagian rumpun bahasa 6 7 .

DI DALAM tahun-tahun terakhir kasus penerapan metode matematika pada materi linguistik telah berlipat ganda secara signifikan, dan dalam banyak upaya semacam itu, arah yang kurang lebih pasti telah diuraikan. Ayo berbelok<117>untuk pertimbangan berurutan mereka, tanpa merinci.

Mari kita mulai dengan arah yang diberi nama stilostatistik. Dalam hal ini, kita berbicara tentang definisi dan karakterisasi ciri-ciri gaya karya individu atau pengarang melalui hubungan kuantitatif unsur linguistik yang digunakan. Pendekatan statistik untuk mempelajari fenomena stilistika didasarkan pada pemahaman gaya sastra sebagai cara individu dalam menguasai sarana bahasa. Pada saat yang sama, peneliti benar-benar teralihkan dari pertanyaan tentang signifikansi kualitatif dari elemen linguistik yang dapat dihitung, memfokuskan semua perhatiannya hanya pada sisi kuantitatif; sisi semantik dari unit bahasa yang dipelajari, muatan emosional dan ekspresifnya, serta bagiannya dalam jalinan sebuah karya seni - semua ini tetap tidak diperhitungkan, merujuk pada apa yang disebut fenomena berlebihan. Dengan demikian, sebuah karya seni muncul dalam bentuk agregat mekanis, yang kekhususan konstruksinya diekspresikan hanya melalui hubungan numerik unsur-unsurnya. Perwakilan stilostatistik tidak menutup mata terhadap semua keadaan yang dicatat, menentang metode gaya tradisional, yang tidak diragukan lagi memasukkan unsur subjektivitas, dengan satu kualitas metode matematika, yang, menurut pendapat mereka, mengkompensasi semua kekurangannya - objektivitas hasil yang dicapai. “Kami berusaha,” tulis, misalnya, V. Fuchs, “... untuk mengkarakterisasi gaya ekspresi linguistik dengan cara matematis. Untuk tujuan ini, metode harus dibuat, yang hasilnya harus memiliki objektivitas yang sama dengan hasil ilmu eksakta ... Ini menunjukkan bahwa kita, setidaknya pada awalnya, hanya akan berurusan dengan kualitas struktural formal, dan bukan dengan semantik kandungan ungkapan linguistik. Dengan cara ini kita akan memperoleh suatu sistem hubungan ordinal, yang secara totalitasnya akan menjadi dasar dan titik tolak teori gaya matematika” 6 8 .<118>

Jenis pendekatan statistik paling sederhana untuk mempelajari bahasa penulis atau karya individu adalah menghitung kata-kata yang digunakan, karena kekayaan kamus, tampaknya, harus mencirikan penulis itu sendiri dengan cara tertentu. Namun, hasil perhitungan tersebut memberikan hasil yang agak tidak terduga dalam hal ini dan sama sekali tidak berkontribusi pada pengetahuan estetika dan evaluasi sebuah karya sastra, yang tidak lain merupakan salah satu tugas stilistika. Berikut beberapa data jumlah kata yang digunakan dalam sejumlah karya:

Alkitab (Latin). . . . . . . . . . 5649 kata

Alkitab (Ibrani). . . . 5642 kata

Demosthenes (bicara). . . . . . . . . . . . 4972 kata

Salam. . . . . . . . . . . . . . . . . 3394 kata

Horace. . . . . . . . . . . . . . . . . . . 0,6084 kata

Dante (Divine Comedy) 5860 kata

(ini termasuk 1615 nama diri dan nama geografis)

Tasso (Orland yang Marah). . . . 8474 kata

Milton. . . . . . . . . . . . . . . . . . . . 0,8000 kata (kira-kira diberikan)

Shakespeare. . . . . . . . . . . . . . . . . . .15000 kata

(kurang lebih menurut sumber lain 20.000 kata)

O. Jespersen menunjukkan bahwa kamus Zola, Kipling dan Jack London secara signifikan melebihi kamus Milton, yaitu jumlahnya 8000 6 9 . Perhitungan kamus pidato Presiden AS W. Wilson menemukan bahwa kamus itu lebih kaya daripada kamus Shakespeare. Untuk ini harus ditambahkan data psikolog. Jadi, Terman, berdasarkan pengamatan sejumlah besar kasus, menemukan bahwa rata-rata kosakata anak adalah sekitar 3600 kata, dan pada usia 14 - sudah 9000. Rata-rata orang dewasa menggunakan 11700 kata, dan seseorang "meningkat kecerdasan" hingga 13500 7 0 . Dengan demikian, data numerik semacam itu sendiri tidak memberikan dasar apa pun untuk mengidentifikasi kualitas gaya karya dan hanya "secara objektif"<119>mereka menyatakan penggunaan jumlah kata yang berbeda oleh penulis yang berbeda, yang, seperti yang ditunjukkan oleh perhitungan di atas, tidak terkait dengan nilai artistik relatif dari karya mereka.

Perhitungan frekuensi relatif penggunaan kata oleh masing-masing penulis dibuat agak berbeda. Dalam hal ini, tidak hanya jumlah total kata yang diperhitungkan, tetapi juga frekuensi penggunaan masing-masing kata. Pemrosesan statistik materi yang diperoleh dengan cara ini terdiri dari fakta bahwa kata-kata dengan frekuensi penggunaan yang sama dikelompokkan ke dalam kelas (atau peringkat), yang mengarah pada pembentukan distribusi frekuensi semua kata yang digunakan oleh penulis tertentu. Kasus khusus dari perhitungan semacam ini adalah penentuan frekuensi relatif dari kata-kata khusus (misalnya, kosakata Roman dalam karya Chaucer, seperti yang dilakukan oleh Mersand 7 1). Frekuensi relatif dari kata-kata yang digunakan oleh penulis berisi informasi objektif yang sama tentang gaya masing-masing penulis seperti perhitungan total di atas, dengan satu-satunya perbedaan adalah hasilnya adalah data numerik yang lebih akurat. Tetapi ini juga digunakan untuk menentukan tanggal karya individu dari penulis yang sama berdasarkan perhitungan awal dari frekuensi relatif penggunaan kata-katanya dalam periode yang berbeda dalam hidupnya (menurut karya yang diberi tanggal oleh penulisnya sendiri). Jenis lain dari penggunaan data dari perhitungan tersebut adalah untuk menetapkan keaslian kepenulisan karya yang pertanyaan ini tampaknya diragukan 7 2 . Dalam kasus terakhir ini, semuanya didasarkan pada perbandingan rumus statistik untuk frekuensi penggunaan dalam karya asli dan kontroversial. Tidak perlu berbicara tentang relativitas dan perkiraan yang sangat besar dari hasil yang diperoleh dengan metode tersebut. Bagaimanapun, frekuensi penggunaan relatif berubah tidak hanya dengan usia pengarang, tetapi juga bergantung pada genre, plot, dan juga lingkungan historis dari karya tersebut (bandingkan, misalnya, "Roti" dan "Peter I" oleh A. Tolstoy).<120>

Memperdalam metode yang dijelaskan di atas, stilostatistik sebagai karakteristik gaya mulai menggunakan kriteria stabilitas frekuensi relatif dari kata-kata yang paling umum digunakan. Metode yang digunakan dalam kasus ini dapat diilustrasikan dengan pemrosesan statistik cerita Pushkin "The Captain's Daughter" oleh Esselson dan Epstein di Institute of Slavic Languages ​​​​di University of Detroit (USA) 7 3 . Seluruh teks cerita (sekitar 30.000 kemunculan kata) menjadi sasaran survei, dan kemudian bagian yang berisi sekitar 10.000 dan 5.000 kemunculan. Selanjutnya, untuk menentukan stabilitas frekuensi relatif penggunaan kata, 102 kata yang paling umum digunakan (dengan frekuensi 1160 kali hingga 35) dibandingkan dengan frekuensi relatif yang dihitung (dibuat berdasarkan bagian selektif) dengan yang sebenarnya. Misalnya, penyatuan "dan" digunakan 1.160 kali di sepanjang cerita. Dalam bagian yang berisi 5.000 kemunculan semua kata, konjungsi ini diharapkan digunakan 5.000 x 1.160:30.000, atau dibulatkan 193 kali, dan dalam bagian yang berisi 10.000 kemunculan semua kata, diharapkan digunakan 10.000 x 1.160 : 30.000, atau 386 kali. Perbandingan data yang diperoleh dengan menggunakan perhitungan semacam ini dengan data sebenarnya menunjukkan penyimpangan yang sangat tipis (dalam 5%). Berdasarkan perhitungan tersebut, ditemukan bahwa dalam cerita Pushkin ini, preposisi "k" digunakan dua kali lebih sering daripada "y", dan kata ganti "kamu" digunakan tiga kali lebih sering daripada "mereka", dll. , terlepas dari semua perubahan plot, baik di sepanjang cerita maupun di bagian-bagian individualnya, terdapat stabilitas dalam frekuensi relatif penggunaan kata-kata. Apa yang diamati dalam kaitannya dengan beberapa kata (paling umum) mungkin berlaku untuk semua kata yang digunakan dalam karya tersebut. Oleh karena itu, gaya pengarang dapat dicirikan oleh rasio tertentu dari variabilitas frekuensi rata-rata penggunaan kata dengan frekuensi umum untuk bahasa tertentu.<121>frekuensi penggunaannya. Rasio ini dianggap sebagai karakteristik kuantitatif objektif dari gaya pengarang.

Elemen formal lain dari struktur bahasa dipelajari dengan cara yang sama. Jadi, misalnya, V. Fuchs menjadikan ciri-ciri metrik dari karya-karya Goethe, Rilke, Caesar, Sallust, dll.

Kriteria stabilitas frekuensi relatif penggunaan kata-kata, sambil mengklarifikasi teknik karakterisasi gaya kuantitatif, tidak memperkenalkan sesuatu yang baru secara fundamental dibandingkan dengan metode yang lebih primitif yang dianalisis di atas. Semua metode stilostatistik pada akhirnya menghasilkan hasil "objektif" yang sama tidak memihaknya, meluncur di atas permukaan lidah dan hanya bergantung pada tanda-tanda eksternal murni. Metode kuantitatif ternyata tidak mampu memusatkan perhatian pada perbedaan kualitatif materi yang diteliti dan justru meratakan semua objek yang diteliti.

Dimana spesifikasi maksimum dibutuhkan, kriteria yang paling umum ditawarkan; karakteristik kualitatif dinyatakan dalam bahasa kuantitas. Ini bukan hanya kontradiksi logis, tetapi juga ketidaksepakatan dengan sifat benda. Memang, apa yang terjadi jika kita mencoba mendapatkan karakteristik gaya komparatif (yaitu, kualitatif) dari karya Alexander Gerasimov dan Rembrandt berdasarkan rasio kuantitatif cat merah dan hitam pada kanvas mereka? Tampaknya itu benar-benar omong kosong. Sejauh mana informasi kuantitatif yang sepenuhnya "objektif" tentang data fisik seseorang mampu memberi kita gambaran tentang segala sesuatu yang mencirikan seseorang dan membuatnya esensi sejati? Jelas tidak ada. Mereka hanya dapat berfungsi sebagai tanda individu yang membedakan satu orang dari orang lain, seperti jejak belitan di ibu jari. Situasinya mirip dengan karakteristik kuantitatif gaya sastra. Jika Anda melihat lebih dekat, mereka memberikan data yang sangat sedikit untuk menilai gaya yang sebenarnya<122>kualitas bahasa penulis, serta deskripsi belitan di jari untuk studi psikologi manusia.

Untuk semua yang telah dikatakan, harus ditambahkan bahwa di masa lalu, di apa yang disebut sekolah formal kritik sastra, telah dilakukan upaya untuk mempelajari gaya penulis secara kuantitatif, ketika julukan, metafora, dan elemen ritmis-melodi ayat dihitung. Namun, upaya ini tidak dikembangkan lebih lanjut.

Area lain penerapan metode matematika untuk mempelajari fenomena linguistik dapat dikelompokkan dengan nama statistik linguistik. Ini berusaha untuk mengganggu pertanyaan mendasar dari teori bahasa dan dengan demikian untuk mendapatkan panggilan di bidang linguistik yang tepat. Untuk mengenal arah ini, yang terbaik adalah beralih ke karya Herdan yang telah disebutkan, dalam kata-kata salah satu dari banyak pengulasnya, "buku yang sangat megah" 7 5 , menerima, bagaimanapun, tanggapan yang luas di kalangan ahli bahasa 7 6 . Mengingat fakta bahwa Kherdan (sebagaimana telah disebutkan di atas) berusaha mengumpulkan dalam bukunya segala sesuatu yang paling penting di bidang penerapan metode matematika untuk masalah linguistik, dalam bukunya kita sebenarnya tidak terlalu banyak membahas Kherdan melainkan dengan keseluruhan kecenderungan. Seperti yang ditunjukkan oleh judul buku, "Bahasa sebagai Pilihan dan Probabilitas", fokus utamanya adalah untuk mengklarifikasi apa yang tersisa dalam bahasa untuk pilihan bebas pembicara dan apa yang disebabkan oleh struktur bahasa yang imanen, seperti halnya menentukan perbandingan kuantitatif unsur-unsur orde pertama dan kedua. Buku Kherdan memberikan informasi yang hampir lengkap tentang semua pekerjaan di bidang ini yang dilakukan oleh perwakilan dari berbagai spesialisasi.<123>(filsuf, ahli bahasa, ahli matematika, teknisi), tetapi tidak terbatas pada ini dan mencakup banyak pengamatan, pertimbangan, dan kesimpulan asli dari penulis sendiri. Sebagai karya ringkasan, ini memberikan gambaran bagus tentang metode kuantitatif yang digunakan, dan hasil yang dicapai dengan bantuannya. Pertanyaan-pertanyaan yang kami gabungkan secara kondisional ke dalam bagian statistik linguistik dibahas di bagian kedua dan keempat buku ini.

Dari sekian banyak kasus penerapan metode statistik matematika untuk mempelajari masalah linguistik, kami akan fokus pada yang paling umum, yang pada saat yang sama dapat dianggap sebagai yang paling khas. Menggunakan data dari penulis lain - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 dan lain-lain, serta mengutip penelitiannya sendiri yang menentukan frekuensi relatif sebaran fonem, huruf, panjang kata (diukur dengan jumlah huruf dan suku kata) , bentuk tata bahasa dan elemen metrik dalam heksameter Latin dan Yunani, Herdan menetapkan fakta stabilitas frekuensi relatif elemen linguistik sebagai karakteristik umum dari semua struktur linguistik. Dia menurunkan aturan berikut: “Proporsi elemen linguistik yang termasuk dalam satu atau beberapa tingkat atau bidang pengkodean linguistik - fonologi, tata bahasa, metrik - tetap kurang lebih konstan untuk bahasa tertentu, dalam periode perkembangan tertentu dan dalam batas observasi yang cukup luas dan dilakukan secara tidak memihak. » 8 2 . Aturan ini, yang disebut Herdan sebagai hukum dasar bahasa, ia berusaha untuk menafsirkan dan memperluasnya dengan cara tertentu. “Dia,” tulis Herdan tentang hukum ini, “adalah ekspresi dari fakta bahwa bahkan di sini, di mana kehendak manusia dan kebebasan memilih diberikan<124>kerangka kerja terluas, di mana pilihan sadar dan permainan riang bergantian satu sama lain, secara umum ada stabilitas yang cukup besar... dalam tata bahasa, tetapi juga dalam kaitannya dengan frekuensi penggunaan fonem tertentu, unit leksikal (kata) dan fonem tata bahasa dan konstruksi; dengan kata lain kesamaannya tidak hanya pada apa yang digunakan, tetapi juga pada seberapa sering digunakan” 8 3 . Situasi ini disebabkan oleh alasan yang dapat dimengerti, tetapi ini menimbulkan kesimpulan baru. Ketika memeriksa teks atau segmen yang berbeda dari bahasa tertentu, misalnya, ditemukan bahwa frekuensi relatif penggunaan fonem tertentu (atau elemen ucapan lainnya) oleh orang yang berbeda pada dasarnya tetap sama. Hal ini mengarah pada interpretasi bentuk ucapan individu sebagai beberapa fluktuasi dalam kemungkinan konstan menggunakan fonem yang dipertimbangkan dalam bahasa tertentu. Dengan demikian, ternyata dalam kegiatan berbicara seseorang tunduk pada hukum probabilitas tertentu dalam kaitannya dengan jumlah unsur linguistik yang digunakan. Dan kemudian, ketika kita mengamati sejumlah besar unsur linguistik dalam sekumpulan besar teks atau segmen tuturan, kita mendapat kesan ketergantungan kausal dalam arti bahwa dalam hal ini juga terdapat determinasi dalam kaitannya dengan penggunaan unsur linguistik tertentu. Dengan kata lain, ternyata dapat diterima untuk menyatakan bahwa apa yang tampaknya menjadi hubungan sebab akibat dari sudut pandang intuitif, secara kuantitatif adalah sebuah probabilitas 8 4 . Jelas bahwa semakin besar totalnya<125>kekhususan teks atau segmen tuturan yang diteliti, akan semakin jelas kestabilan frekuensi relatif penggunaan unsur linguistik akan terwujud juga dalam penggunaan individu (hukum bilangan besar). Dari sini yang baru dibuat kesimpulan umum bahwa bahasa adalah fenomena massa dan harus diperlakukan seperti itu.

Kesimpulan ini, yang dicapai berdasarkan perhitungan frekuensi unsur-unsur fonetik, kata-kata dan bentuk-bentuk gramatikal, yang bersama-sama membentuk bahasa, kemudian diterapkan pada "penafsiran statistik" pembagian Saussure menjadi "bahasa" (lalangue) dan "ucapan" (laparole). ). Menurut Saussure, "bahasa" adalah seperangkat kebiasaan linguistik yang memungkinkan komunikasi antara anggota komunitas linguistik tertentu. Ini adalah realitas sosial, sebuah "fenomena massa", wajib bagi semua orang yang berbicara bahasa ini. Herdan, seperti yang ditunjukkan, membuktikan bahwa anggota komunitas satu bahasa mirip satu sama lain tidak hanya karena mereka menggunakan fonem, satuan leksikal, dan bentuk tata bahasa yang sama, tetapi juga karena semua elemen ini digunakan dengan frekuensi yang sama. Dengan demikian, definisi statistiknya tentang "bahasa" mengambil bentuk berikut: "bahasa" (lalangue) adalah totalitas unsur-unsur linguistik umum ditambah kemungkinan relatifnya untuk digunakan.

Definisi "bahasa" ini juga merupakan titik awal untuk interpretasi statistik yang sesuai dari "ucapan", yang menurut Saussure, merupakan ucapan individu. Membandingkan "bahasa" sebagai fenomena sosial dari "ucapan" sebagai fenomena individu, Saussure menulis: "Ucapan adalah tindakan individu dari kemauan dan pemahaman, di mana perlu untuk membedakan: 1. kombinasi dengan mana subjek yang berbicara menggunakan bahasa kode untuk mengungkapkan pemikiran pribadinya; 2. suatu mekanisme psikofisik yang memungkinkannya mengobjektifkan kombinasi-kombinasi ini” 8 5 . Karena "bahasa" dalam statistik linguistik dianggap sebagai sekumpulan elemen dengan kerabat tertentu<126>probabilitas tertentu penggunaannya, sejauh itu mencakup totalitas statistik atau ansambel (populasi) sebagai karakteristik paling esensial dan dapat dipertimbangkan dalam aspek ini. Sejalan dengan itu, "ucapan" berubah menjadi sampel terpisah yang diambil dari "bahasa" sebagai agregat statistik. Probabilitas dalam hal ini ditentukan oleh hubungan "ucapan" dengan "bahasa" (dalam pemahaman "kuantitatif" mereka), dan distribusi frekuensi relatif dari penggunaan elemen bahasa yang berbeda ditafsirkan sebagai hasil dari a "pilihan" kolektif (pilihan) dalam periode kronologis tertentu dari keberadaan bahasa. Menyadari bahwa interpretasi tentang perbedaan antara "bahasa" dan "ucapan" seperti itu dibangun di atas dasar yang sama sekali berbeda dari interpretasi Saussure, Herdan menulis dalam hal ini: "Modifikasi kecil yang tampaknya dari konsep Saussure ini memiliki konsekuensi penting bahwa "bahasa" ( lalangue ) sekarang memperoleh karakteristik penting dalam bentuk agregat statistik (populasi). Populasi ini dicirikan oleh frekuensi relatif tertentu atau probabilitas fluktuasi, artinya setiap unsur linguistik termasuk dalam tingkatan linguistik tertentu. Dalam hal ini, "ucapan" (laparole), sesuai dengan artinya, ternyata merupakan istilah untuk mendefinisikan sampel statistik yang diambil dari "bahasa" sebagai populasi statistik. Menjadi jelas bahwa pilihan (pilihan) muncul di sini dalam bentuk rasio "ucapan" dengan "bahasa", yaitu rasio sampel yang diambil secara acak dengan agregat statistik (populasi). Urutan distribusi frekuensi itu sendiri, sebagai deposit aktivitas bicara komunitas linguistik selama berabad-abad, merupakan elemen pilihan (pilihan), tetapi bukan pilihan individu, seperti dalam gaya, tetapi pilihan kolektif. Dengan menggunakan metafora, di sini kita dapat berbicara tentang pilihan yang dibuat oleh semangat bahasa, jika kita memahami prinsip-prinsip komunikasi linguistik, yang sesuai dengan kompleks data mental anggota komunitas linguistik tertentu. Kestabilan deret adalah hasil dari probabilitas (peluang)» 8 6 .

Kasus khusus dari penerapan prinsip yang disebutkan<127>pa adalah batasan dalam bahasa fenomena normatif dari "pengecualian" (penyimpangan). Dalam statistik linguistik, dikatakan bahwa metode statistik memungkinkan Anda menghilangkan yang sudah ada masalah ini ketidakjelasan dan menetapkan kriteria yang jelas untuk membedakan antara fenomena ini. Jika norma dipahami sebagai populasi statistik (dalam pengertian di atas), dan pengecualian (atau kesalahan) adalah penyimpangan dari frekuensi yang ditunjukkan oleh populasi statistik, maka solusi kuantitatif dari pertanyaan tersebut akan muncul dengan sendirinya. Semuanya bermuara pada hubungan statistik antara "populasi" dan "outlier". Jika frekuensi yang diamati dalam sampel individu menyimpang dari probabilitas karena populasi statistik lebih dari yang ditentukan oleh serangkaian jumlah sampel, maka kami memiliki alasan untuk menyimpulkan bahwa garis demarkasi antara "sama" (norma) dan "tidak sama" (pengecualian) dilanggar.

Perbedaan kuantitatif antara "bahasa" dan "ucapan" juga digunakan untuk membedakan dua jenis elemen linguistik: gramatikal dan leksikal. Titik awal untuk memecahkan masalah ini, yang seringkali menimbulkan kesulitan besar dari sudut pandang linguistik, adalah asumsi bahwa tingkat frekuensi elemen gramatikal berbeda dengan unit leksikal. Hal ini diduga terkait dengan "generalisasi" elemen tata bahasa, perbedaannya dari konsep yang ditetapkan oleh unit leksikal. Selain itu, unsur-unsur tata bahasa dianggap, sebagai aturan, volumenya jauh lebih kecil: sebagai kata-kata independen (mereka termasuk kata ganti, preposisi, kata sambung dan kata-kata resmi) biasanya terdiri dari sejumlah kecil fonem, dan dalam bentuk "bentuk terkait" - dari satu atau dua fonem 8 7 . Semakin kecil unsur linguistiknya, semakin kecil kemampuan "panjangnya" (momen kuantitatif) untuk berfungsi sebagai ciri yang menentukan, dan semakin penting "kualitas" fonem yang diperoleh untuk tujuan ini. Metode apa yang diusulkan untuk memecahkan masalah yang sedang dipertimbangkan? Ini diselesaikan dengan merujuk pada konsep gramatikal yang murni kuantitatif<128>memuat, “Misalkan,” tulis Herdan sehubungan dengan ini, “bahwa kami tertarik untuk membandingkan dua bahasa dalam hal ini. Bagaimana kita menentukan dengan tingkat objektivitas tertentu "beban gramatikal" yang dibawa oleh suatu bahasa? Jelas bahwa muatan ini akan bergantung pada posisi garis demarkasi yang memisahkan tata bahasa dari kosa kata. Pertimbangan pertama yang mungkin muncul di benak kita adalah menentukan seberapa "kompleks" tata bahasa suatu bahasa. Bagaimanapun, "kompleksitas" adalah karakteristik kualitatif, dan konsep "beban gramatikal" adalah karakteristik kuantitatif. Benar, beban sampai batas tertentu bergantung pada kerumitannya, tetapi tidak sepenuhnya. Suatu bahasa dapat dihargai dengan tata bahasa yang sangat kompleks, tetapi hanya sebagian kecil yang digunakan dalam aktivitas bahasa. Kami mendefinisikan "beban gramatikal" sebagai totalitas tata bahasa yang dibawa oleh suatu bahasa ketika ia beraksi, yang segera membawa masalah kami ke ranah linguistik struktural dalam pengertian disiplin yang didefinisikan oleh Saussure. Dalam pemaparan berikut, metode kuantitatif digunakan untuk menentukan perbedaan antara bahasa, tergantung di mana letak batasnya, memisahkan tata bahasa dari kosakata” 8 8 . Dengan kata lain, perbedaan bahasa dalam hal ini harus direduksi menjadi perbedaan hubungan numerik antara unsur gramatikal dan leksikal.

Bahan-bahan yang kami miliki melukis gambar berikut. DI DALAM bahasa Inggris(hanya "kata-kata tata bahasa" yang diperhitungkan: kata ganti, atau, sebagaimana mereka juga disebut, "pengganti", preposisi, konjungsi dan kata kerja bantu) dalam segmen yang mencakup 78.633 kasus penggunaan semua kata (1027 kata berbeda), 53.102 kasus penggunaan elemen tata bahasa, atau lebih tepatnya, "kata tata bahasa" (149 kata berbeda), ditemukan, yaitu 67,53 % pada 15,8% kata yang berbeda. Demikian data Deway 8 9 . Data lain menunjukkan persentase yang berbeda<129>rasio: 57,1% dengan 5,4% kata berbeda 9 0 . Perbedaan yang signifikan ini dijelaskan oleh perbedaan antara bahasa tertulis dan lisan. Formulir tertulis bahasa (data pertama) diduga menggunakan lebih banyak unsur tata bahasa daripada bahasa lisan (kasus kedua). Dalam Divine Comedy Dante (setelah aslinya Italia), Mariotti menetapkan 54,4% dari kemunculan "kata-kata tata bahasa".

Cara lain dan, tampaknya, cara yang lebih sempurna untuk menentukan muatan tata bahasa suatu bahasa adalah dengan menghitung fonem yang termasuk dalam unsur tata bahasa. Dalam hal ini, tidak hanya kata tata bahasa independen yang diperhitungkan, tetapi juga bentuk terkait. Berikut adalah mungkin berbagai pilihan. Misalnya, menentukan frekuensi relatif penggunaan fonem konsonan individu dalam elemen tata bahasa dan membandingkannya dengan frekuensi penggunaan total fonem yang sama ini (data akhir dari rasio semacam itu dalam bahasa Inggris memberikan proporsi 99,9% hingga 100.000 - penggunaan total); atau perbandingan konsonan serupa menurut kelompok klasifikasi terpisah (labial, palatal, velar dan fonem lainnya). Rasio akhir di sini berbentuk proporsi 56,47% (dalam unsur gramatikal) sampai 60,25% (dalam pemakaian total); atau perbandingan yang sama dari fonem konsonan awal (dalam hal ini, rasionya adalah 100,2% dalam kata gramatikal dengan 99,95 dalam penggunaan total). Operasi statistik lain yang lebih kompleks juga dimungkinkan, yang, bagaimanapun, menghasilkan ekspresi kuantitatif yang serupa dari masalah yang diteliti.

Data kuantitatif yang diberikan berfungsi sebagai dasar untuk kesimpulan umum. Itu bermuara pada fakta bahwa distribusi fonem dalam elemen tata bahasa menentukan sifat distribusi (dalam istilah numerik, tentu saja) fonem dalam bahasa secara keseluruhan. Dan ini, pada gilirannya, memungkinkan kita untuk menyimpulkan bahwa penggunaan elemen tata bahasa bergantung pada pilihan individu dan merupakan bagian dari ekspresi linguistik yang dikendalikan oleh probabilitas.<130>ness. Kesimpulan spekulatif ini diperkuat dengan perhitungan bentuk tata bahasa dalam bahasa Rusia yang dibuat oleh Esselson 9 1 . Studi ini menjadi sasaran 46896 kata yang diambil dari sumber II (karya Griboedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov dan N. Ostrovsky). Mereka dibagi menjadi kata sehari-hari (17.756 kata atau 37,9%) dan non-sehari-hari (29140 kata atau 62,1%). Kemudian seluruh rangkaian kata dibagi menjadi 4 kelompok tergantung pada sifat gramatikalnya: kelompok pertama memasukkan kata benda, kata sifat, kata sifat dalam fungsi kata benda, kata ganti, dan angka infleksi; di grup ke-2 - kata kerja; dalam kelompok ke-3 - participle verbal, partisip dalam fungsi kata sifat dan kata benda dan gerund; pada kelompok ke-4 - bentuk kata keterangan, preposisi, konjungsi dan partikel yang tidak berubah-ubah. Hasil ringkasan (juga tabel dengan data untuk masing-masing penulis diberikan) memberikan rasio berikut:

kelompok pertama

kelompok ke-2

kelompok ke-3

kelompok ke-4

bahasa sehari-hari

pendiam

Herdan mencirikan pertimbangan data kuantitatif yang diperoleh dengan kata-kata berikut: “Mereka membenarkan kesimpulan bahwa elemen tata bahasa harus dipertimbangkan sebagai faktor yang menentukan kemungkinan ekspresi linguistik. Kesimpulan seperti itu menghindari kualifikasi yang memberatkan dari setiap kata yang digunakan. Jelas bahwa, karena tata bahasa dan kosa kata tidak disimpan dalam cangkang kedap air, tidak ada "pilihan" murni atau "kebetulan" murni. Baik tata bahasa maupun kosa kata mengandung kedua elemen tersebut, meskipun dalam proporsi yang sangat bervariasi” 9 2 .<131>

Sebagian besar buku Herdan dikhususkan untuk mempelajari dualitas atau dualitas dalam bahasa, dan konsep dualitas itu sendiri didasarkan pada karakteristik matematika.

Dengan demikian, teorema dalam geometri projektif dapat disusun dalam dua deret, sehingga setiap teorema deret yang satu dapat diperoleh dari beberapa teorema deret lainnya dengan mengganti kata-kata tersebut. dot Dan lurus. Misalnya, jika sebuah pernyataan diberikan: "setiap titik yang berbeda milik satu dan hanya satu garis," maka kita dapat menurunkan pernyataan yang sesuai darinya: "setiap dua garis berbeda milik satu dan hanya satu titik." Metode lain untuk menentukan dualitas adalah memplot sepanjang absis dan sumbu y rencana yang berbeda fenomena yang sedang dipelajari. Jadi, seperti, misalnya, Yul 9 3, frekuensi penggunaan yang berbeda dihitung di sepanjang absis, dan jumlah unit leksikal yang frekuensinya ditentukan, dll., Dihitung di sepanjang ordinat.Beginilah konsep dualitas ditafsirkan, diduga sama berlaku untuk penelitian linguistik.

Di bawah konsep dualitas yang didefinisikan dengan cara ini, yang dalam semua kasus sebenarnya memiliki karakter kode biner dan yang juga dianggap sebagai fitur paling esensial dari struktur linguistik, fenomena dengan kualitas yang sangat berbeda dibawa masuk, memungkinkan pertentangan di sepanjang dua bidang. : pembagian penggunaan kata menurut sifat satuan leksikal dan pembagian satuan leksikal menurut frekuensi penggunaan kata; bentuk ucapan tertulis dan lisan; elemen leksikal dan tata bahasa; Sinonim dan antonim; fonem dan representasi grafisnya; dapat didefinisikan dan didefinisikan (signifiant dan signifiy Saussure), dll.

Setelah studi kuantitatif tentang dualitas tertentu, fenomena linguistik atau "teks" terbatas, sebagai suatu peraturan, sebuah kesimpulan ditarik, yang dikaitkan dengan kualitas universalitas linguistik. Sifat dari kesimpulan tersebut dan cara mereka dibenarkan dapat dilihat pada contoh<132>studi tentang dualitas kata dan konsep (sebenarnya, kita berbicara tentang rasio panjang kata dan volume konsep - harus diingat bahwa penggunaan istilah linguistik dan istilah lain yang sangat bebas di karya seperti itu sering membuat pemahaman menjadi sangat sulit). Penting untuk dicatat bahwa sebagai bahan yang menjadi sumber pengamatan jenis dualitas linguistik ini, berikut ini digunakan: nomenklatur penyakit internasional (sekitar 1000 nama) dan daftar umum penyakit di Inggris dan Wells untuk tahun 1949 Dalam hal ini, kesimpulan umum berikut dibuat: “ Setiap konsep yang menunjukkan gagasan umum memiliki apa yang disebut "bola" atau "volume". Ia memungkinkan melalui mediumnya untuk memikirkan banyak objek atau konsep lain yang berada di dalam “ruang”nya. Di sisi lain, semua item yang diperlukan untuk mendefinisikan sebuah konsep merupakan apa yang disebut "isinya". Volume dan konten saling berkorelasi - semakin kecil kontennya dan, karenanya, semakin abstrak konsepnya, semakin besar ruang lingkup atau volumenya, yaitu, semakin banyak objek yang dibawa di bawahnya. Ini dapat dilihat sebagai analogi (dalam bidang konseptual) dengan prinsip-prinsip pengkodean, yang menurutnya panjang simbol dan frekuensi penggunaan saling bergantung” 9 4 .

Prinsip dualitas juga berlaku untuk masalah-masalah tertentu. Misalnya saat menetapkan persamaan arti dari dua kata bahasa berbeda. Sebagai hasil dari mempelajari kamus Inggris-Jerman oleh Muret-Zanders menggunakan metode iterasi matematis, disimpulkan bahwa probabilitas penggunaan kata bahasa Inggris dengan satu atau lebih arti dalam terjemahan bahasa Jerman tetap konstan untuk setiap huruf awal di seluruh kamus 9 5 . Pertimbangan urutan kata dalam kamus Cina mengarah pada kesimpulan bahwa itu bersifat taksonomi, karena jumlah goresan dalam karakter menunjukkan tempatnya (sebagai radikal independen atau subkelas tertentu yang berada di bawah radikal). Taksonomi adalah prinsip subordinasi klasifikasi yang digunakan dalam zoologi dan botani. Kherdan mengklaim itu<133>dasar leksikografi Cina juga dibangun di atas prinsip taksonomi 9 6, dll.

Membuat penilaian umum bidang penerapan metode matematika ini untuk mempelajari masalah linguistik (yaitu, statistik linguistik), tampaknya, perlu untuk melanjutkan dari posisi yang dirumuskan oleh Ettinger: “Matematika dapat digunakan secara efektif dalam layanan linguistik hanya ketika ahli bahasa jelas batas nyata penerapannya, serta kemungkinan model matematika yang digunakan” 9 7 . Dengan kata lain, kita dapat berbicara tentang linguistik matematika ketika metode matematika membuktikan kesesuaiannya untuk memecahkan masalah linguistik yang tepat, yang secara keseluruhan merupakan ilmu bahasa. Jika tidak demikian, meskipun ini dapat membuka aspek baru penelitian ilmiah, maka dalam hal ini Anda dapat berbicara tentang apa saja, tetapi bukan tentang linguistik - dalam hal ini, kami tidak bermaksud demikian jenis yang berbeda linguistik terapan (akan dibahas di bawah), dan linguistik ilmiah, atau teoretis. Berdasarkan posisi ini, perlu dicatat bahwa dari sudut pandang ahli bahasa, banyak statistik linguistik yang diragukan bahkan membingungkan.

Mari kita beralih ke analisis hanya dua contoh (agar tidak mengacaukan presentasi), menetapkan bahwa keberatan yang sangat signifikan dapat dibuat untuk masing-masing contoh. Di sini kita memiliki perbedaan kuantitatif antara satuan gramatikal dan leksikal. Ternyata untuk membuat perbedaan seperti itu, perlu diketahui terlebih dahulu apa yang termasuk dalam bidang tata bahasa, dan apa yang termasuk dalam kosa kata, karena "beban gramatikal" bahasa (yaitu, totalitas elemen gramatikal). digunakan dalam ucapan), seperti ditunjukkan dalam kutipan di atas, "bergantung pada garis demarkasi yang memisahkan kosa kata dari tata bahasa." Tanpa mengetahui di mana garis ini terletak, oleh karena itu tidak mungkin untuk menarik perbedaan yang ditunjukkan. Lalu apa arti dari metode kuantitatif membedakan leksikal dari tata bahasa?<134>matic? Namun, untuk Herdan, dia tidak terlalu memikirkan masalah ini dan dengan berani mengklasifikasikan elemen linguistik, merujuk pada elemen tata bahasa "bentuk yang terhubung", yang dilihat dari penyajiannya, harus dipahami sebagai infleksi eksternal, dan "kata tata bahasa", yang meliputi preposisi , konjungsi, kata kerja bantu dan kata ganti - yang terakhir berdasarkan fakta bahwa mereka adalah "pengganti". Tetapi jika kita hanya berbicara tentang kualitas kata ganti ini dan atas dasar ini menghubungkannya dengan elemen tata bahasa, maka, jelas, kata-kata seperti "disebutkan sebelumnya", "bernama", "diberikan", dll., Juga harus dikaitkan dengannya, jadi bagaimana mereka juga bertindak sebagai deputi. Sehubungan dengan metode pemisahan elemen tata bahasa yang digunakan dalam statistik linguistik, pertanyaan yang muncul secara alami tentang bagaimana menangani dalam kasus ini dengan fenomena tata bahasa "non-formal" seperti urutan kata, nada, morfem nol, hubungan paradigmatik (beberapa dari fenomena ini , omong-omong, temukan refleksi dalam bahasa-bahasa yang dipelajari dengan metode matematika)? Cara menggambar perbedaan dalam bahasa dengan infleksi internal yang kaya (seperti, misalnya, dalam bahasa Semit), di mana tidak hanya secara tata bahasa mengubah akar (radikal), tetapi juga memberinya keberadaan leksikal, karena akar tanpa permutasi memiliki tidak ada keberadaan nyata dalam bahasa? Apa yang harus dipahami dengan kompleksitas tata bahasa suatu bahasa, dengan kriteria apa yang ditentukan? Jika poin kuantitatif, yang dalam hal ini ditekankan dengan segala cara yang mungkin, maka salah satu bahasa yang paling sulit secara tata bahasa adalah bahasa Inggris, yang memiliki konstruksi seperti Ishallhavebeencalling atau Hewouldhavebeencalling. Dalam kalimat-kalimat ini, hanya panggilan yang dapat diklasifikasikan sebagai leksikal, dan oleh karena itu, yang lainnya harus dianggap tata bahasa. Dasar apa yang ada untuk menghubungkan frekuensi penggunaan unsur-unsur tata bahasa dengan generalitas atau keabstrakan makna kata-kata tata bahasa? Bagaimanapun, cukup jelas bahwa frekuensi penggunaan unsur-unsur tata bahasa yang relatif besar ditentukan oleh fungsinya dalam konstruksi kalimat, dan untuk keabstrakan makna, sangat mudah untuk menemukan yang besar.<135>jumlah elemen leksikal yang dapat dengan mudah bersaing dengan elemen tata bahasa dalam hal ini, sebagian besar lebih rendah dari frekuensinya (misalnya, makhluk, keberadaan, ekstensi, ruang, substansi dll).

Absurditas serupa muncul di hadapan kita dalam kasus definisi dualitas (dualitas) kata dan konsep. Penting untuk memiliki pemahaman yang sangat aneh tentang esensi struktural bahasa untuk menelitinya menggunakan nomenklatur penyakit dan daftar penyakit rumah sakit, yang, seperti ditunjukkan di atas, berfungsi sebagai bahan sumber untuk linguistik yang sangat penting. kesimpulan. Tanpa memikirkan penggunaan istilah-istilah yang sama sekali tidak jelas yang tidak memiliki keberadaan linguistik, seperti bidang, volume, dan isi suatu konsep (omong-omong, makna leksikal dari kata dan konsep yang ditunjukkan oleh istilah ilmiah itu terlalu kasar). bingung), mari kita beralih ke kesimpulan yang dibuat dalam kasus ini. Sebagaimana dinyatakan di atas, kita berurusan dengan pernyataan bahwa "cakupan dan isi saling berkorelasi." Seluruh rangkaian penalaran yang memberikan dasar untuk kesimpulan seperti itu, serta metode operasi matematika dari fakta linguistik, dengan jelas menunjukkan bahwa dalam hal ini satu kualitas bahasa yang sangat esensial diabaikan sama sekali, yang mengganggu semua perhitungan yang sedang dilakukan. : kemampuan untuk mengungkapkan hal yang sama " konten" oleh unit linguistik dari "volume" yang berbeda, yang tidak diragukan lagi memiliki frekuensi penggunaan relatif yang berbeda. Jadi, kami dapat menunjuk orang yang sama dengan Petrov, kenalan saya, dia, seorang Moskow, seorang pemuda, seorang pegawai universitas, saudara laki-laki istri saya, seorang pria yang kami temui di jembatan, dll. tidak diragukan lagi hanya kesimpulan pribadi, yang, bagaimanapun, seperti yang ditunjukkan, signifikansi universal melekat, tetapi juga kelayakan penerapan metode kuantitatif itu sendiri untuk masalah linguistik semacam itu.

Namun terkadang ahli bahasa ditawari kesimpulan yang validitasnya tidak diragukan lagi. Inilah "hukum dasar bahasa", yang terdiri dari fakta bahwa dalam bahasa terdapat stabilitas tertentu dari unsur-unsurnya dan frekuensi relatif penyebutannya.<136>konsumsi. Masalah dengan penemuan semacam ini, bagaimanapun, adalah bahwa mereka telah lama dikenal oleh para ahli bahasa. Lagi pula, sangat jelas bahwa jika bahasa tidak memiliki stabilitas tertentu dan setiap anggota komunitas linguistik tertentu dengan bebas memvariasikan unsur-unsur bahasa, maka komunikasi timbal balik tidak akan mungkin terjadi dan keberadaan bahasa itu sendiri akan menjadi tidak berarti. . Adapun distribusi frekuensi relatif dari penggunaan elemen individu bahasa, ia menemukan ekspresinya dalam linguistik dalam bentuk alokasi kategori kosakata dan tata bahasa pasif dan aktif, yang sangat diperhatikan oleh L. V. Shcherba. Dalam hal ini, metode statistik hanya dapat membantu ahli bahasa dalam mendistribusikan elemen linguistik tertentu sesuai dengan kategori frekuensi relatif penggunaannya, tetapi mereka tidak memiliki alasan untuk mengklaim menemukan pola baru yang bernilai bagi linguistik teoretis.

Di sisi lain, statistik linguistik menawarkan sejumlah kesimpulan yang benar-benar "asli" yang sangat menunjukkan sifat pemikiran ilmiah para penganutnya. Jadi, "kosa kata politik" dalam karya Churchill, Benes, Halifax, Stresemann, dan lainnya dipelajari dengan metode statistik yang kompleks, dan terjemahan karya mereka ke dalam bahasa Inggris digunakan dalam perhitungan untuk penulis yang tidak berbahasa Inggris. Hasil perhitungan disajikan dalam bentuk banyak tabel, rumus matematika dan persamaan. Interpretasi linguistik dari data kuantitatif dalam kasus ini direduksi menjadi fakta bahwa penggunaan "kosakata politik" Churchill adalah yang paling khas (?) untuk kelompok penulis ini dan bahwa penggunaan kata-kata Churchill dalam kasus-kasus di mana dia berurusan dengan masalah politik adalah tipikal. dari kelompok pidato bahasa Inggris.9 8 .

Dalam kasus lain, setelah manipulasi statistik yang tepat, disimpulkan bahwa Hitler melanggar dualitas antara "bahasa" dan "ucapan" dalam pengertian kuantitatif istilah-istilah ini dalam penggunaan Nazi Jerman. Kasus khusus penghancuran dualitas ini adalah pemahaman literal<137>putaran metaforis (misalnya, "tuangkan garam ke luka terbuka"). Nazi Jerman mencap dirinya dengan begitu banyak tindakan tidak manusiawi sehingga hampir tidak perlu untuk menghukumnya atas kekejaman bahasa ini 9 9 . Menurut Kherdan, definisi Marx tentang bahasa sebagai realitas langsung dari pemikiran juga mengarah pada pelanggaran dualitas linguistik, dan hukum dialektika tentang transisi suatu fenomena menjadi kebalikannya, menurut pendapatnya, hukum linguistik yang disalahpahami tentang dualitas. bahasa. Penafsiran seperti itu berbicara sendiri.

Akhirnya, kelemahan umum yang melekat dalam semua kasus di atas dari metode kuantitatif mempelajari materi linguistik dan dengan demikian memperoleh karakter metodologis adalah pendekatan elemen linguistik sebagai seperangkat fakta mekanis yang benar-benar independen satu sama lain, yang sesuai dengan itu, jika ada. atau pola, mereka hanya merujuk pada hubungan numerik dari distribusi fakta otonom, di luar ketergantungan sistemiknya. Benar, J. Watmou mencoba dengan segala cara yang mungkin untuk memastikan bahwa matematikalah yang lebih baik daripada analisis struktural linguistik apa pun, yang mampu mengungkap ciri-ciri struktural suatu bahasa. “Matematika modern,” tulisnya, “tidak berurusan dengan pengukuran dan kalkulus, yang keakuratannya dibatasi oleh sifatnya, tetapi terutama dengan struktur. Inilah sebabnya mengapa matematika sangat kondusif untuk keakuratan pembelajaran bahasa - sejauh deskripsi terpisah, bahkan lebih terbatas sifatnya, tidak mampu ... Sama seperti dalam fisika, elemen matematika digunakan untuk menggambarkan dunia fisik, karena mereka dianggap sesuai dengan unsur-unsur dunia fisik, maka dalam linguistik matematika unsur-unsur matematika dianggap sesuai dengan unsur-unsur dunia bicara” 101 . Tetapi rumusan pertanyaan seperti itu sama sekali tidak menyelamatkan situasi, karena paling-paling bisa<138>memberikan analisis bahasa baik sebagai struktur fisik, yang masih jauh dari cukup untuk bahasa, dan pada akhirnya analisis masih bersifat mekanistik yang sama, atau sebagai struktur logis-matematis, dan ini memindahkan bahasa ke bidang yang berbeda, dan dalam banyak hal asing baginya. Tidaklah berlebihan untuk dicatat bahwa Watmow meramalkan keberhasilan linguistik matematika hanya di masa depan, dan untuk hasil nyata mereka, dia mengevaluasinya dengan kata-kata berikut: “... hampir semua pekerjaan yang dilakukan hingga saat ini oleh Herdan, Zipf, Yul, Giro (Guiraux) dan lainnya, sama sekali tidak berada di luar ruang lingkup kritik baik dari linguistik maupun matematika; dia sangat terkesan amatir” 103 . Jadi, jika kita tidak mencoba untuk memprediksi masa depan metode matematika dalam penelitian linguistik, tetapi mencoba untuk menghargai apa yang kita miliki saat ini, maka kita harus mengakui bahwa matematika sebenarnya telah terbatas pada bidang linguistik hanya untuk “mengukur dan menghitung”. ”, dan saya tidak dapat memberikan analisis kualitatif bahasa tersebut, menyelidiki strukturnya.<139>

Mari kita coba seobjektif mungkin. Pada bagian tertentu, data kuantitatif ternyata dapat digunakan oleh linguistik, tetapi hanya sebagai tambahan dan terutama pada masalah yang berorientasi praktis. Berkenaan dengan sebagian besar metode kuantitatif untuk mempelajari fenomena linguistik individu, kesimpulan umum R. Brown tidak diragukan lagi dapat dibenarkan: "Mereka dapat dianggap sebagai Kherdan menganggap mereka, tetapi apa arti dari semua ini?" 104 . Bayangkan kita mengajukan pertanyaan: "Apa saja pohon di taman ini?". Dan sebagai tanggapan kita mendapatkan: "Ada seratus pohon di taman ini." Apakah ini jawaban atas pertanyaan kita, dan apakah itu benar-benar masuk akal? Tetapi sehubungan dengan banyak pertanyaan linguistik, metode matematika hanya memberikan jawaban seperti itu.

Namun, ada bidang kegiatan penelitian yang luas, terutama menggunakan metode matematika dan pada saat yang sama mengarahkannya ke materi linguistik, di mana kelayakan kombinasi semacam itu tidak diragukan lagi. “Makna” dari kegiatan penelitian ini, signifikansinya ditentukan oleh tujuan yang dicita-citakan. Itu sudah diuji dalam praktik. Dalam hal ini, kita berbicara tentang masalah yang terkait dengan pembuatan mesin informasi, struktur untuk terjemahan mesin dari tulisan teks ilmiah, otomatisasi terjemahan ucapan lisan dari satu bahasa ke bahasa lain dan dengan semua tugas kompleks yang digabungkan dalam masalah linguistik sibernetika. Seluruh rangkaian masalah seperti itu biasanya diberi nama umum linguistik terapan. Dengan demikian, ini dibedakan dari apa yang disebut linguistik matematika, yang mencakup bidang kerja yang telah ditetapkan di atas sebagai stilostatistik dan statistik linguistik, meskipun sama sekali tidak menghindari pemrosesan statistik materi linguistik. Mungkin ciri linguistik terapan yang paling penting, memisahkannya dari linguistik matematika, seperti diuraikan di atas, adalah bahwa yang pertama memiliki arah yang berlawanan: bukan matematika untuk linguistik, tetapi linguistik.<140>(diformalkan dengan metode matematika) untuk berbagai masalah praktis.

Tidak perlu mengungkapkan isi masalah individu yang sekarang termasuk dalam wilayah linguistik terapan yang sangat luas. Berbeda dengan linguistik matematika, masalah ini secara aktif dibahas dalam literatur linguistik Soviet dan mulai menempati tempat yang semakin menonjol dalam masalah ilmiah lembaga penelitian 105 . Jadi, mereka sudah dikenal oleh komunitas linguistik kita. Namun, keadaan ini tidak membebaskan kita dari kebutuhan untuk merefleksinya, khususnya, dari sudut pandang prinsip-prinsip ilmu bahasa. Ini tidak diragukan lagi akan membantu menghilangkan kesalahpahaman yang semakin sering muncul antara perwakilan ilmu yang sangat jauh satu sama lain dan mengambil bagian dalam pekerjaan pada masalah linguistik terapan, dan akan menguraikan cara konvergensi mereka, di satu sisi. , dan pembatasan bidang penelitian, di sisi lain. Tak perlu dikatakan bahwa pertimbangan berikut akan mewakili sudut pandang ahli bahasa, dan matematikawan perlu tidak hanya mencoba mengasimilasinya, tetapi, sehubungan dengan pertanyaan yang diajukan, berikan interpretasi mereka.

Ahli teori bahasa sama sekali tidak dapat puas dengan fakta bahwa dalam semua kasus<141>bahasa untuk tujuan yang ditetapkan oleh linguistik terapan, dasarnya adalah model matematika. Sejalan dengan itu, pengamatan terhadap fenomena bahasa dan hasil yang diperoleh dengan cara ini diungkapkan dalam istilah dan konsep matematika, yaitu melalui persamaan dan rumus matematika. Mari kita lihat contoh untuk kejelasan. Condon 1 06 dan Zipf 1 07 menetapkan bahwa logaritma frekuensi ( F) kemunculan kata-kata dalam teks besar terletak hampir dalam garis lurus, jika dikorelasikan dalam diagram dengan logaritma pangkat atau pangkat ( R) dari kata-kata ini. Persamaan f=c:r, Di mana Dengan adalah konstanta mencerminkan hubungan ini dalam arti terbatas itu c:r untuk nilai yang ditetapkan R mereproduksi frekuensi yang diamati dengan perkiraan yang bagus. Hubungan antara F Dan R, diungkapkan oleh rumus matematika, adalah model hubungan antara nilai yang diamati dari frekuensi penggunaan dan peringkat, atau peringkat, kata-kata. Ini adalah salah satu kasus pemodelan matematika. 

Seluruh teori informasi seluruhnya didasarkan pada model matematis dari proses komunikasi yang dikembangkan oleh C. Shannon 108 . Ini didefinisikan sebagai "suatu disiplin matematika yang dikhususkan untuk metode menghitung dan memperkirakan jumlah informasi yang terkandung dalam data apa pun, dan studi tentang proses penyimpanan dan pengiriman informasi" (TSB, vol. 51, hal. 128). Dengan demikian, konsep dasar teori informasi menerima ekspresi matematis Informasi diukur dalam binit atau unit biner (kode, yang disamakan dengan bahasa, dengan dua sinyal bersyarat yang sama-sama mungkin mentransmisikan satu unit informasi biner selama transmisi setiap karakter ).-baik kode dan jumlah rata-rata informasi yang dikirimkan<142>formasi. Redundansi dinyatakan sebagai persentase dari total kemampuan pengiriman kode”, 1 09 dst. Dengan cara yang sama, terjemahan mesin membutuhkan pengembangan algoritmik untuk memetakan elemen dari satu bahasa ke bahasa lain, dll. 1 10 . Ini adalah kasus pemodelan lainnya.

Penggunaan model tanpa makna dapat menjadi bantuan yang sangat signifikan, khususnya, kemungkinan besar, dalam memecahkan masalah yang ditetapkan oleh linguistik terapan itu sendiri. Namun, untuk linguistik teoretis, sangat penting bahwa model abstrak, sebagai suatu peraturan, tidak mereproduksi semua fitur dari fenomena nyata, semua kualitas fungsionalnya. Jadi, seorang arsitek, sebelum membangun rumah, dapat membuat modelnya sendiri, yang mereproduksi rumah yang dirancang dengan detail terkecil, dan ini membantunya memecahkan sejumlah masalah praktis terkait pembangunan rumah itu sendiri. Tetapi model rumah seperti itu, betapapun akuratnya, tidak memiliki "fungsi" itu dan tujuan semua rumah dibangun secara umum - tidak mampu menyediakan perumahan bagi seseorang. Situasinya mirip dengan bahasa, di mana model tidak selalu mampu mereproduksi semua kualitasnya. Dalam hal ini, masalahnya semakin diperumit oleh fakta bahwa bukan linguistik, tetapi kriteria matematis yang digunakan untuk membangun model. “Model matematika ... - tulis A. Ettinger, - memainkan peran yang sangat penting dalam semua bidang teknologi, tetapi karena model tersebut adalah alat sintesis, signifikansinya untuk linguistik, yang terutama merupakan disiplin sejarah dan deskriptif, secara alami terbatas ” 1 11 .<143>

Pemodelan matematika suatu bahasa sebenarnya hanya dapat diterapkan pada keadaan statisnya, yang bersyarat bagi seorang ahli bahasa dan pada kenyataannya bertentangan langsung dengan kualitas dasar suatu bahasa, yang bentuk keberadaannya adalah pengembangan. Tak perlu dikatakan bahwa studi statis suatu bahasa sama sekali tidak dikecualikan dari linguistik dan merupakan dasar untuk menyusun tata bahasa dan kamus normatif, tata bahasa deskriptif, tata bahasa praktis dan kamus yang berfungsi sebagai panduan untuk studi praktis bahasa asing, dll. Namun, dalam semua karya semacam itu, yang sebagian besar diterapkan di alam, para ahli bahasa secara sadar membatasi bidang penelitian dan sama sekali tidak menutup mata terhadap aspek lain dari bahasa 1 12 . Dengan pemeriksaan statis terhadap bahasa, khususnya, kualitas bahasa yang terkait dengan sifatnya yang dinamis, seperti produktivitas, ketergantungan pada bentuk pemikiran, dan interaksi yang luas dengan faktor budaya, sosial, politik, sejarah, dan lainnya, benar-benar hilang dari bidang pandang peneliti. Hanya pada bidang sinkronis bahasa dapat dianggap sebagai sistem tanda atau kode konvensional, yang, bagaimanapun, ternyata sepenuhnya tidak dapat dibenarkan segera setelah kita mengadopsi sudut pandang dinamis yang lebih cocok untuk bahasa. Dalam proses perkembangan itulah kualitas bahasa seperti motivasi, polisemi kata yang tidak memiliki batas yang stabil, non-otonomi makna kata dan cangkang bunyinya, dan potensi kreatif kata yang terkait dengan konteksnya. terwujud, dan semua ini sangat bertentangan dengan ciri utama kode atau tanda 1 13 . Jelas, dalam linguistik terapan, seseorang juga dapat memikirkan semua kualitas bahasa ini dan, untuk tujuan praktis, puas dengan, boleh dikatakan, "potret" bahasa tersebut, yang masih mampu memberikan gambaran yang cukup mendekati tentang mekanisme fungsinya.<144>nirovaniya. Namun, setiap "snapshot", jika dianggap sebagai fakta bahasa, dan bukan sebagai fakta sistem kode konvensional, harus dimasukkan dalam proses pergerakan tanpa akhir di mana bahasa selalu ada 1 14 . Ia tidak dapat dipelajari di luar kondisi-kondisi konkrit yang mencirikan gerakan ini, yang meninggalkan jejaknya keadaan yang diberikan bahasa dan mengkondisikan potensi pengembangannya lebih lanjut. Di sini ada perbedaan yang sama antara foto sesaat seseorang dan potretnya yang dilukis dengan kuas. seniman sejati. Dalam karya seniman, di hadapan kita ada gambaran umum tentang seseorang dalam semua orisinalitas tidak hanya penampilan fisiknya, tetapi juga konten spiritual batinnya. Dari potret artistik, kita juga bisa membaca masa lalu orang yang tergambar di dalamnya dan menentukan kemampuannya dalam tindakannya. Dan snapshot, meskipun mampu memberikan gambaran yang lebih akurat tentang penampilan aslinya, tidak memiliki kualitas ini dan sering kali menangkap jerawat yang tidak disengaja yang muncul di hidung dan<145>pose atau ekspresi yang sama sekali tidak seperti biasanya, yang pada akhirnya mengarah pada distorsi dari aslinya.

Perlu dicatat bahwa metode "snapshot" tentu saja dapat diterapkan pada fakta perkembangan bahasa. Tetapi dalam kasus ini, kita sebenarnya hanya akan berurusan dengan keadaan bahasa yang terpisah, yang, dalam karakterisasi kuantitatifnya, ternyata tidak lebih dari karakterisasi kuantitatif komparatif dari bahasa yang berbeda. "Dinamika" kuantitatif semacam ini tidak akan mengandung apa pun yang organik, dan hubungan antara masing-masing negara bagian bahasa hanya akan bertumpu pada perbandingan hubungan numerik. Jika dalam hal ini juga menggunakan analogi, maka kita bisa mengacu pada pertumbuhan anak. Perkembangannya tentu saja dapat direpresentasikan dalam bentuk dinamika data numerik tentang berat badan, tinggi badan, perubahan rasio volume bagian-bagian tubuhnya, namun semua data tersebut sama sekali terlepas dari segala sesuatu yang terutama merupakan esensi individu. seseorang - karakternya, kecenderungannya, kebiasaannya. , rasa, dll.

Sisi negatif lain dari "pemodelan" matematika bahasa adalah kenyataan bahwa ia tidak dapat berfungsi sebagai prinsip umum yang menjadi dasar yang memungkinkan untuk melakukan deskripsi bahasa yang komprehensif dan komprehensif - sistematis. Hanya pendekatan matematis terhadap fenomena bahasa, misalnya, tidak akan memungkinkan untuk menjawab bahkan pertanyaan mendasar seperti itu (tanpanya keberadaan ilmu bahasa tidak terpikirkan), seperti: apa itu bahasa, fenomena apa yang seharusnya diklasifikasikan sebagai linguistik yang tepat, bagaimana suatu kata atau kalimat didefinisikan, apa konsep dasar dan kategori bahasa, dll. Sebelum beralih ke metode matematika mempelajari bahasa, perlu sudah memiliki jawaban (bahkan dalam bentuk kerja hipotesis) untuk semua pertanyaan ini sebelumnya. Tidak perlu menutup mata terhadap fakta bahwa dalam semua kasus yang kita ketahui tentang studi fenomena linguistik dengan metode matematika, semua konsep dan kategori ini mau tidak mau harus diterima sebagaimana didefinisikan oleh tradisional atau, secara relatif, metode kualitatif.

Fitur metode matematika dalam aplikasi linguistik mereka dicatat oleh Spang-Hanssen ketika pi<146>sal: “Perlu diingat bahwa fakta-fakta yang diamati yang menerima ekspresi kuantitatif ... tidak memiliki nilai jika tidak menjadi bagian dari deskripsi, dan untuk tujuan linguistik itu harus merupakan deskripsi sistematis, terkait erat dengan linguistik kualitatif deskripsi dan teori” 1 15 . Dalam pidato lain oleh Spang-Hanssen, kami menemukan klarifikasi dari gagasan ini: “Sampai kemungkinan membangun sistem kuantitatif terbukti, dan selama ada sistem kualitatif yang diterima secara umum untuk bidang studi tertentu, perhitungan frekuensi dan lainnya karakteristik numerik dari sudut pandang linguistik visi tidak masuk akal" 1 16 . Gagasan serupa diungkapkan oleh Uldall, yang agak tidak terduga menghubungkannya dengan pengembangan landasan teoretis umum glosematik: “Ketika seorang ahli bahasa mempertimbangkan atau mengukur segala sesuatu yang dia pertimbangkan dan ukur, itu sendiri tidak ditentukan secara kuantitatif; misalnya, kata-kata, ketika dihitung, didefinisikan, jika didefinisikan sama sekali, dalam istilah yang sangat berbeda.<147>

Dengan demikian, ternyata baik dalam istilah teoretis maupun dalam penerapan praktisnya, metode matematika secara langsung bergantung pada konsep dan kategori linguistik yang didefinisikan oleh metode tradisional, filologis, atau, sebagaimana disebutkan di atas, metode kualitatif. Dalam istilah linguistik terapan, penting untuk menyadari ketergantungan ini, dan akibatnya, mengenal totalitas kategori utama linguistik tradisional.

Benar, tidak ada alasan untuk mencela perwakilan ilmu eksakta yang bekerja di bidang linguistik terapan karena tidak menggunakan data linguistik modern. Ini tidak sesuai dengan keadaan sebenarnya. Mereka tidak hanya mengetahui dengan sangat baik, tetapi juga secara luas menggunakan sistem fitur diferensial yang ditetapkan oleh ahli bahasa yang merupakan karakteristik bahasa yang berbeda, distribusi dan pengaturan elemen linguistik dalam sistem bahasa tertentu, pencapaian fonetik akustik, dll. Tetapi dalam hal ini diperlukan reservasi yang sangat signifikan. . Faktanya, perwakilan ilmu eksakta menggunakan data hanya satu arah dalam linguistik - yang disebut linguistik deskriptif, yang dengan sengaja membedakan dirinya dari masalah tradisional linguistik teoretis, jauh dari mencakup seluruh bidang penelitian linguistik, dari yang tepat. Dari sudut pandang linguistik, ia memiliki kekurangan metodologis yang signifikan, yang menyebabkan krisis yang baru terungkap 1 18 , dan, terlebih lagi, memiliki orientasi praktis murni, sesuai dengan kepentingan linguistik terapan. Semua reservasi dan celaan yang dibuat di atas terhadap pertimbangan statis bahasa berlaku untuk linguistik deskriptif. Pendekatan linguistik deskriptif sepihak seperti itu dapat dilakukan oleh penyelidik<148>Namun, hal itu dapat dibenarkan hanya dengan tugas-tugas yang ditetapkan oleh linguistik terapan itu sendiri, tetapi jauh dari menghabiskan seluruh isi ilmu bahasa.

Dalam proses mengembangkan pertanyaan linguistik terapan, masalah teoretis baru mungkin muncul, dan sebenarnya sudah muncul. Beberapa masalah ini terkait erat dengan tugas spesifik linguistik terapan dan ditujukan untuk mengatasi kesulitan yang muncul dalam menyelesaikan masalah tersebut. Masalah lain terkait langsung dengan linguistik teoretis, memungkinkan perspektif baru tentang ide-ide tradisional atau membuka bidang baru penelitian linguistik, konsep dan teori baru. Di antara yang terakhir ini, misalnya, adalah masalah menciptakan bahasa "mesin" (atau bahasa perantara), yang paling erat kaitannya dengan serangkaian masalah kardinal linguistik teoretis yang kompleks seperti hubungan konsep dan makna leksikal, logika dan tata bahasa, diakroni dan sinkroni, sifat tanda bahasa, esensi makna linguistik, prinsip-prinsip membangun bahasa buatan, dll. 1 19 . Dalam hal ini, sangat penting untuk membangun saling pengertian dan persemakmuran dalam pekerjaan bersama perwakilan disiplin linguistik dan ilmu eksakta. Adapun sisi linguistik, dalam hal ini, tampaknya, kita tidak boleh berbicara tentang membatasi upaya, misalnya, perancang mesin terjemahan terlebih dahulu” dan mencoba menetapkan kemampuan kerja mesin tersebut dengan ayat-ayat N. Gribachev atau prosa V. Kochetov 1 20 . Mesin itu sendiri akan menemukan batas kemampuannya, dan profitabilitas - batas penggunaannya. Tetapi ahli bahasa, sebagai kontribusi mereka pada tujuan bersama, harus membawa pengetahuan mereka tentang ciri-ciri struktur bahasa, keserbagunaannya, hubungan perpotongan internal unsur-unsurnya, serta hubungan bahasa yang luas dan multilateral dengan fisik, fisiologis. , mental dan logis<149>fenomena mi, pola spesifik fungsi dan perkembangan bahasa. Totalitas pengetahuan ini diperlukan bagi para perancang mesin yang sesuai agar tidak berkeliaran ke arah yang salah, tetapi untuk membuat pencarian terarah dan berorientasi dengan jelas. Bahkan yang itu sangat ulasan singkat kasus penerapan metode matematika untuk masalah linguistik, yang dibuat dalam esai ini, meyakinkan bahwa pengetahuan semacam itu tidak akan berlebihan bagi perwakilan ilmu eksakta.

Atas dasar semua pertimbangan di atas, seseorang jelas dapat sampai pada beberapa kesimpulan umum.

Jadi, linguistik matematika? Jika ini berarti penggunaan metode matematika sebagai kunci utama universal untuk menyelesaikan semua masalah linguistik, maka klaim semacam itu harus diakui sama sekali tidak dapat dibenarkan. Segala sesuatu yang telah dilakukan ke arah ini sejauh ini hanya sedikit atau bahkan tidak menyelesaikan masalah tradisional ilmu bahasa. Paling buruk, penerapan metode matematika disertai dengan absurditas yang jelas atau, dari sudut pandang linguistik, sama sekali tidak berarti. Paling-paling, metode matematika dapat digunakan sebagai metode tambahan penelitian linguistik, ditempatkan untuk melayani masalah linguistik yang spesifik dan terbatas. Tidak ada pertanyaan tentang "filsafat kuantitatif bahasa" dalam kasus ini. Fisika, psikologi, fisiologi, logika, sosiologi, dan etnologi pada masanya melanggar kemerdekaan ilmu bahasa, tetapi mereka tidak dapat menaklukkan linguistik. Kebalikannya terjadi - linguistik memanfaatkan pencapaian ilmu-ilmu ini dan, sejauh yang diperlukan untuk dirinya sendiri, mulai menggunakan bantuan mereka, dengan demikian memperkaya gudang metode penelitiannya. Sekarang, tampaknya, giliran matematika. Diharapkan komunitas baru ini juga akan berkontribusi pada penguatan ilmu bahasa, perbaikan metode kerjanya, dan peningkatan keragamannya. Oleh karena itu, berbicara tentang linguistik matematika sama sahnya dengan linguistik fisik, linguistik fisiologis, linguistik logis, linguistik psikologis, dan linguistik psikologis.<150>dll. Tidak ada linguistik seperti itu, hanya ada satu linguistik yang secara menguntungkan menggunakan data ilmu lain sebagai alat penelitian tambahan. Dengan demikian, tidak ada alasan untuk mundur sebelum serangan ilmu baru dan dengan mudah menyerah pada posisi yang telah dimenangkannya. Di sini sangat tepat untuk mengingat kata-kata A. Martinet: “Mungkin tergoda untuk bergabung dengan satu atau gerakan pemikiran besar lainnya dengan menggunakan beberapa istilah yang dipilih dengan baik, atau untuk menyatakan dengan beberapa rumus matematika kekakuan penalaran seseorang. Namun, saatnya telah tiba bagi para ahli bahasa untuk menyadari kemandirian sains mereka dan membebaskan diri dari kompleks inferioritas yang membuat mereka mengasosiasikan tindakan mereka dengan satu atau beberapa prinsip ilmiah umum, akibatnya kontur realitas selalu menjadi hanya semakin kabur, bukannya semakin jelas.

Oleh karena itu, matematika itu sendiri dan linguistik itu sendiri. Ini sama sekali tidak mengecualikan bantuan timbal balik mereka atau pertemuan persahabatan dalam kerja bersama tentang masalah bersama. Tempat penerapan upaya bersama dari kedua ilmu semacam ini adalah seluruh rangkaian masalah yang merupakan bagian dari linguistik terapan dan sangat penting secara ekonomi nasional. Seseorang seharusnya hanya berharap bahwa dalam kerja bersama mereka, kedua ilmu menunjukkan saling pengertian yang maksimal, yang, tidak diragukan lagi, juga akan berkontribusi pada hasil maksimal dari kerja sama mereka.<151>

Daftar isi
Perkenalan
Bab 1. Sejarah penerapan metode matematika dalam linguistik
1.1. Pembentukan Linguistik Struktural pada Pergantian Abad 19-20
1.2. Penerapan metode matematika dalam linguistik pada paruh kedua abad kedua puluh
Kesimpulan
literatur
Perkenalan
Pada abad ke-20, terjadi kecenderungan terus-menerus menuju interaksi dan interpenetrasi berbagai bidang pengetahuan.Batas-batas antar ilmu secara bertahap kabur; semakin banyak cabang aktivitas mental yang "berada di persimpangan" pengetahuan kemanusiaan, teknis, dan ilmu alam.
Ciri lain yang jelas dari modernitas adalah keinginan untuk mempelajari struktur dan elemen penyusunnya. Oleh karena itu, semakin banyak tempat di teori ilmiah dan dalam prakteknya diberikan kepada matematika. Bersentuhan, di satu sisi, dengan logika dan filsafat, di sisi lain, dengan statistik (dan, akibatnya, dengan ilmu sosial), matematika menembus semakin dalam ke bidang-bidang yang sejak lama dianggap murni. "kemanusiaan", memperluas potensi heuristik mereka (jawaban atas pertanyaan "berapa banyak" akan sering membantu menjawab pertanyaan "apa" dan "bagaimana"). Linguistik tidak terkecuali.Tujuan saya makalah- secara singkat menyoroti hubungan antara matematika dan cabang linguistik seperti linguistik. Sejak 1950-an, matematika telah digunakan dalam linguistik untuk membuat alat teoretis untuk mendeskripsikan struktur bahasa (baik alami maupun buatan). Namun, harus dikatakan bahwa dia tidak segera menemukan jenisnya sendiri. penggunaan praktis. Awalnya, metode matematika dalam linguistik mulai digunakan untuk memperjelas konsep dasar linguistik, namun seiring perkembangan teknologi komputer, premis teoretis semacam itu mulai diterapkan dalam praktik. Penyelesaian tugas-tugas seperti terjemahan mesin, pencarian informasi mesin, pemrosesan teks otomatis membutuhkan pendekatan bahasa yang baru secara fundamental. Sebuah pertanyaan muncul di hadapan ahli bahasa: bagaimana belajar merepresentasikan pola linguistik dalam bentuk yang dapat diterapkan langsung ke teknologi. Istilah "linguistik matematika", yang populer di zaman kita, merujuk pada penelitian linguistik apa pun yang menggunakan metode eksak (dan konsep metode eksak dalam sains selalu terkait erat dengan matematika). Beberapa ilmuwan beberapa tahun terakhir percaya bahwa ungkapan itu sendiri tidak dapat diangkat ke peringkat istilah, karena itu tidak berarti "linguistik" khusus, tetapi hanya arah baru yang berfokus pada peningkatan, peningkatan akurasi dan keandalan metode penelitian bahasa. Linguistik menggunakan metode kuantitatif (aljabar) dan non-kuantitatif, yang membawanya lebih dekat ke logika matematika, dan akibatnya, ke filsafat, dan bahkan ke psikologi. Bahkan Schlegel mencatat interaksi bahasa dan kesadaran, dan ahli bahasa terkemuka di awal abad ke-20, Ferdinand de Saussure (saya akan menceritakan tentang pengaruhnya terhadap perkembangan metode matematika dalam linguistik nanti), menghubungkan struktur bahasa dengan kepemilikannya. kepada orang-orang. Peneliti modern L. Perlovsky melangkah lebih jauh, mengidentifikasi karakteristik kuantitatif bahasa (misalnya, jumlah jenis kelamin, kasus) dengan kekhasan mentalitas nasional (lebih lanjut tentang ini di Bagian 2.2, "Metode Statistik dalam Linguistik").
Interaksi matematika dan linguistik adalah topik yang memiliki banyak segi, dan dalam pekerjaan saya, saya tidak akan membahas semuanya, tetapi, pertama-tama, pada aspek terapannya.
Bab I. Sejarah Penerapan Metode Matematika dalam Linguistik
1.1 Pembentukan linguistik struktural pada pergantian abad XIX - XX
Deskripsi matematis bahasa didasarkan pada gagasan bahasa sebagai mekanisme, yang berasal dari ahli bahasa Swiss terkenal di awal abad ke-20, Ferdinand de Saussure.
Tautan awal dari konsepnya adalah teori bahasa sebagai suatu sistem yang terdiri dari tiga bagian (bahasa itu sendiri - bahasa, ucapan - parole, dan aktivitas bicara - bahasa), di mana setiap kata (anggota sistem) dianggap tidak dengan sendirinya. , tapi berhubungan dengan orang lain. ...


Atas