भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास। भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग की संभावनाएँ

भाषाविज्ञान में प्रवेश गणितीय तरीकेऔर "गणितीय भावना" ने सटीकता और निष्पक्षता की दिशा में भाषाविज्ञान के विकास में योगदान दिया। हालाँकि, उसके रास्ते में इससे आगे का विकासइस दिशा में गंभीर बाधाएं हैं। लेखक भाषाविज्ञान और गणित के अभिसरण के कारणों, भाषाविज्ञान में गणितीय विधियों की प्रयोज्यता की सीमाओं और गणितज्ञों और भाषाविदों के बीच आपसी समझ को बाधित करने वाले कारकों की प्रकृति पर विचार करता है।

1950 के दशक के उत्तरार्ध में, जब कुछ युवा भाषाविदों ने भाषा की संरचना का अध्ययन करने के लिए गणितीय तरीकों को लागू करने के बारे में सोचा और गणितज्ञों के साथ सहयोग करना शुरू किया, तो इससे उनके बहुत से सहयोगियों को आश्चर्य और यहां तक ​​कि झटका लगा - आखिरकार, वे आश्वस्त थे बचपन से कि मानवीय विज्ञान, जिनमें से एक भाषाविज्ञान है, गणित और अन्य "सटीक" विज्ञानों के साथ कुछ भी सामान्य नहीं है और न ही हो सकता है।

इस बीच, प्राकृतिक भाषा और गणित के बीच घनिष्ठ संबंध का अस्तित्व उस समय कोई नई खोज नहीं थी। एलएस वायगोत्स्की ने 1934 में प्रकाशित अपनी पुस्तक "थिंकिंग एंड स्पीच" में लिखा था: "गणित में पहली बार देखने वाली सोच जो भाषा से उत्पन्न होती है, लेकिन इसे खत्म कर देती है, जाहिर है, डेसकार्टेस" और जारी रखा: "हमारा सामान्य बोल-चाल काअपने अंतर्निहित उतार-चढ़ाव और व्याकरणिक और मनोवैज्ञानिक की विसंगतियों के कारण, यह गणितीय और शानदार सद्भाव के आदर्शों और एक निरंतर आंदोलन के बीच मोबाइल संतुलन की स्थिति में है, जिसे हम विकास कहते हैं।

में उदय हो रहा है प्राचीन ग्रीसव्याकरणिक श्रेणियों का सिद्धांत पहले से ही भाषा की संरचना के कई सबसे महत्वपूर्ण पहलुओं का वर्णन था, जो प्राचीन यूनानी गणितज्ञों द्वारा स्थानिक रूपों का वर्णन करने के लिए बनाए गए मॉडल के करीब अमूर्त मॉडल की मदद से थे; केवल मामले, लिंग, आदि जैसी अवधारणाओं की परिचितता, जो बन गई है, जैसा कि एच। स्टिंथल ने लिखा है, "हमारी दूसरी प्रकृति", हमें यह समझने से रोकती है कि उनकी रचना के लिए उच्च स्तर की अमूर्त सोच की क्या आवश्यकता है। तो आपको हैरानी होनी चाहिए इसके बजायभाषाई "गणितीय सद्भाव के आदर्श" का वर्णन करने के लिए वास्तविक गणितीय साधनों का उपयोग करने का पहला प्रयास केवल बीसवीं शताब्दी के मध्य में किया गया था।

इस "देरी" के दो कारण हैं। सबसे पहले, भाषा के विज्ञान में महत्वपूर्ण कदम उठाए जाने के बाद प्राचीन युग, वास्तव में केवल 19वीं शताब्दी में फिर से विकसित होना शुरू हुआ, लेकिन इस पूरी शताब्दी में भाषाविदों का मुख्य ध्यान भाषा के इतिहास की ओर मुड़ गया, और केवल अगली शताब्दी में, जो सामान्य रूप से मानविकी के लिए संरचनावाद का युग था, ने किया प्राचीन काल के बाद पहली बार भाषाविज्ञान ने भाषा संरचनाओं के अध्ययन की ओर रुख किया, लेकिन एक नए स्तर पर। जब भाषाविदों ने महसूस किया कि भाषा, एफ डी सॉसर के शब्दों में, एक "शुद्ध संबंधों की प्रणाली" है, यानी संकेतों की एक प्रणाली, जिसकी भौतिक प्रकृति नगण्य है, और केवल उनके बीच के संबंध महत्वपूर्ण हैं, समानांतर के बीच भाषा और गणितीय निर्माण काफी स्पष्ट हो गए, जो "शुद्ध संबंधों की प्रणाली" भी हैं, और पहले से ही बीसवीं शताब्दी की शुरुआत में, वही डी सॉसर ने गणितीय तरीकों से भाषा का अध्ययन करने का सपना देखा था।

दूसरे, नए युग की शुरुआत में गणित में मात्रात्मक तरीके सामने आए, और केवल 19 वीं शताब्दी में गणितज्ञों ने फिर से गैर-मात्रात्मक अमूर्त मॉडल बनाना शुरू किया जो प्राचीन लोगों से अधिक भिन्न थे। उच्च स्तरअमूर्तता, और भी - जो हमारे विषय के लिए विशेष रूप से महत्वपूर्ण है - इस तथ्य से कि उनका उपयोग स्थानिक रूपों की तुलना में घटनाओं की एक विस्तृत श्रृंखला का वर्णन करने के लिए किया जा सकता है; अक्सर ऐसे मॉडल सुविधाजनक और यहां तक ​​​​कि निकले आवश्यक साधनघटना का अध्ययन करने के लिए कि उन्हें बनाने वाले गणितज्ञों ने बिल्कुल नहीं सोचा था और उनके अस्तित्व के बारे में भी नहीं जानते थे। इन मॉडलों में वे थे जिन्हें बाद में भाषा विज्ञान में प्रयोग किया गया; विशेष रूप से गणितीय विषयों का गहन विकास, जिसकी सामग्री उनका निर्माण था, बीसवीं शताब्दी के पूर्वार्द्ध में हुआ। इसलिए इस सदी के मध्य में गणित और भाषा विज्ञान का मिलन बिल्कुल स्वाभाविक था।

इस बैठक के परिणामों में से एक नए गणितीय अनुशासन का उदय था - गणितीय भाषाविज्ञान, जिसका विषय भाषाई अनुसंधान के लिए एक गणितीय उपकरण का विकास है। गणितीय भाषाविज्ञान में केंद्रीय स्थान औपचारिक व्याकरण के सिद्धांत द्वारा कब्जा कर लिया गया है, जो इसमें प्रयुक्त तंत्र की प्रकृति से, गणितीय तर्क से संबंधित है और विशेष रूप से, एल्गोरिदम के सिद्धांत से संबंधित है। यह सही भाषा इकाइयों का वर्णन करने के लिए औपचारिक तरीके प्रदान करता है। विभिन्न स्तर, और यह भी, जो विशेष रूप से महत्वपूर्ण है, भाषा इकाइयों के परिवर्तनों का वर्णन करने के लिए औपचारिक तरीके - समान स्तर पर और स्तरों के बीच। वाक्य-विन्यास संरचनाओं का सिद्धांत औपचारिक व्याकरण के सिद्धांत से जुड़ा हुआ है, जो तंत्र के संदर्भ में बहुत सरल है, लेकिन भाषाई अनुप्रयोगों के लिए कम महत्वपूर्ण नहीं है। गणितीय भाषाविज्ञान में, भाषा के विश्लेषणात्मक मॉडल भी विकसित किए जा रहे हैं, जिसमें कुछ निश्चित - ज्ञात - "सही ग्रंथों" पर डेटा के आधार पर, औपचारिक निर्माण किए जाते हैं, जिसके परिणामस्वरूप कुछ का वर्णन होता है " घटक भाग» भाषा तंत्र। इस तरह, कोई पारंपरिक व्याकरणिक अवधारणाओं का औपचारिक विवरण प्राप्त कर सकता है। इसमें गहन तर्क ("मोंटेग्यू शब्दार्थ") के उपकरण का उपयोग करते हुए वाक्य के अर्थ का विवरण भी शामिल होना चाहिए।

बेशक, गणितीय उपकरण की मदद से, वायगोत्स्की द्वारा बोली जाने वाली भाषा के दो आदर्शों में से केवल एक का वर्णन किया जा सकता है; इसलिए, एक या दूसरे गणितीय मॉडल (या सामान्य रूप से गणितीय मॉडल) के उपयोग पर अक्सर सुनी जाने वाली आपत्तियां इस आधार पर होती हैं कि यह ऐसे और ऐसे विशेष मामलों को कवर नहीं करती है: इसमें निहित "उतार-चढ़ाव और विसंगतियों" का वर्णन करने के लिए भाषा, किसी को पूरी तरह से अन्य, गैर-गणितीय साधनों की आवश्यकता होती है, और "गणितीय आदर्श" का सिर्फ एक स्पष्ट विवरण उन्हें खोजने में मदद कर सकता है, क्योंकि इससे "गणितीय" से "शानदार" को स्पष्ट रूप से परिसीमन करना संभव हो जाएगा। भाषा। लेकिन यह अभी भी भविष्य के लिए एक मामला है।

गणितीय भाषाविज्ञान के उद्भव से कम नहीं, और शायद अधिक महत्वपूर्ण, मौलिक गणितीय विचारों और अवधारणाओं - जैसे सेट, फ़ंक्शन, समरूपता के भाषाविज्ञान में प्रत्यक्ष प्रवेश था। आधुनिक भाषाई शब्दार्थ में, विधेय और परिमाणक की अवधारणाएँ, जो गणितीय तर्क से आई हैं, एक महत्वपूर्ण भूमिका निभाती हैं। (उनमें से पहला तर्क में तब भी उत्पन्न हुआ जब यह भाषाविज्ञान से अलग नहीं था, और अब यह सामान्यीकृत और गणितीय रूप से संसाधित रूप में भाषाविज्ञान में वापस आ गया है।)

और अंत में, बहुत बडा महत्वभाषाई अनुसंधान की भाषा का परिशोधन है, जो "गणितीय भावना" के भाषाविज्ञान में प्रवेश के कारण होता है, न केवल उन क्षेत्रों में जहां गणितीय विचारों और विधियों का उपयोग करना संभव है। यह सब संक्षेप में निम्नानुसार किया जा सकता है: भाषाविज्ञान अधिक से अधिक सटीक और अधिक वस्तुनिष्ठ विज्ञान बन रहा है - बिना रुके, निश्चित रूप से, मानविकी का विज्ञान।

हालांकि इस पर प्राकृतिक तरीकाभाषाविज्ञान के विकास में गंभीर बाधाएं आती हैं जो इसे लंबे समय तक धीमा कर सकती हैं। मुख्य एक "संकायों का पृथक्करण" है जो नए युग की शुरुआत में उत्पन्न हुआ था: एक ओर प्राकृतिक वैज्ञानिक और गणितज्ञ, और दूसरी ओर मानवतावादी वैज्ञानिक, "दूसरे संकाय में" सहयोगियों के काम में रुचि नहीं रखते हैं। ” और, इसके अलावा, गहरे नीचे, और अक्सर खुले तौर पर उनका तिरस्कार करते हैं। गणितज्ञ और प्राकृतिक वैज्ञानिक (और इससे भी अधिक "तकनीकी") मानविकी अनुसंधान को केवल एक प्रकार की "सजावट" या "बेकार बकवास" के रूप में देखते हैं, जबकि "मानविकी" गणित और प्राकृतिक विज्ञान को केवल व्यावहारिक के लिए सहन करने के लिए तैयार हैं। लाभ और आश्वस्त हैं कि वे कुछ भी नहीं हैं जो मानव आत्मा की प्रकृति को समझने में मदद कर सकते हैं।

केवल बीच में 19 वीं सदीइसमें, महान जीवविज्ञानी और महान विचारक कोनराड लॉरेंज के शब्दों में, "प्राकृतिक विज्ञान और मानविकी के बीच की शैतानी दीवार (डाई बोस माउर ज़्विसचेन नेचर- und गीस्टविसेन्सचाफ्टेन)" तर्क को अलग करने वाली सबसे पतली जगह में पहला उल्लंघन किया गया था। अंक शास्त्र। 20वीं शताब्दी में, अन्य अंतराल दिखाई दिए - उनमें से एक जिसे गणितज्ञों और भाषाविदों द्वारा दोनों ओर से पंच किया गया था - लेकिन वे अभी भी कम हैं, दीवार अभी भी मजबूत है, और इसे और मजबूत करने के लिए दोनों पक्षों के प्रयासों में कोई कमी नहीं है। और छिद्रों को ठीक करें। अक्सर ये प्रयास काफी सफल होते हैं; इस दिशा में नवीनतम "उपलब्धि" में "प्रोफाइल शिक्षा" है उच्च विद्यालयजो पहले से ही बचपन में सक्षम और इच्छुक लोगों को "संकायों" में विभाजित करता है और उन्हें "विदेशी" विज्ञानों में अज्ञानता पर गर्व करना सिखाता है - प्राकृतिक और मानव विज्ञानों के आगे अभिसरण को बहुत बाधित कर सकता है, जो दोनों के सामान्य विकास के लिए तत्काल आवश्यक है . दीवार खड़ी करने के परिणामों में से एक यह है कि "मानविकी", भाषाविदों के विशाल बहुमत सहित, गणित के उन वर्गों की मूल बातों के बारे में भी कुछ नहीं जानते हैं जिनके पास गणित है। उच्चतम मूल्यमानविकी के लिए (और एक गणितज्ञ की एक ऐसे व्यक्ति के रूप में कल्पना करें जो विशेष रूप से गणनाओं में व्यस्त है)।

एक और बाधा विज्ञान की वर्तमान स्थिति की उन्मत्त दौड़ विशेषता है, अधिक से अधिक नए "परिणामों" की निरंतर खोज, क्षितिज को संकीर्ण करना और गहरी समस्याओं के बारे में सोचने या संबंधित के गंभीर अध्ययन में संलग्न होने का समय नहीं छोड़ना और, इसके अलावा, काफी संबंधित नहीं वैज्ञानिक अनुशासन. यह भाषाविदों और गणितज्ञों पर समान रूप से लागू होता है - वास्तव में, उन सभी पर जो पेशेवर रूप से विज्ञान में लगे हुए हैं।

और तीसरा जड़ता है, या, अधिक सरलता से, आलस्य। पहली नज़र में, आलस्य और उन्मत्त दौड़ असंगत हैं, लेकिन वास्तव में वे एक-दूसरे के साथ अच्छी तरह से मिलते हैं और इसके अलावा, एक-दूसरे का समर्थन और उत्तेजना करते हैं। जब कोई व्यक्ति एक कठिन कार्य करने के लिए बहुत आलसी होता है, तो वह एक आसान और अधिक "विश्वसनीय" को पकड़ लेता है, जिसमें सफलता उसकी जड़ता को न्यायोचित और प्रोत्साहित करती है। के प्रति अहंकारी रवैया छोटे भाई, दीवार के दूसरी तरफ झुकना भी आलस्य को बढ़ावा देता है और इससे प्रोत्साहित होता है। जब, उदाहरण के लिए, एक गणितज्ञ सभी विचारों पर पुनर्विचार करने का प्रस्ताव करता है प्राचीन इतिहासखुद को प्राचीन भाषाओं से थोड़ा परिचित होने की जहमत न उठाते हुए इसके लिए बहुत हद तक वही आलसी मां जिम्मेदार है।

इन बाधाओं से उत्पन्न विज्ञान के विकास के लिए खतरा पहली नज़र में लगने की तुलना में कहीं अधिक गंभीर है। जब "विदेशी" विज्ञानों में अज्ञानता गर्व का विषय बन जाती है, तो यह स्वाभाविक रूप से "अपने" विज्ञानों में भी सतहीपन और अज्ञानता की ओर ले जाती है। लंबे समय से दो से अधिक "संकाय" हैं, उनकी संख्या साल-दर-साल बढ़ रही है, और प्रत्येक को दूसरों से दीवार से निकाल दिया गया है; संकायों के अंदर भी दीवारें दिखाई देती हैं। शोधकर्ताओं के क्षितिज धीरे-धीरे संकुचित हो रहे हैं; यह सच है कि शोध का तंत्र अधिक से अधिक सूक्ष्म और परिष्कृत होता जा रहा है, लेकिन लगभग अनन्य रूप से छोटी वस्तुएं, और इस धारणा को प्रबल किया जाता है कि केवल वे ही अध्ययन के योग्य हैं। विज्ञान में संकट के बारे में बात करने का हर कारण है, और भाषा विज्ञान कोई अपवाद नहीं है। अब, मुझे ऐसा लगता है, पीछे मुड़कर देखने और सोचने का समय आ गया है।

यहां दिशा के भाषाविद् एकत्र हुए, जो "अर्थ - पाठ" मॉडल से जुड़ा हुआ है। पिछली शताब्दी के 60 के दशक में बनाया गया यह मॉडल पहले और में से एक था सर्वोत्तम परिणामभाषाविज्ञान और गणित की बैठक, जिसके बाद भाषाविदों की दो पीढ़ियाँ बड़ी हुई हैं, अपने छात्र वर्षों से सटीक सोच के आदी हैं। लेकिन, दुर्भाग्य से, वे जड़ता से मुक्त नहीं हैं, जो उन्हें संकट के अस्तित्व को महसूस करने और इसे दूर करने के तरीकों के बारे में सोचने से रोकता है। इस बीच, सभी भाषाविदों के बीच - और शायद मानविकी में शामिल सभी लोगों के बीच भी - उनके पास इस तरह की समझ के लिए सबसे अधिक वस्तुनिष्ठ अवसर हैं, और मैं आशा करना चाहूंगा कि वे इन अवसरों का उपयोग करेंगे।

रिपोर्ट का पाठ कृपया ए.वी. ग्लैडकी और प्रकाशन गृह द्वारा प्रदान किया गया था

भाषाविज्ञान व्याख्यान संख्या 1 में गणितीय विधियों के अनुप्रयोग का इतिहास

योजना

गठन
संरचनात्मक भाषाविज्ञान
पर XIX की बारी- XX सदियों।
गणितीय विधियों का अनुप्रयोग
भाषा विज्ञान में बीसवीं की दूसरी छमाही में
शतक।
संभावनाओं
अनुप्रयोग
गणितीय तरीकों में
भाषा विज्ञान।

एक प्रणाली के रूप में फर्डिनेंड डी सॉसर (1857-1913) भाषा

उचित भाषा
भाषण - पैरोल
भाषण गतिविधि
- भाषा

मैं एक। बाउडौइन डे कर्टेने (1845 - 1929)

"ध्वनियाँ भाषा के" परमाणु "हैं
सिस्टम जिनके पास है
सीमित संख्या
आसानी से मापने योग्य गुण।
यह सबसे सुविधाजनक है
औपचारिक के लिए सामग्री,
सख्त तरीके
विवरण।"

संरचनात्मक भाषाविज्ञान -

यह भाषा और पर विचारों का एक समूह है
इसके शोध के तरीकों पर आधारित है
जो भाषा की समझ के रूप में निहित है
स्पष्ट रूप से अलग पहचान के साथ साइन सिस्टम
संरचनात्मक तत्व (इकाइयां
भाषा, उनकी कक्षाएं, आदि) और के लिए इच्छा
सख्त (सटीक आ रहा है
विज्ञान) भाषा का औपचारिक विवरण।

लेनिनग्रादस्काया
ध्वन्यात्मक स्कूल
(एल.वी. शेर्बा) के रूप में प्रयोग किया जाता है
ध्वनि के सामान्यीकरण के लिए मुख्य मानदंड
एक स्वनिम मनोवैज्ञानिक के रूप में
विश्लेषण आधारित प्रयोग
देशी वक्ताओं का भाषण।
प्राग भाषाई सर्कल
(N.S. Trubetskoy) ने सिद्धांत विकसित किया
विरोध - शब्दार्थ संरचना
उनके द्वारा भाषा को एक सेट के रूप में वर्णित किया गया था
विरोधात्मक रूप से निर्मित
शब्दार्थ इकाइयाँ - परिवार।

बीसवीं शताब्दी के उत्तरार्ध में भाषाविज्ञान में गणितीय विधियों का अनुप्रयोग

अमेरिकन
वर्णनात्मकता
(एल. ब्लूमफील्ड और ई. सपिर)। भाषा
वर्णनकर्ताओं के रूप में प्रस्तुत किया गया
भाषण उच्चारण का संग्रह।
एन चॉम्स्की का औपचारिक व्याकरण।
मास्को
ध्वन्यात्मक स्कूल,
जिनके प्रतिनिधि ए.ए.
रिफॉर्मत्स्की, वी. एन. सिदोरोव, पी.एस.
कुज़नेत्सोव, ए.एम. सुखोटिन, आर.आई. अवनेसोव।

मशीनी अनुवाद प्रणाली

कलन विधि
लगातार अनुवाद
शब्द से शब्द, वाक्यांश से वाक्यांश।
टी-सिस्टम (से अंग्रेज़ी शब्दस्थानांतरण
- परिवर्तन), जिसमें अनुवाद
वाक्य रचना के स्तर पर किया गया
संरचनाएं।
आई-सिस्टम ("इंटरलिंगुआ" शब्द से) एक शब्दार्थ प्रतिनिधित्व प्राप्त करना
इसके माध्यम से इनपुट वाक्य
सिमेंटिक विश्लेषण और संश्लेषण
प्राप्त पर इनपुट प्रस्ताव
अर्थपूर्ण प्रस्तुति।

10. व्यावहारिक भाषाविज्ञान

अध्ययन करते हैं
अपने राज्य में कोई भाषा नहीं (यानी
प्रणाली), और कार्रवाई में भाषा (यानी में
संचार);
एक विशिष्ट अनुप्रयोग समस्या हल करता है,
बिना भाषा मॉडल बनाना
भाषा के तथ्यों की व्याख्या करने का दावा करता है
(सैद्धांतिक भाषाविज्ञान के रूप में);
विशिष्ट उपभाषाओं को लक्षित करना
(यानी भाषा का चुनिंदा ज्ञान), और नहीं
पूरी भाषा के लिए।

11. मात्रात्मक भाषाविज्ञान

- अंतःविषय दिशा में
अनुप्रयुक्त अनुसंधान, जो
मुख्य अध्ययन उपकरण के रूप में
भाषा और वाणी का प्रयोग किया जाता है
मात्रात्मक या सांख्यिकीय
विश्लेषण के तरीके।

12. कम्प्यूटेशनल भाषाविज्ञान

- विधियों, प्रौद्योगिकियों और का विकास
विशिष्ट प्रणालियाँ जो प्रदान करती हैं
एक व्यक्ति और एक कंप्यूटर के बीच एक प्राकृतिक संचार
या सीमित प्राकृतिक भाषा।

13. कम्प्यूटेशनल भाषाविज्ञान

प्राकृतिक प्रसंस्करण के लिए प्रणालियों का निर्माण
भाषा (उदाहरण के लिए, संचार प्रसंस्करण प्रणाली
मूलपाठ);
सूचना पुनर्प्राप्ति प्रणाली का विकास
(वृत्तचित्र, अर्थात्, जिसमें
ग्रंथ, और तथ्यात्मक, यानी जिसमें
तथ्यों को संग्रहीत किया जाता है, न केवल प्रस्तुत किया जाता है
शाब्दिक रूप, साथ ही तालिकाओं के रूप में,
सूत्र, आदि);
हाइपरटेक्स्ट सिस्टम का निर्माण (यानी।
उन्हें जोड़ने के साथ ग्रंथों का सेट
रिश्तों);
कंप्यूटर प्रौद्योगिकियों का विकास
संकलन और शब्दकोशों का उपयोग।

14. आपका ध्यान देने के लिए धन्यवाद!

15. रिपोर्ट:

कानून
प्रकृति और "मानवतावादी" कानून।
भाषा विज्ञान में गणितीय क्रांति।
कोपेनहेगन स्कूल ऑफ स्ट्रक्चरल
भाषा विज्ञान।
लागू भाषाविज्ञान का गठन
वैज्ञानिक अनुशासन।

16. प्रायोगिक सत्र:

गणित के अनुप्रयोग के इतिहास का विवरण
पुरातनता से हमारे भाषा विज्ञान में तरीके
दिन।
एकीकरण प्रवृत्तियों का प्रकटीकरण
गणितीय, भाषाई और अन्य ज्ञान
भाषा के विज्ञान के विकास का इतिहास।
लागू की तुलनात्मक विशेषताएं और
सैद्धांतिक भाषाविज्ञान (तालिका में भरें
लागू की तुलनात्मक विशेषताएं और
सैद्धांतिक भाषाविज्ञान)।
एक अनुप्रयुक्त खंड के रूप में कॉर्पस भाषाविज्ञान
भाषा विज्ञान।
मात्रात्मक भाषाविज्ञान के अनुप्रयुक्त पहलू।
कम्प्यूटेशनल भाषाविज्ञान और इसके उपकरण।

पिछली शताब्दी के दौरान, भाषाविज्ञान को हमेशा एक ऐसे विज्ञान के उदाहरण के रूप में उद्धृत किया गया है जो तेजी से विकसित हुआ और बहुत जल्दी पद्धतिगत परिपक्वता तक पहुंच गया। पहले से ही पिछली शताब्दी के मध्य में, युवा विज्ञान ने आत्मविश्वास से विज्ञान के घेरे में अपनी जगह ले ली, जिसकी एक हजार साल की परंपरा थी, और इसके सबसे प्रमुख प्रतिनिधियों में से एक - ए। श्लेचर - में यह विश्वास करने का साहस था कि वह अपने कामों से पहले से ही अंतिम पंक्ति का योग कर रहा था।<113>हालाँकि, भाषाविज्ञान के इतिहास ने दिखाया है कि इस तरह की राय बहुत जल्दबाजी और अनुचित थी। सदी के अंत में, भाषाविज्ञान को नव-व्याकरणिक सिद्धांतों की आलोचना से जुड़े अपने पहले बड़े झटके लगे, जिसके बाद दूसरों ने आलोचना की। यह ध्यान दिया जाना चाहिए कि सभी संकट जिन्हें हम भाषा के विज्ञान के इतिहास में उजागर कर सकते हैं, एक नियम के रूप में, इसकी नींव को हिला नहीं दिया, बल्कि इसके विपरीत, मजबूती में योगदान दिया और अंततः उनके साथ एक शोधन और सुधार लाया। भाषाई अनुसंधान के तरीके, विषयों और वैज्ञानिक मुद्दों के साथ विस्तार।

लेकिन भाषाविज्ञान के बगल में, अन्य विज्ञान भी रहते और विकसित हुए, जिनमें बड़ी संख्या में नए भी शामिल थे। भौतिक, रासायनिक और तकनीकी (तथाकथित "सटीक") विज्ञानों ने हमारे समय में विशेष रूप से तेजी से विकास प्राप्त किया है, और उनके सैद्धांतिक आधार, गणित ने उन सभी पर शासन किया है। सटीक विज्ञानों ने न केवल सभी मानविकी पर बहुत दबाव डाला है, बल्कि वर्तमान में वे "उन्हें अपने विश्वास में लाने", उन्हें अपने रीति-रिवाजों के अधीन करने, उन पर अपनी शोध विधियों को थोपने का प्रयास कर रहे हैं। वर्तमान स्थिति में, एक जापानी अभिव्यक्ति का उपयोग करते हुए, यह कहा जा सकता है कि अब भाषाविद-दार्शनिक चटाई के बहुत किनारे को परिभाषित कर रहे हैं, जहां सटीक विज्ञान, गणित की अध्यक्षता में, विजयी और स्वतंत्र रूप से स्थित हैं।

क्या यह सामान्य वैज्ञानिक हितों के दृष्टिकोण से अधिक समीचीन नहीं होगा कि गणित के सामने आत्मसमर्पण कर दिया जाए, इसके तरीकों की शक्ति के लिए पूरी तरह से आत्मसमर्पण कर दिया जाए, जिसके लिए कुछ आवाजें खुले तौर पर 59 को बुला रही हैं, और इस तरह, शायद, नई ताकत हासिल करें? इन सवालों का जवाब देने के लिए, हमें पहले यह देखना होगा कि गणित क्या दावा करता है इस मामले मेंभाषाविज्ञान के किस क्षेत्र में गणितीय तरीके अपना आवेदन पाते हैं, किस हद तक वे भाषाई सामग्री की बारीकियों के अनुरूप हैं और क्या वे देने में सक्षम हैं या केवल उन सवालों के जवाब देने में सक्षम हैं जो भाषा का विज्ञान प्रस्तुत करता है।

शुरुआत से ही, यह ध्यान दिया जाना चाहिए कि भाषा विज्ञान में नए, गणितीय प्रवृत्ति के उत्साही लोगों के बीच<114>स्थैतिक अनुसंधान में इसके लक्ष्यों और उद्देश्यों के बारे में मतों की एकमत नहीं है। अकाद। ए. ए. मार्कोव, जो भाषा के लिए गणितीय तरीकों को लागू करने वाले पहले व्यक्ति थे, बोल्ड्रिनी, यूल, मारियोटी भाषा के तत्वों को मात्रात्मक तरीकों के निर्माण के लिए या सांख्यिकीय प्रमेय के लिए उपयुक्त उदाहरण सामग्री के रूप में मानते हैं, बिना यह सोचे कि इस तरह के अध्ययन के परिणाम दिलचस्प हैं या नहीं भाषाविदों को 6 0 . रॉस का मानना ​​है कि संभाव्यता सिद्धांत और गणितीय आँकड़े एक उपकरण प्रदान करते हैं या, जैसा कि वे अब कहना पसंद करते हैं, उन भाषाई निष्कर्षों के परीक्षण और पुष्टि के लिए एक गणितीय मॉडल जो संख्यात्मक व्याख्या की अनुमति देते हैं। इस प्रकार, गणितीय विधियों की कल्पना केवल भाषाई अनुसंधान के सहायक साधन के रूप में की जाती है 6 1। हर्डन द्वारा और भी बहुत कुछ दावा किया गया है, जिन्होंने अपनी पुस्तक में न केवल भाषा की समस्याओं के गणितीय अध्ययन के सभी प्रयासों को सारांशित और व्यवस्थित किया, बल्कि आगे के काम के संबंध में उन्हें एक स्पष्ट दिशा देने की भी कोशिश की। वह अपनी पुस्तक की संपूर्ण सामग्री की प्रस्तुति को "साहित्यिक आँकड़ों की समझ" पर केंद्रित करता है (जैसा कि वह गणितीय आँकड़ों के तरीकों द्वारा ग्रंथों के अध्ययन को कहता है। - तीन बजे।)भाषाविज्ञान के एक अभिन्न अंग के रूप में" 6 2, और भाषाविज्ञान में इस नए खंड के सार और कार्यों को निम्नलिखित शब्दों में तैयार करता है: "साहित्यिक आँकड़े भाषा के मात्रात्मक दर्शन के रूप में भाषाविज्ञान की सभी शाखाओं पर लागू होते हैं। हमारी राय में, साहित्यिक सांख्यिकी संरचनात्मक भाषाविज्ञान है जो एक मात्रात्मक विज्ञान या एक मात्रात्मक दर्शन के स्तर तक उठा हुआ है। इस प्रकार, इसके परिणामों को दायरे से बाहर होने के रूप में परिभाषित करना भी उतना ही गलत है<115>भाषाविज्ञान या इसे अनुसंधान के लिए एक सहायक उपकरण के रूप में मानते हैं" 6 3।

इस सिद्धांत में जाने की सलाह देना मुश्किल है कि क्या इस मामले में भाषाविज्ञान की एक नई शाखा के उद्भव की बात करना और इसके दावों के मुद्दे को हल करना वैध है, पहले इस बात पर विचार किए बिना कि वास्तव में इसमें क्या किया गया है। क्षेत्र, और स्पष्ट करने के लिए किस दिशा में नई विधियों का अनुप्रयोग 6 4 . इससे हमें विचारों के अंतर को समझने में मदद मिलेगी।

भाषाई समस्याओं को हल करने के लिए गणितीय (या, अधिक सटीक, सांख्यिकीय) मानदंड का उपयोग किसी भी तरह से भाषा के विज्ञान के लिए नया नहीं है और भाषाविदों द्वारा लंबे समय से इसका उपयोग किया जाता रहा है। आखिरकार, भाषाविज्ञान की ऐसी पारंपरिक अवधारणाएं ध्वन्यात्मक कानून (और संबंधित<116>इसके साथ नी - कानून का अपवाद), व्याकरणिक तत्वों की उत्पादकता (उदाहरण के लिए, व्युत्पन्न प्रत्यय), या यहां तक ​​​​कि भाषाओं के बीच संबंधित संबंधों के मानदंड, एक निश्चित सीमा तक, सापेक्ष सांख्यिकीय विशेषताओं पर आधारित होते हैं। आखिरकार, देखे गए मामलों का सांख्यिकीय विरोध जितना तेज और अधिक विशिष्ट है, उतना ही अधिक कारण हमें उत्पादक और अनुत्पादक प्रत्यय के बारे में बात करनी है, ध्वन्यात्मक कानून और इसके अपवादों के बारे में, भाषाओं के बीच रिश्तेदारी की उपस्थिति या अनुपस्थिति के बारे में। लेकिन अगर ऐसे मामलों में सांख्यिकीय सिद्धांत का उपयोग कम या ज्यादा अनायास किया जाता है, तो भविष्य में इसे सचेत रूप से और पहले से ही एक निश्चित लक्ष्य निर्धारण के साथ लागू किया जाने लगा। इसलिए, हमारे समय में, व्यक्तिगत भाषाओं की शब्दावली और अभिव्यक्तियों के तथाकथित आवृत्ति शब्दकोश 6 5 या यहां तक ​​​​कि "वास्तविकता पर सामान्य ध्यान" 6 6 के साथ बहुभाषी शब्दों के अर्थ व्यापक हो गए हैं। इन शब्दकोशों के डेटा का उपयोग विदेशी भाषा की पाठ्यपुस्तकों (जिसका पाठ सबसे अधिक इस्तेमाल की जाने वाली शब्दावली पर बनाया गया है) और न्यूनतम शब्दकोशों को संकलित करने के लिए किया जाता है। एम. स्वदेश द्वारा लेक्सिकोस्टैटिस्टिक्स या ग्लोटोक्रोनोलॉजी की पद्धति में सांख्यिकीय कलन का एक विशेष भाषाई उपयोग पाया गया, जहां, सांख्यिकीय सूत्रों के आधार पर, जो मुख्य कोष की भाषाओं से शब्दों के गायब होने के मामलों को ध्यान में रखते हैं, यह संभव है भाषा परिवारों के विभाजन के पूर्ण कालक्रम को स्थापित करने के लिए 6 7 .

में पिछले साल काभाषाई सामग्री के लिए गणितीय तरीकों को लागू करने के मामलों में काफी वृद्धि हुई है, और इस तरह के प्रयासों के द्रव्यमान में कमोबेश निश्चित दिशाओं की रूपरेखा तैयार की गई है। चलो मुड़ें<117>विवरण में जाए बिना, उनके क्रमिक विचार के लिए।

शुरुआत करते हैं उस दिशा से जिसे शैलीविज्ञान का नाम दिया गया है। इस मामले में, हम उपयोग किए गए भाषाई तत्वों के मात्रात्मक संबंधों के माध्यम से व्यक्तिगत कार्यों या लेखकों की शैलीगत विशेषताओं की परिभाषा और विशेषता के बारे में बात कर रहे हैं। शैलीगत घटनाओं के अध्ययन के लिए सांख्यिकीय दृष्टिकोण साहित्यिक शैली की समझ पर आधारित है, जो भाषा के साधनों में महारत हासिल करने का एक व्यक्तिगत तरीका है। इसी समय, शोधकर्ता गणनीय भाषाई तत्वों के गुणात्मक महत्व के सवाल से पूरी तरह से विचलित हो जाता है, अपना सारा ध्यान केवल मात्रात्मक पक्ष पर केंद्रित करता है; अध्ययन की गई भाषा इकाइयों का शब्दार्थ पक्ष, उनका भावनात्मक और अभिव्यंजक भार, साथ ही साथ कला के काम के ताने-बाने में उनकी हिस्सेदारी - यह सब खाते से बाहर रहता है, तथाकथित निरर्थक घटना को संदर्भित करता है। इस प्रकार, कला का एक कार्य एक यांत्रिक समुच्चय के रूप में प्रकट होता है, जिसके निर्माण की विशिष्टता इसके तत्वों के संख्यात्मक संबंधों के माध्यम से ही अपनी अभिव्यक्ति पाती है। स्टाइलोस्टैटिस्टिक्स के प्रतिनिधि पारंपरिक शैलीविज्ञान के तरीकों का विरोध करते हुए, नोट की गई सभी परिस्थितियों पर आंखें नहीं मूंदते हैं, जिसमें निस्संदेह व्यक्तिपरकता के तत्व शामिल हैं, गणितीय पद्धति की एक ही गुणवत्ता के साथ, जो उनकी राय में, इसकी सभी कमियों की भरपाई करता है - प्राप्त परिणामों की निष्पक्षता। "हम प्रयास करते हैं," लिखते हैं, उदाहरण के लिए, वी। फुच्स, "... गणितीय तरीकों से भाषाई अभिव्यक्ति की शैली को चिह्नित करने के लिए। इस उद्देश्य के लिए, विधियों का निर्माण किया जाना चाहिए, जिसके परिणामों में सटीक विज्ञानों के परिणामों के समान ही वस्तुनिष्ठता होनी चाहिए ... इससे पता चलता है कि हम, कम से कम शुरुआत में, केवल औपचारिक संरचनात्मक गुणों से निपटेंगे, न कि शब्दार्थ के साथ भाषाई अभिव्यक्तियों की सामग्री। इस तरह हम क्रमिक संबंधों की एक प्रणाली प्राप्त करेंगे, जो इसकी समग्रता में शैली के गणितीय सिद्धांत का आधार और प्रारंभिक बिंदु होगा ”6 8।<118>

लेखकों या व्यक्तिगत कार्यों की भाषा के अध्ययन के लिए सबसे सरल प्रकार का सांख्यिकीय दृष्टिकोण उपयोग किए गए शब्दों की गणना करना है, क्योंकि शब्दकोश की समृद्धि, जाहिर है, लेखक को एक निश्चित तरीके से खुद को चित्रित करना चाहिए। हालांकि, इस तरह की गणनाओं के परिणाम इस संबंध में कुछ अप्रत्याशित परिणाम देते हैं और किसी साहित्यिक कार्य के सौंदर्य ज्ञान और मूल्यांकन में किसी भी तरह से योगदान नहीं करते हैं, जो शैलीविज्ञान के कार्यों में से कम से कम एक नहीं है। यहां कई कार्यों में प्रयुक्त शब्दों की कुल संख्या के कुछ आंकड़े दिए गए हैं:

बाइबिल (लैटिन)। . . . . . . . . . 5649 शब्द

बाइबिल (हिब्रू)। . . . 5642 शब्द

डेमोस्थनीज (भाषण)। . . . . . . . . . . . 4972 शब्द

सेलस्ट। . . . . . . . . . . . . . . . . 3394 शब्द

होरेस। . . . . . . . . . . . . . . . . . . .6084 शब्द

डांटे (डिवाइन कॉमेडी) 5860 शब्द

(इसमें 1615 उचित नाम और भौगोलिक नाम शामिल हैं)

टैसो (उग्र ऑरलैंड)। . . . 8474 शब्द

मिल्टन। . . . . . . . . . . . . . . . . . . . .8000 शब्द (लगभग दिया गया)

शेक्सपियर। . . . . . . . . . . . . . . . . . .15000 शब्द

(लगभग, अन्य स्रोतों के अनुसार 20,000 शब्द)

ओ. जेस्पर्सन बताते हैं कि ज़ोला, किपलिंग और जैक लंदन का शब्दकोश मिल्टन के शब्दकोश से काफी अधिक है, यानी संख्या 8000 6 9 है। अमेरिकी राष्ट्रपति डब्ल्यू. विल्सन के भाषणों के शब्दकोष की गणना में पाया गया कि यह शेक्सपियर के शब्दकोष से अधिक समृद्ध है। इसमें मनोवैज्ञानिकों का डेटा जोड़ा जाना चाहिए। इस प्रकार, बड़ी संख्या में मामलों की टिप्पणियों के आधार पर, टरमन ने पाया कि एक औसत बच्चे की शब्दावली लगभग 3600 शब्द है, और 14 साल की उम्र में - पहले से ही 9000। औसत वयस्क 11700 शब्दों का उपयोग करता है, और एक व्यक्ति "बढ़ा हुआ" इंटेलिजेंस" 13500 7 0 तक। इस प्रकार, इस तरह के संख्यात्मक डेटा अपने आप में कार्यों के शैलीगत गुणों की पहचान करने के लिए कोई आधार प्रदान नहीं करते हैं और केवल "उद्देश्यपूर्ण" निष्कर्ष निकालते हैं।<119>वे अलग-अलग लेखकों द्वारा अलग-अलग शब्दों का उपयोग करते हैं, जैसा कि ऊपर की गणना दिखाती है, उनके कार्यों के सापेक्ष कलात्मक मूल्य से संबंधित नहीं है।

व्यक्तिगत लेखकों द्वारा शब्दों के उपयोग की सापेक्ष आवृत्ति की गणना कुछ अलग तरीके से की जाती है। इस मामले में, न केवल शब्दों की कुल मात्रा को ध्यान में रखा जाता है, बल्कि अलग-अलग शब्दों के उपयोग की आवृत्ति भी होती है। इस तरह से प्राप्त सामग्री के सांख्यिकीय प्रसंस्करण में यह तथ्य शामिल है कि उपयोग की समान आवृत्ति वाले शब्दों को वर्गों (या रैंक) में समूहीकृत किया जाता है, जो किसी दिए गए लेखक द्वारा उपयोग किए गए सभी शब्दों के आवृत्ति वितरण की स्थापना की ओर जाता है। इस तरह की गणना का एक विशेष मामला विशेष शब्दों की सापेक्ष आवृत्ति का निर्धारण है (उदाहरण के लिए, चौसर के कार्यों में रोमांस शब्दावली, जैसा कि मेर्संड 7 1 द्वारा किया गया था)। लेखकों द्वारा उपयोग किए गए शब्दों की सापेक्ष आवृत्ति में व्यक्तिगत लेखकों की शैली के बारे में उपरोक्त कुल गणनाओं के समान उद्देश्यपूर्ण जानकारी होती है, केवल अंतर यह है कि परिणाम अधिक सटीक संख्यात्मक डेटा है। लेकिन इसका उपयोग एक ही लेखक के अलग-अलग कार्यों को उनके जीवन के विभिन्न अवधियों में शब्दों के उपयोग की सापेक्ष आवृत्ति की प्रारंभिक गणना के आधार पर किया जाता है (स्वयं लेखक द्वारा दिनांकित कार्यों के अनुसार)। ऐसी गणनाओं से डेटा का एक अन्य प्रकार का उपयोग उन कार्यों के लेखकत्व की प्रामाणिकता स्थापित करना है जिनके लिए यह प्रश्न संदिग्ध लगता है 7 2 । इस अंतिम मामले में, सब कुछ वास्तविक और विवादास्पद कार्यों में उपयोग की आवृत्ति के लिए सांख्यिकीय सूत्रों की तुलना पर आधारित है। इस तरह के तरीकों से प्राप्त परिणामों की बहुत बड़ी सापेक्षता और अनुमानितता के बारे में बात करने की आवश्यकता नहीं है। आखिरकार, उपयोग की सापेक्ष आवृत्ति न केवल लेखक की उम्र के साथ बदलती है, बल्कि शैली, कथानक और कार्य की कार्रवाई के ऐतिहासिक वातावरण पर भी निर्भर करती है (तुलना करें, उदाहरण के लिए, "रोटी" और "पीटर" मैं" ए टॉल्स्टॉय द्वारा)।<120>

ऊपर वर्णित विधि को गहरा करते हुए, स्टाइलोस्टैटिस्टिक्स एक शैली की विशेषता के रूप में सबसे अधिक इस्तेमाल किए जाने वाले शब्दों की सापेक्ष आवृत्ति की स्थिरता की कसौटी का सहारा लेने लगे। इस मामले में उपयोग की जाने वाली विधि को डेट्रायट विश्वविद्यालय (यूएसए) 7 3 में एस्सेलसन और एपस्टीन द्वारा पुश्किन की कहानी "द कैप्टन की बेटी" के सांख्यिकीय प्रसंस्करण द्वारा चित्रित किया जा सकता है। कहानी का पूरा पाठ (शब्दों की लगभग 30,000 घटनाएँ) सर्वेक्षण के अधीन था, और फिर लगभग 10,000 और 5,000 घटनाओं वाले परिच्छेद। इसके अलावा, शब्दों के उपयोग की सापेक्ष आवृत्ति की स्थिरता को निर्धारित करने के लिए, 102 सबसे अधिक इस्तेमाल किए जाने वाले शब्दों (1160 से 35 की आवृत्ति के साथ) की गणना की गई सापेक्ष आवृत्ति (चयनात्मक मार्ग के आधार पर बनाई गई) के साथ की गई थी। वास्तविक के साथ। उदाहरण के लिए, संघ "और" पूरी कहानी में 1,160 बार इस्तेमाल किया गया था। सभी शब्दों की 5,000 घटनाओं वाले मार्ग में, इस संयुग्मन को 5,000 x 1,160: 30,000, या 193 बार गोल करने की उम्मीद की जानी चाहिए, और सभी शब्दों की 10,000 घटनाओं वाले मार्ग में, यह 10,000 x 1,160 होने की उम्मीद है : 30,000, या 386 बार। वास्तविक डेटा के साथ इस तरह की गणनाओं का उपयोग करके प्राप्त आंकड़ों की तुलना बहुत मामूली विचलन (5% के भीतर) दिखाती है। इस तरह की गणनाओं के आधार पर, यह पाया गया कि पुश्किन की इस कहानी में, पूर्वसर्ग "के" का प्रयोग "वाई" के रूप में दो बार किया जाता है, और सर्वनाम "आप" का उपयोग "उन्हें", आदि की तुलना में तीन गुना अधिक बार किया जाता है। कथानक के सभी उतार-चढ़ाव के बावजूद, पूरी कहानी में और इसके अलग-अलग हिस्सों में, शब्दों के उपयोग की सापेक्ष आवृत्ति में स्थिरता है। कुछ (सबसे सामान्य) शब्दों के संबंध में जो देखा गया है, वह संभवतः कार्य में प्रयुक्त सभी शब्दों पर लागू होता है। यह इस प्रकार है कि लेखक की शैली को किसी दिए गए भाषा के लिए सामान्य आवृत्ति के लिए किसी शब्द का उपयोग करने की औसत आवृत्ति की परिवर्तनशीलता के एक निश्चित अनुपात की विशेषता हो सकती है।<121>इसके उपयोग की आवृत्ति। इस अनुपात को लेखक की शैली की एक वस्तुपरक मात्रात्मक विशेषता के रूप में माना जाता है।

भाषा संरचना के अन्य औपचारिक तत्वों का अध्ययन इसी तरह किया जाता है। इसलिए, उदाहरण के लिए, वी. फुच्स ने तुलनात्मक-सांख्यिकीय विचार के लिए गोएथे, रिल्के, सीज़र, सल्लस्ट, आदि के कार्यों की मीट्रिक विशेषताओं को प्रस्तुत किया।

शब्दों के उपयोग की सापेक्ष आवृत्ति की स्थिरता की कसौटी, शैली के मात्रात्मक लक्षण वर्णन की तकनीक को स्पष्ट करते हुए, ऊपर विश्लेषण किए गए अधिक आदिम तरीकों की तुलना में मौलिक रूप से कुछ भी पेश नहीं करती है। स्टाइलोस्टैटिस्टिक्स के सभी तरीके अंततः समान रूप से "उद्देश्य" परिणाम उत्पन्न करते हैं, जीभ की सतह पर ग्लाइडिंग करते हैं और केवल विशुद्ध रूप से बाहरी संकेतों से चिपके रहते हैं। मात्रात्मक तरीके, जाहिरा तौर पर, अध्ययन की जा रही सामग्री में गुणात्मक अंतर पर ध्यान केंद्रित करने में सक्षम नहीं हैं और वास्तव में अध्ययन के तहत सभी वस्तुओं को समतल करते हैं।

जहां अधिकतम विशिष्टताओं की आवश्यकता होती है, वहां सबसे सामान्यीकृत मानदंड पेश किए जाते हैं; गुणात्मक विशेषताओं को मात्रा की भाषा में व्यक्त किया जाता है। यह न केवल एक तार्किक विरोधाभास है, बल्कि चीजों की प्रकृति के साथ असहमति भी है। वास्तव में, क्या होता है यदि हम अपने कैनवस पर लाल और काले रंग के मात्रात्मक अनुपात के आधार पर अलेक्जेंडर गेरासिमोव और रेम्ब्रांट के कार्यों की तुलनात्मक शैलीगत (अर्थात, गुणात्मक) विशेषता प्राप्त करने का प्रयास करते हैं? यह बिल्कुल बकवास लगता है। किसी व्यक्ति के भौतिक डेटा के बारे में पूरी तरह से "उद्देश्य" मात्रात्मक जानकारी किस हद तक हमें किसी व्यक्ति की विशेषता और उसे बनाने वाली हर चीज का अंदाजा लगाने में सक्षम है सच्चा सार? जाहिर तौर पर कोई नहीं। वे केवल एक व्यक्तिगत संकेत के रूप में सेवा कर सकते हैं जो एक व्यक्ति को दूसरे से अलग करता है, जैसे कि अंगूठे पर दृढ़ संकल्प की छाप। साहित्यिक शैली की मात्रात्मक विशेषताओं के साथ स्थिति समान है। यदि आप बारीकी से देखते हैं, तो वे वास्तविक शैलीगत निर्णय के लिए केवल अल्प डेटा प्रदान करते हैं<122>लेखक की भाषा के गुण, साथ ही मानव मनोविज्ञान के अध्ययन के लिए उंगली पर संकल्पों का वर्णन।

जो कुछ भी कहा गया है, उसमें यह जोड़ा जाना चाहिए कि अतीत में, साहित्यिक आलोचना के तथाकथित औपचारिक स्कूल में, लेखकों की शैली का मात्रात्मक अध्ययन करने का प्रयास पहले से ही किया गया था, जब विशेषण, रूपक और लयबद्ध-मधुर तत्व पद्य की गिनती की गई। हालाँकि, यह प्रयास आगे विकसित नहीं हुआ था।

भाषाई घटनाओं के अध्ययन के लिए गणितीय विधियों के अनुप्रयोग के एक अन्य क्षेत्र को भाषाई सांख्यिकी के नाम से समूहीकृत किया जा सकता है। यह भाषा के सिद्धांत के मूलभूत प्रश्नों में घुसपैठ करना चाहता है और इस प्रकार उचित भाषाई क्षेत्र में व्यवसाय प्राप्त करना चाहता है। इस दिशा से परिचित होने के लिए, इसके कई समीक्षकों में से एक के शब्दों में, हेर्डन के पहले से ही उल्लेखित कार्य की ओर मुड़ना सबसे अच्छा है, "एक राक्षसी रूप से दिखावा करने वाली पुस्तक" 7 5 , प्राप्त, हालांकि, भाषाविदों के बीच एक व्यापक प्रतिक्रिया 7 6 . इस तथ्य के मद्देनजर कि खेरदान (जैसा कि पहले ही ऊपर उल्लेख किया गया है) ने अपनी पुस्तक में भाषाई समस्याओं के लिए गणितीय विधियों के अनुप्रयोग के क्षेत्र में सबसे महत्वपूर्ण सब कुछ एकत्र करने की मांग की, उनकी पुस्तक में हम वास्तव में खेरदान के साथ इतना अधिक व्यवहार नहीं कर रहे हैं जितना कि समग्र रूप से रुझान। पुस्तक के शीर्षक के रूप में, "भाषा के रूप में पसंद और संभावना," से पता चलता है, इसका मुख्य ध्यान यह स्पष्ट करने पर है कि वक्ता की स्वतंत्र पसंद के लिए भाषा में क्या बचा है और भाषा की अंतर्निहित संरचना के कारण क्या है, जैसे पहले और दूसरे क्रम के तत्वों के मात्रात्मक अनुपात का निर्धारण करने पर। खेरदान की पुस्तक इस क्षेत्र में विभिन्न विशिष्टताओं के प्रतिनिधियों द्वारा किए गए सभी कार्यों के बारे में लगभग संपूर्ण जानकारी प्रदान करती है।<123>(दार्शनिक, भाषाविद्, गणितज्ञ, तकनीशियन), लेकिन यह यहीं तक सीमित नहीं है और इसमें स्वयं लेखक के कई मूल अवलोकन, विचार और निष्कर्ष शामिल हैं। संक्षेपण कार्य के रूप में, यह उपयोग की जाने वाली मात्रात्मक विधियों और उनकी सहायता से प्राप्त परिणामों का एक अच्छा विचार देता है। जिन सवालों को हम सशर्त रूप से भाषाई आंकड़ों के खंड में जोड़ते हैं, उनका इलाज पुस्तक के दूसरे और चौथे भाग में किया जाता है।

भाषाई मुद्दों के अध्ययन के लिए गणितीय आँकड़ों के तरीकों को लागू करने के कई मामलों में से, हम सबसे सामान्य लोगों पर ध्यान केंद्रित करेंगे, जिन्हें एक ही समय में सबसे विशिष्ट माना जा सकता है। अन्य लेखकों के डेटा का उपयोग करना - बोल्ड्रिनी 7 7 , मैथेशियस 7 8, मारियोटी 7 9, जिपफ 8 0, डेवे 8 1 और अन्य, साथ ही अपने स्वयं के अध्ययनों का हवाला देते हुए जो स्वरों, अक्षरों, शब्द की लंबाई (अक्षरों और अक्षरों की संख्या से मापा जाता है) के वितरण की सापेक्ष आवृत्ति निर्धारित करते हैं। , लैटिन और ग्रीक हेक्सामीटर में व्याकरणिक रूप और मीट्रिक तत्व, हेर्डन सभी भाषाई संरचनाओं की एक सामान्य विशेषता के रूप में भाषाई तत्वों की सापेक्ष आवृत्ति की स्थिरता के तथ्य को स्थापित करता है। वह निम्नलिखित नियम प्राप्त करता है: "भाषाई कोडिंग के एक या दूसरे स्तर या क्षेत्र से संबंधित भाषाई तत्वों का अनुपात - स्वर विज्ञान, व्याकरण, मेट्रिक्स - किसी दिए गए भाषा के विकास की एक निश्चित अवधि में और उसके भीतर कमोबेश स्थिर रहता है। पर्याप्त रूप से व्यापक और निष्पक्ष रूप से किए गए प्रेक्षणों की सीमाएं। » 8 2 . यह नियम, जिसे हर्डन भाषा का मूल नियम कहता है, वह एक निश्चित तरीके से व्याख्या और विस्तार करना चाहता है। "वह," हेर्डन इस कानून के बारे में लिखते हैं, "इस तथ्य की अभिव्यक्ति है कि यहां भी, जहां मानव इच्छा और पसंद की स्वतंत्रता प्रदान की जाती है<124>व्यापक ढांचा, जहां सचेत पसंद और लापरवाही एक-दूसरे के साथ विशद रूप से वैकल्पिक रूप से खेलते हैं, सामान्य तौर पर काफी स्थिरता होती है ... व्याकरण में, लेकिन विशिष्ट स्वरों, शाब्दिक इकाइयों (शब्दों) और व्याकरणिक स्वरों के उपयोग की आवृत्ति के संबंध में भी निर्माण; दूसरे शब्दों में, समानता न केवल उपयोग की जाने वाली चीज़ों में है, बल्कि यह कितनी बार उपयोग की जाती है" 8 3। यह स्थिति समझने योग्य कारणों से है, लेकिन यह नए निष्कर्षों को जन्म देती है। किसी दिए गए भाषा के विभिन्न ग्रंथों या खंडों की जांच करते समय, उदाहरण के लिए, यह पाया जाता है कि अलग-अलग लोगों द्वारा किसी दिए गए विशेष ध्वन्यात्मक (या अन्य भाषण तत्वों) के उपयोग की सापेक्ष आवृत्तियां मूल रूप से समान रहती हैं। यह भाषण के अलग-अलग रूपों की व्याख्या की ओर जाता है क्योंकि किसी दिए गए भाषा में विचार किए गए फोनेम का उपयोग करने की निरंतर संभावना में कुछ उतार-चढ़ाव होते हैं। इस प्रकार, यह पता चला है कि उनकी भाषण गतिविधि में एक व्यक्ति उपयोग किए गए भाषाई तत्वों की संख्या के संबंध में संभाव्यता के कुछ कानूनों के अधीन है। और फिर, जब हम ग्रंथों या भाषण खंडों के एक बड़े समूह में बड़ी संख्या में भाषाई तत्वों का निरीक्षण करते हैं, तो हमें इस अर्थ में कारण निर्भरता का आभास होता है कि इस मामले में कुछ भाषाई तत्वों के उपयोग के संबंध में भी निर्धारण होता है। दूसरे शब्दों में, यह दावा करने के लिए स्वीकार्य हो जाता है कि जो एक सहज ज्ञान युक्त दृष्टिकोण से एक कारण संबंध प्रतीत होता है, मात्रात्मक रूप से एक प्रायिकता 8 4 है। यह स्पष्ट है कि कुल जितना बड़ा होगा<125>परीक्षित ग्रंथों या भाषण खंडों की विशिष्टता, अधिक स्पष्ट रूप से भाषाई तत्वों के उपयोग की सापेक्ष आवृत्ति की स्थिरता व्यक्तिगत उपयोग (बड़ी संख्या के कानून) में भी प्रकट होगी। यहां से नया बनाया जाता है सामान्य निष्कर्षवह भाषा एक सामूहिक परिघटना है और इसे उसी रूप में माना जाना चाहिए।

ये निष्कर्ष, ध्वन्यात्मक तत्वों, शब्दों और व्याकरणिक रूपों की आवृत्ति गणना के आधार पर पहुंचे, जो एक साथ एक भाषा का गठन करते हैं, फिर सॉसर के विभाजन की "भाषा" (लालांग) और "भाषण" (लैपरोल) में "सांख्यिकीय व्याख्या" पर लागू होते हैं। ). सॉसर के अनुसार, "भाषा" भाषाई आदतों का एक समूह है जो किसी दिए गए भाषाई समुदाय के सदस्यों के बीच संचार को संभव बनाती है। यह एक सामाजिक वास्तविकता है, एक "सामूहिक घटना" है, जो इस भाषा को बोलने वाले सभी लोगों के लिए अनिवार्य है। हर्डन, जैसा कि संकेत दिया गया है, यह साबित करता है कि एक भाषा समुदाय के सदस्य एक दूसरे के समान हैं, न केवल इसमें वे एक ही स्वर, शाब्दिक इकाइयों और व्याकरणिक रूपों का उपयोग करते हैं, बल्कि यह भी कि इन सभी तत्वों का उपयोग समान आवृत्ति के साथ किया जाता है। इस प्रकार, "भाषा" की उनकी सांख्यिकीय परिभाषा निम्नलिखित रूप लेती है: "भाषा" (लालंगुए) सामान्य भाषाई तत्वों की समग्रता और उनके उपयोग की सापेक्ष संभावना है।

"भाषा" की यह परिभाषा "भाषण" की संबंधित सांख्यिकीय व्याख्या के लिए शुरुआती बिंदु भी है, जो सॉसर के अनुसार, एक व्यक्तिगत अभिव्यक्ति है। एक व्यक्तिगत घटना के रूप में "भाषण" की एक सामाजिक घटना के रूप में "भाषा" की तुलना करते हुए, सॉसर ने लिखा: "भाषण इच्छा और समझ का एक व्यक्तिगत कार्य है, जिसमें यह भेद करना आवश्यक है: 1. संयोजन जिसके साथ बोलने वाला विषय भाषा का उपयोग करता है अपने व्यक्तिगत विचार व्यक्त करने के लिए कोड; 2. एक साइकोफिजिकल तंत्र जो उसे इन संयोजनों को ऑब्जेक्टिफाई करने की अनुमति देता है" 8 5। चूँकि भाषाई आँकड़ों में "भाषा" को एक निश्चित सापेक्ष वाले तत्वों के समूह के रूप में माना जाता है<126>उनके उपयोग की निश्चित संभावना, जहां तक ​​​​इसमें सांख्यिकीय समग्रता या पहनावा (जनसंख्या) सबसे आवश्यक विशेषता के रूप में शामिल है और इस पहलू पर विचार किया जा सकता है। इसके अनुसार, "भाषण" एक सांख्यिकीय समुच्चय के रूप में "भाषा" से लिए गए एक अलग नमूने में बदल जाता है। इस मामले में संभाव्यता "भाषण" के "भाषा" (उनकी "मात्रात्मक" समझ में) के संबंध से निर्धारित होती है, और भाषा के विभिन्न तत्वों के उपयोग की सापेक्ष आवृत्ति के वितरण को परिणाम के रूप में व्याख्या की जाती है सामूहिक "पसंद" (पसंद) भाषा के अस्तित्व की एक निश्चित कालानुक्रमिक अवधि में। यह महसूस करते हुए कि "भाषा" और "भाषण" के बीच अंतर की ऐसी व्याख्या फिर भी सॉसर की तुलना में पूरी तरह से अलग आधारों पर बनाई गई है, हर्डन इस संबंध में लिखते हैं: "सौसर की अवधारणा के स्पष्ट रूप से मामूली संशोधन का महत्वपूर्ण परिणाम है कि" भाषा "( lalangue) ) अब एक सांख्यिकीय समुच्चय (जनसंख्या) के रूप में एक आवश्यक विशेषता प्राप्त करता है। यह आबादी कुछ सापेक्ष आवृत्तियों या उतार-चढ़ाव की संभावनाओं की विशेषता है, जिसका अर्थ है कि प्रत्येक भाषाई तत्व एक निश्चित भाषाई स्तर से संबंधित है। इस मामले में, "भाषण" (लैपरोल), इसके अर्थ के अनुसार, सांख्यिकीय जनसंख्या के रूप में "भाषा" से लिए गए सांख्यिकीय नमूनों को परिभाषित करने के लिए एक शब्द बन जाता है। यह स्पष्ट हो जाता है कि पसंद (पसंद) यहां "भाषण" से "भाषा" के अनुपात के रूप में दिखाई देती है, जो एक सांख्यिकीय कुल (जनसंख्या) के लिए यादृच्छिक रूप से लिए गए नमूने का अनुपात है। आवृत्ति वितरण का बहुत क्रम, सदियों से एक भाषाई समुदाय की भाषण गतिविधि के जमाव के रूप में, पसंद (पसंद) का एक तत्व है, लेकिन व्यक्तिगत पसंद का नहीं, जैसा कि शैली में है, लेकिन सामूहिक पसंद का है। एक रूपक का उपयोग करते हुए, हम यहां भाषा की भावना द्वारा की गई पसंद के बारे में बात कर सकते हैं, अगर हम भाषाई संचार के सिद्धांतों को समझते हैं, जो किसी विशेष भाषाई समुदाय के सदस्यों के मानसिक डेटा के परिसर के अनुसार हैं। श्रृंखला की स्थिरता संभाव्यता (मौका) का परिणाम है» 8 6।

बताए गए सिद्धांत के आवेदन का एक विशेष मामला<127>पीए "अपवाद" (विचलन) से प्रामाणिक घटना की भाषा में परिसीमन है। भाषाई आँकड़ों में, यह तर्क दिया जाता है कि सांख्यिकीय पद्धति आपको मौजूदा को खत्म करने की अनुमति देती है यह मुद्दाअस्पष्टता और इन घटनाओं के बीच अंतर करने के लिए स्पष्ट मानदंड स्थापित करें। यदि आदर्श को एक सांख्यिकीय जनसंख्या (उपरोक्त अर्थ में) के रूप में समझा जाता है, और अपवाद (या त्रुटि) सांख्यिकीय जनसंख्या द्वारा दर्शाई गई आवृत्तियों से विचलन है, तो प्रश्न का एक मात्रात्मक समाधान स्वयं सुझाता है। यह सब "जनसंख्या" और "बाह्य" के बीच एक सांख्यिकीय संबंध के लिए उबलता है। यदि एक व्यक्तिगत नमूने में देखी गई आवृत्तियाँ सांख्यिकीय आबादी के कारण संभावनाओं से अधिक होती हैं, जो नमूना गणनाओं की एक श्रृंखला द्वारा निर्धारित की जाती हैं, तो हमारे पास यह निष्कर्ष निकालने का कारण है कि "समान" (मानक) और "नहीं" के बीच की सीमा रेखा वही" (अपवाद) का उल्लंघन किया जाता है।

"भाषा" और "भाषण" के बीच मात्रात्मक अंतर का उपयोग दो प्रकार के भाषाई तत्वों को भेद करने के लिए भी किया जाता है: व्याकरणिक और शाब्दिक। इस समस्या को हल करने के लिए शुरुआती बिंदु, जो अक्सर भाषाई दृष्टिकोण से बड़ी कठिनाइयों को प्रस्तुत करता है, यह धारणा है कि व्याकरणिक तत्वों की आवृत्ति की डिग्री लेक्सिकल इकाइयों की तुलना में भिन्न होती है। यह कथित रूप से व्याकरणिक तत्वों के "सामान्यीकरण" से जुड़ा हुआ है, कैसे वे शाब्दिक इकाइयों द्वारा निर्धारित अवधारणाओं से भिन्न होते हैं। इसके अलावा, व्याकरणिक तत्व माना जाता है, एक नियम के रूप में, मात्रा में बहुत छोटा: स्वतंत्र शब्दों के रूप में (उनमें सर्वनाम, पूर्वसर्ग, संयुग्मन और शामिल हैं) आधिकारिक शब्द) वे आम तौर पर कम संख्या में स्वरों से युक्त होते हैं, और "संबंधित रूपों" के रूप में - एक या दो स्वरों के 8 7 . भाषाई तत्व जितना छोटा होता है, इसकी "लंबाई" (मात्रात्मक क्षण) एक परिभाषित विशेषता के रूप में कम सक्षम होती है, और इस उद्देश्य के लिए स्वरों की "गुणवत्ता" उतनी ही महत्वपूर्ण होती है। विचाराधीन समस्या को हल करने के लिए कौन से तरीके प्रस्तावित हैं? इसे व्याकरणिक की विशुद्ध रूप से मात्रात्मक अवधारणा के संदर्भ में हल किया जाता है<128>लोड, "मान लीजिए," इस संबंध में हर्डन लिखते हैं, "कि हम इस संबंध में दो भाषाओं की तुलना करने में रुचि रखते हैं। हम एक निश्चित डिग्री की निष्पक्षता के साथ "व्याकरणिक भार" कैसे निर्धारित करते हैं जो एक भाषा वहन करती है? यह स्पष्ट है कि यह भार व्याकरण को शब्दावली से अलग करने वाली सीमांकन रेखा की स्थिति पर निर्भर करेगा। पहला विचार जो हमारे दिमाग में आ सकता है वह यह निर्धारित करना है कि दी गई भाषा का व्याकरण कितना "जटिल" है। आखिरकार, "जटिलता" एक गुणात्मक विशेषता है, और "व्याकरणिक भार" की अवधारणा एक मात्रात्मक विशेषता है। सच है, भार कुछ हद तक जटिलता पर निर्भर करता है, लेकिन पूरी तरह से नहीं। एक भाषा को एक अत्यंत जटिल व्याकरण के साथ पुरस्कृत किया जा सकता है, लेकिन भाषा की गतिविधि में इसका तुलनात्मक रूप से छोटा हिस्सा ही उपयोग किया जाता है। हम "व्याकरणिक भार" को व्याकरण की समग्रता के रूप में परिभाषित करते हैं जो एक भाषा जब क्रिया में होती है, जो तुरंत हमारी समस्या को संरचनात्मक भाषाविज्ञान के दायरे में लाती है, जिसमें अनुशासन को सॉसर द्वारा परिभाषित किया गया था। निम्नलिखित प्रस्तुति में, मात्रात्मक तरीकों का उपयोग भाषाओं के बीच अंतर को निर्धारित करने के लिए किया जाता है, जहां सीमा निहित है, व्याकरण को शब्दावली से अलग करना "8 8। दूसरे शब्दों में, इस मामले में भाषा के अंतर को व्याकरणिक और शाब्दिक तत्वों के बीच संख्यात्मक संबंधों में अंतर के रूप में कम किया जाना चाहिए।

हमारे निपटान में सामग्री निम्नलिखित चित्र को चित्रित करती है। में अंग्रेजी भाषा(केवल "व्याकरणिक शब्दों" को ध्यान में रखा गया था: सर्वनाम, या, जैसा कि उन्हें "प्रतिस्थापन", पूर्वसर्ग, संयुग्मन और भी कहा जाता है सहायक क्रियाएँ) एक सेगमेंट में जिसमें सभी शब्दों (1027 अलग-अलग शब्द) के उपयोग के 78,633 मामले शामिल हैं, व्याकरणिक तत्वों के उपयोग के 53,102 मामले, या अधिक सटीक रूप से, "व्याकरणिक शब्द" (149 अलग-अलग शब्द) पाए गए, जो कि 67.53 है 15.8% अलग-अलग शब्दों पर%। ये हैं Deway 8 9 के आंकड़े। अन्य डेटा एक अलग प्रतिशत दिखाते हैं<129>अनुपात: 57.1% 5.4% अलग-अलग शब्दों के साथ 9 0। इस महत्वपूर्ण विसंगति को लिखित और बोली जाने वाली भाषा के बीच के अंतर से समझाया गया है। लिखित रूपभाषाएँ (पहला डेटा) कथित तौर पर मौखिक (दूसरा मामला) की तुलना में अधिक व्याकरणिक तत्वों का उपयोग करती हैं। दांते की डिवाइन कॉमेडी (इतालवी मूल के बाद) में, मारियोटी ने "व्याकरणिक शब्दों" की घटनाओं का 54.4% स्थापित किया।

एक और, जाहिरा तौर पर, किसी भाषा के व्याकरणिक भार को निर्धारित करने का एक अधिक सही तरीका व्याकरणिक तत्वों में शामिल स्वरों की गणना करना है। इस मामले में, न केवल स्वतंत्र व्याकरणिक शब्दों, बल्कि संबंधित रूपों को भी ध्यान में रखा जाता है। यहाँ संभव हैं विभिन्न विकल्प. उदाहरण के लिए, व्याकरणिक तत्वों में अलग-अलग व्यंजन स्वरों के उपयोग की सापेक्ष आवृत्ति का निर्धारण करना और उनकी तुलना इन समान स्वरों के कुल उपयोग की आवृत्ति के साथ करना (अंग्रेजी में इस तरह के अनुपात का अंतिम डेटा 99.9% से 100,000 का अनुपात देता है - कुल उपयोग); या अलग-अलग वर्गीकरण समूहों (लेबियाल, पैलेटल, वेलर और अन्य स्वर) के अनुसार व्यंजनों की समान तुलना। यहां अंतिम अनुपात 56.47% (व्याकरणिक तत्वों में) से 60.25% (कुल उपयोग में) के अनुपात का रूप लेता है; या प्रारंभिक व्यंजन स्वरों की समान तुलना (इस मामले में, व्याकरणिक शब्दों में अनुपात 100.2% कुल उपयोग में 99.95 था)। अन्य अधिक जटिल सांख्यिकीय संचालन भी संभव हैं, हालांकि, अध्ययन के तहत समस्या के समान मात्रात्मक अभिव्यक्तियों का परिणाम है।

दिए गए मात्रात्मक डेटा एक सामान्य निष्कर्ष के आधार के रूप में कार्य करते हैं। यह इस तथ्य पर निर्भर करता है कि व्याकरणिक तत्वों में स्वरों का वितरण समग्र रूप से भाषा में स्वरों के वितरण की प्रकृति (संख्यात्मक शब्दों में, निश्चित रूप से) को निर्धारित करता है। और यह, बदले में, हमें यह निष्कर्ष निकालने की अनुमति देता है कि व्याकरणिक तत्वों का उपयोग कम से कम व्यक्तिगत पसंद पर निर्भर करता है और भाषाई अभिव्यक्ति के उस हिस्से का गठन करता है जो संभावनाओं द्वारा नियंत्रित होता है।<130>नेस। Esselson 9 1 द्वारा बनाई गई रूसी भाषा में व्याकरणिक रूपों की गणना से इस सट्टा निष्कर्ष की पुष्टि होती है। अध्ययन द्वितीय स्रोतों से लिए गए 46896 शब्दों के अधीन था (ग्रिबेडोव, दोस्तोवस्की, गोंचारोव, साल्टीकोव-शेड्रिन, गारशिन, बेलिंस्की, एम्फिटेट्रोव, गुसेव-ऑरेनबर्गस्की, एहरनबर्ग, सिमोनोव और एन। ओस्ट्रोव्स्की द्वारा काम करता है)। उन्हें बोलचाल के शब्दों (17,756 शब्दों या 37.9%) और गैर-बोलचाल के शब्दों (29140 शब्दों या 62.1%) में विभाजित किया गया था। तब शब्दों के पूरे समूह को उनकी व्याकरणिक प्रकृति के आधार पर 4 समूहों में विभाजित किया गया था: पहले समूह में संज्ञा, विशेषण, संज्ञा, सर्वनाम और विभक्ति वाले अंकों के कार्य में विशेषण शामिल थे; दूसरे समूह में - क्रिया; तीसरे समूह में - मौखिक प्रतिभागी, विशेषण और संज्ञा और गेरुंड के कार्य में भाग लेते हैं; चौथे समूह में - क्रियाविशेषण, पूर्वसर्ग, संयुग्मन और कण के अपरिवर्तनीय रूप। सारांश परिणाम (व्यक्तिगत लेखकों के लिए डेटा वाली तालिकाएँ भी दी गई हैं) निम्नलिखित अनुपात देते हैं:

पहला समूह

दूसरा समूह

तीसरा समूह

चौथा समूह

बोल-चाल का

अल्पभाषी

हेर्डन निम्नलिखित शब्दों में इस प्रकार प्राप्त मात्रात्मक डेटा के विचार की विशेषता बताते हैं: "वे इस निष्कर्ष को सही ठहराते हैं कि व्याकरणिक तत्वों को एक कारक के रूप में माना जाना चाहिए जो भाषाई अभिव्यक्ति की संभावना को निर्धारित करता है। ऐसा निष्कर्ष प्रयुक्त प्रत्येक शब्द की बोझिल योग्यता से बचा जाता है। यह स्पष्ट है कि, चूंकि व्याकरण और शब्दावली निर्विवाद गोले में संग्रहीत नहीं हैं, न तो शुद्ध "पसंद" या शुद्ध "मौका" है। व्याकरण और शब्दावली दोनों में दोनों तत्व शामिल हैं, हालांकि काफी भिन्न अनुपात में" 9 2।<131>

हर्डन की पुस्तक का एक बड़ा भाग भाषा में द्वैत या द्वैत के अध्ययन के लिए समर्पित है, और द्वैत की अवधारणा गणितीय विशेषताओं पर आधारित है।

इस प्रकार, प्रक्षेपी ज्यामिति में प्रमेयों को दो श्रृंखलाओं में व्यवस्थित किया जा सकता है, ताकि शब्दों को बदलकर एक श्रृंखला के प्रत्येक प्रमेय को दूसरी श्रृंखला के किसी प्रमेय से प्राप्त किया जा सके। डॉटऔर सीधा।उदाहरण के लिए, यदि एक कथन दिया गया है: "कोई भी भिन्न बिंदु एक और केवल एक रेखा से संबंधित हैं," तो हम इससे संबंधित कथन प्राप्त कर सकते हैं: "कोई भी दो अलग-अलग रेखाएँ एक और केवल एक बिंदु से संबंधित हैं।" द्वैत का निर्धारण करने के लिए एक अन्य विधि भुज और y-अक्ष के साथ प्लॉट करना है विभिन्न योजनाएँअध्ययन के तहत घटना। इसलिए, उदाहरण के लिए, यूल 9 3 करता है, उपयोग की विभिन्न आवृत्तियों को भुज के साथ गिना जाता है, और शाब्दिक इकाइयों की संख्या जिनकी आवृत्ति निर्धारित की जाती है, आदि की गणना समन्वय के साथ की जाती है। इस प्रकार द्वैत की अवधारणा है व्याख्या, माना जाता है समान रूप सेभाषाई अनुसंधान के लिए लागू

इस तरह से परिभाषित द्वैत की अवधारणा के तहत, जो सभी मामलों में वास्तव में एक बाइनरी कोड का चरित्र है और जिसे भाषाई संरचना की सबसे आवश्यक विशेषता भी माना जाता है, अत्यंत भिन्न गुणों की घटनाएं सामने आती हैं, जो दो विमानों के साथ विरोध की अनुमति देती हैं। : शाब्दिक इकाइयों की प्रकृति के अनुसार शब्दों के उपयोग का वितरण और आवृत्ति के अनुसार शाब्दिक इकाइयों का वितरण शब्दों का प्रयोग; भाषण के लिखित और मौखिक रूप; शाब्दिक और व्याकरणिक तत्व; पर्यायवाची और विलोम; स्वनिम और इसका ग्राफिक प्रतिनिधित्व; परिभाषित करने योग्य और परिभाषित करने योग्य (सौसर का महत्वपूर्ण और महत्वपूर्ण), आदि।

एक या दूसरे विशेष, भाषाई घटना या सीमित "पाठ" के द्वंद्व के मात्रात्मक अध्ययन के बाद, एक नियम के रूप में, एक निष्कर्ष निकाला जाता है, जिसके लिए भाषाई सार्वभौमिकता के गुणों को जिम्मेदार ठहराया जाता है। ऐसे निष्कर्षों की प्रकृति और उनके औचित्य को उदाहरण में देखा जा सकता है<132>शब्द और अवधारणा के द्वंद्व का अध्ययन (वास्तव में, हम शब्द की लंबाई और अवधारणा की मात्रा के अनुपात के बारे में बात कर रहे हैं - यह ध्यान में रखना चाहिए कि भाषाई और अन्य शब्दों का अत्यंत मुक्त उपयोग ऐसे कार्य अक्सर समझने को बहुत कठिन बना देते हैं)। यह ध्यान रखना महत्वपूर्ण है कि इस प्रकार के भाषाई द्वैत की टिप्पणियों के स्रोत के रूप में काम करने वाली सामग्री के रूप में, निम्नलिखित का उपयोग किया गया था: रोगों का अंतर्राष्ट्रीय नामकरण (लगभग 1000 नाम) और 1949 के लिए इंग्लैंड और वेल्स में रोगों का सामान्य रजिस्टर इस मामले में, निम्नलिखित सामान्य निष्कर्ष निकाला जाता है: " एक सामान्य विचार को दर्शाने वाली प्रत्येक अवधारणा में एक "गोला" या "मात्रा" कहा जा सकता है। यह अपने माध्यम से कई वस्तुओं या अन्य अवधारणाओं के बारे में सोचने की अनुमति देता है जो इसके "क्षेत्र" के भीतर हैं। दूसरी ओर, एक अवधारणा को परिभाषित करने के लिए आवश्यक सभी मदों को इसकी "सामग्री" कहा जाता है। वॉल्यूम और सामग्री परस्पर संबंधित हैं - सामग्री जितनी छोटी होती है और, तदनुसार, अवधारणा जितनी अधिक सारगर्भित होती है, उसका दायरा या आयतन उतना ही बड़ा होता है, यानी अधिक वस्तुओं को इसके अंतर्गत लाया जाता है। इसे कोडिंग के सिद्धांतों के अनुरूप (वैचारिक क्षेत्र में) देखा जा सकता है, जिसके अनुसार एक प्रतीक की लंबाई और उपयोग की आवृत्ति अन्योन्याश्रित हैं" 9 4।

द्वैत का सिद्धांत विशेष समस्याओं पर भी लागू होता है। उदाहरण के लिए, दो शब्दों के अर्थों की समानता स्थापित करते समय विभिन्न भाषाएं. गणितीय पुनरावृति पद्धति का उपयोग करके मूरेट-ज़ैंडर्स द्वारा अंग्रेजी-जर्मन शब्दकोश का अध्ययन करने के परिणामस्वरूप, यह निष्कर्ष निकाला गया है कि जर्मन अनुवाद में एक या एक से अधिक अर्थों के साथ अंग्रेजी शब्द का उपयोग करने की संभावना पूरे शब्दकोश 9 में प्रत्येक प्रारंभिक अक्षर के लिए स्थिर रहती है। 5। चीनी शब्दकोशों में शब्द क्रम पर विचार करने से यह निष्कर्ष निकलता है कि यह एक टैक्सोनोमिक प्रकृति का है, क्योंकि चरित्र में स्ट्रोक की संख्या इसके स्थान को इंगित करती है (एक स्वतंत्र कट्टरपंथी या कट्टरपंथी के अधीनस्थ एक निश्चित उपवर्ग के रूप में)। टैक्सोनॉमी जूलॉजी और वनस्पति विज्ञान में प्रयुक्त वर्गीकरण का एक अधीनस्थ सिद्धांत है। खेरदान का दावा है<133>चीनी शब्दकोश की नींव भी वर्गीकरण 9 6, आदि के सिद्धांतों पर बनी है।

भाषाई समस्याओं (यानी, भाषाई सांख्यिकी) के अध्ययन के लिए गणितीय तरीकों के आवेदन के इस क्षेत्र का एक सामान्य मूल्यांकन करते हुए, यह आवश्यक है, जाहिरा तौर पर, एटिंगर द्वारा तैयार की गई स्थिति से आगे बढ़ने के लिए: "गणित का प्रभावी ढंग से उपयोग किया जा सकता है भाषाविज्ञान की सेवा में तभी जब भाषाविद् इसके अनुप्रयोग की वास्तविक सीमाओं के साथ-साथ उपयोग किए गए गणितीय मॉडल की संभावनाओं को स्पष्ट करते हैं ”9 7। दूसरे शब्दों में, हम गणितीय भाषाविज्ञान के बारे में तब बात कर सकते हैं जब गणितीय विधियाँ उन भाषाई समस्याओं को हल करने के लिए अपनी उपयुक्तता सिद्ध करती हैं, जो अपनी समग्रता में भाषा के विज्ञान का निर्माण करती हैं। यदि ऐसा नहीं है, हालांकि यह वैज्ञानिक अनुसंधान के नए पहलुओं को खोल सकता है, तो इस मामले में आप कुछ भी बात कर सकते हैं, लेकिन भाषाविज्ञान के बारे में नहीं - इस मामले में हमारा मतलब नहीं है अलग - अलग प्रकारअनुप्रयुक्त भाषाविज्ञान (इस पर नीचे चर्चा की जाएगी), और वैज्ञानिक, या सैद्धांतिक, भाषाविज्ञान। इस स्थिति के आधार पर, यह ध्यान दिया जाना चाहिए कि एक भाषाविद् के दृष्टिकोण से, भाषाई आंकड़ों में बहुत कुछ संदिग्ध और यहां तक ​​कि आश्चर्यजनक है।

आइए हम केवल दो उदाहरणों के विश्लेषण की ओर मुड़ें (ताकि प्रस्तुति को अव्यवस्थित न करें), यह आरक्षित करते हुए कि उनमें से प्रत्येक के लिए बहुत महत्वपूर्ण आपत्तियाँ की जा सकती हैं। यहाँ हमारे पास व्याकरणिक और शाब्दिक इकाइयों के बीच मात्रात्मक अंतर है। यह पता चला है कि इस तरह के अंतर को बनाने के लिए, पहले से ही यह जानना आवश्यक है कि व्याकरण के क्षेत्र से क्या संबंधित है, और शब्दावली क्या है, क्योंकि भाषा का "व्याकरणिक भार" (यानी, व्याकरणिक तत्वों की समग्रता) भाषण में प्रयुक्त), जैसा कि ऊपर उद्धृत किया गया है, "सीमांकन की रेखा पर निर्भर करता है जो शब्दावली को व्याकरण से अलग करता है।" यह जाने बिना कि यह रेखा कहाँ स्थित है, इसलिए संकेतित भेद को आकर्षित करना असंभव है। व्याकरण से शाब्दिक भेद करने की मात्रात्मक पद्धति का अर्थ क्या है?<134>मैटिक? हालाँकि, हर्डन के लिए, वह विशेष रूप से इस मुद्दे के बारे में नहीं सोचते हैं और साहसपूर्वक भाषाई तत्वों को वर्गीकृत करते हैं, व्याकरणिक तत्वों "जुड़े रूपों" का जिक्र करते हुए, जो प्रस्तुति को देखते हुए, बाहरी विभक्ति और "व्याकरणिक शब्दों" के रूप में समझा जाना चाहिए। जिसमें पूर्वसर्ग, संयोजन, सहायक क्रिया और सर्वनाम शामिल हैं - उत्तरार्द्ध इस तथ्य के आधार पर कि वे "विकल्प" हैं। लेकिन अगर हम केवल सर्वनामों के इस गुण की बात करें और इस आधार पर उन्हें व्याकरणिक तत्वों से संबंधित करें, तो जाहिर है, "पूर्वोक्त", "नाम", "दिया", आदि जैसे शब्दों को भी उनके लिए जिम्मेदार ठहराया जाना चाहिए, इसलिए वे भी कैसे प्रतिनिधि के रूप में कार्य करते हैं। भाषाई आँकड़ों में प्रयुक्त व्याकरणिक तत्वों को अलग करने की विधि के संबंध में, स्वाभाविक रूप से यह सवाल उठता है कि इस मामले में इस तरह के "गैर-औपचारिक" व्याकरणिक घटनाओं के साथ शब्द क्रम, स्वर, शून्य morphemes, प्रतिमान संबंध (इनमें से कुछ घटनाएं) से कैसे निपटें , वैसे, उन भाषाओं में प्रतिबिंब पाते हैं जिनका अध्ययन गणितीय तरीकों से किया जाता है)? समृद्ध आंतरिक विभक्ति (उदाहरण के लिए, सेमिटिक भाषाओं में) के साथ भाषाओं में अंतर कैसे आकर्षित करें, जहां यह न केवल व्याकरणिक रूप से जड़ (कट्टरपंथी) को संशोधित करता है, बल्कि इसे शाब्दिक अस्तित्व भी देता है, क्योंकि बिना क्रमपरिवर्तन के जड़ है भाषा में कोई वास्तविक अस्तित्व नहीं है? किसी भाषा की व्याकरणिक जटिलता से क्या समझा जाना चाहिए, यह किस कसौटी से निर्धारित होता है? यदि मात्रात्मक बिंदु, जिस पर इस मामले में हर संभव तरीके से जोर दिया जाता है, तो सबसे अधिक व्याकरणिक रूप से कठिन भाषाओं में से एक अंग्रेजी होगी, जिसमें इस तरह के निर्माण हैं जैसे मैं बुला रहा हूं या वह बुला रहा होगा। इन वाक्यों में, केवल कॉल को लेक्सिकल के रूप में वर्गीकृत किया जा सकता है, और बाकी सब कुछ, इसलिए, व्याकरणिक माना जाना चाहिए। व्याकरणिक तत्वों के उपयोग की आवृत्ति को व्याकरणिक शब्दों के अर्थों की व्यापकता या अमूर्तता से जोड़ने के लिए कौन से आधार मौजूद हैं? आखिरकार, यह काफी स्पष्ट है कि व्याकरणिक तत्वों के उपयोग की अपेक्षाकृत बड़ी आवृत्ति वाक्यों के निर्माण में उनके कार्य द्वारा निर्धारित की जाती है, और अर्थों की अमूर्तता के लिए, एक बड़ा खोजना बहुत आसान है<135>शाब्दिक तत्वों की संख्या जो इस संबंध में व्याकरणिक तत्वों के साथ आसानी से प्रतिस्पर्धा कर सकते हैं, आवृत्ति में काफी हद तक कम (उदाहरण के लिए, अस्तित्व, अस्तित्व, विस्तार, स्थान, पदार्थवगैरह)।

शब्द और अवधारणा के द्वैत (द्वैत) की परिभाषा के मामले में इसी तरह की बेरुखी हमारे सामने आती है। रोगों के नामकरण और रोगों के अस्पताल के रजिस्टर का उपयोग करके अनुसंधान के अधीन करने के लिए भाषा के संरचनात्मक सार की एक अत्यंत विशिष्ट समझ होना आवश्यक है, जैसा कि ऊपर बताया गया है, बहुत महत्वपूर्ण भाषाई के लिए स्रोत सामग्री के रूप में कार्य करता है। निष्कर्ष। ऐसे शब्दों के पूरी तरह से अस्पष्ट उपयोग पर ध्यान दिए बिना, जिनका भाषाई अस्तित्व नहीं है, जैसे कि एक अवधारणा का क्षेत्र, मात्रा और सामग्री (वैसे, शब्द का शाब्दिक अर्थ और वैज्ञानिक शब्द द्वारा निरूपित अवधारणा सकल है भ्रमित), आइए हम इस मामले में किए गए निष्कर्ष की ओर मुड़ें। जैसा ऊपर बताया गया है, हम इस दावे से निपट रहे हैं कि "क्षेत्र और सामग्री पारस्परिक रूप से सहसंबंधित हैं।" तर्क का पूरा कोर्स जो इस तरह के निष्कर्ष के लिए आधार देता है, साथ ही भाषाई तथ्यों के गणितीय संचालन की विधि स्पष्ट रूप से दिखाती है कि इस मामले में भाषा की एक बहुत ही आवश्यक गुणवत्ता को पूरी तरह से नजरअंदाज कर दिया जाता है, जो सभी गणनाओं को पूरा करता है : अलग-अलग "मात्रा" की भाषाई इकाइयों द्वारा एक ही "सामग्री" को व्यक्त करने की क्षमता, जो निस्संदेह, इसके अलावा, उपयोग की अलग-अलग सापेक्ष आवृत्ति है। इसलिए, हम उसी व्यक्ति को पेत्रोव, मेरे परिचित, वह, एक मस्कोवाइट, एक युवक, एक विश्वविद्यालय कर्मचारी, मेरी पत्नी के भाई, एक व्यक्ति जिसे हम पुल पर मिले थे, आदि के रूप में नामित कर सकते हैं। ऐसे तथ्यों के आलोक में, वहाँ इसमें कोई संदेह नहीं है कि केवल निजी निष्कर्ष हैं, हालांकि, जैसा कि यह बताया गया था, सार्वभौमिक महत्व जुड़ा हुआ है, लेकिन ऐसी भाषाई समस्याओं के लिए स्वयं मात्रात्मक तरीकों को लागू करने की समीचीनता भी जुड़ी हुई है।

लेकिन कभी-कभी भाषाविदों को ऐसे निष्कर्ष पेश किए जाते हैं, जिनकी वैधता पर कोई संदेह नहीं है। यह "भाषा का मूल नियम" है, जिसमें यह शामिल है कि भाषा में इसके तत्वों की एक निश्चित स्थिरता और उनके उल्लेख की सापेक्ष आवृत्ति होती है।<136>उपभोग। हालाँकि, इस तरह की खोजों के साथ समस्या यह है कि वे लंबे समय से भाषाविदों के लिए जाने जाते हैं। आखिरकार, यह बिल्कुल स्पष्ट है कि यदि भाषा में एक निश्चित स्थिरता नहीं होती और किसी दिए गए भाषाई समुदाय का प्रत्येक सदस्य स्वतंत्र रूप से भाषा के तत्वों में परिवर्तन करता है, तो आपसी संचार संभव नहीं होगा और भाषा का अस्तित्व ही अर्थहीन हो जाएगा। . भाषा के अलग-अलग तत्वों के उपयोग की सापेक्ष आवृत्ति के वितरण के लिए, इसने भाषाविज्ञान में अपनी अभिव्यक्ति को निष्क्रिय और सक्रिय शब्दावली और व्याकरण की श्रेणियों के आवंटन के रूप में पाया है, जिस पर एल. वी. शचरबा ने इतना ध्यान दिया। इस मामले में, सांख्यिकीय विधियां केवल भाषाविदों को उनके उपयोग की सापेक्ष आवृत्ति की श्रेणियों के अनुसार विशिष्ट भाषाई तत्वों के वितरण में मदद कर सकती हैं, लेकिन उनके पास सैद्धांतिक भाषाविज्ञान के मूल्य के किसी भी नए पैटर्न को खोजने का दावा करने का कोई कारण नहीं है।

दूसरी ओर, भाषाई आँकड़े वास्तव में कई "मूल" निष्कर्ष प्रस्तुत करते हैं जो इसके अनुयायियों की वैज्ञानिक सोच की प्रकृति का अत्यंत संकेत देते हैं। इस प्रकार, चर्चिल, बेनेस, हैलिफ़ैक्स, स्ट्रेसेमैन और अन्य के कार्यों में "राजनीतिक शब्दावली" का अध्ययन जटिल सांख्यिकीय विधियों के साथ किया जाता है, और अंग्रेजी में उनके कार्यों के अनुवाद गैर-अंग्रेजी बोलने वाले लेखकों की गणना में उपयोग किए जाते हैं। गणना के परिणाम कई तालिकाओं, गणितीय सूत्रों और समीकरणों के रूप में प्रस्तुत किए जाते हैं। इस मामले में मात्रात्मक डेटा की भाषाई व्याख्या इस तथ्य तक कम हो जाती है कि लेखकों के इस समूह के लिए चर्चिल की "राजनीतिक शब्दावली" का उपयोग सबसे विशिष्ट (?) है और चर्चिल के शब्दों का उपयोग उन मामलों में जहां वह राजनीतिक मुद्दों से संबंधित है अंग्रेजी भाषण समूह के 9 8 .

एक अन्य मामले में, उपयुक्त सांख्यिकीय जोड़तोड़ के बाद, यह निष्कर्ष निकाला गया है कि हिटलर ने नाजी जर्मनी के उपयोग में इन शर्तों के मात्रात्मक अर्थ में "भाषा" और "भाषण" के बीच द्वंद्व का उल्लंघन किया। इस द्वैत के विनाश का एक विशेष मामला शाब्दिक समझ है<137>रूपक बदल जाता है (उदाहरण के लिए, "खुले घावों में नमक डालना")। नाजी जर्मनी ने खुद को इतने अमानवीय कृत्यों से ढँक लिया कि उसे इस भाषाई अत्याचार के लिए दोषी ठहराने की शायद ही कोई आवश्यकता है 9 9 . खेरदान के अनुसार, मार्क्स की भाषा की परिभाषा विचार की तत्काल वास्तविकता के रूप में भी भाषाई द्वैत के उल्लंघन की ओर ले जाती है, और इसके विपरीत में एक घटना के संक्रमण के बारे में द्वंद्वात्मकता का कानून, उनकी राय में, द्वैत का गलत भाषाई कानून है। भाषा का। ऐसी व्याख्याएं अपने लिए बोलती हैं।

अंत में, भाषाई सामग्री का अध्ययन करने की मात्रात्मक पद्धति के उपरोक्त सभी मामलों में निहित एक सामान्य कमी और इस प्रकार एक पद्धतिगत चरित्र प्राप्त करना भाषाई तत्वों के लिए एक दूसरे से बिल्कुल स्वतंत्र तथ्यों के एक यांत्रिक सेट के रूप में दृष्टिकोण है, जिसके अनुसार, यदि कोई हो या पैटर्न, वे केवल स्वायत्त तथ्यों के वितरण के संख्यात्मक संबंधों को संदर्भित करते हैं, उनकी प्रणालीगत निर्भरता के बाहर। सच है, जे। वाटमौ हर संभव तरीके से आश्वस्त करने की कोशिश करता है कि यह गणित है जो किसी भी प्रकार के भाषाई संरचनात्मक विश्लेषण से बेहतर है, जो किसी भाषा की संरचनात्मक विशेषताओं को प्रकट करने में सक्षम है। "आधुनिक गणित," वह लिखते हैं, "माप और कलन से संबंधित नहीं है, जिसकी सटीकता उनकी प्रकृति द्वारा सीमित है, लेकिन मुख्य रूप से संरचना के साथ है। यही कारण है कि गणित भाषा सीखने की सटीकता के लिए अत्यधिक अनुकूल है - इस हद तक कि एक अलग विवरण, प्रकृति में और भी अधिक सीमित, सक्षम नहीं है ... जैसे भौतिकी में, भौतिक दुनिया का वर्णन करने के लिए गणितीय तत्वों का उपयोग किया जाता है, चूँकि उन्हें भौतिक दुनिया के तत्वों के अनुरूप माना जाता है, इसलिए गणितीय भाषाविज्ञान में गणितीय तत्वों को भाषण की दुनिया के तत्वों के अनुरूप माना जाता है ”101। लेकिन प्रश्न का ऐसा सूत्रीकरण किसी भी तरह से स्थिति को नहीं बचाता है, क्योंकि यह सबसे अच्छा हो सकता है<138>भाषा का विश्लेषण या तो एक भौतिक संरचना के रूप में दें, जो अभी भी भाषा के लिए पर्याप्त नहीं है, और अंतिम विश्लेषण में अभी भी वही यंत्रवत चरित्र है, या एक तार्किक-गणितीय संरचना के रूप में है, और यह भाषा को एक अलग तल पर स्थानांतरित करता है, और कई मायनों में इसके लिए विदेशी। यह नोट करना अतिश्योक्तिपूर्ण नहीं है कि वाटमो केवल भविष्य में गणितीय भाषाविज्ञान की सफलताओं का पूर्वाभास करता है, और उनके वास्तविक परिणामों के लिए, वह निम्नलिखित शब्दों में उनका मूल्यांकन करता है: "... हेरडन, जिपफ द्वारा आज तक किए गए लगभग सभी कार्य, यूल, गिरो ​​(गुइराक्स) और अन्य, किसी भी तरह से भाषा विज्ञान और गणित दोनों की आलोचना के दायरे से बाहर नहीं हैं; उसे काफी हद तक शौकियापन की बू आती है” 103। इस प्रकार, यदि हम भाषाई अनुसंधान में गणितीय विधियों के भविष्य की भविष्यवाणी करने की कोशिश नहीं करते हैं, लेकिन आज जो हमारे पास है, उसकी सराहना करने की कोशिश करते हैं, तो हमें यह स्वीकार करना होगा कि गणित वास्तव में भाषाविज्ञान के क्षेत्र में केवल "माप और गिनती" तक ही सीमित हो गया है। ”, और मैं इसकी संरचना में तल्लीन होकर भाषा का गुणात्मक विश्लेषण नहीं कर सका।<139>

आइए यथासंभव उद्देश्यपूर्ण होने का प्रयास करें। एक निश्चित भाग में, मात्रात्मक डेटा, जाहिरा तौर पर, भाषाविज्ञान द्वारा उपयोग किया जा सकता है, लेकिन केवल सहायक के रूप में और मुख्य रूप से व्यावहारिक अभिविन्यास वाली समस्याओं में। व्यक्तिगत भाषाई परिघटनाओं के अध्ययन के अधिकांश मात्रात्मक तरीकों के संबंध में, आर। ब्राउन का सामान्य निष्कर्ष निस्संदेह उचित है: "उन्हें माना जा सकता है जैसा कि खेरदान उन्हें मानते हैं, लेकिन इस सब का क्या अर्थ है?" 104। आइए कल्पना करें कि हम सवाल पूछते हैं: "इस बगीचे में कौन से पेड़ हैं?"। और जवाब में हमें मिलता है: "इस बगीचे में सौ पेड़ हैं।" क्या यह हमारे प्रश्न का उत्तर है, और क्या यह वास्तव में समझ में आता है? लेकिन कई भाषाई सवालों के संबंध में, गणितीय तरीके ऐसे ही जवाब देते हैं।

हालांकि, अनुसंधान गतिविधियों का एक विस्तृत क्षेत्र है, मुख्य रूप से गणितीय तरीकों का उपयोग करते हुए और साथ ही उन्हें भाषाई सामग्री के लिए उन्मुख करते हुए, जहां इस तरह के संयोजन की समीचीनता संदेह से परे है। इस शोध गतिविधि का "अर्थ", इसका महत्व उन लक्ष्यों से निर्धारित होता है जिनके लिए यह प्रयास करता है। व्यवहार में इसका परीक्षण पहले ही किया जा चुका है। इस मामले में, हम लिखित के मशीनी अनुवाद के लिए सूचना मशीनों, संरचनाओं के निर्माण से जुड़ी समस्याओं के बारे में बात कर रहे हैं वैज्ञानिक ग्रंथ, एक भाषा से दूसरी भाषा में मौखिक भाषण के अनुवाद का स्वचालन और उन सभी जटिल कार्यों के साथ जो साइबरनेटिक्स के भाषाई मुद्दों में संयुक्त हैं। ऐसी समस्याओं के पूरे सेट को आमतौर पर अनुप्रयुक्त भाषाविज्ञान का सामान्य नाम दिया जाता है। इस प्रकार, यह तथाकथित गणितीय भाषाविज्ञान से अलग है, जिसमें काम के उन क्षेत्रों को शामिल किया गया है जिन्हें स्टाइलोस्टैटिस्टिक्स और भाषाई सांख्यिकी के रूप में ऊपर नामित किया गया है, हालांकि यह किसी भी तरह से भाषाई सामग्री के सांख्यिकीय प्रसंस्करण से बचा नहीं जाता है। शायद लागू भाषाविज्ञान की सबसे महत्वपूर्ण विशेषता, इसे गणितीय भाषाविज्ञान से अलग करना, जैसा कि ऊपर उल्लिखित है, यह है कि पूर्व की विपरीत दिशा है: भाषाविज्ञान के लिए गणित नहीं, बल्कि भाषाविज्ञान।<140>(गणितीय विधियों द्वारा औपचारिक रूप से) व्यावहारिक समस्याओं की एक विस्तृत श्रृंखला के लिए।

व्यक्तिगत समस्याओं की सामग्री का खुलासा करने की आवश्यकता नहीं है जो अब लागू भाषाविज्ञान के अत्यंत विस्तृत क्षेत्र में शामिल हैं। गणितीय भाषाविज्ञान के विपरीत, इन समस्याओं पर सोवियत भाषाई साहित्य में सक्रिय रूप से चर्चा की जाती है और अनुसंधान संस्थानों की वैज्ञानिक समस्याओं में एक तेजी से प्रमुख स्थान पर कब्जा करना शुरू कर दिया है। इस प्रकार, वे पहले से ही हमारे भाषाई समुदाय के लिए जाने जाते हैं। हालाँकि, यह परिस्थिति हमें भाषा के विज्ञान के सिद्धांतों के दृष्टिकोण से, विशेष रूप से, उन्हें प्रतिबिंब के अधीन करने की आवश्यकता से मुक्त नहीं करती है। यह निस्संदेह उन गलतफहमियों को खत्म करने में मदद करेगा जो विज्ञान के प्रतिनिधियों के बीच अधिक से अधिक बार उत्पन्न होती हैं जो एक दूसरे से बहुत दूर हैं और लागू भाषाविज्ञान की समस्याओं पर काम में भाग लेते हैं, और एक ओर उनके अभिसरण के तरीकों की रूपरेखा तैयार करेंगे। , और दूसरी ओर अनुसंधान के क्षेत्रों का परिसीमन। यह बिना कहे चला जाता है कि निम्नलिखित विचार भाषाविद् के दृष्टिकोण का प्रतिनिधित्व करेंगे, और यह आवश्यक है कि गणितज्ञ न केवल इसे आत्मसात करने का प्रयास करें, बल्कि उठाए गए प्रश्नों के संबंध में उन्हें अपनी व्याख्या दें।

भाषाविद्-सिद्धांतकार किसी भी तरह से इस तथ्य से संतुष्ट नहीं हो सकता है कि सभी मामलों में<141>अनुप्रयुक्त भाषाविज्ञान द्वारा निर्धारित उद्देश्यों के लिए भाषा, उनका आधार एक गणितीय मॉडल है। इसके अनुसार, भाषा की परिघटनाओं पर अवलोकन और इस प्रकार प्राप्त परिणाम गणित के पदों और अवधारणाओं में व्यक्त किए जाते हैं, अर्थात् गणितीय समीकरणों और सूत्रों के माध्यम से। आइए स्पष्टता के लिए एक उदाहरण देखें। कॉन्डन 1 06 और जिपफ 1 07 ने स्थापित किया कि आवृत्ति के लघुगणक ( एफ) एक बड़े पाठ में शब्दों की उपस्थिति लगभग एक सीधी रेखा में स्थित होती है, यदि वे आरेख में रैंक या रैंक के लघुगणक के साथ सहसंबद्ध होते हैं ( आर) इन शब्दों के। समीकरण एफ = सी: आर,कहाँ साथएक स्थिरांक इस संबंध को सीमित अर्थों में दर्शाता है कि करोड़निर्धारित मूल्य के लिए आरमहान सन्निकटन के साथ देखी गई आवृत्ति को पुन: उत्पन्न करता है। के बीच संबंध एफऔर आर,एक गणितीय सूत्र द्वारा व्यक्त, शब्दों के उपयोग की आवृत्ति और रैंक, या रैंक के बीच संबंधों के लिए एक मॉडल है। यह गणितीय मॉडलिंग के मामलों में से एक है। 

सूचना का संपूर्ण सिद्धांत पूरी तरह से सी. शैनन 108 द्वारा विकसित संचार प्रक्रिया के गणितीय मॉडल पर आधारित है। इसे "एक गणितीय अनुशासन के रूप में परिभाषित किया गया है जो किसी भी डेटा में निहित जानकारी की मात्रा की गणना और अनुमान लगाने के तरीकों के लिए समर्पित है, और सूचनाओं को संग्रहीत करने और प्रसारित करने की प्रक्रियाओं का अध्ययन" (TSB, खंड 51, पृष्ठ 128)। तदनुसार, सूचना सिद्धांत की बुनियादी अवधारणाओं को एक गणितीय अभिव्यक्ति प्राप्त होती है। सूचना को बिनिट्स या बाइनरी इकाइयों में मापा जाता है (एक कोड, जो एक भाषा के समान है, दो सशर्त समान रूप से संभावित संकेतों के साथ प्रत्येक चरित्र के संचरण के दौरान सूचना की एक बाइनरी इकाई को प्रसारित करता है। ) -या तो कोड और प्रेषित सूचना की औसत मात्रा<142>गठन। अतिरेक को कोड की कुल संचारण क्षमता के प्रतिशत के रूप में व्यक्त किया जाता है", 1 09 आदि। उसी तरह, मशीनी अनुवाद के लिए एक भाषा के तत्वों को दूसरी भाषा में मैप करने के एल्गोरिथम विकास की आवश्यकता होती है, आदि। 1 10। ये मॉडलिंग के अन्य मामले हैं।

बिना किसी अर्थ के मॉडलों का उपयोग बहुत महत्वपूर्ण मदद कर सकता है, विशेष रूप से, सभी संभावनाओं में, उन समस्याओं को हल करने में जो भाषाविज्ञान स्वयं को निर्धारित करता है। हालांकि, सैद्धांतिक भाषाविज्ञान के लिए, यह बहुत महत्वपूर्ण है कि अमूर्त मॉडल, एक नियम के रूप में, वास्तविक घटना की सभी विशेषताओं, उसके सभी कार्यात्मक गुणों को पुन: उत्पन्न नहीं करता है। तो, एक वास्तुकार, एक घर बनाने से पहले, अपना मॉडल बना सकता है, जो घर को सभी छोटे विवरणों में डिज़ाइन किया जा रहा है, और इससे उसे घर के निर्माण से संबंधित कई व्यावहारिक मुद्दों को हल करने में मदद मिलती है। लेकिन एक घर का ऐसा मॉडल, चाहे वह कितना भी सटीक क्यों न हो, उस "कार्य" से रहित होता है और वह उद्देश्य जिसके लिए सभी घर सामान्य रूप से बनाए जाते हैं - यह एक व्यक्ति को आवास प्रदान करने में सक्षम नहीं है। स्थिति भाषा के समान है, जहां मॉडल हमेशा अपने सभी गुणों को पुन: उत्पन्न करने में सक्षम नहीं होता है। इस मामले में, मामला इस तथ्य से और जटिल है कि मॉडल बनाने के लिए भाषाई नहीं, बल्कि गणितीय मानदंड का उपयोग किया जाता है। "गणितीय मॉडल ... - ए। एटिंगर लिखते हैं, - प्रौद्योगिकी के सभी क्षेत्रों में एक अत्यंत महत्वपूर्ण भूमिका निभाते हैं, लेकिन चूंकि वे संश्लेषण के लिए एक उपकरण हैं, भाषाविज्ञान के लिए उनका महत्व, जो मुख्य रूप से एक ऐतिहासिक और वर्णनात्मक अनुशासन है, स्वाभाविक रूप से सीमित है "1 11।<143>

किसी भाषा का गणितीय प्रतिरूपण वास्तव में केवल उसकी स्थिर स्थिति पर लागू होता है, जो एक भाषाविद् के लिए सशर्त है और वास्तव में एक भाषा की मूल गुणवत्ता के साथ सीधे संघर्ष में है, जिसका अस्तित्व ही विकास है। यह बिना कहे चला जाता है कि किसी भाषा का स्थिर अध्ययन किसी भी तरह से भाषाविज्ञान से बाहर नहीं है और यह मानक व्याकरण और शब्दकोशों, वर्णनात्मक व्याकरण, व्यावहारिक व्याकरण और शब्दकोशों को संकलित करने का आधार है जो विदेशी भाषाओं के व्यावहारिक अध्ययन के लिए एक मार्गदर्शक के रूप में काम करते हैं, आदि। हालांकि, ऐसे सभी कार्यों में, जो मुख्य रूप से प्रकृति में लागू होते हैं, भाषाविद् सचेत रूप से अनुसंधान के क्षेत्र को सीमित करते हैं और किसी भी तरह से भाषा के अन्य पहलुओं पर अपनी आंखें नहीं मूंदते हैं 1 12। भाषा की एक स्थिर परीक्षा के साथ, विशेष रूप से, इसकी गतिशील प्रकृति से जुड़े भाषा के ऐसे गुण, जैसे उत्पादकता, सोच के रूपों पर निर्भरता और सांस्कृतिक, सामाजिक, राजनीतिक, ऐतिहासिक और अन्य कारकों के साथ व्यापक बातचीत पूरी तरह से गायब हो जाती है। शोधकर्ता की दृष्टि का क्षेत्र। केवल सिंक्रोनिक प्लेन पर ही भाषा को पारंपरिक संकेतों या कोडों की एक प्रणाली के रूप में माना जा सकता है, हालांकि, जैसे ही हम भाषा के लिए अधिक उपयुक्त गतिशील दृष्टिकोण अपनाते हैं, यह पूरी तरह से अनुचित हो जाता है। यह विकास की प्रक्रियाओं में है कि भाषा के गुण जैसे कि प्रेरणा, शब्दों का बहुरूपता जिसमें स्थिर सीमाएँ नहीं होती हैं, किसी शब्द के अर्थ और उसके ध्वनि खोल की गैर-स्वायत्तता और संदर्भ से जुड़े शब्द की रचनात्मक क्षमता होती है। प्रकट हुआ है, और यह सब एक कोड या चिह्न 1 13 की मुख्य विशेषताओं के साथ तीव्र विरोधाभास में है। जाहिर है, अनुप्रयुक्त भाषाविज्ञान में, भाषा के इन सभी गुणों के बारे में भी सोचा जा सकता है और, व्यावहारिक उद्देश्यों के लिए, भाषा के एक "स्नैपशॉट" के साथ संतुष्ट होना चाहिए, जो अभी भी काफी अनुमानित विचार देने में सक्षम है इसके कामकाज का तंत्र।<144>निरोवानिया। हालांकि, इस तरह के प्रत्येक "स्नैपशॉट", अगर भाषा के एक तथ्य के रूप में माना जाता है, न कि पारंपरिक कोड की एक प्रणाली के तथ्य के रूप में, आंदोलन की अंतहीन प्रक्रिया में शामिल होना चाहिए जिसमें भाषा हमेशा मौजूद होती है 1 14। इस आंदोलन की विशेषता वाली ठोस स्थितियों के बाहर इसका अध्ययन नहीं किया जा सकता है, जो इस पर अपनी छाप छोड़ता है दिया गया राज्यभाषा और कंडीशनिंग इसके आगे के विकास की क्षमता। यहाँ वही अंतर है जो किसी व्यक्ति की क्षणिक तस्वीर और ब्रश से चित्रित उसके चित्र में होता है। सच्चा कलाकार. कलाकार के काम में, हमारे पास न केवल उसकी शारीरिक बनावट, बल्कि उसकी आंतरिक आध्यात्मिक सामग्री की मौलिकता में एक व्यक्ति की सामान्य छवि है। एक कलात्मक चित्र से, हम उस पर दर्शाए गए व्यक्ति के अतीत को भी पढ़ सकते हैं और यह निर्धारित कर सकते हैं कि वह अपने कार्यों में क्या सक्षम है। और एक स्नैपशॉट, हालांकि मूल की उपस्थिति की एक अधिक सटीक छवि देने में सक्षम है, इन गुणों से रहित है और अक्सर एक आकस्मिक दाना दोनों को पकड़ लेता है जो नाक पर उछलता है और<145>एक पूरी तरह से अनैच्छिक मुद्रा या अभिव्यक्ति, जो अंततः मूल के विरूपण की ओर ले जाती है।

यह ध्यान दिया जाना चाहिए कि "स्नैपशॉट" की विधि निश्चित रूप से भाषा के विकास के तथ्यों पर लागू की जा सकती है। लेकिन इस मामले में, हम वास्तव में केवल भाषा की अलग-अलग अवस्थाओं से निपटेंगे, जो कि उनके मात्रात्मक लक्षण वर्णन में, विभिन्न भाषाओं के तुलनात्मक मात्रात्मक लक्षण वर्णन से अधिक नहीं जुड़े हुए हैं। इस तरह की मात्रात्मक "गतिकी" में कुछ भी जैविक नहीं होगा, और भाषा के अलग-अलग राज्यों के बीच का संबंध केवल संख्यात्मक संबंधों की तुलना पर टिका होगा। यदि इस मामले में भी, एक सादृश्य का सहारा लिया जाए, तो हम बच्चे के विकास का उल्लेख कर सकते हैं। उनका विकास, निश्चित रूप से, उनके वजन, ऊंचाई, उनके शरीर के कुछ हिस्सों के आयतन के बदलते अनुपात के बारे में संख्यात्मक डेटा की गतिशीलता के रूप में प्रस्तुत किया जा सकता है, लेकिन ये सभी डेटा उन सभी चीजों से बिल्कुल अलग हैं जो मुख्य रूप से व्यक्तिगत सार का गठन करते हैं। एक व्यक्ति का - उसका चरित्र, झुकाव, आदतें, स्वाद आदि।

भाषा के गणितीय "मॉडलिंग" का एक और नकारात्मक पक्ष यह तथ्य है कि यह सामान्य सिद्धांत के रूप में काम नहीं कर सकता है जिसके आधार पर भाषा का व्यापक और व्यापक - व्यवस्थित वर्णन करना संभव है। उदाहरण के लिए, भाषा की परिघटना के लिए केवल एक गणितीय दृष्टिकोण, ऐसे मूलभूत प्रश्नों (जिसके बिना भाषा के विज्ञान का अस्तित्व ही अकल्पनीय है) का उत्तर देना संभव नहीं होगा, जैसे: भाषा क्या है, क्या परिघटना होनी चाहिए उचित भाषाई के रूप में वर्गीकृत, किसी शब्द या वाक्य को कैसे परिभाषित किया जाता है, भाषा की मूल अवधारणाएं और श्रेणियां क्या हैं, आदि। परिकल्पना) इन सभी प्रश्नों के लिए अग्रिम में। इस तथ्य पर आंखें मूंदने की जरूरत नहीं है कि गणितीय तरीकों से भाषाई घटनाओं के अध्ययन के सभी मामलों में हमें इन सभी अवधारणाओं और श्रेणियों को अनिवार्य रूप से स्वीकार करना पड़ा क्योंकि वे पारंपरिक या अपेक्षाकृत बोलकर परिभाषित किए गए थे। गुणात्मक तरीके।

उनके भाषाई अनुप्रयोग में गणितीय विधियों की यह विशेषता स्पैंग-हैनसेन द्वारा नोट की गई थी जब पाई<146>साल: "यह ध्यान में रखा जाना चाहिए कि देखे गए तथ्य जो एक मात्रात्मक अभिव्यक्ति प्राप्त करते हैं ... उनका कोई मूल्य नहीं है यदि वे विवरण का हिस्सा नहीं बनते हैं, और भाषाई उद्देश्यों के लिए यह एक व्यवस्थित विवरण होना चाहिए, गुणात्मक भाषाई से निकटता से संबंधित होना चाहिए विवरण और सिद्धांत ”1 15। स्पैंग-हैनसेन के एक अन्य भाषण में, हम इस विचार का स्पष्टीकरण पाते हैं: "जब तक एक मात्रात्मक प्रणाली के निर्माण की संभावना सिद्ध नहीं हो जाती है, और जब तक अध्ययन के किसी दिए गए क्षेत्र, आवृत्ति गणना और अन्य के लिए आम तौर पर स्वीकृत गुणात्मक प्रणाली होती है भाषाई दृष्टि से संख्यात्मक विशेषताओं का कोई मतलब नहीं है" 1 16। इसी तरह के विचार उल्डल द्वारा व्यक्त किए गए हैं, कुछ हद तक अप्रत्याशित रूप से उन्हें ग्लोसेमैटिक्स की सामान्य सैद्धांतिक नींव के विकास के साथ जोड़ते हैं: “जब कोई भाषाविद् वह सब कुछ मानता है या मापता है जिसे वह मानता है और मापता है, तो यह स्वयं मात्रात्मक रूप से निर्धारित नहीं होता है; उदाहरण के लिए, शब्द, जब उन्हें गिना जाता है, परिभाषित किया जाता है, यदि वे बिल्कुल भिन्न शब्दों में परिभाषित होते हैं।<147>

इस प्रकार, यह पता चला है कि सैद्धांतिक रूप से और उनके व्यावहारिक अनुप्रयोग दोनों में, गणितीय तरीके सीधे भाषाई अवधारणाओं और पारंपरिक, दार्शनिक, या, जैसा कि ऊपर उल्लेख किया गया है, गुणात्मक तरीकों से परिभाषित श्रेणियों पर निर्भर हैं। अनुप्रयुक्त भाषाविज्ञान के संदर्भ में, इस निर्भरता को महसूस करना महत्वपूर्ण है, और परिणामस्वरूप, पारंपरिक भाषाविज्ञान की मुख्य श्रेणियों की समग्रता से परिचित होना।

सच है, आधुनिक भाषाविज्ञान के डेटा का उपयोग नहीं करने के लिए अनुप्रयुक्त भाषाविज्ञान के क्षेत्र में काम करने वाले सटीक विज्ञान के प्रतिनिधियों को फटकारने का कोई कारण नहीं है। यह चीजों की वास्तविक स्थिति के अनुरूप नहीं है। वे न केवल पूरी तरह से अच्छी तरह से जानते हैं, बल्कि अपने काम में व्यापक रूप से भाषाविदों द्वारा स्थापित अंतर सुविधाओं की प्रणालियों का उपयोग करते हैं जो विभिन्न भाषाओं की विशेषता हैं, विशिष्ट भाषा प्रणालियों के भीतर भाषाई तत्वों का वितरण और व्यवस्था, ध्वनिक ध्वन्यात्मकता की उपलब्धियां आदि। लेकिन इस मामले में, एक बहुत ही महत्वपूर्ण आरक्षण आवश्यक है। वास्तव में, सटीक विज्ञान के प्रतिनिधि भाषाविज्ञान में केवल एक दिशा के डेटा का उपयोग करते हैं - तथाकथित वर्णनात्मक भाषाविज्ञान, जो जानबूझकर खुद को सैद्धांतिक भाषाविज्ञान की पारंपरिक समस्याओं से अलग करता है, भाषाई अनुसंधान के पूरे क्षेत्र को कवर करने से दूर, एक उचित से भाषाई दृष्टिकोण से, इसमें महत्वपूर्ण पद्धति संबंधी कमियां हैं, जिसने इसे हाल ही में सामने आए संकट 1 18 तक पहुँचाया, और, इसके अलावा, एक विशुद्ध रूप से व्यावहारिक अभिविन्यास है, जो लागू भाषाविज्ञान के हितों के अनुरूप है। भाषा के स्थिर विचार के विरुद्ध ऊपर किए गए सभी आरक्षण और भर्त्सना वर्णनात्मक भाषाविज्ञान पर लागू होते हैं। वर्णनात्मक भाषाविज्ञान का ऐसा एकतरफा दृष्टिकोण, अन्वेषक कर सकता है<148>हालाँकि, इसे केवल उन कार्यों द्वारा उचित ठहराया जा सकता है जो भाषाविज्ञान स्वयं को निर्धारित करता है, लेकिन यह भाषा के विज्ञान की संपूर्ण सामग्री को समाप्त नहीं करता है।

अनुप्रयुक्त भाषाविज्ञान के प्रश्न विकसित करने की प्रक्रिया में, नई सैद्धांतिक समस्याएं उत्पन्न हो सकती हैं, और वास्तव में पहले ही उत्पन्न हो चुकी हैं। इनमें से कुछ समस्याएँ अनुप्रयुक्त भाषाविज्ञान के विशिष्ट कार्यों से निकटता से संबंधित हैं और इन समस्याओं को हल करने में उत्पन्न होने वाली कठिनाइयों पर काबू पाने के उद्देश्य से हैं। अन्य समस्याएं सीधे तौर पर सैद्धांतिक भाषाविज्ञान से संबंधित हैं, पारंपरिक विचारों पर एक नए दृष्टिकोण की अनुमति देती हैं या भाषाई अनुसंधान, नई अवधारणाओं और सिद्धांतों के नए क्षेत्रों को खोलती हैं। इनमें से उत्तरार्द्ध, उदाहरण के लिए, एक "मशीन" भाषा (या मध्यस्थ भाषा) बनाने की समस्या है, जो सैद्धांतिक भाषाविज्ञान के ऐसे कार्डिनल मुद्दों के एक जटिल सेट से सबसे अधिक निकटता से संबंधित है, जैसे कि अवधारणाओं और शाब्दिक अर्थ, तर्क और तर्क का संबंध। व्याकरण, द्विभाषी और समकालिकता, भाषा की सांकेतिक प्रकृति, भाषाई अर्थ का सार, कृत्रिम भाषाओं के निर्माण के सिद्धांत आदि। 1 19. इस मामले में, भाषाई विषयों और सटीक विज्ञान के प्रतिनिधियों के सामान्य कार्य में आपसी समझ और राष्ट्रमंडल स्थापित करना विशेष रूप से महत्वपूर्ण है। भाषाई पक्ष के लिए, इस मामले में, जाहिरा तौर पर, हमें पहले से ही अनुवाद मशीनों के डिजाइनरों के प्रयासों को सीमित करने के बारे में बात नहीं करनी चाहिए" और एन के छंदों के साथ ऐसी मशीनों की कार्य क्षमताओं को स्थापित करने का प्रयास करना चाहिए। ग्रिबाचेव या वी। कोचेतोव का गद्य 1 20। मशीन स्वयं अपनी क्षमताओं की सीमा, और लाभप्रदता - इसके उपयोग की सीमा का पता लगाएगी। लेकिन भाषाविदों को, सामान्य कारण में उनके योगदान के रूप में, भाषा की संरचना की विशेषताओं, इसकी बहुमुखी प्रतिभा, इसके तत्वों के आंतरिक प्रतिच्छेदन संबंधों के साथ-साथ भौतिक, शारीरिक के साथ भाषा के व्यापक और बहुपक्षीय संबंधों का ज्ञान लाना चाहिए। , मानसिक और तार्किक<149>एमआई घटनाएं, भाषा के कामकाज और विकास के विशिष्ट पैटर्न। संबंधित मशीनों के डिजाइनरों के लिए इस ज्ञान की समग्रता आवश्यक है ताकि वे गलत दिशाओं में न भटकें, बल्कि खोज को उद्देश्यपूर्ण और स्पष्ट रूप से उन्मुख बनाएं। वह भी बहुत है संक्षिप्त समीक्षाभाषाई समस्याओं के लिए गणितीय तरीकों के आवेदन के मामले, जो इस निबंध में किए गए थे, आश्वस्त करते हैं कि इस तरह का ज्ञान किसी भी तरह से सटीक विज्ञान के प्रतिनिधियों के लिए अतिश्योक्तिपूर्ण नहीं होगा।

उपरोक्त सभी विचारों के आधार पर, स्पष्ट रूप से कुछ सामान्य निष्कर्षों पर पहुंचा जा सकता है।

तो, गणितीय भाषाविज्ञान? यदि इसका अर्थ सभी भाषाई समस्याओं को हल करने के लिए एक सार्वभौमिक मास्टर कुंजी के रूप में गणितीय विधियों का उपयोग करना है, तो ऐसे दावों को बिल्कुल अनुचित माना जाना चाहिए। इस दिशा में जो कुछ भी किया गया है वह अब तक भाषा विज्ञान की पारंपरिक समस्याओं को हल करने के लिए बहुत कम या बिल्कुल भी नहीं किया गया है। सबसे बुरी स्थिति में, गणितीय तरीकों का उपयोग स्पष्ट गैरबराबरी के साथ होता है या, भाषाई दृष्टिकोण से, बिल्कुल अर्थहीन होता है। सर्वोत्तम रूप से, गणितीय विधियों को भाषाई अनुसंधान के सहायक तरीकों के रूप में इस्तेमाल किया जा सकता है, विशिष्ट और सीमित भाषाई समस्याओं की सेवा में रखा जा रहा है। इस मामले में "भाषा के मात्रात्मक दर्शन" का कोई सवाल ही नहीं हो सकता है। भौतिकी, मनोविज्ञान, शरीर विज्ञान, तर्कशास्त्र, समाजशास्त्र और नृविज्ञान ने अपने समय में भाषा के विज्ञान की स्वतंत्रता का अतिक्रमण किया, लेकिन वे भाषा विज्ञान को अपने अधीन नहीं कर सके। विपरीत हुआ - भाषाविज्ञान ने इन विज्ञानों की उपलब्धियों का लाभ उठाया और अपने लिए आवश्यक सीमा तक, उनकी सहायता का उपयोग करना शुरू कर दिया, जिससे इसके अनुसंधान विधियों के शस्त्रागार को समृद्ध किया गया। अब जाहिर तौर पर गणित की बारी है। आशा की जानी चाहिए कि यह नया समुदाय भाषा के विज्ञान को मजबूत करने, इसकी कार्य पद्धति में सुधार करने और इसकी विविधता में वृद्धि करने में भी योगदान देगा। इसलिए, गणितीय भाषाविज्ञान के बारे में बात करना उतना ही वैध है जितना कि भौतिक भाषाविज्ञान, शारीरिक भाषाविज्ञान, तार्किक भाषाविज्ञान, मनोवैज्ञानिक भाषाविज्ञान और<150>आदि। ऐसी कोई भाषाविज्ञान नहीं हैं, केवल एक भाषाविज्ञान है, जो अन्य विज्ञानों के डेटा को सहायक अनुसंधान उपकरण के रूप में उपयोग करता है। इस प्रकार, नए विज्ञान के हमले से पीछे हटने का कोई कारण नहीं है और इसे आसानी से उन पदों के लिए प्रस्तुत करना है जो इसने जीते हैं। यहां ए मार्टिनेट के शब्दों को याद करना बहुत उपयुक्त है: "शायद यह कुछ अच्छी तरह से चुने हुए शब्दों का उपयोग करके विचार के एक या दूसरे प्रमुख आंदोलन में शामिल होने या किसी गणितीय सूत्र के साथ किसी के तर्क की कठोरता को घोषित करने के लिए आकर्षक है। हालाँकि, अब समय आ गया है कि भाषाविद अपने विज्ञान की स्वतंत्रता का एहसास करें और खुद को उस हीन भावना से मुक्त करें जो उन्हें अपने किसी भी कार्य को एक या दूसरे सामान्य वैज्ञानिक सिद्धांत से जोड़ती है, जिसके परिणामस्वरूप वास्तविकता की रूपरेखा हमेशा बन जाती है। केवल अधिक अस्पष्ट, स्पष्ट होने के बजाय। 21।

इसलिए गणित अपने आप में और भाषा विज्ञान अपने आप में। यह किसी भी तरह से आम समस्याओं पर संयुक्त कार्य में उनकी पारस्परिक सहायता या मैत्रीपूर्ण बैठक को बाहर नहीं करता है। दो विज्ञानों के ठोस प्रयासों के आवेदन का यह स्थान उन समस्याओं की पूरी विस्तृत श्रृंखला है जो अनुप्रयुक्त भाषाविज्ञान का हिस्सा हैं और महान राष्ट्रीय आर्थिक महत्व के हैं। किसी को केवल यह कामना करनी चाहिए कि उनके संयुक्त कार्य में दोनों विज्ञानों ने अधिकतम आपसी समझ दिखाई, जो निस्संदेह उनके सहयोग की अधिकतम फलदायीता में भी योगदान देगा।<151>

विषयसूची
परिचय
अध्याय 1. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास
1.1। 19वीं-20वीं सदी के मोड़ पर संरचनात्मक भाषाविज्ञान का गठन
1.2। बीसवीं शताब्दी के उत्तरार्ध में भाषाविज्ञान में गणितीय विधियों का अनुप्रयोग
निष्कर्ष
साहित्य
परिचय
20वीं शताब्दी में, ज्ञान के विभिन्न क्षेत्रों की परस्पर क्रिया और अंतःप्रवेश की दिशा में निरंतर रुझान रहा है।व्यक्तिगत विज्ञानों के बीच की सीमाएँ धीरे-धीरे धुंधली होती जा रही हैं; मानसिक गतिविधि की अधिक से अधिक शाखाएँ हैं जो मानवीय, तकनीकी और प्राकृतिक विज्ञान ज्ञान के "जंक्शन पर" हैं।
आधुनिकता की एक अन्य स्पष्ट विशेषता संरचनाओं और उनके घटक तत्वों का अध्ययन करने की इच्छा है। इसलिए, अधिक से अधिक जगह वैज्ञानिक सिद्धांतऔर व्यवहार में गणित को दिया जाता है। संपर्क में आना, एक ओर, तर्क और दर्शन के साथ, दूसरी ओर, आँकड़ों के साथ (और, परिणामस्वरूप, सामाजिक विज्ञान के साथ), गणित उन क्षेत्रों में गहराई से और गहराई से प्रवेश करता है जिन्हें लंबे समय तक विशुद्ध रूप से माना जाता था "मानवतावादी", उनकी अनुमानी क्षमता का विस्तार ("कितना" प्रश्न का उत्तर अक्सर "क्या" और "कैसे" सवालों के जवाब देने में मदद करेगा)। भाषाविज्ञान कोई अपवाद नहीं था। मेरा लक्ष्य टर्म परीक्षा- संक्षेप में गणित और भाषा विज्ञान की ऐसी शाखा के बीच भाषा विज्ञान के रूप में संबंध पर प्रकाश डालें। 1950 के दशक से, भाषाओं की संरचना (प्राकृतिक और कृत्रिम दोनों) का वर्णन करने के लिए एक सैद्धांतिक तंत्र बनाने के लिए भाषाविज्ञान में गणित का उपयोग किया गया है। हालांकि, यह कहा जाना चाहिए कि उसे तुरंत अपनी तरह नहीं मिली। प्रायोगिक उपयोग. प्रारंभ में, भाषाविज्ञान में गणितीय विधियों का उपयोग भाषाविज्ञान की बुनियादी अवधारणाओं को स्पष्ट करने के लिए किया जाने लगा, हालाँकि, कंप्यूटर प्रौद्योगिकी के विकास के साथ, इस तरह के सैद्धांतिक आधार को व्यवहार में लागू किया जाने लगा। मशीन अनुवाद, मशीन सूचना पुनर्प्राप्ति, स्वचालित टेक्स्ट प्रोसेसिंग जैसे कार्यों के समाधान के लिए भाषा के लिए मौलिक रूप से नए दृष्टिकोण की आवश्यकता होती है। भाषाविदों के सामने एक सवाल खड़ा हो गया है: भाषाई प्रतिमानों को उस रूप में प्रस्तुत करना कैसे सीखें, जिसमें उन्हें सीधे प्रौद्योगिकी पर लागू किया जा सके। शब्द "गणितीय भाषाविज्ञान", जो हमारे समय में लोकप्रिय है, किसी भी भाषाई शोध को संदर्भित करता है जो सटीक विधियों का उपयोग करता है (और विज्ञान में सटीक विधियों की अवधारणा हमेशा गणित से निकटता से संबंधित होती है)। पिछले वर्षों के कुछ वैज्ञानिकों का मानना ​​​​है कि अभिव्यक्ति को किसी शब्द के पद तक नहीं बढ़ाया जा सकता है, क्योंकि इसका मतलब कोई विशेष "भाषा विज्ञान" नहीं है, बल्कि भाषा अनुसंधान विधियों की सटीकता और विश्वसनीयता में सुधार, वृद्धि पर केंद्रित एक नई दिशा है। भाषाविज्ञान मात्रात्मक (बीजीय) और गैर-मात्रात्मक दोनों तरीकों का उपयोग करता है, जो इसे गणितीय तर्क के करीब लाता है, और इसके परिणामस्वरूप, दर्शनशास्त्र और यहां तक ​​कि मनोविज्ञान तक। यहां तक ​​​​कि श्लेगल ने भाषा और चेतना की बातचीत का उल्लेख किया, और बीसवीं शताब्दी की शुरुआत के प्रमुख भाषाविद्, फर्डिनेंड डी सॉसर (मैं बाद में भाषाविज्ञान में गणितीय तरीकों के विकास पर उनके प्रभाव के बारे में बताऊंगा), भाषा की संरचना को इसके संबंधित से जोड़ा लोगों को। आधुनिक शोधकर्ता एल. पेर्लोव्स्की राष्ट्रीय मानसिकता की ख़ासियत के साथ भाषा की मात्रात्मक विशेषताओं (उदाहरण के लिए, लिंगों की संख्या, मामले) की पहचान करते हुए आगे बढ़ते हैं (इस पर धारा 2.2 में अधिक, "भाषाविज्ञान में सांख्यिकीय तरीके")।
गणित और भाषा विज्ञान की परस्पर क्रिया एक बहुआयामी विषय है, और अपने काम में मैं सभी पर नहीं, बल्कि सबसे पहले, इसके व्यावहारिक पहलुओं पर ध्यान केन्द्रित करूँगा।
अध्याय I. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास
1.1 XIX - XX सदियों के मोड़ पर संरचनात्मक भाषाविज्ञान का गठन
भाषा का गणितीय विवरण एक तंत्र के रूप में भाषा के विचार पर आधारित है, जो बीसवीं शताब्दी की शुरुआत के प्रसिद्ध स्विस भाषाविद् फर्डिनेंड डी सॉसर के समय से है।
उनकी अवधारणा की प्रारंभिक कड़ी एक प्रणाली के रूप में भाषा का सिद्धांत है जिसमें तीन भाग होते हैं (स्वयं भाषा - भाषा, भाषण - पैरोल, और भाषण गतिविधि - भाषा), जिसमें प्रत्येक शब्द (प्रणाली का सदस्य) अपने आप में नहीं माना जाता है , लेकिन दूसरों के संबंध में। ...


ऊपर