언어학에서 수학적 방법을 적용한 역사. 언어학에서 수학적 방법의 적용에 대한 전망

언어학으로의 침투 수학적 방법그리고 "수학적 정신"은 정확성과 객관성을 지향하는 언어학의 발전에 기여했습니다. 그러나 그녀의 길에 추가 개발이 방향에는 심각한 장애물이 있습니다. 저자는 언어학과 수학이 융합하는 이유, 언어학에서 수학적 방법의 적용 한계, 수학과 언어학자의 상호 이해를 방해하는 요인의 본질에 대해 반성한다.

1950년대 후반에 일부 젊은 언어학자들이 언어의 구조를 연구하기 위해 수학적 방법을 적용하는 것에 대해 생각하고 수학자들과 협력하기 시작했을 때, 이것은 많은 동료들에게 놀라움과 심지어 충격을 주었습니다. 어린 시절부터 인도주의 과학, 그 중 하나는 언어학이며 수학 및 기타 "정확한"과학과 공통점이 없으며 가질 수도 없습니다.

한편, 자연어와 수학의 긴밀한 연관성의 존재는 당시로서는 전혀 새로운 발견이 아니었다. L. S. Vygotsky는 1934년에 출판된 그의 저서 "Thinking and Speech"에서 다음과 같이 썼습니다. 구어체본질적인 변동과 문법적, 심리적 불일치로 인해 수학적 이상과 환상적인 조화의 이상과 우리가 진화라고 부르는 끊임없는 움직임 사이의 모바일 평형 상태에 있습니다.

에서 발생 고대 그리스문법적 범주의 교리는 이미 고대 그리스 수학자들이 공간 형태를 설명하기 위해 만든 모델과 유사한 스타일의 추상 모델의 도움으로 언어 구조의 가장 중요한 여러 측면에 대한 설명이었습니다. H. Steinthal이 쓴 것처럼 "우리의 두 번째 본성"이 된 사례, 성별 등과 같은 개념의 친숙성만이 그들의 창작에 필요한 높은 수준의 추상적 사고를 이해하지 못하게 합니다. 그래서 당신은 놀랄 것입니다 오히려언어학적 "수학적 조화의 이상"을 설명하기 위해 실제 수학적 수단을 사용하려는 최초의 시도는 20세기 중반에야 이루어졌습니다.

이 "지연"에는 두 가지 이유가 있습니다. 첫째, 언어 과학은 고대, 실제로 19 세기에야 다시 발전하기 시작했지만 금세기 내내 언어 학자들의 주요 관심은 언어의 역사로 바뀌었고 일반적으로 인문학의 구조주의 시대였던 다음 세기에만 고대 이후 처음으로 언어학은 언어 구조 연구로 전환했지만 새로운 수준이었습니다. 언어학자들이 F. de Saussure의 말에 따르면 언어가 "순수한 관계의 체계", 즉 기호의 체계라는 것을 깨달았을 때 그 물리적 성질은 중요하지 않고 그들 사이의 관계만이 중요합니다. 언어와 수학적 구성은 "순수한 관계의 체계"이기도 한 매우 분명해졌으며 이미 20세기 초에 같은 드 소쉬르는 수학적 수단으로 언어를 공부하는 꿈을 꾸었습니다.

둘째, 양적 방법은 뉴에이지 초기에 수학에서 전면에 등장했으며, 19세기에 와서야 수학자들은 다시 고대 모델과 더 다른 비정량적 추상 모델을 구축하기 시작했습니다. 높은 레벨추상화, 그리고 또한 우리 주제에 특히 중요한 것은 공간적 형태보다 훨씬 더 넓은 범위의 현상을 설명하는 데 사용될 수 있다는 사실입니다. 종종 그러한 모델은 편리하고 심지어 필요한 수단그것들을 만든 수학자들이 전혀 생각하지 않았고 그것들의 존재에 대해 알지도 못하는 현상을 연구하기 위해. 이러한 모델 중에는 나중에 언어학에 적용되는 모델이 있습니다. 특히 20세기 전반기에 수학적 학문의 집중적인 발전이 일어났습니다. 따라서 금세기 중반의 수학과 언어학의 만남은 지극히 자연스러운 일이었다.

이 회의의 결과 중 하나는 언어 연구를 위한 수학적 장치의 개발을 주제로 하는 수학적 언어학이라는 새로운 수학적 학문의 출현이었습니다. 수학적 언어학의 중심 위치는 공식 문법 이론에 의해 점유되며, 사용되는 장치의 특성상 수학적 논리, 특히 알고리즘 이론과 관련이 있습니다. 올바른 언어 단위를 설명하는 공식 방법을 제공합니다. 다양한 수준, 그리고 특히 중요한 것은 같은 수준과 수준 사이에서 언어 단위의 변환을 설명하는 공식적인 방법입니다. 구문 구조 이론은 장치 측면에서 훨씬 단순하지만 언어 적용에 있어 덜 중요한 형식 문법 이론과 인접해 있습니다. 수학적 언어학에서는 "올바른 텍스트"에 대한 알려진 것으로 간주되는 특정 데이터를 기반으로 공식적인 구조가 만들어지는 언어의 분석 모델도 개발되고 있으며 그 결과 일부 " 구성 부품» 언어 메커니즘. 이러한 방식으로 일부 전통적인 문법 개념에 대한 공식적인 설명을 얻을 수 있습니다. 여기에는 내포 논리("Montagu semantics") 장치를 사용하여 문장의 의미를 설명하는 것도 포함되어야 합니다.

물론 수학적 장치의 도움으로 비고츠키가 말한 언어의 두 가지 이상 중 하나만 설명할 수 있습니다. 따라서 그러한 특수한 경우를 다루지 않는다는 이유로 특정 수학적 모델(또는 일반적으로 수학적 모델)의 사용에 대해 자주 듣는 이의 제기는 의미가 없습니다. 언어, 사람은 절대적으로 다른 비 수학적 수단이 필요하며 "수학적 이상"에 대한 명확한 설명만으로도이를 찾는 데 도움이 될 수 있습니다. 언어. 그러나 이것은 여전히 ​​미래의 문제입니다.

수학적 언어학의 출현보다 못지않고 아마도 더 중요한 것은 집합, 함수, 동형사상과 같은 근본적인 수학적 아이디어와 개념이 언어학으로 직접 침투한 것입니다. 현대 언어의 의미론에서는 수리논리학에서 유래한 술어와 수량사라는 개념이 중요한 역할을 한다. (그 중 첫 번째는 언어학과 구별되지 않았을 때에도 논리학에서 생겨났으며, 이제는 일반화되고 수학적으로 처리된 형태로 언어학으로 회귀했다.)

그리고 마지막으로 아주 큰 중요성수학적 아이디어와 방법을 사용할 수있는 영역뿐만 아니라 언어학에 "수학적 정신"이 침투하여 발생하는 언어 연구의 언어가 세련되었습니다. 이 모든 것은 다음과 같이 간단히 요약할 수 있습니다. 언어학은 물론 인문학의 과학이 되는 것을 중단하지 않고 점점 더 정확하고 객관적인 과학이 되고 있습니다.

그러나 이에 자연스러운 방법언어학의 발전은 오랫동안 그것을 늦출 수 있는 심각한 장애물에 직면해 있습니다. 주된 것은 뉴 에이지 초기에 발생한 "학부의 분리"입니다. 한편으로는 자연 과학자와 수학자, 다른 한편으로는 인도주의 과학자는 "다른 학부에서"동료의 작업에 관심이 없습니다. ” 그리고 더욱이 마음 속으로 그들을 공개적으로 경멸하는 경우가 많습니다. . 수학자 및 자연과학자(그리고 더 많은 "기술자")는 인문학 연구를 일종의 "장식" 또는 "나쁜 수다"로 보는 경향이 있는 반면, "인문학"은 실용성을 위해서만 수학과 자연과학을 용인할 준비가 되어 있습니다. 그들은 인간 정신의 본질을 이해하는 데 도움이 될 수 있는 것이 아무것도 아니라고 확신합니다.

중간에만 19 세기여기에서 위대한 생물학자이자 위대한 사상가인 콘라트 로렌츠(Konrad Lorenz)는 "자연과학과 인문학 사이의 사악한 벽(die böse Mauer zwischen Natur- und Geistwissenschaften)"에서 논리와 논리를 분리하는 가장 얇은 곳에서 첫 번째 균열이 발생했습니다. 수학. 20세기에는 다른 격차가 나타났습니다. 그중에는 수학자 및 언어학자가 양쪽에서 구멍을 뚫은 것이 있지만 여전히 적고 벽은 여전히 ​​강하며 이를 더욱 강화하기 위한 양측의 노력은 부족하지 않습니다. 구멍을 패치하십시오. 종종 이러한 노력은 매우 성공적입니다. 이 방향의 최신 "업적"은 "프로필 교육"입니다. 고등학교이미 어린 시절에 유능하고 관심있는 사람들을 "기능"으로 나누고 "외국"과학에 대한 무지를 자랑스럽게 가르치는 것은 자연 과학과 인간 과학의 추가 융합을 크게 방해 할 수 있으며, 이는 둘 다의 정상적인 발전에 시급히 필요합니다. . 벽을 세우는 것의 결과 중 하나는 대다수의 언어학자를 포함한 "인문학"은 최고 가치인문학을 위해(그리고 전적으로 계산에만 몰두하는 사람으로서 수학자를 상상해 보십시오).

또 다른 장애물은 현재 과학 상태의 광적인 경주 특성, 점점 더 많은 새로운 "결과"를 끊임없이 추구하고 시야를 좁히고 더 깊은 문제에 대해 생각하거나 관련 문제에 대한 진지한 연구에 참여할 시간을 남기지 않는 것입니다. 게다가 그다지 관련이 없다. 과학적 규율. 이것은 언어학자와 수학자에게 동일하게 적용되며 실제로 과학에 전문적으로 종사하는 모든 사람에게 적용됩니다.

그리고 세 번째는 관성 또는 더 간단히 게으름입니다. 게으름과 광란의 경주는 언뜻 보면 어울리지 않는 것 같지만 실제로는 잘 어울리고, 더 나아가 서로를 응원하고 자극한다. 어떤 사람이 너무 게을러서 어려운 일을 맡지 못할 때, 그는 더 쉽고 "신뢰할 수 있는" 일, 그의 관성을 정당화하고 격려하는 성공을 잡습니다. 에 대한 오만한 태도 작은 형제, 벽 반대편에 몰려드는 것도 게으름을 조장하고 격려합니다. 예를 들어, 한 수학자가 다음에 관한 모든 생각을 재고할 것을 제안할 때 고대 역사, 고대 언어에 조금이라도 익숙해지는 데 어려움을 겪지 않고 동일한 게으른 어머니가 이에 대한 책임이 매우 큽니다.

이러한 장애물이 과학 발전에 미치는 위험은 언뜻 보기에 훨씬 더 심각합니다. "외국" 과학의 무지가 자존심의 문제가 될 때, 이것은 자연스럽게 "우리" 과학의 피상성과 무지로 이어집니다. 오랫동안 두 개 이상의 "학부"가 있었고 그 수는 해마다 증가하고 있으며 각각은 다른 벽으로 둘러싸여 있습니다. 학부 내부에도 벽이 나타납니다. 연구자의 지평은 점차 좁아지고 있습니다. 연구 장치가 점점 더 미묘해지고 정교해지고 있는 것은 사실이지만 거의 전적으로 작은 물건, 그리고 그들이 공부할 가치가 있는 유일한 것이라는 개념이 강화됩니다. 과학의 위기에 대해 이야기할 모든 이유가 있으며 언어학도 예외는 아닙니다. 지금은 되돌아보고 생각할 때인 것 같습니다.

여기에 "의미 - 텍스트"모델과 관련된 방향의 언어 학자들이 모였습니다. 지난 세기의 60년대에 만들어진 이 모델은 최초이자 최상의 결과언어학과 수학의 만남, 그 후 두 세대의 언어학자가 성장하여 학생 시절부터 정확한 사고에 익숙해졌습니다. 그러나 불행히도 그들은 위기의 존재를 깨닫고 극복 방법을 생각하지 못하게 하는 관성에서 자유롭지 않습니다. 한편, 모든 언어학자 중에서, 그리고 아마도 인문학에 종사하는 모든 사람 중에서, 그들은 그러한 이해에 대한 가장 객관적인 기회를 가지고 있으며, 나는 그들이 이러한 기회를 활용하기를 희망합니다.

보고서의 텍스트는 A.V. Gladkiy와 출판사에서 친절하게 제공했습니다.

언어학에서의 수학적 방법 적용의 역사 LECTURE No. 1

계획

형성
구조언어학
~에 XIX의 차례- XX 세기.
수학적 방법의 적용
20세기 후반 언어학
세기.
전망
애플리케이션
수학적 방법
언어학.

Ferdinand de Saussure(1857-1913) 시스템으로서의 언어

적절한 언어
연설 - 가석방
말하기 활동
- 언어

I.A. 보두앵 드 쿠르트네(1845~1929)

"소리는 언어의 "원자"입니다.
시스템
제한된 수
쉽게 측정할 수 있는 속성.
이게 제일 편함
공식 자료,
엄격한 방법
설명."

구조언어학 -

그것은 언어에 대한 일련의 견해와
연구 방법을 기반으로
이는 언어에 대한 이해를
명확하게 구별되는 기호 시스템
구조 요소(단위
언어, 수업 등) 및
엄격한 (정확한 접근
과학) 언어의 공식적인 설명.

레닌그라드스카야
음운 학교
(L.V. Shcherba)로 사용
소리의 일반화에 대한 주요 기준
음소 심리 언어학
분석 기반 실험
원어민의 연설.
프라하 언어 학계
(N.S. Trubetskoy)가 이론을 개발했습니다.
반대 - 의미론적 구조
언어는 그들에 의해 집합으로 설명되었습니다.
반대로 건설
의미 단위 - fam.

20세기 후반 언어학에서의 수학적 방법의 적용

미국 사람
서술주의
(L. Bloomfield 및 E. Sapir). 언어
서술자에게 다음과 같이 제시
말소리 모음.
N. Chomsky의 공식 문법.
모스크바
음운 학교,
그의 대표자는 A.A.
Reformatsky, V.N. Sidorov, P.S.
Kuznetsov, A.M. Sukhotin, R.I. Avanesov.

기계 번역 시스템

연산
순차번역
단어별로, 구별로.
T-시스템(에서 영단어옮기다
- 변환), 여기서 번역
구문 수준에서 수행
구조.
I-시스템("interlingua"라는 단어에서 유래) 의미론적 표현 획득
를 통해 문장을 입력
의미 분석 및 합성
받은 제안 입력
시맨틱 프리젠테이션.

10. 실용언어학

연구
해당 상태의 언어가 아님(즉,
시스템) 및 작동 중인 언어(즉,
의사소통);
특정 응용 프로그램 문제를 해결하고
없이 언어 모델 생성
언어의 사실을 설명하는 주장
(이론적 언어학으로서);
특정 하위 언어 타겟팅
(즉, 언어에 대한 선택적 지식)
전체 언어에 대해.

11. 양적 언어학

- 학제 간 방향
응용 연구,
주요 학습 도구로
언어와 말이 사용된다
양적 또는 통계적
분석 방법.

12. 전산언어학

– 방법, 기술 및
제공하는 특정 시스템
자연에서 사람과 컴퓨터 사이의 통신
또는 제한된 자연어.

13. 전산언어학

자연 처리 시스템 생성
언어(예: 통신 처리 시스템
텍스트);
정보 검색 시스템의 발달
(다큐멘터리, 즉
텍스트 및 사실, 즉 어느
사실은 저장되고 제시될 뿐만 아니라
텍스트 형식뿐만 아니라 표 형식으로도
공식 등);
하이퍼텍스트 시스템 생성(즉,
그들을 연결하는 텍스트 세트
관계);
컴퓨터 기술의 발전
사전 편집 및 사용.

14. 관심을 가져 주셔서 감사합니다!

15. 보고서:

법률
자연과 "인도주의"법.
언어학의 수학적 혁명.
구조의 코펜하겐 학교
언어학.
응용 언어학의 형성
과학적 규율.

16. 실습:

수학적 응용의 역사에 대한 설명
고대부터 우리 언어학의 방법
날.
통합 경향의 발현
수학, 언어 및 기타 지식
언어 과학 발전의 역사.
적용 및 비교 특성
이론 언어학 (표를 채우십시오
적용 및 비교 특성
이론적 언어학).
응용 섹션으로서 코퍼스 언어학
언어학.
양적 언어학의 응용 측면.
전산 언어학과 그 도구.

지난 세기 동안 언어학은 빠르게 발전하고 매우 빠르게 방법론적 성숙도에 도달한 과학의 예로 항상 인용되었습니다. 이미 지난 세기 중반에 젊은 과학은 천년의 전통을 가진 과학계에서 자신있게 자리를 잡았으며 가장 저명한 대표자 중 한 명인 A. Schleicher는 자신의 작품으로 그가 이미 마지막 줄을 요약하고 있었습니다.<113>그러나 언어학의 역사는 그러한 의견이 너무 성급하고 정당하지 않다는 것을 보여주었습니다. 세기 말에 언어학은 신문법 원칙에 대한 비판과 관련하여 처음으로 큰 충격을 받았고, 그 뒤를 이어 다른 사람들도 충격을 받았습니다. 일반적으로 언어 과학의 역사에서 발견 할 수있는 모든 위기는 그 기초를 흔들지 않았지만 오히려 강화에 기여했으며 궁극적으로 세련미와 개선을 가져 왔습니다. 주제 및 과학적 문제와 함께 확장되는 언어 연구 방법의.

그러나 언어학 다음으로 많은 수의 새로운 과학을 포함하여 다른 과학도 살고 발전했습니다. 물리, 화학 및 기술 (소위 "정확한") 과학은 우리 시대에 특히 급속한 발전을 이루었으며 이론적 기반 인 수학이 모든 과학을 지배했습니다. 정확한 과학은 모든 인문학을 크게 압박했을뿐만 아니라 현재 그들은 "그들을 신앙으로 인도"하고 관습에 종속시키고 연구 방법을 강요하기 위해 노력하고 있습니다. 현재 상황에서 일본어 표현을 사용하면 이제 언어 학자-문자 학자들이 수학이 이끄는 정확한 과학이 승리하고 자유롭게 위치한 매트의 가장자리를 더럽히고 있다고 말할 수 있습니다.

일부 목소리가 공개적으로 59라고 부르는 수학 방법의 힘에 전적으로 굴복하여 아마도 새로운 힘을 얻는 것이 일반적인 과학적 관심의 관점에서 더 편리하지 않을까요? 이러한 질문에 답하기 위해 우리는 먼저 수학에서 주장하는 바를 살펴봐야 합니다. 이 경우언어학의 수학적 방법이 적용되는 영역, 언어 자료의 세부 사항과 어느 정도 일치하는지, 언어 과학이 제기하는 질문에 대한 답변을 제공하거나 제안할 수 있는지 여부.

처음부터 언어학의 새로운 수학적 추세를 열광하는 사람들 사이에서<114>정적 연구의 목표와 목표에 관한 의견의 만장일치는 없습니다. Acad. 수학적 방법을 언어에 처음으로 적용한 A. A. Markov, Boldrini, Yul, Mariotti는 이러한 연구의 결과가 흥미로운지 여부를 전혀 궁금해하지 않고 언어 요소를 양적 방법을 구성하거나 통계적 정리를 위한 적절한 설명 자료로 간주합니다. 언어학자에게 6 0 . Ross는 확률 이론과 수학적 통계가 수치 해석을 허용하는 언어적 결론을 테스트하고 확인하기 위한 도구 또는 그들이 지금 말하는 것을 선호하는 수학적 모델을 제공한다고 믿습니다. 따라서 수학적 방법은 언어 연구 6 1 의 보조 수단으로만 인식됩니다. 그의 저서에서 언어 문제의 수학적 연구에 대한 모든 시도를 요약하고 체계화했을 뿐만 아니라 추가 작업과 관련하여 명확한 방향을 제시하려고 노력한 Herdan은 훨씬 더 많은 것을 주장합니다. 그는 "문학 통계의 이해(그는 수학적 통계 방법에 의한 텍스트 연구라고 부름)"에 대한 책의 전체 자료를 발표하는 데 중점을 둡니다. - 3시에.)언어학의 필수적인 부분으로” 6 2 , 다음 단어로 언어학의 이 새로운 섹션의 본질과 과제를 공식화합니다. “언어의 양적 철학으로서의 문학 통계는 언어학의 모든 분야에 적용할 수 있습니다. 우리가 보기에 문학 통계학은 양적 과학이나 양적 철학의 수준으로 끌어올린 구조적 언어학이다. 따라서 결과를 범위를 벗어난 것으로 정의하는 것도 똑같이 잘못되었습니다.<115>언어학 또는 연구를 위한 보조 도구로 취급” 6 3 .

이 경우에 실제로 행해진 일에 대한 고려를 먼저 언급하지 않고 새로운 언어학 분과의 출현에 대해 말하고 그 주장의 문제를 해결하는 것이 이 경우에 합법적인지 여부에 대해 이론화하는 것은 바람직하지 않습니다. 영역, 그리고 새로운 방법의 적용 방향을 명확히 하기 위해 6 4 . 이것은 우리가 의견의 차이를 이해하는 데 도움이 될 것입니다.

언어 문제를 해결하기 위해 수학적(또는 보다 정확하게는 통계적) 기준을 사용하는 것은 언어 과학에서 결코 새로운 것이 아니며 어느 정도는 언어학자들이 오랫동안 사용해 왔습니다. 결국, 사실 음성 법칙과 같은 언어학의 전통적인 개념(및 관련<116>그것과 함께 nee - 법에 대한 예외), 문법 요소의 생산성(예: 파생 접미사) 또는 언어 간의 관련 관계에 대한 기준까지도 어느 정도는 상대적인 통계적 특성을 기반으로 합니다. 결국, 관찰된 사례의 통계적 반대가 더 날카롭고 뚜렷할수록 생산적 접미사와 비생산적 접미사, 음성 법칙 및 예외, 언어 간 친족 관계의 존재 여부에 대해 이야기해야 하는 이유가 더 많아집니다. 그러나 그러한 경우에 통계적 원리가 어느 정도 자발적으로 사용된다면 미래에는 이미 특정 목표 설정과 함께 의식적으로 적용되기 시작했습니다. 그래서 우리 시대에는 소위 어휘의 빈도 사전과 개별 언어 6 5의 표현 또는 "현실에 대한 일반적인 초점"6 6을 가진 다국어 단어의 의미까지 널리 퍼졌습니다. 이 사전의 데이터는 외국어 교과서 (가장 일반적으로 사용되는 어휘를 기반으로 텍스트가 작성됨) 및 최소 사전을 편집하는 데 사용됩니다. 통계 미적분학은 M. Swadesh의 어휘 통계학 또는 성문 연대기 방법에서 특별한 언어 사용을 발견했습니다. 여기에서 주요 기금의 언어에서 단어가 사라진 경우를 고려한 통계 공식을 기반으로 가능합니다. 어족 구분의 절대적 연대기 확립 6 7 .

안에 지난 몇 년언어 자료에 수학적 방법을 적용하는 경우가 크게 증가했으며 그러한 시도의 덩어리에서 다소 명확한 방향이 설명되었습니다. 돌자<117>자세히 살펴보지 않고 순차적으로 고려합니다.

문체통계학이라는 이름이 붙은 방향부터 시작해보자. 이 경우 사용된 언어적 요소의 양적 관계를 통해 개별 작품 또는 작가의 문체적 특징을 정의하고 특성화하는 것에 대해 이야기하고 있습니다. 문체 현상 연구에 대한 통계적 접근 방식은 문학적 문체를 언어 수단을 습득하는 개별적인 방법으로 이해하는 데 기반을 두고 있습니다. 동시에 연구원은 셀 수 있는 언어 요소의 질적 중요성에 대한 질문에서 완전히 산만해져 양적 측면에만 모든 관심을 집중합니다. 연구 된 언어 단위의 의미 론적 측면, 정서적 및 표현 적 부하, 예술 작품 구조에서의 몫-이 모든 것이 설명되지 않은 상태로 남아 있으며 소위 중복 현상을 나타냅니다. 따라서 예술 작품은 기계적 집합체의 형태로 나타나며, 구성의 특수성은 요소들의 수치적 관계를 통해서만 표현됩니다. stylostatistics의 대표자는 의심 할 여지없이 주관성의 요소를 포함하는 전통적인 문체의 방법에 반대하면서 언급 된 모든 상황에 눈을 멀게하지 않으며 수학적 방법의 단일 품질로 모든 단점을 보완합니다. 달성한 결과의 객관성. 예를 들어 V. Fuchs는“... 수학적 수단으로 언어 표현 스타일을 특성화하기 위해 노력합니다. 이를 위해 방법을 만들어야하며 그 결과는 정확한 과학의 결과와 동일한 객관성을 가져야합니다 ... 이것은 적어도 처음에는 의미가 아닌 형식적인 구조적 특성만을 다룰 것임을 시사합니다. 언어 표현의 내용 . 이런 식으로 우리는 전체적으로 수학적 스타일 이론의 기초이자 출발점이 될 서수 관계 체계를 얻을 것입니다.” 6 8 .<118>

작가 또는 개별 작품의 언어 연구에 대한 가장 간단한 유형의 통계적 접근 방식은 사용 된 단어를 세는 것입니다. 왜냐하면 사전의 풍부함은 작가 자신을 특정 방식으로 특성화해야하기 때문입니다. 그러나 이러한 계산의 결과는 이와 관련하여 다소 예상치 못한 결과를 제공하며 적어도 문체론의 과제 중 하나가 아닌 문학 작품의 미적 지식과 평가에 전혀 기여하지 않습니다. 다음은 여러 작품에 사용된 총 단어 수에 대한 데이터입니다.

성경(라틴어). . . . . . . . . . 5649 단어

성경(히브리어). . . . 5642 단어

데모스테네스(연설). . . . . . . . . . . . 4972 단어

Sallust. . . . . . . . . . . . . . . . . 3394 단어

호레이스. . . . . . . . . . . . . . . . . . . .6084 단어

단테 (신곡) 5860 단어

(여기에는 1615개의 고유명사와 지명이 포함됨)

타소(분노의 올랜드). . . . 8474 단어

밀튼. . . . . . . . . . . . . . . . . . . . .8000 단어(주어진 약)

셰익스피어. . . . . . . . . . . . . . . . . . .15000 단어

(대략, 다른 출처에 따르면 20,000 단어)

O. Jespersen은 Zola, Kipling 및 Jack London의 사전이 Milton의 사전을 훨씬 능가한다고 지적합니다. 즉, 숫자는 8000 6 9 입니다. W. 윌슨 미국 대통령의 연설 사전을 계산한 결과 셰익스피어보다 풍부하다는 사실이 밝혀졌다. 여기에 심리학자의 데이터를 추가해야 합니다. 따라서 Terman은 많은 사례를 관찰한 결과 평균 어린이의 어휘가 약 3600단어이고 14세에 이미 9000단어라는 사실을 발견했습니다. 평균 성인은 11700단어를 사용하고 "증가 지능" 최대 13500 7 0 . 따라서 이러한 수치 데이터 자체는 작품의 양식적 특성을 식별할 수 있는 근거를 제공하지 않으며 단지 "객관적으로"<119>그들은 위의 계산에서 알 수 있듯이 작품의 상대적인 예술적 가치와 관련이 없는 다른 저자에 의한 다른 수의 단어 사용을 명시합니다.

개별 저자에 의한 단어 사용의 상대적 빈도 계산은 다소 다르게 구성됩니다. 이 경우 단어의 총량뿐만 아니라 개별 단어의 사용 빈도도 고려됩니다. 이러한 방식으로 얻은 자료의 통계적 처리는 사용 빈도가 동일한 단어가 클래스(또는 순위)로 그룹화되어 주어진 저자가 사용하는 모든 단어의 빈도 분포를 설정한다는 사실에 있습니다. 이러한 종류의 계산의 특수한 경우는 특수 단어의 상대적 빈도를 결정하는 것입니다(예: Mersand 7 1이 수행한 Chaucer 작업의 로맨스 어휘). 저자가 사용하는 단어의 상대적 빈도는 위의 총 계산과 동일한 저자 개인의 스타일에 대한 객관적인 정보를 포함하고 있으며 결과가 더 정확한 수치 데이터라는 차이점이 있습니다. 그러나 그것은 또한 (저자 자신이 일자화한 저작물에 따라) 그의 삶의 다른 시기에 단어 사용의 상대적 빈도에 대한 예비 계산을 기반으로 동일한 저자의 개별 저작물의 연대를 측정하는 데 사용됩니다. 그러한 계산에서 데이터를 사용하는 또 다른 유형은 이 질문이 의심스러워 보이는 저작물의 진정성을 확립하는 것입니다 7 2 . 이 마지막 경우에서 모든 것은 실제 저작물과 논란이 되는 저작물의 사용 빈도에 대한 통계 공식의 비교를 기반으로 합니다. 그러한 방법으로 얻은 결과의 매우 큰 상대성과 근접성에 대해 말할 필요가 없습니다. 결국 상대 사용 빈도는 작가의 나이뿐만 아니라 장르, 줄거리, 작품 행동의 역사적 환경에 따라 달라집니다 (예를 들어 "빵"과 "피터"를 비교하십시오. 나"A. Tolstoy).<120>

위에서 설명한 방법을 심화시키면서 스타일 특성으로서의 스타일 통계학은 가장 일반적으로 사용되는 단어의 상대적 빈도의 안정성 기준에 의존하기 시작했습니다. 이 경우에 사용된 방법은 미국 디트로이트 대학교(University of Detroit)의 슬라브 언어 연구소(Institute of Slavic Languages ​​Institute of Slavic Languages ​​)에서 Esselson과 Epstein이 쓴 푸쉬킨의 이야기 "The Captain 's Daughter"의 통계 처리로 설명 할 수 있습니다. 7 3 . 이야기의 전체 텍스트(약 30,000 단어 발생)를 조사한 다음 약 10,000 및 5,000 발생을 포함하는 구절을 조사했습니다. 또한 단어 사용의 상대빈도의 안정성을 알아보기 위해 가장 많이 사용되는 102개의 단어(빈도가 1160~35)를 계산된 상대도수(선택적 구절을 기준으로 만듦)와 비교하였다. 실제와 함께. 예를 들어, "and"라는 결합은 이야기 전체에서 1,160번 사용되었습니다. 모든 단어가 5,000번 나타나는 구절에서 이 접속사는 5,000 x 1,160:30,000 또는 193번 반올림되어 사용될 것으로 예상되어야 하며, 모든 단어가 10,000번 나타나는 구절에서는 10,000 x 1,160으로 사용될 것으로 예상됩니다. : 30,000, 즉 386배. 이러한 계산을 통해 얻은 데이터와 실제 데이터를 비교하면 매우 미세한 편차(5% 이내)를 보입니다. 이러한 계산을 바탕으로 Pushkin의이 이야기에서 전치사 "k"는 "y"보다 2 배 더 자주 사용되며 대명사 "you"는 "them"보다 3 배 더 자주 사용되는 것으로 나타났습니다. , 이야기 전체와 개별 부분 모두에서 줄거리의 모든 변덕에도 불구하고 단어 사용의 상대적 빈도에는 안정성이 있습니다. 일부(가장 일반적인) 단어와 관련하여 관찰되는 것은 아마도 작업에 사용된 모든 단어에 적용 가능할 것입니다. 저자의 스타일은 주어진 언어에 대한 일반적인 빈도에 대한 단어 사용의 평균 빈도의 가변성의 특정 비율로 특징지어질 수 있습니다.<121>사용 빈도. 이 비율은 저자 스타일의 객관적인 양적 특성으로 간주됩니다.

언어 구조의 다른 형식적 요소도 비슷한 방식으로 연구됩니다. 예를 들어, V. Fuchs는 Goethe, Rilke, Caesar, Sallust 등의 작품의 운율적 특성을 비교 통계적 고려에 적용했습니다.7 4

단어 사용의 상대적 빈도의 안정성 기준은 스타일의 양적 특성화 기술을 명확히 하는 동시에 위에서 분석한 보다 원시적인 방법과 비교할 때 근본적으로 새로운 것을 도입하지 않습니다. 문체 통계학의 모든 방법은 궁극적으로 동등하게 냉정한 "객관적인" 결과를 생성하며, 혀의 표면 위를 미끄러지듯 움직이고 순전히 외부 기호에만 집착합니다. 정량적 방법은 분명히 연구 중인 자료의 질적 차이에 초점을 맞출 수 없으며 실제로 연구 중인 모든 대상을 평준화합니다.

최대 사양이 필요한 경우 가장 일반화된 기준이 제공됩니다. 질적 특성은 양의 언어로 표현된다. 이것은 논리적 모순일 뿐만 아니라 사물의 본성에 대한 불일치이기도 하다. 실제로 알렉산더 게라시모프와 렘브란트 작품의 캔버스에 있는 빨간색과 검은색 페인트의 양적 비율을 기반으로 비교 문체(즉, 질적) 특성을 얻으려고 하면 어떻게 될까요? 절대적인 넌센스 인 것 같습니다. 사람을 특징 짓고 그를 만드는 모든 것에 대한 아이디어를 줄 수있는 사람의 신체 데이터에 대한 완전히 "객관적인"양적 정보는 어느 정도입니까? 진정한 본질? 분명히 없습니다. 엄지 손가락의 회선 각인과 같이 한 사람을 다른 사람과 구별하는 개별 기호로만 사용할 수 있습니다. 문체의 양적 특성과 유사한 상황이다. 자세히 보면 실제 문체를 판단하기 위한 빈약한 데이터를 제공합니다.<122>저자 언어의 특성과 인간 심리학 연구를 위한 손가락의 회선에 대한 설명.

언급된 모든 것에 더해, 과거 소위 공식적인 문학 비평 학파에서는 작가의 문체를 정량적으로 연구하려는 시도가 이미 이루어졌다는 점을 덧붙일 필요가 있습니다. 구절의 수를 세었다. 그러나이 시도는 더 이상 개발되지 않았습니다.

언어 현상 연구를 위한 수학적 방법의 또 다른 적용 영역은 언어 통계라는 이름으로 그룹화할 수 있습니다. 그것은 언어 이론의 근본적인 질문에 개입하여 적절한 언어 영역에서 소명을 얻고자 합니다. 이 방향에 대해 알아보려면 이미 언급 한 Herdan의 작업으로 돌아가는 것이 가장 좋습니다. 많은 리뷰어 중 한 명이 "엄청나게 허세 한 책"7 5 , 그러나 언어학자들 사이에서 폭넓은 반응을 얻었다7 6 . Kherdan(위에서 이미 언급한 바와 같이)이 언어 문제에 수학적 방법을 적용하는 분야에서 가장 중요한 모든 것을 그의 책에서 수집하려고 했다는 사실을 고려할 때, 그의 책에서 우리는 실제로 Kherdan 전체를 다루는 것이 아니라 전체를 다루고 있습니다. 경향. 선택과 개연성으로서의 언어라는 책의 제목에서 알 수 있듯이, 이 책의 주요 초점은 화자의 자유로운 선택에 맡겨진 언어와 언어의 내재적 구조에 기인한 것이 무엇인지를 명확히 하는 데 있습니다. 1 차 및 2 차 요소의 정량적 비율을 결정합니다. Kherdan의 책은 다양한 전문 분야의 대표자들이 수행하는 이 분야의 모든 작업에 대한 거의 철저한 정보를 제공합니다.<123>(철학자, 언어학자, 수학자, 기술자), 그러나 이에 국한되지 않고 저자 자신의 많은 독창적인 관찰, 고려 및 결론을 포함합니다. 요약 작업으로 사용된 정량적 방법과 그 도움으로 얻은 결과에 대한 좋은 아이디어를 제공합니다. 언어 통계 섹션에 조건부로 결합하는 질문은 책의 두 번째 부분과 네 번째 부분에서 다룹니다.

수학적 통계 방법을 언어 문제 연구에 적용하는 많은 사례 중에서 가장 일반적인 것으로 간주 될 수있는 가장 일반적인 사례에 중점을 둘 것입니다. 다른 저자의 데이터 사용 - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 등을 비롯하여 음소, 문자, 단어 길이(문자 및 음절 수로 측정) 분포의 상대적 빈도를 결정하는 자신의 연구를 인용함 , 라틴어 및 그리스어 hexameter의 문법적 형식 및 미터법 요소 인 Herdan은 모든 언어 구조의 공통된 특성으로 언어 요소의 상대적 빈도의 안정성에 대한 사실을 확립합니다. 그는 다음과 같은 규칙을 도출합니다. 충분히 광범위하고 공정하게 수행된 관찰의 한계 » 8 2 . Herdan이 언어의 기본 법칙이라고 부르는 이 규칙은 특정 방식으로 해석하고 확장하려고 합니다. Herdan은 이 법에 대해 다음과 같이 썼습니다. “그는 인간의 의지와 선택의 자유가 부여되는 여기에서도<124>의식적인 선택과 자유로운 놀이가 서로 생생하게 번갈아 가며 나타나는 가장 넓은 틀, 일반적으로 문법적으로 상당한 안정성이 있지만 특정 음소, 어휘 단위(단어) 및 문법적 음소의 사용 빈도와 관련하여 건축; 즉, 유사성은 사용되는 것뿐만 아니라 얼마나 자주 사용되는지에 있습니다.” 8 3 . 이 상황은 이해할 수 있는 이유 때문이지만, 이것은 새로운 결론을 낳는다. 예를 들어 주어진 언어의 서로 다른 텍스트나 세그먼트를 조사할 때 서로 다른 사람들이 주어진 특정 음소(또는 다른 음성 요소)를 사용하는 상대적 빈도는 기본적으로 동일하게 유지된다는 것이 발견되었습니다. 이것은 주어진 언어에서 고려되는 음소를 사용할 일정한 확률의 일부 변동으로 개별 언어 형태의 해석으로 이어집니다. 따라서 그의 언어 활동에서 사람은 사용되는 언어 요소의 수와 관련하여 특정 확률 법칙의 적용을 받는다는 것이 밝혀졌습니다. 그런 다음 많은 텍스트 또는 음성 세그먼트 세트에서 엄청난 수의 언어 요소를 관찰할 때 이 경우 특정 언어 요소의 사용과 관련하여 결정이 있다는 의미에서 인과 관계가 있다는 인상을 받습니다. 즉, 직관적인 관점에서 인과관계로 보이는 것이 정량적으로 확률 8 4 라고 주장하는 것은 허용될 수 있는 것으로 판명되었습니다. 총액이 클수록 분명하다.<125>검사된 텍스트 또는 음성 세그먼트의 특이성이 높을수록 언어 요소 사용의 상대적 빈도의 안정성이 개별 사용에서도 더 명확하게 나타납니다(대수의 법칙). 여기에서 새로운 것이 만들어집니다. 일반적인 결론그 언어는 대중적 현상이며 그렇게 취급되어야 합니다.

함께 언어를 구성하는 음성 요소, 단어 및 문법적 형태의 빈도 계산을 기반으로 도달한 이러한 결론은 소쉬르가 "언어"(lalangue)와 "음성"(laparole)으로 구분한 "통계적 해석"에 적용됩니다. ). Saussure에 따르면 "언어"는 주어진 언어 커뮤니티의 구성원 간의 의사 소통을 가능하게 하는 일련의 언어 습관입니다. 이것은이 언어를 사용하는 모든 사람들에게 의무적 인 사회적 현실, "대량 현상"입니다. Herdan은 지적한 바와 같이 단일 언어 공동체의 구성원들이 동일한 음소, 어휘 단위 및 문법 형식을 사용한다는 점뿐만 아니라 이러한 모든 요소가 동일한 빈도로 사용된다는 점에서 서로 유사하다는 것을 증명합니다. 따라서 "언어"에 대한 그의 통계적 정의는 다음과 같은 형식을 취합니다. "언어"(lalangue)는 일반적인 언어 요소의 총체에 사용되는 상대적 확률을 더한 것입니다.

"언어"의 이러한 정의는 또한 소쉬르에 따르면 개별 발화인 "말"에 대한 해당 통계적 해석의 출발점이기도 합니다. 개별 현상으로서의 "말"의 사회적 현상으로서의 "언어"에 대해 Saussure는 다음과 같이 썼습니다. 그의 개인적인 생각을 표현하기 위한 코드; 2. 그가 이러한 조합을 객관화할 수 있게 해주는 정신물리학적 메커니즘” 8 5 . 언어 통계에서 "언어"는 특정 상대를 가진 요소 집합으로 간주되기 때문에<126>가장 본질적인 특성으로 통계적 총체성 또는 앙상블(인구)을 포함하고 이러한 측면에서 고려할 수 있는 한 사용 가능성이 있습니다. 이에 따라 "말"은 통계적 집계로 "언어"에서 가져온 별도의 샘플이 됩니다. 이 경우 확률은 "말"과 "언어"의 관계("정량적" 이해에서)에 의해 결정되며 언어의 다른 요소 사용의 상대적 빈도 분포는 다음의 결과로 해석됩니다. 언어 존재의 특정 연대기에서 집단 "선택"(선택). 그럼에도 불구하고 "언어"와 "말"의 차이점에 대한 그러한 해석이 소쉬르의 것과는 완전히 다른 근거에 기반하고 있음을 깨달은 Herdan은 이와 관련하여 다음과 같이 썼습니다. )는 이제 통계적 집계(인구)의 형태로 필수 특성을 얻습니다. 이 모집단은 특정 상대 빈도 또는 변동 확률로 특징지어지며, 이는 각 언어 요소가 특정 언어 수준에 속함을 의미합니다. 이 경우 "speech"(laparole)는 그 의미에 따라 "언어"에서 가져온 통계 샘플을 통계적 모집단으로 정의하는 용어임이 밝혀졌습니다. 여기에서 선택(choice)이 "언어"에 대한 "말"의 비율의 형태로 나타나며, 통계적 집계(인구)에 대한 무작위로 추출된 샘플의 비율이라는 것이 명백해집니다. 수세기에 걸쳐 언어 공동체의 언어 활동의 예금으로서 빈도 분포의 바로 그 순서는 선택 (선택)의 요소이지만 스타일에서와 같이 개인의 선택이 아니라 집단 선택의 요소입니다. 은유를 사용하여 특정 언어 공동체 구성원의 복잡한 정신 데이터와 일치하는 언어 의사 소통의 원칙을 이해한다면 언어 정신에 의한 선택에 대해 여기서 이야기 할 수 있습니다. 계열의 안정성은 확률(chance)» 8 6 의 결과입니다.

명시된 원칙 적용의 특수한 경우<127>pa는 "예외"(편차)에서 규범적 현상의 언어로 구분됩니다. 언어통계에서는 통계적 방법을 사용하면 기존의 이 문제이러한 현상을 구별하기 위한 명확한 기준을 설정합니다. 규범이 통계적 모집단(위의 의미에서)으로 이해되고 예외(또는 오류)가 통계적 모집단에 의해 표시된 빈도의 편차인 경우 질문에 대한 정량적 해결책이 제시됩니다. 그것은 모두 "인구"와 "이상치" 사이의 통계적 관계로 귀결됩니다. 개별 표본에서 관찰된 빈도가 일련의 표본 수에 의해 결정된 것보다 더 많이 통계적 모집단으로 인한 확률에서 벗어나는 경우 "동일"(규범)과 "아니다" 사이의 경계선이 다음과 같은 결론을 내릴 이유가 있습니다. 동일"(예외)이 위반됩니다.

"언어"와 "음성" 사이의 양적 차이는 문법적 요소와 어휘적 요소의 두 가지 유형의 언어 요소를 구별하는 데에도 사용됩니다. 언어학적 관점에서 종종 큰 어려움을 나타내는 이 문제를 해결하기 위한 출발점은 문법적 요소의 빈도가 어휘 단위의 빈도와 다르다는 가정이다. 이것은 문법 요소의 "일반화"와 관련이 있으며 어휘 단위로 고정된 개념과 어떻게 다른지와 관련이 있습니다. 또한 문법적 요소는 일반적으로 부피가 훨씬 작습니다. 독립적인 단어(대명사, 전치사, 접속사 및 공식적인 말) 일반적으로 소수의 음소로 구성되며 "관련 형식"의 형태로 하나 또는 두 개의 음소로 구성됩니다. 8 7 . 언어적 요소가 작을수록 "길이"(정량적 순간)가 특성을 정의하는 데 덜 적합하고 이러한 목적을 위해 획득하는 음소의 "품질"이 더 중요해집니다. 고려중인 문제를 해결하기 위해 어떤 방법이 제안됩니까? 문법의 순수 양적 개념을 참고하여 해결<128>Herdan은 이와 관련하여 “우리가 이와 관련하여 두 언어를 비교하는 데 관심이 있다고 가정합니다. 언어가 지닌 "문법적 부하"를 어느 정도의 객관성으로 어떻게 결정합니까? 이 부담은 문법과 어휘를 구분하는 경계선의 위치에 따라 달라질 것이 분명합니다. 우리가 생각할 수 있는 첫 번째 고려 사항은 주어진 언어의 문법이 얼마나 "복잡한지"를 결정하는 것입니다. 결국 "복잡성"은 질적 특성이고 "문법적 부하"의 개념은 양적 특성입니다. 사실, 부하는 어느 정도 복잡성에 따라 다르지만 전적으로는 아닙니다. 언어는 매우 복잡한 문법으로 보상을 받을 수 있지만 언어의 활동에는 비교적 작은 부분만 사용됩니다. 우리는 "문법적 부하"를 언어가 작동할 때 전달하는 문법의 총체성으로 정의하며, 이는 우리의 문제를 Saussure가 규율을 정의한 의미에서 즉시 구조적 언어학의 영역으로 가져옵니다. 다음 프레젠테이션에서는 문법과 어휘를 분리하여 경계가 어디에 있는지에 따라 양적 방법을 사용하여 언어 간의 차이를 결정합니다.” 8 8 . 즉, 이 경우의 언어적 차이는 문법적 요소와 어휘적 요소 사이의 수적 관계의 차이로 환원되어야 한다.

우리 처분의 자료는 다음 그림을 그립니다. 안에 영어("문법적 단어"만 고려되었습니다: 대명사 또는 "대체"라고도 하는 전치사, 접속사 및 조동사) 전체 단어 사용 78,633건(다른 단어 1027건)을 포함하는 세그먼트에서 문법적 요소 사용 사례 53,102건, 더 정확하게는 "문법적 단어"(149건)가 발견되어 67.53입니다. % 15.8 % 다른 단어. 이것이 Deway 8 9의 데이터입니다. 다른 데이터는 다른 비율을 보여줍니다<129>비율: 57.1%, 5.4% 다른 단어 9 0 . 이 중요한 불일치는 문어와 구어의 차이로 설명됩니다. 서면 양식언어(첫 번째 데이터)는 구두 언어(두 번째 경우)보다 문법적 요소를 더 많이 사용하는 것으로 추정됩니다. Dante의 Divine Comedy(이탈리아 원작 이후)에서 Mariotti는 "문법적 단어" 발생의 54.4%를 설정했습니다.

언어의 문법적 부하를 결정하는 또 다른, 분명히 더 완벽한 방법은 문법 요소에 포함된 음소를 세는 것입니다. 이 경우 독립적인 문법 단어뿐만 아니라 관련 형식도 고려됩니다. 여기에 가능 다양한 옵션. 예를 들어, 문법 요소에서 개별 자음 음소의 상대적인 사용 빈도를 결정하고 이를 동일한 음소의 총 사용 빈도와 비교합니다(영어에서 이러한 비율의 최종 데이터는 99.9% 대 100,000의 비율을 제공합니다. 총 사용); 또는 별도의 분류 그룹(순음, 구개음, 연구개 및 기타 음소)에 따른 자음의 유사한 비교. 여기서 최종 비율은 56.47%(문법적 요소에서)에서 60.25%(총 사용에서)의 비율 형식을 취합니다. 또는 초성 자음 음소의 동일한 비교(이 경우, 비율은 문법 단어에서 100.2% 대 전체 사용에서 99.95)입니다. 다른 더 복잡한 통계 작업도 가능하지만 연구 중인 문제의 양적 표현이 비슷합니다.

주어진 정량적 데이터는 일반적인 결론의 기초 역할을 합니다. 그것은 문법 요소의 음소 분포가 언어 전체에서 음소의 분포(물론 숫자 용어로)의 특성을 결정한다는 사실로 귀결됩니다. 그리고 이것은 문법 요소의 사용이 최소한 개인의 선택에 달려 있으며 개연성에 의해 제어되는 언어 표현의 일부를 구성한다는 결론을 내릴 수 있게 합니다.<130>네스 호. 이 추론적인 결론은 Esselson이 만든 러시아어 문법 형식 계산에 의해 확인됩니다 9 1 . 이 연구는 II 출처(Griboedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov 및 N. Ostrovsky의 작업)에서 가져온 46896 단어를 대상으로 했습니다. 구어체(17,756단어, 37.9%)와 비구어체(29,140단어, 62.1%)로 나뉜다. 그런 다음 전체 단어 집합을 문법적 특성에 따라 4개의 그룹으로 나누었습니다. 두 번째 그룹 - 동사; 세 번째 그룹 - 구두 분사, 형용사와 명사 및 동명사 기능의 분사; 네 번째 그룹 - 부사, 전치사, 접속사 및 입자의 변함없는 형태. 요약 결과(개별 저자에 대한 데이터가 포함된 표도 제공됨)는 다음 비율을 제공합니다.

1군

두 번째 그룹

세 번째 그룹

네 번째 그룹

구어체

말없는

Herdan은 이렇게 얻은 양적 데이터의 고려를 다음과 같이 특징지었습니다. 이러한 결론은 사용된 각 단어의 부담스러운 한정을 피합니다. 문법과 어휘가 빈틈없는 껍질에 저장되어 있지 않기 때문에 순수한 "선택"이나 순수한 "기회"도 없다는 것이 분명합니다. 문법과 어휘 모두 비율이 크게 다르지만 두 요소를 모두 포함합니다.” 9 2 .<131>

Herdan의 책의 많은 부분은 이중성 또는 언어의 이중성에 대한 연구에 할애되어 있으며 이중성이라는 개념 자체가 수학적 특성을 기반으로 합니다.

따라서 사영 기하학의 정리는 두 계열로 배열될 수 있으므로 한 계열의 각 정리는 단어를 대체하여 다른 계열의 일부 정리에서 얻을 수 있습니다. 그리고 똑바로.예를 들어, "서로 다른 점은 하나의 선에만 속합니다"라는 문장이 주어지면 "서로 다른 두 선은 하나의 선에만 속합니다."라는 해당 문장을 도출할 수 있습니다. 이중성을 결정하는 또 다른 방법은 가로 좌표와 y축을 따라 플롯하는 것입니다. 다른 계획연구중인 현상. 그래서 예를 들어 Yul 9 3 처럼 횡축에 사용빈도를 다르게 세고, 종축에 빈도가 정해진 어휘단위의 수 등을 세는데, 이렇게 이중성의 개념은 해석, 아마도 같이언어 연구에 적용할 수 있습니다.

이와 같이 정의된 이원성(二元性)이란 모든 경우에 사실상 이진 부호의 성격을 지니며 언어 구조의 가장 본질적인 특징이라고도 할 수 있는 이원성이라는 개념 아래서 극도로 다른 성질의 현상을 끌어들여 두 개의 평면을 따라 대립하게 만든다. : 어휘단위의 성질에 따른 단어사용의 분포와 빈도에 따른 어휘단위의 분포 단어의 사용; 서면 및 구어체 연설; 어휘 및 문법 요소; 동의어 및 반의어; 음소 및 그래픽 표현; 정의할 수 있고 정의하는 것(소쉬르의 기표와 기표) 등

하나 또는 다른 특정 언어 현상 또는 제한된 "텍스트"의 이중성에 대한 양적 연구 후 일반적으로 언어 보편성의 특성에 기인하는 결론이 도출됩니다. 그러한 결론의 본질과 그것이 정당화되는 방식은 예에서 볼 수 있습니다.<132>단어와 개념의 이중성에 대한 연구(사실, 우리는 단어의 길이와 개념의 양의 비율에 대해 이야기하고 있습니다. 그러한 작업은 종종 이해를 매우 어렵게 만듭니다.) 이러한 유형의 언어적 이중성을 관찰한 자료로 다음과 같은 자료가 사용되었다는 점에 주목하는 것이 중요하다. . 이 경우 다음과 같은 일반적인 결론이 내려집니다. 매체를 통해 "영역" 내에 있는 많은 개체 또는 기타 개념에 대해 생각할 수 있습니다. 반면에 개념을 정의하는 데 필요한 모든 항목은 "내용"이라고 하는 것을 구성합니다. 볼륨과 콘텐츠는 상호 연관되어 있습니다. 콘텐츠가 작을수록 개념이 추상적일수록 범위나 볼륨이 커집니다. 이것은 기호의 길이와 사용 빈도가 상호 의존적이라는 코딩 원칙에 대한 유추(개념적 영역에서)로 볼 수 있습니다.” 9 4 .

이중성의 원리는 특정 문제에도 적용됩니다. 예를 들어, 두 단어의 의미 동등성을 확립할 때 다른 언어들. Muret-Zanders의 영독사전을 수학적 반복법을 이용하여 연구한 결과, 독일어 번역에서 하나 이상의 의미를 가진 영어 단어를 사용할 확률은 전체 사전에서 각 첫 글자에 대해 일정하게 유지된다는 결론을 얻었다 9 5 . 중국어 사전의 어순을 고려하면 문자의 획 수가 그 위치를 나타내기 때문에 분류학적 성격이라는 결론에 도달합니다(독립적 급진적 또는 급진적 하위 클래스로). 분류법은 동물학 및 식물학에서 사용되는 분류의 종속 원칙입니다. 케르단은<133>중국어 사전 편찬의 기초는 또한 분류법 9 6 등의 원칙을 기반으로 합니다.

언어 문제 연구(즉, 언어 통계)에 수학적 방법을 적용하는 이 영역에 대한 일반적인 평가를 할 때, 분명히 Ettinger가 공식화한 입장에서 진행하는 것이 필요합니다. 언어학자가 사용된 수학적 모델의 가능성뿐만 아니라 적용의 실제 한계를 명확히 할 때만 언어학 서비스에서” 9 7 . 즉, 수학적 방법이 언어 문제를 적절하게 해결하는 데 적합하다는 것을 증명할 때 수학적 언어학에 대해 이야기할 수 있으며, 이는 전체적으로 언어 과학을 구성합니다. 그렇지 않은 경우 과학 연구의 새로운 측면을 열 수 있지만이 경우 언어학이 아닌 모든 것에 대해 이야기 할 수 있습니다. 이 경우에는 그렇지 않다는 의미입니다. 다른 유형응용 언어학(아래에서 논의할 것임) 및 과학적 또는 이론적 언어학. 이 입장을 바탕으로 언어학자의 관점에서 볼 때 언어 통계의 많은 부분이 의심스럽고 심지어 어리둥절하다는 점에 유의해야 합니다.

(프레젠테이션을 어지럽히지 않기 위해) 두 가지 예에 대한 분석으로 돌아가서 각각에 대해 매우 중요한 이의를 제기할 수 있음을 규정합니다. 여기서 우리는 문법적 단위와 어휘적 단위 사이의 양적 구별을 갖는다. 이러한 구분을 하기 위해서는 언어의 "문법적 부하"(즉, 문법적 요소의 총체성) 때문에 문법 분야에 속하는 것이 무엇인지, 어휘에 속하는 것이 무엇인지 미리 알아야 한다는 것이 밝혀졌습니다. 연설에서 사용됨), 위에 인용된 바와 같이 "어휘와 문법을 구분하는 경계선에 따라 달라집니다." 따라서 이 선이 어디에 있는지 모르면 표시된 구분을 그리는 것이 불가능합니다. 그렇다면 어휘와 문법을 구별하는 양적 방법의 의미는 무엇인가?<134>매틱? 그러나 헤르단은 이 문제에 대해 특별히 생각하지 않고 언어적 요소를 대담하게 분류하여, 표현으로 판단할 때 외적 굴절로 이해되어야 할 문법적 요소인 "연결된 형태"와 "문법적 단어"를 언급하며, 여기에는 전치사, 접속사, 보조 동사 및 대명사가 포함됩니다. 후자는 "대체"라는 사실 때문입니다. 그러나 우리가 이러한 대명사의 품질에 대해서만 이야기하고 이를 기반으로 문법적 요소와 관련시키는 경우 분명히 "앞서 언급한", "이름이 지정된", "주어진"등의 단어도 그에 기인해야하므로 그들도 대리인으로 행동하는 방법. 언어 통계에서 사용되는 문법적 요소를 분리하는 방법과 관련하여, 이 경우 어순, 성조, 영 형태소, 계열 관계(이러한 현상 중 일부는 , 그건 그렇고, 수학적 방법으로 연구되는 언어에서 반성을 찾으십니까)? 어근(급진적)을 문법적으로 수정할 뿐만 아니라 순열이 없는 어근은 언어에 실제 존재가 없습니까? 언어의 문법적 복잡성은 무엇을 이해해야 하며, 어떤 기준으로 결정되는가? 이 경우 가능한 모든 방법으로 강조되는 양적 포인트가 문법적으로 가장 어려운 언어 중 하나는 Ishallhavebeencalling 또는 Hewouldhavebeencalling과 같은 구조를 가진 영어가 될 것입니다. 이 문장들에서 call 만 어휘로 분류될 수 있고, 그 외의 모든 것은 문법적으로 간주되어야 합니다. 문법 요소의 사용 빈도와 문법 단어 의미의 일반성 또는 추상성을 연결하는 근거는 무엇입니까? 결국, 문법적 요소의 상대적으로 많은 사용빈도가 문장 구성에서의 기능에 의해 결정된다는 것은 매우 자명하며, 의미의 추상성에 관해서는 매우 쉽게 찾을 수 있다.<135>이러한 점에서 문법적 요소와 쉽게 경쟁할 수 있는 어휘 요소의 수는 빈도 면에서 크게 열등합니다(예: 존재, 존재, 확장, 공간, 실체등).

단어와 개념의 이중성(duality)에 대한 정의의 경우에도 비슷한 종류의 부조리가 우리 앞에 일어난다. 위에서 지적한 바와 같이 매우 중요한 언어학의 원천 자료가 된 질병의 명명법과 질병의 병원 등록부를 사용하여 연구하기 위해서는 언어의 구조적 본질에 대한 매우 독특한 이해가 필요합니다. 결론. 개념의 영역, 부피, 내용 등 언어적 존재가 없는 용어의 완전히 모호한 사용에 연연하지 않고 혼란), 이 경우에 내린 결론으로 ​​돌아가 보자. 위에서 언급한 바와 같이 "범위와 내용이 상호 연관되어 있다"는 주장을 다루고 있습니다. 그러한 결론에 대한 근거를 제공하는 전체 추론 과정과 언어적 사실의 수학적 연산 방법은 이 경우 언어의 매우 본질적인 특성 중 하나가 완전히 무시되어 수행되는 모든 계산을 뒤엎는다는 것을 분명히 보여줍니다. : 같은 것을 표현하는 능력 "양"이 다른 언어 단위로 "내용"을 표현하는 능력, 의심 할 여지없이 상대적 사용 빈도가 다릅니다. 그래서 우리는 같은 사람을 Petrov, 내 지인, 그, Muscovite, 청년, 대학 직원, 아내의 형제, 다리에서 만난 남자 등으로 지정할 수 있습니다. 의심의 여지없이 개인적인 결론이지만 지적한 바와 같이 보편적인 의미가 부여될 뿐만 아니라 그러한 언어 문제에 양적 방법 자체를 적용하는 편의성도 있습니다.

그러나 때때로 언어학자들은 그 타당성이 의심의 여지가 없는 결론을 내립니다. 이것은 "언어의 기본 법칙"이며, 언어에는 요소의 특정 안정성과 언급의 상대적 빈도가 있다는 사실로 구성됩니다.<136>소비. 그러나 이런 종류의 발견의 문제는 그것들이 언어학자들에게 오랫동안 알려져 왔다는 것입니다. 결국, 언어가 일정한 안정성을 갖지 못하고 주어진 언어 공동체의 각 구성원이 언어의 요소를 자유롭게 변경한다면 상호 의사 소통이 불가능하고 언어의 존재 자체가 무의미해질 것입니다. . 언어의 개별 요소 사용의 상대적 빈도 분포에 관해서는 L. V. Shcherba가 많은 관심을 기울인 수동 및 능동 어휘 및 문법 범주를 할당하는 형태로 언어학에서 그 표현을 발견했습니다. 이 경우 통계적 방법은 사용의 상대적 빈도 범주에 따라 특정 언어 요소를 분포하는 언어학자에게만 도움이 될 수 있지만 이론적 언어학에 가치가 있는 새로운 패턴을 발견했다고 주장할 이유는 없습니다.

반면에 언어 통계는 지지자들의 과학적 사고의 본질을 극도로 나타내는 진정한 "독창적"결론을 제공합니다. 따라서 Churchill, Benes, Halifax, Stresemann 등의 저작물에서 "정치적 어휘"는 복잡한 통계적 방법으로 연구되며 비영어권 작가의 계산에 그들의 저작물을 영어로 번역하는 데 사용됩니다. 계산 결과는 수많은 표, 수학 공식 및 방정식의 형태로 제공됩니다. 이 경우 양적 데이터의 언어적 해석은 처칠의 "정치적 어휘" 사용이 이 저자 그룹에 대해 가장 전형적인(?) 것이고 정치적 문제를 다루는 경우 처칠의 단어 사용이 전형적이라는 사실로 축소됩니다. 영어 스피치 그룹의 9 8 .

또 다른 경우에는 적절한 통계적 조작을 거친 후 히틀러가 나치 독일을 사용하면서 이러한 용어의 양적 의미에서 "언어"와 "말" 사이의 이중성을 위반했다고 결론지었습니다. 이 이중성이 파괴된 특별한 경우는 문자 그대로의 이해입니다.<137>은유적 전환(예: "열린 상처에 소금을 붓는다"). 나치 독일은 너무나 많은 비인간적 행위로 스스로를 낙인찍었기 때문에 이 언어적 만행 9 9 에 대해 유죄 판결을 받을 필요가 거의 없습니다. 케르단에 따르면, 마르크스의 언어에 대한 사상의 직접적 실재는 언어적 이중성을 위반하는 것으로 이어지며, 현상을 반대 현상으로 전환시키는 변증법의 법칙은 그의 견해로는 이중성의 언어적 법칙으로 잘못 이해되고 있다. 언어의. 그러한 해석은 스스로를 대변합니다.

마지막으로, 언어 자료를 연구하여 방법론적 특성을 획득하는 양적 방법의 위의 모든 경우에 내재된 공통적인 단점은 서로 완전히 독립적인 일련의 기계적 사실로서 언어 요소에 접근하는 것입니다. 또는 패턴, 그들은 체계적 종속성 외부에서 자율적 사실 분포의 수치적 관계만을 참조합니다. 사실, J. Watmou는 언어의 구조적 특징을 드러낼 수 있는 어떤 종류의 언어 구조 분석보다 더 나은 수학임을 확인하기 위해 가능한 모든 방법을 시도합니다. "현대 수학"은 "정확도가 본질적으로 제한되는 측정 및 미적분을 다루지 않고 주로 구조를 다룹니다. 이것이 수학이 언어 학습의 정확성에 매우 도움이 되는 이유입니다. 본질적으로 훨씬 더 제한적인 별도의 설명이 불가능할 정도로 ... 물리학에서와 마찬가지로 수학적 요소는 물리적 세계를 설명하는 데 사용됩니다. 물리적 세계의 요소에 해당하는 것으로 가정하기 때문에 수학적 언어학에서 수학적 요소는 언어 세계의 요소에 해당하는 것으로 간주됩니다.” 101 . 그러나 그러한 질문의 정식화는 결코 상황을 구하지 못한다.<138>언어에 대한 분석은 여전히 ​​언어에 충분하지 않고 최종 분석에서 여전히 동일한 기계적 특성을 갖거나 논리-수학적 구조로 언어를 분석하여 언어를 다른 차원으로 전환합니다. 그리고 많은 점에서 그것에 이질적입니다. Watmow는 미래에만 수학적 언어학의 성공을 예견하고 실제 결과에 대해 다음과 같이 평가합니다. “... Herdan, Zipf, 율 지로(Guiraux) 등은 언어학과 수학 모두에서 비평의 범위를 벗어나지 않는다. 그녀는 아마추어의 냄새가 난다” 103 . 따라서 언어 연구에서 수학적 방법의 미래를 예측하려는 것이 아니라 오늘날 우리가 가지고 있는 것을 평가하려고 한다면 수학이 언어학 분야에서 실제로 "측정 및 계산"에만 국한되었다는 것을 인정해야 할 것입니다. ”, 언어의 구조를 파고 들어 언어에 대한 질적 분석을 할 수 없었습니다.<139>

최대한 객관적이 되도록 노력합시다. 특정 부분에서 양적 데이터는 분명히 언어학에서 사용할 수 있지만 보조적으로 만 주로 실용적인 방향을 가진 문제에서 사용할 수 있습니다. 개별 언어 현상을 연구하는 대부분의 정량적 방법과 관련하여 R. Brown의 일반적인 결론은 의심할 여지 없이 정당합니다. 104 . "이 정원에 있는 나무는 무엇입니까?"라는 질문을 한다고 상상해 봅시다. 이에 대한 응답으로 "이 정원에는 백 그루의 나무가 있습니다." 이것이 우리의 질문에 대한 답이며 정말 이치에 맞습니까? 그러나 많은 언어적 질문과 관련하여 수학적 방법이 바로 그러한 답을 제공합니다.

그러나 주로 수학적 방법을 사용하고 동시에 그러한 조합의 편의성이 의심의 여지가 없는 언어 자료에 대한 연구 활동의 넓은 분야가 있습니다. 이 연구 활동의 "의미", 그 중요성은 그것이 추구하는 목표에 의해 결정됩니다. 이미 실전에서 검증되었습니다. 이 경우 정보 기계 생성과 관련된 문제, 서면 기계 번역 구조에 대해 이야기하고 있습니다. 과학 텍스트, 한 언어에서 다른 언어로의 구어 번역 자동화 및 사이버네틱스의 언어 문제에 결합된 모든 복잡한 작업과 함께. 이러한 문제의 전체 세트는 일반적으로 응용 언어학이라는 일반적인 이름이 부여됩니다. 따라서 언어 자료의 통계적 처리를 결코 피하지는 않지만 위에서 문체 통계학 및 언어 통계로 지정된 작업 영역을 포함하는 소위 수학적 언어학과 구별됩니다. 아마도 응용 언어학을 수학적 언어학과 구분하는 가장 중요한 특징은 전자가 언어학을 위한 수학이 아니라 언어학이라는 반대 방향을 가지고 있다는 것입니다.<140>(수학적 방법으로 공식화) 광범위한 실제 문제에 대해.

이제 응용언어학이라는 극히 넓은 영역에 포함되는 개별 문제의 내용을 공개할 필요가 없다. 수학적 언어학과 달리 이러한 문제는 소비에트 언어 문헌에서 활발히 논의되고 있으며 연구 기관의 과학적 문제에서 점점 더 두드러지는 위치를 차지하기 시작합니다 105 . 따라서 그들은 이미 우리 언어 커뮤니티에 잘 알려져 있습니다. 그러나 이러한 상황은 특히 언어 과학의 원리의 관점에서 반성해야 할 필요성을 덜어주지 않습니다. 이것은 의심 할 여지없이 서로 매우 멀리 떨어져 있고 응용 언어학 문제에 대한 작업에 참여하는 과학 대표자들 사이에서 점점 더 자주 발생하는 오해를 제거하는 데 도움이 될 것이며 한편으로는 그들의 수렴 방법을 설명 할 것입니다. , 연구 영역의 구분, 반면에. 다음 고려 사항은 언어 학자의 관점을 나타낼 것이며 수학자는 그것을 동화하려고 노력할뿐만 아니라 제기 된 질문과 관련하여 해석을 제공해야합니다.

언어학자-이론가는 모든 경우에<141>응용 언어학에 의해 설정된 목적을 위한 언어, 그들의 기초는 수학적 모델입니다. 이에 따라 언어 현상에 대한 관찰과 이렇게 얻은 결과를 수학 용어와 개념, 즉 수학 방정식과 공식을 통해 표현한다. 명확성을 위해 예를 살펴보겠습니다. Condon 1 06 및 Zipf 1 07은 빈도( 에프) 큰 텍스트에서 단어의 발생은 순위 또는 순위의 로그와 다이어그램에서 상관 관계가 있는 경우 거의 직선에 위치합니다( 아르 자형) 이 단어들 중. 방정식 f=c:r,어디 와 함께상수는 제한된 의미에서 이 관계를 반영합니다. c:r설정 값 아르 자형근사치로 관찰된 주파수를 재현합니다. 사이의 관계 에프그리고 아르 자형,수학 공식으로 표현되는 것은 사용 빈도의 관찰 값과 단어의 순위 또는 순위 사이의 관계에 대한 모델입니다. 이것은 수학적 모델링의 경우 중 하나입니다. 

전체 정보 이론은 전적으로 C. Shannon108이 개발한 커뮤니케이션 프로세스의 수학적 모델을 기반으로 합니다. 그것은 "모든 데이터에 포함된 정보의 양을 계산하고 추정하는 방법과 정보를 저장하고 전송하는 과정에 대한 연구에 전념하는 수학적 분야"로 정의됩니다(TSB, vol. 51, p. 128). 따라서 정보 이론의 기본 개념은 수학적 표현을 받아 정보를 바이니트(binits) 또는 이진 단위(언어에 비유되는 코드로 두 개의 조건부 동등 확률 신호가 각 문자 전송 시 하나의 이진 단위 정보를 전송합니다. ) - 코드 및 전송된 정보의 평균 양<142>형성. 중복성은 코드의 총 전송 능력의 백분율로 표현됩니다.”, 1 09 등. 같은 방식으로 기계 번역에는 한 언어의 요소를 다른 언어로 매핑하는 알고리즘 개발 등이 필요합니다. 1 10 . 다른 모델링 사례입니다.

의미가 없는 모델을 사용하는 것은 특히 응용 언어학이 설정한 문제를 해결하는 데 매우 중요한 도움이 될 수 있습니다. 그러나 이론적 언어학의 경우 추상 모델이 원칙적으로 실제 현상의 모든 기능, 모든 기능적 특성을 재현하지 않는 것이 매우 중요합니다. 따라서 건축가는 집을 짓기 전에 설계 중인 집을 가장 작은 세부 사항까지 재현하는 모델을 만들 수 있으며, 이는 그가 집 자체 건설과 관련된 많은 실제 문제를 해결하는 데 도움이 됩니다. 그러나 그러한 집 모델은 아무리 정확하더라도 그 "기능"이 없으며 일반적으로 모든 주택이 건축되는 목적이 없습니다. 사람에게 주택을 제공 할 수 없습니다. 상황은 모델이 항상 모든 품질을 재현할 수 있는 것은 아닌 언어와 유사합니다. 이 경우 언어가 아닌 수학적 기준이 모델을 구축하는 데 사용된다는 사실로 인해 문제가 더욱 복잡해집니다. "수학적 모델은 ... -A. Ettinger는 기술의 모든 영역에서 매우 중요한 역할을 하지만 합성 도구이기 때문에 주로 역사적이고 설명적인 분야인 언어학에 대한 중요성은 자연스럽게 제한됩니다. 111.<143>

언어의 수학적 모델링은 실제로 정적 상태에만 적용할 수 있으며 이는 언어학자에게 조건부이며 실제로 언어의 기본 품질과 직접적으로 충돌하며 그 존재 형태는 개발입니다. 언어의 정적 연구는 언어학에서 결코 배제되지 않으며, 외국어의 실제 학습을 위한 지침이 되는 규범문법과 사전, 서술문법, 실용문법과 사전 등을 편찬하는 기초가 됨은 물론이다. 그러나 자연에 주로 적용되는 이러한 모든 작업에서 언어학자는 의식적으로 연구 분야를 제한하고 언어의 다른 측면에 결코 눈을 감지 않습니다 1 12 . 특히 언어에 대한 정적 검사를 통해 생산성, 사고 형식에 대한 의존성, 문화적, 사회적, 정치적, 역사적 및 기타 요인과의 광범위한 상호 작용과 같은 동적 특성과 관련된 언어의 특성이 완전히 사라집니다. 연구원의 시야. 공시적 차원에서만 언어는 관습적인 기호나 코드의 체계로 간주될 수 있지만, 언어에 더 적합한 동적 관점을 채택하자마자 완전히 정당화되지 않는 것으로 판명됩니다. 동기 부여, 안정된 경계를 갖지 않는 단어의 다의어, 단어의 의미와 소리 껍질의 비 자율성, 문맥과 관련된 단어의 창의적 잠재력과 같은 언어 특성이 개발 과정에 있습니다. 그리고 이 모든 것은 코드나 기호의 주요 특성과 첨예하게 모순된다 1 13 . 분명히 응용 언어학에서는 언어의 이러한 모든 특성을 생각할 수 있으며 실용적인 목적을 위해 언어의 "스냅샷"에 만족할 수 있습니다. 그 기능의 메커니즘.<144>nirovaniya. 그러나 그러한 각각의 "스냅샷"은 관습적인 코드 체계의 사실이 아니라 언어의 사실로 간주된다면 언어가 항상 존재하는 끝없는 이동 과정에 포함되어야 합니다114. 그것은 이 운동을 특징짓는 구체적인 조건 밖에서 연구될 수 없습니다. 주어진 상태언어 및 컨디셔닝은 추가 개발의 힘입니다. 여기에는 한 순간의 인물 사진과 붓으로 그린 ​​초상화의 차이와 같은 차이가 있다. 진정한 예술가. 작가의 작품에서 우리는 외모뿐만 아니라 내면의 영적 내용의 모든 독창성을 지닌 사람의 일반화 이미지를 가지고 있습니다. 예술적인 초상화에서 우리는 또한 그것에 묘사된 사람의 과거를 읽을 수 있고 그의 행동에서 그가 무엇을 할 수 있는지 결정할 수 있습니다. 그리고 스냅샷은 원본의 모양을 더 정확하게 나타낼 수 있지만 이러한 특성이 없으며 종종 코에 튀어 나온 우발적 여드름과<145>전혀 특징이 없는 포즈나 표정으로 결국 원본의 왜곡으로 이어집니다.

"스냅샷"의 방법은 물론 언어 발달의 사실에 적용될 수 있다는 점에 유의해야 합니다. 그러나 이 경우에 우리는 실제로 언어의 분리된 상태만을 다룰 것이며, 양적 특성화에서 다른 언어의 비교 양적 특성화에 지나지 않는 것으로 판명됩니다. 이러한 종류의 양적 "역학"은 유기적인 것을 포함하지 않으며 언어의 개별 상태 간의 연결은 수치 관계의 비교에만 의존합니다. 이 경우에도 유추에 의지한다면 우리는 아이의 성장을 언급할 수 있습니다. 물론 그의 발달은 체중, 키, 신체 부위의 부피 변화 비율에 대한 수치 데이터의 역학 형태로 나타낼 수 있지만 이러한 모든 데이터는 주로 개별 본질을 구성하는 모든 것과 절대적으로 분리됩니다. 사람의 - 그의 성격, 성향, 습관. , 취향 등

언어의 수학적 "모델링"의 또 다른 부정적인 측면은 언어에 대한 포괄적이고 포괄적인 체계적 설명을 수행할 수 있는 일반 원칙이 될 수 없다는 사실입니다. 예를 들어, 언어 현상에 대한 수학적 접근만이 다음과 같은 근본적인 질문(언어 과학의 존재 자체를 생각할 수 없음)과 같은 근본적인 질문에 답하는 것을 가능하게 하지 않을 것입니다. 적절한 언어학적으로 분류되는 것, 단어나 문장이 어떻게 정의되는지, 언어의 기본 개념과 범주는 무엇인지 등. 가설) 이 모든 질문에 미리. 수학적 방법에 의한 언어 현상 연구에 대해 우리에게 알려진 모든 사례에서 이러한 모든 개념과 범주는 필연적으로 전통적 또는 상대적으로 말하면 질적 방법.

언어적 적용에서 수학적 방법의 이러한 특징은 파이가<146>샐: “정량적 표현을 받는 관찰된 사실은 설명의 일부를 형성하지 않는 경우 가치가 없으며 언어적 목적을 위해 질적 언어와 밀접하게 관련된 체계적인 설명이어야 한다는 점을 염두에 두어야 합니다. 설명 및 이론” 1 15 . 스팡-한센(Spang-Hanssen)의 또 다른 연설에서 우리는 이 아이디어에 대한 해명을 발견했습니다. 언어적 관점의 수치적 특성은 의미가 없습니다." 1 16 . 유사한 아이디어가 Uldall에 의해 표현되어 다소 예기치 않게 그것들을 용어해석학의 일반적인 이론적 기초의 발전과 연결합니다. 예를 들어, 단어를 셀 때 단어는 완전히 다른 용어로 정의됩니다.<147>

따라서 이론적 용어와 실제 적용 모두에서 수학적 방법은 전통적, 철학적 또는 위에서 언급했듯이 질적 방법에 의해 정의된 언어 개념 및 범주에 직접적으로 의존한다는 것이 밝혀졌습니다. 응용 언어학 측면에서 이러한 의존성을 깨닫고 결과적으로 전통 언어학의 주요 범주 전체에 익숙해지는 것이 중요합니다.

사실, 현대 언어학의 데이터를 사용하지 않는다는 이유로 응용 언어학 분야에서 일하는 정확한 과학의 대표자를 비난 할 이유가 없습니다. 이것은 실제 상황과 일치하지 않습니다. 그들은 완벽하게 잘 알고있을뿐만 아니라 다른 언어의 특징, 특정 언어 시스템 내 언어 요소의 분포 및 배열, 음향 음성학의 성과 등 언어학자가 설정 한 차별화 기능 시스템을 작업에 널리 사용합니다. 그러나 이 경우 매우 중요한 예약이 필요합니다. . 실제로 정확한 과학의 대표자는 언어학에서 한 방향의 데이터 만 사용합니다. 소위 설명 언어학은 언어 연구의 전체 분야를 다루는 것과는 거리가 먼 이론적 언어학의 전통적인 문제와 의도적으로 구별됩니다. 언어학적으로 볼 때 방법론적으로 상당한 결점을 가지고 있어 최근에 드러난 위기1 18 에 더해 응용언어학의 이해관계에 부합하는 순전히 실용적인 지향을 가지고 있다. 언어의 정적 고려에 대해 위에서 언급한 모든 유보와 비난은 기술 언어학에 적용할 수 있습니다. 기술 언어학의 이러한 일방적인 접근은 연구자가 할 수 있는 일이다.<148>그러나 그것은 응용언어학 자체가 설정한 작업에 의해서만 정당화될 수 있지만 언어 과학의 전체 내용을 소진하는 것과는 거리가 멀다.

응용 언어학의 문제를 발전시키는 과정에서 새로운 이론적 문제가 발생할 수 있으며 실제로는 이미 발생했습니다. 이러한 문제 중 일부는 응용 언어학의 특정 작업과 밀접하게 관련되어 있으며 이러한 문제를 해결하는 데 발생하는 어려움을 극복하는 것을 목표로 합니다. 다른 문제는 이론적 언어학과 직접 관련되어 전통적인 아이디어에 대한 새로운 관점을 허용하거나 언어 연구, 새로운 개념 및 이론의 새로운 영역을 개척합니다. 예를 들어 후자의 경우에는 "기계" 언어(또는 중간 언어)를 생성하는 문제가 있는데, 이는 개념과 어휘 의미, 논리 및 문법, 통시와 동시, 언어의 기호성, 언어적 의미의 본질, 인공언어 구성 원리 등 119. 이 경우 언어 분야와 정확한 과학 대표자들의 공동 작업에서 상호 이해와 커먼 웰스를 구축하는 것이 특히 중요합니다. 언어적 측면에 관해서는, 이 경우에 우리는 이미 예를 들어 번역 기계 설계자의 노력을 미리 제한하고 그러한 기계의 작동 기능을 N의 구절로 설정하려고 시도하는 것에 대해 이야기해서는 안됩니다. Gribachev 또는 V. Kochetov 1 20의 산문 . 기계 자체는 기능의 한계와 수익성, 즉 사용의 한계를 찾을 것입니다. 그러나 공통 원인에 대한 기여로서 언어학자는 언어 구조의 특징, 다용성, 요소의 내부 교차 관계뿐만 아니라 언어와 물리적, 생리학적 언어의 광범위하고 다각적인 연결에 대한 지식을 가져와야 합니다. , 정신적, 논리적<149>mi 현상, 특정 기능 패턴 및 언어 발달. 이 지식의 총체는 해당 기계의 설계자가 잘못된 방향으로 방황하지 않고 검색을 목적이 있고 명확하게 하기 위해 필요합니다. 그것조차 아주 짧은 리뷰이 에세이에서 작성된 언어 문제에 수학적 방법을 적용한 사례는 그러한 지식이 정확한 과학의 대표자에게 결코 불필요하지 않을 것이라고 확신합니다.

위의 모든 고려 사항을 바탕으로 몇 가지 일반적인 결론에 도달할 수 있습니다.

그렇다면 수학적 언어학은? 이것이 모든 언어 문제를 해결하기 위한 보편적 마스터 키로 수학적 방법을 사용하는 것을 의미한다면 그러한 주장은 절대적으로 정당하지 않은 것으로 인식되어야 합니다. 이 방향으로 수행된 모든 작업은 지금까지 언어 과학의 전통적인 문제를 해결하는 데 거의 또는 전혀 수행되지 않았습니다. 최악의 경우, 수학적 방법의 적용은 명백한 불합리성을 수반하거나 언어학적 관점에서 절대적으로 무의미합니다. 기껏해야 수학적 방법은 언어 연구의 보조 방법으로 사용될 수 있으며 특정하고 제한된 언어 문제를 해결하는 데 사용됩니다. 이 경우 "양적 언어 철학"에 대한 의문의 여지가 없습니다. 당시의 물리학, 심리학, 생리학, 논리학, 사회학, 민족학은 언어학의 독립성을 잠식했지만 언어학을 예속시킬 수는 없었다. 그 반대가 일어났습니다. 언어학은 이러한 과학의 성과를 이용했고, 그 자체로 필요한 만큼 그들의 도움을 사용하기 시작하여 연구 방법의 무기고를 풍부하게 했습니다. 이제 분명히 수학의 차례입니다. 이 새로운 커뮤니티가 언어 과학의 강화, 작업 방법의 개선 및 다양성 증가에 기여할 수 있기를 바랍니다. 그러므로 물리적 언어학, 생리학적 언어학, 논리적 언어학, 심리적 언어학,<150>기타 그러한 언어학은 없으며 보조 연구 도구로 다른 과학의 데이터를 유익하게 사용하는 언어학이 하나뿐입니다. 따라서 새로운 과학의 맹공 앞에서 후퇴할 이유가 없으며, 새로운 과학이 획득한 위치를 쉽게 그에게 양보할 이유가 없습니다. 여기에서 A. Martinet의 말을 상기하는 것이 매우 적절합니다. 그러나 언어 학자들이 과학의 독립성을 깨닫고 자신의 행동을 하나 또는 다른 일반적인 과학적 원리와 연관시키는 열등감에서 벗어날 때가 왔습니다. 그 결과 현실의 윤곽은 항상 명확해지기는커녕 애매모호할 뿐 21 .

따라서 수학 자체와 언어학 자체입니다. 이것은 공통 문제에 대한 공동 작업에서 상호 지원이나 친선 회의를 결코 배제하지 않습니다. 두 과학의 공동 노력의 이러한 종류의 적용 장소는 응용 언어학의 일부이며 국가 경제적 중요성이 큰 광범위한 문제입니다. 공동 작업에서 두 ​​과학이 최대한의 상호 이해를 보여 의심 할 여지없이 협력의 최대 결실에 기여할 수 있기를 바랍니다.<151>

목차
소개
제1장 언어학에서의 수학적 방법 적용의 역사
1.1. 19-20세기 초 구조언어학의 형성
1.2. 20세기 후반 언어학에서의 수학적 방법의 적용
결론
문학
소개
20세기에는 다양한 지식 분야의 상호작용과 상호 침투를 향한 지속적인 추세가 있어 개별 과학 간의 경계가 점차 모호해지고 있습니다. 인도주의, 기술 및 자연 과학 지식의 "교차점"에 있는 정신 활동의 점점 더 많은 분야가 있습니다.
근대성의 또 다른 분명한 특징은 구조와 그 구성 요소를 연구하려는 욕구입니다. 그래서 점점 더 많은 곳에서 과학 이론실제로는 수학에 주어집니다. 한편으로는 논리와 철학, 다른 한편으로는 통계(그리고 결과적으로 사회과학)와 접촉하면서 수학은 오랫동안 순전히 과학에만 국한된 것으로 여겨졌던 영역에 점점 더 깊이 침투합니다. "인도 주의적", 휴리스틱 잠재력 확장 ( "얼마나"라는 질문에 대한 답은 종종 "무엇"과 "어떻게"라는 질문에 답하는 데 도움이 됨). 언어학도 예외는 아니었습니다. 기말 보고서-수학과 언어학 같은 언어학 분야 사이의 연결을 간략하게 강조합니다. 1950년대부터 수학은 언어 구조(자연 및 인공 모두)를 설명하기 위한 이론적 장치를 만들기 위해 언어학에서 사용되었습니다. 그러나 그녀는 즉시 자신의 종류를 찾지 못했다고 말해야합니다. 실용. 처음에는 언어학의 수학적 방법이 언어학의 기본 개념을 명확히 하기 위해 사용되기 시작했지만, 컴퓨터 기술의 발달과 함께 이러한 이론적 전제가 실제로 적용되기 시작했습니다. 기계 번역, 기계 정보 검색, 자동 텍스트 처리와 같은 작업을 해결하려면 언어에 대한 근본적으로 새로운 접근 방식이 필요했습니다. 언어학자들은 기술에 직접 적용할 수 있는 형태로 언어 패턴을 표현하는 방법을 배우는 방법에 대한 질문을 제기했습니다. 우리 시대에 유행하는 "수학적 언어학"이라는 용어는 정확한 방법을 사용하는 모든 언어 연구를 의미합니다(그리고 과학에서 정확한 방법의 개념은 항상 수학과 밀접한 관련이 있습니다). 지난 몇 년 동안 일부 과학자들은 특별한 "언어학"을 의미하지 않고 언어 연구 방법의 정확성과 신뢰성을 향상시키는 데 중점을 둔 새로운 방향만을 의미하기 때문에 표현 자체를 용어의 등급으로 올릴 수 없다고 생각합니다. 언어학은 양적(대수적) 방법과 비정량적 방법을 모두 사용하여 수학적 논리, 결과적으로 철학, 심지어 심리학에 더 가깝게 만듭니다. Schlegel조차도 언어와 의식의 상호 작용에 주목했으며 20 세기 초의 저명한 언어학자인 Ferdinand de Saussure (언어학의 수학적 방법 개발에 대한 그의 영향에 대해서는 나중에 설명하겠습니다)는 언어의 구조를 소속과 연결했습니다. 사람들에게. 현대 연구원 L. Perlovsky는 더 나아가 국가 정신의 특성으로 언어의 양적 특성(예: 성별, 사례 수)을 식별합니다(자세한 내용은 섹션 2.2, "언어학의 통계적 방법" 참조).
수학과 언어학의 상호 작용은 다면적인 주제이며, 제 작업에서 저는 모든 것에 대해 생각하지 않고 우선 적용 측면에 대해 설명할 것입니다.
제1장 언어학에서 수학적 방법의 응용 역사
1.1 XIX-XX 세기 전환기에 구조 언어학의 형성
언어에 대한 수학적 설명은 20세기 초 유명한 스위스 언어학자인 Ferdinand de Saussure로 거슬러 올라가는 메커니즘으로서의 언어에 대한 아이디어를 기반으로 합니다.
그의 개념의 초기 링크는 각 단어(시스템의 구성원)가 그 자체가 아닌 것으로 간주되는 세 부분(언어 자체 - 랑그, 스피치 - 파롤 및 스피치 활동 - 언어)으로 구성된 시스템으로서의 언어 이론입니다. , 그러나 다른 사람들과 관련하여 ....


맨 위