언어학에서 수학적 방법을 적용한 역사. 언어학과 수학의 상호 작용에 대한 성찰

19~20세기 초 구조언어학의 형성. 언어 학습의 통계적 방법. 20세기 후반 언어학에서의 수학적 방법의 적용. 형식 논리의 방법으로 언어를 학습합니다. 기계 번역의 특징.

소개

제1장 언어학에서의 수학적 방법 적용의 역사

1.1. 19~20세기 초 구조언어학의 형성

1.2. 20세기 후반 언어학에서의 수학적 방법의 적용

제2장 언어학에서 수학을 사용한 선별된 예

2.1. 기계 번역

2.2.언어 학습의 통계적 방법

2.3. 형식 논리의 방법으로 언어 학습

2.4. 언어학에서 수학적 방법의 적용에 대한 전망

결론

문학

부록 1. Ronald Schleifer. 페르디낭 드 소쉬르

부록 2. Ferdinand de Saussure(번역)

소개

20세기에는 다양한 지식 분야의 상호작용과 상호 침투를 향한 지속적인 추세가 있었습니다. 개별 과학 사이의 경계가 점차 모호해지고 있습니다. 인도주의, 기술 및 자연 과학 지식의 "교차점"에 있는 정신 활동의 점점 더 많은 분야가 있습니다.

근대성의 또 다른 분명한 특징은 구조와 그 구성 요소를 연구하려는 욕구입니다. 따라서 과학적 이론과 실제 모두에서 점점 더 많은 위치가 수학에 주어집니다. 한편으로는 논리와 철학, 다른 한편으로는 통계(그리고 결과적으로 사회과학)와 접촉하면서 수학은 오랫동안 순전히 과학에만 국한된 것으로 여겨졌던 영역에 점점 더 깊이 침투합니다. 휴리스틱 잠재력을 확장하는 "인도 주의적"( "얼마나"라는 질문에 대한 대답은 종종 "무엇"과 "어떻게"라는 질문에 대답하는 데 도움이 됨). 언어학도 예외는 아니었다.

제 과정의 목적은 수학과 언어학과 같은 언어학 분야 사이의 연결을 간략하게 강조하는 것입니다. 1950년대부터 수학은 언어 구조(자연 및 인공 모두)를 설명하기 위한 이론적 장치를 만들기 위해 언어학에서 사용되었습니다. 동시에 그러한 실용적인 응용 프로그램을 즉시 찾지 못했다고 말해야합니다. 처음에는 언어학의 기본 개념을 명확히 하기 위해 언어학의 수학적 방법이 사용되기 시작했지만 컴퓨터 기술의 발달과 함께 이러한 이론적 전제가 실제로 적용되기 시작했습니다. 기계 번역, 기계 정보 검색, 자동 텍스트 처리와 같은 작업을 해결하려면 언어에 대한 근본적으로 새로운 접근 방식이 필요했습니다. 언어학자들은 언어 패턴을 기술에 직접 적용할 수 있는 형태로 표현하는 방법을 배우는 방법에 대한 질문에 직면했습니다. 우리 시대에 유행하는 "수학적 언어학"이라는 용어는 정확한 방법을 사용하는 모든 언어 연구를 의미합니다(그리고 과학에서 정확한 방법의 개념은 항상 수학과 밀접한 관련이 있습니다). 지난 몇 년간의 일부 과학자들은 특별한 "언어학"을 의미하지 않고 언어 연구 방법의 정확성과 신뢰성을 향상시키는 데 중점을 둔 새로운 방향만을 의미하기 때문에 표현 자체를 용어의 등급으로 올릴 수 없다고 생각합니다. . 언어학은 양적(대수적) 방법과 비정량적 방법을 모두 사용하여 수학적 논리, 결과적으로 철학, 심지어 심리학에 더 가깝게 만듭니다. Schlegel조차도 언어와 의식의 상호 작용에 주목했으며 20 세기 초의 저명한 언어학자인 Ferdinand de Saussure (언어학에서 수학적 방법 개발에 대한 그의 영향에 대해서는 나중에 설명하겠습니다)는 언어의 구조를 소속과 연결했습니다. 사람들에게. 현대 연구원 L. Perlovsky는 더 나아가 국가 정신의 특성으로 언어의 양적 특성(예: 성별, 사례 수)을 식별합니다(자세한 내용은 섹션 2.2, "언어학의 통계적 방법" 참조).

수학과 언어학의 상호 작용은 다면적인 주제이며, 제 작업에서 저는 모든 것에 대해 생각하지 않고 우선 적용 측면에 대해 설명할 것입니다.

제1장언어학에서의 수학적 방법 적용의 역사

1.1 구조언어학의 형성XIX-XX 세기의 전환기에

언어에 대한 수학적 설명은 20세기 초의 유명한 스위스 언어학자인 Ferdinand de Saussure로 거슬러 올라가는 메커니즘으로서의 언어라는 개념을 기반으로 합니다.

그의 개념의 초기 링크는 세 부분으로 구성된 시스템으로서의 언어 이론입니다. 언어, 연설 - 비밀번호, 그리고 말하기 활동 - 언어), 여기서 각 단어(시스템의 구성원)는 그 자체로 고려되지 않고 다른 구성원과 관련하여 고려됩니다. 또 다른 저명한 언어학자인 Dane Louis Hjelmslev는 나중에 언급했듯이 Saussure는 "언어에 대한 구조적 접근, 즉 단위 간의 관계를 기록함으로써 언어에 대한 과학적 설명을 요구한 최초의 사람이었습니다."

언어를 계층 구조로 이해한 소쉬르는 처음으로 언어 단위의 가치와 중요성에 대한 문제를 제기했습니다. 별도의 현상 및 사건(즉, 개별 인도-유럽어 단어의 기원에 대한 역사)은 그 자체로 연구되는 것이 아니라 유사한 구성 요소와 상호 연관되는 시스템에서 연구되어야 합니다.

소쉬르의 언어 구조 단위는 소리와 의미가 결합된 "기호"라는 단어를 고려했습니다. 이러한 요소 중 어느 것도 서로 없이는 존재하지 않습니다. 따라서 원어민은 다중 의미 단어 의미의 다양한 음영을 언어의 구조적 전체에서 별도의 요소로 이해합니다.

따라서 F. de Saussure의 이론에서 한편으로는 언어학과 사회학 및 사회 심리학의 상호 작용을 볼 수 있습니다(동시에 Husserl의 현상학, Freud의 정신 분석, Einstein의 상대성 이론이 , 문학, 음악 및 미술의 형식과 내용에 대한 실험이 진행되고 있음) 반면에 수학 (체계성 개념은 언어의 대수적 개념에 해당함). 이러한 개념은 언어 해석의 개념을 다음과 같이 변경했습니다. 현상은 발생 원인과 관련하여 해석되지 않고 현재와 미래와 관련하여 해석되기 시작했습니다. 해석은 더 이상 사람의 의도와 무관하지 않습니다(의도가 프로이트의 의미에서 비인격적이고 "무의식"일 수 있음에도 불구하고).

언어 메커니즘의 기능은 원어민의 말하기 활동을 통해 나타납니다. 음성의 결과는 소위 "정확한 텍스트"입니다. 특정 패턴을 따르는 음성 단위의 시퀀스이며, 그 중 다수는 수학적 설명을 허용합니다. 구문 구조를 기술하는 방법 이론은 올바른 텍스트(주로 문장)의 수학적 기술을 위한 방법 연구를 다룹니다. 그러한 구조에서 언어적 유비는 고유한 특성의 도움으로 정의되는 것이 아니라 체계(“구조적”) 관계의 도움으로 정의됩니다.

서부에서 Saussure의 아이디어는 위대한 스위스 언어학자의 젊은 동시대 사람들에 의해 개발되었습니다. 덴마크에서는 L. Hjelmslev가 이미 언급했으며 그의 작품 "Fundamentals of Linguistic Theory"에서 언어 대수 이론을 일으켰습니다. 미국 - 체코의 E. Sapir, L. Bloomfield, C. Harris - 러시아 이민자 과학자 N. Trubetskoy.

언어 연구의 통계적 규칙성은 다름 아닌 유전학의 창시자인 게오르그 멘델에 의해 다루어지기 시작했습니다. 1968년이 되어서야 문헌학자들은 그가 말년에 수학 방법을 사용한 언어 현상 연구에 매료되었다는 사실을 발견했습니다. Mendel은 이 방법을 생물학에서 언어학으로 가져왔습니다. 1990년대에는 가장 대담한 언어학자와 생물학자만이 그러한 분석의 타당성을 주장했습니다. 성 베드로 수도원 기록 보관소에서 대수도원장이 Mendel이었던 브르노의 Tomasz는 "mann", "bauer", "mayer"로 끝나는 성 열과 일부 분수 및 계산이 포함된 시트를 발견했습니다. 멘델은 성의 기원에 관한 공식적인 법칙을 발견하기 위해 독일어의 모음과 자음의 수, 그가 고려하는 총 단어 수, 성의 수, 등.

우리나라에서 구조적 언어학은 서양과 거의 동시에 19-20 세기 초에 발전하기 시작했습니다. F. de Saussure와 동시에 시스템으로서의 언어 개념은 Kazan University F.F. Fortunatov 및 I.A. 보두앵 드 쿠르트네. 후자는 각각 de Saussure와 오랫동안 대응했으며 Geneva와 Kazan 언어학 학교는 서로 협력했습니다. 소쉬르가 언어학에서 "정확한" 방법의 이데올로기라고 불릴 수 있다면 Baudouin de Courtenay는 그 적용을 위한 실용적인 토대를 마련했습니다. 그는 언어학을 처음으로 분리했습니다. 정확한통계적 방법과 기능적 의존성을 사용하는 과학) 문헌학(언어와 말을 통해 영적 문화를 연구하는 인도주의 학문 공동체)에서. 과학자 자신은 "언어학은 가까운 미래에 유용할 수 있으며, 언어학 및 문학사와의 의무적 결합에서만 해방될 수 있다"고 믿었습니다. 음운론은 수학적 방법을 언어학에 도입하기 위한 "시험장"이 되었습니다. 언어 시스템의 "원자"로서의 소리는 쉽게 측정할 수 있는 속성의 수가 제한되어 형식적이고 엄격한 설명 방법에 가장 편리한 재료였습니다. 음운론은 소리의 의미 존재를 부정하므로 "인간" 요소는 연구에서 제거되었습니다. 이런 의미에서 음소는 물리적 또는 생물학적 대상과 같습니다.

지각에 허용되는 가장 작은 언어 요소인 음소는 별도의 영역, 별도의 "현상학적 현실"을 나타냅니다. 예를 들어 영어에서 "t" 소리는 다르게 발음될 수 있지만 모든 경우에 영어를 사용하는 사람은 "t"로 인식합니다. 가장 중요한 것은 음소가 주요 의미있는 기능을 수행한다는 것입니다. 또한 언어 간의 차이점은 한 언어의 한 소리가 다른 음소에 해당할 수 있다는 것입니다. 예를 들어 영어의 "l"과 "r"은 다르지만 다른 언어에서는 동일한 음소의 변형입니다(예: 영어 "t", 열망 유무에 관계없이 발음). 모든 자연어의 광대한 어휘는 훨씬 적은 수의 음소 조합의 집합입니다. 예를 들어 영어에서는 40개의 음소만 사용하여 약 백만 단어를 발음하고 씁니다.

언어의 소리는 체계적으로 구성된 일련의 기능입니다. 1920년대에서 1930년대에 Saussure에 이어 Jacobson과 N.S. Trubetskoy는 음소의 "독특한 특징"을 골라냈습니다. 이러한 기능은 혀, 치아, 성대와 같은 음성 기관의 구조를 기반으로 합니다. 예를 들어, 영어에서 "t"와 "d"의 차이는 "음성"(성대의 긴장)의 유무와 음소를 구별하는 음성의 수준입니다. 따라서 음운론은 Saussure가 설명한 일반 언어 규칙의 예로 간주할 수 있습니다. "언어에는 차이가 있을 뿐입니다." 훨씬 더 중요한 것은 이것이 아닙니다. 차이는 일반적으로 그것이 위치한 정확한 조건을 의미합니다. 그러나 언어에는 정확한 조건 없이 차이만 있을 뿐입니다. 우리가 "지정"을 고려하든 "의미"를 고려하든 언어 시스템이 개발되기 전에 존재했을 개념이나 소리가 언어에는 없습니다.

따라서 소쉬르 언어학에서 연구된 현상은 언어의 비교와 대립의 집합으로 이해됩니다. 언어는 단어의 의미를 표현하는 동시에 의사소통 수단이며 이 두 기능은 결코 일치하지 않습니다. 우리는 형식과 내용의 교대를 알아차릴 수 있습니다. 언어적 대조가 구조 단위를 정의하고 이러한 단위가 상호 작용하여 어떤 의미 있는 내용을 생성합니다. 언어의 요소는 무작위적이기 때문에 대조도 조합도 근거가 될 수 없다. 이것은 언어에서 독특한 특징이 다른 이해 수준에서 음성 대조를 형성하고 음소가 형태소로 결합되고 형태소가 단어로, 단어가 문장으로 결합되는 것을 의미합니다. 어쨌든 전체 음소, 단어, 문장 등 부분의 합 이상입니다.

소쉬르는 사회에서 기호의 역할을 연구하면서 언어학과 분리된 20세기의 새로운 과학에 대한 아이디어를 제안했습니다. Saussure는 이것을 과학 기호학이라고 불렀습니다 (그리스어 "semeion"-기호). 1920년대와 1930년대 동유럽, 1950년대와 1960년대 파리에서 발전한 기호학의 "과학"은 언어와 언어 구조에 대한 연구를 이러한 구조로 구성된(또는 표현된) 문학적 발견으로 확장했습니다. 또한 그의 경력의 황혼기에 일반적인 언어학 과정과 병행하여 Saussure는 의도적으로 구성된 고유 이름의 철자 바꾸기를 발견하려고 노력하면서 후기 로마시의 "기호 학적"분석에 참여했습니다. 이 방법은 여러 면에서 언어 분석에서 합리주의와 정반대였습니다. 언어의 "개연성" 문제를 시스템에서 연구하려는 시도였습니다. 이러한 연구는 확률의 "실제 측면"에 초점을 맞추는 데 도움이 됩니다. Jean Starobinsky에 따르면 Saussure가 애너그램을 찾고 있는 "핵심 단어"는 "시의 삶의 원천이 아니라 시인을 위한 도구"입니다. 시는 키워드의 소리를 바꾸는 역할을 합니다. Starobinsky에 따르면 이 분석에서 "소쉬르는 숨겨진 의미를 탐구하지 않습니다." 반대로 그의 작품에서는 의식과 관련된 질문을 회피하려는 욕구가 눈에 띈다. 언어의 법칙”(. 부록 1 참조).

후기 로마 시에서 고유명사를 연구하려는 소쉬르의 시도는 그의 언어 분석의 구성 요소 중 하나인 기호의 자의적 특성과 의미 분석의 가능성을 배제한 소쉬르 언어학의 형식적 본질을 강조합니다. Todorov는 오늘날 Saussure의 작업이 명확하게 정의된 의미를 가진 현상의 상징을 연구하기를 꺼리는 점에서 극도로 일관성이 있는 것 같다고 결론지었습니다[부록 1]. 애너그램을 탐색하면서 Saussure는 반복에만 주의를 기울이고 이전 옵션에는 주의를 기울이지 않습니다. . . . Nibelungenlied를 연구하면서 그는 잘못된 읽기에 할당하기 위해서만 기호를 정의합니다. 의도하지 않은 경우 기호는 존재하지 않습니다. 결국, 일반 언어학에 관한 그의 글에서 그는 언어 기호뿐만 아니라 기호학의 존재를 가정합니다. 그러나 이 가정은 기호학이 무작위적이고 자의적인 기호만을 기술할 수 있다는 사실에 의해 제한됩니다.

만약 이것이 사실이라면 그것은 그가 대상 없이는 "의도"를 상상할 수 없었기 때문입니다. 그는 형식과 내용 사이의 간격을 완전히 메울 수 없었습니다. 그의 글에서 이것은 질문으로 바뀌었습니다. 대신 그는 "언어 적 정당성"으로 전환했습니다. 한편으로는 역사와 주관적 추측에 기초한 19세기 개념과 이러한 개념에 기초한 임의적 해석의 방법, 그리고 다른 한편으로는 형식과 내용(주체와 객체) 사이의 대립을 지우는 구조주의적 개념 사이에서, 구조주의, 정신분석학, 심지어 양자역학의 의미와 기원 - 언어학과 기호학에 관한 Ferdinand de Saussure의 저술은 언어와 문화의 의미 연구에서 전환점이 되었습니다.

러시아 과학자들은 1928년 헤이그에서 열린 제1차 국제 언어학자 회의에도 참석했습니다. S. Kartsevsky, R. Yakobson 및 N. Trubetskoy는 지난 세기 초 가장 현대적인 아이디어의 정신으로 언어의 계층 구조를 조사한 보고서를 작성했습니다. Jakobson은 그의 저서에서 언어의 기본 요소는 무엇보다도 그 발생 이유가 아니라 기능과 관련하여 연구되어야 한다는 Saussure의 생각을 발전시켰습니다.

불행히도 1924년 스탈린이 집권한 후 다른 많은 과학과 마찬가지로 러시아 언어학도 후퇴했습니다. 많은 재능 있는 과학자들이 강제 이주를 당했고, 그 나라에서 추방되거나 수용소에서 사망했습니다. 1950년대 중반 이후에야 이론의 특정 다원주의가 가능해졌습니다. 이에 대해서는 1.2절에서 자세히 설명합니다.

1.2 20세기 후반 언어학에서의 수학적 방법의 적용

20세기 중반까지 4개의 세계 언어 학파가 형성되었으며, 각각은 특정 "정확한" 방법의 조상으로 밝혀졌습니다. 레닌그라드 음운학교(그 조상은 Baudouin de Courtenay L. V. Shcherba의 학생이었습니다) 음소 형태의 소리를 일반화하는 주요 기준으로 원어민의 말 분석을 기반으로 한 심리 언어 실험을 사용했습니다.

과학자들 프라하 언어 학계, 특히-설립자 N.S. 러시아에서 이주한 Trubetskoy는 반대 이론을 개발했습니다. 언어의 의미 구조는 반대적으로 구성된 의미 단위 집합 인 Sem으로 설명되었습니다. 이 이론은 언어 연구뿐만 아니라 예술 문화 연구에도 적용되었다.

이데올로기 미국식 서술주의언어학자 L. Bloomfield와 E. Sapir였습니다. 언어는 그들의 연구의 주요 대상인 일련의 음성 진술로 서술자들에게 제시되었습니다. 그들의 초점은 텍스트의 과학적 설명(따라서 이름)의 규칙, 즉 구성 요소의 구성, 배열 및 분류에 대한 연구였습니다. 음운론 및 형태론 분야에서 분석 절차의 공식화(다른 수준에서 언어 연구를 위한 원칙 개발, 분배 분석, 직접 구성 요소 방법 등)는 언어 모델링의 일반적인 질문 공식화로 이어졌습니다. 언어의 체계적 측면뿐만 아니라 언어의 내용 계획에 대한 부주의로 인해 기술 주의자들은 언어를 시스템으로 충분히 충분히 해석할 수 없었습니다.

1960년대에 미국의 철학자이자 언어학자인 N. Chomsky의 작업으로 인해 형식 문법 이론이 개발되었습니다. 그는 가장 유명한 현대 과학자 및 공인 중 한 명으로 정당하게 간주되며 많은 기사, 논문 및 장편 다큐멘터리까지 그에게 바쳐집니다. Chomsky가 발명 한 구문 구조를 설명하는 근본적으로 새로운 방법의 이름-생성 (생성) 문법-언어학의 해당 추세를 호출했습니다. 유전주의.

러시아 이민자의 후예인 촘스키는 1945년부터 펜실베이니아 대학교에서 언어학, 수학 및 철학을 공부했으며, 그의 스승인 Zelig Harris의 영향을 많이 받았습니다. 기존 미국 정치 체제에 대한 비판자이자 반세계주의의 영적 지도자 중 한 명으로 알려져 있음).

Chomsky의 첫 번째 주요 과학 작업, 석사 논문 "현대 히브리어의 형태학 » (1951)은 미발표 상태로 남아 있습니다. 촘스키는 1955년에 펜실베이니아 대학교에서 박사 학위를 받았지만 그의 논문(언어 이론의 논리적 구조라는 제목으로 1975년에야 전체가 출판됨)과 그의 첫 논문인 구문 구조(1957, Rus. trans . 1962), 1951-1955년 하버드 대학교에서 공연되었다. 같은 1955년에 과학자는 Massachusetts Institute of Technology로 옮겨 1962년에 교수가 되었습니다.

Chomsky의 이론은 발전 과정에서 여러 단계를 거쳤습니다.

첫 번째 모노그래프 "구문 구조"에서 과학자는 한정된 문법적 수단 집합을 사용하여 무한한 문장 집합을 생성하는 메커니즘으로 언어를 제시했습니다. 언어 속성을 설명하기 위해 그는 깊은(직접 인식에서 숨겨지고 재귀 시스템에 의해 생성된, 즉 반복적으로 적용될 수 있는 규칙) 및 표면(직접 인식된) 문법 구조의 개념과 전환을 설명하는 변형을 제안했습니다. 깊은 구조에서 표면 구조로. 여러 표면 구조는 하나의 깊은 구조에 해당할 수 있습니다(예: 수동 구조 법령은 대통령에 의해 서명활성 구조와 동일한 심층 구조에서 파생됨 대통령은 법령에 서명) 및 그 반대(따라서 모호성 어머니는 딸을 사랑하나는 어머니가 딸을 사랑하는 사람이고 다른 하나는 딸에게 사랑받는 사람입니다.

Chomsky의 표준 이론은 Chomsky의 저서 "Aspects of the Theory of Syntax"에 제시된 "Aspects" 모델로 간주됩니다. 이 모델에서는 처음으로 의미론적 해석의 규칙이 형식 이론에 도입되어 깊은 구조에 의미를 부여했습니다. Aspects에서 언어적 능력은 언어의 사용(수행)에 반대되며, 변환 중 의미 보존에 대한 소위 Katz-Postal 가설이 채택되며, 이와 관련하여 선택적 변환의 개념이 제외되고, 어휘 호환성을 설명하는 구문 기능이 도입되었습니다.

1970년대에 Chomsky는 제어 및 구속 이론(GB 이론 - 단어에서 정부그리고 제본) 이전보다 더 일반적입니다. 그 안에서 과학자는 특정 언어의 구문 구조를 설명하는 특정 규칙을 포기했습니다. 모든 변환이 하나의 범용 이동 변환으로 대체되었습니다. GB 이론의 틀 내에는 개인 모듈도 있으며, 각 모듈은 문법의 자체 부분을 담당합니다.

이미 최근인 1995년에 Chomsky는 인간의 언어를 기계어처럼 기술하는 미니멀리스트 프로그램을 제안했습니다. 이것은 모델이나 이론이 아닌 프로그램일 뿐입니다. 여기에서 Chomsky는 인간 언어 장치의 두 가지 주요 하위 시스템인 어휘집과 컴퓨팅 시스템과 두 가지 인터페이스(음성 및 논리)를 식별합니다.

Chomsky의 형식 문법은 자연 언어뿐만 아니라 인공 언어, 특히 프로그래밍 언어를 설명하는 고전이 되었습니다. 20세기 후반의 구조적 언어학의 발전은 당연히 "촘스키 혁명"으로 간주될 수 있습니다.

모스크바 음운 학교, 그의 대표자는 A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov는 유사한 이론을 사용하여 음성학을 연구했습니다. 점차 "정확한" 방법이 음성학뿐만 아니라 구문에도 적용되기 시작했습니다. 국내외의 언어학자와 수학자 모두 언어의 구조를 연구하기 시작했습니다. 1950년대와 60년대에 기계 번역 시스템의 개발과 관련하여 소련에서 수학과 언어학 간의 상호 작용의 새로운 단계가 시작되었습니다.

우리나라에서 이러한 작업을 시작하게 된 원동력은 미국 기계 번역 분야의 첫 번째 개발이었습니다. 널리 퍼지지 않았습니다). 1947년에 A. Butt와 D. Britten은 컴퓨터를 사용한 단어별 번역 코드를 고안했고, 1년 후 R. Richens는 기계 번역에서 단어를 어간과 어미로 나누는 규칙을 제안했습니다. 그 시절은 오늘날과 사뭇 달랐다. 이들은 방 전체를 차지하는 매우 크고 값비싼 기계였으며 이를 유지하기 위해 많은 엔지니어, 운영자 및 프로그래머가 필요했습니다. 기본적으로이 컴퓨터는 군사 기관의 요구에 대한 수학적 계산을 수행하는 데 사용되었습니다. 수학, 물리학 및 기술의 새로운 기능은 무엇보다도 군사 업무에 사용되었습니다. 초기 단계에서 MP의 개발은이 모든 것 (냉전 상황에서), 미국에서 개발 된 러시아-영어 방향, 소련에서 영-러시아 방향으로 군대에서 적극적으로 지원했습니다.

1954년 1월, 매사추세츠 공과 대학에서 "조지타운 실험"이 열렸습니다. IBM-701 기계에서 러시아어를 영어로 번역하는 최초의 공개 시연이었습니다. D.Yu가 만든 실험의 성공적인 통과에 대한 메시지 요약. Panov는 RJ "Mathematics", 1954, No. 10: "기계를 사용하여 한 언어에서 다른 언어로 번역: 첫 번째 성공적인 테스트에 대한 보고서"에 등장했습니다.

D. Yu. Panov (당시 과학 정보 연구소-INI, 나중에 VINITI 이사)는 나중에 소련 과학 아카데미의 정밀 수학 및 컴퓨터 공학 연구소에서 기계 번역 그룹을 이끌었던 I. K. Belskaya를 유치했습니다. 기계 번역 작업. 1955년 말, BESM 기계의 도움으로 영어를 러시아어로 처음 번역한 경험이 시작되었습니다. BESM 프로그램은 N.P. Trifonov 및 L.N. 그의 박사 논문은 기계 번역을 위한 사전 구성 방법에 전념했습니다.

동시에 기계 번역 작업은 소련 과학 아카데미 수학 연구소 (현재 러시아 과학 아카데미 M.V. Keldysh 응용 수학 연구소)의 응용 수학 부서에서 수행되었습니다. 수학자 A.A. Lyapunov. 그는 O.S. Kulagin과 그녀의 학생들 T.D. Wentzel과 N.N. 리코. 기술을 사용하여 한 언어에서 다른 언어로 번역할 수 있는 가능성에 대한 Lyapunov와 Kulagina의 아이디어는 Nature, 1955, No. 8 저널에 게재되었습니다. 1955년 말부터 T.N. Moloshnaya는 영어-러시아어 번역 알고리즘에 대한 독립적인 작업을 시작했습니다.

당시 스페인어 번역 알고리즘에 참여했던 R. Frumkina는 작업의 이 단계에서 일관된 조치를 취하는 것이 어려웠다고 회상합니다. 훨씬 더 자주 나는 내 자신이나 동료와 같은 휴리스틱 경험을 따라야했습니다.

동시에 1세대 기계 번역 시스템은 매우 불완전했습니다. 그들 모두는 "단어 별", "구문 별"순차 번역 알고리즘을 기반으로했습니다. 단어와 문장 간의 의미 론적 연결은 어떤 식 으로든 고려되지 않았습니다. 예를 들어 문장은 다음과 같습니다. John은 그의 장난감 상자를 찾고 있었습니다.마침내 그는 그것을 찾았습니다. 상자는 펜 안에 있었다.요한은 매우 기뻤습니다.. (John은 그의 장난감 상자를 찾고 있었습니다. 마침내 그는 그것을 찾았습니다. 상자는 놀이울에 있었습니다. John은 매우 행복했습니다.)” 이 문맥에서 "펜"은 "펜"(쓰기 도구)이 아니라 "놀이 틀"( 플레이펜). 동의어, 반의어 및 비유적 의미에 대한 지식은 컴퓨터에 입력하기 어렵습니다. 유망한 방향은 인간 번역가의 사용에 초점을 맞춘 컴퓨터 시스템의 개발이었습니다.

시간이 지남에 따라 직접 번역 시스템은 구문 구조 수준에서 번역이 수행되는 T- 시스템 (영어 단어 "전송"-변환에서 유래)으로 대체되었습니다. T-systems의 알고리즘은 입력 문장의 언어의 문법 규칙에 따라 구문 구조를 구축한 다음(고교에서 외국어를 가르치는 방식과 유사) 출력 문장을 합성할 수 있도록 하는 메커니즘을 사용했습니다. 구문 구조를 변형하고 사전에서 필요한 단어를 대체함으로써.

Lyapunov는 번역된 텍스트의 의미를 추출하여 다른 언어로 제시함으로써 번역에 대해 이야기했습니다. 어의론적 분석을 통해 입력 문장의 의미론적 표상을 획득하고, 획득한 의미 표현에 따라 입력 문장을 합성하는 것을 기반으로 기계 번역 시스템을 구축하는 접근 방식이 여전히 가장 완벽한 것으로 간주됩니다. 이러한 시스템을 I-시스템("인터링구아"라는 단어에서 유래)이라고 합니다. 동시에 정보 처리 분야의 세계 과학자 커뮤니티 인 IFIP 국제 연맹의 노력에도 불구하고 50 년대 후반과 60 년대 초반으로 거슬러 올라가는 작업을 만드는 작업은 지금까지 완전히 해결되지 않았습니다. .

과학자들은 텍스트 작업을 위한 알고리즘을 공식화하고 구축하는 방법, 기계에 어떤 사전을 입력해야 하는지, 기계 번역에 어떤 언어 패턴을 사용해야 하는지에 대해 생각했습니다. 전통적인 언어학에는 의미론뿐만 아니라 구문 측면에서도 그러한 아이디어가 없었습니다. 그 당시에는 언어에 대한 구문 구조 목록이 없었고 호환성 및 상호 교환 가능성에 대한 조건이 연구되지 않았으며 더 작은 구성 요소에서 구문 구조의 큰 단위를 구성하는 규칙이 개발되지 않았습니다.

기계 번역의 이론적 토대를 마련해야 할 필요성은 수학적 언어학의 형성과 발전으로 이어졌습니다. 소련에서이 문제의 주역은 수학자 A.A. Lyapunov, O.S. 쿨라기나, V.A. Uspensky, 언어 학자 V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. 이바노프. Kulagina의 논문은 형식 문법 이론 연구에 전념했으며 (동시에 미국의 N. Khomsky와 함께) Kuznetsov는 F.F. Fortunatov.

1960년 5월 6일, "언어 연구를 위한 구조적 및 수학적 방법의 개발에 관한" 소련 과학 아카데미 상임위원회 법령이 채택되었고, 언어학 연구소 및 연구소에 해당 부서가 만들어졌습니다. 러시아어. 1960 년부터 모스크바 주립 대학교, 레닌 라드, 노보시비르스크 대학교, 모스크바 주립 외국어 연구소의 철학 학부와 같은 미국 최고의 인도주의 대학은 자동 텍스트 처리 분야의 인력 교육을 시작했습니다.

동시에 "고전적"이라고 불리는이 시대의 기계 번역 작업은 실제적인 관심보다 이론적입니다. 비용 효율적인 기계 번역 시스템은 지난 세기의 80년대에만 만들어지기 시작했습니다. 이에 대해서는 2.1절 기계 번역에서 나중에 설명하겠습니다.

1960년대 - 70년대에는 장 이론 및 퍼지 집합 이론과 같은 집합 이론 및 수학적 논리의 방법을 사용한 심층적인 이론적 발전이 포함됩니다.

언어학 분야 이론의 저자는 소비에트 시인, 번역가 및 언어 학자 V.G. Admoni. 그는 처음에 독일어를 기반으로 이론을 발전시켰습니다. Admoni의 경우 "필드" 개념은 비어 있지 않은 임의의 언어 요소 집합을 나타냅니다(예: "어휘 필드", "의미 필드").

필드의 구조는 이질적입니다. 즉, 집합을 정의하는 완전한 기능 집합을 가진 요소가 있는 코어와 주어진 집합의 두 가지 기능을 모두 가질 수 있는 주변부(모두는 아님)로 구성됩니다. 그리고 이웃들. 이 진술을 설명하는 예를 들겠습니다. 예를 들어, 영어에서 합성어 필드("day-dream" - "dream"는 구 필드("tear gas" - "tear gas")와 분리하기 어렵습니다. .

위에서 이미 언급한 퍼지 집합 이론은 필드 이론과 밀접한 관련이 있습니다. 소련에서는 언어학자 V.G. Admoni, I.P. Ivanova, G.G. 그러나 Pochentsov의 조상은 1965년에 "Fuzzy Logic"이라는 기사를 발표한 미국 수학자 L. Zadeh였습니다. 퍼지 세트 이론에 대한 수학적 정당화를 제공하면서 Zade는 언어 자료를 기반으로 고려했습니다.

이 이론에서 우리는 주어진 세트(Aa)에 대한 요소의 소속에 대해 많이 이야기하는 것이 아니라 주변 요소가 어느 정도 여러 필드에 속할 수 있기 때문에 이 구성원(Aa)의 정도에 대해 이야기하고 있습니다. Zade(Lofti-zade)는 아제르바이잔 출신으로 12세 때까지 아제르바이잔어, 러시아어, 영어, 페르시아어의 4개 언어로 의사소통하는 연습을 했으며 키릴 문자, 라틴어, 아랍어의 세 가지 다른 알파벳을 사용했습니다. 과학자가 퍼지 세트 이론과 언어학의 공통점이 무엇인지 물었을 때 그는 이 연관성을 부인하지 않고 다음과 같이 설명합니다. 그렇다면 무의식적으로 만. 젊었을 때 Zadeh는 테헤란의 장로교 학교에서 공부했고 제2차 세계대전 후 미국으로 이주했습니다. "문제는 내가 미국인인지, 러시아인인지, 아제르바이잔인인지 아니면 다른 사람인지가 아닙니다. 저는 이 모든 문화와 민족에 의해 형성되었으며 그들 각각에서 상당히 편안함을 느낍니다."라고 대화 중 하나에서 말했습니다. 이 말에는 모호하지 않은 정의와 예리한 범주에서 벗어난 퍼지 집합 이론을 특징 짓는 것과 유사한 것이 있습니다.

우리나라에서는 70년대에 20세기 서양 언어학자들의 작품이 번역되어 연구되었다. I.A. Melchuk은 N. Chomsky의 작품을 러시아어로 번역했습니다. 에. Slyusareva는 그녀의 저서 "The Theory of F. de Saussure in the Light of Modern Linguistics"에서 Saussure의 가르침의 가정을 70년대 언어학의 실제 문제와 연결합니다. 언어학의 수학화 경향이 있습니다. 국내 유수의 대학은 "수학(이론, 응용) 언어학"이라는 전문 분야의 인력을 양성하고 있습니다. 동시에 서양에서는 점점 더 많은 새로운 언어 기반을 필요로 하는 컴퓨터 기술의 발전에 급격한 도약이 있습니다.

1980년대 과학원 동양학연구소 교수 Yu.K. Lekomtsev는 언어 설명에 사용되는 체계, 표 및 기타 유형의 표기법 분석을 통해 언어학 언어를 분석하는 동안 이러한 목적에 적합한 수학적 시스템(주로 행렬 대수 시스템)을 고려합니다.

그리하여 20세기 내내 정확한 것과 인문학의 융합이 이루어졌다. 수학과 언어학의 상호 작용은 점차 실용적인 응용 프로그램을 찾았습니다. 이에 대해서는 다음 장에서 자세히 설명합니다.

제2장 언어학에서 수학을 사용한 선별된 예

2.1 기계 번역

보편적인 메커니즘의 도움으로 한 언어에서 다른 언어로 번역한다는 아이디어는 이 분야의 첫 번째 개발이 시작되기 몇 세기 전에 나타났습니다. 1649년에 Rene Descartes는 다른 언어는 하나의 기호로 표현됩니다. 1930~40년대에 이 아이디어를 구현하려는 첫 번째 시도, 세기 중반의 이론적 발전의 시작, 1970~80년대 기술의 도움으로 번역 시스템의 개선, 최근 번역 기술의 급속한 발전 10년 - 산업으로서 기계 번역이 발전하는 단계입니다. 과학으로서의 컴퓨터 언어학이 성장한 것은 기계 번역에 관한 작업에서입니다.

70년대 후반과 80년대 초반에 컴퓨터 기술이 발전함에 따라 연구원들은 보다 현실적이고 비용 효율적인 목표를 설정했습니다. 기계는 이전에 가정한 것처럼 경쟁자가 아니라 인간 번역가의 보조자가 되었습니다. 기계 번역은 독점적으로 군사 업무를 수행하지 않습니다 (주로 러시아어와 영어에 초점을 맞춘 모든 소련과 미국의 발명 및 연구는 어떤 식 으로든 냉전에 기여했습니다). 1978년 Arpa 상호연결 네트워크를 통해 자연어 단어가 전송되었고 6년 후 미국에서 최초의 마이크로컴퓨터 번역 프로그램이 등장했습니다.

70년대에 유럽 공동체 위원회는 Systran 컴퓨터 번역기의 영어-프랑스어 버전을 구입하고 프랑스어-영어 및 이탈리아어-영어 버전과 미군이 사용하는 러시아어-영어 번역 시스템도 주문했습니다. 이것이 EUROTRA 프로젝트의 토대를 마련한 방법입니다.

70-80년대 기계 번역의 부활에 대해. 유럽 ​​공동체 위원회(CEC)는 Systran의 영어-프랑스어 버전과 러시아어에서 영어로의 번역 시스템을 구매합니다(후자는 ALPAC 보고서 이후에 개발되었으며 US Air에서 계속 사용됨). 포스 및 NASA); 또한 CEC는 프랑스어-영어 및 이탈리아어-영어 버전의 개발을 명령합니다. 동시에 일본에서는 기계 번역 활동이 빠르게 확장되고 있습니다. 미국에서는 Pan American Health Organization(PAHO)이 스페인어-영어 방향(SPANAM 시스템)의 개발을 명령합니다. 미 공군은 오스틴에 있는 텍사스 대학의 언어 연구 센터에서 기계 번역 시스템 개발에 자금을 지원하고 있습니다. 캐나다의 TAUM 그룹은 METEO(기상 번역) 시스템 개발에서 눈에 띄는 진전을 보이고 있습니다. 70년대와 80년대에 많은 프로젝트가 시작되었습니다. 이후 본격적인 상용 시스템으로 발전했습니다.

1978년에서 1993년 사이에 미국에서 기계 번역 분야 연구에 2천만 달러, 유럽에서 7천만 달러, 일본에서 2억 달러가 사용되었습니다.

새로운 개발 중 하나는 축적 원칙에 따라 작동하는 TM(번역 메모리) 기술입니다. 새로 번역된 텍스트에서 동일하거나 유사한 세그먼트가 발견되면 번역 및 일치율 표시와 함께 표시됩니다. 그런 다음 번역가는 결정(번역 편집, 거부 또는 수락)을 내립니다. 그 결과는 시스템에 저장되므로 동일한 문장을 두 번 번역할 필요가 없습니다. TM 기술을 기반으로 하는 잘 알려진 상용 시스템은 현재 TRADOS 시스템(1984년 설립)에서 개발하고 있습니다.

현재 Systran, IBM, L&H(Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare 등 수십 개의 회사에서 상용 기계 번역 시스템을 개발하고 있습니다. 아타 소프트웨어; Linguistica b.v. 및 기타 이제 웹에서 직접 자동 번역기 서비스를 사용할 수 있습니다: alphaWorks; PROMT의 온라인 번역기, LogoMedia.net, AltaVista의 Babel Fish 번역 서비스, 인피니티닷컴; 인터넷 번역.

우리나라에서도 80년대 후반에 상업적으로 효과적인 번역 시스템이 등장했습니다. 기계 번역의 개념 자체가 확장되었습니다("사람과의 대화에서 전체 번역 주기 또는 개별 작업을 자동 또는 반자동으로 수행하는 여러 자동 및 자동화 시스템 및 장치 생성"을 포함하기 시작함). 이 산업의 발전을 위한 정부 예산이 증가했습니다.

러시아어, 영어, 독일어, 프랑스어 및 일본어가 국내 번역 시스템의 주요 언어가 되었습니다. All-Union Translation Center(VTsP)는 컴퓨터 ES-1035-ANRAP에서 영어와 독일어를 러시아어로 번역하는 시스템을 개발했습니다. 단일 소프트웨어에서 영어와 독일어를 입력하고 러시아어를 출력하는 세 가지 사전으로 구성되었습니다. 컴퓨터 기술, 프로그래밍, 무선 전자, 기계 공학, 농업, 야금에 대한 여러 상호 교환 가능한 전문 사전이 있습니다. 이 시스템은 두 가지 모드로 작동할 수 있습니다. 자동 모드와 대화형 모드로 화면에 소스 텍스트와 문구당 번역이 표시되어 사람이 편집할 수 있습니다. 텍스트를 ANRAP으로 번역하는 속도(타이핑 시작부터 인쇄가 끝날 때까지)는 시간당 약 100페이지였습니다.

1989년에 러시아어, 영어, 독일어 및 일본어로 작업하는 SPRINT 유형의 상업 번역가 제품군이 만들어졌습니다. 그들의 주요 장점은 IBM PC와의 호환성이었습니다. 따라서 국내 기계 번역 시스템은 국제 수준의 품질에 도달했습니다. 동시에 프랑스어에서 러시아어 FRAP로의 기계 번역 시스템이 개발되고 있으며 여기에는 문자 분석, 형태론, 구문론 및 의미론의 4단계 텍스트 분석이 포함됩니다. LGPI에서. Herzen은 4개 언어(영어, 프랑스어, 스페인어, 러시아어) SILOD-MP 시스템(영어-러시아어 및 프랑코-러시아어 사전이 산업 모드에서 사용됨)에 대한 작업을 진행 중이었습니다.

전기 공학에 대한 텍스트의 전문 번역을 위해 ETAP-2 시스템이 존재했습니다. 입력 텍스트 분석은 형태론과 구문의 두 가지 수준에서 수행되었습니다. ETAP-2 사전에는 약 4,000개의 항목이 포함되어 있습니다. 텍스트 변환 단계 - 약 1000개의 규칙(일반 96개, 개인 342개, 나머지는 사전임). 이 모든 것이 만족스러운 변환 품질을 보장했습니다(예를 들어, 특허 "광 위상 격자 배열 및 이러한 배열을 갖는 결합 장치"의 제목은 "광 위상 격자 장치 및 이러한 장치를 갖는 연결 장치"로 번역되었습니다. 동어반복, 의미는 보존됨).

Minsk Pedagogical Institute of Foreign Languages에서는 영어-러시아어 단어 형식 및 구문 사전을 기반으로 제목의 기계 번역 시스템이 발명되었으며, 과학 아카데미 동양 연구 연구소에서 번역 시스템이 발명되었습니다. 일본어에서 러시아어로. 모스크바 자동화 시스템 연구소에서 만든 컴퓨팅 및 프로그래밍을 위한 최초의 자동 어휘 및 용어 서비스(SLOTHERM)는 설명 사전과 언어 연구를 위한 특수 사전에 약 20,000개의 용어를 포함했습니다.

기계 번역 시스템은 의도된 목적뿐만 아니라 자동 학습 시스템의 중요한 구성 요소(번역 교육, 철자 검사 및 문법 지식)로 점차 사용되기 시작했습니다.

90년대에는 PC 시장(데스크탑에서 포켓까지)과 정보 기술의 급속한 발전, 인터넷의 광범위한 사용(점점 더 국제화되고 다국어화되고 있음)이 도입되었습니다. 이 모든 것이 요구되는 자동 번역 시스템의 추가 개발을 만들었습니다. 1990년대 초부터 국내 개발사들도 PC 시스템 시장에 뛰어들고 있다.

1990년 7월 모스크바에서 열린 PC 포럼에서 PROMT(PROgrammer's Machine Translation)라고 불리는 러시아 최초의 상용 기계 번역 시스템이 발표되었습니다. 비공개 주식 회사] "Project MT"로 대체되었으며 이미 1992 년에 PROMT 회사는 MP 시스템 공급을위한 NASA 경쟁에서 우승했습니다 (PROMT는이 경쟁에서 미국이 아닌 유일한 회사였습니다). 영어, 독일어, 프랑스어, 이탈리아어, 스페인어를 러시아어로, 러시아어를 영어로 번역하기 위한 새로운 이름 STYLUS로 전체 시스템 제품군이 개발되었으며, 1993년에는 STYLUS를 기반으로 세계 최초의 Windows용 기계 번역 시스템이 만들어졌습니다. for Windows 3.X/95/NT가 출시되었고 1995-1996년에 3세대 기계 번역 시스템인 Windows 95/NT용 완전 32비트 STYLUS 3.0이 도입되었습니다. 새로운 세계 최초의 러시아어-독일어 및 러시아어-프랑스 기계 번역 시스템.

1997년에는 프랑스 회사인 Softissimo와 프랑스어에서 독일어 및 영어로 또는 그 반대로 번역 시스템을 만드는 계약이 체결되었으며 올해 12월에는 세계 최초의 독일어-프랑스 번역 시스템이 출시되었습니다. 같은 해 PROMT 회사는 인터넷 WebTranSite 작업을 위한 특수 번역기뿐만 아니라 하나의 쉘에서 여러 언어 지침을 지원하는 Gigant 기술을 사용하여 구현된 시스템을 출시했습니다.

1998년에 PROMT 98이라는 새 이름으로 전체 프로그램 집합이 출시되었습니다. 1년 후 PROMT는 인터넷 작업을 위한 고유한 소프트웨어 패키지인 PROMT Internet과 기업 메일 시스템용 번역기인 PROMT Mail의 두 가지 신제품을 출시했습니다. 역자. 1999년 11월 PROMT는 프랑스 잡지 PC Expert가 테스트한 최고의 기계 번역 시스템으로 경쟁사보다 30% 더 뛰어난 성능을 인정받았습니다. 기업 고객을 위한 특수 서버 솔루션인 기업 번역 서버 PROMT Translation Server(PTS) 및 인터넷 솔루션 PROMT Internet Translation Server(PITS)도 개발되었습니다. 2000년에 PROMT는 차세대 MT 시스템인 PROMT Translation Office 2000, PROMT Internet 2000 및 Magic Gooddy 2000을 출시하여 전체 소프트웨어 제품 라인을 업데이트했습니다.

PROMT 시스템의 지원을 받는 온라인 번역은 PROMT의 Online Translator, InfiniT.com, Translate.Ru, Lycos 등 여러 국내외 사이트와 비즈니스 문서 번역을 위한 다양한 프로필 기관에서 사용됩니다. 기사 및 편지(Outlook Express 및 기타 이메일 클라이언트에 직접 내장된 번역 시스템이 있음).

최근에는 인공지능 시스템과 통계적 방법을 기반으로 새로운 기계 번역 기술이 등장하고 있습니다. 후자에 대해 - 다음 섹션에서.

2.2 추가언어 학습의 ical 방법

현대 언어학에서는 양적 수학 방법을 사용하여 언어 현상을 연구하는 데 상당한 관심을 기울입니다. 양적 데이터는 종종 연구 중인 현상, 관련 현상 시스템에서의 위치 및 역할을 더 깊이 이해하는 데 도움이 됩니다. "얼마나"라는 질문에 대한 대답은 "무엇", "어떻게", "왜"라는 질문에 답하는 데 도움이 됩니다. 이것이 정량적 특성의 경험적 잠재력입니다.

통계적 방법은 기계 번역 시스템 개발에 중요한 역할을 합니다(섹션 2.1 참조). 통계적 접근에서 번역 문제는 잡음이 있는 채널의 관점에서 고려됩니다. 영어 문장을 러시아어로 번역해야 한다고 상상해 보세요. 노이즈 채널 원리는 영어와 러시아어 문장의 관계에 대해 다음과 같은 설명을 제공합니다. 영어 문장은 일종의 노이즈로 인해 왜곡된 러시아어 문장에 불과합니다. 원래 러시아어 문장을 복구하려면 사람들이 일반적으로 러시아어로 말하는 내용과 러시아어 구문이 영어로 어떻게 왜곡되는지 알아야 합니다. 번역은 주어진 러시아어 문장이 주어졌을 때 러시아어 문장의 무조건 확률과 영어 문장(원문)의 확률의 곱이 최대가 되는 그런 러시아어 문장을 찾아 번역을 진행한다. Bayes의 정리에 따르면 다음 러시아어 문장이 영어 번역일 가능성이 가장 높습니다.

여기서 e는 번역 문장이고 f는 원래 문장입니다.

따라서 소스 모델과 채널 모델 또는 언어 모델과 번역 모델이 필요합니다. 언어 모델은 대상 언어(이 경우 러시아어)의 모든 문장에 확률 점수를 할당하고 번역 모델은 원래 문장에 할당해야 합니다. (표 1 참조)

일반적으로 기계 번역 시스템은 두 가지 모드로 작동합니다.

1. 시스템 훈련: 병렬 텍스트의 훈련 코퍼스를 취하고 선형 프로그래밍을 사용하여 그에 따라 사용 가능한 영어로 코퍼스의 러시아어 부분의 확률을 최대화하는 번역 대응 테이블의 값을 검색합니다. 선택한 번역 모델에. 러시아어 모델은 동일한 말뭉치의 러시아어 부분에 구축됩니다.

2. 착취: 생소한 영어 문장에 대해 얻은 데이터를 기반으로 언어 모델과 번역 모델이 할당한 확률의 곱을 최대화하는 러시아어를 검색합니다. 이러한 검색에 사용되는 프로그램을 디코더라고 합니다.

가장 간단한 통계 번역 모델은 리터럴 번역 모델입니다. 이 모델은 문장을 한 언어에서 다른 언어로 번역하기 위해 모든 단어를 번역하는 것으로 충분하며("단어 모음" 생성) 모델이 올바른 순서로 단어 배치를 제공할 것이라고 가정합니다. P( a, f | e)에서 P(a | e , f)로, 즉 한 쌍의 문장이 주어진 정렬의 확률, 각 확률 P(a, f | e)는 주어진 문장 쌍의 모든 정렬 확률의 합으로 정규화됩니다.

모델 #1을 교육하는 데 사용되는 Viterbi 알고리즘의 구현은 다음과 같습니다.

1. 번역 대응 확률의 전체 테이블이 동일한 값으로 채워집니다.

2. 단어 쌍 연결의 가능한 모든 변형에 대해 확률 P(a, f | e)가 계산됩니다.

3. P(a, f | e)의 값을 정규화하여 P(a | e, f)의 값을 얻습니다.

4. 각 변환 쌍의 빈도가 계산되고 각 정렬 옵션의 확률로 가중치가 적용됩니다.

5. 결과 가중 빈도가 정규화되고 새로운 변환 대응 확률 테이블을 형성합니다.

6. 알고리즘은 2단계부터 반복됩니다.

예를 들어, 두 쌍의 문장으로 구성된 말뭉치에 대한 유사한 모델의 훈련을 고려하십시오(그림 2).

백악관

많은 수의 반복 후에 번역이 높은 정확도로 수행되었음을 보여주는 표(표 2)를 얻게 됩니다.

또한 통계적 방법은 어휘, 형태, 구문 및 스타일 연구에 널리 사용됩니다. Perm State University의 과학자들은 틀에 박힌 문구가 텍스트의 중요한 "건축 자재"라는 주장에 근거하여 연구를 수행했습니다. 이러한 구문은 "핵" 반복 단어와 종속 단어 지정자로 구성되며 뚜렷한 문체 색상이 있습니다.

과학적 스타일에서 "핵"단어는 다음과 같이 불릴 수 있습니다. 연구, 연구, 태스크, 문제, 문제, 현상, 사실, 관측, 분석기타 저널리즘에서 다른 단어는 "핵"이 될 것이며 특히 신문 텍스트의 가치가 높아집니다. 시간, 사람, 힘, 사업, 행동, 법, 생명, 역사, 장소등. (총 29개)

언어 학자들에게 특히 흥미로운 것은 직업 유형에 따라 국어의 전문적 차별화, 어휘 및 문법 사용의 독창성입니다. 전문 연설의 운전자는 sh 형식을 사용하는 것으로 알려져 있습니다. 영형 Fer, 의료진은 k라고 말합니다. 영형 칵테일 대신 클럽 sh - 그러한 예가 주어질 수 있습니다. 통계의 임무는 발음의 변동성과 언어 규범의 변화를 추적하는 것입니다.

전문적인 차이는 문법적 차이뿐만 아니라 어휘적 차이로 이어집니다. 이름을 딴 야쿠트 주립 대학 MK Ammosov는 50개의 설문지를 의사와 건축업자 사이에서 특정 단어에 대한 가장 일반적인 반응으로 분석했습니다(표 3).

빌더

인간

환자(10), 성격(5)

남자 (5)

좋은

도움말(8), 도움말(7)

악 (16)

죽음 (10)

사랑스러운 (5)

죽음

시체 (8)

생활 (6)

열(8), 화상(6)

불 (7)

손가락

손(14), 파나리티움(5)

대(7), 인덱스(6)

시력(6), 동공, 안과의(각 5)

브라운(10), 라지(6)

머리

마음(14), 두뇌(5)

빅(9), 스마트(8), 스마트(6)

잃다

의식, 생명(각각 4개)

돈 (5), 찾기 (4)

설문지에 주어진 단어 자극이 건축업자의 직업보다 직업과 더 관련이 있기 때문에 건축업자보다 의사가 직업 활동과 관련된 연상을 더 자주 제공한다는 점에 유의할 수 있습니다.

언어의 통계적 규칙성은 작가의 언어, 작업 등 모든 언어의 단어(단어 형식, 구문) 빈도의 수치적 특성을 제공하는 빈도 사전을 만드는 데 사용됩니다. 단어는 특정 볼륨의 텍스트에서 사용의 특성으로 사용됩니다.

음성 인식 모델은 필수 구성 요소인 사전 없이는 불가능합니다. 음성 인식에서 기본 조작 단위는 단어입니다. 이로부터 특히 인식된 텍스트의 각 단어는 청자(또는 독자)의 내부 어휘의 해당 단위와 동일시되어야 합니다. 처음부터 검색이 사전의 일부 하위 도메인으로 제한된다고 가정하는 것은 당연합니다. 대부분의 현대 음성 인식 이론에 따르면, 일반적인 경우에 소리 나는 텍스트의 실제 음성학적 분석은 단어의 가능한 음운적 모양에 대한 일부 정보만을 제공하며, 이러한 종류의 정보는 하나가 아니라 특정 MANY 단어에 해당합니다. 사전의; 따라서 두 가지 문제가 발생합니다.

(a) 특정 매개변수에 따라 적절한 세트를 선택합니다.

(b) 인식된 텍스트의 주어진 단어에 가장 잘 일치하는 유일한 단어를 제외한 모든 단어를 "제거"하기 위해 윤곽선 집합의 경계 내에서(적절하게 할당된 경우). "드롭아웃" 전략 중 하나는 빈도가 낮은 단어를 제외하는 것입니다. 따라서 음성 인식을 위한 어휘는 주파수 사전입니다. 제시된 프로젝트의 초기 작업은 러시아어 빈도 사전의 컴퓨터 버전을 만드는 것입니다.

러시아어 자료를 기반으로 5개의 빈도 사전이 있습니다(분기 사전 제외). 기존 사전의 몇 가지 일반적인 단점만 살펴보겠습니다.

알려진 모든 러시아어 빈도 사전은 기록된(인쇄된) 텍스트의 처리 배열을 기반으로 합니다. 부분적으로 이러한 이유로 단어의 정체성이 주로 형식적이고 시각적인 일치에 기반할 때 의미론이 충분히 고려되지 않습니다. 결과적으로 주파수 특성도 편이되고 왜곡됩니다. 예를 들어, 빈도 사전의 컴파일러가 "친구"라는 단어 사용에 대한 일반 통계에서 "서로"라는 조합의 단어를 포함하는 경우 이는 거의 정당화되지 않습니다. 다른 단어, 또는 오히려 독립된 사전 단위는 전체로서의 조합일 뿐입니다.

또한 기존의 모든 사전에서 단어는 단수형 명사, 명사격, 부정사형 동사 등 기본형으로만 배치됩니다. 일부 사전은 단어 형태의 빈도에 대한 정보를 제공하지만 일반적으로 철저하지 않고 일관되게 제공하지 않습니다. 동일한 단어의 다른 단어 형태의 빈도는 분명히 일치하지 않습니다. 음성 인식 모델의 개발자는 실제 인식 프로세스에서 인식 대상이 되는 텍스트에 "몰입된" 특정 단어 형식이라는 점을 고려해야 합니다. 단어 형태는 시작이 동일한 단어 집합이 형성되며 단어 형태의 초기 섹션이 사전 형식의 초기 섹션과 반드시 ​​동일하지는 않습니다. 특정 리듬 구조를 갖는 것은 단어 형식이며 단어의 지각 선택을 위한 매우 중요한 매개변수이기도 합니다. 마지막으로 인식된 발화의 최종 표현에서 단어는 해당 단어 형식으로 표현됩니다.

음성 인식 과정에서 주파수의 중요성을 보여주는 많은 작품들이 있습니다. 그러나 우리는 단어 형식의 빈도가 사용되는 작업을 인식하지 못합니다. 반대로 모든 저자는 개별 단어 형식의 빈도를 거의 무시하고 독점적으로 어휘소를 참조합니다. 그들에 의해 얻은 결과가 인공물로 간주되지 않는 경우 원어민이 단어 형식과 사전 형식의 빈도 비율, 즉 실제로 어휘소에 대한 정보에 어떻게든 접근할 수 있다고 가정해야 합니다. 또한 단어 형식에서 어휘소로의 이러한 전환은 물론 해당 패러다임에 대한 자연 지식으로 설명 할 수 없습니다. 단어를 최종 식별하기 전에 빈도 정보를 사용해야하기 때문입니다. 그렇지 않으면 단순히 의미를 잃습니다.

1차 통계적 특성에 따르면 텍스트의 종류와 관계없이 발생빈도가 높은 단어가 포함된 사전의 부분을 주어진 상대오차로 판단할 수 있다. 또한 사전에 단계별 정렬을 도입하여 처음 100개, 1000개, 5000개 등 자주 사용되는 단어를 포함하는 일련의 사전을 얻을 수 있습니다. 사전의 통계적 특성은 어휘의 의미론적 분석과 관련하여 관심을 갖는다. 주제-이데올로기 그룹 및 의미 필드에 대한 연구는 어휘 연관성이 가장 일반적인 의미를 가진 어휘 주위에 집중된 의미 링크에 의해 지원됨을 보여줍니다. 어휘 의미론적 필드 내의 의미에 대한 설명은 의미에서 가장 추상적인 어휘소를 가진 단어를 식별함으로써 수행될 수 있습니다. 분명히 "빈"(주격 능력의 관점에서) 사전 단위는 통계적으로 동질적인 계층을 구성합니다.

개별 장르에 대한 어휘는 그다지 가치가 없습니다. 유사성 측정과 통계적 분포의 특성을 연구하면 언어 사용 영역에 따라 어휘의 질적 계층화에 대한 흥미로운 정보를 얻을 수 있습니다.

빈도가 높은 사전을 편찬하려면 컴퓨터 기술을 사용해야 합니다. 사전 작업 과정에 부분 기계화 및 자동화를 도입하는 것은 서로 다른 텍스트에 대한 사전의 기계 처리 실험으로서 흥미가 있습니다. 이러한 사전은 어휘 자료를 처리하고 축적하기 위해 보다 엄격한 시스템을 필요로 합니다. 미니어처로 이것은 텍스트와 어휘의 다양한 측면에 대한 정보를 제공할 수 있는 정보 검색 시스템입니다. 이 시스템에 대한 몇 가지 기본 요청은 처음부터 계획되어 있습니다: 인벤토리 단어의 총 수, 단일 단어 및 전체 사전의 통계적 특성, 사전의 빈도 및 희귀 영역 순서 지정 등. 기계 카드 파일을 사용하면 다음을 수행할 수 있습니다. 개별 장르 및 소스에 대한 역 사전을 자동으로 구축합니다. 언어에 대한 다른 많은 유용한 통계 정보는 축적된 정보 배열에서 추출됩니다. 컴퓨터 주파수 사전은 보다 광범위한 어휘 작업 자동화로의 전환을 위한 실험적 기반을 만듭니다.

빈도 사전의 통계 데이터는 다른 언어 문제를 해결하는 데 널리 사용될 수 있습니다. 예를 들어 현대 러시아어의 단어 형성의 활성 수단을 분석 및 결정하고 어휘에 대한 통계적 정보를 고려한다(이 모든 것에서 자소 조합의 확률적 특성, 단어로 실현되는 문자 조합의 유형을 고려하는 것이 중요하다), 실제 필사 및 음역. 사전의 통계적 매개변수는 리터럴 텍스트의 타이핑 자동화, 인식 및 자동 읽기 문제를 해결하는 데에도 유용합니다.

러시아어의 현대 설명 사전과 문법은 주로 문학 및 예술 텍스트를 기반으로 구축됩니다. A.S. 언어의 빈도 사전이 있습니다. 푸쉬킨, A.S. 그리보예도바, F.M. Dostoevsky, V.V. Vysotsky 및 기타 많은 저자. Smolensk State의 역사 및 문학 이론과에서. Pedagogical University는 시적 및 산문 텍스트의 빈도 사전을 편집하기 위해 수년 동안 노력해 왔습니다. 이 연구를 위해 푸쉬킨의 모든 가사와 황금 시대의 시인 두 명, 즉 그리보예도프의 "Woe from Wit"와 레르몬토프의 모든 시의 빈도 사전이 선택되었습니다. 파스테르나크와 실버 에이지의 다섯 명의 다른 시인 - Balmont 1894-1903, Blok의 "아름다운 여인에 관한 시", Mandelstam의 "Stone", Gumilyov의 "Pillar of Fire", Akhmatova의 "Anno Domini MCMXXI" 및 "Sisters of Pasternak의 My Life"와 철기 시대의 시인 4명 - "Yuri Zhivago의 시", "맑아질 때", M. Petrovs의 전체 가사 "The road is far away", "Windshield", Mezhirov의 "Farewell to the snow"와 "Horseshoes", Voznesensky의 "Antimirov", "Snezhnitsa » Rylenkova".

이 사전은 본질적으로 다르다는 점에 유의해야합니다. 일부는 하나의 극적인 작품의 어휘를 나타내고 다른 일부는 가사 책, 여러 책 또는 시인시의 전체 모음을 나타냅니다. 이 백서에 제시된 분석 결과는 주의를 기울여야 하며 절대적인 것으로 간주할 수 없습니다. 동시에 특별한 조치를 통해 텍스트의 존재론적 특성의 차이를 어느 정도 줄일 수 있습니다.

최근 몇 년 동안 구어체와 책 연설 사이의 반대가 점점 더 분명해졌습니다. 이 문제는 구어를 향한 교육의 전환을 요구하는 방법론자들 사이에서 특히 날카롭게 논의됩니다. 동시에 구어체 연설의 특수성은 여전히 ​​설명되지 않은 채로 남아 있습니다.

사전은 EXCEL97 오피스 프로그램 환경에서 사용자 어플리케이션을 생성하여 처리하였다. 이 응용 프로그램에는 "제목 시트", 초기 데이터가 포함된 "사전" 시트, 결과가 포함된 "근접성" 및 "거리", 매크로 세트 등 4개의 EXCEL 책 워크시트가 포함되어 있습니다.

초기 정보는 "사전" 시트에 입력됩니다. 학습된 텍스트의 사전은 EXCEL 셀에 기록되며 마지막 열 S는 얻은 결과로 구성되며 다른 사전에서 찾은 단어 수와 같습니다. "근접성" 및 "거리" 표에는 근접성 M, 상관 관계 R 및 거리 D의 계산된 측정값이 포함됩니다.

응용 프로그램 매크로는 VBA(Visual Basic for Application)로 작성된 이벤트 기반 프로그래밍 절차입니다. 절차는 VBA 라이브러리 개체 및 해당 처리 방법을 기반으로 합니다. 따라서 응용 프로그램의 워크시트를 사용한 작업의 경우 핵심 개체인 워크시트(워크시트)와 해당 시트 활성화 방법(활성화)이 사용됩니다. 분석된 소스 데이터의 범위를 Dictionary 시트에 설정하는 것은 Range 객체(range)의 Select 메소드에 의해 이루어지며, 단어를 변수에 값으로 전달하는 것은 동일한 Range의 Value 속성(value)으로 이루어진다. 물체.

순위 상관 분석이 서로 다른 텍스트 간의 주제 종속성에 대해 주의를 기울이게 만든다는 사실에도 불구하고 각 텍스트에서 가장 빈번한 단어의 대부분은 하나 이상의 다른 텍스트에서 일치합니다. S열은 각 저자에 대해 가장 빈번한 15개 단어 중 해당 단어의 수를 보여줍니다. 굵은 글씨체로 된 단어는 우리 표에 있는 한 시인의 단어에만 나타납니다. Blok, Akhmatova 및 Petrovs에는 강조 표시된 단어가 전혀 없으며 S = 15입니다. 이 세 명의 시인은 가장 자주 사용되는 15개의 단어가 동일하며 목록의 위치만 다릅니다. 하지만 어휘가 가장 독창적인 푸쉬킨도 S=8이고 강조 표시된 단어가 7개 있습니다.

결과는 시의 주요 주제를 집중시키는 특정 어휘 계층이 있음을 보여줍니다. 일반적으로 이러한 단어는 짧습니다: 1음절 88, 2음절 127, 3음절 10의 총 단어 사용 수(225) 중. 종종 이러한 단어는 주요 신화를 나타내며 쌍으로 떨어질 수 있습니다. 밤-낮, 땅-하늘(태양), 신-인간(사람), 삶-죽음, 몸-영혼, 로마-세계(만델스탐에서); 더 높은 수준의 신화로 결합될 수 있습니다. 하늘, 별, 태양, 지구; 사람은 원칙적으로 몸, 심장, 피, 팔, 다리, 뺨, 눈이 두드러집니다.. 인간 상태 중에서 수면과 사랑이 선호됩니다. 집과 도시는 모스크바, 로마, 파리와 같은 인간 세계에 속합니다. 창의성은 어휘소로 표현된다 단어그리고 노래.

Griboedov와 Lermontov는 가장 빈번한 단어 중 자연을 나타내는 단어가 거의 없습니다. 그들은 사람, 몸의 일부, 영적 세계의 요소를 나타내는 단어가 세 배나 많습니다. 푸쉬킨과 20세기 시인. 인간과 자연의 명칭은 거의 동일합니다. 주제의 이 중요한 측면에서 우리는 20세기라고 말할 수 있습니다. 푸쉬킨을 따랐다.

최소 테마 사례가장 빈번한 단어 중 Griboyedov와 Pushkin에서만 발견됩니다. 레르몬토프와 20세기 시인. 그것은 최소한의 주제로 나아갑니다. 단어. 그 단어는 행위를 배제하지 않습니다(주제에 대한 성경적 해석: 신약에서 예수 그리스도의 모든 가르침은 하나님의 말씀 또는 예수의 말씀으로 간주되며 사도들은 때때로 스스로를 말씀의 사역자라고 부릅니다). 어휘소 단어의 신성한 의미는 예를 들어 Pasternak의 구절 "그리고 말씀에 드러난 세상의 이미지"에서 설득력있게 나타납니다. 어휘소의 신성한 의미 단어인간사와 관련하여 그리고 대조적으로 Gumilyov의 같은 이름의시에서 설득력있게 나타납니다.

하나의 텍스트에서만 발견되는 토큰은 주어진 책 또는 책 모음의 독창성을 나타냅니다. 예를 들어 "mind"라는 단어는 Griboedov의 코미디 "Woe from Wit"에서 가장 자주 사용되지만 다른 텍스트의 빈도 단어에서는 발생하지 않습니다. 마음의 주제는 희극에서 단연코 가장 중요한 주제입니다. 이 어휘소는 Chatsky의 이미지를 수반하며 Chatsky라는 이름은 코미디에서 가장 자주 사용됩니다. 따라서 작품은 가장 빈번한 보통명사와 가장 빈번한 고유명사를 유기적으로 조합한다.

가장 높은 상관 계수는 Gumilyov의 비극적 책 "The Pillar of Fire"와 Akhmatova의 "Anno Domini MCMXXI"의 주제를 연결합니다. 가장 많이 사용되는 명사 15개 중 피, 마음, 영혼, 사랑, 말, 하늘 등 10개의 공통 명사가 있습니다. Akhmatova의 책에는 Gumilyov의 체포와 그의 처형 사이에 쓰여진 미니어처 "당신은 살아 있지 않을 것입니다 ..."가 포함되어 있음을 기억하십시오.

연구 자료의 촛불과 군중의 주제는 "유리 지바고의시"에서만 발견됩니다. 소설 구절에서 촛불의 주제는 많은 맥락 적 의미를 가지고 있습니다. 그것은 신앙, 불멸, 창의성, 데이트라는 주제와 함께 예수 그리스도의 이미지와 관련이 있습니다. 촛불은 소설의 중심 장면에서 가장 중요한 빛의 원천이다. 군중의 주제는 흔들리지 않는 가치를 가진 사람의 사생활이 군중을 기쁘게하는 원칙에 기반한 새로운 국가의 부도덕에 반대하는 소설의 주요 아이디어와 관련하여 발전합니다. .

이 작업에는 프로그램에도 반영된 세 번째 단계도 포함됩니다. 이것은 두 사전에 공통된 단어의 서수 차이와 두 사전의 동일한 단어 간의 평균 거리를 계산하는 것입니다. 이 단계에서는 통계의 도움으로 식별된 사전 상호 작용의 일반적인 추세에서 텍스트에 접근하는 수준으로 이동할 수 있습니다. 예를 들어, Gumilyov와 Akhmatova의 책은 통계적으로 유의미한 상관 관계가 있습니다. 사전에서 어떤 단어가 공통적으로 사용되는지 살펴보고 우선 일련 번호가 최소로 다르거나 0인 단어를 선택합니다. 순위 번호가 같은 것은 이 단어들이며, 결과적으로 똑같이 중요한 것은 두 시인의 마음 속에 있는 이러한 최소한의 주제입니다. 다음으로 텍스트 및 컨텍스트 수준으로 이동해야 합니다.

정량적 방법은 또한 원어민인 사람들의 특성을 연구하는 데 도움이 됩니다. 러시아어에는 6 건이 있고 영어에는 사례가 없으며 Dagestan 사람들의 일부 언어에서는 사례 수가 40에 이릅니다. L. Perlovsky는 그의 기사 "의식, 언어 및 문화"에서 이들을 연관시킵니다. 사물과 현상을 개별적으로 또는 다른 사람과 관련하여 인식하는 개인주의 또는 집단주의에 대한 사람들의 경향이있는 특성. 결국 개인의 자유, 자유주의, 민주주의와 같은 개념이 등장한 것은 영어권 세계 (사례가 없습니다. "자체적으로"인식됨)였습니다. 평가 특성이 없는 언어). 그러한 추측은 여전히 ​​대담한 과학적 가설 수준에만 남아 있다는 사실에도 불구하고 이미 익숙한 현상을 새로운 방식으로 보는 데 도움이됩니다.

보시다시피 양적 특성은 언어학의 완전히 다른 영역에 적용될 수 있으며 "정확한" 방법과 "인도주의적인" 방법 사이의 경계가 점차 모호해집니다. 언어학은 문제를 해결하기 위해 수학뿐만 아니라 컴퓨터 기술의 도움에 점점 더 의존하고 있습니다.

2.3 학습Ⅰ형식 논리의 방법에 의한 언어

비정량적 수학 방법, 특히 논리와 함께 현대 이론 언어학은 정량적 방법보다 덜 유익하게 상호 작용합니다. 컴퓨터 기술의 급속한 발전과 현대 세계에서의 역할의 성장은 일반적으로 언어와 논리의 상호 작용에 대한 접근 방식의 수정을 요구했습니다.

논리의 방법은 공식화 된 언어, 특히 프로그래밍 언어의 개발에 널리 사용되며, 그 요소는 일부 기호 (수학적 유사), 선택 (또는 이전에 선택된 기호로 구성) 및 특정 방식으로 해석되며, "전통적인" 사용, 이해 및 이해 없이 다른 문맥에서 동일한 기호의 기능. 프로그래머는 자신의 작업에서 끊임없이 논리를 다룹니다. 프로그래밍의 의미는 컴퓨터에게 (가장 넓은 의미에서) 추론하도록 가르치는 것입니다. 동시에 "추론"의 방법은 매우 다른 것으로 밝혀졌습니다. 모든 프로그래머는 자신과 다른 사람의 프로그램에서 버그를 찾는 데 일정 시간을 소비합니다. 즉, 논리에서 추론의 오류를 검색합니다. 그리고 이것은 또한 흔적을 남깁니다. 일반 음성에서 논리적 오류를 감지하는 것이 훨씬 쉽습니다. 논리학자가 연구하는 언어의 상대적 단순성은 복잡한 자연어만을 분석하는 언어학자가 달성할 수 있는 것보다 더 명확하게 이러한 언어의 구조를 설명할 수 있게 합니다. 논리학자가 연구하는 언어가 자연어에서 복사한 관계를 사용한다는 점에서 논리학자는 언어 일반 이론에 상당한 기여를 할 수 있습니다. 여기의 상황은 물리학에서 발생하는 상황과 유사합니다. 물리학자는 또한 자연에서 전혀 발생하지 않는 이상적으로 단순화된 경우에 대한 정리를 공식화합니다. 그는 이상 기체, 이상 액체에 대한 법칙을 공식화하고 마찰이 없을 때 운동에 대해 이야기합니다. 등. 이러한 이상화된 사례의 경우, 현실에서 일어나는 일과 모든 복잡성에서 현실을 직접 고려하려고 시도할 경우 물리학에 알려지지 않은 상태로 남을 수 있는 일을 이해하는 데 크게 기여할 간단한 법칙을 설정할 수 있습니다.

자연어 연구에서는 언어 학습자가 가능한 한 많은 단어를 어리석게 "암기"하지 않고 그 구조를 더 잘 이해할 수 있도록 논리적 방법이 사용됩니다. L. Shcherba는 또한 강의에서 러시아어 법에 따라 작성된 문장의 예를 사용했습니다. "반짝이는 kuzdra shteko는 bokra를 boked하고 bokra를 말립니다." 문장에서 단어의 의미가 불분명하다는 사실에도 불구하고 (그들은 단순히 러시아어로 존재하지 않음) 명확하게 대답 할 수있었습니다. bokr' 애니메이션 등 이 문구의 번역은 다음과 같은 것으로 밝혀졌습니다. 전적으로 언어의 법칙에 따라 구축된 존재하지 않는 단어의 텍스트(예술적)의 유사한 예는 Lewis Carroll의 Jabberwock입니다(이상한 나라의 앨리스에서 Carroll은 그의 캐릭터 Humpty Dumpty를 통해 그가 단어의 의미를 설명합니다. 발명 : "요리"-저녁 8시, 저녁 식사를 요리 할 때 "chlivky"-약하고 손재주, "shorek"-흰 족제비, 오소리 및 타래 송곳 사이의 십자가, "다이빙"- 점프, 잠수, 회전, "나바" - 해시계 아래의 풀(오른쪽으로 약간, 왼쪽으로 약간, 뒤로 약간 확장됨), "그런트" - 끙끙거리고 웃으며, "젤류크" - 녹색 칠면조, "myumzik"-새; 그녀의 깃털은 흐트러지고 빗자루처럼 모든 방향으로 튀어 나와 있습니다. "mova"-집에서 멀리 떨어져 있습니다) .

현대 논리 및 이론적 언어학의 주요 개념 중 하나는 다양한 논리 및 수학 미적분학, 자연어 연구에 사용되어 서로 다른 "수준"의 언어 간의 관계를 설명하고 고려중인 언어와 도움으로 설명되는 주제 영역은 메타 언어의 개념입니다. 메타 언어는 언어 대상인 다른 언어에 대한 판단을 표현하는 데 사용되는 언어입니다. 메타 언어의 도움으로 언어 대상의 문자 조합(표현) 구조를 연구하고 표현 속성, 다른 언어와의 관계 등에 대한 정리를 증명합니다. 연구 중인 언어는 주제 언어라고도 합니다. 이 메타 언어와 관련이 있습니다. 주제 언어와 메타 언어는 모두 일반(자연) 언어가 될 수 있습니다. 메타언어는 목적어와 다를 수 있지만(예를 들어 러시아인을 위한 영어 교과서에서는 러시아어가 메타언어이고 영어가 목적어임), 예를 들어 특수 용어와 같이 부분적으로만 다를 수도 있습니다. (러시아어 언어용어는 러시아어를 기술하기 위한 메타언어의 한 요소이며, 소위 의미적 요소는 자연어의 의미를 기술하기 위한 메타언어의 일부이다.)

"메탈 언어"의 개념은 수학적 논리의 틀 안에 구축된 형식화된 언어 연구와 관련하여 매우 유익해졌습니다. 형식화된 주제어와 달리, 이 경우 메타언어는 메타이론이 공식화되는 수단(주제 언어로 공식화된 주제 이론의 속성을 연구함)은 일반적으로 일반적인 자연어이며, 어떤 특별한 방식으로 어떤 종류의 모호함도 포함하지 않는 특수한 방식으로 제한된 자연 언어의 단편 , 은유, "형이상학적" 개념 등 정확한 과학적 연구를 위한 도구로 사용하는 것을 방해하는 일상 언어의 요소. 동시에 메타언어 자체가 형식화될 수 있고 (이와 상관없이) 메타메타언어를 통해 수행되는 연구의 대상이 될 수 있으며, 그러한 시리즈는 무한히 성장하는 것으로 "생각"될 수 있다.

논리는 우리에게 언어 대상과 메타 언어 사이의 유익한 구별을 가르쳐줍니다. 언어-대상은 바로 논리적 연구의 대상이며, 메타언어는 그러한 연구가 수행되는 필연적으로 인공적인 언어이다. 논리적 사고는 실제 언어(객체 언어)의 관계와 구조를 기호의 언어(메타언어)로 공식화하는 것일 뿐입니다.

메타 언어는 어떤 경우에도 객관적 언어보다 "나쁘지 않아야" 합니다(즉, 메타 언어에서 후자의 각 표현에는 "번역"이라는 이름이 있어야 합니다). 그렇지 않으면 이러한 요구 사항이 충족되지 않으면(확실히 특별 계약이 달리 제공하지 않는 경우 자연 언어로 배치) 의미 론적 역설(이율배반)이 발생합니다.

점점 더 많은 새로운 프로그래밍 언어가 만들어지면서 프로그래밍 번역가의 문제와 관련하여 메타 언어를 만드는 것이 시급했습니다. 현재 Backus-Naur 형식의 메타언어(약칭 BNF)는 프로그래밍 언어의 구문을 설명하는 데 가장 일반적으로 사용됩니다. 수학적 공식과 유사한 일부 공식 형태의 압축 형식입니다. 언어의 각 개념에 대해 고유한 메타 수식(정상 수식)이 있습니다. 왼쪽과 오른쪽 부분으로 구성되어 있습니다. 왼쪽은 정의되는 개념을 지정하고 오른쪽은 이 개념으로 결합되는 허용 가능한 언어 구조 집합을 지정합니다. 수식은 꺾쇠 괄호 형태의 특수 메타문자를 사용하는데, 여기에는 정의 중인 개념(수식의 왼쪽) 또는 이전에 정의한 개념(오른쪽)이 포함되며 왼쪽과 오른쪽 부분의 구분이 표시됩니다. "::=" 메타 문자로, 그 의미는 "정의에 따라 존재합니다"라는 단어와 동일합니다. Metalinguistic 공식은 어떤 형태로든 번역기에 내장되어 있습니다. 이들의 도움으로 프로그래머가 사용하는 구성이 이 언어에서 구문적으로 유효한 구성과 형식적으로 일치하는지 확인합니다. 다양한 과학의 별도의 메타 언어도 있으므로 지식은 다양한 메타 언어의 형태로 존재합니다.

논리적 방법은 또한 연결주의 개념을 기반으로 한 인공 지능 시스템 생성의 기반이 되었습니다. 연결주의는 지식에 대한 질문을 주제로 하는 철학 과학의 특별한 경향입니다. 이러한 경향의 틀 안에서 인공신경망을 이용하여 사람의 지적 능력을 설명하려는 시도가 이루어지고 있다. 뉴런과 유사한 많은 수의 구조 단위로 구성되고 다른 요소와의 연결 강도를 결정하는 각 요소에 가중치가 할당된 신경망은 인간 뇌의 단순화된 모델입니다. 이러한 종류의 신경망을 사용한 실험은 패턴 인식, 읽기 및 간단한 문법 구조 식별과 같은 작업을 수행하는 방법을 학습하는 능력을 입증했습니다.

철학자들은 연결주의에 관심을 갖기 시작했는데, 이는 연결주의 접근이 마음의 고전적 이론과 마음의 작용이 디지털 장치에 의한 상징적 언어의 처리와 유사하다는 이 이론 내에서 널리 받아들여지는 생각에 대한 대안을 제공할 것을 약속했기 때문입니다. 컴퓨터. 이 개념은 매우 논란의 여지가 있지만 최근 몇 년 동안 점점 더 많은 지지자를 찾았습니다.

언어에 대한 논리적 연구는 시스템으로서의 언어에 대한 소쉬르의 개념을 이어갑니다. 그것이 끊임없이 계속되고 있다는 사실은 지난 세기 초 과학적 추측의 대담성을 다시 한 번 확인시켜줍니다. 나는 오늘날 언어학에서 수학적 방법의 발전에 대한 전망에 내 연구의 마지막 부분을 바칠 것입니다.

2.4 언어학에서 수학적 방법의 적용에 대한 전망

컴퓨터 기술 시대에 수학적 언어학의 방법은 새로운 발전 관점을 받았습니다. 언어 분석 문제에 대한 솔루션 검색은 이제 점점 더 정보 시스템 수준에서 구현되고 있습니다. 동시에 언어 자료 처리 프로세스의 자동화는 연구원에게 상당한 기회와 이점을 제공하며 필연적으로 그에게 새로운 요구 사항과 작업을 제시합니다.

"정확한" 지식과 "인도주의적인" 지식의 조합은 언어학, 컴퓨터 과학 및 철학 분야에서 새로운 발견을 위한 비옥한 토양이 되었습니다.

한 언어에서 다른 언어로의 기계 번역은 빠르게 성장하는 정보 기술 분야로 남아 있습니다. 컴퓨터 지원 번역은 품질 면에서 사람의 번역(특히 문학 텍스트의 경우)과 결코 비교할 수 없다는 사실에도 불구하고 대량의 텍스트를 번역할 때 기계는 사람에게 없어서는 안 될 도우미가 되었습니다. 가까운 장래에 주로 텍스트의 의미론적 분석을 기반으로 하는 보다 발전된 번역 시스템이 만들어질 것으로 믿어집니다.

똑같이 유망한 영역은 정보 기술과 소위 "가상 현실"을 이해하기 위한 철학적 토대 역할을 하는 언어학과 논리의 상호 작용입니다. 가까운 장래에 인공 지능 시스템 생성에 대한 작업이 계속 될 것입니다. 다시 말하지만 그 능력은 인간과 같지 않을 것입니다. 그러한 경쟁은 무의미합니다. 우리 시대에 기계는 경쟁자가 아니라 인간의 조수가 되어야 하며 환상의 영역이 아니라 현실 세계의 일부가 되어야 합니다.

통계적 방법에 의한 언어 연구는 계속되어 질적 특성을보다 정확하게 결정할 수 있습니다. 언어에 대한 가장 대담한 가설은 수학적, 따라서 논리적인 증거를 찾는 것이 중요합니다.

가장 중요한 것은 언어학에서 수학 적용의 다양한 분야가 이전에는 상당히 고립되어 있었지만 최근 몇 년 동안 Ferdinand de Saussure가 발견한 언어 시스템과 유사하게 일관된 시스템으로 연결되어 서로 연관되어 있다는 것입니다. 그리고 Yvan Baudouin de Courtenay. 이것이 과학적 지식의 연속성입니다.

현대 세계의 언어학은 정보 기술 발전의 기반이 되었습니다. 컴퓨터 과학이 급속도로 발전하는 인간 활동의 한 분야로 남아 있는 한, 수학과 언어학의 결합은 과학 발전에서 계속해서 그 역할을 할 것입니다.

결론

20세기 동안 컴퓨터 기술은 군사적 사용에서 평화적 사용에 이르기까지, 좁은 범위의 목표에서 인간 생활의 모든 분야로의 침투에 이르기까지 먼 길을 왔습니다. 과학으로서의 수학은 컴퓨터 기술의 발달과 함께 새로운 실천적 의미를 발견했습니다. 이 과정은 오늘날에도 계속됩니다.

이전에는 상상도 할 수 없었던 "물리학자"와 "작사가"의 "탠덤"이 현실이 되었습니다. 인문학과 수학과 컴퓨터 과학의 완전한 상호 작용을 위해서는 자격을 갖춘 전문가가 양측에 필요했습니다. 컴퓨터 과학자들은 주변 현실의 변화를 이해하고, 인간과 기술의 상호 작용에서 점점 더 많은 새로운 언어 및 정신 개념을 개발하고, 프로그램, 전문적인 성장을 위해 우리 시대의 모든 "인문학"은 최소한 컴퓨터 작업의 기본을 마스터해야합니다.

정보학과 밀접하게 연결되어 있는 수학은 자연과학 및 인문학과 지속적으로 발전하고 교류하고 있습니다. 새로운 세기에 과학의 수학화 경향은 약해지는 것이 아니라 오히려 증가하고 있습니다. 정량적 데이터를 기반으로 언어 발달 법칙, 역사적, 철학적 특성을 이해합니다.

수학적 형식주의는 언어학의 패턴을 설명하는 데 가장 적합합니다(실제로 인문학과 자연 과학 모두에서와 마찬가지로). 상황은 때때로 과학에서 적절한 수학적 언어를 사용하지 않고는 물리적, 화학적 등의 본질을 이해하는 것이 불가능한 방식으로 발전합니다. 프로세스가 불가능합니다. XX 세기의 유명한 영국 물리학자인 원자의 행성 모델 만들기. E. Rutherford는 수학적 어려움을 겪었습니다. 처음에는 그의 이론이 받아들여지지 않았습니다. 그것은 설득력 있게 들리지 않았고, 그 이유는 원자 상호 작용의 모델 표현을 이해하는 것이 가능한 메커니즘에 기초한 확률 이론에 대한 Rutherford의 무지 때문이었습니다. 이를 깨닫고 이미 노벨상의 소유자 인 뛰어난 과학자가 수학자 Lamb 교수의 세미나에 등록하고 2 년 동안 학생들과 함께 과정에 참석하고 확률 이론에 대한 워크샵을 진행했습니다. . 이를 기반으로 Rutherford는 전자의 거동을 설명할 수 있었고 그의 구조 모델에 설득력 있는 정확성을 부여하고 인지도를 얻었습니다. 언어학도 마찬가지입니다.

이것은 객관적인 현상에서 수학의 언어로, 양적 특성의 언어로 설명될 수 있는 덕분에 무엇이 그렇게 수학적인가라는 질문을 던집니다. 이들은 시간과 공간에 분포된 균일한 물질 단위입니다. 균질성의 고립을 향해 다른 과학보다 더 멀리 나아갔고 수학을 사용하는 데 더 적합한 것으로 판명된 과학.

1990년대에 급속도로 발전한 인터넷은 다양한 국가, 민족, 문화의 대표자들을 하나로 모았습니다. 영어가 계속해서 국제 커뮤니케이션의 주요 언어라는 사실에도 불구하고 인터넷은 우리 시대에 다국어가 되었습니다. 이것은 인간 활동의 다양한 분야에서 널리 사용되는 상업적으로 성공적인 기계 번역 시스템의 개발로 이어졌습니다.

컴퓨터 네트워크는 철학적 성찰의 대상이 되었습니다. "가상 현실"을 이해하는 데 도움이 되는 새로운 언어적, 논리적, 세계관 개념이 점점 더 많이 만들어지고 있습니다. 많은 예술 작품에서 사람에 대한 기계의 지배와 외부 세계에 대한 가상 현실에 대한 시나리오 (더 자주 비관적 인 시나리오)가 만들어졌습니다. 항상 그러한 예측은 무의미한 것으로 판명되었습니다. 정보 기술은 인간의 지식을 투자하는 유망한 산업일 뿐만 아니라 정보를 제어하고 결과적으로 인간의 생각을 통제하는 방법이기도 합니다.

이 현상에는 부정적인 측면과 긍정적인 측면이 모두 있습니다. 부정적 - 정보에 대한 통제는 정보에 대한 자유로운 접근에 대한 양도할 수 없는 인권에 위배되기 때문입니다. 긍정적 - 이 제어가 부족하면 인류에게 치명적인 결과를 초래할 수 있기 때문입니다. 지난 10년 동안 가장 현명한 영화 중 하나인 Wim Wenders의 "세상이 끝날 때"를 회상하는 것으로 충분합니다. 그의 캐릭터는 컴퓨터에 기록된 자신의 꿈의 "가상 현실"에 완전히 몰두합니다. 동시에 한 명의 과학자도 한 명의 예술가도 미래에 과학과 기술을 기다리고 있는 질문에 대한 명확한 답을 줄 수 없습니다.

때때로 환상적으로 보이는 "미래"에 초점을 맞추는 것은 발명가들이 인간의 개입 없이 작동할 수 있는 완벽한 기술 모델을 만들려고 했던 20세기 중반 과학의 독특한 특징이었습니다. 시간은 그러한 연구의 유토피아적 성격을 보여주었다. 동시에 과학자들을 비난하는 것은 불필요 할 것입니다. 1950-60 년대에 열정이 없었다면 정보 기술은 90 년대에 그렇게 강력한 도약을 이루지 못했을 것이며 지금 우리가 가진 것을 갖지 못했을 것입니다.

20세기의 지난 수십 년 동안 과학의 우선 순위가 바뀌었습니다. 연구, 창의적인 파토스는 상업적 관심으로 바뀌었습니다. 다시 말하지만 이것은 좋지도 나쁘지도 않습니다. 이것은 과학이 점점 더 일상 생활에 통합되는 현실입니다.

21세기에도 이러한 추세는 계속되고 있으며, 우리 시대에 발명의 이면에는 명성과 인지도뿐만 아니라 무엇보다도 돈이 있습니다. 최신 과학기술 성과가 테러단체나 독재정권의 손에 들어가지 않도록 하는 것도 중요한 이유다. 작업은 불가능할 정도로 어렵습니다. 그것을 최대한 실현하는 것은 전 세계 공동체의 과제입니다.

정보는 무기이며 무기는 핵무기 또는 화학 무기보다 덜 위험하지 않습니다. 단지 물리적으로 작용하는 것이 아니라 심리적으로 작용합니다. 인류는 이 경우 자유와 통제 중 무엇이 더 중요한지 생각해야 합니다.

정보기술의 발전과 관련된 최근의 철학적 개념과 이를 이해하려는 시도는 19세기와 20세기 초를 지배했던 자연과학적 유물론과 물질세계의 의미를 부정하는 극단적 관념론의 한계를 동시에 보여주었다. . 현대사상, 특히 서양사상은 주변세계가 물질과 이상으로 명확하게 구분되는 상황에서 이러한 사고의 이원성을 극복하는 것이 중요하다. 이에 대한 길은 문화의 대화, 주변 현상에 대한 다양한 관점의 비교입니다.

역설적이게도 정보 기술은 이 과정에서 중요한 역할을 할 수 있습니다. 컴퓨터 네트워크, 특히 인터넷은 엔터테인먼트와 활발한 상업 활동을 위한 자원일 뿐만 아니라 현대 세계의 다양한 문명의 대표자들 간의 의미 있고 논란이 많은 의사 소통의 수단이기도 합니다. 본. 인터넷은 공간적, 시간적 경계를 넘어선다고 할 수 있습니다.

그리고 정보 기술을 통한 문화의 대화에서 가장 오래된 보편적 의사소통 수단으로서의 언어의 역할은 여전히 ​​중요합니다. 그렇기 때문에 언어학은 수학, 철학, 컴퓨터 과학과의 상호 작용을 통해 두 번째 탄생을 경험하고 오늘날에도 계속 발전하고 있습니다. 현재의 추세는 미래에도 계속 될 것입니다. 15 년 전 동일한 V. Wenders가 예측했듯이 "세상이 끝날 때까지"입니다. 사실, 이 끝이 언제 발생할지는 알 수 없지만 미래는 조만간 현재가 될 것이기 때문에 지금 중요합니다.

부록 1

페르디낭 드 소쉬르

스위스 언어학자 Ferdinand de Saussure(1857-1913)는 특정 언어와 언어 형태의 역사보다는 언어의 구조를 기술하려는 시도에서 현대 언어학의 창시자로 널리 간주됩니다. 사실, 언어학 및 문학 연구의 구조주의 방법과 기호학의 중요한 분야는 20세기 초에 그의 작업에서 주요 출발점을 찾습니다. Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes 등의 작업인 "후기 구조주의"라고 불리게 된 전략과 개념의 복합체는 Saussure의 작업에서 제안되었습니다. 후기 라틴 시의 언어학 및 철자법적 독해 문학적 모더니즘에서 20세기 초반의 정신 분석 및 철학에 이르기까지. Algirdas Julien Greimas와 Joseph Courtes가 Semiotics and Language: An Analytic Dictionary에서 "해석"이라는 제목 아래에서 주장하듯이, 20세기 초에 그들이 소쉬르 언어학, 후설 현상학 및 프로이트 정신 분석과 동일시하는 새로운 해석 방식이 나타났습니다. 이 양식에서 "해석은 더 이상 주어진 내용을 형식에 귀속시키는 문제가 아닙니다. 오히려 주어진 기호 체계 내에서 의미 요소의 등가 내용을 다른 방식으로 공식화하는 의역입니다." 159). "해석"에 대한 이러한 이해에서 형식과 내용은 구별되지 않습니다. 오히려 모든 "형식"은 의미론적 "내용"이자 "의미하는 형식"이기도 하므로 해석은 이미 다른 의미 시스템 내에서 의미를 나타내는 어떤 것에 대한 유추적 의역을 제공합니다.

클로드 레비스트로스가 "구조와 형태: 블라디미르 프로프의 작품에 대한 고찰"에서 구조주의 개념을 가장 체계적으로 표현한 것 중 하나인 형태와 이해에 대한 이러한 재해석은 소쉬르의 사후 과정에 함축되어 있습니다. in General Linguistics (1916, trans., 1959, 1983). 그의 생애 동안 Saussure는 상대적으로 거의 출판하지 않았으며 그의 주요 작업인 Course는 1907-11년에 그가 제공한 일반 언어학의 여러 과정을 학생들이 필사한 것입니다. Course에서 Saussure는 19세기에 행해진 역사적 언어학 작업과 반대되는 언어의 "과학적" 연구를 요구했습니다. 그 작업은 서구 지성의 위대한 업적 중 하나입니다. 언어, 역사적 (또는 "통시적") 언어학은 추정되는 공통 언어 소스, 먼저 "인도 유럽"언어 및 이전 "p"에서 서양 언어의 기원과 발전을 추적했습니다. roto-Indo-European" 언어.

소쉬르가 의문을 제기한 것은 언어의 기본 "단위"가 실제로 이러한 "단어 요소"의 긍정적인 존재라는 수반되는 가정과 함께 단어의 고유한 발생에 대한 연구입니다. 그의 작업은 역사 언어학에서 아주 세밀하게 연구한 언어에 관한 많은 사실을 감당할 수 있는 수의 명제로 축소하려는 시도였습니다. 19세기 문헌학의 "비교학파"는 과정에서 "언어학이라는 진정한 과학을 확립하는 데 성공하지 못했다"고 소쉬르는 말합니다. 그 "본성"은 단순히 언어를 구성하는 "원소적인" 단어들 - 외관상 언어의 "긍정적인" 사실(또는 "실질")에서 발견되는 것이 아니라 그것들을 발생시키는 형식적 관계에서 발견되어야 한다고 그는 주장한다. "물질."

소쉬르의 언어에 대한 체계적 재검토는 세 가지 가정에 기반을 두고 있습니다. 그가 가석방으로 지정한 "말-사건"- 그리고 언어학의 적절한 대상, 그가 랑그로 지정한 사건을 지배하는 체계(또는 "코드"). 더욱이 이러한 체계적 연구는 "공시적"을 요구합니다. 역사를 통한 언어 발달에 대한 "통시적" 연구보다는 특정 순간에 언어 요소들 사이의 관계에 대한 개념.

이 가정은 1929년에 Roman Jakobson이 "구조주의"로 지정하게 된 것을 야기했습니다. "현대 과학에 의해 조사된 모든 현상은 기계적 집합체가 아니라 구조적 전체로 취급됩니다. 프로세스의 기계적 개념은 다음 질문에 굴복합니다. 그들의 기능"("로맨틱" 711). 이 구절에서 Jakobson은 역사적 사건에 대한 단순하고 "기계적인" 설명이 아니라 과학 체계로서 언어학을 정의하려는 Saussure의 의도를 명확히 표현하고 있습니다. 이와 함께 Jakobson은 또한 Saussurean의 두 번째 기본 가정을 설명하고 있습니다. 지금은 그것을 "구조적"이라고 부릅니다. 언어학: 언어의 기본 요소는 그 원인이 아니라 기능과 관련해서만 연구될 수 있습니다. 유럽의 "단어"), 그러한 사건과 실체는 체계적 틀 안에 위치해야 합니다. 이것은 다른 소위 사건 및 실체와 관련되어 있습니다. 이것은 경험과 현상을 이해하는 데 있어 급진적인 재정향이며, 철학자 Ernst Cassirer는 그 중요성을 "17세기에 우리 전체를 변화시킨 갈릴레오의 새로운 과학"과 비교했습니다. 물리적 세계의 개념"(Culler, Pursuit 2에서 인용) 4). Greimas와 Courtes가 지적한 바와 같이 이러한 변화는 "해석"을 재고하고 따라서 설명과 이해 자체를 재고합니다. 설명은 "현상"의 원인에 관한 것이므로 "결과"로서 어떤 방식으로 원인에 종속되는 대신, 여기에서 설명은 현상을 미래 지향적인 "기능"에 종속시키는 것으로 구성됩니다. "목적." 설명은 더 이상 인간의 의도나 목적과 무관하지 않습니다(비인격적, 공동적 또는 프로이트 용어로 "무의식"일 수 있음에도 불구하고).

그의 언어학에서 Saussure는 특히 언어적 "단어"의 재정의에서 이러한 변형을 수행합니다. 그는 언어적 "기호"로 설명하고 기능주의 용어로 정의합니다. 그는 기호가 "개념과 소리 이미지"의 결합이라고 주장하며, 이를 "기표와 기표"라고 불렀습니다(66-67; Roy Harris의 1983년 번역은 "의미"와 "신호"라는 용어를 제공합니다). 그들의 "결합"의 본질은 기의도 기표도 다른 것의 "원인"이 아니라 "각각이 다른 것의 가치"(8)라는 점에서 "기능적"입니다. 언어의 요소, 기호 , 관계적으로 역사적 언어학의 기본 가정, 즉 언어와 의미의 기본 단위(즉, "단어")의 동일성을 엄격한 분석 대상으로 만듭니다. "나무"라는 단어가 "같은" 단어가 아니기 때문입니다 단어는 고유한 특성에 의해 정의됩니다. 이러한 특성의 "기계적 집합체"가 아니라 언어의 "구조적 전체"인 시스템의 요소로 정의되기 때문입니다.

개체의 이러한 관계형(또는 "분음 구별") 정의는 구조 언어학에서 언어의 모든 요소 개념을 지배합니다. 이것은 소쉬르 언어학의 가장 인상적인 업적, 즉 언어의 "음소" 및 "독특한 특징" 개념의 발전에서 가장 분명합니다. 음소는 언어의 가장 작은 분절 및 의미 단위입니다. 그것들은 언어에서 발생하는 소리가 아니라 소쉬르가 언급한 "소리 이미지"이며, 이는 화자가 의미를 전달하는 것으로 이해합니다. (따라서 Elmar Holenstein은 중요한 방식으로 Saussure를 따르는 Jakobson의 언어학을 "현상학적 구조주의"라고 설명합니다.) 프라하 학파 구조주의의 주요 대변인인 Jan Mukarovsky가 1937년에 "구조 . . . 경험적 현실이 아니라 현상학적 현실이다. 그것은 작업 그 자체가 아니라 집단(세대, 환경 등)의 의식에 위치한 일련의 기능적 관계입니다." , 1960년에 "구조에는 뚜렷한 내용이 없습니다. 그것은 내용 그 자체이며, 그것이 구속되는 논리적 조직은 실재의 재산으로 생각된다"(167; 또한 Jakobson, Fundamentals 27-28 참조).

따라서 언어의 가장 작은 지각 요소인 음소는 긍정적 대상이 아니라 "현상학적 실재"입니다. 예를 들어 영어에서 음소 /t/는 다양한 방식으로 발음될 수 있지만 모든 경우에 영어 사용자는 /t/로 기능하는 것으로 인식합니다. 흡기 t(즉, 뒤에 h와 같은 호흡으로 발음되는 t), 고음 또는 저음 t 소리, 확장된 t 소리 등은 모두 동일한 방식으로 다음의 의미를 구별하는 기능을 합니다. 영어로 "to"와 "do". 더욱이 언어 간의 차이는 한 언어의 음운 변화가 다른 언어에서는 뚜렷한 음소를 구성할 수 있다는 점입니다. 따라서 영어는 /l/과 /r/을 구별하는 반면, 다른 언어는 이러한 조음이 동일한 음소의 변형으로 간주되도록 구조화되어 있습니다(예: 영어의 흡음 및 흡음 t). 모든 자연어에서 사용 가능한 방대한 수의 단어는 소수의 음소 조합입니다. 예를 들어 영어는 40개 미만의 음소가 결합되어 100만 개가 넘는 단어를 형성합니다.

언어의 음소는 그 자체로 체계적으로 조직된 특징의 구조이다. 1920년대와 1930년대에 Saussure의 리드에 따라 Jakobson과 N. S. Trubetzkoy는 음소의 "독특한 특징"을 분리했습니다. 이러한 특징은 언어 기관(혀, 치아, 성대 등)의 생리학적 구조를 기반으로 합니다. Saussure는 과정에서 Harris가 "생리학적 음성학"( 39; Baskin의 이전 번역은 "음운론"[(1959) 38]이라는 용어를 사용함)으로 설명한다고 언급했습니다. 예를 들어, 영어에서 /t/와 /d/의 차이는 "목소리"(성대의 결합)의 유무이며, 유성 수준에서 이러한 음소는 상호적으로 서로를 정의합니다. 이런 식으로 음운론은 소쉬르가 설명한 언어의 일반 규칙의 구체적인 예입니다. 언어에는 차이점만 있습니다. 훨씬 더 중요합니다. 차이는 일반적으로 차이가 설정되는 양의 용어를 의미합니다. 그러나 언어에는 긍정적인 용어가 없는 차이만 있을 뿐입니다. 우리가 기의를 취하든 기표를 취하든 언어는 언어 체계 이전에 존재했던 관념도 소리도 가지고 있지 않다. ( 120)

이 프레임워크에서 언어 정체성은 고유한 특성이 아니라 체계적("구조적") 관계에 의해 결정됩니다.

나는 음운론이 Saussure의 "선도를 따랐다"고 말했는데, 왜냐하면 그의 언어 생성 생리학에 대한 그의 분석이 Harris가 말했듯이 "요즘에는" "심리적" 또는 "기능적"이 아니라 "물리적"이라고 불릴 것이기 때문입니다. ""(읽기 49), 결과적으로 과정에서 그는 언어의 기능적 분석의 방향과 개요를 분명히 설명했습니다. 유사하게, 1878년에 등장한 그의 유일한 확장 출판물인 Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes(인도유럽어의 원시 모음 체계에 관한 회고록)는 완전히 19세기 프로젝트에 포함되었습니다. 세기 역사 언어학. 그럼에도 불구하고, 이 작업에서, 조나단 컬러(Jonathan Culler)가 주장한 바와 같이, 소쉬르는 "역사적 재구성 작업을 할 때에도 언어를 순전히 관계적인 항목의 체계로 생각하는 다산성"을 보여주었습니다(Saussure 66). Saussure는 기존 인도-유럽 언어의 모음 교체 패턴을 설명하기 위해 음소 간의 체계적인 구조적 관계를 분석함으로써 몇 가지 다른 음소 /a/ 외에도 형식적으로 기술될 수 있는 또 다른 음소가 있었음에 틀림없다고 제안했습니다. Culler는 "소쉬르의 작업이 매우 인상적이었던 것은 거의 50년 후 설형 문자 히타이트어가 발견되고 해독되었을 때 소쉬르가 예측한 대로 작동하는 음소 h를 포함하는 것으로 밝혀졌다는 사실"이라고 결론지었습니다. . 그는 순전히 형식적인 분석을 통해 현재 인도유럽어의 후두라고 알려진 것을 발견했습니다."(66)

기적수업에서 함축적이면서도 명시적인 의미 작용 요소의 관계적 또는 분음적 결정에 대한 이러한 개념은 구조적 언어학을 지배하는 세 번째 가정, 즉 소쉬르가 "기호의 자의적 성질"이라고 부르는 것을 제안합니다. 이것에 의해 그는 언어에서 기표와 기의 사이의 관계가 결코 필요하지 않다는 것을 의미합니다(또는 "동기 부여"). "나무"라는 개념과 결합하기 위해 기표 나무처럼 쉽게 소리 기표 arbre를 찾을 수 있습니다. 그러나 이것보다 더 중요한 것은 기의가 또한 자의적이라는 것을 의미합니다. "나무"라는 개념을 나무의 크기(우리가 "낮은 목본 식물"을 제외함)만큼 나무의 특성(야자수는 제외)으로 쉽게 정의할 수 있습니다. 전화 부시). 이것은 내가 제시한 가정의 번호 매기기가 우선 순위를 나타내지 않는다는 것을 분명히 해야 합니다: 각 가정 - 의미 작용의 체계적 특성("동기적으로" 언어를 공부함으로써 가장 잘 이해됨), 요소의 관계적 또는 "분음 구별적" 특성 기호의 자의적 특성인 의미 작용의 가치는 다른 것에서 파생됩니다.

즉, Saussurean 언어학은 언어의 조합과 대조의 포괄적인 관계에서 연구하는 현상입니다. 이 개념에서 언어는 의미(의미)를 표현하는 과정이자 그 산물(의사소통)이며, 언어의 이 두 기능은 동일하지도 완전히 일치하지도 않습니다(Schleifer, "해체" 참조). 여기서 우리는 Greimas와 Courtes가 모더니스트 해석에서 설명하는 형식과 내용 사이의 교대를 볼 수 있습니다. 게다가 언어의 요소는 자의적이기 때문에 대조도 조합도 기본이라고 할 수 없다. 따라서 언어의 구별되는 특징들이 결합하여 또 다른 이해 수준에서 대조되는 음소를 형성하고, 음소가 결합하여 대조되는 형태소를 형성하고, 형태소가 결합하여 단어를 형성하고, 단어가 결합하여 문장을 형성하는 등의 방식으로 진행됩니다. 각각의 예에서 전체 음소, 단어 또는 문장 등은 부분의 합보다 큽니다(소쉬르의 예[(1959) 103]에서 물, H2O가 기계적 응집보다 더 큰 것과 같습니다) 수소와 산소).

일반 언어학 과정의 세 가지 가정으로 인해 소쉬르는 언어 과학을 넘어 "사회 내 기호의 삶"을 연구할 20세기의 새로운 과학을 요구했습니다. Saussure는 이 과학을 "기호학(그리스어 semeion "sign"에서 유래)"(16)이라고 명명했습니다. 기호학의 "과학"은 1920년대와 1930년대에 동유럽, 1950년대와 1960년대에 파리에서 시행되었기 때문에 언어 및 언어 구조에 대한 연구를 그러한 구조로 구성된(또는 분절된) 문학적 인공물로 확장했습니다. 더군다나 경력 후반기에 일반 언어학 과정을 제공하는 동안에도 Saussure는 고의적으로 숨겨진 고유명사의 아나그램을 발견하기 위해 후기 라틴 시에 대한 자신의 "기호학적" 분석을 추구했습니다. 연구 방법은 여러 면에서 그의 언어 분석의 기능적 합리주의와 정반대였습니다. 소쉬르가 이 연구를 추구한 99권의 노트 중 하나에서 언급한 것처럼 "우연"의 문제를 체계적으로 조사하려고 시도했습니다. 모든 것의 불가피한 기초가 된다"(Starobinski 101에서 인용). 소쉬르 자신이 말했듯이 그러한 연구는 우연과 의미의 "물질적 사실"(인용 101)에 초점을 맞추므로 Jean Starobinski가 주장하듯이 소쉬르가 찾고 있는 "주제-단어"는 "시인을 위한 것"입니다. , 도구이지 시의 중요한 세균이 아닙니다. 시는 주제어의 음운적 재료를 다시 사용하는 데 필요합니다"(45). 이 분석에서 Starobinski는 "소쉬르는 숨겨진 의미를 찾는 데 자신을 잃지 않았습니다. "라고 말합니다. 오히려 그의 작업은 의식에서 발생하는 모든 문제를 회피하려는 욕망을 보여주는 것 같다. "(121).

즉, 후기 라틴 시에서 고유명사를 발견하려는 소쉬르의 시도 - Tzvetan Todorov가 "단어 . . . 기표에"(266) - 그의 언어 분석을 지배하는 요소 중 하나인 기호의 자의적 특성을 강조합니다. (또한 소쉬르 언어학의 형식적 특성을 강조합니다. 물질" - 의미론을 분석의 주요 대상으로 효과적으로 제거합니다.) Todorov가 결론을 내리듯이, Saussure의 작업은 오늘날 상징적 현상을 받아들이기를 거부한다는 점에서 현저하게 동질적으로 보입니다. . . . 철자법에 대한 그의 연구에서 그는 연상 현상이 아닌 반복 현상에만 주목한다. . . . Nibelungen에 대한 그의 연구에서 그는 잘못된 읽기에 기인하기 위해서만 기호를 인식합니다. 기호는 의도적이지 않기 때문에 기호는 존재하지 않습니다. 마지막으로 일반 언어학 과정에서 그는 기호학의 존재, 따라서 언어 기호 이외의 기호에 대해 고찰합니다. 그러나 이 확언은 기호학이 단일 유형의 기호, 즉 자의적인 기호에 전념한다는 사실에 의해 즉시 제한됩니다. (269-70)

이것이 사실이라면 그것은 소쉬르가 주체 없이 "의도"를 생각할 수 없었기 때문입니다. 그는 형식과 내용 사이의 대립에서 완전히 벗어날 수 없었습니다. 대신 그는 "언어 적 합법성"에 의지했습니다. 한편으로는 역사, 주관성, 그리고 이러한 개념이 지배하는 인과적 해석 방식에 대한 19세기 개념과 다른 한편으로는 레비-스트로스가 "없는 칸트주의"라고 부른 20세기 "구조주의" 개념 사이에 위치합니다. a 초월적 주체"(Connerton 23에서 인용) - 본격적인 구조주의, 정신 분석, 심지어 양자 역학에서 형식과 내용(또는 주체와 객체) 사이의 대립과 전경과 배경의 위계를 지우는 개념 - Ferdinand의 작업 언어학과 기호학의 드 소쉬르는 의미와 문화 연구에서 중요한 순간을 규정합니다.

로날드 슐라이퍼

부록 2

페르디낭 드 소쉬르(번역)

스위스 언어학자인 Ferdinand de Saussure(1857-1913)는 개별 언어와 단어 형식의 역사가 아니라 언어의 구조를 설명하려는 시도 덕분에 현대 언어학의 창시자로 간주됩니다. 대체로 20세기 초에 그의 작품에서 언어학 및 문학 비평, 그리고 상당 부분 기호학의 구조적 방법의 토대가 마련되었습니다. Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes 등의 작업에서 발전된 소위 "후기 구조주의"의 방법과 개념은 Saussure와 후기 로마시의 아나그램 읽기. 언어학 및 언어 해석에 대한 소쉬르의 작업은 물리학에서 문학 혁신, 정신 분석 및 20세기 초 철학에 이르기까지 광범위한 지적 분야를 연결하는 데 도움이 된다는 점에 유의해야 합니다. A. J. 그레마스(A. J. Greimas)와 J. 쿠르테(J. Kurte)는 기호학과 언어(Semiotics and Language)에서 “20세기 초 소쉬르의 언어학, 후설의 현상학, 정신분석학 등과 함께 새로운 종류의 해석으로서 “해석”이라는 제목의 분석사전이 등장하였다. 프로이트의. 그러한 경우, "해석은 주어진 내용이 없었을 형식에 주어진 내용을 귀속시키는 것이 아니라 주어진 기호 체계 내에서 중요한 요소의 동일한 내용을 다른 방식으로 공식화하는 의역입니다"(159) ). "해석"에 대한 이러한 이해에서 형식과 내용은 분리할 수 없습니다. 반대로 각 형식은 의미론적 의미("의미 있는 형식")로 채워지므로 해석은 다른 기호 시스템에서 의미 있는 것을 새롭고 유사한 방식으로 다시 설명합니다.

Claude Lévi-Strauss가 구조주의의 프로그래밍 작업 중 하나("구조와 형식: 블라디미르 프로프의 작품에 대한 성찰")에서 제시한 형식과 내용에 대한 유사한 이해는 Saussure의 사후 저서 A Course in에서 볼 수 있습니다. 일반 언어학 (1916, trans., 1959, 1983). 그의 생애 동안 소쉬르는 거의 출판하지 않았으며, 그의 주요 작품인 "코스"는 1907-11년에 일반 언어학에 대한 그의 강의에 참석한 학생들의 노트에서 수집되었습니다. Course에서 Saussure는 언어에 대한 "과학적" 연구를 요구하여 19세기 비교-역사적 언어학과 대조했습니다. 이 작업은 서양 사상의 가장 위대한 업적 중 하나로 간주 될 수 있습니다. 개별 단어를 언어의 구조적 요소로 사용하여 역사적 (또는 "통시적") 언어학은 서유럽 언어의 기원과 발전을 증명했습니다. 일반적인 인도 유럽 언어 및 이전 Proto-Indo-European.

소쉬르가 의문을 제기한 것은 언어의 기본 "단위"가 실제로 이러한 "단어 요소"의 긍정적인 존재라는 부수적인 가정과 함께 단어의 고유한 발생에 대한 연구입니다. 그의 작업은 비교 언어학에서 우연히 연구한 언어에 대한 많은 사실을 소수의 정리로 축소하려는 시도였습니다. 19세기의 비교 철학 학파는 "연구 대상의 본질을 이해하지 못했기" 때문에 "진정한 언어학 학파를 만드는 데 성공하지 못했다"(3)고 소쉬르(Saussure)는 썼습니다. 그는 이 "본질"이 언어의 "긍정적 실체"인 개별 단어에 있을 뿐만 아니라 이러한 실체가 존재하도록 돕는 형식적 연결에도 있다고 주장합니다.

Saussure의 언어 "테스트"는 세 가지 가정을 기반으로 합니다. 첫째, 언어에 대한 과학적 이해는 역사적 근거가 아니라 구조적 현상에 근거한다. 따라서 그는 언어의 개별 현상, 즉 그가 "가석방"으로 정의하는 "말의 사건"과 적절한 언어학 연구 대상, 이러한 사건을 제어하는 ​​시스템(코드, 구조)을 구별했습니다. "랑그"). 더욱이 그러한 체계적인 연구는 언어의 역사를 통한 언어 발달에 대한 "통시적" 연구가 아니라 주어진 순간에 언어의 요소들 사이의 관계에 대한 "동시적" 개념을 요구합니다.

이 가설은 1929년 로만 야콥슨(Roman Jakobson)이 "구조주의(structuralism)"라고 부른 것, 즉 "현대 과학에 의해 조사된 모든 현상은 기계적인 축적이 아니라 구성 요소가 기능"("로맨틱 "711). 이 구절에서 Jakobson은 역사적 사건의 "기계적" 열거가 아닌 구조로 언어를 정의하는 Saussure의 아이디어를 정식화했습니다. 또한 Jakobson은 구조 언어학의 선구자가 된 또 다른 Saussurean 가정을 개발합니다. 언어의 기본 요소는 그 원인이 아니라 기능과 관련하여 연구되어야 합니다. 별도의 현상 및 사건(즉, 개별 인도-유럽어 단어의 기원에 대한 역사)은 그 자체로 연구되는 것이 아니라 유사한 구성 요소와 상호 연관되는 시스템에서 연구되어야 합니다. 이것은 현상을 주변 현실과 비교하는 근본적인 전환이었고, 철학자 Ernst Cassirer는 "17세기에 물질 세계에 대한 생각을 뒤집은 갈릴레오의 과학"과 비교했습니다. 현상은 발생 원인과 관련하여 해석되기 시작했지만 현재와 미래에 미칠 수 있는 영향과 관련하여 해석되기 시작했습니다. Freud의 의미에서 "무의식"이라는 단어).

그의 언어학에서 소쉬르는 특히 언어학에서 단어 개념의 변화에서 이러한 전환을 보여주는데, 그는 단어를 기호로 정의하고 그 기능으로 설명합니다. 그를위한 기호는 소리와 의미의 조합, "의미 및 지정"(66-67; Roy Harris의 1983 년 영어 번역- "의미"및 "신호")입니다. 이 화합물의 본질은 "기능적"입니다(하나도 다른 요소도 서로 없이 존재할 수 없음). 더욱이 "한 사람은 다른 사람에게서 자질을 빌린다"(8). 따라서 소쉬르는 언어의 주요 구조적 요소인 기호를 정의하고 역사언어학의 기초를 기호와 단어의 동일성을 특히 엄밀한 분석이 필요로 합니다. 따라서 우리는 같은 단어 "나무"의 다른 의미를 이해할 수 있습니다. 단어가 특정 특성의 집합이기 때문이 아니라 "구조적 전체"에서 기호 시스템의 요소로 정의되기 때문입니다. 언어로.

이러한 상대적("분음 구별") 통일성 개념은 구조 언어학에서 언어의 모든 요소 개념의 근간을 이룹니다. 이것은 소쉬르 언어학의 가장 독창적인 발견, 언어의 "음소" 및 "특징" 개념의 발전에서 특히 분명합니다. 음소는 음성 및 의미 있는 언어 단위 중 가장 작은 단위입니다. 그것들은 언어에서 발생하는 소리일 뿐만 아니라 원어민이 의미를 갖는 것으로 인식하는 "사운드 이미지"라고 Saussure는 말합니다. (엘마 홀렌슈타인은 주요 조항에서 소쉬르의 사상과 개념을 이어가는 야콥슨의 언어학을 "현상학적 구조주의"라고 부른다는 점에 유의해야 한다.) 이것이 바로 프라하 구조주의 학파의 주요 연사인 Jan Mukarowski가 1937년에 "구조. . . 경험적 개념이 아니라 현상학적 개념이다. 그것은 결과 그 자체가 아니라 집단의식(세대, 타자 등)의 중요한 관계들의 집합이다.” 비슷한 생각이 1960년에 프랑스 구조주의의 지도자인 Lévi-Strauss에 의해 표현되었습니다. “구조에는 명확한 내용이 없습니다. 그것은 그 자체로 의미가 있으며 그것을 포함하는 논리적 구성은 현실의 각인입니다.

차례로, 인식에 허용되는 가장 작은 언어 요소인 음소는 별도의 통합 "현상학적 현실"을 나타냅니다. 예를 들어 영어에서 "t" 소리는 다르게 발음될 수 있지만 모든 경우에 영어를 사용하는 사람은 "t"로 인식합니다. 흡인, 상승 또는 하강, 긴 "t" 소리 등은 "to"와 "do"라는 단어의 의미를 똑같이 구별합니다. 또한 언어 간의 차이점은 한 언어의 한 소리가 다른 음소에 해당할 수 있다는 것입니다. 예를 들어 영어의 "l"과 "r"은 다른 반면 다른 언어에서는 동일한 음소의 변형입니다(예: 영어 "t", 열망 유무에 관계없이 발음). 모든 자연어의 광대한 어휘는 훨씬 적은 수의 음소 조합의 집합입니다. 예를 들어 영어에서는 40개의 음소만 사용하여 약 백만 단어를 발음하고 씁니다.

언어의 소리는 체계적으로 구성된 일련의 기능입니다. 1920년대에서 1930년대에 Saussure에 이어 Jacobson과 N.S. Trubetskoy는 음소의 "독특한 특징"을 골라냈습니다. 이러한 기능은 혀, 치아, 성대와 같은 언어 기관의 구조를 기반으로 합니다. Saussure는 "Course of General Linguistics"에서 이를 알아차렸고 Harris는 이를 "생리학적 음성학"이라고 부릅니다(Baskin의 이전 번역에서 "음운론"이라는 용어는 " 사용됨) - 소리를 내기 위해 친구와 "매듭 » durg로 연결됩니다. 예를 들어 영어에서 "t"와 "d"의 차이는 "voice"(성대의 긴장)의 유무와 음소를 구분하는 음성의 크기입니다. 따라서 음운론은 Saussure가 설명한 일반 언어 규칙의 예로 간주할 수 있습니다. "언어에는 차이가 있을 뿐입니다." 훨씬 더 중요한 것은 이것이 아닙니다. 차이는 일반적으로 그것이 위치한 정확한 조건을 의미합니다. 그러나 언어에는 정확한 조건 없이 차이만 있을 뿐입니다. 우리가 "지정"을 고려하든 "의미"를 고려하든 언어 시스템이 개발되기 전에 존재했을 개념이나 소리가 언어에는 없습니다.

그러한 구조에서 언어적 유비는 고유한 특성의 도움으로 정의되는 것이 아니라 체계(“구조적”) 관계의 도움으로 정의됩니다.

나는 음운론의 발전이 소쉬르의 생각에 의존했다고 이미 언급했습니다. 현대의 언어 생리학에 대한 그의 분석은 "'심리적' 또는 '기능적'이 아니라 '물리적'이라고 불릴 것이지만 The Course에서 그는 언어의 기능적 분석의 방향과 기본 원칙을 명확하게 설명했습니다. 그의 생애 동안 출판된 유일한 작품인 1878년에 출판된 Memoire sur le systeme primitif des voyelles dans les langues indo-europeennes(인도-유럽 언어의 원래 모음 체계에 대한 노트)는 완전히 1878년의 비교 역사 언어학과 일치했습니다. 19 세기. 그럼에도 불구하고, 이 작업에서 소쉬르는 "역사적 재구성을 통해서도 상호 연결된 현상의 체계로서의 언어 개념의 결실"을 보여주었다고 조나단 컬러(Jonathan Culler)는 말합니다. 음소 간의 관계를 분석하고 인도 유럽어 그룹의 현대 언어에서 모음의 교대를 설명하면서 Saussure는 여러 가지 다른 소리 "a"외에도 공식적으로 설명되는 다른 음소가 있어야한다고 제안했습니다. Kaller는 "소쉬르의 작업에서 특별한 인상을 주는 것은 거의 50년 후 히타이트 설형문자가 발견되고 해독되었을 때 문자에서 "h"로 표시되는 음소가 발견되었으며 이는 소쉬르가 예측한 대로 작동했다는 것입니다. 형식 분석을 통해 그는 현재 인도유럽어에서 목음으로 알려진 것을 발견했습니다.

코스에서 명시적이든 암시적이든 기호의 상대적(분음 구별) 정의 개념에는 구조 언어학의 세 번째 핵심 가정이 있는데, 이는 소쉬르가 "기호의 자의적 성질"이라고 불렀습니다. 이것은 언어에서 소리와 의미 사이의 관계가 어떤 것에 의해 동기가 부여되지 않는다는 것을 의미합니다. "수목"이라는 단어와 "나무"라는 단어를 "나무"라는 개념과 쉽게 연결할 수 있습니다. 더욱이 이것은 소리도 임의적이라는 것을 의미합니다. "나무"의 개념은 나무 껍질의 존재 (야자수 제외)와 크기 ( "낮은 목본 식물"-관목 제외)로 정의 할 수 있습니다. 이것으로부터 내가 제시하는 모든 가정이 점점 더 중요하지 않은 것으로 나뉘지 않는다는 것이 분명해야합니다. 각각-기호의 체계적 특성 (언어의 "동기"연구에서 가장 이해할 수 있음), 상대적 (분음 부호) 본질 , 기호의 임의적 특성-나머지에서 나옵니다.

따라서 소쉬르 언어학에서 연구된 현상은 언어의 비교와 대립의 집합으로 이해됩니다. 언어는 단어의 의미(지정)와 그 결과(의사소통)의 표현이며 이 두 기능은 결코 일치하지 않습니다(Shleifer의 "언어 해체" 참조). 우리는 Greimas와 Kurte가 최신 버전의 해석에서 설명하는 형식과 내용의 교대를 볼 수 있습니다. 언어적 대조는 구조 단위를 정의하고 이러한 단위는 연속적인 수준에서 상호 작용하여 특정 의미 있는 내용을 생성합니다. 언어의 요소는 무작위적이기 때문에 대조도 조합도 근거가 될 수 없다. 이것은 언어에서 독특한 특징이 다른 수준의 이해에서 음성 대조를 형성하고 음소가 대조되는 형태소, 형태소-단어, 단어-문장 등으로 결합됨을 의미합니다. 어쨌든 전체 음소, 단어, 문장 등 부분의 합 이상입니다(소쉬르의 예에서 물이 수소와 산소의 조합 이상인 것처럼).

"일반 언어학 과정"의 세 가지 가정은 소쉬르로 하여금 "사회에서 기호의 삶"을 연구하는 언어학과 별개인 20세기의 새로운 과학에 대한 아이디어로 이끌었습니다. Saussure는 이것을 과학 기호학이라고 불렀습니다 (그리스어 "semeion"-기호). 1920년대와 1930년대에 동유럽, 1950년대와 1960년대에 파리에서 발전한 기호학의 "과학"은 언어와 언어 구조에 대한 연구를 이러한 구조로 구성된(또는 공식화된) 문학적 발견으로 확장했습니다. 또한 그의 경력의 황혼기에 일반 언어학 과정과 병행하여 Saussure는 의도적으로 구성된 고유 이름의 철자 바꾸기를 발견하려고 노력하면서 후기 로마시의 "기호 학적"분석에 참여했습니다. 이 방법은 여러면에서 언어 분석에서 합리주의와 반대였습니다. Saussure가 99 개의 노트북 중 하나에 쓴 것처럼 시스템에서 "모든 것의 기초가되는"개연성 "의 문제를 연구하려는 시도였습니다. " Saussure 자신이 주장하는 그러한 조사는 확률의 "실제 측면"에 초점을 맞추는 데 도움이 됩니다. 소쉬르가 애너그램을 찾고 있는 "키워드"는 Jean Starobinsky에 따르면 "시인을 위한 도구이지 시의 삶의 원천이 아닙니다. 시는 핵심 단어의 소리를 뒤집는 역할을 합니다. Starobinsky에 따르면 이 분석에서 "소쉬르는 숨겨진 의미를 탐구하지 않습니다." 반대로 그의 작품에서는 의식과 관련된 질문을 회피하려는 욕구가 눈에 띈다. 언어의 법칙.”

후기 로마 시에서 고유명사를 연구하려는 소쉬르의 시도(Tsvetan Todorov는 이것을 "단어 ... 그것이 쓰여지기 전의 것"의 약어라고 불렀습니다)는 그의 언어 분석의 구성 요소 중 하나인 기호의 임의적 특성을 강조합니다. 의미 분석의 가능성을 배제하는 소쉬르 언어학의 형식적 본질("언어"는 그가 "현상이 아니라 형식의 본질"이라고 주장함)입니다. Todorov는 오늘날 Saussure의 글이 기호[의미가 잘 정의된 현상] 연구를 꺼리는 점에서 현저하게 일관성이 있는 것처럼 보인다고 결론지었습니다. . . . 애너그램을 탐색하면서 Saussure는 반복에만 주의를 기울이고 이전 옵션에는 주의를 기울이지 않습니다. . . . Nibelungenlied를 연구하면서 그는 잘못된 읽기에 할당하기 위해서만 기호를 정의합니다. 의도하지 않은 경우 기호는 존재하지 않습니다. 결국, 일반 언어학에 관한 그의 글에서 그는 언어 기호뿐만 아니라 기호학의 존재를 가정합니다. 그러나 이 가정은 기호학이 무작위적이고 자의적인 기호만을 기술할 수 있다는 사실에 의해 제한됩니다.

만약 이것이 사실이라면 그것은 그가 대상 없이는 "의도"를 상상할 수 없었기 때문입니다. 그는 형식과 내용 사이의 간격을 완전히 메울 수 없었습니다. 그의 글에서 이것은 질문으로 바뀌었습니다. 대신 그는 "언어 적 정당성"으로 전환했습니다. 한편으로는 역사와 주관적 추측에 기초한 19세기 개념과 이러한 개념에 기초한 우연적 해석의 방법, 그리고 다른 한편으로는 레비스트로스가 "초월이 없는 칸트주의"라고 부른 구조주의적 개념 사이에서 행위자" - 형태와 내용(주체와 대상), 구조주의, 정신분석학, 심지어 양자역학의 의미와 기원 사이의 대립을 지우는 것 - 언어학과 기호학에 관한 Ferlinand de Saussure의 작업은 언어와 의미 연구의 전환점을 표시합니다. 문화.

로널드 슈레이퍼

문학

1. Admoni V.G. 문법 이론의 기초 / V.G. 훈계; 소련 과학 아카데미.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. 언어학의 수학적 방법. M., 1974.

4. 아놀드 I.V. 현대영어 단어의 의미구조와 연구방법론. /I.V. Arnold-L .: 교육, 1966. - 187p.

6.Bashlykov A.M. 자동 번역 시스템. / 오전. Bashlykov, A.A. 소콜로프. -M.: LLC "FIMA", 1997. - 20p.

7. Baudouin de Courtenay: 이론적 유산과 현대성: 국제 과학 회의 보고서 초록 / Ed.I.G. Kondratiev. - 카잔: KGU, 1995. - 224p.

8. A. V. Gladkiy, 수학적 언어학의 요소. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198p.

9. 골로빈, B.N. 언어 및 통계. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. 이론 및 응용 언어학. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. 의미론. 통사론. 형태. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. 언어학의 공식 언어 입문 / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., ill.

13. 20세기 말 Baudouin de Courtenay의 언어 유산: 2000년 3월 15-18일 국제 과학 및 실무 회의 요약. - 크라스노야르스크, 2000. - 125p.

Matveeva G.G. 숨겨진 문법적 의미와 화자의 사회적 인물("초상화") 식별 / G.G. Matveev. - Rostov, 1999. - 174p.

14. Melchuk, I.A. 언어 모델 구축 경험 "의미<-->텍스트". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. 번역 및 응용 언어학 / L.L. 넬류빈. -M.: 고등학교, 1983. - 207p.

16. 정확한 언어 연구 방법: 소위 "수학적 언어학" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva 및 기타 - M., 1961. - 162 p.

17. Piotrovsky L.G. 수학적 언어학: 교과서 / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. -M.: 고등학교, 1977. - 160p.

18. 그는 그렇습니다. 텍스트, 기계, 사람. - L., 1975. - 213p.

19. 그는 그렇습니다. 응용 언어학 / Ed. AS 게르다. - L., 1986. - 176p.

20. 레진, I.I. 언어 모델. M., 1963. Revzin, I.I. 현대 구조 언어학. 문제 및 방법. M., 1977. - 239p.

21. Revzin, I.I., Rozentsveig, V.Yu. 일반 및 기계 번역의 기초 / Revzin I.I., Rozentsveig, V.Yu. -M., 1964. -401p.

22. Slyusareva N.A. 현대 언어학에 비추어 F. de Saussure의 이론 / N.A. Slyusareva. -M.: Nauka, 1975. - 156p.

23. 올빼미, L.Z. 분석 언어학 / L.Z. 올빼미 - M., 1970. - 192 p.

24. 소쉬르 F. 드. 일반 언어학에 대한 주석 / F. de Saussure; 당. fr에서. - M.: Progress, 2000. - 187p.

25. 그는 그렇습니다. 일반 언어학 코스 / Per. fr에서. - 예카테린부르크, 1999. -426p.

26. 음성 통계 및 자동 텍스트 분석 / Ed. 에드. R.G. Piotrovsky. L., 1980. - 223p.

27. Stoll, P. 세트. 논리. 공리 이론. / R. Stoll; 당. 영어로부터. - M., 1968. - 180p.

28. Tenier, L. 구조적 구문의 기초. M., 1988.

29. 우빈 I.I. 소련의 번역 활동 자동화 / I.I. 우빈, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28p.

30. Faure, R., Kofman, A., Denis-Papin, M. 현대 수학. M., 1966.

31. Shenk, R. 개념 정보 처리. M., 1980.

32. Shikhanovich, Yu.A. 현대 수학 입문(초기 개념). M., 1965

33. Shcherba L.V. 질적 및 양적 용어의 러시아어 모음 / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. 세계 시민 // Spark - 1996. - No. 5. - p.13

35. VA Uspensky. Andrei Nikolaevich Kolmogorov의 기호 메시지에 대한 "New Literary Review"독자를위한 예비. - 새로운 문학 검토. -1997. - 24호. - S. 18-23

36. Perlovsky L. 의식, 언어 및 문화. - 아는 것이 힘이다. -2000. 4번 - S. 20-33

소개? 강의 번역 이론

2.4 언어학에서 수학적 방법의 적용에 대한 전망

컴퓨터 기술 시대에 수학적 언어학의 방법은 새로운 발전 관점을 받았습니다. 언어 분석 문제에 대한 솔루션 검색은 이제 점점 더 정보 시스템 수준에서 구현되고 있습니다. 동시에 언어 자료 처리 프로세스의 자동화는 연구원에게 상당한 기회와 이점을 제공하며 필연적으로 그에게 새로운 요구 사항과 작업을 제시합니다.

"정확한" 지식과 "인도주의적인" 지식의 조합은 언어학, 컴퓨터 과학 및 철학 분야에서 새로운 발견을 위한 비옥한 토양이 되었습니다.

한 언어에서 다른 언어로의 기계 번역은 빠르게 성장하는 정보 기술 분야로 남아 있습니다. 컴퓨터 지원 번역은 품질 면에서 사람의 번역(특히 문학 텍스트의 경우)과 결코 비교할 수 없다는 사실에도 불구하고 대량의 텍스트를 번역할 때 기계는 사람에게 없어서는 안 될 도우미가 되었습니다. 가까운 장래에 주로 텍스트의 의미론적 분석을 기반으로 하는 보다 발전된 번역 시스템이 만들어질 것으로 믿어집니다.

똑같이 유망한 영역은 정보 기술과 소위 "가상 현실"을 이해하기 위한 철학적 토대 역할을 하는 언어학과 논리의 상호 작용입니다. 가까운 장래에 인공 지능 시스템 생성에 대한 작업이 계속 될 것입니다. 다시 말하지만 그 능력은 인간과 같지 않을 것입니다. 그러한 경쟁은 무의미합니다. 우리 시대에 기계는 경쟁자가 아니라 인간의 조수가 되어야 하며 환상의 영역이 아니라 현실 세계의 일부가 되어야 합니다.

통계적 방법에 의한 언어 연구는 계속되어 질적 특성을보다 정확하게 결정할 수 있습니다. 언어에 대한 가장 대담한 가설은 수학적, 따라서 논리적인 증거를 찾는 것이 중요합니다.

가장 중요한 것은 언어학에서 수학 적용의 다양한 분야가 이전에는 상당히 고립되어 있었지만 최근 몇 년 동안 Ferdinand de Saussure가 발견한 언어 시스템과 유사하게 일관된 시스템으로 연결되어 서로 연관되어 있다는 것입니다. 그리고 Yvan Baudouin de Courtenay. 이것이 과학적 지식의 연속성입니다.

현대 세계의 언어학은 정보 기술 발전의 기반이 되었습니다. 컴퓨터 과학이 급속도로 발전하는 인간 활동의 한 분야로 남아 있는 한, 수학과 언어학의 결합은 과학 발전에서 계속해서 그 역할을 할 것입니다.


결론

20세기 동안 컴퓨터 기술은 군사적 사용에서 평화적 사용에 이르기까지, 좁은 범위의 목표에서 인간 생활의 모든 영역으로의 침투에 이르기까지 먼 길을 왔습니다. 과학으로서의 수학은 컴퓨터 기술의 발달과 함께 새로운 실천적 의미를 발견했습니다. 이 과정은 오늘날에도 계속됩니다.

이전에는 상상도 할 수 없었던 "물리학자"와 "작사가"의 "탠덤"이 현실이 되었습니다. 인문학과 수학과 컴퓨터 과학의 완전한 상호 작용을 위해서는 자격을 갖춘 전문가가 양측에 필요했습니다. 컴퓨터 과학자들은 주변 현실의 변화를 이해하고, 인간과 기술의 상호 작용에서 점점 더 많은 새로운 언어 및 정신 개념을 개발하고, 프로그램, 전문적인 성장을 위해 우리 시대의 모든 "인문학"은 최소한 컴퓨터 작업의 기본을 마스터해야합니다.

정보학과 밀접하게 연결되어 있는 수학은 자연과학 및 인문학과 지속적으로 발전하고 교류하고 있습니다. 새로운 세기에 과학의 수학화 경향은 약해지는 것이 아니라 오히려 증가하고 있습니다. 정량적 데이터를 기반으로 언어 발달 법칙, 역사적, 철학적 특성을 이해합니다.

수학적 형식주의는 언어학의 패턴을 설명하는 데 가장 적합합니다(실제로 다른 과학, 인문학 및 자연 과학 모두에서). 상황은 때때로 과학에서 적절한 수학적 언어를 사용하지 않고는 물리적, 화학적 등의 본질을 이해하는 것이 불가능한 방식으로 발전합니다. 프로세스가 불가능합니다. XX 세기의 유명한 영국 물리학자인 원자의 행성 모델 만들기. E. Rutherford는 수학적 어려움을 겪었습니다. 처음에는 그의 이론이 받아들여지지 않았습니다. 그것은 설득력 있게 들리지 않았고, 그 이유는 원자 상호 작용의 모델 표현을 이해하는 것이 가능한 메커니즘에 기초한 확률 이론에 대한 Rutherford의 무지 때문이었습니다. 이를 깨닫고 이미 노벨상의 소유자 인 뛰어난 과학자가 수학자 Lamb 교수의 세미나에 등록하고 2 년 동안 학생들과 함께 과정에 참석하고 확률 이론에 대한 워크샵을 진행했습니다. . 이를 기반으로 Rutherford는 전자의 거동을 설명할 수 있었고 그의 구조 모델에 설득력 있는 정확성을 부여하고 인지도를 얻었습니다. 언어학도 마찬가지입니다.

이것은 객관적인 현상에서 수학의 언어로, 양적 특성의 언어로 설명될 수 있는 덕분에 무엇이 그렇게 수학적인가라는 질문을 던집니다. 이들은 시간과 공간에 분포된 균일한 물질 단위입니다. 균질성의 고립을 향해 다른 과학보다 더 멀리 나아갔고 수학을 사용하는 데 더 적합한 것으로 판명된 과학.

1990년대에 급속도로 발전한 인터넷은 다양한 국가, 민족, 문화의 대표자들을 하나로 모았습니다. 영어가 계속해서 국제 커뮤니케이션의 주요 언어라는 사실에도 불구하고 인터넷은 우리 시대에 다국어가 되었습니다. 이것은 인간 활동의 다양한 분야에서 널리 사용되는 상업적으로 성공적인 기계 번역 시스템의 개발로 이어졌습니다.

컴퓨터 네트워크는 철학적 성찰의 대상이 되었습니다. "가상 현실"을 이해하는 데 도움이 되는 새로운 언어적, 논리적, 세계관 개념이 점점 더 많이 만들어지고 있습니다. 많은 예술 작품에서 사람에 대한 기계의 지배와 외부 세계에 대한 가상 현실에 대한 시나리오 (더 자주 비관적 인 시나리오)가 만들어졌습니다. 항상 그러한 예측은 무의미한 것으로 판명되었습니다. 정보 기술은 인간의 지식을 투자하는 유망한 산업일 뿐만 아니라 정보를 제어하고 결과적으로 인간의 생각을 통제하는 방법이기도 합니다.

이 현상에는 부정적인 측면과 긍정적인 측면이 모두 있습니다. 부정적 - 정보에 대한 통제는 정보에 대한 자유로운 접근에 대한 양도할 수 없는 인권에 위배되기 때문입니다. 긍정적 - 이 제어가 부족하면 인류에게 치명적인 결과를 초래할 수 있기 때문입니다. 지난 10년 동안 가장 현명한 영화 중 하나인 Wim Wenders의 "세상이 끝날 때"를 회상하는 것으로 충분합니다. 그의 캐릭터는 컴퓨터에 기록된 자신의 꿈의 "가상 현실"에 완전히 몰두합니다. 그러나 한 명의 과학자도, 한 명의 예술가도 미래에 무엇이 과학과 기술을 기다리고 있는지에 대한 명확한 답을 줄 수는 없습니다.

때때로 환상적으로 보이는 "미래"에 초점을 맞추는 것은 발명가들이 인간의 개입 없이 작동할 수 있는 완벽한 기술 모델을 만들려고 했던 20세기 중반 과학의 독특한 특징이었습니다. 시간은 그러한 연구의 유토피아적 성격을 보여주었다. 그러나 이것에 대해 과학자들을 비난하는 것은 불필요 할 것입니다. 1950 년대에 열정이 없었다면 60 년대 정보 기술은 90 년대에 그렇게 강력한 도약을 이루지 못했을 것이며 지금 우리가 가진 것을 갖지 못했을 것입니다.

20세기의 지난 수십 년 동안 과학의 우선 순위가 바뀌었습니다. 연구, 창의적인 파토스는 상업적 관심에 자리를 내주었습니다. 다시 말하지만 이것은 좋지도 나쁘지도 않습니다. 이것은 과학이 점점 더 일상 생활에 통합되는 현실입니다.

21세기에도 이러한 추세는 계속되고 있으며, 우리 시대에 발명의 이면에는 명성과 인지도뿐만 아니라 무엇보다도 돈이 있습니다. 최신 과학기술 성과가 테러단체나 독재정권의 손에 들어가지 않도록 하는 것도 중요한 이유다. 작업은 불가능할 정도로 어렵습니다. 그것을 최대한 실현하는 것은 전 세계 공동체의 과제입니다.

정보는 무기이며 무기는 핵이나 화학 무기보다 덜 위험하지 않습니다. 단지 물리적으로 작용하는 것이 아니라 심리적으로 작용합니다. 인류는 이 경우 자유와 통제 중 무엇이 더 중요한지 생각해야 합니다.

정보기술의 발전과 관련된 최근의 철학적 개념과 이를 이해하려는 시도는 19세기와 20세기 초를 지배했던 자연과학적 유물론과 물질세계의 의미를 부정하는 극단적 관념론의 한계를 동시에 보여주었다. . 현대사상, 특히 서양사상은 주변세계가 물질과 이상으로 명확하게 구분되는 상황에서 이러한 사고의 이원성을 극복하는 것이 중요하다. 이에 대한 길은 문화의 대화, 주변 현상에 대한 다양한 관점의 비교입니다.

역설적이게도 정보 기술은 이 과정에서 중요한 역할을 할 수 있습니다. 컴퓨터 네트워크, 특히 인터넷은 엔터테인먼트와 활발한 상업 활동을 위한 자원일 뿐만 아니라 현대 세계의 다양한 문명의 대표자들 간의 의미 있고 논란이 많은 의사 소통의 수단이기도 합니다. 본. 인터넷은 공간적, 시간적 경계를 넘어선다고 할 수 있습니다.

그리고 정보 기술을 통한 문화의 대화에서 가장 오래된 보편적 의사소통 수단으로서의 언어의 역할은 여전히 ​​중요합니다. 그렇기 때문에 언어학은 수학, 철학, 컴퓨터 과학과의 상호 작용을 통해 두 번째 탄생을 경험하고 오늘날에도 계속 발전하고 있습니다. 현재의 추세는 미래에도 계속 될 것입니다. 15 년 전 동일한 V. Wenders가 예측했듯이 "세상이 끝날 때까지"입니다. 사실, 이 끝이 언제 발생할지는 알 수 없지만 미래가 어쨌든 조만간 현재가 될 것이기 때문에 지금 그것이 중요합니까?


부록 1

페르디낭 드 소쉬르

스위스 언어학자 Ferdinand de Saussure(1857-1913)는 특정 언어와 언어 형태의 역사보다는 언어의 구조를 기술하려는 시도에서 현대 언어학의 창시자로 널리 간주됩니다. 사실, 언어학 및 문학 연구의 구조주의 방법과 기호학의 중요한 분야는 20세기 초에 그의 작업에서 주요 출발점을 찾습니다. Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes 등의 작업인 "후기 구조주의"라고 불리게 된 전략과 개념의 복합체는 Saussure의 작업에서 제안되었다는 주장도 있습니다. 후기 라틴 시의 언어학 및 철자법적 독해 문학적 모더니즘에서 20세기 초반의 정신 분석 및 철학에 이르기까지. Algirdas Julien Greimas와 Joseph Courtés가 Semiotics and Language: An Analytic Dictionary에서 "Interpretation"이라는 제목으로 주장한 것처럼 20세기 초에 소쉬르 언어학, Husserlian 현상학 및 Freud 정신 분석과 동일시하는 새로운 해석 방식이 등장했습니다. 이 양식에서 "해석은 더 이상 주어진 내용을 형식에 귀속시키는 문제가 아닙니다. 오히려 주어진 기호 체계 내에서 의미 요소의 등가 내용을 다른 방식으로 공식화하는 의역입니다." 159). "해석"에 대한 이러한 이해에서 형식과 내용은 구별되지 않습니다. 오히려 모든 "형식"은 의미론적 "내용"이자 "의미하는 형식"이기도 하므로 해석은 이미 다른 의미 시스템 내에서 의미를 나타내는 어떤 것에 대한 유추적 의역을 제공합니다.

클로드 레비스트로스가 "구조와 형태: 블라디미르 프롭의 작품에 대한 성찰"에서 구조주의 개념에 대한 가장 프로그래밍적인 설명 중 하나에서 설명한 형태와 이해의 이러한 재해석은 소쉬르의 사후 과정에 함축되어 있습니다. in General Linguistics (1916, trans., 1959, 1983). 그의 생애 동안 Saussure는 상대적으로 거의 출판하지 않았으며 그의 주요 작업인 Course는 1907-11년에 그가 제공한 일반 언어학의 여러 과정을 학생들이 필사한 것입니다. Course에서 Saussure는 19세기에 행해진 역사적 언어학 작업과 반대되는 언어의 "과학적" 연구를 요구했습니다. 그 작업은 서구 지성의 위대한 업적 중 하나입니다. 언어, 역사적 (또는 "통시적") 언어학은 추정되는 공통 언어 소스, 먼저 "인도 유럽"언어 및 이전 "p"에서 서양 언어의 기원과 발전을 추적했습니다. roto-Indo-European" 언어.

소쉬르가 의문을 제기한 것은 언어의 기본 "단위"가 실제로 이러한 "단어 요소"의 긍정적인 존재라는 수반되는 가정과 함께 단어의 고유한 발생에 대한 연구입니다. 그의 작업은 역사 언어학에서 아주 세밀하게 연구한 언어에 관한 많은 사실을 감당할 수 있는 수의 명제로 축소하려는 시도였습니다. 19세기 문헌학의 "비교학파"는 과정에서 "언어학이라는 진정한 과학을 확립하는 데 성공하지 못했다"고 소쉬르는 말합니다. 그 "본성"은 단순히 언어를 구성하는 "원소적인" 단어(외견상 언어의 "긍정적인" 사실(또는 "실질"))에서 찾을 수 있는 것이 아니라 이러한 요소를 발생시키는 형식적 관계에서 찾을 수 있다고 그는 주장합니다. "물질."

소쉬르의 언어에 대한 체계적 재검토는 세 가지 가정에 기초하고 있다. 첫째, 언어에 대한 과학적 연구는 언어 현상의 역사보다는 체계를 발전시키고 연구해야 한다는 것이다. 그가 가석방(parole)이라고 부르는 특정한 "말-사건"과 언어학의 적절한 대상, 그가 랑그(langue)라고 부르는 그러한 사건을 지배하는 체계(또는 "코드"). 이러한 체계적인 연구는 더욱이 " 역사를 통해 언어의 발달에 대한 "통시적" 연구라기보다는 특정 순간에 언어의 요소들 사이의 관계에 대한 공시적" 개념.

이 가정은 1929년에 Roman Jakobson이 "구조주의"로 지정하게 된 것을 야기했습니다. "현대 과학에 의해 조사된 모든 현상은 기계적 집합체가 아니라 구조적 전체로 취급됩니다. 프로세스의 기계적 개념은 다음 질문에 굴복합니다. 그들의 기능"("로맨틱" 711). 이 구절에서 Jakobson은 역사적 사건에 대한 단순하고 "기계적인" 설명이 아닌 과학 체계로서 언어학을 정의하려는 Saussure의 의도를 명확히 표현하고 있습니다. 이와 함께 Jakobson은 또한 Saussurean의 두 번째 기본 가정을 설명하고 있습니다. 이제 그것을 "구조적"이라고 부릅니다 – 언어학: 언어의 기본 요소는 그 원인이 아니라 기능과 관련하여 연구될 수 있습니다. 유럽의 "단어"), 그러한 사건과 실체는 체계적인 틀 안에 위치해야 합니다. 이것은 다른 소위 사건 및 실체와 관련되어 있습니다. 이것은 경험과 현상을 이해하는 데 있어서 급진적인 재정향이며, 철학자 Ernst Cassirer는 이것의 중요성을 "17세기에 우리의 전체를 변화시킨 갈릴레오의 새로운 과학"과 비교했습니다. 물리적 세계의 개념"(Culler, Pursuit 2에서 인용) 4). Greimas와 Courtés가 지적한 바와 같이 이러한 변화는 "해석"을 재고하고 따라서 설명과 이해 자체를 재고합니다. 설명은 "현상"의 원인에 관한 것이므로 "결과"로서 어떤 방식으로 원인에 종속되는 대신, 여기에서 설명은 현상을 미래 지향적인 "기능"에 종속시키는 것으로 구성됩니다. "목적." 설명은 더 이상 인간의 의도나 목적과 무관하지 않습니다(비인격적, 공동적 또는 프로이트 용어로 "무의식"일 수 있음에도 불구하고).

그의 언어학에서 Saussure는 특히 언어적 "단어"의 재정의에서 이러한 변형을 수행합니다. 그는 언어적 "기호"로 설명하고 기능주의 용어로 정의합니다. 그는 기호가 "개념과 소리 이미지"의 결합이라고 주장하며, 이를 "기표와 기표"라고 불렀습니다(66-67; Roy Harris의 1983년 번역은 "의미"와 "신호"라는 용어를 제공합니다). 그들의 "결합"의 본질은 기의도 기표도 다른 것의 "원인"이 아니라 "각각이 다른 것의 가치"(8)라는 점에서 "기능적"입니다. 언어의 요소, 기호 , 관계적으로 역사적 언어학의 기본 가정, 즉 언어와 의미의 기본 단위(즉, "단어")의 동일성을 엄격한 분석 대상으로 만듭니다. "나무"라는 단어가 "같은" 단어가 아니기 때문입니다 단어는 고유한 특성에 의해 정의됩니다. 이러한 특성의 "기계적 집합체"가 아니라 언어의 "구조적 전체"인 시스템의 요소로 정의되기 때문입니다.

개체의 이러한 관계형(또는 "분음 구별") 정의는 구조 언어학에서 언어의 모든 요소 개념을 지배합니다. 이것은 소쉬르 언어학의 가장 인상적인 업적, 즉 언어의 "음소" 및 "독특한 특징" 개념의 발전에서 가장 분명합니다. 음소는 언어의 가장 작은 분절 및 의미 단위입니다. 그것들은 언어에서 발생하는 소리가 아니라 소쉬르가 언급한 "소리 이미지"이며, 이는 화자가 의미를 전달하는 것으로 이해합니다. (따라서 Elmar Holenstein은 중요한 방식으로 Saussure를 따르는 Jakobson의 언어학을 "현상학적 구조주의"라고 설명합니다.) 프라하 학파 구조주의의 주요 대변인인 Jan Mukarovsky가 1937년에 "구조 . . . 경험적 현실이 아니라 현상학적 현실이다. 그것은 작품 자체가 아니라 집단(세대, 환경 등)의 의식에 위치한 일련의 기능적 관계입니다."(갈랑 35에서 인용) 마찬가지로 프랑스 구조주의의 주요 대변인인 Lévi-Strauss , 1960년에 "구조에는 뚜렷한 내용이 없습니다. 그것은 내용 그 자체이며, 그것이 구속되는 논리적 조직은 실재의 재산으로 생각된다"(167; 또한 Jakobson, Fundamentals 27-28 참조).

따라서 언어의 가장 작은 지각 요소인 음소는 긍정적 대상이 아니라 "현상학적 실재"입니다. 예를 들어 영어에서 음소 /t/는 다양한 방식으로 발음될 수 있지만 모든 경우에 영어 사용자는 /t/로 기능하는 것으로 인식합니다. 흡기 t(즉, 뒤에 h와 같은 호흡으로 발음되는 t), 고음 또는 저음 t 소리, 확장된 t 소리 등은 모두 동일한 방식으로 다음의 의미를 구별하는 기능을 합니다. 영어로 "to"와 "do". 더욱이 언어 간의 차이는 한 언어의 음운 변화가 다른 언어에서는 뚜렷한 음소를 구성할 수 있다는 점입니다. 따라서 영어는 /l/과 /r/을 구별하는 반면, 다른 언어는 이러한 조음이 동일한 음소의 변형으로 간주되도록 구조화되어 있습니다(예: 영어의 흡음 및 흡음 t). 모든 자연어에서 사용 가능한 방대한 수의 단어는 소수의 음소 조합입니다. 예를 들어 영어는 40개 미만의 음소가 결합되어 100만 개가 넘는 단어를 형성합니다.

언어의 음소는 그 자체로 체계적으로 조직된 특징의 구조이다. 1920년대와 1930년대에 Saussure의 리드에 따라 Jakobson과 N. S. Trubetzkoy는 음소의 "독특한 특징"을 분리했습니다. 이러한 특징은 언어 기관(혀, 치아, 성대 등)의 생리학적 구조를 기반으로 합니다. Saussure는 과정에서 Harris가 "생리학적 음성학"( 39; Baskin의 이전 번역은 "음운론"[(1959) 38]이라는 용어를 사용함)으로 설명한다고 언급했습니다. 예를 들어, 영어에서 /t/와 /d/의 차이는 "목소리"(성대의 결합)의 유무이며, 유성 수준에서 이러한 음소는 상호적으로 서로를 정의합니다. 이런 식으로 음운론은 소쉬르가 설명한 언어의 일반 규칙의 구체적인 예입니다. 언어에는 차이점만 있습니다. 훨씬 더 중요합니다. 차이는 일반적으로 차이가 설정되는 양의 용어를 의미합니다. 그러나 언어에는 긍정적인 용어가 없는 차이만 있을 뿐입니다. 우리가 기의를 취하든 기표를 취하든 언어는 언어 체계 이전에 존재했던 관념도 소리도 가지고 있지 않다. ( 120)

이 프레임워크에서 언어 정체성은 고유한 특성이 아니라 체계적("구조적") 관계에 의해 결정됩니다.

나는 음운론이 Saussure의 "선도를 따랐다"고 말했는데, 왜냐하면 그의 언어 생성 생리학에 대한 그의 분석이 Harris가 말했듯이 "요즘에는" "심리적" 또는 "기능적"이 아니라 "물리적"이라고 불릴 것이기 때문입니다. ""(읽기 49), 결과적으로 과정에서 그는 언어의 기능적 분석의 방향과 개요를 분명히 설명했습니다. 유사하게, 1878년에 등장한 그의 유일한 확장 출판물인 Mémoire sur le système primitif des voyelles dans les langues indo-européennes(인도유럽어의 초기 모음 체계에 관한 회고록)는 19세기 프로젝트에 완전히 포함되었습니다. 세기 역사 언어학. 그럼에도 불구하고, 이 작업에서, 조나단 컬러(Jonathan Culler)가 주장한 바와 같이, 소쉬르는 "역사적 재구성 작업을 할 때에도 언어를 순전히 관계적인 항목의 체계로 생각하는 다산성"을 보여주었습니다(Saussure 66). Saussure는 기존 인도-유럽 언어의 모음 교체 패턴을 설명하기 위해 음소 간의 체계적인 구조적 관계를 분석함으로써 몇 가지 다른 음소 /a/ 외에도 형식적으로 기술될 수 있는 또 다른 음소가 있었음에 틀림없다고 제안했습니다. Culler는 "소쉬르의 작업이 매우 인상적이었던 것은 거의 50년 후 설형 문자 히타이트어가 발견되고 해독되었을 때 소쉬르가 예측한 대로 작동하는 음소 h를 포함하는 것으로 밝혀졌다는 사실"이라고 결론지었습니다. . 그는 순전히 형식적인 분석을 통해 현재 인도유럽어의 후두라고 알려진 것을 발견했습니다."(66)

기적수업에서 함축적이면서도 명시적인 의미 작용 요소의 관계적 또는 분음적 결정에 대한 이러한 개념은 구조적 언어학을 지배하는 세 번째 가정, 즉 소쉬르가 "기호의 자의적 성질"이라고 부르는 것을 제안합니다. 이것에 의해 그는 언어에서 기표와 기의 사이의 관계가 결코 필요하지 않다는 것을 의미합니다(또는 "동기 부여"). "나무"라는 개념과 결합하기 위해 기표 나무처럼 쉽게 소리 기표 arbre를 찾을 수 있습니다. 그러나 이것보다 더 중요한 것은 기의가 또한 자의적이라는 것을 의미합니다. "나무"라는 개념을 나무의 크기(우리가 "낮은 목본 식물"을 제외함)만큼 나무의 특성(야자수는 제외)으로 쉽게 정의할 수 있습니다. 전화 부시). 이것은 내가 제시한 가정의 번호 매기기가 우선 순위를 나타내지 않는다는 것을 분명히 해야 합니다: 각 가정 – 의미 작용의 체계적 특성("동기적으로" 언어를 공부함으로써 가장 잘 이해됨), 요소의 관계적 또는 "분음 구별적" 특성 기호의 자의적 특성인 의미 작용의 가치는 다른 것에서 파생됩니다.

즉, Saussurean 언어학은 언어의 조합과 대조의 포괄적인 관계에서 연구하는 현상입니다. 이 개념에서 언어는 의미(의미)를 표현하는 과정이자 그 산물(의사소통)이며, 언어의 이 두 기능은 동일하지도 완전히 일치하지도 않습니다(Schleifer, "해체" 참조). 여기에서 우리는 그레마스와 쿠르테가 모더니스트 해석에서 기술한 형식과 내용 사이의 교대를 볼 수 있습니다. 게다가 언어의 요소는 자의적이기 때문에 대조도 조합도 기본이라고 할 수 없다. 따라서 언어의 구별되는 특징들이 결합하여 또 다른 이해 수준에서 대조되는 음소를 형성하고, 음소가 결합하여 대조되는 형태소를 형성하고, 형태소가 결합하여 단어를 형성하고, 단어가 결합하여 문장을 형성하는 등의 방식으로 진행됩니다. 각각의 예에서 전체 음소, 단어 또는 문장 등은 부분의 합보다 큽니다(소쉬르의 예[(1959) 103]에서 물, H2O가 기계적 응집보다 더 큰 것과 같습니다) 수소와 산소).

일반 언어학 과정의 세 가지 가정으로 인해 소쉬르는 언어 과학을 넘어 "사회 내 기호의 삶"을 연구할 20세기의 새로운 과학을 요구했습니다. Saussure는 이 과학을 "기호학(그리스어 semeîon "기호"에서 유래)"(16)이라고 명명했습니다. 기호학의 "과학"은 1920년대와 1930년대에 동유럽, 1950년대와 1960년대에 파리에서 시행되었기 때문에 언어 및 언어 구조에 대한 연구를 그러한 구조로 구성된(또는 분절된) 문학적 인공물로 확장했습니다. 더군다나 경력 후반기에 일반 언어학 과정을 제공하는 동안에도 Saussure는 고의적으로 숨겨진 고유명사의 아나그램을 발견하기 위해 후기 라틴 시에 대한 자신의 "기호학적" 분석을 추구했습니다. 연구 방법은 여러 면에서 그의 언어 분석의 기능적 합리주의와 정반대였습니다. 소쉬르가 이 연구를 추구한 99권의 노트 중 하나에서 언급한 것처럼 "우연"의 문제를 체계적으로 조사하려고 시도했습니다. 모든 것의 불가피한 기초가 된다"(Starobinski 101에서 인용). 소쉬르 자신이 말했듯이 그러한 연구는 우연과 의미의 "물질적 사실"(인용 101)에 초점을 맞추므로 Jean Starobinski가 주장하듯이 소쉬르가 찾고 있는 "주제-단어"는 "시인을 위한 것"입니다. , 도구이지 시의 중요한 세균이 아닙니다. 시는 주제어의 음운적 재료를 다시 사용하는 데 필요합니다"(45). 이 분석에서 Starobinski는 "소쉬르는 숨겨진 의미를 찾는 데 자신을 잃지 않았습니다. "라고 말합니다. 오히려 그의 작업은 의식에서 발생하는 모든 문제를 회피하려는 욕망을 보여주는 것 같다. "(121).

즉, 후기 라틴 시에서 고유명사를 발견하려는 소쉬르의 시도, 즉 Tzvetan Todorov가 "단어의 축소"라고 부르는 것입니다. . . to its signifier"(266) – 그의 언어 분석을 지배하는 요소 중 하나인 기호의 자의적 특성을 강조합니다. (그것은 또한 소쉬르 언어학의 형식적 특성을 강조합니다. 의미론을 분석의 주요 대상으로 효과적으로 제거합니다.) Todorov가 결론을 내린 것처럼, Saussure의 작업은 오늘날 상징적 현상을 받아들이기를 거부한다는 점에서 현저하게 동질적으로 보입니다. . . . 철자법에 대한 그의 연구에서 그는 연상 현상이 아닌 반복 현상에만 주목한다. . . . Nibelungen에 대한 그의 연구에서 그는 잘못된 읽기에 기인하기 위해서만 기호를 인식합니다. 기호는 의도적이지 않기 때문에 기호는 존재하지 않습니다. 마지막으로 일반 언어학 과정에서 그는 기호학의 존재, 따라서 언어 기호 이외의 기호에 대해 고찰합니다. 그러나 이 확언은 기호학이 단일 유형의 기호, 즉 자의적인 기호에 전념한다는 사실에 의해 즉시 제한됩니다. (269-70)

이것이 사실이라면 그것은 소쉬르가 주체 없이 "의도"를 생각할 수 없었기 때문입니다. 그는 형식과 내용 사이의 대립에서 완전히 벗어날 수 없었습니다. 대신 그는 "언어 적 합법성"에 의지했습니다. 한편으로는 역사, 주관성, 그리고 이러한 개념에 의해 지배되는 인과적 해석 방식에 대한 19세기 개념과 다른 한편으로는 Lévi-Strauss가 "없는 칸트주의"라고 부른 20세기 "구조주의" 개념 사이에 위치합니다. a 초월적 주체"(Connerton 23에서 인용) – 형식과 내용(또는 주체와 객체) 사이의 대립과 본격적인 구조주의, 정신 분석, 심지어 양자 역학에서 전경과 배경의 위계를 지우는 개념 – Ferdinand의 작업 언어학과 기호학의 드 소쉬르는 의미와 문화 연구에서 중요한 순간을 제한합니다.

로날드 슐라이퍼


부록 2

페르디낭 드 소쉬르(번역)

스위스 언어학자 페르디낭 드 소쉬르(1857-1913)는 개별 언어와 단어 형태의 역사보다는 언어의 구조를 기술하려는 시도 덕분에 현대 언어학의 창시자로 여겨진다. 대체로 20세기 초에 그의 작품에서 언어학 및 문학 비평, 그리고 상당 부분 기호학의 구조적 방법의 토대가 마련되었습니다. Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes 등의 작업에서 발전된 소위 "후기 구조주의"의 방법과 개념은 Saussure와 후기 로마시의 아나그램 읽기. 언어학 및 언어 해석에 대한 소쉬르의 작업은 물리학에서 문학적 혁신, 정신 분석 및 20세기 초 철학에 이르기까지 광범위한 지적 학문을 연결하는 데 도움이 된다는 점에 유의해야 합니다. A. J. 그레마스(A. J. Greimas)와 J. 쿠르테(J. Kurte)는 기호학과 언어(Semiotics and Language)에서 “20세기 초 소쉬르의 언어학, 후설의 현상학, 정신분석학 등과 함께 새로운 종류의 해석으로서 “해석”이라는 제목의 분석사전이 등장하였다. 프로이트의. 그러한 경우, "해석은 주어진 내용이 없었을 형식에 주어진 내용을 귀속시키는 것이 아니라 주어진 기호 체계 내에서 중요한 요소의 동일한 내용을 다른 방식으로 공식화하는 의역입니다"(159) ). "해석"에 대한 이러한 이해에서 형식과 내용은 분리할 수 없습니다. 반대로 각 형식은 의미론적 의미("의미 있는 형식")로 채워지므로 해석은 다른 기호 시스템에서 의미 있는 것을 새롭고 유사한 방식으로 다시 설명합니다.

클로드 레비스트로스가 구조주의의 주요 작품 중 하나인 "구조와 형태: 블라디미르 프로프의 작품에 대한 고찰"에서 제시한 형태와 내용에 대한 유사한 이해는 소쉬르가 사후에 출판한 책 A Course in에서 볼 수 있습니다. 일반 언어학 (1916, trans., 1959, 1983). 그의 생애 동안 소쉬르는 거의 출판하지 않았으며, 그의 주요 작품인 "코스"는 1907-11년에 일반 언어학에 대한 그의 강의에 참석한 학생들의 노트에서 수집되었습니다. Course에서 Saussure는 언어에 대한 "과학적" 연구를 요구하여 19세기 비교-역사적 언어학과 대조했습니다. 이 작업은 서양 사상의 가장 위대한 업적 중 하나로 간주 될 수 있습니다. 개별 단어를 언어의 구조적 요소로 기초로 삼아 역사적 (또는 "통시적") 언어학은 서유럽 언어의 기원과 발전을 증명했습니다. 일반적인 인도 유럽 언어 - 그리고 초기 인도 유럽 조어.

소쉬르가 의문을 제기한 것은 언어의 기본 "단위"가 실제로 이러한 "단어 요소"의 긍정적인 존재라는 부수적인 가정과 함께 단어의 고유한 발생에 대한 연구입니다. 그의 작업은 비교 언어학에서 우연히 연구한 언어에 대한 많은 사실을 소수의 정리로 축소하려는 시도였습니다. 19세기의 비교 철학 학파는 "연구 대상의 본질을 이해하지 못했기" 때문에 "진정한 언어학 학파를 만드는 데 성공하지 못했다"(3)고 소쉬르(Saussure)는 썼습니다. 그는 이 "본질"이 언어의 "긍정적 실체"인 개별 단어에 있을 뿐만 아니라 이러한 실체가 존재하도록 돕는 형식적 연결에도 있다고 주장합니다.

Saussure의 언어 "테스트"는 세 가지 가정을 기반으로 합니다. 첫째, 언어에 대한 과학적 이해는 역사적 근거가 아니라 구조적 현상에 근거한다. 따라서 그는 언어의 개별 현상, 즉 그가 "가석방"으로 정의하는 "말의 사건"과 적절한 언어학 연구 대상, 이러한 사건을 제어하는 ​​시스템(코드, 구조)을 구별했습니다. "랑그"). 더욱이 그러한 체계적인 연구는 언어의 역사를 통한 언어 발달에 대한 "통시적" 연구가 아니라 주어진 순간에 언어의 요소들 사이의 관계에 대한 "동시적" 개념을 요구합니다.

이 가설은 1929년 로만 야콥슨(Roman Jakobson)이 "구조주의(structuralism)"라고 부른 것, 즉 "현대 과학에 의해 조사된 모든 현상은 기계적인 축적이 아니라 구성 요소가 기능"("로맨틱 "711). 이 구절에서 Jakobson은 역사적 사건의 "기계적" 열거가 아닌 구조로 언어를 정의하는 Saussure의 아이디어를 정식화했습니다. 또한 Jakobson은 구조 언어학의 선구자가 된 또 다른 Saussurean 가정을 개발합니다. 언어의 기본 요소는 그 원인이 아니라 기능과 관련하여 연구되어야 합니다. 별도의 현상 및 사건(즉, 개별 인도-유럽어 단어의 기원에 대한 역사)은 그 자체로 연구되는 것이 아니라 유사한 구성 요소와 상호 연관되는 시스템에서 연구되어야 합니다. 이것은 현상을 주변 현실과 비교하는 근본적인 전환이었고, 철학자 Ernst Cassirer는 "17세기에 물질 세계에 대한 생각을 뒤집은 갈릴레오의 과학"과 비교했습니다. 현상은 발생 원인과 관련하여 해석되기 시작했지만 현재와 미래에 미칠 수 있는 영향과 관련하여 해석되기 시작했습니다. Freud의 의미에서 "무의식"이라는 단어).

그의 언어학에서 소쉬르는 특히 언어학에서 단어 개념의 변화에서 이러한 전환을 보여주는데, 그는 단어를 기호로 정의하고 그 기능으로 설명합니다. 그를위한 기호는 소리와 의미의 조합, "의미 및 지정"(66-67; Roy Harris의 1983 년 영어 번역- "의미"및 "신호")입니다. 이 화합물의 본질은 "기능적"입니다(하나도 다른 요소도 서로 없이 존재할 수 없음). 더욱이 "한 사람은 다른 사람에게서 자질을 빌린다"(8). 따라서 소쉬르는 언어의 주요 구조적 요소인 기호를 정의하고 역사언어학의 기초를 기호와 단어의 동일성을 특히 엄밀한 분석이 필요로 합니다. 따라서 우리는 같은 단어 "나무"의 다른 의미를 이해할 수 있습니다. 단어가 특정 특성의 집합이기 때문이 아니라 "구조적 전체"에서 기호 시스템의 요소로 정의되기 때문입니다. 언어로.

이러한 상대적("분음 구별") 통일성 개념은 구조 언어학에서 언어의 모든 요소 개념의 근간을 이룹니다. 이것은 소쉬르 언어학의 가장 독창적인 발견, 언어의 "음소" 및 "특징" 개념의 발전에서 특히 분명합니다. 음소는 음성 및 의미 있는 언어 단위 중 가장 작은 단위입니다. 그것들은 언어에서 발생하는 소리일 뿐만 아니라 원어민이 의미를 갖는 것으로 인식하는 "사운드 이미지"라고 Saussure는 말합니다. (엘마 홀렌슈타인은 주요 조항에서 소쉬르의 사상과 개념을 이어가는 야콥슨의 언어학을 "현상학적 구조주의"라고 부른다는 점에 유의해야 한다.) 이것이 바로 프라하 구조주의 학파의 주요 연사인 Jan Mukarowski가 1937년에 "구조. . . 경험적 개념이 아니라 현상학적 개념이다. 그것은 결과 그 자체가 아니라 집단의식(세대, 타자 등)의 중요한 관계들의 집합이다.” 비슷한 생각이 1960년에 프랑스 구조주의의 지도자인 Lévi-Strauss에 의해 표현되었습니다. “구조에는 명확한 내용이 없습니다. 그것은 그 자체로 의미가 있으며 그것을 포함하는 논리적 구성은 현실의 각인입니다.

차례로, 인식에 허용되는 가장 작은 언어 요소인 음소는 별도의 통합 "현상학적 현실"을 나타냅니다. 예를 들어 영어에서 "t" 소리는 다르게 발음될 수 있지만 모든 경우에 영어를 사용하는 사람은 "t"로 인식합니다. 흡인, 상승 또는 하강, 긴 "t" 소리 등은 "to"와 "do"라는 단어의 의미를 똑같이 구별합니다. 또한 언어 간의 차이점은 한 언어의 한 소리가 다른 음소에 해당할 수 있다는 것입니다. 예를 들어 영어의 "l"과 "r"은 다른 반면 다른 언어에서는 동일한 음소의 변형입니다(예: 영어 "t", 열망 유무에 관계없이 발음). 모든 자연어의 광대한 어휘는 훨씬 적은 수의 음소 조합의 집합입니다. 예를 들어 영어에서는 40개의 음소만 사용하여 약 백만 단어를 발음하고 씁니다.

언어의 소리는 체계적으로 구성된 일련의 기능입니다. 1920년대-1930년대에 Saussure에 이어 Jacobson과 N.S. Trubetskoy는 음소의 "독특한 특징"을 골라냈습니다. 이러한 기능은 언어 기관(혀, 치아, 성대)의 구조를 기반으로 합니다. Saussure는 "일반 언어학 과정"에서 이를 언급하고 Harris는 이를 "생리학적 음성학"이라고 부릅니다(Baskin의 이전 번역에서 "음운론"이라는 용어는 " 사용됨) - 소리를 내기 위해 친구와 "매듭 » durg로 연결됩니다. 예를 들어 영어에서 "t"와 "d"의 차이는 "voice"(성대의 긴장)의 유무와 음소를 구분하는 음성의 크기입니다. 따라서 음운론은 Saussure가 설명한 일반 언어 규칙의 예로 간주할 수 있습니다. "언어에는 차이가 있을 뿐입니다." 훨씬 더 중요한 것은 이것이 아닙니다. 차이는 일반적으로 그것이 위치한 정확한 조건을 의미합니다. 그러나 언어에는 정확한 조건 없이 차이만 있을 뿐입니다. 우리가 "지정"을 고려하든 "의미"를 고려하든 언어 시스템이 개발되기 전에 존재했을 개념이나 소리가 언어에는 없습니다.

그러한 구조에서 언어적 유비는 고유한 특성의 도움으로 정의되는 것이 아니라 체계(“구조적”) 관계의 도움으로 정의됩니다.

나는 음운론의 발전이 소쉬르의 생각에 의존했다고 이미 언급했습니다. 현대의 언어 생리학에 대한 그의 분석은 "'심리적' 또는 '기능적'이 아니라 '물리적'이라고 불릴 것이지만 The Course에서 그는 언어의 기능적 분석의 방향과 기본 원칙을 명확하게 설명했습니다. 1878년에 출판된 그의 생애 유일한 출판물인 Mémoire sur le système primitif des voyelles dans les langues indo-européennes(인도-유럽 언어의 원래 모음 체계에 대한 노트)는 1878년의 비교 역사 언어학과 완전히 일치했습니다. 19 세기. 그럼에도 불구하고, 이 작업에서 소쉬르는 "역사적 재구성을 통해서도 상호 연결된 현상의 체계로서의 언어 개념의 결실"을 보여주었다고 조나단 컬러(Jonathan Culler)는 말합니다. 음소 간의 관계를 분석하고 인도 유럽어 그룹의 현대 언어에서 모음의 교대를 설명하면서 Saussure는 여러 가지 다른 소리 "a"외에도 공식적으로 설명되는 다른 음소가 있어야한다고 제안했습니다. Kaller는 "소쉬르의 작업이 특히 인상적이었던 것은 거의 50년 후 히타이트 설형 문자가 발견되고 해독되었을 때 소쉬르가 예측한 대로 작동하는 "h"로 표시된 서면 음소가 발견되었다는 것입니다. 형식 분석을 통해 그는 현재 인도유럽어에서 목음으로 알려진 것을 발견했습니다.

코스에서 명시적이든 암시적이든 기호의 상대적(분음 구별) 정의 개념에는 구조 언어학의 세 번째 핵심 가정이 있는데, 이는 소쉬르가 "기호의 자의적 성질"이라고 불렀습니다. 이것은 언어에서 소리와 의미 사이의 관계가 어떤 것에 의해 동기가 부여되지 않는다는 것을 의미합니다. "수목"이라는 단어와 "나무"라는 단어를 "나무"라는 개념과 쉽게 연결할 수 있습니다. 더욱이 이것은 소리도 임의적이라는 것을 의미합니다. "나무"의 개념은 나무 껍질의 존재 (야자수 제외)와 크기 ( "낮은 목본 식물"-관목 제외)로 정의 할 수 있습니다. 이것으로부터 내가 제시하는 모든 가정이 점점 더 중요하지 않은 것으로 나뉘지 않는다는 것이 분명해야합니다. 각각-기호의 체계적 특성 (언어의 "동기"연구에서 가장 이해할 수 있음), 상대적 (분음 부호) 본질, 기호의 임의적 특성은 나머지에서 나옵니다.

따라서 소쉬르 언어학에서 연구된 현상은 언어의 비교와 대립의 집합으로 이해됩니다. 언어는 단어의 의미(지정)와 그 결과(의사소통)의 표현이며 이 두 기능은 결코 일치하지 않습니다(Shleifer의 "언어 해체" 참조). 우리는 Greimas와 Kurte가 최신 버전의 해석에서 설명하는 형식과 내용의 교대를 볼 수 있습니다. 언어적 대조는 구조 단위를 정의하고 이러한 단위는 연속적인 수준에서 상호 작용하여 특정 의미 있는 내용을 생성합니다. 언어의 요소는 무작위적이기 때문에 대조도 조합도 근거가 될 수 없다. 즉, 언어에서 구별되는 특징은 서로 다른 이해 수준에서 음운 대비를 형성하고, 음소는 대조되는 형태소로, 형태소는 단어로, 단어는 문장으로 결합됩니다. 어쨌든 전체 음소, 단어, 문장 등 부분의 합 이상입니다(소쉬르의 예에서 물이 수소와 산소의 결합 이상인 것처럼).

"일반 언어학 과정"의 세 가지 가정은 소쉬르로 하여금 "사회에서 기호의 삶"을 연구하는 언어학과 별개인 20세기의 새로운 과학에 대한 아이디어로 이끌었습니다. Saussure는 이것을 과학 기호학이라고 불렀습니다(그리스어 "semeîon" - 기호). 1920년대와 1930년대에 동유럽, 1950년대와 1960년대에 파리에서 발전한 기호학의 "과학"은 언어와 언어 구조에 대한 연구를 이러한 구조의 도움으로 구성(또는 공식화)된 문학적 발견으로 확장했습니다. 또한 그의 경력의 황혼기에 일반 언어학 과정과 병행하여 Saussure는 의도적으로 구성된 고유 이름의 철자 바꾸기를 발견하려고 노력하면서 후기 로마시의 "기호 학적"분석에 참여했습니다. 이 방법은 여러면에서 언어 분석에서 합리주의와 반대였습니다. Saussure가 99 개의 노트북 중 하나에 쓴 것처럼 시스템에서 "모든 것의 기초가되는"개연성 "의 문제를 연구하려는 시도였습니다. " Saussure 자신이 주장하는 그러한 조사는 확률의 "실제 측면"에 초점을 맞추는 데 도움이 됩니다. 소쉬르가 애너그램을 찾고 있는 "키워드"는 Jean Starobinsky에 따르면 "시인을 위한 도구이지 시의 삶의 원천이 아닙니다. 시는 핵심 단어의 소리를 뒤집는 역할을 합니다. Starobinsky에 따르면 이 분석에서 "소쉬르는 숨겨진 의미를 탐구하지 않습니다." 반대로 그의 작품에서는 의식과 관련된 질문을 회피하려는 욕구가 눈에 띈다. 언어의 법칙.”

후기 로마 시에서 고유명사를 연구하려는 소쉬르의 시도(Tsvetan Todorov는 이것을 "단어 ... 그것이 쓰여지기 전의 것"의 약어라고 불렀습니다)는 그의 언어 분석의 구성 요소 중 하나인 기호의 임의적 특성을 강조합니다. Saussurean 언어학의 형식적 본질("언어"는 "현상이 아니라 형식의 본질"이라고 주장함)은 의미를 분석할 가능성을 배제합니다. Todorov는 오늘날 Saussure의 글이 기호[의미가 잘 정의된 현상] 연구를 꺼리는 점에서 현저하게 일관성이 있는 것처럼 보인다고 결론지었습니다. . . . 애너그램을 탐색하면서 Saussure는 반복에만 주의를 기울이고 이전 옵션에는 주의를 기울이지 않습니다. . . . Nibelungenlied를 연구하면서 그는 잘못된 읽기에 할당하기 위해서만 기호를 정의합니다. 의도하지 않은 경우 기호는 존재하지 않습니다. 결국, 일반 언어학에 관한 그의 글에서 그는 언어 기호뿐만 아니라 기호학의 존재를 가정합니다. 그러나 이 가정은 기호학이 무작위적이고 자의적인 기호만을 기술할 수 있다는 사실에 의해 제한됩니다.

만약 이것이 사실이라면 그것은 그가 대상 없이는 "의도"를 상상할 수 없었기 때문입니다. 그는 형식과 내용 사이의 간격을 완전히 메울 수 없었습니다. 그의 글에서 이것은 질문으로 바뀌었습니다. 대신 그는 "언어 적 정당성"으로 전환했습니다. 한편으로는 역사와 주관적 추측에 기초한 19세기 개념과 이러한 개념에 기초한 우연적 해석의 방법, 그리고 다른 한편으로는 레비스트로스가 "초월이 없는 칸트주의"라고 부른 구조주의적 개념 사이에서 배우" - 형식과 내용(주체와 객체), 구조주의, 정신분석학, 심지어 양자역학에서 의미와 기원 사이의 대립을 지우는 언어학과 기호학에 관한 Ferlinand de Saussure의 저술은 언어와 문화의 의미 연구에서 전환점을 표시합니다.

로널드 슈레이퍼

문학

1. Admoni V.G. 문법 이론의 기초 / V.G. 훈계; 소련 과학 아카데미.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. 언어학의 수학적 방법. M., 1974.

4. 아놀드 I.V. 현대영어 단어의 의미구조와 연구방법론. /I.V. Arnold-L .: 교육, 1966. - 187 p.

6.Bashlykov A.M. 자동 번역 시스템. / 오전. Bashlykov, A.A. 소콜로프. - M .: FIMA LLC, 1997. - 20p.

7. Baudouin de Courtenay: 이론적 유산과 현대성: 국제 과학 회의 보고서 초록 / Ed.I.G. Kondratiev. - 카잔: KGU, 1995. - 224p.

8. A. V. Gladkiy, 수학적 언어학의 요소. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198p.

9. 골로빈, B.N. 언어 및 통계. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. 이론 및 응용 언어학. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. 의미론. 통사론. 형태. // V.B. Kasevich-M., 1988. - 292p.

12. Lekomtsev Yu.K. 언어학의 공식 언어 소개 / Yu.K. Lekomtsev. – M.: Nauka, 1983, 204 p., ill.

13. 20세기 말 Baudouin de Courtenay의 언어 유산: 2000년 3월 15-18일 국제 과학 및 실무 회의 요약. - 크라스노야르스크, 2000. - 125p.

Matveeva G.G. 숨겨진 문법적 의미와 화자의 사회적 인물("초상화") 식별 / G.G. Matveev. - Rostov, 1999. - 174p.

14. Melchuk, I.A. 언어 모델 구축 경험 "의미<-->텍스트". / I.A. Melchuk. - M., 1974. - 145 p.

15. Nelyubin L.L. 번역 및 응용 언어학 / L.L. 넬류빈. - M. : 고등학교, 1983. - 207 p.

16. 정확한 언어 연구 방법: 소위 "수학적 언어학" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva 및 기타 - M., 1961. - 162 p.

17. Piotrovsky L.G. 수학적 언어학: 교과서 / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. -M.: 고등학교, 1977. - 160p.

18. 그는 그렇습니다. 텍스트, 기계, 사람. - L., 1975. - 213p.

19. 그는 그렇습니다. 응용 언어학 / Ed. AS 게르다. - L., 1986. - 176p.

20. 레진, I.I. 언어 모델. M., 1963. Revzin, I.I. 현대 구조 언어학. 문제 및 방법. M., 1977. - 239p.

21. Revzin, I.I., Rozentsveig, V.Yu. 일반 및 기계 번역의 기초 / Revzin I.I., Rozentsveig, V.Yu. -M., 1964. -401p.

22. Slyusareva N.A. 현대 언어학에 비추어 F. de Saussure의 이론 / N.A. Slyusareva. -M.: Nauka, 1975. - 156p.

23. 올빼미, L.Z. 분석 언어학 / L.Z. 올빼미 - M., 1970. - 192 p.

24. 소쉬르 F. 드. 일반 언어학에 대한 주석 / F. de Saussure; 당. fr에서. – M.: Progress, 2000. – 187p.

25. 그는 그렇습니다. 일반 언어학 코스 / Per. fr에서. - 예카테린부르크, 1999. -426p.

26. 음성 통계 및 자동 텍스트 분석 / Ed. 에드. R.G. Piotrovsky. L., 1980. - 223p.

27. Stoll, P. 세트. 논리. 공리 이론. / R. Stoll; 당. 영어로부터. - M., 1968. - 180p.

28. Tenier, L. 구조적 구문의 기초. M., 1988.

29. 우빈 I.I. 소련의 번역 활동 자동화 / I.I. 우빈, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28p.

30. Faure, R., Kofman, A., Denis-Papin, M. 현대 수학. M., 1966.

31. Shenk, R. 개념 정보 처리. M., 1980.

32. Shikhanovich, Yu.A. 현대 수학 입문(초기 개념). M., 1965

33. Shcherba L.V. 질적 및 양적 용어의 러시아어 모음 / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. 세계 시민 // Ogonyok - 1996. - No. 5. – p.13

35. VA Uspensky. Andrei Nikolaevich Kolmogorov의 기호 메시지에 대한 "New Literary Review"독자를위한 예비. - 새로운 문학 리뷰. -1997. - 24호. - S. 18-23

36. Perlovsky L. 의식, 언어 및 문화. - 아는 것이 힘이다. –2000. 4번 - S. 20-33

37. Frumkina R.M. 회사 소개 - 비스듬히. // 러시아 저널. - 2000. - 1위. – 12페이지

38. Fitialov, S.Ya. 구조 언어학의 구문 모델링 // 구조 언어학의 문제. M., 1962.

39. 그는 그렇습니다. NN 문법과 종속성 문법의 동등성에 대해 // 구조 언어학의 문제. M., 1967.

40. Chomsky, N. 언어 이론의 논리적 기초 // 언어학의 새로운 기능. 문제. 4. M., 1965

41. 슐라이퍼 R. 페르디낭 드 소쉬르//프레스. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. 누르세요. jhu.ru

46. ​​en.wikipedia.org

47. www.smolensk.ru


Cryptanalysis는 암호를 해독하는 방법과 방법에 대한 과학(및 응용 사례)입니다. 암호학과 암호해독은 단일 지식 분야인 암호학을 구성합니다. 암호학은 현재 현대 정보 기술에서 중요한 응용 분야인 현대 수학 분야입니다. "암호화"라는 용어는 D. Vallis에 의해 도입되었습니다. 메시지 암호화의 필요성은 오래 전에 발생했습니다. V-...

단어의 더 이상의 의미가 아니라 가장 가까운 것입니다. 따라서 심리학적 방향, 특히 젊은 문법은 19세기 중반 언어학이 직면한 많은 질문에 답을 주었다. 비교역사언어학의 방법론을 밝히고, 의미론과 기능의미문법의 주요 문제를 제기하고, 언어와 발화의 관계를 분석하고, ...

연락처", "사회 학적 측면의 다중 언어주의". 그들의 연구는 언어학과 사회학의 교차점에서 발생한 사회 언어학 (사회 언어학)과 민족 언어학, 언어 민족지, 문체학, 수사학, 화용론, 이론에 의해 수행됩니다. 언어 커뮤니케이션, 매스 커뮤니케이션 이론 등. 언어는 사회에서 다음과 같은 사회적 기능을 수행합니다. 의사 소통 / 정보 제공 (...

언어학의 섹션과 구성에 대해. 부분적으로 교차하여 논리적으로 통합된 시스템을 형성하지 않는 경험적으로 형성된 언어학의 섹션은 몇 가지 다른 매개변수에 따라 서로 상관관계가 있는 것으로 나타낼 수 있습니다. 일반 언어학 및 언어의 부분 과학. 언어학의 가장 일반적인 부분과 특정 부분이 구별됩니다. 언어학의 주요 섹션 중 하나는 이론입니다 ...

소개

제1장 언어학에서의 수학적 방법 적용의 역사

1.1. 19~20세기 초 구조언어학의 형성

1.2. 20세기 후반 언어학에서의 수학적 방법의 적용

제2장 언어학에서 수학을 사용한 선별된 예

2.1. 기계 번역

2.2.언어 학습의 통계적 방법

2.3. 형식 논리의 방법으로 언어 학습

2.4. 언어학에서 수학적 방법의 적용에 대한 전망

결론

문학

부록 1. Ronald Schleifer. 페르디낭 드 소쉬르

부록 2. Ferdinand de Saussure(번역)

소개

20세기에는 다양한 지식 분야의 상호작용과 상호 침투를 향한 지속적인 추세가 있었습니다. 개별 과학 사이의 경계가 점차 모호해지고 있습니다. 인도주의, 기술 및 자연 과학 지식의 "교차점"에 있는 정신 활동의 점점 더 많은 분야가 있습니다.

근대성의 또 다른 분명한 특징은 구조와 그 구성 요소를 연구하려는 욕구입니다. 따라서 과학적 이론과 실제 모두에서 점점 더 많은 위치가 수학에 주어집니다. 한편으로는 논리와 철학, 다른 한편으로는 통계(그리고 결과적으로 사회과학)와 접촉하면서 수학은 오랫동안 순전히 과학에만 국한된 것으로 여겨졌던 영역에 점점 더 깊이 침투합니다. 휴리스틱 잠재력을 확장하는 "인도 주의적"( "얼마나"라는 질문에 대한 대답은 종종 "무엇"과 "어떻게"라는 질문에 대답하는 데 도움이 됨). 언어학도 예외는 아니었다.

제 과정의 목적은 수학과 언어학과 같은 언어학 분야 사이의 연결을 간략하게 강조하는 것입니다. 1950년대부터 수학은 언어 구조(자연 및 인공 모두)를 설명하기 위한 이론적 장치를 만들기 위해 언어학에서 사용되었습니다. 그러나 그러한 실용적인 응용 프로그램 자체를 즉시 찾지는 못했다고 말해야 합니다. 처음에는 언어학의 기본 개념을 명확히 하기 위해 언어학의 수학적 방법이 사용되기 시작했지만 컴퓨터 기술의 발달과 함께 이러한 이론적 전제가 실제로 적용되기 시작했습니다. 기계 번역, 기계 정보 검색, 자동 텍스트 처리와 같은 작업을 해결하려면 언어에 대한 근본적으로 새로운 접근 방식이 필요했습니다. 언어학자들은 언어 패턴을 기술에 직접 적용할 수 있는 형태로 표현하는 방법을 배우는 방법에 대한 질문에 직면했습니다. 우리 시대에 유행하는 "수학적 언어학"이라는 용어는 정확한 방법을 사용하는 모든 언어 연구를 의미합니다(그리고 과학에서 정확한 방법의 개념은 항상 수학과 밀접한 관련이 있습니다). 지난 몇 년간의 일부 과학자들은 특별한 "언어학"을 의미하지 않고 언어 연구 방법의 정확성과 신뢰성을 향상시키는 데 중점을 둔 새로운 방향만을 의미하기 때문에 표현 자체를 용어의 등급으로 올릴 수 없다고 생각합니다. . 언어학은 양적(대수적) 방법과 비정량적 방법을 모두 사용하여 수학적 논리, 결과적으로 철학, 심지어 심리학에 더 가깝게 만듭니다. Schlegel조차도 언어와 의식의 상호 작용에 주목했으며 20 세기 초의 저명한 언어학자인 Ferdinand de Saussure (언어학에서 수학적 방법 개발에 대한 그의 영향에 대해서는 나중에 설명하겠습니다)는 언어의 구조를 소속과 연결했습니다. 사람들에게. 현대 연구원 L. Perlovsky는 더 나아가 국가 정신의 특성으로 언어의 양적 특성(예: 성별, 사례 수)을 식별합니다(자세한 내용은 섹션 2.2, "언어학의 통계적 방법" 참조).

수학과 언어학의 상호 작용은 다면적인 주제이며, 제 작업에서 저는 모든 것에 대해 생각하지 않고 우선 적용 측면에 대해 설명할 것입니다.

제1장 언어학에서 수학적 방법의 응용 역사

1.1 XIX-XX 세기 전환기에 구조 언어학의 형성

언어에 대한 수학적 설명은 20세기 초의 유명한 스위스 언어학자인 Ferdinand de Saussure로 거슬러 올라가는 메커니즘으로서의 언어라는 개념을 기반으로 합니다.

그의 개념의 초기 링크는 세 부분으로 구성된 시스템으로서의 언어 이론입니다. 언어, 연설 - 비밀번호, 그리고 말하기 활동 - 언어), 여기서 각 단어(시스템의 구성원)는 그 자체로 고려되지 않고 다른 구성원과 관련하여 고려됩니다. 또 다른 저명한 언어학자인 Dane Louis Hjelmslev는 나중에 언급했듯이 Saussure는 "언어에 대한 구조적 접근, 즉 단위 간의 관계를 기록함으로써 언어에 대한 과학적 설명을 요구한 최초의 사람이었습니다."

언어를 계층 구조로 이해한 소쉬르는 처음으로 언어 단위의 가치와 중요성에 대한 문제를 제기했습니다. 별도의 현상 및 사건(즉, 개별 인도-유럽어 단어의 기원에 대한 역사)은 그 자체로 연구되는 것이 아니라 유사한 구성 요소와 상호 연관되는 시스템에서 연구되어야 합니다.

소쉬르의 언어 구조 단위는 소리와 의미가 결합된 "기호"라는 단어를 고려했습니다. 이러한 요소 중 어느 것도 서로 없이는 존재하지 않습니다. 따라서 원어민은 다중 의미 단어 의미의 다양한 음영을 언어의 구조적 전체에서 별도의 요소로 이해합니다.

따라서 F. de Saussure의 이론에서 한편으로는 언어학과 사회학 및 사회 심리학의 상호 작용을 볼 수 있습니다(동시에 Husserl의 현상학, Freud의 정신 분석, Einstein의 상대성 이론이 , 문학, 음악 및 미술의 형식과 내용에 대한 실험이 진행되고 있음) 반면에 수학 (체계성 개념은 언어의 대수적 개념에 해당함). 이러한 개념은 언어 해석의 개념을 다음과 같이 변경했습니다. 현상은 발생 원인과 관련하여 해석되지 않고 현재와 미래와 관련하여 해석되기 시작했습니다. 해석은 더 이상 사람의 의도와 무관하지 않습니다(의도가 프로이트의 의미에서 비인격적이고 "무의식"일 수 있음에도 불구하고).

언어 메커니즘의 기능은 원어민의 말하기 활동을 통해 나타납니다. 음성의 결과는 소위 "정확한 텍스트"입니다. 특정 패턴을 따르는 음성 단위의 시퀀스이며, 그 중 다수는 수학적 설명을 허용합니다. 구문 구조를 기술하는 방법 이론은 올바른 텍스트(주로 문장)의 수학적 기술을 위한 방법 연구를 다룹니다. 그러한 구조에서 언어적 유비는 고유한 특성의 도움으로 정의되는 것이 아니라 체계(“구조적”) 관계의 도움으로 정의됩니다.

서부에서 Saussure의 아이디어는 위대한 스위스 언어학자의 젊은 동시대 사람들에 의해 개발되었습니다. 덴마크에서는 L. Hjelmslev가 이미 언급했으며 그의 작품 "Fundamentals of Linguistic Theory"에서 언어 대수 이론을 일으켰습니다. 미국 - 체코의 E. Sapir, L. Bloomfield, C. Harris - 러시아 이민자 과학자 N. Trubetskoy.

언어 연구의 통계적 규칙성은 다름 아닌 유전학의 창시자인 게오르그 멘델에 의해 다루어지기 시작했습니다. 1968년이 되어서야 문헌학자들은 그가 말년에 수학 방법을 사용한 언어 현상 연구에 매료되었다는 사실을 발견했습니다. Mendel은 이 방법을 생물학에서 언어학으로 가져왔습니다. 1990년대에는 가장 대담한 언어학자와 생물학자만이 그러한 분석의 타당성을 주장했습니다. 성 베드로 수도원 기록 보관소에서 대수도원장이 Mendel이었던 브르노의 Tomasz는 "mann", "bauer", "mayer"로 끝나는 성 열과 일부 분수 및 계산이 포함된 시트를 발견했습니다. 멘델은 성의 기원에 관한 공식적인 법칙을 발견하기 위해 독일어의 모음과 자음의 수, 그가 고려하는 총 단어 수, 성의 수, 등.

우리나라에서 구조적 언어학은 서양과 거의 동시에 19-20 세기 초에 발전하기 시작했습니다. F. de Saussure와 동시에 시스템으로서의 언어 개념은 Kazan University F.F. Fortunatov 및 I.A. 보두앵 드 쿠르트네. 후자는 각각 de Saussure와 오랫동안 대응했으며 Geneva와 Kazan 언어학 학교는 서로 협력했습니다. 소쉬르가 언어학에서 "정확한" 방법의 이데올로기라고 불릴 수 있다면 Baudouin de Courtenay는 그 적용을 위한 실용적인 토대를 마련했습니다. 그는 언어학을 처음으로 분리했습니다. 정확한통계적 방법과 기능적 의존성을 사용하는 과학) 문헌학(언어와 말을 통해 영적 문화를 연구하는 인도주의 학문 공동체)에서. 과학자 자신은 "언어학은 가까운 미래에 유용할 수 있으며, 언어학 및 문학사와의 의무적 결합에서만 해방될 수 있다"고 믿었습니다. 음운론은 수학적 방법을 언어학에 도입하기 위한 "시험장"이 되었습니다. 언어 시스템의 "원자"로서의 소리는 쉽게 측정할 수 있는 속성의 수가 제한되어 형식적이고 엄격한 설명 방법에 가장 편리한 재료였습니다. 음운론은 소리의 의미 존재를 부정하므로 "인간" 요소는 연구에서 제거되었습니다. 이런 의미에서 음소는 물리적 또는 생물학적 대상과 같습니다.

지각에 허용되는 가장 작은 언어 요소인 음소는 별도의 영역, 별도의 "현상학적 현실"을 나타냅니다. 예를 들어 영어에서 "t" 소리는 다르게 발음될 수 있지만 모든 경우에 영어를 사용하는 사람은 "t"로 인식합니다. 가장 중요한 것은 음소가 주요 의미있는 기능을 수행한다는 것입니다. 또한 언어 간의 차이점은 한 언어의 한 소리가 다른 음소에 해당할 수 있다는 것입니다. 예를 들어 영어의 "l"과 "r"은 다르지만 다른 언어에서는 동일한 음소의 변형입니다(예: 영어 "t", 열망 유무에 관계없이 발음). 모든 자연어의 광대한 어휘는 훨씬 적은 수의 음소 조합의 집합입니다. 예를 들어 영어에서는 40개의 음소만 사용하여 약 백만 단어를 발음하고 씁니다.

언어의 소리는 체계적으로 구성된 일련의 기능입니다. 1920년대에서 1930년대에 Saussure에 이어 Jacobson과 N.S. Trubetskoy는 음소의 "독특한 특징"을 골라냈습니다. 이러한 기능은 혀, 치아, 성대와 같은 음성 기관의 구조를 기반으로 합니다. 예를 들어, 영어에서 "t"와 "d"의 차이는 "음성"(성대의 긴장)의 유무와 음소를 구별하는 음성의 수준입니다. 따라서 음운론은 Saussure가 설명한 일반 언어 규칙의 예로 간주할 수 있습니다. "언어에는 차이가 있을 뿐입니다." 훨씬 더 중요한 것은 이것이 아닙니다. 차이는 일반적으로 그것이 위치한 정확한 조건을 의미합니다. 그러나 언어에는 정확한 조건 없이 차이만 있을 뿐입니다. 우리가 "지정"을 고려하든 "의미"를 고려하든 언어 시스템이 개발되기 전에 존재했을 개념이나 소리가 언어에는 없습니다.

따라서 소쉬르 언어학에서 연구된 현상은 언어의 비교와 대립의 집합으로 이해됩니다. 언어는 단어의 의미를 표현하는 동시에 의사소통 수단이며 이 두 기능은 결코 일치하지 않습니다. 우리는 형식과 내용의 교대를 알아차릴 수 있습니다. 언어적 대조가 구조 단위를 정의하고 이러한 단위가 상호 작용하여 어떤 의미 있는 내용을 생성합니다. 언어의 요소는 무작위적이기 때문에 대조도 조합도 근거가 될 수 없다. 이것은 언어에서 독특한 특징이 다른 이해 수준에서 음성 대조를 형성하고 음소가 형태소로 결합되고 형태소가 단어로, 단어가 문장으로 결합되는 것을 의미합니다. 어쨌든 전체 음소, 단어, 문장 등 부분의 합 이상입니다.

소쉬르는 사회에서 기호의 역할을 연구하면서 언어학과 분리된 20세기의 새로운 과학에 대한 아이디어를 제안했습니다. Saussure는 이것을 과학 기호학이라고 불렀습니다(그리스어 "semeîon" - 기호). 1920년대와 1930년대 동유럽, 1950년대와 1960년대 파리에서 발전한 기호학의 "과학"은 언어와 언어 구조에 대한 연구를 이러한 구조로 구성된(또는 표현된) 문학적 발견으로 확장했습니다. 또한 그의 경력의 황혼기에 일반적인 언어학 과정과 병행하여 Saussure는 의도적으로 구성된 고유 이름의 철자 바꾸기를 발견하려고 노력하면서 후기 로마시의 "기호 학적"분석에 참여했습니다. 이 방법은 여러 면에서 언어 분석에서 합리주의와 정반대였습니다. 언어의 "개연성" 문제를 시스템에서 연구하려는 시도였습니다. 이러한 연구는 확률의 "실제 측면"에 초점을 맞추는 데 도움이 됩니다. Jean Starobinsky에 따르면 Saussure가 애너그램을 찾고 있는 "핵심 단어"는 "시의 삶의 원천이 아니라 시인을 위한 도구"입니다. 시는 키워드의 소리를 바꾸는 역할을 합니다. Starobinsky에 따르면 이 분석에서 "소쉬르는 숨겨진 의미를 탐구하지 않습니다." 반대로 그의 작품에서는 의식과 관련된 질문을 회피하려는 욕구가 눈에 띈다. 언어의 법칙”(. 부록 1 참조).

후기 로마 시에서 고유명사를 연구하려는 소쉬르의 시도는 그의 언어 분석의 구성 요소 중 하나인 기호의 자의적 특성과 의미 분석의 가능성을 배제한 소쉬르 언어학의 형식적 본질을 강조합니다. Todorov는 오늘날 Saussure의 작업이 명확하게 정의된 의미를 가진 현상의 상징을 연구하기를 꺼리는 점에서 극도로 일관성이 있는 것 같다고 결론지었습니다[부록 1]. 애너그램을 탐색하면서 Saussure는 반복에만 주의를 기울이고 이전 옵션에는 주의를 기울이지 않습니다. . . . Nibelungenlied를 연구하면서 그는 잘못된 읽기에 할당하기 위해서만 기호를 정의합니다. 의도하지 않은 경우 기호는 존재하지 않습니다. 결국, 일반 언어학에 관한 그의 글에서 그는 언어 기호뿐만 아니라 기호학의 존재를 가정합니다. 그러나 이 가정은 기호학이 무작위적이고 자의적인 기호만을 기술할 수 있다는 사실에 의해 제한됩니다.

만약 이것이 사실이라면 그것은 그가 대상 없이는 "의도"를 상상할 수 없었기 때문입니다. 그는 형식과 내용 사이의 간격을 완전히 메울 수 없었습니다. 그의 글에서 이것은 질문으로 바뀌었습니다. 대신 그는 "언어 적 정당성"으로 전환했습니다. 한편으로는 역사와 주관적 추측에 기초한 19세기 개념과 이러한 개념에 기초한 임의적 해석의 방법, 그리고 다른 한편으로는 형식과 내용(주체와 객체) 사이의 대립을 지우는 구조주의적 개념 사이에서, 구조주의, 정신분석학, 심지어 양자역학의 의미와 기원 - 언어학과 기호학에 관한 Ferdinand de Saussure의 저술은 언어와 문화의 의미 연구에서 전환점이 되었습니다.

러시아 과학자들은 1928년 헤이그에서 열린 제1차 국제 언어학자 회의에도 참석했습니다. S. Kartsevsky, R. Yakobson 및 N. Trubetskoy는 지난 세기 초 가장 현대적인 아이디어의 정신으로 언어의 계층 구조를 조사한 보고서를 작성했습니다. Jakobson은 그의 저서에서 언어의 기본 요소는 무엇보다도 그 발생 이유가 아니라 기능과 관련하여 연구되어야 한다는 Saussure의 생각을 발전시켰습니다.

불행히도 1924년 스탈린이 집권한 후 다른 많은 과학과 마찬가지로 러시아 언어학도 후퇴했습니다. 많은 재능 있는 과학자들이 강제 이주를 당했고, 그 나라에서 추방되거나 수용소에서 사망했습니다. 1950년대 중반 이후에야 이론의 특정 다원주의가 가능해졌습니다. 이에 대해서는 1.2절에서 자세히 설명합니다.

1.2 20세기 후반 언어학에서의 수학적 방법의 적용

20세기 중반까지 4개의 세계 언어 학파가 형성되었으며, 각각은 특정 "정확한" 방법의 조상으로 밝혀졌습니다. 레닌그라드 음운학교(그 조상은 Baudouin de Courtenay L. V. Shcherba의 학생이었습니다) 음소 형태의 소리를 일반화하는 주요 기준으로 원어민의 말 분석을 기반으로 한 심리 언어 실험을 사용했습니다.

과학자들 프라하 언어 학계, 특히-설립자 N.S. 러시아에서 이주한 Trubetskoy는 반대 이론을 개발했습니다. 언어의 의미 구조는 반대적으로 구성된 의미 단위 집합 인 Sem으로 설명되었습니다. 이 이론은 언어 연구뿐만 아니라 예술 문화 연구에도 적용되었다.

이데올로기 미국식 서술주의언어학자 L. Bloomfield와 E. Sapir였습니다. 언어는 그들의 연구의 주요 대상인 일련의 음성 진술로 서술자들에게 제시되었습니다. 그들의 초점은 텍스트의 과학적 설명(따라서 이름)의 규칙, 즉 구성 요소의 구성, 배열 및 분류에 대한 연구였습니다. 음운론 및 형태론 분야에서 분석 절차의 공식화(다른 수준에서 언어 연구를 위한 원칙 개발, 분배 분석, 직접 구성 요소 방법 등)는 언어 모델링의 일반적인 질문 공식화로 이어졌습니다. 언어의 체계적 측면뿐만 아니라 언어의 내용 계획에 대한 부주의로 인해 기술 주의자들은 언어를 시스템으로 충분히 충분히 해석할 수 없었습니다.

1960년대에 미국의 철학자이자 언어학자인 N. Chomsky의 작업으로 인해 형식 문법 이론이 개발되었습니다. 그는 가장 유명한 현대 과학자 및 공인 중 한 명으로 정당하게 간주되며 많은 기사, 논문 및 장편 다큐멘터리까지 그에게 바쳐집니다. Chomsky가 발명 한 구문 구조를 설명하는 근본적으로 새로운 방법의 이름-생성 (생성) 문법-언어학의 해당 추세를 호출했습니다. 유전주의.

러시아 이민자의 후예인 촘스키는 1945년부터 펜실베이니아 대학교에서 언어학, 수학 및 철학을 공부했으며, 그의 스승인 Zelig Harris의 영향을 많이 받았습니다. 기존 미국 정치 체제에 대한 비판자이자 반세계주의의 영적 지도자 중 한 명으로 알려져 있음).

Chomsky의 첫 번째 주요 과학 작업, 석사 논문 "현대 히브리어의 형태학 » (1951)은 미발표 상태로 남아 있습니다. 촘스키는 1955년에 펜실베이니아 대학교에서 박사 학위를 받았지만 그의 논문(언어 이론의 논리적 구조라는 제목으로 1975년에야 전체가 출판됨)과 그의 첫 논문인 구문 구조(1957, Rus. trans . 1962), 1951-1955년 하버드 대학교에서 공연되었다. 같은 1955년에 과학자는 Massachusetts Institute of Technology로 옮겨 1962년에 교수가 되었습니다.

Chomsky의 이론은 발전 과정에서 여러 단계를 거쳤습니다.

첫 번째 모노그래프 "구문 구조"에서 과학자는 한정된 문법적 수단 집합을 사용하여 무한한 문장 집합을 생성하는 메커니즘으로 언어를 제시했습니다. 언어 속성을 설명하기 위해 그는 깊은(직접 인식에서 숨겨지고 재귀 시스템에 의해 생성된, 즉 반복적으로 적용될 수 있는 규칙) 및 표면(직접 인식된) 문법 구조의 개념과 전환을 설명하는 변형을 제안했습니다. 깊은 구조에서 표면 구조로. 여러 표면 구조는 하나의 깊은 구조에 해당할 수 있습니다(예: 수동 구조 법령은 대통령에 의해 서명활성 구조와 동일한 심층 구조에서 파생됨 대통령은 법령에 서명) 및 그 반대(따라서 모호성 어머니는 딸을 사랑하나는 어머니가 딸을 사랑하는 사람이고 다른 하나는 딸에게 사랑받는 사람입니다.

Chomsky의 표준 이론은 Chomsky의 저서 "Aspects of the Theory of Syntax"에 제시된 "Aspects" 모델로 간주됩니다. 이 모델에서는 처음으로 의미론적 해석의 규칙이 형식 이론에 도입되어 깊은 구조에 의미를 부여했습니다. Aspects에서 언어적 능력은 언어의 사용(수행)에 반대되며, 변환 중 의미 보존에 대한 소위 Katz-Postal 가설이 채택되며, 이와 관련하여 선택적 변환의 개념이 제외되고, 어휘 호환성을 설명하는 구문 기능이 도입되었습니다.

1970년대에 Chomsky는 제어 및 구속 이론(GB 이론 - 단어에서 정부그리고 제본) 이전보다 더 일반적입니다. 그 안에서 과학자는 특정 언어의 구문 구조를 설명하는 특정 규칙을 포기했습니다. 모든 변환이 하나의 범용 이동 변환으로 대체되었습니다. GB 이론의 틀 내에는 개인 모듈도 있으며, 각 모듈은 문법의 자체 부분을 담당합니다.

이미 최근인 1995년에 Chomsky는 인간의 언어를 기계어처럼 기술하는 미니멀리스트 프로그램을 제안했습니다. 이것은 모델이나 이론이 아닌 프로그램일 뿐입니다. 여기에서 Chomsky는 인간 언어 장치의 두 가지 주요 하위 시스템인 어휘집과 컴퓨팅 시스템과 두 가지 인터페이스(음성 및 논리)를 식별합니다.

Chomsky의 형식 문법은 자연 언어뿐만 아니라 인공 언어, 특히 프로그래밍 언어를 설명하는 고전이 되었습니다. 20세기 후반의 구조적 언어학의 발전은 당연히 "촘스키 혁명"으로 간주될 수 있습니다.

모스크바 음운 학교, 그의 대표자는 A.A. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov는 유사한 이론을 사용하여 음성학을 연구했습니다. 점차 "정확한" 방법이 음성학뿐만 아니라 구문에도 적용되기 시작했습니다. 국내외의 언어학자와 수학자 모두 언어의 구조를 연구하기 시작했습니다. 1950년대와 60년대에 기계 번역 시스템의 개발과 관련하여 소련에서 수학과 언어학 간의 상호 작용의 새로운 단계가 시작되었습니다.

우리나라에서 이러한 작업을 시작하게 된 원동력은 미국 기계 번역 분야의 첫 번째 개발이었습니다. 널리 퍼지지 않았습니다). 1947년에 A. Butt와 D. Britten은 컴퓨터를 사용한 단어별 번역 코드를 고안했고, 1년 후 R. Richens는 기계 번역에서 단어를 어간과 어미로 나누는 규칙을 제안했습니다. 그 시절은 오늘날과 사뭇 달랐다. 이들은 방 전체를 차지하는 매우 크고 값비싼 기계였으며 이를 유지하기 위해 많은 엔지니어, 운영자 및 프로그래머가 필요했습니다. 기본적으로이 컴퓨터는 군사 기관의 요구에 대한 수학적 계산을 수행하는 데 사용되었습니다. 수학, 물리학 및 기술의 새로운 기능은 무엇보다도 군사 업무에 사용되었습니다. 초기 단계에서 MP의 개발은 군대의 적극적인 지원을 받았으며 (냉전 상황에서) 미국에서는 러시아-영어 방향이, 소련에서는 영-러시아 방향이 개발되었습니다.

1954년 1월, 매사추세츠 공과 대학에서 "조지타운 실험"이 열렸습니다. IBM-701 기계에서 러시아어를 영어로 번역하는 최초의 공개 시연이었습니다. D.Yu가 만든 실험의 성공적인 통과에 대한 메시지 요약. Panov는 RJ "Mathematics", 1954, No. 10: "기계를 사용하여 한 언어에서 다른 언어로 번역: 첫 번째 성공적인 테스트에 대한 보고서"에 등장했습니다.

D. Yu. Panov (당시 과학 정보 연구소-INI, 나중에 VINITI 이사)는 나중에 소련 과학 아카데미의 정밀 수학 및 컴퓨터 공학 연구소에서 기계 번역 그룹을 이끌었던 I. K. Belskaya를 유치했습니다. 기계 번역 작업. 1955년 말, BESM 기계의 도움으로 영어를 러시아어로 처음 번역한 경험이 시작되었습니다. BESM 프로그램은 N.P. Trifonov 및 L.N. 그의 박사 논문은 기계 번역을 위한 사전 구성 방법에 전념했습니다.

동시에 기계 번역 작업은 소련 과학 아카데미 수학 연구소 (현재 러시아 과학 아카데미 M.V. Keldysh 응용 수학 연구소)의 응용 수학 부서에서 수행되었습니다. 수학자 A.A. Lyapunov. 그는 O.S. Kulagin과 그녀의 학생들 T.D. Wentzel과 N.N. 리코. 기술을 사용하여 한 언어에서 다른 언어로 번역할 수 있는 가능성에 대한 Lyapunov와 Kulagina의 아이디어는 Nature, 1955, No. 8 저널에 게재되었습니다. 1955년 말부터 T.N. Moloshnaya는 영어-러시아어 번역 알고리즘에 대한 독립적인 작업을 시작했습니다.

당시 스페인어 번역 알고리즘에 참여했던 R. Frumkina는 작업의 이 단계에서 일관된 조치를 취하는 것이 어려웠다고 회상합니다. 훨씬 더 자주 나는 내 자신이나 동료와 같은 휴리스틱 경험을 따라야했습니다.

그러나 1세대 기계 번역 시스템은 매우 불완전했습니다. 그들 모두는 "단어 별", "구문 별"순차 번역 알고리즘을 기반으로했습니다. 단어와 문장 간의 의미 론적 연결은 어떤 식 으로든 고려되지 않았습니다. 예를 들어 문장은 다음과 같습니다. John은 그의 장난감 상자를 찾고 있었습니다.마침내 그는 그것을 찾았습니다. 상자는 펜 안에 있었다.요한은 매우 기뻤습니다.. (John은 그의 장난감 상자를 찾고 있었습니다. 마침내 그는 그것을 찾았습니다. 상자는 놀이울에 있었습니다. John은 매우 행복했습니다.)” 이 문맥에서 "펜"은 "펜"(쓰기 도구)이 아니라 "놀이 틀"( 플레이펜). 동의어, 반의어 및 비유적 의미에 대한 지식은 컴퓨터에 입력하기 어렵습니다. 유망한 방향은 인간 번역가의 사용에 초점을 맞춘 컴퓨터 시스템의 개발이었습니다.

시간이 지남에 따라 직접 번역 시스템은 구문 구조 수준에서 번역이 수행되는 T- 시스템 (영어 단어 "전송"-변환에서 유래)으로 대체되었습니다. T-systems의 알고리즘은 입력 문장의 언어의 문법 규칙에 따라 구문 구조를 구축한 다음(고교에서 외국어를 가르치는 방식과 유사) 출력 문장을 합성할 수 있도록 하는 메커니즘을 사용했습니다. 구문 구조를 변형하고 사전에서 필요한 단어를 대체함으로써.

Lyapunov는 번역된 텍스트의 의미를 추출하여 다른 언어로 제시함으로써 번역에 대해 이야기했습니다. 어의론적 분석을 통해 입력 문장의 의미론적 표상을 획득하고, 획득한 의미 표현에 따라 입력 문장을 합성하는 것을 기반으로 기계 번역 시스템을 구축하는 접근 방식이 여전히 가장 완벽한 것으로 간주됩니다. 이러한 시스템을 I-시스템("인터링구아"라는 단어에서 유래)이라고 합니다. 그러나 정보 처리 분야의 세계 과학자 커뮤니티 인 IFIP 국제 연맹의 노력에도 불구하고 50 년대 후반과 60 년대 초반으로 거슬러 올라가는 작업을 만드는 작업은 지금까지 완전히 해결되지 않았습니다.

과학자들은 텍스트 작업을 위한 알고리즘을 공식화하고 구축하는 방법, 기계에 어떤 사전을 입력해야 하는지, 기계 번역에 어떤 언어 패턴을 사용해야 하는지에 대해 생각했습니다. 전통적인 언어학에는 의미론뿐만 아니라 구문 측면에서도 그러한 아이디어가 없었습니다. 그 당시에는 언어에 대한 구문 구조 목록이 없었고 호환성 및 상호 교환 가능성에 대한 조건이 연구되지 않았으며 더 작은 구성 요소에서 구문 구조의 큰 단위를 구성하는 규칙이 개발되지 않았습니다.

기계 번역의 이론적 토대를 마련해야 할 필요성은 수학적 언어학의 형성과 발전으로 이어졌습니다. 소련에서이 문제의 주역은 수학자 A.A. Lyapunov, O.S. 쿨라기나, V.A. Uspensky, 언어 학자 V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. 이바노프. Kulagina의 논문은 형식 문법 이론 연구에 전념했으며 (동시에 미국의 N. Khomsky와 함께) Kuznetsov는 F.F. Fortunatov.

1960년 5월 6일, "언어 연구를 위한 구조적 및 수학적 방법의 개발에 관한" 소련 과학 아카데미 상임위원회 법령이 채택되었고, 언어학 연구소 및 연구소에 해당 부서가 만들어졌습니다. 러시아어. 1960 년부터 모스크바 주립 대학교, 레닌 라드, 노보시비르스크 대학교, 모스크바 주립 외국어 연구소의 철학 학부와 같은 미국 최고의 인도주의 대학은 자동 텍스트 처리 분야의 인력 교육을 시작했습니다.

그러나 "고전적"이라고 불리는 이 시기의 기계 번역 작업은 실제적인 관심보다는 이론적인 것입니다. 비용 효율적인 기계 번역 시스템은 지난 세기의 80년대에만 만들어지기 시작했습니다. 이에 대해서는 2.1절 기계 번역에서 나중에 설명하겠습니다.

1960년대 - 70년대에는 장 이론 및 퍼지 집합 이론과 같은 집합 이론 및 수학적 논리의 방법을 사용한 심층적인 이론적 발전이 포함됩니다.

언어학 분야 이론의 저자는 소비에트 시인, 번역가 및 언어 학자 V.G. Admoni. 그는 처음에 독일어를 기반으로 이론을 발전시켰습니다. Admoni의 경우 "필드" 개념은 비어 있지 않은 임의의 언어 요소 집합을 나타냅니다(예: "어휘 필드", "의미 필드").

필드의 구조는 이질적입니다. 즉, 집합을 정의하는 완전한 기능 집합을 가진 요소가 있는 코어와 주어진 집합의 두 가지 기능을 모두 가질 수 있는 주변부(모두는 아님)로 구성됩니다. 그리고 이웃들. 이 진술을 설명하는 예를 들겠습니다. 예를 들어, 영어에서 합성어 필드("day-dream" - "dream"는 구 필드("tear gas" - "tear gas")와 분리하기 어렵습니다. .

위에서 이미 언급한 퍼지 집합 이론은 필드 이론과 밀접한 관련이 있습니다. 소련에서는 언어학자 V.G. Admoni, I.P. Ivanova, G.G. 그러나 Pochentsov의 조상은 1965년에 "Fuzzy Logic"이라는 기사를 발표한 미국 수학자 L. Zadeh였습니다. 퍼지 세트 이론에 대한 수학적 정당화를 제공하면서 Zade는 언어 자료를 기반으로 고려했습니다.

이 이론에서 우리는 주변 요소가 어느 정도 여러 필드에 속할 수 있기 때문에 주어진 집합(АОа)에 대한 요소의 소속이 아니라 이 멤버십의 정도(mАОа)에 대해 이야기하고 있습니다. Zade(Lofti-zade)는 아제르바이잔 출신으로 12세 때까지 아제르바이잔어, 러시아어, 영어, 페르시아어의 4개 언어로 의사소통하는 연습을 했으며 키릴 문자, 라틴어, 아랍어의 세 가지 다른 알파벳을 사용했습니다. 과학자가 퍼지 세트 이론과 언어학의 공통점이 무엇인지 물었을 때 그는 이 연관성을 부인하지 않고 다음과 같이 설명합니다. 그렇다면 무의식적으로 만. 젊었을 때 Zadeh는 테헤란의 장로교 학교에서 공부했고 제2차 세계대전 후 미국으로 이주했습니다. "문제는 내가 미국인인지, 러시아인인지, 아제르바이잔인인지 아니면 다른 사람인지가 아닙니다. 저는 이 모든 문화와 민족에 의해 형성되었으며 그들 각각에서 상당히 편안함을 느낍니다."라고 대화 중 하나에서 말했습니다. 이 말에는 모호하지 않은 정의와 예리한 범주에서 벗어난 퍼지 집합 이론을 특징 짓는 것과 유사한 것이 있습니다.

우리나라에서는 70년대에 20세기 서양 언어학자들의 작품이 번역되어 연구되었다. I.A. Melchuk은 N. Chomsky의 작품을 러시아어로 번역했습니다. 에. Slyusareva는 그녀의 저서 "The Theory of F. de Saussure in the Light of Modern Linguistics"에서 Saussure의 가르침의 가정을 70년대 언어학의 실제 문제와 연결합니다. 언어학의 수학화 경향이 있습니다. 국내 유수의 대학은 "수학(이론, 응용) 언어학"이라는 전문 분야의 인력을 양성하고 있습니다. 동시에 서양에서는 점점 더 많은 새로운 언어 기반을 필요로 하는 컴퓨터 기술의 발전에 급격한 도약이 있습니다.

1980년대 과학원 동양학연구소 교수 Yu.K. Lekomtsev는 언어 설명에 사용되는 체계, 표 및 기타 유형의 표기법 분석을 통해 언어학 언어를 분석하는 동안 이러한 목적에 적합한 수학적 시스템(주로 행렬 대수 시스템)을 고려합니다.

그리하여 20세기 내내 정확한 것과 인문학의 융합이 이루어졌다. 수학과 언어학의 상호 작용은 점차 실용적인 응용 프로그램을 찾았습니다. 이에 대해서는 다음 장에서 자세히 설명합니다.

제2장 언어학에서 수학을 사용한 선별된 예

2.1 기계 번역

보편적인 메커니즘의 도움으로 한 언어에서 다른 언어로 번역한다는 아이디어는 이 분야의 첫 번째 개발이 시작되기 몇 세기 전에 나타났습니다. 1649년에 Rene Descartes는 다른 언어는 하나의 기호로 표현됩니다. 1930~40년대에 이 아이디어를 구현하려는 첫 번째 시도, 세기 중반의 이론적 발전의 시작, 1970~80년대 기술의 도움으로 번역 시스템의 개선, 최근 번역 기술의 급속한 발전 10년 - 산업으로서 기계 번역이 발전하는 단계입니다. 과학으로서의 컴퓨터 언어학이 성장한 것은 기계 번역에 관한 작업에서입니다.

70년대 후반과 80년대 초반에 컴퓨터 기술이 발전함에 따라 연구원들은 보다 현실적이고 비용 효율적인 목표를 설정했습니다. 기계는 이전에 가정한 것처럼 경쟁자가 아니라 인간 번역가의 보조자가 되었습니다. 기계 번역은 독점적으로 군사 업무를 수행하지 않습니다 (주로 러시아어와 영어에 초점을 맞춘 모든 소련과 미국의 발명 및 연구는 어떤 식 으로든 냉전에 기여했습니다). 1978년 Arpa 상호연결 네트워크를 통해 자연어 단어가 전송되었고 6년 후 미국에서 최초의 마이크로컴퓨터 번역 프로그램이 등장했습니다.

70년대에 유럽 공동체 위원회는 Systran 컴퓨터 번역기의 영어-프랑스어 버전을 구입하고 프랑스어-영어 및 이탈리아어-영어 버전과 미군이 사용하는 러시아어-영어 번역 시스템도 주문했습니다. 이것이 EUROTRA 프로젝트의 토대를 마련한 방법입니다.

70-80년대 기계 번역의 부활에 대해. 유럽 ​​공동체 위원회(CEC)는 Systran의 영어-프랑스어 버전과 러시아어에서 영어로의 번역 시스템을 구매합니다(후자는 ALPAC 보고서 이후에 개발되었으며 US Air에서 계속 사용됨). 포스 및 NASA); 또한 CEC는 프랑스어-영어 및 이탈리아어-영어 버전의 개발을 명령합니다. 동시에 일본에서는 기계 번역 활동이 빠르게 확장되고 있습니다. 미국에서는 Pan American Health Organization(PAHO)이 스페인어-영어 방향(SPANAM 시스템)의 개발을 명령합니다. 미 공군은 오스틴에 있는 텍사스 대학의 언어 연구 센터에서 기계 번역 시스템 개발에 자금을 지원하고 있습니다. 캐나다의 TAUM 그룹은 METEO(기상 번역) 시스템 개발에서 눈에 띄는 진전을 보이고 있습니다. 70년대와 80년대에 많은 프로젝트가 시작되었습니다. 이후 본격적인 상용 시스템으로 발전했습니다.

1978년에서 1993년 사이에 미국에서 기계 번역 분야 연구에 2천만 달러, 유럽에서 7천만 달러, 일본에서 2억 달러가 사용되었습니다.

새로운 개발 중 하나는 축적 원칙에 따라 작동하는 TM(번역 메모리) 기술입니다. 새로 번역된 텍스트에서 동일하거나 유사한 세그먼트가 발견되면 번역 및 일치율 표시와 함께 표시됩니다. 그런 다음 번역가는 결정(번역 편집, 거부 또는 수락)을 내립니다. 그 결과는 시스템에 저장되므로 동일한 문장을 두 번 번역할 필요가 없습니다. TM 기술을 기반으로 하는 잘 알려진 상용 시스템은 현재 TRADOS 시스템(1984년 설립)에서 개발하고 있습니다.

현재 Systran, IBM, L&H(Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare 등 수십 개의 회사에서 상용 기계 번역 시스템을 개발하고 있습니다. 아타 소프트웨어; Linguistica b.v. 및 기타 이제 웹에서 직접 자동 번역기 서비스를 사용할 수 있습니다: alphaWorks; PROMT의 온라인 번역기, LogoMedia.net, AltaVista의 Babel Fish 번역 서비스, 인피니티닷컴; 인터넷 번역.

우리나라에서도 80년대 후반에 상업적으로 효과적인 번역 시스템이 등장했습니다. 기계 번역의 개념 자체가 확장되었습니다("사람과의 대화에서 전체 번역 주기 또는 개별 작업을 자동 또는 반자동으로 수행하는 여러 자동 및 자동화 시스템 및 장치 생성"을 포함하기 시작함). 이 산업의 발전을 위한 정부 예산이 증가했습니다.

러시아어, 영어, 독일어, 프랑스어 및 일본어가 국내 번역 시스템의 주요 언어가 되었습니다. All-Union Translation Center(VTsP)는 컴퓨터 ES-1035-ANRAP에서 영어와 독일어를 러시아어로 번역하는 시스템을 개발했습니다. 단일 소프트웨어에서 영어와 독일어를 입력하고 러시아어를 출력하는 세 가지 사전으로 구성되었습니다. 컴퓨터 기술, 프로그래밍, 무선 전자, 기계 공학, 농업, 야금에 대한 여러 상호 교환 가능한 전문 사전이 있습니다. 이 시스템은 두 가지 모드로 작동할 수 있습니다. 자동 모드와 대화형 모드로 화면에 소스 텍스트와 문구당 번역이 표시되어 사람이 편집할 수 있습니다. 텍스트를 ANRAP으로 번역하는 속도(타이핑 시작부터 인쇄가 끝날 때까지)는 시간당 약 100페이지였습니다.

1989년에 러시아어, 영어, 독일어 및 일본어로 작업하는 SPRINT 유형의 상업 번역가 제품군이 만들어졌습니다. 그들의 주요 장점은 IBM PC와의 호환성이었습니다. 따라서 국내 기계 번역 시스템은 국제 수준의 품질에 도달했습니다. 동시에 프랑스어에서 러시아어 FRAP로의 기계 번역 시스템이 개발되고 있으며 여기에는 문자 분석, 형태론, 구문론 및 의미론의 4단계 텍스트 분석이 포함됩니다. LGPI에서. Herzen은 4개 언어(영어, 프랑스어, 스페인어, 러시아어) SILOD-MP 시스템(영어-러시아어 및 프랑코-러시아어 사전이 산업 모드에서 사용됨)에 대한 작업을 진행 중이었습니다.

전기 공학에 대한 텍스트의 전문 번역을 위해 ETAP-2 시스템이 존재했습니다. 입력 텍스트 분석은 형태론과 구문의 두 가지 수준에서 수행되었습니다. ETAP-2 사전에는 약 4,000개의 항목이 포함되어 있습니다. 텍스트 변환 단계 - 약 1000개의 규칙(일반 96개, 개인 342개, 나머지는 사전임). 이 모든 것이 만족스러운 변환 품질을 보장했습니다(예를 들어, 특허 "광 위상 격자 배열 및 이러한 배열을 갖는 결합 장치"의 제목은 "광 위상 격자 장치 및 이러한 장치를 갖는 연결 장치"로 번역되었습니다. 동어반복, 의미는 보존됨).

Minsk Pedagogical Institute of Foreign Languages에서는 영어-러시아어 단어 형식 및 구문 사전을 기반으로 제목의 기계 번역 시스템이 발명되었으며, 과학 아카데미 동양 연구 연구소에서 번역 시스템이 발명되었습니다. 일본어에서 러시아어로. 모스크바 자동화 시스템 연구소에서 만든 컴퓨팅 및 프로그래밍을 위한 최초의 자동 어휘 및 용어 서비스(SLOTHERM)는 설명 사전과 언어 연구를 위한 특수 사전에 약 20,000개의 용어를 포함했습니다.

기계 번역 시스템은 의도된 목적뿐만 아니라 자동 학습 시스템의 중요한 구성 요소(번역 교육, 철자 검사 및 문법 지식)로 점차 사용되기 시작했습니다.

90년대에는 PC 시장(데스크탑에서 포켓까지)과 정보 기술의 급속한 발전, 인터넷의 광범위한 사용(점점 더 국제화되고 다국어화되고 있음)이 도입되었습니다. 이 모든 것이 요구되는 자동 번역 시스템의 추가 개발을 만들었습니다. 1990년대 초부터 국내 개발사들도 PC 시스템 시장에 뛰어들고 있다.

1990년 7월 러시아 최초의 상업용 기계 번역 시스템인 PROMT(PROgrammer's Machine Translation)가 모스크바 PC 포럼에서 소개되었습니다. 1992년에 PROMT는 영어, 독일어, 프랑스어, 이탈리아어, 스페인어를 러시아어로, 러시아어를 영어로 번역하기 위한 STYLUS라는 새 이름으로 전체 시스템 제품군을 출시했으며 세계 최초의 Windows용 기계 번역 시스템이 1993년 STYLUS의 기반이 되었습니다. 1994년에는 Windows 3.X/95/NT용 STYLUS 2.0이 출시되었고, 1995-1996년에는 3세대 기계 번역 시스템인 Windows 95/NT용 완전 32비트 STYLUS 3.0이 출시되었습니다. 완전히 새로운 세계 최초의 러시아어-독일어 및 러시아어-프랑스 기계 번역 시스템의 개발이 성공적으로 완료되었습니다.

1997년에는 프랑스 회사인 Softissimo와 프랑스어에서 독일어 및 영어로 또는 그 반대로 번역 시스템을 만드는 계약이 체결되었으며 올해 12월에는 세계 최초의 독일어-프랑스 번역 시스템이 출시되었습니다. 같은 해 PROMT 회사는 인터넷 WebTranSite 작업을 위한 특수 번역기뿐만 아니라 하나의 쉘에서 여러 언어 지침을 지원하는 Gigant 기술을 사용하여 구현된 시스템을 출시했습니다.

1998년에 PROMT 98이라는 새 이름으로 전체 프로그램 집합이 출시되었습니다. 1년 후 PROMT는 인터넷 작업을 위한 고유한 소프트웨어 패키지인 PROMT Internet과 기업 메일 시스템용 번역기인 PROMT Mail의 두 가지 신제품을 출시했습니다. 역자. 1999년 11월 PROMT는 프랑스 잡지 PC Expert가 테스트한 최고의 기계 번역 시스템으로 경쟁사보다 30% 더 뛰어난 성능을 인정받았습니다. 기업 고객을 위한 특수 서버 솔루션인 기업 번역 서버 PROMT Translation Server(PTS) 및 인터넷 솔루션 PROMT Internet Translation Server(PITS)도 개발되었습니다. 2000년에 PROMT는 차세대 MT 시스템인 PROMT Translation Office 2000, PROMT Internet 2000 및 Magic Gooddy 2000을 출시하여 전체 소프트웨어 제품 라인을 업데이트했습니다.

PROMT 시스템의 지원을 받는 온라인 번역은 PROMT의 Online Translator, InfiniT.com, Translate.Ru, Lycos 등 여러 국내외 사이트와 비즈니스 문서 번역을 위한 다양한 프로필 기관에서 사용됩니다. 기사 및 편지(Outlook Express 및 기타 이메일 클라이언트에 직접 내장된 번역 시스템이 있음).

최근에는 인공지능 시스템과 통계적 방법을 기반으로 새로운 기계 번역 기술이 등장하고 있습니다. 후자에 대해 - 다음 섹션에서.

2.2 언어 학습의 통계적 방법

현대 언어학에서는 양적 수학 방법을 사용하여 언어 현상을 연구하는 데 상당한 관심을 기울입니다. 양적 데이터는 종종 연구 중인 현상, 관련 현상 시스템에서의 위치 및 역할을 더 깊이 이해하는 데 도움이 됩니다. "얼마나"라는 질문에 대한 대답은 "무엇", "어떻게", "왜"라는 질문에 답하는 데 도움이 됩니다. 이것이 정량적 특성의 경험적 잠재력입니다.

통계적 방법은 기계 번역 시스템 개발에 중요한 역할을 합니다(섹션 2.1 참조). 통계적 접근에서 번역 문제는 잡음이 있는 채널의 관점에서 고려됩니다. 영어 문장을 러시아어로 번역해야 한다고 상상해 보세요. 노이즈 채널 원리는 영어와 러시아어 문장의 관계에 대해 다음과 같은 설명을 제공합니다. 영어 문장은 일종의 노이즈로 인해 왜곡된 러시아어 문장에 불과합니다. 원래 러시아어 문장을 복구하려면 사람들이 일반적으로 러시아어로 말하는 내용과 러시아어 구문이 영어로 어떻게 왜곡되는지 알아야 합니다. 번역은 주어진 러시아어 문장이 주어졌을 때 러시아어 문장의 무조건 확률과 영어 문장(원문)의 확률의 곱이 최대가 되는 그런 러시아어 문장을 찾아 번역을 진행한다. Bayes의 정리에 따르면 다음 러시아어 문장이 영어 번역일 가능성이 가장 높습니다.

여기서 e는 번역 문장이고 f는 원래 문장입니다.

따라서 소스 모델과 채널 모델 또는 언어 모델과 번역 모델이 필요합니다. 언어 모델은 대상 언어(이 경우 러시아어)의 모든 문장에 확률 점수를 할당하고 번역 모델은 원래 문장에 할당해야 합니다. (표 1 참조)

일반적으로 기계 번역 시스템은 두 가지 모드로 작동합니다.

1. 시스템 훈련: 병렬 텍스트의 훈련 코퍼스를 취하고 선형 프로그래밍을 사용하여 그에 따라 사용 가능한 영어로 코퍼스의 러시아어 부분의 확률을 최대화하는 번역 대응 테이블의 값을 검색합니다. 선택한 번역 모델에. 러시아어 모델은 동일한 말뭉치의 러시아어 부분에 구축됩니다.

2. 착취: 생소한 영어 문장에 대해 얻은 데이터를 기반으로 언어 모델과 번역 모델이 할당한 확률의 곱을 최대화하는 러시아어를 검색합니다. 이러한 검색에 사용되는 프로그램을 디코더라고 합니다.

가장 간단한 통계 번역 모델은 리터럴 번역 모델입니다. 이 모델은 문장을 한 언어에서 다른 언어로 번역하기 위해 모든 단어를 번역하는 것으로 충분하며("단어 모음" 생성) 모델이 올바른 순서로 단어 배치를 제공할 것이라고 가정합니다. P( a, f | e)에서 P(a | e , f)로, 즉 한 쌍의 문장이 주어진 정렬의 확률, 각 확률 P(a, f | e)는 주어진 문장 쌍의 모든 정렬 확률의 합으로 정규화됩니다.

모델 #1을 교육하는 데 사용되는 Viterbi 알고리즘의 구현은 다음과 같습니다.

1. 번역 대응 확률의 전체 테이블이 동일한 값으로 채워집니다.

2. 단어 쌍 연결의 가능한 모든 변형에 대해 확률 P(a, f | e)가 계산됩니다.

3. P(a, f | e)의 값을 정규화하여 P(a | e, f)의 값을 얻습니다.

4. 각 변환 쌍의 빈도가 계산되고 각 정렬 옵션의 확률로 가중치가 적용됩니다.

5. 결과 가중 빈도가 정규화되고 새로운 변환 대응 확률 테이블을 형성합니다.

6. 알고리즘은 2단계부터 반복됩니다.

예를 들어, 두 쌍의 문장으로 구성된 말뭉치에 대한 유사한 모델의 훈련을 고려하십시오(그림 2).

백악관

  • 집/집

많은 수의 반복 후에 번역이 높은 정확도로 수행되었음을 보여주는 표(표 2)를 얻게 됩니다.

또한 통계적 방법은 어휘, 형태, 구문 및 스타일 연구에 널리 사용됩니다. Perm State University의 과학자들은 틀에 박힌 문구가 텍스트의 중요한 "건축 자재"라는 주장에 근거하여 연구를 수행했습니다. 이러한 구문은 "핵" 반복 단어와 종속 단어 지정자로 구성되며 뚜렷한 문체 색상이 있습니다.

과학적 스타일에서 "핵"단어는 다음과 같이 불릴 수 있습니다. 연구, 연구, 태스크, 문제, 문제, 현상, 사실, 관측, 분석기타 저널리즘에서 다른 단어는 "핵"이 될 것이며 특히 신문 텍스트의 가치가 높아집니다. 시간, 사람, 힘, 사업, 행동, 법, 생명, 역사, 장소등. (총 29개)

언어 학자들에게 특히 흥미로운 것은 직업 유형에 따라 국어의 전문적 차별화, 어휘 및 문법 사용의 독창성입니다. 전문 연설의 운전자는 sh 형식을 사용하는 것으로 알려져 있습니다. 영형 Fer, 의료진은 k라고 말합니다. 영형 칵테일 대신 클럽 sh - 그러한 예가 주어질 수 있습니다. 통계의 임무는 발음의 변동성과 언어 규범의 변화를 추적하는 것입니다.

전문적인 차이는 문법적 차이뿐만 아니라 어휘적 차이로 이어집니다. 이름을 딴 야쿠트 주립 대학 MK Ammosov는 50개의 설문지를 의사와 건축업자 사이에서 특정 단어에 대한 가장 일반적인 반응으로 분석했습니다(표 3).

빌더

인간

환자(10), 성격(5)

남자 (5)

좋은

도움말(8), 도움말(7)

악 (16)

죽음 (10)

사랑스러운 (5)

죽음

시체 (8)

생활 (6)

열(8), 화상(6)

불 (7)

손가락

손(14), 파나리티움(5)

대(7), 인덱스(6)

시력(6), 동공, 안과의(각 5)

브라운(10), 라지(6)

머리

마음(14), 두뇌(5)

빅(9), 스마트(8), 스마트(6)

잃다

의식, 생명(각각 4개)

돈 (5), 찾기 (4)

설문지에 주어진 단어 자극이 건축업자의 직업보다 직업과 더 관련이 있기 때문에 건축업자보다 의사가 직업 활동과 관련된 연상을 더 자주 제공한다는 점에 유의할 수 있습니다.

언어의 통계적 규칙성은 작가의 언어, 작업 등 모든 언어의 단어(단어 형식, 구문) 빈도의 수치적 특성을 제공하는 빈도 사전을 만드는 데 사용됩니다. 단어는 특정 볼륨의 텍스트에서 사용의 특성으로 사용됩니다.

음성 인식 모델은 필수 구성 요소인 사전 없이는 불가능합니다. 음성 인식에서 기본 조작 단위는 단어입니다. 이로부터 특히 인식된 텍스트의 각 단어는 청자(또는 독자)의 내부 어휘의 해당 단위와 동일시되어야 합니다. 처음부터 검색이 사전의 일부 하위 도메인으로 제한된다고 가정하는 것은 당연합니다. 대부분의 현대 음성 인식 이론에 따르면, 일반적인 경우에 소리 나는 텍스트의 실제 음성학적 분석은 단어의 가능한 음운적 모양에 대한 일부 정보만을 제공하며, 이러한 종류의 정보는 하나가 아니라 특정 MANY 단어에 해당합니다. 사전의; 따라서 두 가지 문제가 발생합니다.

(a) 특정 매개변수에 따라 적절한 세트를 선택합니다.

(b) 인식된 텍스트의 주어진 단어에 가장 잘 일치하는 유일한 단어를 제외한 모든 단어를 "제거"하기 위해 윤곽선 집합의 경계 내에서(적절하게 할당된 경우). "드롭아웃" 전략 중 하나는 빈도가 낮은 단어를 제외하는 것입니다. 따라서 음성 인식을 위한 어휘는 주파수 사전입니다. 제시된 프로젝트의 초기 작업은 러시아어 빈도 사전의 컴퓨터 버전을 만드는 것입니다.

러시아어 자료를 기반으로 5개의 빈도 사전이 있습니다(분기 사전 제외). 기존 사전의 몇 가지 일반적인 단점만 살펴보겠습니다.

알려진 모든 러시아어 빈도 사전은 기록된(인쇄된) 텍스트의 처리 배열을 기반으로 합니다. 부분적으로 이러한 이유로 단어의 정체성이 주로 형식적이고 시각적인 일치에 기반할 때 의미론이 충분히 고려되지 않습니다. 결과적으로 주파수 특성도 편이되고 왜곡됩니다. 예를 들어, 빈도 사전의 컴파일러가 "친구"라는 단어 사용에 대한 일반 통계에서 "서로"라는 조합의 단어를 포함하는 경우 이는 거의 정당화되지 않습니다. 다른 단어, 또는 오히려 독립된 사전 단위는 전체로서의 조합일 뿐입니다.

또한 기존의 모든 사전에서 단어는 단수형 명사, 명사격, 부정사형 동사 등 기본형으로만 배치됩니다. 일부 사전은 단어 형태의 빈도에 대한 정보를 제공하지만 일반적으로 철저하지 않고 일관되게 제공하지 않습니다. 동일한 단어의 다른 단어 형태의 빈도는 분명히 일치하지 않습니다. 음성 인식 모델의 개발자는 실제 인식 프로세스에서 인식 대상이 되는 텍스트에 "몰입된" 특정 단어 형식이라는 점을 고려해야 합니다. 단어 형태는 시작이 동일한 단어 집합이 형성되며 단어 형태의 초기 섹션이 사전 형식의 초기 섹션과 반드시 ​​동일하지는 않습니다. 특정 리듬 구조를 갖는 것은 단어 형식이며 단어의 지각 선택을 위한 매우 중요한 매개변수이기도 합니다. 마지막으로 인식된 발화의 최종 표현에서 단어는 해당 단어 형식으로 표현됩니다.

음성 인식 과정에서 주파수의 중요성을 보여주는 많은 작품들이 있습니다. 그러나 우리는 단어 형식의 빈도가 사용되는 작업을 인식하지 못합니다. 반대로 모든 저자는 개별 단어 형식의 빈도를 거의 무시하고 독점적으로 어휘소를 참조합니다. 그들에 의해 얻은 결과가 인공물로 간주되지 않는 경우 원어민이 단어 형식과 사전 형식의 빈도 비율, 즉 실제로 어휘소에 대한 정보에 어떻게든 접근할 수 있다고 가정해야 합니다. 또한 단어 형식에서 어휘소로의 이러한 전환은 물론 해당 패러다임에 대한 자연 지식으로 설명 할 수 없습니다. 단어를 최종 식별하기 전에 빈도 정보를 사용해야하기 때문입니다. 그렇지 않으면 단순히 의미를 잃습니다.

1차 통계적 특성에 따르면 텍스트의 종류와 관계없이 발생빈도가 높은 단어가 포함된 사전의 부분을 주어진 상대오차로 판단할 수 있다. 또한 사전에 단계별 정렬을 도입하여 처음 100개, 1000개, 5000개 등 자주 사용되는 단어를 포함하는 일련의 사전을 얻을 수 있습니다. 사전의 통계적 특성은 어휘의 의미론적 분석과 관련하여 관심을 갖는다. 주제-이데올로기 그룹 및 의미 필드에 대한 연구는 어휘 연관성이 가장 일반적인 의미를 가진 어휘 주위에 집중된 의미 링크에 의해 지원됨을 보여줍니다. 어휘 의미론적 필드 내의 의미에 대한 설명은 의미에서 가장 추상적인 어휘소를 가진 단어를 식별함으로써 수행될 수 있습니다. 분명히 "빈"(주격 능력의 관점에서) 사전 단위는 통계적으로 동질적인 계층을 구성합니다.

개별 장르에 대한 어휘는 그다지 가치가 없습니다. 유사성 측정과 통계적 분포의 특성을 연구하면 언어 사용 영역에 따라 어휘의 질적 계층화에 대한 흥미로운 정보를 얻을 수 있습니다.

빈도가 높은 사전을 편찬하려면 컴퓨터 기술을 사용해야 합니다. 사전 작업 과정에서 부분 기계화 및 자동화 도입은 다른 텍스트에 대한 사전의 기계 처리 실험으로 흥미 롭습니다. 이러한 사전은 어휘 자료를 처리하고 축적하기 위해 보다 엄격한 시스템을 필요로 합니다. 미니어처로 이것은 텍스트와 어휘의 다양한 측면에 대한 정보를 제공할 수 있는 정보 검색 시스템입니다. 이 시스템에 대한 몇 가지 기본 요청은 처음부터 계획되어 있습니다: 인벤토리 단어의 총 수, 단일 단어 및 전체 사전의 통계적 특성, 사전의 빈도 및 희귀 영역 순서 지정 등. 기계 카드 파일을 사용하면 다음을 수행할 수 있습니다. 개별 장르 및 소스에 대한 역 사전을 자동으로 구축합니다. 언어에 대한 다른 많은 유용한 통계 정보는 축적된 정보 배열에서 추출됩니다. 컴퓨터 주파수 사전은 보다 광범위한 어휘 작업 자동화로의 전환을 위한 실험적 기반을 만듭니다.

빈도 사전의 통계 데이터는 다른 언어 문제를 해결하는 데 널리 사용될 수 있습니다. 예를 들어 현대 러시아어의 단어 형성의 활성 수단을 분석 및 결정하고 어휘에 대한 통계적 정보(자소 조합의 확률적 특성, 단어로 구현되는 문자 조합의 유형을 고려하는 것이 중요함), 실제 필사 및 음역을 고려합니다. 사전의 통계적 매개변수는 리터럴 텍스트의 타이핑 자동화, 인식 및 자동 읽기 문제를 해결하는 데에도 유용합니다.

러시아어의 현대 설명 사전과 문법은 주로 문학 및 예술 텍스트를 기반으로 구축됩니다. A.S. 언어의 빈도 사전이 있습니다. 푸쉬킨, A.S. 그리보예도바, F.M. Dostoevsky, V.V. Vysotsky 및 기타 많은 저자. Smolensk State의 역사 및 문학 이론과에서. Pedagogical University는 시적 및 산문 텍스트의 빈도 사전을 편집하기 위해 수년 동안 노력해 왔습니다. 이 연구를 위해 푸쉬킨의 모든 가사와 황금 시대의 시인 두 명, 즉 그리보예도프의 "Woe from Wit"와 레르몬토프의 모든 시의 빈도 사전이 선택되었습니다. 파스테르나크와 실버 에이지의 다섯 명의 다른 시인 - Balmont 1894-1903, Blok의 "아름다운 여인에 관한 시", Mandelstam의 "Stone", Gumilyov의 "Pillar of Fire", Akhmatova의 "Anno Domini MCMXXI" 및 "Sisters of Pasternak의 My Life"와 철기 시대의 시인 4명 - "Yuri Zhivago의 시", "맑아질 때", M. Petrovs의 전체 가사 "The road is far away", "Windshield", Mezhirov의 "Farewell to the snow"와 "Horseshoes", Voznesensky의 "Antimirov", "Snezhnitsa » Rylenkova".

이 사전은 본질적으로 다르다는 점에 유의해야합니다. 일부는 하나의 극적인 작품의 어휘를 나타내고 다른 일부는 가사 책, 여러 책 또는 시인시의 전체 모음을 나타냅니다. 이 백서에 제시된 분석 결과는 주의를 기울여야 하며 절대적인 것으로 간주할 수 없습니다. 그러나 특별한 조치를 통해 텍스트의 존재론적 특성의 차이를 어느 정도 줄일 수 있습니다.

최근 몇 년 동안 구어체와 책 연설 사이의 반대가 점점 더 분명해졌습니다. 이 문제는 구어를 향한 교육의 전환을 요구하는 방법론자들 사이에서 특히 날카롭게 논의됩니다. 그러나 구어체 연설의 특수성은 여전히 ​​설명되지 않습니다.

사전은 EXCEL97 오피스 프로그램 환경에서 사용자 어플리케이션을 생성하여 처리하였다. 이 응용 프로그램에는 "제목 시트", 초기 데이터가 포함된 "사전" 시트, 결과가 포함된 "근접성" 및 "거리", 매크로 세트 등 4개의 EXCEL 책 워크시트가 포함되어 있습니다.

초기 정보는 "사전" 시트에 입력됩니다. 학습된 텍스트의 사전은 EXCEL 셀에 기록되며 마지막 열 S는 얻은 결과로 구성되며 다른 사전에서 찾은 단어 수와 같습니다. "근접성" 및 "거리" 표에는 근접성 M, 상관 관계 R 및 거리 D의 계산된 측정값이 포함됩니다.

응용 프로그램 매크로는 VBA(Visual Basic for Application)로 작성된 이벤트 기반 프로그래밍 절차입니다. 절차는 VBA 라이브러리 개체 및 해당 처리 방법을 기반으로 합니다. 따라서 응용 프로그램의 워크시트를 사용한 작업의 경우 핵심 개체인 워크시트(워크시트)와 해당 시트 활성화 방법(활성화)이 사용됩니다. 분석된 소스 데이터의 범위를 Dictionary 시트에 설정하는 것은 Range 객체(range)의 Select 메소드에 의해 이루어지며, 단어를 변수에 값으로 전달하는 것은 동일한 Range의 Value 속성(value)으로 이루어진다. 물체.

순위 상관 분석이 서로 다른 텍스트 간의 주제 종속성에 대해 주의를 기울이게 만든다는 사실에도 불구하고 각 텍스트에서 가장 빈번한 단어의 대부분은 하나 이상의 다른 텍스트에서 일치합니다. S열은 각 저자에 대해 가장 빈번한 15개 단어 중 해당 단어의 수를 보여줍니다. 굵은 글씨체로 된 단어는 우리 표에 있는 한 시인의 단어에만 나타납니다. Blok, Akhmatova 및 Petrovs에는 강조 표시된 단어가 전혀 없으며 S = 15입니다. 이 세 명의 시인은 가장 자주 사용되는 15개의 단어가 동일하며 목록의 위치만 다릅니다. 하지만 어휘가 가장 독창적인 푸쉬킨도 S=8이고 강조 표시된 단어가 7개 있습니다.

결과는 시의 주요 주제를 집중시키는 특정 어휘 계층이 있음을 보여줍니다. 일반적으로 이러한 단어는 짧습니다: 1음절 88, 2음절 127, 3음절 10의 총 단어 사용 수(225) 중. 종종 이러한 단어는 주요 신화를 나타내며 쌍으로 떨어질 수 있습니다. 밤-낮, 땅-하늘(태양), 신-인간(사람), 삶-죽음, 몸-영혼, 로마-세계(만델스탐에서); 더 높은 수준의 신화로 결합될 수 있습니다. 하늘, 별, 태양, 지구; 사람은 원칙적으로 몸, 심장, 피, 팔, 다리, 뺨, 눈이 두드러집니다.. 인간 상태 중에서 수면과 사랑이 선호됩니다. 집과 도시는 모스크바, 로마, 파리와 같은 인간 세계에 속합니다. 창의성은 어휘소로 표현된다 단어그리고 노래.

Griboedov와 Lermontov는 가장 빈번한 단어 중 자연을 나타내는 단어가 거의 없습니다. 그들은 사람, 몸의 일부, 영적 세계의 요소를 나타내는 단어가 세 배나 많습니다. 푸쉬킨과 20세기 시인. 인간과 자연의 명칭은 거의 동일합니다. 주제의 이 중요한 측면에서 우리는 20세기라고 말할 수 있습니다. 푸쉬킨을 따랐다.

최소 테마 사례가장 빈번한 단어 중 Griboyedov와 Pushkin에서만 발견됩니다. 레르몬토프와 20세기 시인. 그것은 최소한의 주제로 나아갑니다. 단어. 그 단어는 행위를 배제하지 않습니다(주제에 대한 성경적 해석: 신약에서 예수 그리스도의 모든 가르침은 하나님의 말씀 또는 예수의 말씀으로 간주되며 사도들은 때때로 스스로를 말씀의 사역자라고 부릅니다). 어휘소 단어의 신성한 의미는 예를 들어 Pasternak의 구절 "그리고 말씀에 드러난 세상의 이미지"에서 설득력있게 나타납니다. 어휘소의 신성한 의미 단어인간사와 관련하여 그리고 대조적으로 Gumilyov의 같은 이름의시에서 설득력있게 나타납니다.

하나의 텍스트에서만 발견되는 토큰은 주어진 책 또는 책 모음의 독창성을 나타냅니다. 예를 들어 "mind"라는 단어는 Griboedov의 코미디 "Woe from Wit"에서 가장 자주 사용되지만 다른 텍스트의 빈도 단어에서는 발생하지 않습니다. 마음의 주제는 희극에서 단연코 가장 중요한 주제입니다. 이 어휘소는 Chatsky의 이미지를 수반하며 Chatsky라는 이름은 코미디에서 가장 자주 사용됩니다. 따라서 작품은 가장 빈번한 보통명사와 가장 빈번한 고유명사를 유기적으로 조합한다.

가장 높은 상관 계수는 Gumilyov의 비극적 책 "The Pillar of Fire"와 Akhmatova의 "Anno Domini MCMXXI"의 주제를 연결합니다. 가장 많이 사용되는 명사 15개 중 피, 마음, 영혼, 사랑, 말, 하늘 등 10개의 공통 명사가 있습니다. Akhmatova의 책에는 Gumilyov의 체포와 그의 처형 사이에 쓰여진 미니어처 "당신은 살아 있지 않을 것입니다 ..."가 포함되어 있음을 기억하십시오.

연구 자료의 촛불과 군중의 주제는 "유리 지바고의시"에서만 발견됩니다. 소설 구절에서 촛불의 주제는 많은 맥락 적 의미를 가지고 있습니다. 그것은 신앙, 불멸, 창의성, 데이트라는 주제와 함께 예수 그리스도의 이미지와 관련이 있습니다. 촛불은 소설의 중심 장면에서 가장 중요한 빛의 원천이다. 군중의 주제는 흔들리지 않는 가치를 가진 사람의 사생활이 군중을 기쁘게하는 원칙에 기반한 새로운 국가의 부도덕에 반대하는 소설의 주요 아이디어와 관련하여 발전합니다. .

이 작업에는 프로그램에도 반영된 세 번째 단계도 포함됩니다. 이것은 두 사전에 공통된 단어의 서수 차이와 두 사전의 동일한 단어 간의 평균 거리를 계산하는 것입니다. 이 단계에서는 통계의 도움으로 식별된 사전 상호 작용의 일반적인 추세에서 텍스트에 접근하는 수준으로 이동할 수 있습니다. 예를 들어, Gumilyov와 Akhmatova의 책은 통계적으로 유의미한 상관 관계가 있습니다. 사전에서 어떤 단어가 공통적으로 사용되는지 살펴보고 우선 일련 번호가 최소로 다르거나 0인 단어를 선택합니다. 순위 번호가 같은 것은 이 단어들이며, 결과적으로 똑같이 중요한 것은 두 시인의 마음 속에 있는 이러한 최소한의 주제입니다. 다음으로 텍스트 및 컨텍스트 수준으로 이동해야 합니다.

정량적 방법은 또한 원어민인 사람들의 특성을 연구하는 데 도움이 됩니다. 러시아어에는 6 건이 있고 영어에는 사례가 없으며 Dagestan 사람들의 일부 언어에서는 사례 수가 40에 이릅니다. L. Perlovsky는 그의 기사 "의식, 언어 및 문화"에서 이들을 연관시킵니다. 사물과 현상을 개별적으로 또는 다른 사람과 관련하여 인식하는 개인주의 또는 집단주의에 대한 사람들의 경향이있는 특성. 결국 개인의 자유, 자유주의, 민주주의와 같은 개념이 등장한 것은 영어권 세계 (사례가 없습니다. "자체적으로"인식됨)였습니다. 평가 특성이 없는 언어). 그러한 추측은 여전히 ​​대담한 과학적 가설 수준에만 남아 있다는 사실에도 불구하고 이미 익숙한 현상을 새로운 방식으로 보는 데 도움이됩니다.

보시다시피 양적 특성은 언어학의 완전히 다른 영역에 적용될 수 있으며 "정확한" 방법과 "인도주의적인" 방법 사이의 경계가 점차 모호해집니다. 언어학은 문제를 해결하기 위해 수학뿐만 아니라 컴퓨터 기술의 도움에 점점 더 의존하고 있습니다.

2.3 형식 논리의 방법으로 언어 학습

비정량적 수학 방법, 특히 논리와 함께 현대 이론 언어학은 정량적 방법보다 덜 유익하게 상호 작용합니다. 컴퓨터 기술의 급속한 발전과 현대 세계에서의 역할의 성장은 일반적으로 언어와 논리의 상호 작용에 대한 접근 방식의 수정을 요구했습니다.

논리의 방법은 공식화 된 언어, 특히 프로그래밍 언어의 개발에 널리 사용되며, 그 요소는 일부 기호 (수학적 유사), 선택 (또는 이전에 선택된 기호로 구성) 및 특정 방식으로 해석되며, "전통적인" 사용, 이해 및 이해 없이 다른 문맥에서 동일한 기호의 기능. 프로그래머는 자신의 작업에서 끊임없이 논리를 다룹니다. 프로그래밍의 의미는 컴퓨터에게 (가장 넓은 의미에서) 추론하도록 가르치는 것입니다. 동시에 "추론"의 방법은 매우 다른 것으로 밝혀졌습니다. 모든 프로그래머는 자신과 다른 사람의 프로그램에서 버그를 찾는 데 일정 시간을 소비합니다. 즉, 논리에서 추론의 오류를 검색합니다. 그리고 이것은 또한 흔적을 남깁니다. 일반 음성에서 논리적 오류를 감지하는 것이 훨씬 쉽습니다. 논리학자가 연구하는 언어의 상대적 단순성은 복잡한 자연어만을 분석하는 언어학자가 달성할 수 있는 것보다 더 명확하게 이러한 언어의 구조를 설명할 수 있게 합니다. 논리학자가 연구하는 언어가 자연어에서 복사한 관계를 사용한다는 점에서 논리학자는 언어 일반 이론에 상당한 기여를 할 수 있습니다. 여기의 상황은 물리학에서 발생하는 상황과 유사합니다. 물리학자는 또한 자연에서 전혀 발생하지 않는 이상적으로 단순화된 경우에 대한 정리를 공식화합니다. 그는 이상 기체, 이상 액체에 대한 법칙을 공식화하고 마찰이 없을 때 운동에 대해 이야기합니다. 등. 이러한 이상화된 사례의 경우, 현실에서 일어나는 일과 모든 복잡성에서 현실을 직접 고려하려고 시도할 경우 물리학에 알려지지 않은 상태로 남을 수 있는 일을 이해하는 데 크게 기여할 간단한 법칙을 설정할 수 있습니다.

자연어 연구에서는 언어 학습자가 가능한 한 많은 단어를 어리석게 "암기"하지 않고 그 구조를 더 잘 이해할 수 있도록 논리적 방법이 사용됩니다. L. Shcherba는 또한 강의에서 러시아어 법에 따라 작성된 문장의 예를 사용했습니다. "반짝이는 kuzdra shteko는 bokra를 boked하고 bokra를 말립니다." 문장에서 단어의 의미가 불분명하다는 사실에도 불구하고 (그들은 단순히 러시아어로 존재하지 않음) 명확하게 대답 할 수있었습니다. bokr' 애니메이션 등 이 문구의 번역은 다음과 같은 것으로 밝혀졌습니다. 전적으로 언어의 법칙에 따라 구축된 존재하지 않는 단어의 텍스트(예술적)의 유사한 예는 Lewis Carroll의 Jabberwock입니다(이상한 나라의 앨리스에서 Carroll은 그의 캐릭터 Humpty Dumpty를 통해 그가 단어의 의미를 설명합니다. 발명 : "요리"-저녁 8시, 저녁 식사를 요리 할 때 "chlivky"-약하고 손재주, "shorek"-흰 족제비, 오소리 및 타래 송곳 사이의 십자가, "다이빙"- 점프, 잠수, 회전, "나바" - 해시계 아래의 풀(오른쪽으로 약간, 왼쪽으로 약간, 뒤로 약간 확장됨), "그런트" - 끙끙거리고 웃으며, "젤류크" - 녹색 칠면조, "myumzik"-새; 그녀의 깃털은 흐트러지고 빗자루처럼 모든 방향으로 튀어 나와 있습니다. "mova"-집에서 멀리 떨어져 있습니다) .

현대 논리 및 이론적 언어학의 주요 개념 중 하나는 다양한 논리 및 수학 미적분학, 자연어 연구에 사용되어 서로 다른 "수준"의 언어 간의 관계를 설명하고 고려중인 언어와 도움으로 설명되는 주제 영역은 메타 언어의 개념입니다. 메타 언어는 언어 대상인 다른 언어에 대한 판단을 표현하는 데 사용되는 언어입니다. 메타 언어의 도움으로 언어 대상의 문자 조합(표현) 구조를 연구하고 표현 속성, 다른 언어와의 관계 등에 대한 정리를 증명합니다. 연구 중인 언어는 주제 언어라고도 합니다. 이 메타 언어와 관련이 있습니다. 주제 언어와 메타 언어는 모두 일반(자연) 언어가 될 수 있습니다. 메타언어는 목적어와 다를 수 있지만(예를 들어 러시아인을 위한 영어 교과서에서는 러시아어가 메타언어이고 영어가 목적어임), 예를 들어 특수 용어와 같이 부분적으로만 다를 수도 있습니다. (러시아어 언어용어는 러시아어를 기술하기 위한 메타언어의 한 요소이며, 소위 의미적 요소는 자연어의 의미를 기술하기 위한 메타언어의 일부이다.)

"메탈 언어"의 개념은 수학적 논리의 틀 안에 구축된 형식화된 언어 연구와 관련하여 매우 유익해졌습니다. 형식화된 주제어와 달리, 이 경우 메타언어는 메타이론이 공식화되는 수단(주제 언어로 공식화된 주제 이론의 속성을 연구함)은 일반적으로 일반적인 자연어이며, 어떤 특별한 방식으로 어떤 종류의 모호함도 포함하지 않는 특수한 방식으로 제한된 자연 언어의 단편 , 은유, "형이상학적" 개념 등 정확한 과학적 연구를 위한 도구로 사용하는 것을 방해하는 일상 언어의 요소. 동시에 메타언어 자체가 형식화될 수 있고 (이와 상관없이) 메타메타언어를 통해 수행되는 연구의 대상이 될 수 있으며, 그러한 시리즈는 무한히 성장하는 것으로 "생각"될 수 있다.

논리는 우리에게 언어 대상과 메타 언어 사이의 유익한 구별을 가르쳐줍니다. 언어-대상은 바로 논리적 연구의 대상이며, 메타언어는 그러한 연구가 수행되는 필연적으로 인공적인 언어이다. 논리적 사고는 실제 언어(객체 언어)의 관계와 구조를 기호의 언어(메타언어)로 공식화하는 것일 뿐입니다.

메타 언어는 어떤 경우에도 객관적 언어보다 "나쁘지 않아야" 합니다(즉, 메타 언어에서 후자의 각 표현에는 "번역"이라는 이름이 있어야 합니다). 그렇지 않으면 이러한 요구 사항이 충족되지 않으면(확실히 특별 계약이 달리 제공하지 않는 경우 자연 언어로 배치) 의미 론적 역설(이율배반)이 발생합니다.

점점 더 많은 새로운 프로그래밍 언어가 만들어지면서 프로그래밍 번역가의 문제와 관련하여 메타 언어를 만드는 것이 시급했습니다. 현재 Backus-Naur 형식의 메타언어(약칭 BNF)는 프로그래밍 언어의 구문을 설명하는 데 가장 일반적으로 사용됩니다. 수학적 공식과 유사한 일부 공식 형태의 압축 형식입니다. 언어의 각 개념에 대해 고유한 메타 수식(정상 수식)이 있습니다. 왼쪽과 오른쪽 부분으로 구성되어 있습니다. 왼쪽은 정의되는 개념을 지정하고 오른쪽은 이 개념으로 결합되는 허용 가능한 언어 구조 집합을 지정합니다. 수식은 꺾쇠 괄호 형태의 특수 메타문자를 사용하는데, 여기에는 정의 중인 개념(수식의 왼쪽) 또는 이전에 정의한 개념(오른쪽)이 포함되며 왼쪽과 오른쪽 부분의 구분이 표시됩니다. "::=" 메타 문자로, 그 의미는 "정의에 따라 존재합니다"라는 단어와 동일합니다. Metalinguistic 공식은 어떤 형태로든 번역기에 내장되어 있습니다. 이들의 도움으로 프로그래머가 사용하는 구성이 이 언어에서 구문적으로 유효한 구성과 형식적으로 일치하는지 확인합니다. 다양한 과학의 별도의 메타 언어도 있으므로 지식은 다양한 메타 언어의 형태로 존재합니다.

논리적 방법은 또한 연결주의 개념을 기반으로 한 인공 지능 시스템 생성의 기반이 되었습니다. 연결주의는 지식에 대한 질문을 주제로 하는 철학 과학의 특별한 경향입니다. 이러한 경향의 틀 안에서 인공신경망을 이용하여 사람의 지적 능력을 설명하려는 시도가 이루어지고 있다. 뉴런과 유사한 많은 수의 구조 단위로 구성되고 다른 요소와의 연결 강도를 결정하는 각 요소에 가중치가 할당된 신경망은 인간 뇌의 단순화된 모델입니다. 이러한 종류의 신경망을 사용한 실험은 패턴 인식, 읽기 및 간단한 문법 구조 식별과 같은 작업을 수행하는 방법을 학습하는 능력을 입증했습니다.

철학자들은 연결주의에 관심을 갖기 시작했는데, 이는 연결주의 접근이 마음의 고전적 이론과 마음의 작용이 디지털 장치에 의한 상징적 언어의 처리와 유사하다는 이 이론 내에서 널리 받아들여지는 생각에 대한 대안을 제공할 것을 약속했기 때문입니다. 컴퓨터. 이 개념은 매우 논란의 여지가 있지만 최근 몇 년 동안 점점 더 많은 지지자를 찾았습니다.

언어에 대한 논리적 연구는 시스템으로서의 언어에 대한 소쉬르의 개념을 이어갑니다. 그것이 끊임없이 계속되고 있다는 사실은 지난 세기 초 과학적 추측의 대담성을 다시 한 번 확인시켜줍니다. 나는 오늘날 언어학에서 수학적 방법의 발전에 대한 전망에 내 연구의 마지막 부분을 바칠 것입니다.

2.4 언어학에서 수학적 방법의 적용에 대한 전망

컴퓨터 기술 시대에 수학적 언어학의 방법은 새로운 발전 관점을 받았습니다. 언어 분석 문제에 대한 솔루션 검색은 이제 점점 더 정보 시스템 수준에서 구현되고 있습니다. 동시에 언어 자료 처리 프로세스의 자동화는 연구원에게 상당한 기회와 이점을 제공하며 필연적으로 그에게 새로운 요구 사항과 작업을 제시합니다.

"정확한" 지식과 "인도주의적인" 지식의 조합은 언어학, 컴퓨터 과학 및 철학 분야에서 새로운 발견을 위한 비옥한 토양이 되었습니다.

한 언어에서 다른 언어로의 기계 번역은 빠르게 성장하는 정보 기술 분야로 남아 있습니다. 컴퓨터 지원 번역은 품질 면에서 사람의 번역(특히 문학 텍스트의 경우)과 결코 비교할 수 없다는 사실에도 불구하고 대량의 텍스트를 번역할 때 기계는 사람에게 없어서는 안 될 도우미가 되었습니다. 가까운 장래에 주로 텍스트의 의미론적 분석을 기반으로 하는 보다 발전된 번역 시스템이 만들어질 것으로 믿어집니다.

똑같이 유망한 영역은 정보 기술과 소위 "가상 현실"을 이해하기 위한 철학적 토대 역할을 하는 언어학과 논리의 상호 작용입니다. 가까운 장래에 인공 지능 시스템 생성에 대한 작업이 계속 될 것입니다. 다시 말하지만 그 능력은 인간과 같지 않을 것입니다. 그러한 경쟁은 무의미합니다. 우리 시대에 기계는 경쟁자가 아니라 인간의 조수가 되어야 하며 환상의 영역이 아니라 현실 세계의 일부가 되어야 합니다.

통계적 방법에 의한 언어 연구는 계속되어 질적 특성을보다 정확하게 결정할 수 있습니다. 언어에 대한 가장 대담한 가설은 수학적, 따라서 논리적인 증거를 찾는 것이 중요합니다.

가장 중요한 것은 언어학에서 수학 적용의 다양한 분야가 이전에는 상당히 고립되어 있었지만 최근 몇 년 동안 Ferdinand de Saussure가 발견한 언어 시스템과 유사하게 일관된 시스템으로 연결되어 서로 연관되어 있다는 것입니다. 그리고 Yvan Baudouin de Courtenay. 이것이 과학적 지식의 연속성입니다.

현대 세계의 언어학은 정보 기술 발전의 기반이 되었습니다. 컴퓨터 과학이 급속도로 발전하는 인간 활동의 한 분야로 남아 있는 한, 수학과 언어학의 결합은 과학 발전에서 계속해서 그 역할을 할 것입니다.

결론

20세기 동안 컴퓨터 기술은 군사적 사용에서 평화적 사용에 이르기까지, 좁은 범위의 목표에서 인간 생활의 모든 분야로의 침투에 이르기까지 먼 길을 왔습니다. 과학으로서의 수학은 컴퓨터 기술의 발달과 함께 새로운 실천적 의미를 발견했습니다. 이 과정은 오늘날에도 계속됩니다.

이전에는 상상도 할 수 없었던 "물리학자"와 "작사가"의 "탠덤"이 현실이 되었습니다. 인문학과 수학과 컴퓨터 과학의 완전한 상호 작용을 위해서는 자격을 갖춘 전문가가 양측에 필요했습니다. 컴퓨터 과학자들은 주변 현실의 변화를 이해하고, 인간과 기술의 상호 작용에서 점점 더 많은 새로운 언어 및 정신 개념을 개발하고, 프로그램, 전문적인 성장을 위해 우리 시대의 모든 "인문학"은 최소한 컴퓨터 작업의 기본을 마스터해야합니다.

정보학과 밀접하게 연결되어 있는 수학은 자연과학 및 인문학과 지속적으로 발전하고 교류하고 있습니다. 새로운 세기에 과학의 수학화 경향은 약해지는 것이 아니라 오히려 증가하고 있습니다. 정량적 데이터를 기반으로 언어 발달 법칙, 역사적, 철학적 특성을 이해합니다.

수학적 형식주의는 언어학의 패턴을 설명하는 데 가장 적합합니다(실제로 인문학과 자연 과학 모두에서와 마찬가지로). 상황은 때때로 과학에서 적절한 수학적 언어를 사용하지 않고는 물리적, 화학적 등의 본질을 이해하는 것이 불가능한 방식으로 발전합니다. 프로세스가 불가능합니다. XX 세기의 유명한 영국 물리학자인 원자의 행성 모델 만들기. E. Rutherford는 수학적 어려움을 겪었습니다. 처음에는 그의 이론이 받아들여지지 않았습니다. 그것은 설득력 있게 들리지 않았고, 그 이유는 원자 상호 작용의 모델 표현을 이해하는 것이 가능한 메커니즘에 기초한 확률 이론에 대한 Rutherford의 무지 때문이었습니다. 이를 깨닫고 이미 노벨상의 소유자 인 뛰어난 과학자가 수학자 Lamb 교수의 세미나에 등록하고 2 년 동안 학생들과 함께 과정에 참석하고 확률 이론에 대한 워크샵을 진행했습니다. . 이를 기반으로 Rutherford는 전자의 거동을 설명할 수 있었고 그의 구조 모델에 설득력 있는 정확성을 부여하고 인지도를 얻었습니다. 언어학도 마찬가지입니다.

이것은 객관적인 현상에서 수학의 언어로, 양적 특성의 언어로 설명될 수 있는 덕분에 무엇이 그렇게 수학적인가라는 질문을 던집니다. 이들은 시간과 공간에 분포된 균일한 물질 단위입니다. 균질성의 고립을 향해 다른 과학보다 더 멀리 나아갔고 수학을 사용하는 데 더 적합한 것으로 판명된 과학.

1990년대에 급속도로 발전한 인터넷은 다양한 국가, 민족, 문화의 대표자들을 하나로 모았습니다. 영어가 계속해서 국제 커뮤니케이션의 주요 언어라는 사실에도 불구하고 인터넷은 우리 시대에 다국어가 되었습니다. 이것은 인간 활동의 다양한 분야에서 널리 사용되는 상업적으로 성공적인 기계 번역 시스템의 개발로 이어졌습니다.

컴퓨터 네트워크는 철학적 성찰의 대상이 되었습니다. "가상 현실"을 이해하는 데 도움이 되는 새로운 언어적, 논리적, 세계관 개념이 점점 더 많이 만들어지고 있습니다. 많은 예술 작품에서 사람에 대한 기계의 지배와 외부 세계에 대한 가상 현실에 대한 시나리오 (더 자주 비관적 인 시나리오)가 만들어졌습니다. 항상 그러한 예측은 무의미한 것으로 판명되었습니다. 정보 기술은 인간의 지식을 투자하는 유망한 산업일 뿐만 아니라 정보를 제어하고 결과적으로 인간의 생각을 통제하는 방법이기도 합니다.

이 현상에는 부정적인 측면과 긍정적인 측면이 모두 있습니다. 부정적 - 정보에 대한 통제는 정보에 대한 자유로운 접근에 대한 양도할 수 없는 인권에 위배되기 때문입니다. 긍정적 - 이 제어가 부족하면 인류에게 치명적인 결과를 초래할 수 있기 때문입니다. 지난 10년 동안 가장 현명한 영화 중 하나인 Wim Wenders의 "세상이 끝날 때"를 회상하는 것으로 충분합니다. 그의 캐릭터는 컴퓨터에 기록된 자신의 꿈의 "가상 현실"에 완전히 몰두합니다. 그러나 한 명의 과학자도, 한 명의 예술가도 미래에 무엇이 과학과 기술을 기다리고 있는지에 대한 명확한 답을 줄 수는 없습니다.

때때로 환상적으로 보이는 "미래"에 초점을 맞추는 것은 발명가들이 인간의 개입 없이 작동할 수 있는 완벽한 기술 모델을 만들려고 했던 20세기 중반 과학의 독특한 특징이었습니다. 시간은 그러한 연구의 유토피아적 성격을 보여주었다. 그러나 이것에 대해 과학자들을 비난하는 것은 불필요 할 것입니다. 1950-60 년대에 열정이 없었다면 정보 기술은 90 년대에 그렇게 강력한 도약을 이루지 못했을 것이며 우리는 지금 우리가 가진 것을 갖지 못했을 것입니다.

20세기의 지난 수십 년 동안 과학의 우선 순위가 바뀌었습니다. 연구, 창의적인 파토스는 상업적 관심으로 바뀌었습니다. 다시 말하지만 이것은 좋지도 나쁘지도 않습니다. 이것은 과학이 점점 더 일상 생활에 통합되는 현실입니다.

21세기에도 이러한 추세는 계속되고 있으며, 우리 시대에 발명의 이면에는 명성과 인지도뿐만 아니라 무엇보다도 돈이 있습니다. 최신 과학기술 성과가 테러단체나 독재정권의 손에 들어가지 않도록 하는 것도 중요한 이유다. 작업은 불가능할 정도로 어렵습니다. 그것을 최대한 실현하는 것은 전 세계 공동체의 과제입니다.

정보는 무기이며 무기는 핵무기 또는 화학 무기보다 덜 위험하지 않습니다. 단지 물리적으로 작용하는 것이 아니라 심리적으로 작용합니다. 인류는 이 경우 자유와 통제 중 무엇이 더 중요한지 생각해야 합니다.

정보기술의 발전과 관련된 최근의 철학적 개념과 이를 이해하려는 시도는 19세기와 20세기 초를 지배했던 자연과학적 유물론과 물질세계의 의미를 부정하는 극단적 관념론의 한계를 동시에 보여주었다. . 현대사상, 특히 서양사상은 주변세계가 물질과 이상으로 명확하게 구분되는 상황에서 이러한 사고의 이원성을 극복하는 것이 중요하다. 이에 대한 길은 문화의 대화, 주변 현상에 대한 다양한 관점의 비교입니다.

역설적이게도 정보 기술은 이 과정에서 중요한 역할을 할 수 있습니다. 컴퓨터 네트워크, 특히 인터넷은 엔터테인먼트와 활발한 상업 활동을 위한 자원일 뿐만 아니라 현대 세계의 다양한 문명의 대표자들 간의 의미 있고 논란이 많은 의사 소통의 수단이기도 합니다. 본. 인터넷은 공간적, 시간적 경계를 넘어선다고 할 수 있습니다.

그리고 정보 기술을 통한 문화의 대화에서 가장 오래된 보편적 의사소통 수단으로서의 언어의 역할은 여전히 ​​중요합니다. 그렇기 때문에 언어학은 수학, 철학, 컴퓨터 과학과의 상호 작용을 통해 두 번째 탄생을 경험하고 오늘날에도 계속 발전하고 있습니다. 현재의 추세는 미래에도 계속 될 것입니다. 15 년 전 동일한 V. Wenders가 예측했듯이 "세상이 끝날 때까지"입니다. 사실, 이 끝이 언제 발생할지는 알 수 없지만 미래는 조만간 현재가 될 것이기 때문에 지금 중요합니다.

부록 1

페르디낭 드 소쉬르

스위스 언어학자 Ferdinand de Saussure(1857-1913)는 특정 언어와 언어 형태의 역사보다는 언어의 구조를 기술하려는 시도에서 현대 언어학의 창시자로 널리 간주됩니다. 사실, 언어학 및 문학 연구의 구조주의 방법과 기호학의 중요한 분야는 20세기 초에 그의 작업에서 주요 출발점을 찾습니다. Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes 등의 작업인 "후기 구조주의"라고 불리게 된 전략과 개념의 복합체는 Saussure의 작업에서 제안되었습니다. 후기 라틴 시의 언어학 및 철자법적 독해 문학적 모더니즘에서 20세기 초반의 정신 분석 및 철학에 이르기까지. Algirdas Julien Greimas와 Joseph Courtés가 Semiotics and Language: An Analytic Dictionary에서 "Interpretation"이라는 제목으로 주장한 것처럼 20세기 초에 소쉬르 언어학, Husserlian 현상학 및 Freud 정신 분석과 동일시하는 새로운 해석 방식이 등장했습니다. 이 양식에서 "해석은 더 이상 주어진 내용을 형식에 귀속시키는 문제가 아닙니다. 오히려 주어진 기호 체계 내에서 의미 요소의 등가 내용을 다른 방식으로 공식화하는 의역입니다." 159). "해석"에 대한 이러한 이해에서 형식과 내용은 구별되지 않습니다. 오히려 모든 "형식"은 의미론적 "내용"이자 "의미하는 형식"이기도 하므로 해석은 이미 다른 의미 시스템 내에서 의미를 나타내는 어떤 것에 대한 유추적 의역을 제공합니다.

이러한 형태와 이해의 재해석은 클로드 레비스트로스가 "구조와 형태: 블라디미르 프롭의 작품에 대한 고찰"에서 구조주의 개념에 대한 그의 가장 프로그래밍적인 표현 중 하나에서 설명한 것입니다. in General Linguistics (1916, trans., 1959, 1983). 그의 생애 동안 Saussure는 상대적으로 거의 출판하지 않았으며 그의 주요 작업인 Course는 1907-11년에 그가 제공한 일반 언어학의 여러 과정을 학생들이 필사한 것입니다. Course에서 Saussure는 19세기에 행해진 역사적 언어학 작업과 반대되는 언어의 "과학적" 연구를 요구했습니다. 그 작업은 서구 지성의 위대한 업적 중 하나입니다. 언어, 역사적 (또는 "통시적") 언어학은 추정되는 공통 언어 소스, 먼저 "인도 유럽"언어 및 이전 "p"에서 서양 언어의 기원과 발전을 추적했습니다. roto-Indo-European" 언어.

소쉬르가 의문을 제기한 것은 언어의 기본 "단위"가 실제로 이러한 "단어 요소"의 긍정적인 존재라는 수반되는 가정과 함께 단어의 고유한 발생에 대한 연구입니다. 그의 작업은 역사 언어학에서 아주 세밀하게 연구한 언어에 관한 많은 사실을 감당할 수 있는 수의 명제로 축소하려는 시도였습니다. 19세기 문헌학의 "비교학파"는 과정에서 "언어학이라는 진정한 과학을 확립하는 데 성공하지 못했다"고 소쉬르는 말합니다. 그 "본성"은 단순히 언어를 구성하는 "원소적인" 단어들 - 외관상 언어의 "긍정적인" 사실(또는 "실질")에서 발견되는 것이 아니라 그것들을 발생시키는 형식적 관계에서 발견되어야 한다고 그는 주장한다. "물질."

소쉬르의 언어에 대한 체계적 재검토는 세 가지 가정에 기반을 두고 있습니다. 그가 가석방으로 지정한 "말-사건"- 그리고 언어학의 적절한 대상, 그가 랑그로 지정한 사건을 지배하는 체계(또는 "코드"). 더욱이 이러한 체계적 연구는 "공시적"을 요구합니다. 역사를 통한 언어 발달에 대한 "통시적" 연구보다는 특정 순간에 언어 요소들 사이의 관계에 대한 개념.

이 가정은 1929년에 Roman Jakobson이 "구조주의"로 지정하게 된 것을 야기했습니다. "현대 과학에 의해 조사된 모든 현상은 기계적 집합체가 아니라 구조적 전체로 취급됩니다. 프로세스의 기계적 개념은 다음 질문에 굴복합니다. 그들의 기능"("로맨틱" 711). 이 구절에서 Jakobson은 역사적 사건에 대한 단순하고 "기계적인" 설명이 아니라 과학 체계로서 언어학을 정의하려는 Saussure의 의도를 명확히 표현하고 있습니다. 이와 함께 Jakobson은 또한 Saussurean의 두 번째 기본 가정을 설명하고 있습니다. 지금은 그것을 "구조적"이라고 부릅니다. 언어학: 언어의 기본 요소는 그 원인이 아니라 기능과 관련해서만 연구될 수 있습니다. 유럽의 "단어"), 그러한 사건과 실체는 체계적 틀 안에 위치해야 합니다. 이것은 다른 소위 사건 및 실체와 관련되어 있습니다. 이것은 경험과 현상을 이해하는 데 있어 급진적인 재정향이며, 철학자 Ernst Cassirer는 그 중요성을 "17세기에 우리 전체를 변화시킨 갈릴레오의 새로운 과학"과 비교했습니다. 물리적 세계의 개념"(Culler, Pursuit 2에서 인용) 4). Greimas와 Courtés가 지적한 바와 같이 이러한 변화는 "해석"을 재고하고 따라서 설명과 이해 자체를 재고합니다. 설명은 "현상"의 원인에 관한 것이므로 "결과"로서 어떤 방식으로 원인에 종속되는 대신, 여기에서 설명은 현상을 미래 지향적인 "기능"에 종속시키는 것으로 구성됩니다. "목적." 설명은 더 이상 인간의 의도나 목적과 무관하지 않습니다(비인격적, 공동적 또는 프로이트 용어로 "무의식"일 수 있음에도 불구하고).

그의 언어학에서 Saussure는 특히 언어적 "단어"의 재정의에서 이러한 변형을 수행합니다. 그는 언어적 "기호"로 설명하고 기능주의 용어로 정의합니다. 그는 기호가 "개념과 소리 이미지"의 결합이라고 주장하며, 이를 "기표와 기표"라고 불렀습니다(66-67; Roy Harris의 1983년 번역은 "의미"와 "신호"라는 용어를 제공합니다). 그들의 "결합"의 본질은 기의도 기표도 다른 것의 "원인"이 아니라 "각각이 다른 것의 가치"(8)라는 점에서 "기능적"입니다. 언어의 요소, 기호 , 관계적으로 역사적 언어학의 기본 가정, 즉 언어와 의미의 기본 단위(즉, "단어")의 동일성을 엄격한 분석 대상으로 만듭니다. "나무"라는 단어가 "같은" 단어가 아니기 때문입니다 단어는 고유한 특성에 의해 정의됩니다. 이러한 특성의 "기계적 집합체"가 아니라 언어의 "구조적 전체"인 시스템의 요소로 정의되기 때문입니다.

개체의 이러한 관계형(또는 "분음 구별") 정의는 구조 언어학에서 언어의 모든 요소 개념을 지배합니다. 이것은 소쉬르 언어학의 가장 인상적인 업적, 즉 언어의 "음소" 및 "독특한 특징" 개념의 발전에서 가장 분명합니다. 음소는 언어의 가장 작은 분절 및 의미 단위입니다. 그것들은 언어에서 발생하는 소리가 아니라 소쉬르가 언급한 "소리 이미지"이며, 이는 화자가 의미를 전달하는 것으로 이해합니다. (따라서 Elmar Holenstein은 중요한 방식으로 Saussure를 따르는 Jakobson의 언어학을 "현상학적 구조주의"라고 설명합니다.) 프라하 학파 구조주의의 주요 대변인인 Jan Mukarovsky가 1937년에 "구조 . . . 경험적 현실이 아니라 현상학적 현실이다. 그것은 작품 자체가 아니라 집단(세대, 환경 등)의 의식에 위치한 일련의 기능적 관계입니다."(갈랑 35에서 인용) 마찬가지로 프랑스 구조주의의 주요 대변인인 Lévi-Strauss , 1960년에 "구조에는 뚜렷한 내용이 없습니다. 그것은 내용 그 자체이며, 그것이 구속되는 논리적 조직은 실재의 재산으로 생각된다"(167; 또한 Jakobson, Fundamentals 27-28 참조).

따라서 언어의 가장 작은 지각 요소인 음소는 긍정적 대상이 아니라 "현상학적 실재"입니다. 예를 들어 영어에서 음소 /t/는 다양한 방식으로 발음될 수 있지만 모든 경우에 영어 사용자는 /t/로 기능하는 것으로 인식합니다. 흡기 t(즉, 뒤에 h와 같은 호흡으로 발음되는 t), 고음 또는 저음 t 소리, 확장된 t 소리 등은 모두 동일한 방식으로 다음의 의미를 구별하는 기능을 합니다. 영어로 "to"와 "do". 더욱이 언어 간의 차이는 한 언어의 음운 변화가 다른 언어에서는 뚜렷한 음소를 구성할 수 있다는 점입니다. 따라서 영어는 /l/과 /r/을 구별하는 반면, 다른 언어는 이러한 조음이 동일한 음소의 변형으로 간주되도록 구조화되어 있습니다(예: 영어의 흡음 및 흡음 t). 모든 자연어에서 사용 가능한 방대한 수의 단어는 소수의 음소 조합입니다. 예를 들어 영어는 40개 미만의 음소가 결합되어 100만 개가 넘는 단어를 형성합니다.

언어의 음소는 그 자체로 체계적으로 조직된 특징의 구조이다. 1920년대와 1930년대에 Saussure의 리드에 따라 Jakobson과 N. S. Trubetzkoy는 음소의 "독특한 특징"을 분리했습니다. 이러한 특징은 언어 기관(혀, 치아, 성대 등)의 생리학적 구조를 기반으로 합니다. Saussure는 과정에서 Harris가 "생리학적 음성학"( 39; Baskin의 이전 번역은 "음운론"[(1959) 38]이라는 용어를 사용함)으로 설명한다고 언급했습니다. 예를 들어, 영어에서 /t/와 /d/의 차이는 "목소리"(성대의 결합)의 유무이며, 유성 수준에서 이러한 음소는 상호적으로 서로를 정의합니다. 이런 식으로 음운론은 소쉬르가 설명한 언어의 일반 규칙의 구체적인 예입니다. 언어에는 차이점만 있습니다. 훨씬 더 중요합니다. 차이는 일반적으로 차이가 설정되는 양의 용어를 의미합니다. 그러나 언어에는 긍정적인 용어가 없는 차이만 있을 뿐입니다. 우리가 기의를 취하든 기표를 취하든 언어는 언어 체계 이전에 존재했던 관념도 소리도 가지고 있지 않다. ( 120)

이 프레임워크에서 언어 정체성은 고유한 특성이 아니라 체계적("구조적") 관계에 의해 결정됩니다.

나는 음운론이 Saussure의 "선도를 따랐다"고 말했는데, 왜냐하면 그의 언어 생성 생리학에 대한 그의 분석이 Harris가 말했듯이 "요즘에는" "심리적" 또는 "기능적"이 아니라 "물리적"이라고 불릴 것이기 때문입니다. ""(읽기 49), 결과적으로 과정에서 그는 언어의 기능적 분석의 방향과 개요를 분명히 설명했습니다. 유사하게, 1878년에 등장한 그의 유일한 확장 출판물인 Mémoire sur le système primitif des voyelles dans les langues indo-européennes(인도유럽어의 초기 모음 체계에 관한 회고록)는 19세기 프로젝트에 완전히 포함되었습니다. 세기 역사 언어학. 그럼에도 불구하고, 이 작업에서, 조나단 컬러(Jonathan Culler)가 주장한 바와 같이, 소쉬르는 "역사적 재구성 작업을 할 때에도 언어를 순전히 관계적인 항목의 체계로 생각하는 다산성"을 보여주었습니다(Saussure 66). Saussure는 기존 인도-유럽 언어의 모음 교체 패턴을 설명하기 위해 음소 간의 체계적인 구조적 관계를 분석함으로써 몇 가지 다른 음소 /a/ 외에도 형식적으로 기술될 수 있는 또 다른 음소가 있었음에 틀림없다고 제안했습니다. Culler는 "소쉬르의 작업이 매우 인상적이었던 것은 거의 50년 후 설형 문자 히타이트어가 발견되고 해독되었을 때 소쉬르가 예측한 대로 작동하는 음소 h를 포함하는 것으로 밝혀졌다는 사실"이라고 결론지었습니다. . 그는 순전히 형식적인 분석을 통해 현재 인도유럽어의 후두라고 알려진 것을 발견했습니다."(66)

기적수업에서 함축적이면서도 명시적인 의미 작용 요소의 관계적 또는 분음적 결정에 대한 이러한 개념은 구조적 언어학을 지배하는 세 번째 가정, 즉 소쉬르가 "기호의 자의적 성질"이라고 부르는 것을 제안합니다. 이것에 의해 그는 언어에서 기표와 기의 사이의 관계가 결코 필요하지 않다는 것을 의미합니다(또는 "동기 부여"). "나무"라는 개념과 결합하기 위해 기표 나무처럼 쉽게 소리 기표 arbre를 찾을 수 있습니다. 그러나 이것보다 더 중요한 것은 기의가 또한 자의적이라는 것을 의미합니다. "나무"라는 개념을 나무의 크기(우리가 "낮은 목본 식물"을 제외함)만큼 나무의 특성(야자수는 제외)으로 쉽게 정의할 수 있습니다. 전화 부시). 이것은 내가 제시한 가정의 번호 매기기가 우선 순위를 나타내지 않는다는 것을 분명히 해야 합니다: 각 가정 - 의미 작용의 체계적 특성("동기적으로" 언어를 공부함으로써 가장 잘 이해됨), 요소의 관계적 또는 "분음 구별적" 특성 기호의 자의적 특성인 의미 작용의 가치는 다른 것에서 파생됩니다.

즉, Saussurean 언어학은 언어의 조합과 대조의 포괄적인 관계에서 연구하는 현상입니다. 이 개념에서 언어는 의미(의미)를 표현하는 과정이자 그 산물(의사소통)이며, 언어의 이 두 기능은 동일하지도 완전히 일치하지도 않습니다(Schleifer, "해체" 참조). 여기에서 우리는 그레마스와 쿠르테가 모더니스트 해석에서 기술한 형식과 내용 사이의 교대를 볼 수 있습니다. 게다가 언어의 요소는 자의적이기 때문에 대조도 조합도 기본이라고 할 수 없다. 따라서 언어의 구별되는 특징들이 결합하여 또 다른 이해 수준에서 대조되는 음소를 형성하고, 음소가 결합하여 대조되는 형태소를 형성하고, 형태소가 결합하여 단어를 형성하고, 단어가 결합하여 문장을 형성하는 등의 방식으로 진행됩니다. 각각의 예에서 전체 음소, 단어 또는 문장 등은 부분의 합보다 큽니다(소쉬르의 예[(1959) 103]에서 물, H2O가 기계적 응집보다 더 큰 것과 같습니다) 수소와 산소).

일반 언어학 과정의 세 가지 가정으로 인해 소쉬르는 언어 과학을 넘어 "사회 내 기호의 삶"을 연구할 20세기의 새로운 과학을 요구했습니다. Saussure는 이 과학을 "기호학(그리스어 semeîon "기호"에서 유래)"(16)이라고 명명했습니다. 기호학의 "과학"은 1920년대와 1930년대에 동유럽, 1950년대와 1960년대에 파리에서 시행되었기 때문에 언어 및 언어 구조에 대한 연구를 그러한 구조로 구성된(또는 분절된) 문학적 인공물로 확장했습니다. 더군다나 경력 후반기에 일반 언어학 과정을 제공하는 동안에도 Saussure는 고의적으로 숨겨진 고유명사의 아나그램을 발견하기 위해 후기 라틴 시에 대한 자신의 "기호학적" 분석을 추구했습니다. 연구 방법은 여러 면에서 그의 언어 분석의 기능적 합리주의와 정반대였습니다. 소쉬르가 이 연구를 추구한 99권의 노트 중 하나에서 언급한 것처럼 "우연"의 문제를 체계적으로 조사하려고 시도했습니다. 모든 것의 불가피한 기초가 된다"(Starobinski 101에서 인용). 소쉬르 자신이 말했듯이 그러한 연구는 우연과 의미의 "물질적 사실"(인용 101)에 초점을 맞추므로 Jean Starobinski가 주장하듯이 소쉬르가 찾고 있는 "주제-단어"는 "시인을 위한 것"입니다. , 도구이지 시의 중요한 세균이 아닙니다. 시는 주제어의 음운적 재료를 다시 사용하는 데 필요합니다"(45). 이 분석에서 Starobinski는 "소쉬르는 숨겨진 의미를 찾는 데 자신을 잃지 않았습니다. "라고 말합니다. 오히려 그의 작업은 의식에서 발생하는 모든 문제를 회피하려는 욕망을 보여주는 것 같다. "(121).

즉, 후기 라틴 시에서 고유명사를 발견하려는 소쉬르의 시도 - Tzvetan Todorov가 "단어 . . . 기표에"(266) - 그의 언어 분석을 지배하는 요소 중 하나인 기호의 자의적 특성을 강조합니다. (또한 소쉬르 언어학의 형식적 특성을 강조합니다. 물질" - 의미론을 분석의 주요 대상으로 효과적으로 제거합니다.) Todorov가 결론을 내리듯이, Saussure의 작업은 오늘날 상징적 현상을 받아들이기를 거부한다는 점에서 현저하게 동질적으로 보입니다. . . . 철자법에 대한 그의 연구에서 그는 연상 현상이 아닌 반복 현상에만 주목한다. . . . Nibelungen에 대한 그의 연구에서 그는 잘못된 읽기에 기인하기 위해서만 기호를 인식합니다. 기호는 의도적이지 않기 때문에 기호는 존재하지 않습니다. 마지막으로 일반 언어학 과정에서 그는 기호학의 존재, 따라서 언어 기호 이외의 기호에 대해 고찰합니다. 그러나 이 확언은 기호학이 단일 유형의 기호, 즉 자의적인 기호에 전념한다는 사실에 의해 즉시 제한됩니다. (269-70)

이것이 사실이라면 그것은 소쉬르가 주체 없이 "의도"를 생각할 수 없었기 때문입니다. 그는 형식과 내용 사이의 대립에서 완전히 벗어날 수 없었습니다. 대신 그는 "언어 적 합법성"에 의지했습니다. 한편으로는 역사, 주관성, 그리고 이러한 개념에 의해 지배되는 인과적 해석 방식에 대한 19세기 개념과 다른 한편으로는 Lévi-Strauss가 "없는 칸트주의"라고 부른 20세기 "구조주의" 개념 사이에 위치합니다. a 초월적 주체"(Connerton 23에서 인용) - 본격적인 구조주의, 정신 분석, 심지어 양자 역학에서 형식과 내용(또는 주체와 객체) 사이의 대립과 전경과 배경의 위계를 지우는 개념 - Ferdinand의 작업 언어학과 기호학의 드 소쉬르는 의미와 문화 연구에서 중요한 순간을 제한합니다.

로날드 슐라이퍼

부록 2

페르디낭 드 소쉬르(번역)

스위스 언어학자인 Ferdinand de Saussure(1857-1913)는 개별 언어와 단어 형식의 역사가 아니라 언어의 구조를 설명하려는 시도 덕분에 현대 언어학의 창시자로 간주됩니다. 대체로 20세기 초에 그의 작품에서 언어학 및 문학 비평, 그리고 상당 부분 기호학의 구조적 방법의 토대가 마련되었습니다. Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes 등의 작업에서 발전된 소위 "후기 구조주의"의 방법과 개념은 Saussure와 후기 로마시의 아나그램 읽기. 언어학 및 언어 해석에 대한 소쉬르의 작업은 물리학에서 문학 혁신, 정신 분석 및 20세기 초 철학에 이르기까지 광범위한 지적 분야를 연결하는 데 도움이 된다는 점에 유의해야 합니다. A. J. 그레마스(A. J. Greimas)와 J. 쿠르테(J. Kurte)는 기호학과 언어(Semiotics and Language)에서 “20세기 초 소쉬르의 언어학, 후설의 현상학, 정신분석학 등과 함께 새로운 종류의 해석으로서 “해석”이라는 제목의 분석사전이 등장하였다. 프로이트의. 그러한 경우, "해석은 주어진 내용이 없었을 형식에 주어진 내용을 귀속시키는 것이 아니라 주어진 기호 체계 내에서 중요한 요소의 동일한 내용을 다른 방식으로 공식화하는 의역입니다"(159) ). "해석"에 대한 이러한 이해에서 형식과 내용은 분리할 수 없습니다. 반대로 각 형식은 의미론적 의미("의미 있는 형식")로 채워지므로 해석은 다른 기호 시스템에서 의미 있는 것을 새롭고 유사한 방식으로 다시 설명합니다.

Claude Lévi-Strauss가 구조주의의 프로그래밍 작업 중 하나("구조와 형식: 블라디미르 프로프의 작품에 대한 성찰")에서 제시한 형식과 내용에 대한 유사한 이해는 Saussure의 사후 저서 A Course in에서 볼 수 있습니다. 일반 언어학 (1916, trans., 1959, 1983). 그의 생애 동안 소쉬르는 거의 출판하지 않았으며, 그의 주요 작품인 "코스"는 1907-11년에 일반 언어학에 대한 그의 강의에 참석한 학생들의 노트에서 수집되었습니다. Course에서 Saussure는 언어에 대한 "과학적" 연구를 요구하여 19세기 비교-역사적 언어학과 대조했습니다. 이 작업은 서양 사상의 가장 위대한 업적 중 하나로 간주 될 수 있습니다. 개별 단어를 언어의 구조적 요소로 사용하여 역사적 (또는 "통시적") 언어학은 서유럽 언어의 기원과 발전을 증명했습니다. 일반적인 인도 유럽 언어 및 이전 Proto-Indo-European.

소쉬르가 의문을 제기한 것은 언어의 기본 "단위"가 실제로 이러한 "단어 요소"의 긍정적인 존재라는 부수적인 가정과 함께 단어의 고유한 발생에 대한 연구입니다. 그의 작업은 비교 언어학에서 우연히 연구한 언어에 대한 많은 사실을 소수의 정리로 축소하려는 시도였습니다. 19세기의 비교 철학 학파는 "연구 대상의 본질을 이해하지 못했기" 때문에 "진정한 언어학 학파를 만드는 데 성공하지 못했다"(3)고 소쉬르(Saussure)는 썼습니다. 그는 이 "본질"이 언어의 "긍정적 실체"인 개별 단어에 있을 뿐만 아니라 이러한 실체가 존재하도록 돕는 형식적 연결에도 있다고 주장합니다.

Saussure의 언어 "테스트"는 세 가지 가정을 기반으로 합니다. 첫째, 언어에 대한 과학적 이해는 역사적 근거가 아니라 구조적 현상에 근거한다. 따라서 그는 언어의 개별 현상, 즉 그가 "가석방"으로 정의하는 "말의 사건"과 적절한 언어학 연구 대상, 이러한 사건을 제어하는 ​​시스템(코드, 구조)을 구별했습니다. "랑그"). 더욱이 그러한 체계적인 연구는 언어의 역사를 통한 언어 발달에 대한 "통시적" 연구가 아니라 주어진 순간에 언어의 요소들 사이의 관계에 대한 "동시적" 개념을 요구합니다.

이 가설은 1929년 로만 야콥슨(Roman Jakobson)이 "구조주의(structuralism)"라고 부른 것, 즉 "현대 과학에 의해 조사된 모든 현상은 기계적인 축적이 아니라 구성 요소가 기능"("로맨틱 "711). 이 구절에서 Jakobson은 역사적 사건의 "기계적" 열거가 아닌 구조로 언어를 정의하는 Saussure의 아이디어를 정식화했습니다. 또한 Jakobson은 구조 언어학의 선구자가 된 또 다른 Saussurean 가정을 개발합니다. 언어의 기본 요소는 그 원인이 아니라 기능과 관련하여 연구되어야 합니다. 별도의 현상 및 사건(즉, 개별 인도-유럽어 단어의 기원에 대한 역사)은 그 자체로 연구되는 것이 아니라 유사한 구성 요소와 상호 연관되는 시스템에서 연구되어야 합니다. 이것은 현상을 주변 현실과 비교하는 근본적인 전환이었고, 철학자 Ernst Cassirer는 "17세기에 물질 세계에 대한 생각을 뒤집은 갈릴레오의 과학"과 비교했습니다. 현상은 발생 원인과 관련하여 해석되기 시작했지만 현재와 미래에 미칠 수 있는 영향과 관련하여 해석되기 시작했습니다. Freud의 의미에서 "무의식"이라는 단어).

그의 언어학에서 소쉬르는 특히 언어학에서 단어 개념의 변화에서 이러한 전환을 보여주는데, 그는 단어를 기호로 정의하고 그 기능으로 설명합니다. 그를위한 기호는 소리와 의미의 조합, "의미 및 지정"(66-67; Roy Harris의 1983 년 영어 번역- "의미"및 "신호")입니다. 이 화합물의 본질은 "기능적"입니다(하나도 다른 요소도 서로 없이 존재할 수 없음). 더욱이 "한 사람은 다른 사람에게서 자질을 빌린다"(8). 따라서 소쉬르는 언어의 주요 구조적 요소인 기호를 정의하고 역사언어학의 기초를 기호와 단어의 동일성을 특히 엄밀한 분석이 필요로 합니다. 따라서 우리는 같은 단어 "나무"의 다른 의미를 이해할 수 있습니다. 단어가 특정 특성의 집합이기 때문이 아니라 "구조적 전체"에서 기호 시스템의 요소로 정의되기 때문입니다. 언어로.

이러한 상대적("분음 구별") 통일성 개념은 구조 언어학에서 언어의 모든 요소 개념의 근간을 이룹니다. 이것은 소쉬르 언어학의 가장 독창적인 발견, 언어의 "음소" 및 "특징" 개념의 발전에서 특히 분명합니다. 음소는 음성 및 의미 있는 언어 단위 중 가장 작은 단위입니다. 그것들은 언어에서 발생하는 소리일 뿐만 아니라 원어민이 의미를 갖는 것으로 인식하는 "사운드 이미지"라고 Saussure는 말합니다. (엘마 홀렌슈타인은 주요 조항에서 소쉬르의 사상과 개념을 이어가는 야콥슨의 언어학을 "현상학적 구조주의"라고 부른다는 점에 유의해야 한다.) 이것이 바로 프라하 구조주의 학파의 주요 연사인 Jan Mukarowski가 1937년에 "구조. . . 경험적 개념이 아니라 현상학적 개념이다. 그것은 결과 그 자체가 아니라 집단의식(세대, 타자 등)의 중요한 관계들의 집합이다.” 비슷한 생각이 1960년에 프랑스 구조주의의 지도자인 Lévi-Strauss에 의해 표현되었습니다. “구조에는 명확한 내용이 없습니다. 그것은 그 자체로 의미가 있으며 그것을 포함하는 논리적 구성은 현실의 각인입니다.

차례로, 인식에 허용되는 가장 작은 언어 요소인 음소는 별도의 통합 "현상학적 현실"을 나타냅니다. 예를 들어 영어에서 "t" 소리는 다르게 발음될 수 있지만 모든 경우에 영어를 사용하는 사람은 "t"로 인식합니다. 흡인, 상승 또는 하강, 긴 "t" 소리 등은 "to"와 "do"라는 단어의 의미를 똑같이 구별합니다. 또한 언어 간의 차이점은 한 언어의 한 소리가 다른 음소에 해당할 수 있다는 것입니다. 예를 들어 영어의 "l"과 "r"은 다른 반면 다른 언어에서는 동일한 음소의 변형입니다(예: 영어 "t", 열망 유무에 관계없이 발음). 모든 자연어의 광대한 어휘는 훨씬 적은 수의 음소 조합의 집합입니다. 예를 들어 영어에서는 40개의 음소만 사용하여 약 백만 단어를 발음하고 씁니다.

언어의 소리는 체계적으로 구성된 일련의 기능입니다. 1920년대에서 1930년대에 Saussure에 이어 Jacobson과 N.S. Trubetskoy는 음소의 "독특한 특징"을 골라냈습니다. 이러한 기능은 혀, 치아, 성대와 같은 언어 기관의 구조를 기반으로 합니다. Saussure는 "Course of General Linguistics"에서 이를 알아차렸고 Harris는 이를 "생리학적 음성학"이라고 부릅니다(Baskin의 이전 번역에서 "음운론"이라는 용어는 " 사용됨) - 소리를 내기 위해 친구와 "매듭 » durg로 연결됩니다. 예를 들어 영어에서 "t"와 "d"의 차이는 "voice"(성대의 긴장)의 유무와 음소를 구분하는 음성의 크기입니다. 따라서 음운론은 Saussure가 설명한 일반 언어 규칙의 예로 간주할 수 있습니다. "언어에는 차이가 있을 뿐입니다." 훨씬 더 중요한 것은 이것이 아닙니다. 차이는 일반적으로 그것이 위치한 정확한 조건을 의미합니다. 그러나 언어에는 정확한 조건 없이 차이만 있을 뿐입니다. 우리가 "지정"을 고려하든 "의미"를 고려하든 언어 시스템이 개발되기 전에 존재했을 개념이나 소리가 언어에는 없습니다.

그러한 구조에서 언어적 유비는 고유한 특성의 도움으로 정의되는 것이 아니라 체계(“구조적”) 관계의 도움으로 정의됩니다.

나는 음운론의 발전이 소쉬르의 생각에 의존했다고 이미 언급했습니다. 현대의 언어 생리학에 대한 그의 분석은 "'심리적' 또는 '기능적'이 아니라 '물리적'이라고 불릴 것이지만 The Course에서 그는 언어의 기능적 분석의 방향과 기본 원칙을 명확하게 설명했습니다. 1878년에 출판된 그의 생애 유일한 출판물인 Mémoire sur le système primitif des voyelles dans les langues indo-européennes(인도-유럽 언어의 원래 모음 체계에 대한 노트)는 1878년의 비교 역사 언어학과 완전히 일치했습니다. 19 세기. 그럼에도 불구하고, 이 작업에서 소쉬르는 "역사적 재구성을 통해서도 상호 연결된 현상의 체계로서의 언어 개념의 결실"을 보여주었다고 조나단 컬러(Jonathan Culler)는 말합니다. 음소 간의 관계를 분석하고 인도 유럽어 그룹의 현대 언어에서 모음의 교대를 설명하면서 Saussure는 여러 가지 다른 소리 "a"외에도 공식적으로 설명되는 다른 음소가 있어야한다고 제안했습니다. Kaller는 "소쉬르의 작업에서 특별한 인상을 주는 것은 거의 50년 후 히타이트 설형문자가 발견되고 해독되었을 때 문자에서 "h"로 표시되는 음소가 발견되었으며 이는 소쉬르가 예측한 대로 작동했다는 것입니다. 형식 분석을 통해 그는 현재 인도유럽어에서 목음으로 알려진 것을 발견했습니다.

코스에서 명시적이든 암시적이든 기호의 상대적(분음 구별) 정의 개념에는 구조 언어학의 세 번째 핵심 가정이 있는데, 이는 소쉬르가 "기호의 자의적 성질"이라고 불렀습니다. 이것은 언어에서 소리와 의미 사이의 관계가 어떤 것에 의해 동기가 부여되지 않는다는 것을 의미합니다. "수목"이라는 단어와 "나무"라는 단어를 "나무"라는 개념과 쉽게 연결할 수 있습니다. 더욱이 이것은 소리도 임의적이라는 것을 의미합니다. "나무"의 개념은 나무 껍질의 존재 (야자수 제외)와 크기 ( "낮은 목본 식물"-관목 제외)로 정의 할 수 있습니다. 이것으로부터 내가 제시하는 모든 가정이 점점 더 중요하지 않은 것으로 나뉘지 않는다는 것이 분명해야합니다. 각각-기호의 체계적 특성 (언어의 "동기"연구에서 가장 이해할 수 있음), 상대적 (분음 부호) 본질 , 기호의 임의적 특성-나머지에서 나옵니다.

따라서 소쉬르 언어학에서 연구된 현상은 언어의 비교와 대립의 집합으로 이해됩니다. 언어는 단어의 의미(지정)와 그 결과(의사소통)의 표현이며 이 두 기능은 결코 일치하지 않습니다(Shleifer의 "언어 해체" 참조). 우리는 Greimas와 Kurte가 최신 버전의 해석에서 설명하는 형식과 내용의 교대를 볼 수 있습니다. 언어적 대조는 구조 단위를 정의하고 이러한 단위는 연속적인 수준에서 상호 작용하여 특정 의미 있는 내용을 생성합니다. 언어의 요소는 무작위적이기 때문에 대조도 조합도 근거가 될 수 없다. 이것은 언어에서 독특한 특징이 다른 수준의 이해에서 음성 대조를 형성하고 음소가 대조되는 형태소, 형태소-단어, 단어-문장 등으로 결합됨을 의미합니다. 어쨌든 전체 음소, 단어, 문장 등 부분의 합 이상입니다(소쉬르의 예에서 물이 수소와 산소의 조합 이상인 것처럼).

"일반 언어학 과정"의 세 가지 가정은 소쉬르로 하여금 "사회에서 기호의 삶"을 연구하는 언어학과 별개인 20세기의 새로운 과학에 대한 아이디어로 이끌었습니다. Saussure는 이것을 과학 기호학이라고 불렀습니다(그리스어 "semeîon" - 기호). 1920년대와 1930년대에 동유럽, 1950년대와 1960년대에 파리에서 발전한 기호학의 "과학"은 언어와 언어 구조에 대한 연구를 이러한 구조로 구성된(또는 공식화된) 문학적 발견으로 확장했습니다. 또한 그의 경력의 황혼기에 일반 언어학 과정과 병행하여 Saussure는 의도적으로 구성된 고유 이름의 철자 바꾸기를 발견하려고 노력하면서 후기 로마시의 "기호 학적"분석에 참여했습니다. 이 방법은 여러면에서 언어 분석에서 합리주의와 반대였습니다. Saussure가 99 개의 노트북 중 하나에 쓴 것처럼 시스템에서 "모든 것의 기초가되는"개연성 "의 문제를 연구하려는 시도였습니다. " Saussure 자신이 주장하는 그러한 조사는 확률의 "실제 측면"에 초점을 맞추는 데 도움이 됩니다. 소쉬르가 애너그램을 찾고 있는 "키워드"는 Jean Starobinsky에 따르면 "시인을 위한 도구이지 시의 삶의 원천이 아닙니다. 시는 핵심 단어의 소리를 뒤집는 역할을 합니다. Starobinsky에 따르면 이 분석에서 "소쉬르는 숨겨진 의미를 탐구하지 않습니다." 반대로 그의 작품에서는 의식과 관련된 질문을 회피하려는 욕구가 눈에 띈다. 언어의 법칙.”

후기 로마 시에서 고유명사를 연구하려는 소쉬르의 시도(Tsvetan Todorov는 이것을 "단어 ... 그것이 쓰여지기 전의 것"의 약어라고 불렀습니다)는 그의 언어 분석의 구성 요소 중 하나인 기호의 임의적 특성을 강조합니다. 의미 분석의 가능성을 배제하는 소쉬르 언어학의 형식적 본질("언어"는 그가 "현상이 아니라 형식의 본질"이라고 주장함)입니다. Todorov는 오늘날 Saussure의 글이 기호[의미가 잘 정의된 현상] 연구를 꺼리는 점에서 현저하게 일관성이 있는 것처럼 보인다고 결론지었습니다. . . . 애너그램을 탐색하면서 Saussure는 반복에만 주의를 기울이고 이전 옵션에는 주의를 기울이지 않습니다. . . . Nibelungenlied를 연구하면서 그는 잘못된 읽기에 할당하기 위해서만 기호를 정의합니다. 의도하지 않은 경우 기호는 존재하지 않습니다. 결국, 일반 언어학에 관한 그의 글에서 그는 언어 기호뿐만 아니라 기호학의 존재를 가정합니다. 그러나 이 가정은 기호학이 무작위적이고 자의적인 기호만을 기술할 수 있다는 사실에 의해 제한됩니다.

만약 이것이 사실이라면 그것은 그가 대상 없이는 "의도"를 상상할 수 없었기 때문입니다. 그는 형식과 내용 사이의 간격을 완전히 메울 수 없었습니다. 그의 글에서 이것은 질문으로 바뀌었습니다. 대신 그는 "언어 적 정당성"으로 전환했습니다. 한편으로는 역사와 주관적 추측에 기초한 19세기 개념과 이러한 개념에 기초한 우연적 해석의 방법, 그리고 다른 한편으로는 레비스트로스가 "초월이 없는 칸트주의"라고 부른 구조주의적 개념 사이에서 행위자" - 형태와 내용(주체와 대상), 구조주의, 정신분석학, 심지어 양자역학의 의미와 기원 사이의 대립을 지우는 것 - 언어학과 기호학에 관한 Ferlinand de Saussure의 작업은 언어와 의미 연구의 전환점을 표시합니다. 문화.

로널드 슈레이퍼

문학

1. Admoni V.G. 문법 이론의 기초 / V.G. 훈계; 소련 과학 아카데미.-M.: Nauka, 1964.-104p.

3. Arapov, M.V., Herts, M.M. 언어학의 수학적 방법. M., 1974.

4. 아놀드 I.V. 현대영어 단어의 의미구조와 연구방법론. /I.V. Arnold-L .: 교육, 1966. - 187p.

6.Bashlykov A.M. 자동 번역 시스템. / 오전. Bashlykov, A.A. 소콜로프. -M.: LLC "FIMA", 1997. - 20p.

7. Baudouin de Courtenay: 이론적 유산과 현대성: 국제 과학 회의 보고서 초록 / Ed.I.G. Kondratiev. - 카잔: KGU, 1995. - 224p.

8. A. V. Gladkiy, 수학적 언어학의 요소. / . Gladkiy A.V., Melchuk I.A. -M., 1969. - 198p.

9. 골로빈, B.N. 언어 및 통계. /B.N. Golovin - M., 1971. - 210 p.

10. Zvegintsev, V.A. 이론 및 응용 언어학. / V.A. Zvegintsev - M., 1969. - 143 p.

11. Kasevich, V.B. 의미론. 통사론. 형태. // V.B. Kasevich - M., 1988. - 292 p.

12. Lekomtsev Yu.K. 언어학의 공식 언어 소개 / Yu.K. Lekomtsev. - M.: Nauka, 1983, 204 p., ill.

13. 20세기 말 Baudouin de Courtenay의 언어 유산: 2000년 3월 15-18일 국제 과학 및 실무 회의 요약. - 크라스노야르스크, 2000. - 125p.

Matveeva G.G. 숨겨진 문법적 의미와 화자의 사회적 인물("초상화") 식별 / G.G. Matveev. - Rostov, 1999. - 174p.

14. Melchuk, I.A. 언어 모델 "의미 텍스트" 구축 경험./ I.A. 멜축. - M., 1974. - 145p.

15. Nelyubin L.L. 번역 및 응용 언어학 / L.L. 넬류빈. -M.: 고등학교, 1983. - 207p.

16. 정확한 언어 연구 방법: 소위 "수학적 언어학" / O.S. Akhmanova, I.A. Melchuk, E.V. Paducheva 및 기타 - M., 1961. - 162 p.

17. Piotrovsky L.G. 수학적 언어학: 교과서 / L.G. Piotrovsky, K.B. Bektaev, A.A. Piotrovskaya. -M.: 고등학교, 1977. - 160p.

18. 그는 그렇습니다. 텍스트, 기계, 사람. - L., 1975. - 213p.

19. 그는 그렇습니다. 응용 언어학 / Ed. AS 게르다. - L., 1986. - 176p.

20. 레진, I.I. 언어 모델. M., 1963. Revzin, I.I. 현대 구조 언어학. 문제 및 방법. M., 1977. - 239p.

21. Revzin, I.I., Rozentsveig, V.Yu. 일반 및 기계 번역의 기초 / Revzin I.I., Rozentsveig, V.Yu. -M., 1964. -401p.

22. Slyusareva N.A. 현대 언어학에 비추어 F. de Saussure의 이론 / N.A. Slyusareva. -M.: Nauka, 1975. - 156p.

23. 올빼미, L.Z. 분석 언어학 / L.Z. 올빼미 - M., 1970. - 192 p.

24. 소쉬르 F. 드. 일반 언어학에 대한 주석 / F. de Saussure; 당. fr에서. - M.: Progress, 2000. - 187p.

25. 그는 그렇습니다. 일반 언어학 코스 / Per. fr에서. - 예카테린부르크, 1999. -426p.

26. 음성 통계 및 자동 텍스트 분석 / Ed. 에드. R.G. Piotrovsky. L., 1980. - 223p.

27. Stoll, P. 세트. 논리. 공리 이론. / R. Stoll; 당. 영어로부터. - M., 1968. - 180p.

28. Tenier, L. 구조적 구문의 기초. M., 1988.

29. 우빈 I.I. 소련의 번역 활동 자동화 / I.I. 우빈, L.Yu. Korostelev, B.D. Tikhomirov. - M., 1989. - 28p.

30. Faure, R., Kofman, A., Denis-Papin, M. 현대 수학. M., 1966.

31. Shenk, R. 개념 정보 처리. M., 1980.

32. Shikhanovich, Yu.A. 현대 수학 입문(초기 개념). M., 1965

33. Shcherba L.V. 질적 및 양적 용어의 러시아어 모음 / L.V. Shcherba - L.: Nauka, 1983. - 159 p.

34. Abdullah-zade F. 세계 시민 // Spark - 1996. - No. 5. - p.13

35. VA Uspensky. Andrei Nikolaevich Kolmogorov의 기호 메시지에 대한 "New Literary Review"독자를위한 예비. - 새로운 문학 검토. -1997. - 24호. - S. 18-23

36. Perlovsky L. 의식, 언어 및 문화. - 아는 것이 힘이다. -2000. 4번 - S. 20-33

37. Frumkina R.M. 회사 소개 - 비스듬히. // 러시아 저널. - 2000. - 1위. - 12쪽

38. Fitialov, S.Ya. 구조 언어학의 구문 모델링 // 구조 언어학의 문제. M., 1962.

39. 그는 그렇습니다. NN 문법과 종속성 문법의 동등성에 대해 // 구조 언어학의 문제. M., 1967.

40. Chomsky, N. 언어 이론의 논리적 기초 // 언어학의 새로운 기능. 문제. 4. M., 1965

41. 슐라이퍼 R. 페르디낭 드 소쉬르//프레스. jhu.ru

42. www.krugosvet.ru

43. www.lenta.ru

45. 누르세요. jhu.ru

46. ​​en.wikipedia.org

지난 세기 동안 언어학은 빠르게 발전하고 매우 빠르게 방법론적 성숙도에 도달한 과학의 예로 항상 인용되었습니다. 이미 지난 세기 중반에 젊은 과학은 천년의 전통을 가진 과학계에서 자신있게 자리를 잡았으며 가장 저명한 대표자 중 한 명인 A. Schleicher는 자신의 작품으로 그가 이미 마지막 줄을 요약하고 있었습니다.<113>그러나 언어학의 역사는 그러한 의견이 너무 성급하고 정당하지 않다는 것을 보여주었습니다. 세기 말에 언어학은 신문법 원칙에 대한 비판과 관련하여 처음으로 큰 충격을 받았고, 그 뒤를 이어 다른 사람들도 충격을 받았습니다. 일반적으로 언어 과학의 역사에서 발견 할 수있는 모든 위기는 그 기초를 흔들지 않았지만 오히려 강화에 기여했으며 궁극적으로 세련미와 개선을 가져 왔습니다. 주제 및 과학적 문제와 함께 확장되는 언어 연구 방법의.

그러나 언어학 다음으로 많은 수의 새로운 과학을 포함하여 다른 과학도 살고 발전했습니다. 물리, 화학 및 기술 (소위 "정확한") 과학은 우리 시대에 특히 급속한 발전을 이루었으며 이론적 기반 인 수학이 모든 과학을 지배했습니다. 정확한 과학은 모든 인문학을 크게 압박했을뿐만 아니라 현재 그들은 "그들을 신앙으로 인도"하고 관습에 종속시키고 연구 방법을 강요하기 위해 노력하고 있습니다. 현재 상황에서 일본어 표현을 사용하면 이제 언어 학자-문자 학자들이 수학이 이끄는 정확한 과학이 승리하고 자유롭게 위치한 매트의 가장자리를 더럽히고 있다고 말할 수 있습니다.

일부 목소리가 공개적으로 59라고 부르는 수학 방법의 힘에 전적으로 굴복하여 아마도 새로운 힘을 얻는 것이 일반적인 과학적 관심의 관점에서 더 편리하지 않을까요? 이러한 질문에 답하기 위해 먼저 이 경우 수학적 주장이 무엇인지, 언어학적 수학적 방법이 적용되는 영역, 언어 자료의 세부 사항과 어느 정도 일치하는지, 그리고 그들이 줄 수 있는지 여부를 살펴봐야 합니다. 또는 언어의 과학에 의해 설정된 질문에 대한 답변을 제안할 수도 있습니다.

처음부터 언어학의 새로운 수학적 추세를 열광하는 사람들 사이에서<114>정적 연구의 목표와 목표에 관한 의견의 만장일치는 없습니다. Acad. 수학적 방법을 언어에 처음으로 적용한 A. A. Markov, Boldrini, Yul, Mariotti는 이러한 연구의 결과가 흥미로운지 여부를 전혀 궁금해하지 않고 언어 요소를 양적 방법을 구성하거나 통계적 정리를 위한 적절한 설명 자료로 간주합니다. 언어학자에게 6 0 . Ross는 확률 이론과 수학적 통계가 수치 해석을 허용하는 언어적 결론을 테스트하고 확인하기 위한 도구 또는 그들이 지금 말하는 것을 선호하는 수학적 모델을 제공한다고 믿습니다. 따라서 수학적 방법은 언어 연구 6 1 의 보조 수단으로만 인식됩니다. 그의 저서에서 언어 문제의 수학적 연구에 대한 모든 시도를 요약하고 체계화했을 뿐만 아니라 추가 작업과 관련하여 명확한 방향을 제시하려고 노력한 Herdan은 훨씬 더 많은 것을 주장합니다. 그는 "문학 통계의 이해(그는 수학적 통계 방법에 의한 텍스트 연구라고 부름)"에 대한 책의 전체 자료를 발표하는 데 중점을 둡니다. - 3시에.)언어학의 필수적인 부분으로” 6 2 , 다음 단어로 언어학의 이 새로운 섹션의 본질과 과제를 공식화합니다. “언어의 양적 철학으로서의 문학 통계는 언어학의 모든 분야에 적용할 수 있습니다. 우리가 보기에 문학 통계학은 양적 과학이나 양적 철학의 수준으로 끌어올린 구조적 언어학이다. 따라서 결과를 범위를 벗어난 것으로 정의하는 것도 똑같이 잘못되었습니다.<115>언어학 또는 연구를 위한 보조 도구로 취급” 6 3 .

이 경우에 실제로 행해진 일에 대한 고려를 먼저 언급하지 않고 새로운 언어학 분과의 출현에 대해 말하고 그 주장의 문제를 해결하는 것이 이 경우에 합법적인지 여부에 대해 이론화하는 것은 바람직하지 않습니다. 영역, 그리고 새로운 방법의 적용 방향을 명확히 하기 위해 6 4 . 이것은 우리가 의견의 차이를 이해하는 데 도움이 될 것입니다.

언어 문제를 해결하기 위해 수학적(또는 보다 정확하게는 통계적) 기준을 사용하는 것은 언어 과학에서 결코 새로운 것이 아니며 어느 정도는 언어학자들이 오랫동안 사용해 왔습니다. 결국, 사실 음성 법칙과 같은 언어학의 전통적인 개념(및 관련<116>그것과 함께 nee - 법에 대한 예외), 문법 요소의 생산성(예: 파생 접미사) 또는 언어 간의 관련 관계에 대한 기준까지도 어느 정도는 상대적인 통계적 특성을 기반으로 합니다. 결국, 관찰된 사례의 통계적 반대가 더 날카롭고 뚜렷할수록 생산적 접미사와 비생산적 접미사, 음성 법칙 및 예외, 언어 간 친족 관계의 존재 여부에 대해 이야기해야 하는 이유가 더 많아집니다. 그러나 그러한 경우에 통계적 원리가 어느 정도 자발적으로 사용된다면 미래에는 이미 특정 목표 설정과 함께 의식적으로 적용되기 시작했습니다. 그래서 우리 시대에는 소위 어휘의 빈도 사전과 개별 언어 6 5의 표현 또는 "현실에 대한 일반적인 초점"6 6을 가진 다국어 단어의 의미까지 널리 퍼졌습니다. 이 사전의 데이터는 외국어 교과서 (가장 일반적으로 사용되는 어휘를 기반으로 텍스트가 작성됨) 및 최소 사전을 편집하는 데 사용됩니다. 통계 미적분학은 M. Swadesh의 어휘 통계학 또는 성문 연대기 방법에서 특별한 언어 사용을 발견했습니다. 여기에서 주요 기금의 언어에서 단어가 사라진 경우를 고려한 통계 공식을 기반으로 가능합니다. 어족 구분의 절대적 연대기 확립 6 7 .

최근 몇 년 동안 언어 자료에 수학적 방법을 적용하는 사례가 크게 증가했으며 이러한 시도의 대량으로 다소 명확한 방향이 설명되었습니다. 돌아서자<117>자세히 살펴보지 않고 순차적으로 고려합니다.

문체통계학이라는 이름이 붙은 방향부터 시작해보자. 이 경우 사용된 언어적 요소의 양적 관계를 통해 개별 작품 또는 작가의 문체적 특징을 정의하고 특성화하는 것에 대해 이야기하고 있습니다. 문체 현상 연구에 대한 통계적 접근 방식은 문학적 문체를 언어 수단을 습득하는 개별적인 방법으로 이해하는 데 기반을 두고 있습니다. 동시에 연구원은 셀 수 있는 언어 요소의 질적 중요성에 대한 질문에서 완전히 산만해져 양적 측면에만 모든 관심을 집중합니다. 연구 된 언어 단위의 의미 론적 측면, 정서적 및 표현 적 부하, 예술 작품 구조에서의 몫-이 모든 것이 설명되지 않은 상태로 남아 있으며 소위 중복 현상을 나타냅니다. 따라서 예술 작품은 기계적 집합체의 형태로 나타나며, 구성의 특수성은 요소들의 수치적 관계를 통해서만 표현됩니다. stylostatistics의 대표자는 의심 할 여지없이 주관성의 요소를 포함하는 전통적인 문체의 방법에 반대하면서 언급 된 모든 상황에 눈을 멀게하지 않으며 수학적 방법의 단일 품질로 모든 단점을 보완합니다. 달성한 결과의 객관성. 예를 들어 V. Fuchs는“... 수학적 수단으로 언어 표현 스타일을 특성화하기 위해 노력합니다. 이를 위해 방법을 만들어야하며 그 결과는 정확한 과학의 결과와 동일한 객관성을 가져야합니다 ... 이것은 적어도 처음에는 의미가 아닌 형식적인 구조적 특성만을 다룰 것임을 시사합니다. 언어 표현의 내용 . 이런 식으로 우리는 전체적으로 수학적 스타일 이론의 기초이자 출발점이 될 서수 관계 체계를 얻을 것입니다.” 6 8 .<118>

작가 또는 개별 작품의 언어 연구에 대한 가장 간단한 유형의 통계적 접근 방식은 사용 된 단어를 세는 것입니다. 왜냐하면 사전의 풍부함은 작가 자신을 특정 방식으로 특성화해야하기 때문입니다. 그러나 이러한 계산의 결과는 이와 관련하여 다소 예상치 못한 결과를 제공하며 적어도 문체론의 과제 중 하나가 아닌 문학 작품의 미적 지식과 평가에 전혀 기여하지 않습니다. 다음은 여러 작품에 사용된 총 단어 수에 대한 데이터입니다.

성경(라틴어). . . . . . . . . . 5649 단어

성경(히브리어). . . . 5642 단어

데모스테네스(연설). . . . . . . . . . . . 4972 단어

Sallust. . . . . . . . . . . . . . . . . 3394 단어

호레이스. . . . . . . . . . . . . . . . . . . .6084 단어

단테 (신곡) 5860 단어

(여기에는 1615개의 고유명사와 지명이 포함됨)

타소(분노의 올랜드). . . . 8474 단어

밀튼. . . . . . . . . . . . . . . . . . . . .8000 단어(주어진 약)

셰익스피어. . . . . . . . . . . . . . . . . . .15000 단어

(대략, 다른 출처에 따르면 20,000 단어)

O. Jespersen은 Zola, Kipling 및 Jack London의 사전이 Milton의 사전을 훨씬 능가한다고 지적합니다. 즉, 숫자는 8000 6 9 입니다. W. 윌슨 미국 대통령의 연설 사전을 계산한 결과 셰익스피어보다 풍부하다는 사실이 밝혀졌다. 여기에 심리학자의 데이터를 추가해야 합니다. 따라서 Terman은 많은 사례를 관찰한 결과 평균 어린이의 어휘가 약 3600단어이고 14세에 이미 9000단어라는 사실을 발견했습니다. 평균 성인은 11700단어를 사용하고 "증가 지능" 최대 13500 7 0 . 따라서 이러한 수치 데이터 자체는 작품의 양식적 특성을 식별할 수 있는 근거를 제공하지 않으며 단지 "객관적으로"<119>그들은 위의 계산에서 알 수 있듯이 작품의 상대적인 예술적 가치와 관련이 없는 다른 저자에 의해 다른 수의 단어를 사용했다고 명시합니다.

개별 저자에 의한 단어 사용의 상대적 빈도 계산은 다소 다르게 구성됩니다. 이 경우 단어의 총량뿐만 아니라 개별 단어의 사용 빈도도 고려됩니다. 이러한 방식으로 얻은 자료의 통계적 처리는 사용 빈도가 동일한 단어가 클래스(또는 순위)로 그룹화되어 주어진 저자가 사용하는 모든 단어의 빈도 분포를 설정한다는 사실에 있습니다. 이러한 종류의 계산의 특수한 경우는 특수 단어의 상대적 빈도를 결정하는 것입니다(예: Mersand 7 1이 수행한 Chaucer 작업의 로맨스 어휘). 저자가 사용하는 단어의 상대적 빈도는 위의 총 계산과 동일한 저자 개인의 스타일에 대한 객관적인 정보를 포함하고 있으며 결과가 더 정확한 수치 데이터라는 차이점이 있습니다. 그러나 그것은 또한 (저자 자신이 일자화한 저작물에 따라) 그의 삶의 다른 시기에 단어 사용의 상대적 빈도에 대한 예비 계산을 기반으로 동일한 저자의 개별 저작물의 연대를 측정하는 데 사용됩니다. 그러한 계산에서 데이터를 사용하는 또 다른 유형은 이 질문이 의심스러워 보이는 저작물의 진정성을 확립하는 것입니다 7 2 . 이 마지막 경우에서 모든 것은 실제 저작물과 논란이 되는 저작물의 사용 빈도에 대한 통계 공식의 비교를 기반으로 합니다. 그러한 방법으로 얻은 결과의 매우 큰 상대성과 근접성에 대해 말할 필요가 없습니다. 결국 상대 사용 빈도는 작가의 나이뿐만 아니라 장르, 줄거리, 작품 행동의 역사적 환경에 따라 달라집니다 (예를 들어 "빵"과 "피터"를 비교하십시오. 나"A. Tolstoy).<120>

위에서 설명한 방법을 심화시키면서 스타일 특성으로서의 스타일 통계학은 가장 일반적으로 사용되는 단어의 상대적 빈도의 안정성 기준에 의존하기 시작했습니다. 이 경우에 사용된 방법은 미국 디트로이트 대학교(University of Detroit)의 슬라브 언어 연구소(Institute of Slavic Languages ​​Institute of Slavic Languages ​​)에서 Esselson과 Epstein이 쓴 푸쉬킨의 이야기 "The Captain 's Daughter"의 통계 처리로 설명 할 수 있습니다. 7 3 . 이야기의 전체 텍스트(약 30,000 단어 발생)를 조사한 다음 약 10,000 및 5,000 발생을 포함하는 구절을 조사했습니다. 또한 단어 사용의 상대빈도의 안정성을 알아보기 위해 가장 많이 사용되는 102개의 단어(빈도가 1160~35)를 계산된 상대도수(선택적 구절을 기준으로 만듦)와 비교하였다. 실제와 함께. 예를 들어, "and"라는 결합은 이야기 전체에서 1,160번 사용되었습니다. 모든 단어가 5,000번 나타나는 구절에서 이 접속사는 5,000 x 1,160:30,000 또는 193번 반올림되어 사용될 것으로 예상되어야 하며, 모든 단어가 10,000번 나타나는 구절에서는 10,000 x 1,160으로 사용될 것으로 예상됩니다. : 30,000, 즉 386배. 이러한 계산을 통해 얻은 데이터와 실제 데이터를 비교하면 매우 미세한 편차(5% 이내)를 보입니다. 이러한 계산을 바탕으로 Pushkin의이 이야기에서 전치사 "k"는 "y"보다 2 배 더 자주 사용되며 대명사 "you"는 "them"보다 3 배 더 자주 사용되는 것으로 나타났습니다. , 이야기 전체와 개별 부분 모두에서 줄거리의 모든 변덕에도 불구하고 단어 사용의 상대적 빈도에는 안정성이 있습니다. 일부(가장 일반적인) 단어와 관련하여 관찰되는 것은 아마도 작업에 사용된 모든 단어에 적용 가능할 것입니다. 저자의 스타일은 주어진 언어에 대한 일반적인 빈도에 대한 단어 사용의 평균 빈도의 가변성의 특정 비율로 특징지어질 수 있습니다.<121>사용 빈도. 이 비율은 저자 스타일의 객관적인 양적 특성으로 간주됩니다.

언어 구조의 다른 형식적 요소도 비슷한 방식으로 연구됩니다. 예를 들어, V. Fuchs는 Goethe, Rilke, Caesar, Sallust 등의 작품의 운율적 특성을 비교 통계적 고려에 적용했습니다.7 4

단어 사용의 상대적 빈도의 안정성 기준은 스타일의 양적 특성화 기술을 명확히 하는 동시에 위에서 분석한 보다 원시적인 방법과 비교할 때 근본적으로 새로운 것을 도입하지 않습니다. 문체 통계학의 모든 방법은 궁극적으로 동등하게 냉정한 "객관적인" 결과를 생성하며, 혀의 표면 위를 미끄러지듯 움직이고 순전히 외부 기호에만 집착합니다. 정량적 방법은 분명히 연구 중인 자료의 질적 차이에 초점을 맞출 수 없으며 실제로 연구 중인 모든 대상을 평준화합니다.

최대 사양이 필요한 경우 가장 일반화된 기준이 제공됩니다. 질적 특성은 양의 언어로 표현된다. 이것은 논리적 모순일 뿐만 아니라 사물의 본성에 대한 불일치이기도 하다. 실제로 알렉산더 게라시모프와 렘브란트 작품의 캔버스에 있는 빨간색과 검은색 페인트의 양적 비율을 기반으로 비교 문체(즉, 질적) 특성을 얻으려고 하면 어떻게 될까요? 절대적인 넌센스 인 것 같습니다. 사람의 물리적 데이터에 대한 완전히 "객관적인"정량적 정보는 사람을 특징 짓고 그의 진정한 본질을 구성하는 모든 것에 대한 아이디어를 어느 정도 제공 할 수 있습니까? 분명히 없습니다. 엄지 손가락의 회선 각인과 같이 한 사람을 다른 사람과 구별하는 개별 기호로만 사용할 수 있습니다. 문체의 양적 특성과 유사한 상황이다. 자세히 보면 실제 문체를 판단하기 위한 빈약한 데이터를 제공합니다.<122>저자 언어의 특성과 인간 심리학 연구를 위한 손가락의 회선에 대한 설명.

언급된 모든 것에 더해, 과거 소위 공식적인 문학 비평 학파에서는 작가의 문체를 정량적으로 연구하려는 시도가 이미 이루어졌다는 점을 덧붙일 필요가 있습니다. 구절의 수를 세었다. 그러나이 시도는 더 이상 개발되지 않았습니다.

언어 현상 연구를 위한 수학적 방법의 또 다른 적용 영역은 언어 통계라는 이름으로 그룹화할 수 있습니다. 그것은 언어 이론의 근본적인 질문에 개입하여 적절한 언어 영역에서 소명을 얻고자 합니다. 이 방향에 익숙해 지려면 이미 언급 한 Herdan의 작업으로 돌아가는 것이 가장 좋습니다. 많은 리뷰어 중 한 명이 "엄청나게 허세 한 책"7 5 , 그러나 언어학자들 사이에서 폭넓은 반응을 얻었다7 6 . Kherdan(위에서 이미 언급한 바와 같이)이 언어 문제에 수학적 방법을 적용하는 분야에서 가장 중요한 모든 것을 그의 책에서 수집하려고 했다는 사실을 고려할 때, 그의 책에서 우리는 실제로 Kherdan 전체를 다루는 것이 아니라 전체를 다루고 있습니다. 경향. 선택과 개연성으로서의 언어라는 책의 제목에서 알 수 있듯이, 이 책의 주요 초점은 화자의 자유로운 선택에 맡겨진 언어와 언어의 내재적 구조에 기인한 것이 무엇인지를 명확히 하는 데 있습니다. 1 차 및 2 차 요소의 정량적 비율을 결정합니다. Kherdan의 책은 다양한 전문 분야의 대표자들이 수행하는 이 분야의 모든 작업에 대한 거의 완전한 정보를 제공합니다.<123>(철학자, 언어학자, 수학자, 기술자), 그러나 이에 국한되지 않고 저자 자신의 많은 독창적인 관찰, 고려 및 결론을 포함합니다. 요약 작업으로 사용된 정량적 방법과 그 도움으로 얻은 결과에 대한 좋은 아이디어를 제공합니다. 언어 통계 섹션에 조건부로 결합하는 질문은 책의 두 번째 부분과 네 번째 부분에서 다룹니다.

수학적 통계 방법을 언어 문제 연구에 적용하는 많은 사례 중에서 가장 일반적인 것으로 간주 될 수있는 가장 일반적인 사례에 중점을 둘 것입니다. 다른 저자의 데이터 사용 - Boldrini 7 7 , Mathesius 7 8 , Mariotti 7 9 , Zipf 8 0 , Deway 8 1 등을 비롯하여 음소, 문자, 단어 길이(문자 및 음절 수로 측정) 분포의 상대적 빈도를 결정하는 자신의 연구를 인용함 , 라틴어 및 그리스어 hexameter의 문법적 형식 및 미터법 요소 인 Herdan은 모든 언어 구조의 공통된 특성으로 언어 요소의 상대적 빈도의 안정성에 대한 사실을 확립합니다. 그는 다음과 같은 규칙을 도출합니다. 충분히 광범위하고 공정하게 수행된 관찰의 한계 » 8 2 . Herdan이 언어의 기본 법칙이라고 부르는 이 규칙은 특정 방식으로 해석하고 확장하려고 합니다. Herdan은 이 법에 대해 다음과 같이 썼습니다. “그는 인간의 의지와 선택의 자유가 부여되는 여기에서도<124>의식적인 선택과 자유로운 놀이가 서로 생생하게 번갈아 가며 나타나는 가장 넓은 틀, 일반적으로 문법적으로 상당한 안정성이 있지만 특정 음소, 어휘 단위(단어) 및 문법적 음소의 사용 빈도와 관련하여 건축; 즉, 유사성은 사용되는 것뿐만 아니라 얼마나 자주 사용되는지에 있습니다.” 8 3 . 이 상황은 이해할 수 있는 이유 때문이지만, 이것은 새로운 결론을 낳는다. 예를 들어 주어진 언어의 서로 다른 텍스트나 세그먼트를 조사할 때 서로 다른 사람들이 주어진 특정 음소(또는 다른 음성 요소)를 사용하는 상대적 빈도는 기본적으로 동일하게 유지된다는 것이 발견되었습니다. 이것은 주어진 언어에서 고려되는 음소를 사용할 일정한 확률의 일부 변동으로 개별 언어 형태의 해석으로 이어집니다. 따라서 그의 언어 활동에서 사람은 사용되는 언어 요소의 수와 관련하여 특정 확률 법칙의 적용을 받는다는 것이 밝혀졌습니다. 그런 다음 많은 텍스트 또는 음성 세그먼트 세트에서 엄청난 수의 언어 요소를 관찰할 때 이 경우 특정 언어 요소의 사용과 관련하여 결정이 있다는 의미에서 인과 관계가 있다는 인상을 받습니다. 즉, 직관적인 관점에서 인과관계로 보이는 것이 정량적으로 확률 8 4 라고 주장하는 것은 허용될 수 있는 것으로 판명되었습니다. 총액이 클수록 분명하다.<125>검사된 텍스트 또는 음성 세그먼트의 특이성이 높을수록 언어 요소 사용의 상대적 빈도의 안정성이 개별 사용에서도 더 명확하게 나타납니다(대수의 법칙). 이로부터 언어는 대중적 현상이며 그렇게 취급되어야 한다는 새로운 일반적인 결론이 도출됩니다.

함께 언어를 구성하는 음성 요소, 단어 및 문법적 형태의 빈도 계산을 기반으로 도달한 이러한 결론은 소쉬르가 "언어"(lalangue)와 "음성"(laparole)으로 구분한 "통계적 해석"에 적용됩니다. ). Saussure에 따르면 "언어"는 주어진 언어 커뮤니티의 구성원 간의 의사 소통을 가능하게 하는 일련의 언어 습관입니다. 이것은이 언어를 사용하는 모든 사람들에게 의무적 인 사회적 현실, "대량 현상"입니다. Herdan은 지적한 바와 같이 단일 언어 공동체의 구성원들이 동일한 음소, 어휘 단위 및 문법 형식을 사용한다는 점뿐만 아니라 이러한 모든 요소가 동일한 빈도로 사용된다는 점에서 서로 유사하다는 것을 증명합니다. 따라서 "언어"에 대한 그의 통계적 정의는 다음과 같은 형식을 취합니다. "언어"(lalangue)는 일반적인 언어 요소의 총체에 사용되는 상대적 확률을 더한 것입니다.

"언어"의 이러한 정의는 또한 소쉬르에 따르면 개별 발화인 "말"에 대한 해당 통계적 해석의 출발점이기도 합니다. 개별 현상으로서의 "말"의 사회적 현상으로서의 "언어"에 대해 Saussure는 다음과 같이 썼습니다. 그의 개인적인 생각을 표현하기 위한 코드; 2. 그가 이러한 조합을 객관화할 수 있게 해주는 정신물리학적 메커니즘” 8 5 . 언어 통계에서 "언어"는 특정 상대를 가진 요소 집합으로 간주되기 때문에<126>가장 본질적인 특성으로 통계적 총체성 또는 앙상블(인구)을 포함하고 이러한 측면에서 고려할 수 있는 한 사용 가능성이 있습니다. 이에 따라 "말"은 통계적 집계로 "언어"에서 가져온 별도의 샘플이 됩니다. 이 경우 확률은 "말"과 "언어"의 관계("정량적" 이해에서)에 의해 결정되며 언어의 다른 요소 사용의 상대적 빈도 분포는 다음의 결과로 해석됩니다. 언어 존재의 특정 연대기에서 집단 "선택"(선택). 그럼에도 불구하고 "언어"와 "말"의 차이점에 대한 그러한 해석이 소쉬르의 것과는 완전히 다른 근거에 기반하고 있음을 깨달은 Herdan은 이와 관련하여 다음과 같이 썼습니다. )는 이제 통계적 집계(인구)의 형태로 필수 특성을 얻습니다. 이 모집단은 특정 상대 빈도 또는 변동 확률로 특징지어지며, 이는 각 언어 요소가 특정 언어 수준에 속함을 의미합니다. 이 경우 "speech"(laparole)는 그 의미에 따라 "언어"에서 가져온 통계 샘플을 통계적 모집단으로 정의하는 용어임이 밝혀졌습니다. 여기에서 선택(choice)이 "언어"에 대한 "말"의 비율의 형태로 나타나며, 통계적 집계(인구)에 대한 무작위로 추출된 샘플의 비율이라는 것이 명백해집니다. 수세기에 걸쳐 언어 공동체의 언어 활동의 예금으로서 빈도 분포의 바로 그 순서는 선택 (선택)의 요소이지만 스타일에서와 같이 개인의 선택이 아니라 집단 선택의 요소입니다. 은유를 사용하여 특정 언어 공동체 구성원의 복잡한 정신 데이터와 일치하는 언어 의사 소통의 원칙을 이해한다면 언어 정신에 의한 선택에 대해 여기서 이야기 할 수 있습니다. 계열의 안정성은 확률(chance)» 8 6 의 결과입니다.

명시된 원칙 적용의 특수한 경우<127>pa는 "예외"(편차)에서 규범적 현상의 언어로 구분됩니다. 언어 통계는 통계적 방법이 이 문제에 존재하는 모호함을 제거하고 이러한 현상을 구별하기 위한 명확한 기준을 설정하도록 허용한다고 말합니다. 규범이 통계적 모집단(위의 의미에서)으로 이해되고 예외(또는 오류)가 통계적 모집단에 의해 표시된 빈도의 편차인 경우 질문에 대한 정량적 해결책이 제시됩니다. 그것은 모두 "인구"와 "이상치" 사이의 통계적 관계로 귀결됩니다. 개별 표본에서 관찰된 빈도가 일련의 표본 수에 의해 결정된 것보다 더 많이 통계적 모집단으로 인한 확률에서 벗어나는 경우 "동일"(규범)과 "아니다" 사이의 경계선이 다음과 같은 결론을 내릴 이유가 있습니다. 동일"(예외)이 위반됩니다.

"언어"와 "음성" 사이의 양적 차이는 문법적 요소와 어휘적 요소의 두 가지 유형의 언어 요소를 구별하는 데에도 사용됩니다. 언어학적 관점에서 종종 큰 어려움을 나타내는 이 문제를 해결하기 위한 출발점은 문법적 요소의 빈도가 어휘 단위의 빈도와 다르다는 가정이다. 이것은 문법 요소의 "일반화"와 관련이 있으며 어휘 단위로 고정된 개념과 어떻게 다른지와 관련이 있습니다. 또한 문법 요소는 일반적으로 부피가 훨씬 작습니다. 독립적 인 단어 (대명사, 전치사, 접속사 및 보조 단어 포함)로서 일반적으로 적은 수의 음소로 구성되며 "연결된 형태"의 형태입니다. " -하나 또는 두 개의 음소에서 8 7 . 언어적 요소가 작을수록 "길이"(정량적 순간)가 특성을 정의하는 데 덜 적합하고 이러한 목적을 위해 획득하는 음소의 "품질"이 더 중요해집니다. 고려중인 문제를 해결하기 위해 어떤 방법이 제안됩니까? 문법의 순수 양적 개념을 참고하여 해결<128>Herdan은 이와 관련하여 “우리가 이와 관련하여 두 언어를 비교하는 데 관심이 있다고 가정합니다. 언어가 지닌 "문법적 부하"를 어느 정도의 객관성으로 어떻게 결정합니까? 이 부담은 문법과 어휘를 구분하는 경계선의 위치에 따라 달라질 것이 분명합니다. 우리가 생각할 수 있는 첫 번째 고려 사항은 주어진 언어의 문법이 얼마나 "복잡한지"를 결정하는 것입니다. 결국 "복잡성"은 질적 특성이고 "문법적 부하"의 개념은 양적 특성입니다. 사실, 부하는 어느 정도 복잡성에 따라 다르지만 전적으로는 아닙니다. 언어는 매우 복잡한 문법으로 보상을 받을 수 있지만 언어의 활동에는 비교적 작은 부분만 사용됩니다. 우리는 "문법적 부하"를 언어가 작동할 때 전달하는 문법의 총체성으로 정의하며, 이는 우리의 문제를 Saussure가 규율을 정의한 의미에서 즉시 구조적 언어학의 영역으로 가져옵니다. 다음 프레젠테이션에서는 문법과 어휘를 분리하여 경계가 어디에 있는지에 따라 양적 방법을 사용하여 언어 간의 차이를 결정합니다.” 8 8 . 즉, 이 경우의 언어적 차이는 문법적 요소와 어휘적 요소 사이의 수적 관계의 차이로 환원되어야 한다.

우리 처분의 자료는 다음 그림을 그립니다. 영어("문법적 단어"만 고려됨: 대명사, 또는 "대체"라고도 함), 전치사, 접속사 및 조동사) 다른 단어), 53,102 문법적 요소, 더 정확하게는 "문법적 단어"(149개의 다른 단어)를 사용하는 경우가 67.53%이고 다른 단어가 15.8%입니다. 이것이 Deway 8 9의 데이터입니다. 다른 데이터는 다른 비율을 보여줍니다<129>비율: 57.1%, 5.4% 다른 단어 9 0 . 이 중요한 불일치는 문어와 구어의 차이로 설명됩니다. 언어의 서면 형식(첫 번째 데이터)은 구두 형식(두 번째 경우)보다 문법적 요소를 더 많이 사용하는 것으로 추정됩니다. Dante의 Divine Comedy(이탈리아 원작 이후)에서 Mariotti는 "문법적 단어" 발생의 54.4%를 확립했습니다.

언어의 문법적 부하를 결정하는 또 다른, 분명히 더 완벽한 방법은 문법 요소에 포함된 음소를 세는 것입니다. 이 경우 독립적인 문법 단어뿐만 아니라 관련 형식도 고려됩니다. 여기에는 다양한 옵션이 있습니다. 예를 들어, 문법 요소에서 개별 자음 음소의 상대적인 사용 빈도를 결정하고 이를 동일한 음소의 총 사용 빈도와 비교합니다(영어에서 이러한 비율의 최종 데이터는 99.9% 대 100,000의 비율을 제공합니다. 총 사용); 또는 별도의 분류 그룹(순음, 구개음, 연구개 및 기타 음소)에 따른 자음의 유사한 비교. 여기서 최종 비율은 56.47%(문법적 요소에서)에서 60.25%(총 사용에서)의 비율 형식을 취합니다. 또는 초성 자음 음소의 동일한 비교(이 경우, 비율은 문법 단어에서 100.2% 대 전체 사용에서 99.95)입니다. 다른 더 복잡한 통계 작업도 가능하지만 연구 중인 문제의 양적 표현이 비슷합니다.

주어진 정량적 데이터는 일반적인 결론의 기초 역할을 합니다. 그것은 문법 요소의 음소 분포가 언어 전체에서 음소의 분포(물론 숫자 용어로)의 특성을 결정한다는 사실로 귀결됩니다. 그리고 이것은 문법 요소의 사용이 최소한 개인의 선택에 달려 있으며 개연성에 의해 제어되는 언어 표현의 일부를 구성한다는 결론을 내릴 수 있게 합니다.<130>네스 호. 이 추론적인 결론은 Esselson이 만든 러시아어 문법 형식 계산에 의해 확인됩니다 9 1 . 이 연구는 II 출처(Griboedov, Dostoevsky, Goncharov, Saltykov-Shchedrin, Garshin, Belinsky, Amfiteatrov, Gusev-Orenburgsky, Ehrenburg, Simonov 및 N. Ostrovsky의 작업)에서 가져온 46896 단어를 대상으로 했습니다. 구어체(17,756단어, 37.9%)와 비구어체(29,140단어, 62.1%)로 나뉜다. 그런 다음 전체 단어 집합을 문법적 특성에 따라 4개의 그룹으로 나누었습니다. 두 번째 그룹 - 동사; 세 번째 그룹 - 구두 분사, 형용사와 명사 및 동명사 기능의 분사; 네 번째 그룹 - 부사, 전치사, 접속사 및 입자의 변함없는 형태. 요약 결과(개별 저자에 대한 데이터가 포함된 표도 제공됨)는 다음 비율을 제공합니다.

1군

두 번째 그룹

세 번째 그룹

네 번째 그룹

구어체

말없는

Herdan은 이렇게 얻은 양적 데이터의 고려를 다음과 같이 특징지었습니다. 이러한 결론은 사용된 각 단어의 부담스러운 한정을 피합니다. 문법과 어휘가 빈틈없는 껍질에 저장되어 있지 않기 때문에 순수한 "선택"이나 순수한 "기회"도 없다는 것이 분명합니다. 문법과 어휘 모두 비율이 크게 다르지만 두 요소를 모두 포함합니다.” 9 2 .<131>

Herdan의 책의 많은 부분은 이중성 또는 언어의 이중성에 대한 연구에 할애되어 있으며 이중성이라는 개념 자체가 수학적 특성을 기반으로 합니다.

따라서 사영 기하학의 정리는 두 계열로 배열될 수 있으므로 한 계열의 각 정리는 단어를 대체하여 다른 계열의 일부 정리에서 얻을 수 있습니다. 그리고 똑바로.예를 들어, "서로 다른 점은 하나의 선에만 속합니다"라는 문장이 주어지면 "서로 다른 두 선은 하나의 선에만 속합니다."라는 해당 문장을 도출할 수 있습니다. 이중성을 결정하는 또 다른 방법은 가로 좌표와 세로 좌표를 따라 연구 중인 현상의 다른 평면을 그리는 것입니다. 그래서 예를 들어 율93과 같이 횡축은 사용빈도가 다르고, 종축은 사용빈도가 정해진 어휘단위의 수 등이다.

이와 같이 정의된 이원성(二元性)이란 모든 경우에 사실상 이진 부호의 성격을 지니며 언어 구조의 가장 본질적인 특징이라고도 할 수 있는 이원성이라는 개념 아래서 극도로 다른 성질의 현상을 끌어들여 두 개의 평면을 따라 대립하게 만든다. : 어휘단위의 성질에 따른 단어사용의 분포와 빈도에 따른 어휘단위의 분포 단어의 사용; 서면 및 구어체 연설; 어휘 및 문법 요소; 동의어 및 반의어; 음소 및 그래픽 표현; 정의할 수 있고 정의하는 것(소쉬르의 기표와 기표) 등

하나 또는 다른 특정 언어 현상 또는 제한된 "텍스트"의 이중성에 대한 양적 연구 후 일반적으로 언어 보편성의 특성에 기인하는 결론이 도출됩니다. 그러한 결론의 본질과 그것이 정당화되는 방식은 예에서 볼 수 있습니다.<132>단어와 개념의 이중성에 대한 연구(사실, 우리는 단어의 길이와 개념의 양의 비율에 대해 이야기하고 있습니다. 그러한 작업은 종종 이해를 매우 어렵게 만듭니다.) 이러한 유형의 언어적 이중성을 관찰한 자료로 다음과 같은 자료가 사용되었다는 점에 주목하는 것이 중요하다. . 이 경우 다음과 같은 일반적인 결론이 내려집니다. 매체를 통해 "영역" 내에 있는 많은 개체 또는 기타 개념에 대해 생각할 수 있습니다. 반면에 개념을 정의하는 데 필요한 모든 항목은 "내용"이라고 하는 것을 구성합니다. 볼륨과 콘텐츠는 상호 연관되어 있습니다. 콘텐츠가 작을수록 개념이 추상적일수록 범위나 볼륨이 커집니다. 이것은 기호의 길이와 사용 빈도가 상호 의존적이라는 코딩 원칙에 대한 유추(개념적 영역에서)로 볼 수 있습니다.” 9 4 .

이중성의 원리는 특정 문제에도 적용됩니다. 예를 들어, 서로 다른 두 언어로 된 단어의 의미의 동등성을 확립할 때입니다. Muret-Zanders의 영독사전을 수학적 반복법을 이용하여 연구한 결과, 독일어 번역에서 하나 이상의 의미를 가진 영어 단어를 사용할 확률은 전체 사전에서 각 첫 글자에 대해 일정하게 유지된다는 결론을 얻었다 9 5 . 중국어 사전의 어순을 고려하면 문자의 획 수가 그 위치를 나타내기 때문에 분류학적 성격이라는 결론에 도달합니다(독립적 급진적 또는 급진적 하위 클래스로). 분류법은 동물학 및 식물학에서 사용되는 분류의 종속 원칙입니다. 케르단은<133>중국어 사전 편찬의 기초는 또한 분류법 9 6 등의 원칙을 기반으로 합니다.

언어 문제 연구(즉, 언어 통계)에 수학적 방법을 적용하는 이 영역에 대한 일반적인 평가를 할 때, 분명히 Ettinger가 공식화한 입장에서 진행하는 것이 필요합니다. 언어학자가 사용된 수학적 모델의 가능성뿐만 아니라 적용의 실제 한계를 명확히 할 때만 언어학 서비스에서” 9 7 . 즉, 수학적 방법이 언어 문제를 적절하게 해결하는 데 적합하다는 것을 증명할 때 수학적 언어학에 대해 이야기할 수 있으며, 이는 전체적으로 언어 과학을 구성합니다. 그렇지 않은 경우 과학 연구의 새로운 측면을 열 수 있지만이 경우 언어학이 아닌 모든 것에 대해 이야기 할 수 있습니다. 이 경우 다른 유형의 응용 언어학을 의미하지 않습니다 (우리는 나중에).아래 연설), 그러나 과학적 또는 이론적, 언어학. 이 입장을 바탕으로 언어학자의 관점에서 볼 때 언어 통계의 많은 부분이 의심스럽고 심지어 어리둥절하다는 점에 유의해야 합니다.

(프레젠테이션을 어지럽히지 않기 위해) 두 가지 예에 대한 분석으로 돌아가서 각각에 대해 매우 중요한 이의를 제기할 수 있음을 규정합니다. 여기서 우리는 문법적 단위와 어휘적 단위 사이의 양적 구별을 갖는다. 이러한 구분을 하기 위해서는 언어의 "문법적 부하"(즉, 문법적 요소의 총체성) 때문에 문법 분야에 속하는 것이 무엇인지, 어휘에 속하는 것이 무엇인지 미리 알아야 한다는 것이 밝혀졌습니다. 연설에서 사용됨), 위에 인용된 바와 같이 "어휘와 문법을 구분하는 경계선에 따라 달라집니다." 따라서 이 선이 어디에 있는지 모르면 표시된 구분을 그리는 것이 불가능합니다. 그렇다면 어휘와 문법을 구별하는 양적 방법의 의미는 무엇인가?<134>매틱? 그러나 헤르단은 이 문제에 대해 특별히 생각하지 않고 언어적 요소를 대담하게 분류하여, 표현으로 판단할 때 외적 굴절로 이해되어야 할 문법적 요소인 "연결된 형태"와 "문법적 단어"를 언급하며, 여기에는 전치사, 접속사, 보조 동사 및 대명사가 포함됩니다. 후자는 "대체"라는 사실 때문입니다. 그러나 우리가 이러한 대명사의 품질에 대해서만 이야기하고 이를 기반으로 문법적 요소와 관련시키는 경우 분명히 "앞서 언급한", "이름이 지정된", "주어진"등의 단어도 그에 기인해야하므로 그들도 대리인으로 행동하는 방법. 언어 통계에서 사용되는 문법적 요소를 분리하는 방법과 관련하여, 이 경우 어순, 성조, 영 형태소, 계열 관계(이러한 현상 중 일부는 , 그건 그렇고, 수학적 방법으로 연구되는 언어에서 반성을 찾으십니까)? 어근(급진적)을 문법적으로 수정할 뿐만 아니라 순열이 없는 어근은 언어에 실제 존재가 없습니까? 언어의 문법적 복잡성은 무엇을 이해해야 하며, 어떤 기준으로 결정되는가? 이 경우 가능한 모든 방법으로 강조되는 양적 포인트가 문법적으로 가장 어려운 언어 중 하나는 Ishallhavebeencalling 또는 Hewouldhavebeencalling과 같은 구조를 가진 영어가 될 것입니다. 이 문장들에서 call 만 어휘로 분류될 수 있고, 그 외의 모든 것은 문법적으로 간주되어야 합니다. 문법 요소의 사용 빈도와 문법 단어 의미의 일반성 또는 추상성을 연결하는 근거는 무엇입니까? 결국, 문법적 요소의 상대적으로 많은 사용빈도가 문장 구성에서의 기능에 의해 결정된다는 것은 매우 자명하며, 의미의 추상성에 관해서는 매우 쉽게 찾을 수 있다.<135>이러한 점에서 문법적 요소와 쉽게 경쟁할 수 있는 어휘 요소의 수는 빈도 면에서 크게 열등합니다(예: 존재, 존재, 확장, 공간, 실체등).

단어와 개념의 이중성(duality)에 대한 정의의 경우에도 비슷한 종류의 부조리가 우리 앞에 일어난다. 위에서 지적한 바와 같이 매우 중요한 언어학의 원천 자료가 된 질병의 명명법과 질병의 병원 등록부를 사용하여 연구하기 위해서는 언어의 구조적 본질에 대한 매우 독특한 이해가 필요합니다. 결론. 개념의 영역, 부피, 내용 등 언어적 존재가 없는 용어의 완전히 모호한 사용에 연연하지 않고 혼란), 이 경우에 내린 결론으로 ​​돌아가 보자. 위에서 언급한 바와 같이 "범위와 내용이 상호 연관되어 있다"는 주장을 다루고 있습니다. 그러한 결론에 대한 근거를 제공하는 전체 추론 과정과 언어적 사실의 수학적 연산 방법은 이 경우 언어의 매우 본질적인 특성 중 하나가 완전히 무시되어 수행되는 모든 계산을 뒤엎는다는 것을 분명히 보여줍니다. : 같은 것을 표현하는 능력 "양"이 다른 언어 단위로 "내용"을 표현하는 능력, 의심 할 여지없이 상대적 사용 빈도가 다릅니다. 그래서 우리는 같은 사람을 Petrov, 내 지인, 그, Muscovite, 청년, 대학 직원, 아내의 형제, 다리에서 만난 남자 등으로 지정할 수 있습니다. 의심의 여지없이 개인적인 결론이지만 지적한 바와 같이 보편적인 의미가 부여될 뿐만 아니라 그러한 언어 문제에 양적 방법 자체를 적용하는 편의성도 있습니다.

그러나 때때로 언어학자들은 그 타당성이 의심의 여지가 없는 결론을 내립니다. 이것은 "언어의 기본 법칙"이며, 언어에는 요소의 특정 안정성과 언급의 상대적 빈도가 있다는 사실로 구성됩니다.<136>소비. 그러나 이런 종류의 발견의 문제는 그것들이 언어학자들에게 오랫동안 알려져 왔다는 것입니다. 결국, 언어가 일정한 안정성을 갖지 못하고 주어진 언어 공동체의 각 구성원이 언어의 요소를 자유롭게 변경한다면 상호 의사 소통이 불가능하고 언어의 존재 자체가 무의미해질 것입니다. . 언어의 개별 요소 사용의 상대적 빈도 분포에 관해서는 L. V. Shcherba가 많은 관심을 기울인 수동 및 능동 어휘 및 문법 범주를 할당하는 형태로 언어학에서 그 표현을 발견했습니다. 이 경우 통계적 방법은 사용의 상대적 빈도 범주에 따라 특정 언어 요소를 분포하는 언어학자에게만 도움이 될 수 있지만 이론적 언어학에 가치가 있는 새로운 패턴을 발견했다고 주장할 이유는 없습니다.

반면에 언어 통계는 지지자들의 과학적 사고의 본질을 극도로 나타내는 진정한 "독창적"결론을 제공합니다. 따라서 Churchill, Benes, Halifax, Stresemann 등의 저작물에서 "정치적 어휘"는 복잡한 통계적 방법으로 연구되며 비영어권 작가의 계산에 그들의 저작물을 영어로 번역하는 데 사용됩니다. 계산 결과는 수많은 표, 수학 공식 및 방정식의 형태로 표시됩니다. 이 경우 양적 데이터의 언어적 해석은 처칠의 "정치적 어휘" 사용이 이 저자 그룹에 대해 가장 전형적인(?) 것이고 정치적 문제를 다루는 경우 처칠의 단어 사용이 전형적이라는 사실로 축소됩니다. 영어 스피치 그룹의 9 8 .

또 다른 경우에는 적절한 통계적 조작을 거친 후 히틀러가 나치 독일을 사용하면서 이러한 용어의 양적 의미에서 "언어"와 "말" 사이의 이중성을 위반했다고 결론지었습니다. 이 이중성이 파괴된 특별한 경우는 문자 그대로의 이해입니다.<137>은유적 전환(예: "열린 상처에 소금을 붓는다"). 나치 독일은 너무나 많은 비인간적 행위로 스스로를 낙인찍었기 때문에 이 언어적 만행 9 9 에 대해 유죄 판결을 받을 필요가 거의 없습니다. 케르단에 따르면, 마르크스의 언어에 대한 사상의 직접적 실재는 언어적 이중성을 위반하는 것으로 이어지며, 현상을 반대 현상으로 전환시키는 변증법의 법칙은 그의 견해로는 이중성의 언어적 법칙으로 잘못 이해되고 있다. 언어의. 그러한 해석은 스스로를 대변합니다.

마지막으로, 언어 자료를 연구하여 방법론적 특성을 획득하는 양적 방법의 위의 모든 경우에 내재된 공통적인 단점은 서로 완전히 독립적인 일련의 기계적 사실로서 언어 요소에 접근하는 것입니다. 또는 패턴, 그들은 체계적 종속성 외부에서 자율적 사실 분포의 수치적 관계만을 참조합니다. 사실, J. Watmou는 언어의 구조적 특징을 드러낼 수 있는 어떤 종류의 언어 구조 분석보다 더 나은 수학임을 확인하기 위해 가능한 모든 방법을 시도합니다. "현대 수학"은 "정확도가 본질적으로 제한되는 측정 및 미적분을 다루지 않고 주로 구조를 다룹니다. 이것이 수학이 언어 학습의 정확성에 매우 도움이 되는 이유입니다. 본질적으로 훨씬 더 제한적인 별도의 설명이 불가능할 정도로 ... 물리학에서와 마찬가지로 수학적 요소는 물리적 세계를 설명하는 데 사용됩니다. 물리적 세계의 요소에 해당하는 것으로 가정하기 때문에 수학적 언어학에서 수학적 요소는 언어 세계의 요소에 해당하는 것으로 간주됩니다.” 101 . 그러나 그러한 질문의 정식화는 결코 상황을 구하지 못한다.<138>언어에 대한 분석은 여전히 ​​언어에 충분하지 않고 최종 분석에서 여전히 동일한 기계적 특성을 갖거나 논리-수학적 구조로 언어를 분석하여 언어를 다른 차원으로 전환합니다. 그리고 많은 점에서 그것에 이질적입니다. Watmow는 미래에만 수학적 언어학의 성공을 예견하고 실제 결과에 대해 다음과 같이 평가합니다. “... Herdan, Zipf, 율 지로(Guiraux) 등은 언어학과 수학 모두에서 비평의 범위를 벗어나지 않는다. 그녀는 아마추어의 냄새가 난다” 103 . 따라서 언어 연구에서 수학적 방법의 미래를 예측하려고 하지 않고 현재 우리가 가지고 있는 것을 평가하려고 한다면 수학이 언어학 분야에서 실제로 "측정 및 계산"에만 제한되어 왔다는 것을 인정해야 할 것입니다. ”, 언어의 구조를 파고 들어 언어에 대한 질적 분석을 할 수 없었습니다.<139>

최대한 객관적이 되도록 노력합시다. 특정 부분에서 양적 데이터는 분명히 언어학에서 사용할 수 있지만 보조적으로 만 주로 실용적인 방향을 가진 문제에서 사용할 수 있습니다. 개별 언어 현상을 연구하는 대부분의 정량적 방법과 관련하여 R. Brown의 일반적인 결론은 의심할 여지 없이 정당합니다. 104 . "이 정원에 있는 나무는 무엇입니까?"라는 질문을 한다고 상상해 봅시다. 이에 대한 응답으로 "이 정원에는 백 그루의 나무가 있습니다." 이것이 우리의 질문에 대한 답이며 정말 이치에 맞습니까? 그러나 많은 언어적 질문과 관련하여 수학적 방법이 바로 그러한 답을 제공합니다.

그러나 주로 수학적 방법을 사용하고 동시에 그러한 조합의 편의성이 의심의 여지가 없는 언어 자료에 대한 연구 활동의 넓은 분야가 있습니다. 이 연구 활동의 "의미", 그 중요성은 그것이 추구하는 목표에 의해 결정됩니다. 이미 실전에서 검증되었습니다. 이 경우 우리는 정보 기계 생성, 서면 과학 텍스트의 기계 번역 구조, 한 언어에서 다른 언어로의 구두 번역 자동화 및 결합 된 모든 작업 범위와 관련된 문제에 대해 이야기하고 있습니다. 사이버네틱스의 언어 문제에서. 이러한 문제의 전체 세트는 일반적으로 응용 언어학이라는 일반적인 이름이 부여됩니다. 따라서 언어 자료의 통계적 처리를 결코 피하지는 않지만 위에서 문체 통계학 및 언어 통계로 지정된 작업 영역을 포함하는 소위 수학적 언어학과 구별됩니다. 아마도 응용 언어학을 수학적 언어학과 구분하는 가장 중요한 특징은 전자가 언어학을 위한 수학이 아니라 언어학이라는 반대 방향을 가지고 있다는 것입니다.<140>(수학적 방법으로 공식화) 광범위한 실제 문제에 대해.

이제 응용언어학이라는 극히 넓은 영역에 포함되는 개별 문제의 내용을 공개할 필요가 없다. 수학적 언어학과 달리 이러한 문제는 소비에트 언어 문헌에서 활발히 논의되고 있으며 연구 기관의 과학적 문제에서 점점 더 두드러지는 위치를 차지하기 시작합니다 105 . 따라서 그들은 이미 우리 언어 커뮤니티에 잘 알려져 있습니다. 그러나 이러한 상황은 특히 언어 과학의 원리의 관점에서 반성해야 할 필요성을 덜어주지 않습니다. 이것은 의심 할 여지없이 서로 매우 멀리 떨어져 있고 응용 언어학 문제에 대한 작업에 참여하는 과학 대표자들 사이에서 점점 더 자주 발생하는 오해를 제거하는 데 도움이 될 것이며 한편으로는 그들의 수렴 방법을 설명 할 것입니다. , 연구 영역의 구분, 반면에. 다음 고려 사항은 언어 학자의 관점을 나타낼 것이며 수학자는 그것을 동화하려고 노력할뿐만 아니라 제기 된 질문과 관련하여 해석을 제공해야합니다.

언어학자-이론가는 모든 경우에<141>응용 언어학에 의해 설정된 목적을 위한 언어, 그들의 기초는 수학적 모델입니다. 이에 따라 언어 현상에 대한 관찰과 이렇게 얻은 결과를 수학 용어와 개념, 즉 수학 방정식과 공식을 통해 표현한다. 명확성을 위해 예를 살펴보겠습니다. Condon 1 06 및 Zipf 1 07은 빈도( 에프) 큰 텍스트에서 단어의 발생은 순위 또는 순위의 로그와 다이어그램에서 상관 관계가 있는 경우 거의 직선에 위치합니다( 아르 자형) 이 단어들 중. 방정식 f=c:r,어디 와 함께상수는 제한된 의미에서 이 관계를 반영합니다. c:r설정 값 아르 자형근사치로 관찰된 주파수를 재현합니다. 사이의 관계 에프그리고 아르 자형,수학적 공식으로 표현되는 것은 사용 빈도의 관찰 값과 단어의 순위 또는 순위 사이의 관계에 대한 모델입니다. 이것은 수학적 모델링의 경우 중 하나입니다. 

전체 정보 이론은 전적으로 C. Shannon108이 개발한 커뮤니케이션 프로세스의 수학적 모델을 기반으로 합니다. 그것은 "모든 데이터에 포함된 정보의 양을 계산하고 추정하는 방법과 정보를 저장하고 전송하는 과정에 대한 연구에 전념하는 수학적 분야"로 정의됩니다(TSB, vol. 51, p. 128). 따라서 정보이론의 기본 개념은 수학적 표현을 받아 정보를 바이니트(binits) 또는 이진 단위(언어에 비유되는 코드로 두 개의 조건부 동등 확률 신호가 각 문자 전송 시 하나의 이진 단위 정보를 전송합니다. ) - 코드 및 전송된 정보의 평균 양<142>형성. 중복성은 코드의 총 전송 능력의 백분율로 표현됩니다.”, 1 09 등. 같은 방식으로 기계 번역에는 한 언어의 요소를 다른 언어로 매핑하는 알고리즘 개발이 필요합니다. 1 10 . 다른 모델링 사례입니다.

의미가 없는 모델을 사용하는 것은 특히 응용 언어학이 설정한 문제를 해결하는 데 매우 중요한 도움이 될 수 있습니다. 그러나 이론적 언어학의 경우 추상 모델이 원칙적으로 실제 현상의 모든 기능, 모든 기능적 특성을 재현하지 않는 것이 매우 중요합니다. 따라서 건축가는 집을 짓기 전에 설계 중인 집을 가장 작은 세부 사항까지 재현하는 모델을 만들 수 있으며, 이는 그가 집 자체 건설과 관련된 많은 실제 문제를 해결하는 데 도움이 됩니다. 그러나 그러한 집 모델은 아무리 정확하더라도 그 "기능"이 없으며 일반적으로 모든 주택이 건축되는 목적이 없습니다. 사람에게 주택을 제공 할 수 없습니다. 상황은 모델이 항상 모든 품질을 재현할 수 있는 것은 아닌 언어와 유사합니다. 이 경우 언어가 아닌 수학적 기준이 모델을 구축하는 데 사용된다는 사실로 인해 문제가 더욱 복잡해집니다. "수학적 모델은 ... -A. Ettinger는 기술의 모든 영역에서 매우 중요한 역할을 하지만 합성 도구이기 때문에 주로 역사적이고 설명적인 분야인 언어학에 대한 중요성은 자연스럽게 제한됩니다. 111.<143>

언어의 수학적 모델링은 실제로 정적 상태에만 적용할 수 있으며 이는 언어학자에게 조건부이며 실제로 언어의 기본 품질과 직접적으로 충돌하며 그 존재 형태는 개발입니다. 언어의 정적 연구는 언어학에서 결코 배제되지 않으며, 외국어의 실제 학습을 위한 지침이 되는 규범문법과 사전, 서술문법, 실용문법과 사전 등을 편찬하는 기초가 됨은 물론이다. 그러나 자연에 주로 적용되는 이러한 모든 작업에서 언어학자는 의식적으로 연구 분야를 제한하고 언어의 다른 측면에 결코 눈을 감지 않습니다 1 12 . 특히 언어에 대한 정적 검사를 통해 생산성, 사고 형식에 대한 의존성, 문화적, 사회적, 정치적, 역사적 및 기타 요인과의 광범위한 상호 작용과 같은 동적 특성과 관련된 언어의 특성이 완전히 사라집니다. 연구원의 시야. 공시적 차원에서만 언어는 관습적인 기호나 코드의 체계로 간주될 수 있지만, 언어에 더 적합한 동적 관점을 채택하자마자 완전히 정당화되지 않는 것으로 판명됩니다. 동기 부여, 안정된 경계를 갖지 않는 단어의 다의어, 단어의 의미와 소리 껍질의 비 자율성, 문맥과 관련된 단어의 창의적 잠재력과 같은 언어 특성이 개발 과정에 있습니다. 그리고 이 모든 것은 코드나 기호의 주요 특성과 첨예하게 모순된다 1 13 . 분명히 응용 언어학에서는 언어의 이러한 모든 특성을 생각할 수 있으며 실용적인 목적을 위해 언어의 "스냅샷"에 만족할 수 있습니다. 그 기능의 메커니즘.<144>nirovaniya. 그러나 그러한 각각의 "스냅샷"은 관습적인 코드 체계의 사실이 아니라 언어의 사실로 간주된다면 언어가 항상 존재하는 끝없는 이동 과정에 포함되어야 합니다114. 주어진 언어 상태에 흔적을 남기고 더 발전할 수 있는 가능성을 결정하는 이 운동을 특징짓는 특정 조건 외에는 연구할 수 없습니다. 여기에는 한 사람의 순간적인 사진과 진정한 예술가의 붓으로 그린 ​​초상화 사이의 차이와 같은 차이가 있습니다. 작가의 작품에서 우리는 외모뿐만 아니라 내면의 영적 내용의 모든 독창성을 지닌 사람의 일반화 이미지를 가지고 있습니다. 예술적인 초상화에서 우리는 또한 그것에 묘사된 사람의 과거를 읽을 수 있고 그의 행동에서 그가 무엇을 할 수 있는지 결정할 수 있습니다. 그리고 스냅샷은 원본의 모양을 더 정확하게 나타낼 수 있지만 이러한 특성이 없으며 종종 코에 튀어 나온 우발적 여드름과<145>전혀 특징이 없는 포즈나 표정으로 결국 원본의 왜곡으로 이어집니다.

"스냅샷"의 방법은 물론 언어 발달의 사실에 적용될 수 있다는 점에 유의해야 합니다. 그러나 이 경우에 우리는 실제로 언어의 분리된 상태만을 다룰 것이며, 양적 특성화에서 다른 언어의 비교 양적 특성화에 지나지 않는 것으로 판명됩니다. 이러한 종류의 양적 "역학"은 유기적인 것을 포함하지 않으며 언어의 개별 상태 간의 연결은 수치 관계의 비교에만 의존합니다. 이 경우에도 유추에 의지한다면 우리는 아이의 성장을 언급할 수 있습니다. 물론 그의 발달은 체중, 키, 신체 부위의 부피 변화 비율에 대한 수치 데이터의 역학 형태로 나타낼 수 있지만 이러한 모든 데이터는 주로 개별 본질을 구성하는 모든 것과 절대적으로 분리됩니다. 사람의 - 그의 성격, 성향, 습관. , 취향 등

언어의 수학적 "모델링"의 또 다른 부정적인 측면은 언어에 대한 포괄적이고 포괄적인 체계적 설명을 수행할 수 있는 일반 원칙이 될 수 없다는 사실입니다. 예를 들어, 언어 현상에 대한 수학적 접근만이 다음과 같은 근본적인 질문(언어 과학의 존재 자체를 생각할 수 없음)과 같은 근본적인 질문에 답하는 것을 가능하게 하지 않을 것입니다. 적절한 언어학적으로 분류되는 것, 단어나 문장이 어떻게 정의되는지, 언어의 기본 개념과 범주는 무엇인지 등. 가설) 이 모든 질문에 미리. 수학적 방법에 의한 언어 현상 연구에 대해 우리에게 알려진 모든 사례에서 이러한 모든 개념과 범주는 필연적으로 전통적 또는 상대적으로 말하면 질적 방법.

언어적 적용에서 수학적 방법의 이러한 특징은 파이가<146>샐: “정량적 표현을 받는 관찰된 사실은 설명의 일부를 형성하지 않는 경우 가치가 없으며 언어적 목적을 위해 질적 언어와 밀접하게 관련된 체계적인 설명이어야 한다는 점을 염두에 두어야 합니다. 설명 및 이론” 1 15 . 스팡-한센(Spang-Hanssen)의 또 다른 연설에서 우리는 이 아이디어에 대한 해명을 발견했습니다. 언어적 관점의 수치적 특성은 의미가 없습니다." 1 16 . 유사한 아이디어가 Uldall에 의해 표현되어 다소 예기치 않게 그것들을 용어해석학의 일반적인 이론적 기초의 발전과 연결합니다. 예를 들어, 단어를 셀 때 단어는 완전히 다른 용어로 정의됩니다.<147>

따라서 이론적 용어와 실제 적용 모두에서 수학적 방법은 전통적, 철학적 또는 위에서 언급했듯이 질적 방법에 의해 정의된 언어 개념 및 범주에 직접적으로 의존한다는 것이 밝혀졌습니다. 응용 언어학 측면에서 이러한 의존성을 깨닫고 결과적으로 전통 언어학의 주요 범주 전체에 익숙해지는 것이 중요합니다.

사실, 현대 언어학의 데이터를 사용하지 않는다는 이유로 응용 언어학 분야에서 일하는 정확한 과학의 대표자를 비난 할 이유가 없습니다. 이것은 실제 상황과 일치하지 않습니다. 그들은 완벽하게 잘 알고있을뿐만 아니라 다른 언어의 특징, 특정 언어 시스템 내 언어 요소의 분포 및 배열, 음향 음성학의 성과 등 언어학자가 설정 한 차별화 기능 시스템을 작업에 널리 사용합니다. 그러나 이 경우 매우 중요한 예약이 필요합니다. . 실제로 정확한 과학의 대표자는 언어학에서 한 방향의 데이터 만 사용합니다. 소위 설명 언어학은 언어 연구의 전체 분야를 다루는 것과는 거리가 먼 이론적 언어학의 전통적인 문제와 의도적으로 구별됩니다. 언어학적으로 볼 때 방법론적으로 상당한 결점을 가지고 있어 최근에 드러난 위기1 18 에 더해 응용언어학의 이해관계에 부합하는 순전히 실용적인 지향을 가지고 있다. 언어의 정적 고려에 대해 위에서 언급한 모든 유보와 비난은 기술 언어학에 적용할 수 있습니다. 기술 언어학의 이러한 일방적인 접근은 연구자가 할 수 있는 일이다.<148>그러나 그것은 응용언어학 자체가 설정한 작업에 의해서만 정당화될 수 있지만 언어 과학의 전체 내용을 소진하는 것과는 거리가 멀다.

응용 언어학의 문제를 발전시키는 과정에서 새로운 이론적 문제가 발생할 수 있으며 실제로는 이미 발생했습니다. 이러한 문제 중 일부는 응용 언어학의 특정 작업과 밀접하게 관련되어 있으며 이러한 문제를 해결하는 데 발생하는 어려움을 극복하는 것을 목표로 합니다. 다른 문제는 이론적 언어학과 직접 관련되어 전통적인 아이디어에 대한 새로운 관점을 허용하거나 언어 연구, 새로운 개념 및 이론의 새로운 영역을 개척합니다. 예를 들어 후자의 경우에는 "기계" 언어(또는 중간 언어)를 생성하는 문제가 있는데, 이는 개념과 어휘 의미, 논리 및 문법, 통시와 동시, 언어의 기호성, 언어적 의미의 본질, 인공언어 구성 원리 등 119. 이 경우 언어 분야와 정확한 과학 대표자들의 공동 작업에서 상호 이해와 커먼 웰스를 구축하는 것이 특히 중요합니다. 언어적 측면에 관해서는, 이 경우에 우리는 이미 예를 들어 번역 기계 설계자의 노력을 미리 제한하고 그러한 기계의 작동 기능을 N의 구절로 설정하려고 시도하는 것에 대해 이야기해서는 안됩니다. Gribachev 또는 V. Kochetov 1 20의 산문 . 기계 자체는 기능의 한계와 수익성, 즉 사용의 한계를 찾을 것입니다. 그러나 공통 원인에 대한 기여로서 언어학자는 언어 구조의 특징, 다용성, 요소의 내부 교차 관계뿐만 아니라 언어와 물리적, 생리학적 언어의 광범위하고 다각적인 연결에 대한 지식을 가져와야 합니다. , 정신적, 논리적<149>mi 현상, 특정 기능 패턴 및 언어 발달. 이 지식의 총체는 해당 기계의 설계자가 잘못된 방향으로 방황하지 않고 검색을 목적이 있고 명확하게 하기 위해 필요합니다. 이 에세이에서 작성된 언어 문제에 수학적 방법을 적용하는 사례에 대한 아주 간단한 검토조차도 그러한 지식이 정확한 과학의 대표자에게 결코 불필요하지 않을 것이라고 확신합니다.

위의 모든 고려 사항을 바탕으로 몇 가지 일반적인 결론에 도달할 수 있습니다.

그렇다면 수학적 언어학은? 이것이 모든 언어 문제를 해결하기 위한 보편적 마스터 키로 수학적 방법을 사용하는 것을 의미한다면 그러한 주장은 절대적으로 정당하지 않은 것으로 인식되어야 합니다. 이 방향으로 수행된 모든 작업은 지금까지 언어 과학의 전통적인 문제를 해결하는 데 거의 또는 전혀 수행되지 않았습니다. 최악의 경우, 수학적 방법의 적용은 명백한 불합리성을 수반하거나 언어학적 관점에서 절대적으로 무의미합니다. 기껏해야 수학적 방법은 언어 연구의 보조 방법으로 사용될 수 있으며 특정하고 제한된 언어 문제를 해결하는 데 사용됩니다. 이 경우 "양적 언어 철학"에 대한 의문의 여지가 없습니다. 당시의 물리학, 심리학, 생리학, 논리학, 사회학, 민족학은 언어학의 독립성을 잠식했지만 언어학을 예속시킬 수는 없었다. 그 반대가 일어났습니다. 언어학은 이러한 과학의 성과를 이용했고, 그 자체로 필요한 만큼 그들의 도움을 사용하기 시작하여 연구 방법의 무기고를 풍부하게 했습니다. 이제 분명히 수학의 차례입니다. 이 새로운 커뮤니티가 언어 과학의 강화, 작업 방법의 개선 및 다양성 증가에 기여할 수 있기를 바랍니다. 그러므로 물리적 언어학, 생리학적 언어학, 논리적 언어학, 심리적 언어학,<150>기타 그러한 언어학은 없으며 보조 연구 도구로 다른 과학의 데이터를 유익하게 사용하는 언어학이 하나뿐입니다. 따라서 새로운 과학의 맹공 앞에서 후퇴할 이유가 없으며, 새로운 과학이 획득한 위치를 쉽게 그에게 양보할 이유가 없습니다. 여기에서 A. Martinet의 말을 상기하는 것이 매우 적절합니다. 그러나 언어 학자들이 과학의 독립성을 깨닫고 자신의 행동을 하나 또는 다른 일반적인 과학적 원리와 연관시키는 열등감에서 벗어날 때가 왔습니다. 그 결과 현실의 윤곽은 항상 명확해지기는커녕 애매모호할 뿐 21 .

따라서 수학 자체와 언어학 자체입니다. 이것은 공통 문제에 대한 공동 작업에서 상호 지원이나 친선 회의를 결코 배제하지 않습니다. 두 과학의 공동 노력의 이러한 종류의 적용 장소는 응용 언어학의 일부이며 국가 경제적 중요성이 큰 광범위한 문제입니다. 공동 작업에서 두 ​​과학이 최대한의 상호 이해를 보여 의심 할 여지없이 협력의 최대 결실에 기여할 수 있기를 바랍니다.<151>

논문을 작성하는 데 비용이 얼마나 드나요?

작업 유형 선택 논문(학사/전문가) 논문의 일부 석사 학위 실습 과정 코스 이론 에세이 에세이 시험 작업 증명 작업(VAR/WQR) 사업 계획 시험 문제 MBA 학위 논문(대학/기술 학교) 기타 사례 실험실 작업 , RGR 온라인 도움말 실습 보고서 정보 검색 PowerPoint 프레젠테이션 대학원 초록 졸업장 첨부 자료 기사 시험 도면 자세히 »

감사합니다. 이메일이 발송되었습니다. 당신의 메일을 확인하세요.

15% 할인 프로모션 코드를 원하십니까?

SMS 수신
프로모션 코드

성공적으로!

?매니저와 대화 중에 프로모션 코드를 알려주십시오.
프로모션 코드는 첫 주문에서 한 번만 사용할 수 있습니다.
프로모션 코드 유형 - " 졸업 작품".

수학과 언어학의 상호 작용


소개

제1장 언어학에서의 수학적 방법 적용의 역사

1.1. 19-20세기 초 구조언어학의 형성

1.2. 20세기 후반 언어학에서의 수학적 방법의 적용

제2장 언어학에서 수학을 사용한 선별된 예

2.1. 기계 번역

2.2.언어 학습의 통계적 방법

2.3. 형식 논리의 방법으로 언어 학습

2.4. 언어학에서 수학적 방법의 적용에 대한 전망

결론

문학

부록 1. Ronald Schleifer. 페르디낭 드 소쉬르

부록 2. Ferdinand de Saussure(번역)

소개


20세기에는 다양한 지식 분야의 상호작용과 상호 침투를 향한 지속적인 추세가 있었습니다. 개별 과학 사이의 경계가 점차 모호해지고 있습니다. 인도주의, 기술 및 자연 과학 지식의 "교차점"에 있는 정신 활동의 점점 더 많은 분야가 있습니다.

근대성의 또 다른 분명한 특징은 구조와 그 구성 요소를 연구하려는 욕구입니다. 따라서 과학적 이론과 실제 모두에서 점점 더 많은 위치가 수학에 주어집니다. 한편으로는 논리와 철학, 다른 한편으로는 통계(그리고 결과적으로 사회과학)와 접촉하면서 수학은 오랫동안 순전히 과학에만 국한된 것으로 여겨졌던 영역에 점점 더 깊이 침투합니다. 휴리스틱 잠재력을 확장하는 "인도 주의적"( "얼마나"라는 질문에 대한 대답은 종종 "무엇"과 "어떻게"라는 질문에 대답하는 데 도움이 됨). 언어학도 예외는 아니었다.

제 과정의 목적은 수학과 언어학과 같은 언어학 분야 사이의 연결을 간략하게 강조하는 것입니다. 1950년대부터 수학은 언어 구조(자연 및 인공 모두)를 설명하기 위한 이론적 장치를 만들기 위해 언어학에서 사용되었습니다. 그러나 그러한 실용적인 응용 프로그램 자체를 즉시 찾지는 못했다고 말해야 합니다. 처음에는 언어학의 기본 개념을 명확히 하기 위해 언어학의 수학적 방법이 사용되기 시작했지만 컴퓨터 기술의 발달과 함께 이러한 이론적 전제가 실제로 적용되기 시작했습니다. 기계 번역, 기계 정보 검색, 자동 텍스트 처리와 같은 작업을 해결하려면 언어에 대한 근본적으로 새로운 접근 방식이 필요했습니다. 언어학자들은 언어 패턴을 기술에 직접 적용할 수 있는 형태로 표현하는 방법을 배우는 방법에 대한 질문에 직면했습니다. 우리 시대에 유행하는 "수학적 언어학"이라는 용어는 정확한 방법을 사용하는 모든 언어 연구를 의미합니다(그리고 과학에서 정확한 방법의 개념은 항상 수학과 밀접한 관련이 있습니다). 지난 몇 년간의 일부 과학자들은 특별한 "언어학"을 의미하지 않고 언어 연구 방법의 정확성과 신뢰성을 향상시키는 데 중점을 둔 새로운 방향만을 의미하기 때문에 표현 자체를 용어의 등급으로 올릴 수 없다고 생각합니다. . 언어학은 양적(대수적) 방법과 비정량적 방법을 모두 사용하여 수학적 논리, 결과적으로 철학, 심지어 심리학에 더 가깝게 만듭니다. Schlegel조차도 언어와 의식의 상호 작용에 주목했으며 20 세기 초의 저명한 언어학자인 Ferdinand de Saussure (언어학에서 수학적 방법 개발에 대한 그의 영향에 대해서는 나중에 설명하겠습니다)는 언어의 구조를 소속과 연결했습니다. 사람들에게. 현대 연구원 L. Perlovsky는 더 나아가 국가 정신의 특성으로 언어의 양적 특성(예: 성별, 사례 수)을 식별합니다(자세한 내용은 섹션 2.2, "언어학의 통계적 방법" 참조).

수학과 언어학의 상호 작용은 다면적인 주제이며, 제 작업에서 저는 모든 것에 대해 생각하지 않고 우선 적용 측면에 대해 설명할 것입니다.

제1장 언어학에서 수학적 방법의 응용 역사


1.1 XIX-XX 세기 전환기에 구조 언어학의 형성


언어에 대한 수학적 설명은 20세기 초의 유명한 스위스 언어학자인 Ferdinand de Saussure로 거슬러 올라가는 메커니즘으로서의 언어라는 개념을 기반으로 합니다.

그의 개념의 초기 링크는 각 단어(시스템의 구성원)가 그 자체가 아닌 것으로 간주되는 세 부분(언어 자체 - 랑그, 스피치 - 파롤 및 스피치 활동 - 언어)으로 구성된 시스템으로서의 언어 이론입니다. , 그러나 다른 회원과 관련하여. 또 다른 저명한 언어학자인 Dane Louis Hjelmslev는 나중에 언급했듯이 Saussure는 "언어에 대한 구조적 접근, 즉 단위 간의 관계를 기록함으로써 언어에 대한 과학적 설명을 요구한 최초의 사람이었습니다."

언어를 계층 구조로 이해한 소쉬르는 처음으로 언어 단위의 가치와 중요성에 대한 문제를 제기했습니다. 별도의 현상 및 사건(즉, 개별 인도-유럽어 단어의 기원에 대한 역사)은 그 자체로 연구되는 것이 아니라 유사한 구성 요소와 상호 연관되는 시스템에서 연구되어야 합니다.

소쉬르의 언어 구조 단위는 소리와 의미가 결합된 "기호"라는 단어를 고려했습니다. 이러한 요소 중 어느 것도 서로 없이는 존재하지 않습니다. 따라서 원어민은 다중 의미 단어 의미의 다양한 음영을 언어의 구조적 전체에서 별도의 요소로 이해합니다.

따라서 F. de Saussure의 이론에서 한편으로는 언어학과 사회학 및 사회 심리학의 상호 작용을 볼 수 있습니다(동시에 Husserl의 현상학, Freud의 정신 분석, Einstein의 상대성 이론이 , 문학, 음악, 미술에서 형식과 내용에 대한 실험이 진행되고 있음) 반면에 수학(일관성 개념은 언어의 대수적 개념에 해당함)으로 실험이 진행되고 있습니다. 이러한 개념은 언어 해석의 개념을 다음과 같이 변경했습니다. 현상은 발생 원인과 관련하여 해석되지 않고 현재와 미래와 관련하여 해석되기 시작했습니다. 해석은 더 이상 사람의 의도와 무관하지 않습니다(의도가 프로이트의 의미에서 비인격적이고 "무의식"일 수 있음에도 불구하고).

언어 메커니즘의 기능은 원어민의 말하기 활동을 통해 나타납니다. 음성의 결과는 소위 "올바른 텍스트"입니다. 특정 패턴을 따르는 음성 단위 시퀀스이며, 그 중 다수는 수학적 설명을 허용합니다. 구문 구조를 기술하는 방법 이론은 올바른 텍스트(주로 문장)의 수학적 기술을 위한 방법 연구를 다룹니다. 그러한 구조에서 언어적 유비는 고유한 특성의 도움으로 정의되는 것이 아니라 체계(“구조적”) 관계의 도움으로 정의됩니다.

서부에서 Saussure의 아이디어는 위대한 스위스 언어학자의 젊은 동시대 사람들에 의해 개발되었습니다. 덴마크에서는 L. Hjelmslev가 이미 언급했으며 그의 작품 "Fundamentals of Linguistic Theory"에서 언어 대수 이론을 일으켰습니다. 미국 - 체코의 E. Sapir, L. Bloomfield, C. Harris - 러시아 과학자 이민자 N. Trubetskoy.

언어 연구의 통계적 규칙성은 다름 아닌 유전학의 창시자인 게오르그 멘델에 의해 다루어지기 시작했습니다. 1968년이 되어서야 문헌학자들은 그가 말년에 수학 방법을 사용한 언어 현상 연구에 매료되었다는 사실을 발견했습니다. Mendel은 이 방법을 생물학에서 언어학으로 가져왔습니다. 1990년대에는 가장 대담한 언어학자와 생물학자만이 그러한 분석의 타당성을 주장했습니다. 성 베드로 수도원 기록 보관소에서 대수도원장이 Mendel이었던 브르노의 Tomasz는 "mann", "bauer", "mayer"로 끝나는 성 열과 일부 분수 및 계산이 포함된 시트를 발견했습니다. 멘델은 성의 기원에 관한 공식적인 법칙을 발견하기 위해 독일어의 모음과 자음의 수, 그가 고려하는 총 단어 수, 성의 수, 등.

우리나라에서 구조적 언어학은 서양과 거의 동시에 19-20 세기 초에 발전하기 시작했습니다. F. de Saussure와 동시에 시스템으로서의 언어 개념은 Kazan University F.F. Fortunatov 및 I.A. 보두앵 드 쿠르트네. 후자는 각각 de Saussure와 오랫동안 대응했으며 Geneva와 Kazan 언어학 학교는 서로 협력했습니다. 소쉬르가 언어학에서 "정확한" 방법의 이데올로기라고 불릴 수 있다면 Baudouin de Courtenay는 그 적용을 위한 실용적인 토대를 마련했습니다. 그는 언어학(통계적 방법과 기능적 의존성을 사용하는 정확한 과학으로서의)을 문헌학(언어와 말을 통해 영적 문화를 연구하는 인도주의 학문 공동체)에서 분리한 최초의 사람이었습니다. 과학자 자신은 "언어학은 가까운 미래에 유용할 수 있으며, 언어학 및 문학사와의 의무적 결합에서만 해방될 수 있다"고 믿었습니다. 음운론은 수학적 방법을 언어학에 도입하기 위한 "시험장"이 되었습니다. 언어 시스템의 "원자"로서의 소리는 쉽게 측정할 수 있는 속성의 수가 제한되어 형식적이고 엄격한 설명 방법에 가장 편리한 재료였습니다. 음운론은 소리의 의미 존재를 부정하므로 "인간" 요소는 연구에서 제거되었습니다. 이런 의미에서 음소는 물리적 또는 생물학적 대상과 같습니다.

지각에 허용되는 가장 작은 언어 요소인 음소는 별도의 영역, 별도의 "현상학적 현실"을 나타냅니다. 예를 들어 영어에서 "t" 소리는 다르게 발음될 수 있지만 모든 경우에 영어를 사용하는 사람은 "t"로 인식합니다. 가장 중요한 것은 음소가 주요 의미있는 기능을 수행한다는 것입니다. 또한 언어 간의 차이점은 한 언어의 한 소리가 다른 음소에 해당할 수 있다는 것입니다. 예를 들어 영어의 "l"과 "r"은 다르지만 다른 언어에서는 동일한 음소의 변형입니다(예: 영어 "t", 열망 유무에 관계없이 발음). 모든 자연어의 광대한 어휘는 훨씬 적은 수의 음소 조합의 집합입니다. 예를 들어 영어에서는 40개의 음소만 사용하여 약 백만 단어를 발음하고 씁니다.

언어의 소리는 체계적으로 구성된 일련의 기능입니다. 1920년대-1930년대에 Saussure에 이어 Jacobson과 N.S. Trubetskoy는 음소의 "독특한 특징"을 골라냈습니다. 이러한 기능은 혀, 치아, 성대와 같은 언어 기관의 구조를 기반으로 합니다. 예를 들어, 영어에서 "t"와 "d"의 차이는 "음성"(성대의 긴장)의 유무와 음소를 구별하는 음성의 수준입니다. 따라서 음운론은 Saussure가 설명한 일반 언어 규칙의 예로 간주할 수 있습니다. "언어에는 차이가 있을 뿐입니다." 훨씬 더 중요한 것은 이것이 아닙니다. 차이는 일반적으로 그것이 위치한 정확한 조건을 의미합니다. 그러나 언어에는 정확한 조건 없이 차이만 있을 뿐입니다. 우리가 "지정"을 고려하든 "의미"를 고려하든 언어 시스템이 개발되기 전에 존재했을 개념이나 소리가 언어에는 없습니다.

따라서 소쉬르 언어학에서 연구된 현상은 언어의 비교와 대립의 집합으로 이해됩니다. 언어는 단어의 의미를 표현하는 동시에 의사소통 수단이며 이 두 기능은 결코 일치하지 않습니다. 우리는 형식과 내용의 교대를 알아차릴 수 있습니다. 언어적 대조가 구조 단위를 정의하고 이러한 단위가 상호 작용하여 어떤 의미 있는 내용을 생성합니다. 언어의 요소는 무작위적이기 때문에 대조도 조합도 근거가 될 수 없다. 즉, 언어에서 구별되는 특징은 다른 이해 수준에서 음운 대비를 형성하고, 음소는 형태소로, 형태소는 단어로, 단어는 문장으로 결합됩니다. 어쨌든 전체 음소, 단어, 문장 등 부분의 합 이상입니다.

소쉬르는 사회에서 기호의 역할을 연구하면서 언어학과 분리된 20세기의 새로운 과학에 대한 아이디어를 제안했습니다. Saussure는 이것을 과학 기호학이라고 불렀습니다 (그리스어 "semeon"-기호). 1920~1930년대 동유럽과 1950~1960년대 파리에서 발전한 기호학의 "과학"은 언어 및 언어 구조에 대한 연구를 이러한 구조로 구성된(또는 표현된) 문학적 발견으로 확장했습니다. 또한 그의 경력의 황혼기에 일반적인 언어학 과정과 병행하여 Saussure는 의도적으로 구성된 고유 이름의 철자 바꾸기를 발견하려고 노력하면서 후기 로마시의 "기호 학적"분석에 참여했습니다. 이 방법은 여러 면에서 언어 분석에서 합리주의와 정반대였습니다. 언어의 "개연성" 문제를 시스템에서 연구하려는 시도였습니다. 이러한 연구는 확률의 "실제 측면"에 초점을 맞추는 데 도움이 됩니다. Jean Starobinsky에 따르면 Saussure가 애너그램을 찾고 있는 "핵심 단어"는 "시의 삶의 원천이 아니라 시인을 위한 도구"입니다. 시는 키워드의 소리를 바꾸는 역할을 합니다. Starobinsky에 따르면 이 분석에서 "소쉬르는 숨겨진 의미를 탐구하지 않습니다." 반대로 그의 작품에서는 의식과 관련된 질문을 회피하려는 욕구가 눈에 띈다. 언어의 법칙”(. 부록 1 참조).

후기 로마 시에서 고유명사를 연구하려는 소쉬르의 시도는 그의 언어 분석의 구성 요소 중 하나인 기호의 자의적 특성과 의미 분석의 가능성을 배제한 소쉬르 언어학의 형식적 본질을 강조합니다. Todorov는 오늘날 Saussure의 작업이 명확하게 정의된 의미를 가진 현상의 상징을 연구하기를 꺼리는 점에서 극도로 일관성이 있는 것 같다고 결론지었습니다[부록 1]. 애너그램을 탐색하면서 Saussure는 반복에만 주의를 기울이고 이전 옵션에는 주의를 기울이지 않습니다. . . . Nibelungenlied를 연구하면서 그는 잘못된 읽기에 할당하기 위해서만 기호를 정의합니다. 의도하지 않은 경우 기호는 존재하지 않습니다. 결국, 일반 언어학에 관한 그의 글에서 그는 언어 기호뿐만 아니라 기호학의 존재를 가정합니다. 그러나 이 가정은 기호학이 무작위적이고 자의적인 기호만을 기술할 수 있다는 사실에 의해 제한됩니다.

만약 이것이 사실이라면 그것은 그가 대상 없이는 "의도"를 상상할 수 없었기 때문입니다. 그는 형식과 내용 사이의 간격을 완전히 메울 수 없었습니다. 그의 글에서 이것은 질문으로 바뀌었습니다. 대신 그는 "언어 적 정당성"으로 전환했습니다. 한편으로는 역사와 주관적 추측에 기초한 19세기 개념과 이러한 개념에 기초한 임의적 해석의 방법, 그리고 다른 한편으로는 형식과 내용(주체와 객체) 사이의 대립을 지우는 구조주의적 개념 사이에서, 구조주의, 정신분석학, 심지어 양자역학의 의미와 기원, Ferdinand de Saussure의 언어학과 기호학에 대한 저술은 언어와 문화의 의미 연구에서 전환점이 되었습니다.

러시아 과학자들은 1928년 헤이그에서 열린 제1차 국제 언어학자 회의에도 참석했습니다. S. Kartsevsky, R. Yakobson 및 N. Trubetskoy는 지난 세기 초 가장 현대적인 아이디어의 정신으로 언어의 계층 구조를 조사한 보고서를 작성했습니다. Jakobson은 그의 저서에서 언어의 기본 요소는 무엇보다도 그 발생 이유가 아니라 기능과 관련하여 연구되어야 한다는 Saussure의 생각을 발전시켰습니다.

불행히도 1924년 스탈린이 집권한 후 다른 많은 과학과 마찬가지로 러시아 언어학도 후퇴했습니다. 많은 재능 있는 과학자들이 강제 이주를 당했고, 그 나라에서 추방되거나 수용소에서 사망했습니다. 1950년대 중반이 되어서야 특정 이론의 다원주의가 가능해졌습니다. 자세한 내용은 1.2절에서 설명합니다.


1.2 20세기 후반 언어학에서의 수학적 방법의 적용


20세기 중반까지 4개의 세계 언어 학파가 형성되었으며, 각각은 특정 "정확한" 방법의 조상으로 밝혀졌습니다. Leningrad 음운 학교 (그 조상은 Baudouin de Courtenay L. V. Shcherba의 학생이었습니다)는 소리를 음소 형태로 일반화하는 주요 기준으로 원어민의 연설 분석을 기반으로 한 심리 언어 실험을 사용했습니다.

프라하 언어계의 과학자들, 특히 창립자 N.S. 러시아에서 이주한 Trubetskoy는 반대 이론을 개발했습니다. 언어의 의미 구조는 반대적으로 구성된 의미 단위 집합 인 Sem으로 설명되었습니다. 이 이론은 언어 연구뿐만 아니라 예술 문화 연구에도 적용되었다.

미국 기술주의의 이데올로기는 언어학자인 L. Bloomfield와 E. Sapir였습니다. 언어는 그들의 연구의 주요 대상인 일련의 음성 진술로 서술자들에게 제시되었습니다. 그들의 초점은 텍스트의 과학적 설명(따라서 이름)의 규칙, 즉 구성 요소의 구성, 배열 및 분류에 대한 연구였습니다. 음운론 및 형태론 분야에서 분석 절차의 공식화(다른 수준에서 언어 연구를 위한 원칙 개발, 분배 분석, 직접 구성 요소 방법 등)는 언어 모델링의 일반적인 질문 공식화로 이어졌습니다. 언어의 체계적 측면뿐만 아니라 언어의 내용 계획에 대한 부주의로 인해 기술 주의자들은 언어를 시스템으로 충분히 충분히 해석할 수 없었습니다.

1960년대에 미국의 철학자이자 언어학자인 N. Chomsky의 작업으로 인해 형식 문법 이론이 개발되었습니다. 그는 가장 유명한 현대 과학자 및 공인 중 한 명으로 정당하게 간주되며 많은 기사, 논문 및 장편 다큐멘터리까지 그에게 바쳐집니다. Chomsky가 발명 한 구문 구조를 설명하는 근본적으로 새로운 방법-생성 (생성) 문법-언어학의 해당 추세를 생성주의라고합니다.

러시아 이민자의 후예인 촘스키는 1945년부터 펜실베이니아 대학교에서 언어학, 수학 및 철학을 공부했으며, 그의 스승인 Zelig Harris의 영향을 많이 받았습니다. 기존 미국 정치 체제에 대한 비판자이자 반세계주의의 영적 지도자 중 한 명으로 알려져 있음).

Chomsky의 첫 번째 주요 과학 작업인 그의 석사 논문인 현대 히브리어의 형태학(1951)은 아직 출판되지 않았습니다. 촘스키는 1955년에 펜실베이니아 대학교에서 박사 학위를 받았지만 그의 논문(언어 이론의 논리적 구조라는 제목으로 1975년에야 전체가 출판됨)과 그의 첫 논문인 구문 구조(1957, Rus. trans . 1962), 1951-1955년 하버드 대학교에서 공연되었다. 같은 1955년에 과학자는 Massachusetts Institute of Technology로 옮겨 1962년에 교수가 되었습니다.

Chomsky의 이론은 발전 과정에서 여러 단계를 거쳤습니다.

첫 번째 모노그래프 "구문 구조"에서 과학자는 한정된 문법적 수단 집합을 사용하여 무한한 문장 집합을 생성하는 메커니즘으로 언어를 제시했습니다. 언어 속성을 설명하기 위해 그는 깊은(직접 인식에서 숨겨지고 재귀 시스템에 의해 생성된, 즉 반복적으로 적용될 수 있는 규칙) 및 표면(직접 인식된) 문법 구조의 개념과 전환을 설명하는 변형을 제안했습니다. 깊은 구조에서 표면 구조로. 여러 표면 구조가 하나의 심층 구조에 해당할 수 있습니다(예: 대통령이 서명한 수동적 구성은 대통령이 법령에 서명한 능동적 구성과 동일한 심층 구조에서 파생됨). 딸을 사랑하는 것은 어머니가 딸을 사랑하는 사람이고 다른 하나는 딸이 사랑하는 사람인 두 개의 서로 다른 깊은 곳으로 돌아가는 표면 구조의 우연의 결과로 묘사됩니다.

Chomsky의 표준 이론은 Chomsky의 저서 "Aspects of the Theory of Syntax"에 제시된 "Aspects" 모델로 간주됩니다. 이 모델에서는 처음으로 의미론적 해석의 규칙이 형식 이론에 도입되어 깊은 구조에 의미를 부여했습니다. Aspects에서 언어적 능력은 언어의 사용(수행)에 반대되며, 변환 중 의미 보존에 대한 소위 Katz-Postal 가설이 채택되며, 이와 관련하여 선택적 변환의 개념이 제외되고, 어휘 호환성을 설명하는 구문 기능이 도입되었습니다.

1970년대에 촘스키는 거버넌스 및 구속력 이론(GB 이론 - 정부와 구속력이라는 단어에서 유래)을 이전 이론보다 더 일반적으로 연구했습니다. 그 안에서 과학자는 특정 언어의 구문 구조를 설명하는 특정 규칙을 포기했습니다. 모든 변환이 하나의 범용 이동 변환으로 대체되었습니다. GB 이론의 틀 내에는 개인 모듈도 있으며, 각 모듈은 문법의 자체 부분을 담당합니다.

이미 최근인 1995년에 Chomsky는 인간의 언어를 기계어처럼 기술하는 미니멀리스트 프로그램을 제안했습니다. 모델이나 이론이 아닌 프로그램일 뿐입니다. 여기에서 Chomsky는 인간 언어 장치의 두 가지 주요 하위 시스템인 어휘집과 컴퓨팅 시스템과 두 가지 인터페이스(음성 및 논리)를 식별합니다.

Chomsky의 형식 문법은 자연 언어뿐만 아니라 인공 언어, 특히 프로그래밍 언어를 설명하는 고전이 되었습니다. 20세기 후반의 구조적 언어학의 발전은 당연히 "촘스키 혁명"으로 간주될 수 있습니다.

대표자가 A.A. 인 모스크바 음운 학교. Reformatsky, V.N. Sidorov, P.S. Kuznetsov, A.M. Sukhotin, R.I. Avanesov는 유사한 이론을 사용하여 음성학을 연구했습니다. 점차 "정확한" 방법이 음성학뿐만 아니라 구문에도 적용되기 시작했습니다. 국내외의 언어학자와 수학자 모두 언어의 구조를 연구하기 시작했습니다. 1950년대와 60년대에 기계 번역 시스템의 개발과 관련하여 소련에서 수학과 언어학 간의 상호 작용의 새로운 단계가 시작되었습니다.

우리나라에서 이러한 작업을 시작하게 된 원동력은 미국 기계 번역 분야의 첫 번째 개발이었습니다. 널리 퍼지지 않았습니다). 1947년에 A. Butt와 D. Britten은 컴퓨터를 사용한 단어별 번역 코드를 고안했고, 1년 후 R. Richens는 기계 번역에서 단어를 어간과 어미로 나누는 규칙을 제안했습니다. 그 시절은 오늘날과 사뭇 달랐다. 이들은 방 전체를 차지하는 매우 크고 값비싼 기계였으며 이를 유지하기 위해 많은 엔지니어, 운영자 및 프로그래머가 필요했습니다. 기본적으로이 컴퓨터는 군사 기관의 요구에 대한 수학적 계산을 수행하는 데 사용되었습니다. 수학, 물리학 및 기술의 새로운 기능은 무엇보다도 군사 업무에 사용되었습니다. 초기 단계에서 MP의 개발은 군대의 적극적인 지원을 받았으며 (냉전 상황에서) 미국에서는 러시아-영어 방향이, 소련에서는 영-러시아 방향이 개발되었습니다.

1954년 1월, IBM-701 기계에서 러시아어를 영어로 번역하는 최초의 공개 시연인 조지타운 실험이 매사추세츠 공과 대학에서 열렸습니다. D.Yu가 만든 실험의 성공적인 통과에 대한 메시지 요약. Panov는 RJ "Mathematics", 1954, No. 10: "기계를 사용하여 한 언어에서 다른 언어로 번역: 첫 번째 성공적인 테스트에 대한 보고서"에 등장했습니다.

D. Yu. Panov(당시 과학 정보 연구소 - INI, 이후 VINITI 소장)는 나중에 소련 과학 아카데미의 정밀 수학 및 컴퓨터 공학 연구소에서 기계 번역 그룹을 이끌었던 I. K. Belskaya를 참여시켜 기계 번역 작업. 1955년 말, BESM 기계의 도움으로 영어를 러시아어로 처음 번역한 경험이 시작되었습니다. BESM 프로그램은 N.P. Trifonov 및 L.N. 그의 박사 논문은 기계 번역을 위한 사전 구성 방법에 전념했습니다.

동시에 기계 번역 작업은 소련 과학 아카데미 수학 연구소 (현재 러시아 과학 아카데미 M.V. Keldysh 응용 수학 연구소)의 응용 수학 부서에서 수행되었습니다. 수학자 A.A. Lyapunov. 그는 O.S. Kulagin과 그녀의 학생들 T.D. Wentzel과 N.N. 리코. 기술을 사용하여 한 언어에서 다른 언어로 번역할 수 있는 가능성에 대한 Lyapunov와 Kulagina의 아이디어는 Nature, 1955, No. 8 저널에 게재되었습니다. 1955년 말부터 T.N. Moloshnaya는 영어-러시아어 번역 알고리즘에 대한 독립적인 작업을 시작했습니다.

당시 스페인어 번역 알고리즘에 참여했던 R. Frumkina는 작업의 이 단계에서 일관된 조치를 취하는 것이 어려웠다고 회상합니다. 훨씬 더 자주 나는 내 자신이나 동료와 같은 휴리스틱 경험을 따라야했습니다.

그러나 1세대 기계 번역 시스템은 매우 불완전했습니다. 그들 모두는 "단어별", "구문별" 순차 번역 알고리즘을 기반으로 했습니다. 단어와 문장 사이의 의미 연결은 어떤 식으로도 고려되지 않았습니다. 예를 들어 다음과 같은 문장을 인용할 수 있습니다. “John은 장난감 상자를 찾고 있었습니다. 마침내 그는 그것을 찾았습니다. 상자는 펜 안에 있었다. 요한은 매우 기뻤습니다. (John은 그의 장난감 상자를 찾고 있었습니다. 마침내 그는 그것을 찾았습니다. 상자는 놀이울에 있었습니다. John은 매우 행복했습니다.)” 이 문맥에서 "펜"은 "펜"(쓰기 도구)이 아니라 "플레이펜"(장난감 펜)입니다. 동의어, 반의어 및 비유적 의미에 대한 지식은 컴퓨터에 입력하기 어렵습니다. 유망한 방향은 인간 번역가의 사용에 초점을 맞춘 컴퓨터 시스템의 개발이었습니다.

시간이 지남에 따라 직접 번역 시스템은 구문 구조 수준에서 번역이 수행되는 T- 시스템 (영어 단어 "전송"-변환에서 유래)으로 대체되었습니다. T-systems의 알고리즘은 입력 문장의 언어의 문법 규칙에 따라 구문 구조를 구축한 다음(고교에서 외국어를 가르치는 방식과 유사) 출력 문장을 합성할 수 있도록 하는 메커니즘을 사용했습니다. 구문 구조를 변형하고 사전에서 필요한 단어를 대체함으로써.

Lyapunov는 번역된 텍스트의 의미를 추출하여 다른 언어로 제시함으로써 번역에 대해 이야기했습니다. 어의론적 분석을 통해 입력 문장의 의미론적 표상을 획득하고, 획득한 의미 표현에 따라 입력 문장을 합성하는 것을 기반으로 기계 번역 시스템을 구축하는 접근 방식이 여전히 가장 완벽한 것으로 간주됩니다. 이러한 시스템을 I-시스템("인터링구아"라는 단어에서 유래)이라고 합니다. 그러나 정보 처리 분야의 세계 과학자 커뮤니티 인 IFIP 국제 연맹의 노력에도 불구하고 50 년대 후반과 60 년대 초반으로 거슬러 올라가는 작업을 만드는 작업은 지금까지 완전히 해결되지 않았습니다.

과학자들은 텍스트 작업을 위한 알고리즘을 공식화하고 구축하는 방법, 기계에 어떤 사전을 입력해야 하는지, 기계 번역에 어떤 언어 패턴을 사용해야 하는지에 대해 생각했습니다. 전통적인 언어학에는 의미론뿐만 아니라 구문 측면에서도 그러한 아이디어가 없었습니다. 그 당시에는 언어에 대한 구문 구조 목록이 없었고 호환성 및 상호 교환 가능성에 대한 조건이 연구되지 않았으며 더 작은 구성 요소에서 구문 구조의 큰 단위를 구성하는 규칙이 개발되지 않았습니다.

기계 번역의 이론적 토대를 마련해야 할 필요성은 수학적 언어학의 형성과 발전으로 이어졌습니다. 소련에서이 문제의 주역은 수학자 A.A. Lyapunov, O.S. 쿨라기나, V.A. Uspensky, 언어 학자 V.Yu. Rosenzweig, P.S. Kuznetsov, R.M. Frumkina, A.A. Reformatsky, I.A. Melchuk, V.V. 이바노프. Kulagina의 논문은 형식 문법 이론 연구에 전념했으며 (동시에 미국의 N. Khomsky와 함께) Kuznetsov는 F.F. Fortunatov.

1960년 5월 6일, "언어 연구를 위한 구조적 및 수학적 방법의 개발에 관한" 소련 과학 아카데미 상임위원회 법령이 채택되었고, 언어학 연구소 및 연구소에 해당 부서가 만들어졌습니다. 러시아어. 1960 년부터 모스크바 주립 대학, 레닌 라드, 노보시비르스크 대학, 모스크바 주립 외국어 연구소의 철학 교수진과 같은 주요 인도주의 대학에서 자동 텍스트 처리 분야에서 교육을 시작했습니다.

그러나 "고전적"이라고 불리는 이 시기의 기계 번역 작업은 실제적인 관심보다는 이론적인 것입니다. 비용 효율적인 기계 번역 시스템은 지난 세기의 80년대에만 만들어지기 시작했습니다. 이에 대해서는 2.1절 기계 번역에서 나중에 설명하겠습니다.

1960년대 - 70년대에는 장 이론 및 퍼지 집합 이론과 같은 집합 이론 및 수학적 논리의 방법을 사용한 심층적인 이론적 발전이 포함됩니다.

언어학 분야 이론의 저자는 소비에트 시인, 번역가 및 언어 학자 V.G. Admoni. 그는 처음에 독일어를 기반으로 이론을 발전시켰습니다. Admoni의 경우 "필드" 개념은 비어 있지 않은 임의의 언어 요소 집합을 나타냅니다(예: "어휘 필드", "의미 필드").

필드의 구조는 이질적입니다. 즉, 집합을 정의하는 완전한 기능 집합을 가진 요소가 있는 코어와 주어진 집합의 두 가지 기능을 모두 가질 수 있는 주변부(모두는 아님)로 구성됩니다. 그리고 이웃들. 이 진술을 설명하는 예를 들겠습니다. 예를 들어, 영어에서 합성어 필드("day-dream" - "dream"는 구 필드("tear gas" - "tear gas")와 분리하기 어렵습니다. .

위에서 이미 언급한 퍼지 집합 이론은 필드 이론과 밀접한 관련이 있습니다. 소련에서는 언어학자 V.G. Admoni, I.P. Ivanova, G.G. 그러나 Pochentsov의 조상은 1965년에 "Fuzzy Logic"이라는 기사를 발표한 미국 수학자 L. Zadeh였습니다. 퍼지 세트 이론에 대한 수학적 정당화를 제공하면서 Zade는 언어 자료를 기반으로 고려했습니다.

이 이론에서 우리는 주변 요소가 어느 정도 여러 필드에 속할 수 있기 때문에 주어진 세트(АОа)에 대한 요소의 소속에 대해 그다지 많이 이야기하지 않고 이 소속의 정도(mАОа)에 대해 이야기하고 있습니다. Zade(Lofti-zade)는 아제르바이잔 출신으로 12세 때까지 아제르바이잔어, 러시아어, 영어, 페르시아어의 4개 언어로 의사소통하는 연습을 했으며 키릴 문자, 라틴어, 아랍어의 세 가지 다른 알파벳을 사용했습니다. 과학자가 퍼지 세트 이론과 언어학의 공통점이 무엇인지 물었을 때 그는 이 연관성을 부인하지 않고 다음과 같이 설명합니다. 그렇다면 무의식적으로 만. 젊었을 때 Zadeh는 테헤란의 장로교 학교에서 공부했고 제2차 세계대전 후 미국으로 이주했습니다. “문제는 내가 미국인인지, 러시아인인지, 아제르바이잔인인지, 아니면 무엇이든이 아닙니다.”라고 그는 말했습니다.

유사한 초록:

문체의 근본적인 문제 중 하나 인 언어와 연설. 음소와 음운론적 수준의 개념. 시스템으로서의 언어의 개념과 언어 시스템의 수준. 형태소의 개념과 종류. 텍스트의 구문 단위로서의 문장. 언어 시스템의 징후.


맨 위