У дома / Покрив / Принципи на руския правопис. Какво е семантика? Значения на термина и примери Семантични технологии в CAD

Принципи на руския правопис. Какво е семантика? Значения на термина и примери Семантични технологии в CAD

анотация

Статията е посветена на проблемите на семантичния анализ на текстове. Разглеждат се различни методи: концептуални диаграми на зависимости и семантични мрежи; подходи, базирани на лексикални функции и тематични класове; рамкови и онтологични модели; логически модели за представяне на знания. Всеки от тях има своите предимства и недостатъци.

Създаването на нови методи за семантичен анализ на текстове е уместно при решаването на много проблеми на компютърната лингвистика, като машинен превод, автоматично обобщаване, класификация на текст и други. Също толкова важно е разработването на нови инструменти за автоматизиране на семантичния анализ.

Методи и системи за семантичен анализ на текст

Семантиката е дял от лингвистиката, който изучава семантичното значение на езиковите единици. В допълнение към знанията за структурата на езика, семантиката е тясно свързана с философията, психологията и други науки, тъй като неизбежно повдига въпроси за произхода на значенията на думите, тяхната връзка с битието и мисленето. При извършване на семантичен анализ е необходимо да се вземат предвид социалните и културните характеристики на носителя на езика. Процесът на човешкото мислене, подобно на езика, който е инструмент за изразяване на мисли, е много гъвкав и труден за формализиране. Следователно семантичният анализ с право се счита за най-трудния етап от автоматичната обработка на текст.

Създаването на нови методи за семантичен анализ на текст ще разкрие нови възможности и ще позволи
постига значителен напредък в решаването на много проблеми на компютърната лингвистика, като машинен превод, автоматично обобщаване, класификация на текст и други. Не по-малко актуално е разработването на нови инструменти за автоматизиране на семантичния анализ.

В момента има няколко метода за представяне на значението на твърденията, но нито един от тях не е универсален. Много изследователи са работили върху корелирането на значението на текста. И така, I.A. Мелчук въвежда понятието лексикална функция, развива понятията синтактични и семантични валенции и ги разглежда в контекста на тълковно-комбинаторен речник, който е езиков модел. Той показа, че значенията на думите не са пряко свързани
със заобикалящата реалност, но с представите на носителя на езика за тази реалност.

Повечето изследователи са склонни да смятат, че семантичният анализ трябва да се извършва след синтактичния. В.Ш. Рубашкин и Д.Г. Лахути въведе йерархия от синтактични връзки за по-ефективна работа на семантичния анализатор. Най-важни са задължителните ролеви връзки, следвани от кореферентните връзки, след това незадължителните ролеви връзки и едва след това субектно-асоциативните.

Известният лингвист E.V. Падучева предлага да се разглеждат тематични класове думи, по-специално глаголи, тъй като те носят основното семантично натоварване: глаголи на възприятие, глаголи на знание, глаголи на емоции, глаголи на вземане на решение, речеви действия, движение, глаголи на звук, екзистенциални глаголи, и т.н. Съществено в този подход е идеята да се разделят езиковите понятия на определени семантични групи, като се вземе предвид фактът, че тези понятия имат някакъв нетривиален общ семантичен компонент. Елементите на такива групи обикновено имат еднакъв набор от зависими понятия. Основният проблем при този подход обаче е, че идентифицирането на тематични класове и съставянето на семантични речници е изключително трудоемък процес, силно зависим от индивидуалното възприятие и тълкуване на понятията от конкретен човек.

Един универсален език за представяне на знания трябва да бъде удобен инструмент за извличане на нови знания от съществуващи знания, което означава, че е необходимо да се създаде апарат за проверка на коректността на твърденията. Тук са полезни логическите модели на представяне на знания. Например семантичният език, предложен от V.A. Тузов, съдържа формализмите на логиката на предикатите; съдържа „атомарни“ понятия, „функции“ над тези понятия и правила за извод, с които могат да бъдат описани нови понятия. Възможно е научната мисъл да се развие в посока на създаване на такива семантични езици в бъдеще.

Въпреки факта, че някои научни и технически идеи в областта на обработката на текст се развиват доста бързо, много проблеми в семантичния анализ остават нерешени. Повечето изследователи са стигнали до извода, че речникът в подкрепа на семантичния анализ трябва да работи със значения и следователно да описва свойствата и връзките на понятията, а не на думите. Но възниква въпросът как правилно да се структурира и представи информацията в такива речници, така че търсенето в тях да е удобно и бързо и също така да е възможно да се вземат предвид промените в естествения език (изчезването на стари и появата на нови понятия ). Тази статия прави опит да систематизира известните постижения в областта на семантичния анализ и до известна степен да намери отговор на този и други въпроси.

Изследване на семантиката в рамките на теорията “Значение ↔ Текст”

При създаването на теорията „Значение ↔ Текст“ И.А. Мелчук въвежда понятието лексикална функция.
От формална гледна точка лексикалната функция е функция, чиито аргументи са някои думи или фрази на даден език, а стойностите са набор от думи и фрази на същия език. В същото време само тези лексикални функции, които имат фразеологично свързани значения, представляват интерес и се разглеждат - значения, които са възможни с някои аргументи и невъзможни с други.

С други думи, лексикалната функция е определена семантична връзка, например „равенство по значение“ (Syn), „противоположно по значение“ (Anti) и т.н. Нека има няколко лексикални единици - думи и фрази; тогава тази лексикална функция присвоява на всяка от тези единици набор от лексикални единици, които са в подходящо семантично отношение с оригиналната единица.

Значенията на една лексикална функция от различни аргументи могат напълно или частично да съвпадат; Стойностите на различни функции от един и същ аргумент също могат да съвпадат. Алтернативните корелати, включени в значението на дадена лексикална функция от даден аргумент, не трябва да бъдат взаимозаменяеми винаги и във всеки контекст. Те могат да се различават по стилистични характеристики, по всички видове съвместимост, по граматически условия на употреба и накрая дори по смисъл. Последното е особено важно да се подчертае: различните корелати не винаги трябва да бъдат напълно синоними; достатъчно е техните значения да имат обща част, която съответства на дадена лексикална функция, и разликите да не надхвърлят някакви граници, тоест да не са „твърде значими“.

Като цяло лексикалната функция не е определена за всички думи и изрази. Първо, някои функции са определени само за една или друга част на речта: например Oper, Func и Labor са възможни само за съществителни. Второ, тази или онази функция може да бъде дефинирана само за думи с определена семантика: Magn - за думи, чието значение позволява градация („повече - по-малко“); Oper, Func и Labor са дефинирани само за имена на ситуации.

Трябва да се има предвид, че дори и при напълно подходящ (по своите синтактични и семантични свойства) аргумент, лексикалната функция може да няма значение (на даден език). Например синонимите по принцип са възможни за всякакви думи, но само някои ги имат. Това се дължи на фразеологичния характер на лексикалните функции.

Трябва още веднъж да се подчертае, че първоначално лексикалните функции са въведени специално за описание на лексикална съвместимост, а не за представяне на значение в общ смисъл, следователно не всички от тях трябва да се тълкуват като семантични единици. Връзката между лексикалните функции и значението далеч не е ясна. Някои лексикални функции могат да претендират за статут на семантични елементи, други може да нямат никакво значение, а трети могат да покриват много сложно значение.

От наша гледна точка да се говори за лексикални функции като за „многозначни“ функции не е съвсем правилно и удобно. По-удобно е да говорим за лексикални предикати. Следва списък на прости стандартни лексикални „функции“ (тук те ще бъдат представени под формата на предикати).

1. Syn (x, y), x, y – синоними.

2. Conv (x, y), x, y – преобразувания.

3. Анти (х, у), х, у – антоними.

4. Der (x, y), y е синтактично производно на x, тоест y съвпада с x по смисъл, но принадлежи към различна част от речта:

S0 (x, y), y е съществително име, получено от x (x не е съществително);

A0 (x, y), y – прилагателно, получено от x (x – не е прилагателно);

Adv0 (x, y), y – наречие, образувано от x (x – не е наречие);

V0 (x, y), y е глагол, образуван от x (x не е глагол).

С други думи, "x"y (Der (x, y) « S0 (x, y) Ú A0 (x, y) Ú Adv0 (x, y) Ú V0 (x, y)).

5. Род (x, y), y – обобщаващо понятие по отношение на понятието, обозначено с x (x = ягода, y = зрънце). Този предикат зависи от лексикалната съвместимост на думите в даден език: ако x и m са думи от два различни езика, които имат едно и също значение, тогава за Gener (x, y) и Gener (m, n), съответно, y и n може да нямат едно и също значение.

Ситуацията е определено лексикално отражение (на даден език) на някаква част от реалността. Ситуациите, обозначени с отделни лексикални единици на естествените езици (лексеми), имат като правило от един до четири семантични компонента или семантични актанти, обозначени с главни латински букви A, B, C, D. В същото време всеки такава лексема се сравнява в дълбочина синтактичните актанти са нейните зависими, съответстващи на субекта и силните обекти (ако тази лексема се реализира от предикатен глагол). Дълбоките синтактични актанти са номерирани с арабски цифри: 1, 2, 3, 4.

6. Si (x, y), i = 1, …, 4, y – типично име на i-тия актант за x.

7. Sc (x, y), y – константа, т.е. типичното наименование на вторичния компонент на дадена ситуация x:

Sloc (x, y), y – типично име на мястото, където възниква тази ситуация x; "където..." (x = битка, y = поле (на битка));

Sinstr (x, y), y – типично име на инструмента, използван в дадена ситуация x; „това, чрез което/чрез което...” (x = борба, x = оръжие (на борба));

Smod (x, y), y – типично наименование на метода (начин, характер) за реализиране на дадена ситуация x; „пътят...” (x = живот, y = образ (на живота));

Sres (x, y), y – типично наименование на резултата от дадена ситуация; „какво излиза“ (x = копие, y = копие).

С други думи, "x"y (Sc (x, y) « Sloc (x, y) Ú Sinstr (x, y) Ú Smod (x, y) Ú Sres (x, y)).

8. Корелативни предикати Знак (x, y), y – типично наименование на едно „парче“, един „квант“ на някое x; Mult (x, y), y – типично име на колекция, набор.

9. Сигур (x, y), y – метафора за x (x = сън, y = прегръдка (сън)).

10. Centr (x, y), y – типично обозначение на „централната“ част на обект или процес.

11. Ai (x, y), i = 1, …, 4, y – типично определение на i-тия актант според реалната му роля; „един, който...“; "този, който..."

12. Ablei (x, y), i = 1, …, 4, y – типично определение на i-тия актант според потенциалната му роля в ситуацията; „който може...“; „който може...“

13. Magn0 (x, y) и Magni (x, y), i = 1, ..., 4, y означава „високата степен“, „интензивността“ на самата ситуация x (Magn0) или нейната i-та актант (Магни).

14. Ver (x, y), y – „правилно“, „подходящо за целта“, „както трябва да бъде“ по отношение на x.

15. Бон (x, y), y – „добър” по отношение на x.

16. Advix (z, y), i = 1, ..., 4, x = A, B, C, D, y – името на ситуацията като определение за глагол, назоваващ друга ситуация:

AdviA (z, y), i = 1, ..., 4, y – дума, образувана от z, която, заменяйки z в текста, изисква превръщането на първия актант на това z във връх (вместо z) ( x = придружава, y = заедно с).

AdviB (z, y), i = 1, …, 4, y изисква вторият актант z да стане връх (x = грешен, y = грешен).

17. Loc (x, y), y – предлог за типична локализация (пространствена, времева или абстрактна):

Locin (x, y), y – „статична“ локализация (x = Москва, y = in);

Locad (x, y), y – предлог за посока (x = Москва, y = до);

Locab (x, y), y – предлог за отстраняване (x = Москва, след това y = от).

С други думи, "x"y (Loc (x, y) « Locin (x, y) Ú Locad (x, y) Ú Locab (x, y)).

Понякога Loc(x,y) не може да се определи еднозначно (x = сняг, y = включено и y = в).

18. Copul (x, y), y – свързващ глагол „да бъде“, „да се появи“ (x = атакуван, y = атакуван).

19. Опер1 (х, у), Опер2 (х, у), у – глагол, свързващ името на първи (респективно втори) актант в ролята на субект с името на ситуацията в ролята на първи обект ( ако x = поддръжка, тогава y = осигуряване на Oper1 (x, y) и y = намиране или среща за Oper2 (x, y)).

20. Func0 (x, y), Func1 (x, y), Func2 (x, y), y – глагол, който има името на ситуацията като субект x с имената на актантите (ако има такива) като обект (x = дъжд, y = върви).

21. Труд12 (x, y), y – глагол, свързващ името на първия актант в ролята на субект, с името на втория актант в ролята на първи обект и с името на ситуацията в ролята на втория обект (x = заповед, y = награда; x = наказание, y = субект).

22. Causij (x, y), y – действието на актантите „да направя така, че...“, „да предизвикам“. В случая без актантни индекси Caus (x, y), x е името на неучастващия в ситуацията (x = престъпление, y = тласък). Появява се отделно само с глаголи, в останалите случаи е част от сложни параметри.

23. Incep (x, y), y – „да започна“. Свойствата са същите като Causij (x, y).

24. Perf (x, y), y – „перфект“, y носи завършването на действието, постигането на неговия естествен предел. Perf (x, y) няма отделен независим израз на руски език; Обикновено този предикат се оценява като верен, ако y е в перфектна форма (x = прочетено, y = прочетено).

25. Резултат (x, y), y – „резултат“, т.е. y – „състояние като резултат...“; използва се за несвършени форми (x = легна, y = легна за Perf(x, y), y = легна за Резултат(x, y)).

26. Факт j (x, y), y – „да се реализира“, „да се изпълни“. Горният индекс (римски цифри) представлява, ако е необходимо, степента на изпълнение на подразбиращото се изискване, с по-нисък индекс, присвоен на по-ниската степен (ако x = прихващане и j = I, тогава y = тригер; ако j = II, тогава y = улов).

27. Real j1,2(x, y), y – „осъществява“, „изпълнява изискването“, съдържащо се в x. Индекс j има същото значение като горното – степен на завършеност; индексът обозначава дълбокия синтактичен актант, който изпълнява изискването (x = дълг (паричен), y = потвърждение за Real I1,2(x, y), y = изплащане за Real II1,2(x, y)).

28. Destr (x, y), y – типично наименование за „агресивно” действие (x = оса, y = ужилване).

29. Cap (x, y), y – „шеф“ (x = факултет, y = декан).

30. Оборудване (x, y), y – „персонал“ (x = население, y = състояние).

31. Doc (x, y), y – „документ“:

Docres (x, y), y – „документът, който е резултатът“; „въплъщаване“ (x = доклад, y = доклад);

Docperm (x, y), y – „документ за правото...“ (x = влак, y = (пътен) билет за Docperm Oper2 (x, y));

Doccert (x, y), y – „документ, удостоверяващ...” (x = висше образование, y = диплома).

С други думи, "x"y (Doc (x, y) « Docres (x, y) Ú Docperm (x, y) Ú Doccert (x, y)).

В допълнение към простите лексикални предикати, изброени по-горе, техните комбинации - съставни предикати - могат да се използват за описание на лексикална съвместимост:

AntiReal2 (x, y): неуспех на изпита/неуспех на изпита;

IncepOper2 (x, y): спечелете популярност, изпаднете в отчаяние;

IncepOper2 (x, y): пуснете в продажба, попаднете под обстрел;

CausOper2 (x, y): да се постави под контрол, да се пусне в обращение.

Както беше отбелязано по-рано, в общия случай лексикалната функция не е определена за всички думи и фрази. Функция може да бъде дефинирана само за думи с определена семантика. Например Cap и Equip - за думи, чието значение предполага наличието на „началник“ и „щаб“, тоест за имената на институции и организации в най-широк смисъл; Реални – за думи, чието значение включва компонента „изисквам“ („нуждая се“) и др.

Ако лексикалните функции са представени като предикати, не възникват трудности.
В случаите, когато лексикалните функции не са дефинирани, съответните им предикати ще бъдат неверни.

Специална роля в изследването на семантиката в подхода на I.A. Мелчук се играе от валентността на думите, тоест способността на думите да влизат във връзка с други думи. Думите, които определят дадена ситуация, имат валентности. Това са всички глаголи, някои съществителни (глаголни), прилагателни (обозначаващи сравнение: повече, по-малко, по-високо, по-ниско), някои предлози и наречия.

Има два вида валентности на думите: синтактични и семантични. Въпреки че това разделение понякога е доста произволно. Семантичните валентности се определят чрез лексикален анализ на ситуацията, посочена от конкретна дума. Да дадем пример с думата наем или наем. A наема C означава, че срещу известно възнаграждение D, лице A придобива от друго лице B правото да управлява собственост C за период от време T. Следователно е от съществено значение за ситуацията с наема
са следните „участници” или семантични актанти: предмет на лизинга (този, който наема), първи обект на лизинга (това, което се наема), контрагент (този, от когото наемат), втори обект ( плащане) и срока.

Тези актанти са необходими, тъй като елиминирането на някой от тях променя смисъла на ситуацията. Например, ако премахнете термина, ситуацията с наем се трансформира в ситуация на покупка и продажба. От друга страна, тези актанти са достатъчни, тъй като в ситуация на наем няма изискване да се посочи по каква причина, къде, кога и с каква цел е извършено. Въпреки че съответните словоформи са граматически прикрепени към глагола rent.

С други думи, семантичната валентност се определя от броя на семантичните актанти. Така глаголът rent има семантична валентност 5, тъй като има 5 семантични актанта. Формално тази ситуация може да бъде написана като предикат P (x1, x2, x3, x4, x5), където x1 е „кой“, x2 е „какво“, x3 е „кой има“, x4 е „плащане“, x5 е „термин“.

Не всички семантични актанти могат да бъдат определени в изречение; някои може просто да не бъдат споменати или изобщо да нямат синтактичен израз. Синтактичните валентности се определят от броя на синтактичните актанти, които са представени директно в текста (т.е. субекти и обекти, прикрепени към глагола) и зависят от контекста.

Например семантичната валентност на глагола miss е 4, тъй като той има 4 актанта: кой (изпълнител), в какво/към какво (мишена), от какво (оръжие - незадължително) и с какво (орган, средство). Но в повечето контексти само една валентност се изразява синтактично, например в изречението „Той се прицелваше дълго време, но пропусна“. Фразата „Той пропусна прозореца с бутилка“ обаче не е съвсем правилна.

От формална гледна точка имаме описаната по-долу конструкция. За да не свързваме отделен предикат с всеки глагол (и други думи), ще разгледаме предикат, чиято размерност е по-голяма с 1: P val(y, x1, x2, ..., xn), докато y ще бъде самата дума, а x1, x2, ..., xn – нейната валентност. За разграничаване на синтактични и семантични актанти могат да се използват мултииндекси, за да се укажат актантите, посочени в текста. Записът означава, че актантите i1, i2, …, ik са посочени.
По-специално, ако всички актанти са дадени, тогава получаваме. Някои варианти (на множество индекси) може да не са валидни на езика. Ако множеството i1, i2, …, ik е допустимо, тогава импликацията е в сила

Освен това, ако има два набора от валидни мултииндекси И , така че (i1, i2, …, ik) Ê (i1", i2", …, е"), тогава важи подобна импликация

Обяснителният комбинаторен речник е едно от основните теоретични изобретения на I.A. Мелчук.
В известен смисъл езиковият модел, предложен от I.A. Melchuk, представя езика като набор от речникови статии с огромно количество разнообразна информация; При такъв речник граматическите правила играят по-скоро второстепенна роля. Обяснителният комбинаторен речник отразява преди всичко нетривиалната съвместимост на лексемите. Можем да мислим за език като за много голям модел, в който са дефинирани лексикални предикати, които работят по описания по-горе начин.

Записът в тълковния комбинативен речник носи информация за валентностите на определена дума, което е вярно не само в нейната рамка, но и в рамките на целия език като цяло. Валентността съответства на предикат, където са семантичните актанти на думата cx, n е валентността на думата cx. Например в изречението Петя чете книга, cx = чете, n = 2: y1 = Петя, y2 = книга, тоест можем условно да напишем P val (cx, y1, y2) = 1.

Набор от записи в обяснително-комбинаторен речник може да се счита за определен подмодел на оригиналния модел, който е език. Лексикалните предикати, сега дефинирани на по-тесен набор, ще действат по подобен начин.

Нека означим с F множеството от правилно изградени фрази на естествения език L и j О F – фраза от това множество; – думата cx е включена във фразата j, а cx О L. Нека cx е съществително или прилагателно. Нека обозначим с Предикат множеството от предикати, дефинирани на L. Един от елементите на това множество е въведения предикат за валентност P val (cx, y1, …, yn).

По същия начин можем да приемем, че има и други предикати:

– предикат на рода на думата Род, където О (g1, g2, g3), g1 = женски; g2 = мъжки; g3 = ср.;

– предикат на предлога Предлог, където Î (pr1, ..., prk) – набор от предлози, съчетани с дадена дума;

– падежен предикат Падежи, където – падеж на думата cx; за различните езици броят на случаите е различен: например в руския език има шест случая, следователно Î (case1, case2, case3, case4, case5, case6), case1 = im.p .; case2 = пол; case3 = дата; случай4 = вин.п.; case5 = творчески; case6 = клауза; на немски има четири случая, така че Î (случай1, случай2, случай3, случай4), където случай1 = Nom; case2 = Gen; case3 = дата; случай4 = Акк.

Речниковият запис на обяснително-комбинаторния речник съдържа основната дума, свързаните с нея лексикални предикати и информация за валентността на тази дума. Информацията за валентността включва число, което показва броя на актантите, а за всеки актант - указание в кои случаи и с какви предлози се използват думите, съответстващи на този актант. В някои случаи може да бъде посочен и родът на думата.

Горното може да бъде представено чрез набор от предикати на формата

където xi е свободна променлива, съответстваща на i-тия актант.

Теорията „Значение Û Текст“ е създадена от самото начало за използване в приложни проблеми на автоматичния превод. Според I.A. Melchuk, с негова помощ, за разлика от традиционните нестроги теории, беше необходимо да се осигури изграждането на „работещ“ модел на езика. Теорията „Значение Û текст“ наистина се използва в някои системи за машинен превод, разработени в Русия, най-вече в англо-руската система за автоматичен превод ETAP, създадена от група, ръководена от Ю.Д. Апресян. Всички тези системи са експериментални, тоест промишленото им използване не е възможно. Въпреки че включват много езиково полезна информация, като цяло никой от тях все още не е осигурил пробив в качеството на превода.

Според автора основната ценна идея на тази теория е, че значенията на думите са свързани не пряко с околната реалност, а с идеите на носителя на езика за тази реалност (понякога наричани понятия). Природата на понятията зависи от конкретната култура; системата от понятия на всеки език формира така наречената „наивна картина на света“, която в много подробности може да се различава от „научната“ картина на света, която е универсална. Задачата на семантичния анализ на лексиката в теорията „Значение Û Текст” е именно да открие „наивната картина на света” и да опише нейните основни категории. С други думи, важната роля на тази теория е да опише не само обективната, но и субективната картина на света.

Въпреки факта, че интересът към теорията на I.A. Melchuk избледнява, маркирането на синтактичния корпус „Национален корпус на руския език“ се извършва от лингвистичния процесор ETAP-3, базиран на принципите на теорията „Значение Û Текст“.

Както бе споменато по-горе, Ю. Д. участва в разработването на процесора ETAP. Апресян. Неговите идеи са малко по-различни от тези на I.A. Мелчук. Централното място в изследванията на Ю.Д. Апресян е зает от нов тип синонимен речник. За този речник беше разработена подробна схема за описание на синонимни серии, където всеки елемент от серията беше характеризиран по отношение на семантика, синтаксис, съвместимост и други свойства. Речникът събира и обобщава максимално количество информация за езиковото поведение на руските синоними.

Концептуални диаграми на зависимости

Концептуален и казусен анализ

На етапа на морфологичен и семантико-синтактичен анализ на текстовете основните единици, обозначаващи понятия, са думите. Като правило се смята, че значението на фразите и фразите може да бъде изразено чрез значенията на техните съставни думи. Само ограничен брой стабилни фрази - идиоми - се считат за изключения. Този подход се основава на предположението, че комбинациите от думи, открити в даден език, могат да бъдат разделени на „свободни“ и „несвободни“.

Друг подход се основава на факта, че най-стабилните (неделими) смислови единици са категории и понятия, състоящи се не от независими думи, а от фрази. Такива категории и понятия се наричат ​​понятия. С този подход „несвободните“ фрази са не само идиоматични изрази, но и всички стабилни фразеологични единици на езика и речта (има стотици милиони от тях в развитите езици).

Идеята за концептуалния анализ като неразделна част от семантичния анализ се намира и в изследванията на В.Ш. Рубашкин и Д.Г. Лахути. Този раздел накратко очертава възгледите по въпроса какви проблеми трябва да бъдат решени с помощта на концептуален семантичен анализ.

Въвеждането на семантичния компонент трябва да получи синтактично маркиран текст. Маркираният текст трябва да съдържа различна информация: идентификатори на понятия, съответстващи на думата (термин); указание за синтактичния хост (всички алтернативни хостове) и типа на синтактичната връзка и др.

Преди да се прехвърли към семантичния компонент, термините и фразите също трябва да бъдат идентифицирани, представянето на цифровата информация трябва да бъде унифицирано, трябва да бъдат идентифицирани собствените имена и т.н. В реални проекти всички тези проблеми се решават с различна степен на приближение. Може да се счита, че професионалната общност е постигнала съгласие поне по следните въпроси.

Семантичният анализ, от гледна точка на използваните методи и средства, трябва да включва два етапа: а) етап на интерпретация на граматически изразени (синтактични и анафорични) връзки и б) етап на разпознаване на връзки, които нямат граматичен израз. .

Неяснотите трябва да се разрешават чрез самия процес на анализ - според критерия степен на семантично удовлетворение на получения резултат във всеки вариант.

Ключовата точка на системата за семантичен анализ е ефективната речникова поддръжка.
В този смисъл всяка система за семантичен анализ е ориентирана към тезаурус. Процедурите за семантичен анализ във всички случаи, без изключение, се основават на функционалността на концептуалния речник. Речникът в подкрепа на семантичния анализ трябва да работи със значения и следователно да описва свойствата и връзките на понятията, а не на думите. Това е концептуален речник. В известен смисъл ролята на концептуален речник могат да изпълняват семантични мрежи, които са описани в следващия раздел.

В семантичния интерпретатор на първо място е необходимо да се уточнят различимите видове семантични отношения в текста: роля (отношения според валентността на предиката), субектно-асоциативни (отношения между обекти, процеси, значими в субекта). площ - да бъде част, да има място, да бъде предназначена, да бъде столица и т.н.) и т.н.

Приети са следните основни постулати за интерпретация на синтактичните връзки.

1. Типът установена семантична връзка се определя от семантични класове и
в определени случаи по-подробна семантична характеристика на синтактичните „господар” и „слуга”.

2. Предлозите се разглеждат не като самостоятелен обект на интерпретация, а като допълнителна (семантико-граматична) характеристика на връзката между синтактичния „собственик“ на предлога и контролираната от него значима дума.

3. За разрешаване на лексикална и синтактична омонимия, записана от анализатора, семантичният интерпретатор използва система от емпирично установени предпочитания. За да се улесни сравняването на предпочитанията на опциите за тълкуване, им се присвояват цифрови рангове. На нивото на видовете семантични отношения се установява следният ред на предпочитанията (редът на изброяване съответства на намаляване на приоритета на връзката):

– функционални връзки и връзки, които установяват факта на семантичен излишък;

– ролеви връзки, определени като задължителни, при наличие на семантично последователен актант;

– кореферентни връзки;

– ролеви връзки, определени като незадължителни;

– посочени предметно-асоциативни връзки;

– предметно-асоциативните връзки са неконкретизирани.

Специфицираните синтактични връзки са тези, които интерпретаторът е в състояние да лексикализира със специфична връзка в предметната област (пристанищни съоръжения ® структури, разположени в пристанището); Съответно неуточнените връзки са тези, за които интерпретаторът не успява да предложи такава спецификация и които се интерпретират от общото понятие за свързано.

Ако се открие синтактична омонимия на координиращи връзки, предпочитанията се определят от степента на съгласуваност на семантичните характеристики на участниците в синтактичната връзка.

Лексикалните и локалните синтактични неясноти (наличието на алтернативни хостове за дума) се обработват в един механизъм за изброяване. Глобалните опции за разбор на изречение се разглеждат в механизма за изброяване на следващо ниво. В този случай се сравняват общите интерпретационни тегла на всички връзки в изречението.

При установяване на различни видове отношения тълкуването се определя от следните разпоредби.

При установяване на ролеви отношения следните граматични характеристики на участниците в синтактична връзка са важни и трябва да се вземат предвид (по отношение на руския език):

– семантико-синтактичен тип сказуемо (речникова характеристика);

– граматична форма на сказуемото;

– актантен падеж, възможността за прилагателна форма за актант според дадена валентност;

– възможността за предложно управление на актанта и способността на предлога, образуващ синтактична връзка, да изразява отношението според дадена валентност; информация за способността на предлога да служи като ролеви индикатор за дадена валентност се съхранява в описанието на речника на предлога.

Оперативно, процедурата за определяне на възможната роля на актант се определя от граматиката на ролевите връзки, установявайки съответствието на типа

(Rf, GFP, TSEMU) ® VAL,

където Rf е името на синтактичната връзка; GFP – граматична форма на сказуемото; ЦЕМУ – семантико-синтактичен тип сказуемо; VAL е името на възможна валентност или препратка към ролевата функция на предлога.

След това се проверява съответствието на семантичните характеристики на актанта със семантичното условие за запълване на валентността на предиката (съответната двойка понятия се проверява за обемна съвместимост).

За да се установи кореферентна връзка, са необходими и достатъчни следните условия:

– „господар” и „слуга” принадлежат към семантичната категория Обект;

– понятията, съответстващи на понятията „господар” и „слуга” са в отношение на обемна съвместимост;

– при предложна връзка се проверява способността на даден предлог да изразява кореферентна връзка.

За установяване на определени предметно-асоциативни връзки са необходими и достатъчни следните условия:

– понятията, съответстващи на термините „господар” и „слуга”, са в отношение на обемна несъвместимост или (ако са съвместими) тези термини са синтактично свързани чрез предлог, който не е в състояние да изрази кореферентна връзка;

– с двойка термини „господар – слуга“ лексикално се свързва някакво предметно отношение
(<автомобиль, кузов>® имат част) и/или (ако връзката е предложна) субектната връзка се свързва с подлог и падеж.

За установяване на неуточнени субектно-асоциативни връзки са необходими и достатъчни истинността на първото и неистинността на второто условие.

Анализът "по извадка" (прецедентен анализ), основан на използването на корпус от предварително маркирани текстове, става все по-важен. Разумно изградената система за анализ трябва да гарантира не само извличането на знания от конкретен текст, но и натрупването на резултати както на синтактично, така и на семантично ниво - за по-нататъшното им използване като прецеденти.

Един от най-мащабните и значими проекти, които се изпълняват в момента, е създаването на Националния корпус на руския език. В него участва голяма група лингвисти от Москва, Санкт Петербург, Казан, Воронеж, Саратов и други научни центрове на Русия.

Националният корпус на руския език е колекция от електронни текстове, оборудвани с обширна лингвистична и метатекстуална информация. Корпусът представя цялото разнообразие от стилове, жанрове и варианти на руския език от 19-20 век. Националният корпус на руския език в момента използва пет вида маркиране: метатекстуално, морфологично (флективно), синтактично, акцентно и семантично. Няма да разглеждаме подробно всички налични видове маркиране, ще се съсредоточим само върху семантичното маркиране.

Със семантичното маркиране на повечето думи в текста се приписват една или повече семантични и словообразувателни характеристики, например „човек“, „субстанция“, „пространство“, „скорост“, „движение“ и др. Маркирането на текста се извършва автоматично с помощта на програмата Semmarkup (автор A.E. Polyakov) в съответствие със семантичния речник на корпуса. Тъй като ръчната обработка на семантично маркирани текстове е много трудоемка, семантичната омонимия в корпуса не се премахва: множество алтернативни набори от семантични характеристики се присвояват на многозначни думи.

Семантичното маркиране се основава на класификационната система на руската лексика, приета в базата данни на лексикографа, която е разработена от 1992 г. в отдела за лингвистични изследвания на ВИНИТИ РАН под ръководството на Е.В. Падучева и Е.В. Рахилина. За корпуса е значително увеличен речниковият запас, разширен е съставът и е подобрена структурата на семантичните класове, добавени са словообразувателни функции.

Речникът на семантичния речник се основава на морфологичния речник на системата „Набиране“ (с общ обем от около 120 хиляди думи), който е разширение на граматическия речник на руския език от A.A. Зализняк. Текущата версия на семантичния речник включва думи от значими части на речта: съществителни, прилагателни, числителни, местоимения, глаголи и наречия.

Лексико-семантичната информация, приписвана на произволна дума в текста, се състои от три групи знаци:

– категория (например собствено име, възвратно местоимение);

– действителни лексико-семантични характеристики (например тематичен клас на лексемата, признаци на причинно-следствена връзка, оценки);

– деривационни (словообразувателни) характеристики (например „умалително“, „прилагателно наречие“).

Лексико-семантичната информация има различна структура за различните части на речта. Освен това всяка от категориите съществителни имена – предметни, непредметни и собствени имена – има своя собствена именна структура.

Същинските лексико-семантични знаци са групирани в следните полета:

– таксономия (тематичен клас на лексема) – за съществителни, прилагателни, глаголи и наречия;

– мереология (посочване на връзката „част – цяло“, „елемент – множество“) – за предметни и необективни имена;

– топология (топологичен статус на обозначения обект) – за имена на субекти;

– причинно-следствена връзка – за глаголи;

– служебно състояние – за глаголи;

– оценка – за предметни и непредметни имена, прилагателни и наречия.

Тематични класове глаголи

Като специално направление в изследването на семантиката на руския език се считат и изследванията на Е.В. Падучева. Най-интересни са произведенията по тематични класове на руски глаголи. Тематичният клас обединява думи с общ семантичен компонент, който е централен в тяхната семантична структура. Има например фазови глаголи, глаголи на възприятие, глаголи на знание, глаголи на емоции, глаголи на вземане на решение, речеви действия, движение, глаголи на звук, екзистенциални глаголи и др.

Думите от един и същ тематичен клас имат някакъв нетривиален общ компонент в тълкуването. Тематичният клас е важен по няколко причини. Първо, тематичният клас често има характерни проявления в синтаксиса - например класът обикновено има характерен член.
Второ, членовете на един и същи тематичен клас са склонни да имат същия набор от семантични производни, тоест понятия, зависими от него.

Статията предоставя най-пълния списък на частните аспектни значения на несвършените глаголи. Разграничават се следните видове значения: действително-дългосрочно (процесът или състоянието продължава в момента на наблюдение); процесни (т.е. просто продължаващи); постоянно-непрекъснат (значението на постоянно свойство или връзка); обичайно (значението на обичайно, т.е. общоприето, повтарящо се действие или събитие); потенциал; множествени (но не обичайни или потенциални); общ фактически неограничен (значението на спряно състояние или неограничен процес); обща фактическа сила (действието е достигнало своя предел); обща фактическа двупосочност (резултатът е постигнат, но е анулиран от противоположно насочено действие); като цяло фактически неефективно (не се знае дали действието е достигнало своя лимит).

Работата анализира предикатни имена, тоест съществителни, образувани от глаголи и прилагателни, като борба, идване, отчаяние, скъперничество. В резултат на това е възможно да се прави разлика между процеси, събития, състояния и свойства.

Например, имената на процеси са приемливи в контекста на глаголи със значение „продължаване“, „продължаване“, тоест „провеждане“ (разговор се провежда, стачка се провежда, актуализация се извършва място). Особен тип процес са текущи действия, тоест целенасочени процеси с активен субект, като борба, проверка, но не като плуване, бягство, бунт, ходене, спане, пушене. Имената на действие са приемливи в контекста на глаголи със значение „произвеждам“, „провеждам“: наблюдението е извършено от група агенти; извършват приемане (подмяна, подбор); ние разследваме.

Всички имена на процеси се използват в контекста на фазови глаголи със значение „започват“, „завършват“, „продължават“: борбата е започнала (дъжд, битка); преследването на дисидентите приключи; Десантът (обсадата) продължава. Имената на действията са приемливи в контекста на фазовите глаголи със значение „начало“, „край“, „продължаване“: влязъл в преговори; приключи с проверката на тетрадките; прекъснато четене; започна, започна, спря (издаване). Контекстът на фазовия глагол е диагностика на имена на процеси, за разлика от имена на събития.

Имената на събития се използват в контекста на глаголи със значение „случи се“, „случи се“: стана земетресение. Събитията се различават от процесите по това, че имат ретроспективен наблюдател. Наблюдателят на процеса е синхронен, следователно, ако имаме процес, тогава глаголът е несвършен, а ако имаме събитие, тогава той е свършен.

Ще пропуснем много други подробности относно разликите между процеси, събития, състояния и свойства, освен да отбележим, че потенциалът за приложение на тези изследвания остава да бъде открит.

По-долу е даден списък с глаголи за възприятие, посочени от E.V. Падучева като един от най-задълбочено изучаваните тематични часове. Изглежда, че за да се установи, че глаголът принадлежи към тематичния клас възприятия, е достатъчно да се уверите, че неговата семантична формула включва компонента „възприятие“. Всичко обаче не е толкова просто. Факт е, че перцептивният компонент лесно се включва в семантиката на глаголи от различни класове. Реалното възприятие прелива в умственото възприятие.

1. Глаголи за движение и състояние, които предполагат наблюдател:

а) глаголи на наблюдавано движение: проблясвам, проблясвам, появявам се, изплъзвам се;

б) глаголи от наблюдавано състояние: побелявам, стърча, стърчи; разпръсвам, стърча, избухвам, разпростирам се, отварям се, изпълнявам;

в) глаголи за излъчване на светлина, миризма, звук: блестят, трептят, светят, миришат, смрадят, звучат.

2. Глаголът да се чуе подсказва на наблюдателя (както в камбаната звънна), но следните глаголи също имат перцептивен компонент: застоя, заглушавам, засенчвам, замлъквам, замлъквам, затихвам, да сливане (както в туниката и сивите панталони почти се сляха със земята).

3. Субектът на възприятие (или наблюдателят) е задължителен участник в ситуации, изразени с каузативни глаголи: изразявам, показвам (той ми показа своята привързаност); подчертаване, разкриване, засенчване, подчертаване, улавяне, скриване, излагане, маркиране (граници), отваряне, маркиране, показване; и техните декаузативи (изразяват, разкриват, изпъкват, отпечатват, излагат, идентифицират, отварят).

4. Има много глаголи, които описват идентификация, която изисква участието на сетивата: идентифицирам, разграничавам, разпознавам, разграничавам, идентифицирам, разграничавам (очертава), разпознавам, разпознавам (както в Не разбирам втората буква).

5. Много глаголи включват перцептивен компонент, но обозначават много конкретно действие или дейност, за което основното нещо е целта, а не участието на възприятието в нейното постигане: инспектира („извършва проверка“), регистрира, търси , намерете, намерете, потърсете, проучете, изобразете, очертайте, проследете, проследете, следете, пазете, дебнете, осветете, скрийте, скрийте, шпионирайте.

6. Всеки глагол за предаване и получаване на информация, например за писане или четене, предполага наличието на сигнал, който трябва да бъде възприет от сетивата.

7. Глаголите show и hide, тъй като тяхната интерпретация включва перцептивен компонент, също могат да бъдат класифицирани като глаголи на възприятието.

8. Глаголите за възприятие включват, наред с други неща, слепи - ослепяват (и слепи в едно от значенията). Те описват загуба на органа на зрението, което води до загуба на способността да се вижда завинаги. Това обаче не включва глагола събуждане, който обозначава временна загуба на способността за възприятие с последващото й връщане.

9. Някои стилистично обагрени глаголи за възприятие: зяпам, зяпам, излюпвам, зяпам, зяпам, виждам, хващам, светна.

10. Тематичната класификация се ръководи от оригиналните значения на думите. Междувременно много глаголи имат перцептивно значение като производно; по-специално, да наблюдавате, да се изправите пред (проблем), да проникнете (тайна), да говорите. Например Белите сгради внезапно изплуваха от тъмнината.

11. Други подобни думи, в които значението на възприятие е производно или контекстуално определено, като хвърляне (поглед, поглед), бързане (в очите), обръщане (поглед, внимание), преминаване през (очи), блясък (поглед) , слайд (гледайте).

12. Глаголи с маркирани методи на действие:

а) начало: прозира, побелява, прозвучава;

б) финитиви: да гледам, да слушам и да шпионирам, да подслушвам;

в) насищащи: гледайте достатъчно, възхищавайте се достатъчно, слушайте достатъчно;

г) глаголи за пълно поглъщане в действието: да гледам - ​​да гледам, да гледам - ​​да гледам;

д) специално ефективни: внимавайте - внимавайте, проследявайте - проследявайте, проследявайте - проследявайте;

е) прекъснато смекчаващи: гледай, гледай; semelfactive: виж.

Глаголите на възприемане, подобно на други тематични класове, имат свои собствени модели на семантична производност, характерни за този конкретен клас.

13. Характерен е семантичният преход – от възприятие към мисловен смисъл. Производното умствено значение се развива, например, в глаголите виждам, гледам, забелязвам, разглеждам (като намек; и ние обмисляме вашето изречение), чувствам, изглеждам, откривам, чувам, представям си, срещам, следвам, появявам се; да се представим, да се видим (същата двусмисленост за съществителното изглежда):

а) От гишето той имаше ясна видимост към верандата на клуба (визуално значение);

б) Виждам го така (ментално значение).

14. Глаголът да свидетелствам етимологично предполага видение, но в контекста на Това свидетелства за неговия изключителен талант има ментално значение; да хвърли светлина означава „да направи по-ясно“, въпреки че е необходима светлина, за да се види. Глаголът да очаквам като цяло е загубил компонента, свързан с вкусовото възприятие, и е станал умствен.

15. Производно умствено значение се среща и при каузативни глаголи. И така, шоуто е глагол на възприятието, но може да има и значението на „доказване“, умствено. Интересно е, че сред производните на виждам има както глаголи на знание, така и глаголи на мнение:

а) Виждам, че мълчиш (знание);

б) той вижда това като пречка (мнение).

16. Глаголът да се появи съчетава перцептивното значение (Нямаше го) с мисловното (Оказа се, че е здрав).

17. Производното значение на речта развива глагола забелязвам; проявява се в комбинация с наречия: забелязахте правилно („правилно казахте“).

18. Глаголите слушам, слушам, подчинявам се, внимавам се характеризират с двусмислеността на „възприемат“ - „подчиняват“.

19. Семантичният преход look ® relate също е редовен, тоест повтарящ се: гледам го просто (отнасям се просто); си затварям очите (наслаждавам се); въпреки (независимо от).

20. Многозначността на look ® relate е характерна за глагола примижавам: а) (гледам настрани, отстрани); б) (гледайте накриво, отнасяйте се с подозрение, изразявайте подозрително отношение с поглед).

21. Преходът към see ® have е представен с примери за find, lose.

22. Преходът от възприятие към междуличностен контакт се отбелязва в глаголите да се срещнем, да погледнем (на светлината), да се видим.

23. Значението на виждането може да избледнее до идеята за обикновен контакт с обект, тоест да бъдеш на едно и също място (Тези стени са виждали много; Крим винаги ще се радва да те види).

24. Глаголите появявам се и изчезвам се характеризират с многозначността видим – съществуващ. Подобна двусмисленост има и в denotate – да се означава; да се изгуби: например пътеката се изгуби в храстите (престана да се вижда) и жизнеността на движенията постепенно се загуби (престана да съществува); перфектната форма има бездна (въпреки че несъвършената форма да изчезнеш означава само да не бъдеш видим: къде беше?). На математически език, ако X съществува, тогава X съществува.

25. Семантичната концепция за възприятие често съществува успоредно с движението: сблъсквам се, спъвам се, блъскам се, блъскам се; хвана се (имам бяла гъба).

Последствието от движението може, напротив, да бъде напускане на зрителното поле, както при скриване, бягство, нараняване.

Интересно е, че за глаголите, изразяващи основните видове възприятие - зрение, слух, обоняние, допир, вкус - е възможно да се идентифицира една единствена парадигма от семантични производни на оригиналната лексема и тя ще бъде по същество еднаква за много езици, което показва древността на този речник и дизайн на данни.

Съществено в този подход е идеята за разделяне на езиковите понятия в определени семантични групи, като се вземе предвид фактът, че тези понятия имат някакъв нетривиален общ семантичен компонент. Елементите на такива групи обикновено имат еднакъв набор от зависими понятия. Речникът в подкрепа на семантичния анализ трябва да работи със значения и следователно да описва свойствата и връзките на понятията, а не на думите. Остава въпросът как правилно да се структурира и представя информацията в такива речници, така че търсенето в тях да е удобно и бързо и освен това е възможно да се вземат предвид промените в естествения език (изчезването на стари и появата на нови понятия ).

Когато се обсъждат проблеми на семантиката, често се споменава принципът на композиционността. Той твърди, че значението на сложния израз се определя от значенията на съставните му части и правилата, прилагани за комбинирането им. Тъй като изречението се състои от думи, се оказва, че неговото значение може да бъде представено чрез набор от значения на думите, включени в него. Но не е толкова просто. Значението на изречението също зависи от реда на думите, формулировката и връзките между думите в изречението, т.е. взема предвид синтаксиса.

Както виждаме, концептуалните диаграми на зависимост предполагат, че в някои случаи принципът на композиционност е нарушен. Грешка е да се твърди, че значението на фразите и фразите може да бъде изразено чрез значенията на съставните им думи. Това не винаги е вярно. Основният проблем при този подход обаче е, че идентифицирането на тематични класове и съставянето на семантични речници е изключително трудоемък процес, силно зависим от индивидуалното възприятие и тълкуване на понятията от конкретен човек.

Мрежови модели на представяне на знания

Тезауруси, семантични мрежи, рамкови и онтологични модели

Тезаурусът е вид речник на обща или специална лексика, който показва семантичните отношения между лексикалните единици. За разлика от обяснителния речник, тезаурусът ви позволява да идентифицирате значението не само с помощта на определение, но и чрез съпоставяне на дума с други понятия и техните групи, поради което може да се използва за попълване на базите от знания на изкуствения интелект системи.

Тезаурусите обикновено използват следните основни семантични отношения: синоними, антоними, хипоними, хипероними, мероними, холоними и пароними.

Синонимите са думи от една и съща част на речта, различни по звук и правопис, но с подобно лексикално значение (смел - смел, безстрашен).

Антонимите са думи от една и съща част на речта, различни по звук и правопис, които имат директно противоположни лексикални значения (добро - зло).

Хипонимът е понятие, което изразява конкретна същност във връзка с друго, по-общо понятие (животно - куче - булдог).

Хиперним е дума с по-широко значение, изразяваща общо, родово понятие, наименование на клас предмети, свойства или характеристики (булдог - куче - животно).

Хипернимът е резултат от логическа операция за обобщение, докато хипонимът е ограничение.

Меронимът е понятие, което е неразделна част от друго (кола - двигател, колело, капак).

Холонимът е понятие, което е едно цяло над другите понятия (двигател, колело, капак - кола).

Меронимията и холонимията като семантични отношения са взаимно обратни една на друга, точно както хипонимията и хиперонимията.

Паронимите са думи, които са сходни по форма, но различни по значение (индиец - индиец).

Пример за тезаурус е WordNet. Основната речникова единица на WordNet е синонимна поредица (синсет), съчетаваща думи със сходни значения. Синсетите се състоят от думи, принадлежащи към същата част на речта като оригиналната дума. Всеки синсет е придружен от малък израз (дефиниция), обясняващ значението му. Синсетите са свързани помежду си чрез различни семантични връзки, например хипонимия, хиперонимия и т.н. Пример с думата pen (писалка) е показан на фигура 1. Може да се види, че в речника има пет различни значения за тази дума; принадлежи към категорията на инструментите за писане и има седем свързани думи: молив, маркер, тебешир за черна дъска, тебешир от восък и др.

WordNet съдържа приблизително 155 хиляди различни лексеми и фрази, организирани в 117 хиляди синсетове. Цялата база данни е разделена на три части: съществителни, глаголи и прилагателни/наречия. Една дума или фраза може да бъде в повече от един синсет и да принадлежи към повече от една категория на частта на речта. По-подробна информация за броя на уникалните думи, синсетове и двойки дума-синсет в базата данни WordNet е дадена в таблица 1.

Предимствата на WordNet пред други подобни ресурси са неговата отвореност, достъпност и наличието на голям брой различни семантични връзки между синсетове. WordNet е достъпен директно с помощта на браузър (локално или през интернет) или C библиотеки.

Има реализации на WordNet за други езици (около 16). Например, EuroWordNet е създаден за европейски езици, връзката между различните езикови версии се осъществява чрез специален междуезиков индекс. WordNet се разработва и за руски език. Трябва да се отбележи, че съществуват методи за предметна класификация на синсетовете на WordNet, тоест определяне на областите на знанието, в които се използват. Такава информация може впоследствие да послужи за намаляване на броя на възможните значения на думите, ако предметът на обработвания документ е известен, като по този начин дава възможност да се намали стойността на грешката при приемане на грешното значение на дадена дума.

Семантичната мрежа е модел на предметна област, който има формата на насочен граф, чиито върхове съответстват на обектите на предметната област, а дъгите (ръбовете) определят връзките между тях. Обектите могат да бъдат понятия, събития, свойства, процеси. По този начин семантичната мрежа отразява семантиката на предметната област под формата на понятия и отношения. Освен това понятията могат да бъдат или екземпляри на обекти, или набори от тях.

Семантичните мрежи се появяват като опит за визуализиране на математически формули. Зад визуалното представяне на семантична мрежа под формата на граф стои математически модел, в който всеки връх съответства на елемент от набора от предмети, а дъгата на предикат. Фигура 2 показва пример за семантична мрежа, взета от Wikipedia.

Терминологията, използвана в тази област, е разнообразна. За да се постигне известна хомогенност, възлите, свързани с дъги, обикновено се наричат ​​графи, а структура, в която има цяло гнездо от възли или където има връзки от различен ред между графите, се нарича мрежа. В допълнение към терминологията, използвана за обяснение, методите на изобразяване също се различават. Някои използват кръгове вместо правоъгълници; някои пишат видове релации над или под дъги, като ги затварят или не ги затварят в овали; някои използват съкращения като O или A, за да обозначат агент или обект; някои използват различни видове стрели.

Първите семантични мрежи са разработени като междинен език за системи за машинен превод. Най-новите версии на семантичните мрежи стават все по-мощни и гъвкави и се конкурират с рамкови системи, логическо програмиране и други езици за представяне на знания.

Въпреки различната терминология, разнообразието от методи за представяне на общи и съществуващи квантори и логически оператори, различни начини за манипулиране на мрежи и правила за извод, можем да идентифицираме значителни прилики, присъщи на почти всички семантични мрежи:

– възлите на семантичните мрежи представляват концепции за обекти, събития, състояния;

– различни възли на едно и също понятие се отнасят до различни стойности, освен ако не са маркирани като принадлежащи към едно и също понятие;

– дъгите от семантични мрежи създават връзки между концептуални възли, знаците над дъгите показват типа връзка;

– някои връзки между понятията представляват семантични роли, като „агент“, „обект“, „реципиент“ и „инструмент“; други означават времеви, пространствени, логически отношения и отношения между отделни изречения;

– понятията са организирани в нива според степента на обобщеност, подобно на йерархията на хиперонимите в WordNet, например, субект ® живо същество ® животно ® хищник.

Обърнете внимание, че сред семантичните отношения, използвани за описание на мрежи, може да има не само семантични отношения, използвани в тезаурусите, но и други видове отношения: функционални (обикновено определени от глаголите произвежда, влияе, ...), количествени (повече от, по-малко от, равно на, ...), пространствено (далеч от, близо до, под, над, ...), времево (по-рано, по-късно, по време на, ...), атрибутивно (има свойство, има стойност ), логически (И, ИЛИ, НЕ) и т.н.

Например семантиката на изречението Иванов има черно BMW може да бъде представена под формата на семантична мрежа, показана на фигура 3.

Въпреки някои различия, мрежите са лесни за четене и обработка от компютър и са визуално и доста универсално средство за представяне на семантиката на естествения език. Формализацията им в конкретни модели на представяне, използване и модифициране на знанието обаче се оказва доста трудоемка, особено при наличието на множество връзки между неговите елементи.

Помислете например за някаква мрежа, описваща изявлението, че Настя помоли Даша за книга. Да кажем, че можем да припишем свойства на дадените обекти: Настя – „усърдна“, Даша – „любознателна“. Между тези обекти има връзка (чрез книгата). Но, освен това, има много други връзки, които съществуват в реалния свят: социален статус (студенти, приятелки - не непременно помежду си), семейни отношения (всеки има родители и/или други роднини) и т.н. Оказва се, че дори за такъв прост пример мрежата може да нарасне до голям размер и в резултат на това търсенето на изход в нея ще бъде твърде трудно.

В сложни семантични мрежи, включващи много концепции, процесът на актуализиране на възли и наблюдение на връзките между тях, както виждаме, усложняват процедурата за обработка на информация. Стремежът да се премахнат тези недостатъци доведе до появата на специални видове семантични мрежи, като например рамкови модели.

Рамкови модели за представяне на знания са предложени от М. Мински.

Рамката е структура за описание на концепция или ситуация, състояща се от характеристиките на тази ситуация и техните значения. Рамката може да се разглежда като фрагмент от семантична мрежа, предназначена да опише понятия с целия набор от присъщите им свойства. Особеността на рамковите модели за представяне на знания е, че всички концепции, описани във всеки от възлите на модела, се определят от набор от атрибути и техните стойности, които се съдържат в слотовете на рамката< имя фрейма, слот 1, слот 2, …, слот N >. Графично това изглежда подобно на семантичната мрежа, но основната разлика е, че всеки възел в модела на рамката има обобщена структура, състояща се от много слотове, всеки от които има име, указател за наследяване, указател за тип данни и стойност .

Слотът е атрибут, свързан с възел в модел, базиран на рамка; той е част от рамка. Името на слота трябва да е уникално в рамката. Указателят за наследяване показва каква атрибутна информация за слотовете в рамка от най-високо ниво се наследява от слотове със същите имена в рамка от по-ниско ниво. Индикаторът за тип данни съдържа информация за типа данни, включени в слота. Обикновено се използват следните типове данни: указател към името на рамката от най-високо ниво, реално число, цяло число, текст, списък, таблица, прикачена процедура и т.н. Стойността на слота може да бъде екземпляр на атрибут, друга рамка или аспект и трябва да съответства на посочения тип данни и условие за наследяване. В допълнение към определена стойност, слотът може да съхранява процедури и правила, които се извикват, когато е необходимо да се изчисли тази стойност. Така един слот може да съдържа не само конкретна стойност, но и името на процедура, която позволява да бъде изчислена с помощта на даден алгоритъм, както и един или повече продукти, с помощта на които се определя тази стойност. Един слот може да съдържа повече от една стойност. Понякога този слот включва компонент, наречен фасет, който определя диапазон или списък от възможните му стойности. Фасетът също така определя граничните стойности на пълнителя на слотовете. Най-често процедурите за добавяне и изтриване на информация са свързани със слотове; те могат да наблюдават присвояването на информация към даден възел и да проверят дали са предприети подходящи действия, когато стойността се промени.

Има примерни рамки (прототипи), съхранени в базата знания, и рамки за примери, които са създадени за показване на реални ситуации въз основа на входящи данни. Рамковите модели са доста универсални, тъй като ви позволяват да отразявате цялото разнообразие от знания за света чрез рамкови структури (за обозначаване на обекти и понятия: заем, залог, сметка), рамкови роли (мениджър, касиер, клиент), рамка -сценарии (фалит, събрание на акционерите, празнуване на имен ден), кадрови ситуации (аларма, злополука, режим на работа на устройството) и др. За представяне на знания под формата на мрежа от рамки има специални езици и софтуер: FRL (Frame Representation Language), KRL (Knowledge Representation Language), frame Kappa shell, PILOT/2 и др.

Най-важното свойство на теорията на фреймовете е наследяването на свойства, заимствани от теорията на семантичните мрежи. Както в рамките, така и в семантичните мрежи, наследяването става чрез ISA. ISA слот сочи към рамка на по-високо ниво на йерархията, от която стойностите на подобни слотове са имплицитно наследени, тоест прехвърлени.

Основното предимство на фреймовете като модел за представяне на знания е тяхното съответствие със съвременните представи за организацията на човешката дългосрочна памет, както и нейната гъвкавост и яснота. Предимствата на рамковите модели на представяне на знания се появяват, когато общите връзки се променят рядко и предметната област има няколко изключения.

Недостатъците на рамковите модели включват тяхната относително висока сложност, която се проявява в намаляване на скоростта на механизма за извод и увеличаване на интензивността на труда при извършване на промени в образуваната йерархия. Ето защо при разработването на рамкови системи се обръща много внимание на методите за визуално показване и ефективните средства за редактиране на рамкови структури.

Може да се отбележи, че обектно-ориентираният подход е развитие на рамковия изглед. В този случай шаблонът на рамката може да се разглежда като клас, екземплярът на рамката като обект. Обектно-ориентираните езици за програмиране предоставят инструменти за създаване на класове и обекти, както и инструменти за описание на процедури за обработка на обекти (методи). Рамковите модели обаче не позволяват организирането на гъвкав механизъм за извод, така че рамковите системи са или обектно-ориентирани бази данни, или изискват интеграция с други инструменти за обработка на знания, например логически модели.

В инженерството на знанието под онтологичен модел се разбира подробно описание на определен предмет или проблемна област, което се използва за формулиране на твърдения от общ характер. Онтологиите ви позволяват да представяте концепции във форма, подходяща за машинна обработка.

В центъра на повечето онтологии са класове, които описват концепции на домейн. Атрибутите описват свойствата на класовете и екземплярите. Тук има аналогии с рамковия подход за формализиране на знанието. Много концепции и принципи на изпълнение, както и графичната форма на представяне в началния етап на структуриране, са подобни в онтологиите на семантичните мрежи. Основната разлика е ориентацията на онтологиите за използване директно от компютър, тоест структурите от данни се описват не на естествен език (както е обичайно в семантичните мрежи и тезаурусите), а на специален формален език. Онтологиите също имат много общо с тезаурусите. Но за разлика от тях, необходимите изисквания към онтологичните модели са вътрешна пълнота, логическа взаимосвързаност и последователност на използваните понятия. Тезаурусите може да не отговарят на тези изисквания. Официални езици като RDF, OWL, KIF, CycL, OCML и други се използват за описание на онтологии.

Обикновено се разграничават следните основни елементи на онтологиите:

– копия;

– класове обекти (концепции);

– атрибути (описват свойствата на класовете и екземплярите);

– функции (описват зависимости между класове и инстанции);

– аксиоми (допълнителни ограничения).

Специализираните (домейн-ориентирани) онтологии са представяне на всяка област на знанието или част от реалния свят. Такава онтология съдържа специфични значения на термини за тази област. Например думата поле в селското стопанство означава парче земя, във физиката означава един от видовете материя, в математиката означава клас алгебрични системи.

Общите онтологии се използват за представяне на концепции, общи за голям брой области. Такива онтологии съдържат основен набор от термини, речник или тезаурус, използвани за описание на термини на домейн.

Съвременните онтологични модели са модулни, т.е. състоят се от множество взаимосвързани онтологии, всяка от които описва отделна предметна област или задача. Онтологичните модели не са статични, те постоянно се променят.

Ако система, която използва специализирани онтологии, се развива, може да се наложи сливането на онтологии. Основният недостатък на онтологичните модели е трудността при комбинирането им. Онтологиите дори на тясно свързани области може да са несъвместими една с друга. Разликата може да възникне поради местната култура, идеология или използването на различен описателен език. Обединяването на онтологии се извършва както ръчно, така и полуавтоматично. Като цяло това е трудоемък, бавен и скъп процес.

Онтологичните модели се използват широко в системи, базирани на знания: експертни системи и системи за подпомагане на вземането на решения. Интересен начин за представяне на знания за времето, като се вземе предвид несигурността в онтологиите, е описан в работата на A.F. Тузовски.

В момента семантичните уеб технологии са доста обещаващи и широко използвани в практиката технологии за представяне на знания. Централната концепция на семантичния уеб е онтологията - модел на предметна област, състоящ се от набор от понятия, набор от екземпляри на понятия и набор от отношения (свойства). Наборът от понятия и връзките между тях дефинира обща схема за съхраняване на данни, представена като набор от изявления за екземпляри на понятия или онтологични аксиоми. Такива прости изявления, наречени триплети, имат формата "субект-предикат-обект". Набор от правила, определени от потребителя, се зареждат в системата за изводи, която въз основа на твърденията, съдържащи се в онтологията, създава нови екземпляри на концепциите и отношенията на онтологията според тези правила.

Един от най-значимите проблеми както за представянето на знанието в контекста на времето, така и за представянето на знанието като цяло, е представянето на знанието за времето и за промените в знанието във времето. Въпреки това, повечето езици за описание на знания, използвани на практика, се основават на предикатна логика от първи ред и използват унарни или двоични отношения. Такива езици включват например OWL и RDF. В този случай, за да се опишат двоични отношения, като се вземе предвид времето, е необходимо да се въведе допълнителен параметър, съответстващ на времето в отношенията. В този случай бинарните отношения се превръщат в троични и надхвърлят описателните възможности на езика.

Друга важна задача е да се опишат знанията за времето, като се вземе предвид възможната непълнота на тези знания. Например, описание на твърдения като: „събитие А ще се случи някъде в бъдещето“. Този проблем обикновено се решава в рамките на модална темпорална логика, като LTL, като се използват определени модални оператори. Но тъй като езикът за описание на знанието OWL се основава на описателна логика, става невъзможно да се използва такова решение за OWL онтологии.

В своята работа A.F. Тузовски предлага да представи модел за описание на знанието за времето в следната форма:

< TU, VU, TP, F, Rul >, Където

1) TU – набор от моменти от време TU = (T È (tØ)), където T е линейно подредено множество, имащо мощност на континуум, върху което е дадена двоичната операция на изваждане T ´ T ® R+, а tØ е специален елемент, съответстващ на „неопределен момент време“;

2) VU – набор от променливи, обозначаващи елементите на набора TU, както и специална променлива tN, съответстваща на текущия момент от времето; стойността на променливата tN постоянно се променя, отразявайки изтичането на времето в дадена система, за да опише времевия контекст, за който се използва предложеният подход;

3) TP – набор от времеви интервали; интервалът от време съответства на подредената двойка t =< ti1, ti2 >, където ti1 и ti2 са елементи на множеството VU, така че ((ti1 £ ti2) Ù (ti1 ¹ tØ) Ù (ti2 ¹ tØ)) Ú (ti1 = tØ) Ú
(ti2 = tØ); По този начин периодът от време съответства на определена област от времевата скала и неговата граница може да бъде определен момент във времето, текущият момент във времето (променлива tN) или неопределен момент във времето tØ, докато период от време с съвпадащите граници (ti1 = ti2) съответстват на определен момент от времето;

4) F – набор от предикати, описващи свойствата на времевите интервали, както и качествените връзки между тях;

5) Rul - набор от правила от формата (G ® H) и (G « H), описващи основните механизми на логическото заключение, включително ограничения върху стойностите на предикатите F, както и сигурността на границите на интервали от време.

Концепцията за времеви интервал е необходима за описание на определени времеви интервали, чиито точни граници са неизвестни, докато не настъпи определено състояние на модела. Можем да кажем, че всеки период от време описва определен интервал от време, чиито точни граници все още не са известни. В този случай може да е налична информация за границите, в които този интервал е гарантирано разположен на времевата скала, и точните граници на интервала, описан от периода от време, могат да станат известни в бъдеще. Поради това се въвеждат два вида граници на времеви интервали: точни и гарантирани. За да се дефинират два типа граници, се използват предикатите EL (точноляво), ER (точнодясно), GL (гарантираноляво) и GR (гарантиранодясно), дефиниращи съответно точната лява/дясна и гарантирана лява/дясна граница на периода от време. Например, предикатът EL (ti, ti1) съответства на твърдението „точната лява граница на интервала ti е моментът от време ti1.“ За простота видът на границата на интервал от време може да бъде обозначен с помощта на различни скоби: напълно дефиниран интервал (и двете му граници са точни); интервал .

Агентът е живият инициатор и контролер на действието.

Адресат – получател на съобщението (може да се комбинира с Бенефициент).

Бенефициент (получател, притежател) е участник, чиито интереси са косвено засегнати по време на ситуацията (получава полза или вреда).

Инструментът е стимул на емоция или участник, с помощта на който се извършва действие.

Източникът е мястото, от което се извършва движението.

Контрагент е сила или съпротивителна среда, срещу която се извършва действие.

Обектът е участник, който се движи или променя по време на събитие.

Пациентът е участник, който претърпява значителни промени.

Резултат е участник, който се появява в резултат на събитие.

Стимулът е външна причина или обект, който предизвиква това състояние.

Целта е мястото, към което се извършва движението.

Преживяващият е участник, преживяващ вътрешно състояние, което не води до външни промени (носител на чувства и възприятия).

Ефекторът е нежив участник, често естествена сила, която причинява промяна в състоянието на пациента.

В съответствие с броя на аргументите и техните семантични свойства наборът от вербални лексеми може да бъде разделен на класове. Например, разгледайте следните ролеви типове глаголи: глаголи за физическо въздействие (кълцане, пилене, рязане); глаголи на възприемане (виждам, чувам, чувствам); глаголи на речта (вик, шепот, мърморене). Във всеки клас има по-точно разделение. Сред глаголите на физическо въздействие глаголите от формата глагол (агент, инструмент, обект) имат подобна семантична предикатно-аргументна структура: счупване - счупване, огъване - огъване, сгъване - огъване, разбиване - разбиване на парчета, напукване - разцепване, и т.н. Друга предикатно-аргументна структура, характерна за глаголите от глаголната форма (Агент, Инструмент, Цел): удар - удар, шамар - шамар, удар - удар, удар - удар (за нещо), удар - удар и др.

Може да се отбележи, че има корелации между морфологични падежи, предлози, синтактични роли, от една страна, и семантични роли, от друга страна, например, реже с нож, работи с Джон, пръска с боя. Освен това трябва да се има предвид, че една предикатна дума не може да има два актанта с еднаква семантична роля. Разликите в наборите от роли засягат главно периферните семантични роли (Изпълнител, Стимул, Източник) или се свеждат до обединяването/фрагментирането на основните роли (Агент срещу Агент и Изпълнител; Адресат срещу Адресат, Получател и Бенефициент; Пациент/Тема/Обект спрямо пациент, тема и резултат).

В своята работа C. Fillmore дори предлага правило за индиректно картографиране на семантични роли в синтактични: ако сред аргументите има агент, той става субект; при липса на Агент, ако има Инструмент, той става субект; в отсъствието на агент и инструмент субектът става обект. От тук естествено възниква йерархия на семантичните роли. Най-известните йерархии на семантични роли са: Агент > Инструмент > Пациент; Агент > Източник > Цел > Инструмент > Тема > Място; Агент > Бенефициент > Експериентор > Инструмент > Тема > Място и някои други Йерархията на семантичните роли е изградена по такъв начин, че е възможно да се отрази степента на тематична принадлежност на аргументите (тематичност), така че прагматично най-важните семантични роли са разположени в левия край на йерархията, а в десния – семантични роли, които не се характеризират с висока актуалност.

Първоначално семантичните роли трябваше да се считат за примитиви, които не подлежат на допълнителен анализ, който би могъл да разкрие тяхната вътрешна структура. В този случай обаче възникват редица проблеми. Първо, в резултат на все по-внимателен семантичен и синтактичен анализ има неограничено увеличение на списъка с роли. Второ, неструктурираните ролеви списъци не ни позволяват да правим прогнози за възможните ролеви типове на глаголите или да обясняваме липсата на незасвидетелствани типове. Следователно семантичната теория на ролите предлага определяне на ролите по отношение на отличителни характеристики или прото-роли. Например Д. Даути предлага да се подчертаят следните свойства на проторолата на агента: доброволно участие в събитие или състояние; е съзнателен и/или възприемащ участник; инициира събитие или промяна на състоянието за друг участник; ходове (спрямо точка в пространството или друг участник); съществува независимо от събитието, обозначено с глагола.

За съжаление, в момента не е възможно да се установи еднозначно съответствие между семантичните роли и случаите, т.е. от функционална гледна точка категорията случай е разнородна. Ситуацията се усложнява допълнително от факта, че самите роли са нетривиално свързани помежду си, а в естествените езици са често срещани такива генеративни техники като метафора и метонимия, които пораждат много нови значения и по принцип не могат да бъдат отразени в статичен лексикон.

Логически модели на представяне на знания

Основната идея на подхода при конструирането на логически модели за представяне на знания е, че цялата информация, необходима за решаване на приложни проблеми, се разглежда като набор от факти и твърдения, които са представени под формата на формули в някаква логика. Знанието се отразява от набор от такива формули, а получаването на нови знания се свежда до прилагането на процедури за логически изводи. Логическите модели на представяне на знания се основават на концепцията за формална теория, дефинирана от кортежа S =< B, F, A, R>, където B е изброимо множество от основни символи (азбука); F – множество наречени формули; A – избрано подмножество от априорни верни формули (аксиоми); R е краен набор от релации между формули, наречени правила за извод.

Основният подход за представяне на значението в компютърната лингвистика включва създаване на представяне на значение във формална форма. Такова представяне може да се нарече език за представяне на смисъл. Необходим е представителен език, за да се преодолее пропастта между естествения език и общите познания за света. И тъй като този език е предназначен да се използва за автоматична обработка на текст и при създаването на системи с изкуствен интелект, е необходимо да се вземат предвид изчислителните изисквания на семантичната обработка, като необходимостта да се определи истинността на твърденията, да се поддържа недвусмисленост на представяне, представят твърдения в канонична форма, осигуряват логически изводи и са изразителни.

Естествените езици имат голямо разнообразие от техники, които се използват за предаване на значение. Сред най-важните е способността за предаване на предикатно-аргументна структура. Имайки предвид горното, откриваме, че логиката на предикатите от първи ред е много подходяща като инструмент за представяне на значението на изявленията. От една страна, той е относително лесен за разбиране от хората, от друга страна, той се поддава добре на (изчислителна) обработка. С помощта на логика от първи ред могат да бъдат описани важни семантични класове, включително събития, време и други категории. Все пак трябва да се помни, че твърденията, съответстващи на понятия като вярвания и желания, изискват изрази, които включват модални оператори.

Семантичните мрежи и рамки, обсъдени в предишния раздел, могат да се разглеждат в рамките на предикатната логика от първи ред. Например значението на изречението Имам книга може да бъде написано по четири различни начина, като се използват четири различни езика за представяне на значение (вижте фиг. 4, номерирането съответства на реда на фигурата): 1) концептуална зависимост диаграма; 2) кадрово представяне; 3) семантична мрежа; 4) предикатно смятане от първи ред.

Въпреки че тези четири подхода са различни, на абстрактно ниво те представляват общоприето фундаментално обозначение, че представянето на значението се състои от структури, съставени от много символи. Тези символни структури съответстват на обекти и отношения между обекти. И четирите представяния се състоят от символи, съответстващи на „говорещ“, „книга“ и набор от отношения, обозначаващи притежанието на един от друг. Важното тук е, че всички тези четири идеи позволяват да се свържат, от една страна, изразните характеристики на естествения език и, от друга страна, реалното състояние на нещата в света.

Логическите модели за представяне на знания имат редица предимства. Първо, тук като „основа“ се използва класическият апарат на математическата логика, чиито методи са доста добре проучени и формално обосновани. Второ, има доста ефективни процедури за извличане на синтактично правилни изрази. Трето, този подход ви позволява да съхранявате само набор от аксиоми в бази от знания, а цялото друго знание (включително факти и информация за хора, обекти, събития и процеси) може да бъде получено от тези аксиоми съгласно правилата за извод.

Езикът за представяне на смисъл, както всеки език, има свой собствен синтаксис и семантика. Фигура 5 дава описание на безконтекстната граматика за предикатно смятане от първи ред, предложена в .

Обмислете представянето на значението на категории, събития, време, аспекти и вярвания, дадени в книгата.

Представяне на категория. Под категория се разбира група от думи, обединени от обща характеристика, подобно на това как е организирана в тезаурусите. Думите със семантика, подобна на предикат, често съдържат ограничения за избор, които обикновено се изразяват под формата на семантични категории, където всеки член на категорията има набор от подходящи характеристики.

Най-простият начин за представяне на категории е да се създаде унарен предикат за всяка категория. След това обаче ще бъде трудно да се правят изявления за самите категории. Помислете за следния пример. Да речем, използвайки езика на логиката на предикатите от първи ред, трябва да представите значението на твърдението: „Хари Потър“ е най-популярната детска книга. Това означава, че трябва да намерите най-често срещания обект на категория във формата MostPopular (HarryPotter, ChildrensBook). Тази формула не е истинска логическа формула от първи ред, тъй като аргументите в предикатите по дефиниция трябва да бъдат термини, а не други предикати. За да се реши този проблем, всички понятия, които участват в изявлението, могат да бъдат представени като пълноценни обекти, тоест категорията ChildrensBook може да бъде представена като обект наравно с HarryPotter. Членството в такава категория ще бъде обозначено от връзката ISA (HarryPotter, ChildrensBook). Отношението ISA (е a) показва връзката между обектите и категориите, към които принадлежат тези обекти. Тази техника може да се използва за създаване на йерархии на категории. Например използваме връзката AKO (Детска книга, Книга). Тук отношението AKO (вид) обозначава включването на една категория в друга. Разбира се, за по-голяма надеждност категориите трябва да се характеризират с голям набор от факти, тоест категориите трябва да се дефинират като множества.

Представяне на събития. За да си представим значението на дадено събитие, достатъчно е да го разгледаме под формата на предикат от набор от аргументи, които изпълняват определени роли и са необходими за описание на ситуацията. Примери за такива предикати са дадени в първия раздел (там те са получени от лексикални функции, предложени от I.A. Melchuk). Друг пример: Резервация (Слушател, Днес, 20:00 ч., 2). Тук аргументите са обекти като човек, ресторант, ден, час и брой места за резервация в ресторанта. За глаголите такова представяне може да се получи, ако приемем, че аргументите съответстват на синтактични актанти. Има четири проблема с този подход:

– определяне на правилния брой роли за всяко събитие;

– представяне на факти за роли, свързани със събитието;

– необходимостта да се гарантира, че всички правилни заключения могат да бъдат получени директно от такова представяне на събитието;

– необходимостта да се гарантира, че от представянето на събитието не може да се направи неправилно заключение.

Например глаголът "е" може да има от един до четири актанта, в зависимост от ситуацията, описана от изречението. Следователно не е ясно предварително какво трябва да бъде населеното място на предиката. В края на краищата в изчислението на предикатите от първи ред броят на аргументите трябва да бъде фиксиран.

Едно решение е да приемем, че такива ситуации се обработват на синтактично ниво. Възможно е да се разгледат отделни подкатегории за всяка от конфигурациите на аргументите. Семантичният аналог на този метод е да се създадат възможно най-много предикати, всеки от които ще съответства на отделни ситуации. Името на предиката е същото, но броят на аргументите е различен:
Eating1 (w) – ядох; Eating2 (w, x) – ядох сандвич; Eating3 (w, x, y) – ям сандвич за обяд; Eating4 (w, x, y, z) – Ядох сандвич за обяд у дома. Следователно те се считат за различни. Този подход ще заобиколи проблема с броя на аргументите, но не е ефективен. Освен предложените имена на предикатите, нищо не ги обединява в едно събитие, въпреки че тяхната логическа връзка е очевидна. Оказва се, че някои логически връзки не могат да бъдат получени на базата на предложените предикати. Освен това ще трябва да потърсите тези логически връзки в базата от знания.

Този проблем може да бъде решен чрез използване на семантични постулати. Те свързват изрично семантиката на предикатите. Например, " w, x, y, z Хранене4 (w, x, y, z) Þ Хранене3 (w, x, y).

Предикатите могат да отразяват морфологична, синтактична и семантична информация. Примери за такива семантични постулати са формули, съдържащи някои лексикални предикати от първия раздел. Дадени са семантични постулати, съдържащи морфологични и синтактични характеристики на конструкцията на думи и изречения на руски език. Примери за семантични постулати, които носят семантичен товар, са намерени в предишния раздел.

Обърнете внимание, че не трябва да бъркаме семантиката на изявление в естествения език и семантиката на предиката, който въвеждаме, за да отразим семантиката на изявлението. Семантичните постулати отразяват семантиката на предикатите, тоест семантичните връзки между предикатите, които въведохме.

Ясно е, че този подход за откриване на семантични връзки между предикати е подходящ за малки домейни и има проблеми с мащабируемостта. Би било по-удобно да се каже, че тези предикати се отнасят до един предикат с липсващи аргументи на някои позиции. В този случай можете да правите без семантични постулати. Но този метод има и недостатък. Например, ако разгледаме предиката Хранене (w, x, y, z) и приемем, че една от думите от набора (Закуска, Обяд, Вечеря) трябва да присъства като трети аргумент, тогава кванторът на съществуване, присвоен на друг променлива ще означава съществуване на специфична храна, свързана с всяко хранене, което не е вярно.

Нека да разгледаме подходящ пример. Нека напишем три изявления (обядвах, ядох у дома и изядох сандвич за обяд у дома), използвайки логика от първи ред:

$w, x Хранене (Говорител, w, Обяд, x)

$w, x Хранене (Говорител, w, x, Дом)

$ w Хранене (Говорител, w, Обяд, Дом).

Да приемем, че е необходимо да се получи трета формула от първите две формули, отнасящи се до едно събитие. Независимите събития обядвах и ядох у дома не ни позволяват да заключим, че обядвах у дома. Както при представянето на категорията, можем да разрешим този проблем, като третираме събитията като обекти, така че да могат да бъдат количествено определени и свързани с други обекти, използвайки набори от определени отношения. Сега, според този подход, ще се получи следното представяне.

Заради предложението обядах

$ w ISA (w, Хранене) Ù Ядящ (w, Говорещ) Ù Ядящ (w, Обяд).

За изречението ядох вкъщи

$ w ISA (w, Хранене) Ù Ядящ (w, Говорещ) Ù Място (w, Дом).

За изречението ядох сандвич за обяд вкъщи

$ w ISA (w, Хранене) Ù Ядещ (w, Говорещ) Ù Яден (w, Сандвич) Ù Ядено (w, Обяд) Ù Място (w, Дом)

Представеният подход ни позволява да се отървем от необходимостта да посочим фиксиран брой аргументи в предиката, независимо от ролите и другите актанти. Няма други роли, които да не са споменати в изречението, а логическите връзки между семантично свързани предикати не изискват използването на семантични постулати.

Представяне на времето. Времевата логика се използва за описване на последователности от събития и техните взаимоотношения във времева линия. В естествените езици такъв инструмент е времето на глагола. Едно събитие може да се счита за предхождащо друго, ако потокът от време води от първото събитие до второто. Тук възникват познатите ни концепции за минало, настояще и бъдеще.

Темпоралната логика използва два типа оператори: логически и модални. Обичайните оператори на логиката на пропозиционалното смятане се използват като логически оператори: конюнкция, дизюнкция, отрицание и импликация. Модалните оператори се дефинират по следния начин.

N j – Следващ: j трябва да е истина в състоянието, непосредствено следващо даденото.

F j – Бъдеще: j трябва да стане истина в поне едно състояние в бъдещето.

G j – Глобално: j трябва да е вярно във всички бъдещи състояния.

A j – Всички: j трябва да се изпълни на всички клонове, започващи с този.

E j – Съществува: Има поне един клон, на който j се изпълнява.

j U y – До (силно): y трябва да се изпълни в някакво състояние в бъдеще (възможно в текущото), свойството j трябва да се изпълни във всички състояния до посоченото (не включително).

j R y – Освобождаване: j освобождава y, ако y е истина, докато първият път j стане истина (или винаги, ако не настъпи такъв момент). В противен случай j трябва да стане вярно поне веднъж, преди y да стане вярно първия път.

Представяне на аспекти. Глаголите се използват за описание на действия в естествените езици. Американският философ Z. Vendler през 1957 г. предлага модел за разделяне на глаголите според лексикалните аспекти. Той идентифицира четири класа:

– стативи (състояния) – глаголи, които описват статични състояния, които нямат крайна точка (например „познавам“, „обичам“);

– дейности (активности) – глаголи, описващи състояния, които са динамични и нямат крайна точка (например „бягам“, „карам“);

– постижения (постижения) – глаголи, описващи събития, които имат крайна точка и са постепенни (например „нарисувай картина“, „построи къща“);

– постижения (постижения) – глаголи, които описват събития, които имат крайна точка и се случват моментално (например „разпознавам“, „забелязвам“).

Таблица 2 показва сравнителна таблица на класовете на Wendler за английски глаголи, взета от .

Както можете да видите, продължаването на действието е характерно за дейностите и постиженията и отсъства в действията и постиженията. Можете да кажете Кипяше (дейност) и пишех писмо (ангажимент), но не можете да кажете Съществуваше (изявление) и намирах книга (постижение). Постиженията не се комбинират с обстоятелствата на продължителността. Можете да кажете, че съществуваше два часа (изявление), но не можете да кажете, че го намерих два часа (постижение).

Постиженията и постиженията описват целенасочени действия; те се комбинират с обстоятелствата на датата на завършване, за разлика от изявленията и дейностите. Можете да кажете, че съм написал писмо за два часа (ангажимент), но не можете да кажете, че съм ходил за два часа (активност).

Представяне на вярвания, желания и намерения. За изразяване на отношението на говорещия към информацията, която се съобщава в изявления на естествен език, се използват думи като вярвам, искам, вярвам, представям си и др. Такива твърдения не описват обективна картина на света, а характеристиките на личното възприятие на говорещия, неговите „вътрешни“ идеи за света. Помислете за твърдението, че смятам, че Джон чете „Хари Потър“. Погрешно е да се опитваме да представим значението му с помощта на предикатна логика: вярвам (говорещ, четещ (Джон, Хари Потър). Тук вторият аргумент трябва да е термин, а не формула. Тази синтактична грешка води до семантична грешка. В логиката от първи ред , предикатите свързват обекти, а не връзка между тях. Стандартният начин за преодоляване на този проблем е да добавим оператори, които ни позволяват да правим необходимите изявления. Ако въведем оператора Believes, който приема формули като аргументи, тогава получаваме следното представяне :

Вярва (Говорящ, $ x ISA (x, Четене) Ù Четец (x, Джон) Ù Четещ (x, ХариПотър)).

Не може да се каже, че такова представяне е написано от гледна точка на предикатно смятане от първи ред, но е потвърждение, че в езика има група глаголи, които играят специална роля в семантичния анализ. В автоматизираните системи за анализ понякога е необходимо да се проследят вярванията и намеренията на потребителите. Ситуацията се усложнява от факта, че вярванията, желанията и намеренията могат да се променят по време на диалога.

Въведеният оператор се нарича модален. Има различни модални оператори. Темпоралната модалност вече беше спомената малко по-рано, когато се говори за представянето на времето в изказванията. В допълнение към темпоралната има пространствена модалност, логиката на знанието („известно е, че“), логиката на доказуемостта („възможно е да се докаже това“) и др. Логиката, разширена от модални оператори, се нарича модална логика. В момента в тази област остават много сложни неизследвани въпроси. Как работи изводът в присъствието на специфични модални оператори? Към какви типове формули могат да се прилагат определени оператори? Как модалните оператори взаимодействат с кванторите и логическите връзки? Тези и други въпроси остават да бъдат проучени. Тук няма да се спираме на тях.

Извеждането на синтактично правилни твърдения в логически модели за представяне на знания се основава на правилото за разделяне, разработено от Дж. Робинсън през 1965 г. Той гласи, че ако група изрази, образуващи предпоставка, е вярна, тогава прилагането на правило за извод е гарантирано, че ще произведе верен израз като заключение. Резултатът от прилагането на правилото за разделяне се нарича резолвент.

Методът на разрешаване (или правилото за елиминиране на противоречията) ви позволява да докажете истинността или неистинността на изложено предположение чрез противоречие. В метода на разделяне набор от предложения обикновено се разглежда като съставен предикат, който съдържа няколко предиката, свързани с логически функции и квантори за съществуване и универсалност. Тъй като предикатите с едно и също значение могат да имат различни форми, изреченията трябва първо да бъдат доведени до унифицирана форма (дизюнктивна или конюнктивна нормална форма), в която са премахнати квантори на съществуване, универсалност, символи на импликация, еквивалентност и т.н. съдържа връзка от дизюнкти от лявата страна. Следователно, привеждането на предпоставките, използвани за доказателство, във форма, която представлява конюнкции на дизюнкти, е необходима стъпка в почти всеки алгоритъм, който прилага логически изводи, базирани на метода на разрешаване.
Следните стъпки се следват в процеса на извод, като се използва правилото за разрешаване.

1. Операциите на еквивалентност и импликация се елиминират:

A « B = (A ® B) Ù (B ® A);

A ® B = Ø A Ú B.

2. Операцията на отрицание се движи във формулите, използвайки законите на De Morgan:

Ø (A Ù B) = Ø A Ú Ø B;

Ø (A Ú B) = Ø A Ù Ø B.

3. Логическите формули се свеждат до дизюнктивна форма:

A Ú (B Ù C) = (A Ú B) Ù (A Ú C).

В логиката на предикатите, за да се приложи правилото за разделяне, е необходимо да се извърши по-сложна трансформация на логически формули, за да се сведат до система от дизюнкти. Това се дължи на наличието на допълнителни синтактични елементи, главно квантификатори, променливи, предикати и функции.
Алгоритъмът за обединяване на предикатни логически формули се състои от следните стъпки.

1. Елиминиране на операциите за еквивалентност.

2. Елиминиране на импликативни операции.

3. Въвеждане на операции за отрицание във формули.

4. Елиминиране на кванторите на съществуване. Това може да се случи на третата стъпка поради прилагането на законите на Де Морган, а именно отрицанието на $ се променя на ", но може да възникне и обратното заместване. След това, за да елиминирате $, продължете по следния начин: всички появявания на някаква свързана променлива с екзистенциален квантор, например ($ x), се заменят във формулата с нова константа, например a. Тази константа представлява някаква (неизвестна) стойност на променливата x, за която твърдението, написано с тази формула, е вярно. важното е, че за всички места, където x присъства, ще има една и съща стойност на a се замества, дори ако тя е неизвестна в момента.

5. Общите квантори се поставят на първо място във формулите. Това също не винаги е проста операция; понякога включва преименуване на променливи.

6. Разкриване на връзки, уловени вътре в дизюнкции.

След като изпълните всички стъпки на описания алгоритъм за обединяване, можете да приложите правилото за разрешаване.

Това беше правилото за разделителна способност, което послужи като основа за създаването на езика за програмиране Prolog.
В Prolog фактите се описват под формата на логически предикати със специфични стойности. Правилата за извод се описват от логически предикати с дефиниция на правила за извод под формата на списък от предикати върху бази от знания и процедури за обработка на информация. Самият интерпретатор на Prolog реализира изход, подобен на описания по-горе. За да се инициират изчисления, се изпълнява специална заявка към базата знания, на която системата за логическо програмиране генерира отговори „вярно“ и „невярно“.

Методът за разрешаване е лесен за програмиране, това е едно от най-важните му предимства, но е приложим само за ограничен брой случаи, тъй като за неговото приложение доказателството не трябва да има голяма дълбочина и броят на потенциалните разрешения не трябва да бъде голям.

За да направите инструмента за предикатно смятане от първи ред по-гъвкав, той може да бъде разширен с ламбда смятане. Ламбда смятането е език от по-висок ред от предикатното смятане от първи ред. В него ламбда функцията може да работи не само с променливи, но и с предикати като аргументи. Въпреки това, използването на ламбда изрази не увеличава формално изразителната сила на логиката от първи ред, тъй като всяка конструкция, съдържаща ламбда израз, може да бъде преобразувана в еквивалентна форма без него.

След като езикът Prolog придоби голяма популярност, в началото на 80-те години на миналия век се появи терминът "компютри от пето поколение". По това време се очакваше създаването на следващо поколение компютри, фокусирани върху разпределени изчисления. В същото време се смяташе, че петото поколение ще стане основа за създаването на устройства, способни да имитират процеса на човешкото мислене. В същото време възниква идеята за създаване на хардуерна поддръжка на паралелни релационни бази данни Grace и Delta и паралелен логически извод (Parallel Inference Engine, PIE), базиран на принципите на езика Prolog. Всеки блок за извод сигнализира текущото си работно натоварване, така че работата да може да бъде прехвърлена към блока за извод с най-малко натоварване. Но, както знаем, подобни опити не позволиха създаването на изкуствен интелект, а само послужиха като още едно потвърждение, че човешкото мислене все още не е достатъчно проучено.

Логическите модели на представяне на знания ви позволяват да проверите синтактичната коректност на изявление. Въпреки това, използвайки правилата, които определят синтаксиса на даден език, е невъзможно да се установи истинността или неистинността на дадено твърдение. Едно твърдение може да бъде конструирано синтактично правилно, но да се окаже напълно безсмислено. Освен това логическите модели са трудни за използване при доказване на разсъждения, които отразяват спецификата на конкретен предметен проблем, поради високата степен на еднородност.

Системи с компоненти за семантичен анализ

Като част от проекта Open Cognition се разработва анализаторът Link Grammar Parser, който отговаря за обработката на естествен език. Link Grammar Parser започва да се разработва през 90-те години. в университета Карнеги Мелън. Този подход се различава от класическата теория на синтаксиса. Системата присвоява синтактична структура на изречение, което се състои от набор от етикетирани връзки (конектори), свързващи двойки думи. Link Grammar Parser използва информация за типовете връзки между думите.

Анализаторът разполага с речници, съдържащи около 60 000 речникови форми. Позволява ви да анализирате голям брой синтактични структури, включително множество редки изрази и идиоми. Link Grammar Parser е доста стабилен, той може да пропусне част от изречение, което не разбира, и да определи някаква структура за останалата част от изречението. Анализаторът може да работи с непозната лексика и да прави разумни предположения (въз основа на контекста и правописа) относно синтактичната категория непознати думи. Има данни за собствени имена, числови изрази и различни препинателни знаци.

Анализът в системата протича на два етапа.

1. Изграждане на множество синтактични представяния на едно изречение. На този етап се разглеждат всички варианти за връзки между думите и се избират тези, които удовлетворяват критерия за проективност (връзките не трябва да се пресичат) и критерия за минимална свързаност (резултантната графа трябва да съдържа най-малък брой свързани компоненти; свързан компонент на граф е определено множество от върхове на графа, така че за всеки два върха от това множество има път от единия до другия и няма път от връх на това множество до връх извън това множество).

2. Постобработка. Проектиран да работи с вече изградени алтернативни структури на изреченията.

Получените диаграми по същество са аналог на дърветата на подчинение. В подчинените дървета можете да зададете въпрос от главната дума в изречението към второстепенната. Така думите са подредени в дървовидна структура. Анализаторът може да създаде две или повече схеми за анализ на едно и също изречение. Това явление се нарича синтактична синонимия.

Основната причина, поради която анализаторът се нарича семантична система, е уникално пълен набор от връзки (около 100 основни, някои от които имат 3-4 опции).
В някои случаи внимателната работа върху различни контексти накара авторите на системата да преминат към почти семантични класификации, изградени изключително върху синтактични принципи. По този начин се разграничават следните класове английски наречия: ситуационни наречия, които се отнасят до цялото изречение като цяло (клаузално наречие); наречия за време (времеви наречия); уводни наречия, разположени в началото на изречението и разделени със запетая (отвори); наречия, модифициращи прилагателни и др.

Сред предимствата на системата трябва да се отбележи, че организацията на процедурата за намиране на варианти на синтактично представяне е много ефективна. Конструкцията не протича отгоре надолу (отгоре надолу), а не отдолу нагоре (отдолу нагоре), но всички хипотези на връзки се разглеждат паралелно: първо, всички възможни връзки се изграждат с помощта на речникови формули, а след това възможни подгрупи от тези връзки са идентифицирани. Това, първо, води до алгоритмична непрозрачност на системата, тъй като е много трудно да се проследят всички връзки наведнъж, и второ, не води до линейна зависимост на скоростта на алгоритъма от броя на думите, а до експоненциален, тъй като множеството от всички варианти на синтактични структури в изречение от думи в най-лошия случай е еквивалентно на множеството от всички основни дървета на пълен граф с върхове.

Последната функция на алгоритъма принуждава разработчиците да използват таймер, за да спрат незабавно процедура, която се изпълнява твърде дълго. Въпреки това, всички тези недостатъци са повече от компенсирани от лингвистичната прозрачност на системата, в която валентностите на една дума се предписват с еднаква лекота, а редът на събиране на валенции в рамките на алгоритъма не е фундаментално уточнен; връзките се изграждат така, сякаш паралелно, което е в пълно съответствие с езиковата ни интуиция.

За всяка дума речникът записва с какви връзки може да се свърже с други думи в изречението. Конекторът се състои от името на типа връзка, в която може да влезе въпросната единица за анализ. Само основните, най-важни връзки са повече от 100. За да се посочи посоката на връзката, отдясно на конектора е поставен знак „+“, а отляво знак „–“. Леви и десни конектори от един и същи тип образуват връзка. На една дума може да се присвои конекторна формула, съставена с помощта на определени връзки.

Нека да отбележим и недостатъците на Link Grammar Parser.

1. Практическото тестване на системата показва, че при анализ на сложни изречения, чиято дължина надвишава 25–30 думи, е възможна комбинаторна експлозия. В този случай резултатът от работата на анализатора е „паническа“ графика, обикновено произволен вариант на синтактична структура, която е неадекватна от лингвистична гледна точка.

2. Прилагането на описаните по-горе идеи е трудно за флективни езици като руския поради значително нарастващия обем речници, които възникват поради морфологичното развитие на флективните езици. Всяка морфологична форма трябва да бъде описана с отделна формула, където долният индекс на конектора, включен в нея, трябва да осигурява процедура за съпоставяне. Това води до по-сложен набор от конектори и увеличаване на техния брой.

Проектът Open Cognition, в рамките на който се разработва Link Grammar Parser, е отворен и безплатен, което е голямо предимство за изследване. Доста подробно описание и изходен код могат да бъдат намерени на уебсайта. Open Cognition продължава да се развива и днес, което също е важно, защото има възможност за взаимодействие с разработчиците. Заедно с Link Grammar се разработва анализаторът RelEx, който ви позволява да извличате семантични връзки на зависимост в изявления на естествен език и в резултат на това изреченията се представят под формата на дървета на зависимости. Той използва няколко набора от правила за възстановяване на графиката, като взема предвид синтактичните връзки между думите. След всяка стъпка, съгласно набор от правила за съпоставяне, тагове на структурни характеристики и връзки между думите се добавят към получената графика. Въпреки това, някои правила, напротив, могат да намалят графиката. Ето как се трансформира графиката. Този процес на прилагане на последователност от правила наподобява метода, използван в граматиките на ограниченията. Основната разлика е, че RelEx работи с графично представяне, а не с прости набори от тагове (обозначаващи връзки). Тази функция ви позволява да прилагате по-абстрактни трансформации, когато анализирате текстове. С други думи, основната идея е да се използва разпознаване на образи за трансформиране на графики. За разлика от други парсери, които разчитат изцяло на синтактичната структура на изречението, RelEx е по-фокусиран върху представянето на семантиката, по-специално това се отнася до обекти, сравнения, въпроси, разделяне на анафори и лексикална неяснота на думите.

Система за набиране

„Набиране“ е автоматична руско-английска система за превод, разработена от 1999 до 2002 г. в рамките на проекта за автоматична обработка на текст (AOT). По различно време в работата по системата са участвали 22 специалисти, повечето от които известни лингвисти.
В основата на системата „Набиране“ беше френско-руската система за автоматичен превод (FRAP), разработена във Всеруския център за образование и наука съвместно с Московския държавен педагогически институт на име. М. Торез през 1976–1986 г. и системата за анализ на политически текстове на руски език „Polytext”, разработена в Центъра за информационни изследвания през 1991–1997 г.

Системата Polytext беше насочена към анализиране на официални документи на руски език и съдържаше пълна верига от текстови анализатори: графематични, морфологични, синтактични и частично семантични. В системата „Набиране“ графематичният анализ беше частично заимстван, но адаптиран към новите стандарти за програмиране. Програмата за морфологичен анализ беше написана наново, тъй като скоростта на работа беше ниска, но самият морфологичен апарат не се промени.

На графематично ниво константите са графематични дескриптори. Например LE (лексема) - присвоява се на последователности, състоящи се от знаци на кирилица; ILE (чужда лексема) – присвоява се на последователности от латински букви; CC (цифров комплекс) – присвоен на последователности, състоящи се от числа; CBC (цифрово-буквен комплекс) - присвоен на последователности, състоящи се от цифри и букви и др.

На морфологично ниво за нотация се използват грамеми - граматични характеристики, които свързват словоформа с конкретен морфологичен клас. Различните грами от една и съща категория се изключват взаимно и не могат да бъдат изразени с една дума. Например zhr - женски род, tv - инструментален падеж, pl - множествено число, но - неодушевено, sv - перфектен вид, dst - деятелен залог, ne - преходност на глагола, pvl - повелителна форма на глагола, nst - сегашно време на глагола и пр. d.

Анализът на фрагментацията има за цел да раздели изречението на неразделни фрагменти (синтактични единици), по-големи фрази или равни на тях (синтактична група) и да установи частична йерархия върху множеството от тези единици. Възможни видове фрагменти: главни изречения, подчинени изречения като част от сложни, причастни, причастни и други изолирани фрази. За всеки фрагмент се знае кои фрагменти са директно вложени в него и в кои той е директно вложен.

Системата FRAP съдържаше пълна верига от анализ на текст до семантичен анализ, който беше само частично приложен. В системата FRAP е разработен и тестван семантичен апарат, въз основа на който е създаден специален метод за семантичен анализ в системата „Набиране“ - методът на пълните опции. FRAP не съдържаше механизми за структурни оценки на семантичното представяне, тоест методи не само за едно появяване на текстов елемент, но и за цялата структура като цяло. Идеята на метода на пълните варианти е, че анализът трябва ясно да разделя вариантите на анализ, които възникват на различни етапи, и декларативните лингвистични правила (частични модели), които конструират и оценяват отделните варианти. Този подход, използван преди това само за предсемантични анализатори, сега, поради развитието на компютърната мощ, стана възможно да се прехвърли към семантиката, като по този начин се увеличи нивото на разделяне на процедурните и декларативните части на системата. Процедурната част на семантичния анализ в идеалния случай се свежда до цикли, които преминават през различни езикови опции. По този начин стана възможно да се опростят лингвистичните модели поради увеличената скорост на компютрите.

Основните компоненти на семантичния апарат, използван в Dialing, са семантичните отношения (SR) и семантичните характеристики (SC). Примери за семантични отношения: INSTRU – „инструмент“, LOK – „местоположение, местоположение“, PRINADL – „принадлежност“, REZLT – „резултат“ и т.н. Те са доста универсални и имат прилики с предикатите, разгледани в първия раздел и семантични роли, споменати в трети раздел. Семантичните характеристики ви позволяват да изграждате формули, като използвате логически връзки „и“ и „или“. На всяка дума се приписва определена формула, съставена от семантични характеристики. Семантичният речник на „Набиране” съдържа около 40 семантични характеристики. Примери за семантични характеристики: ABST - абстрактно съществително или прилагателно, THING - наименование на химическо вещество или нещо, което може да се измери с тегло или обем; GEOGR – географски обект; ДВИЖЕНИЕ – глаголи за движение; INTEL – действия, свързани с умствена дейност; КОМУНИКА – глаголи на речта; NOSINF – носители на информация; ORG – организация; SOBIR – всичко, което обозначава съвкупност от еднотипни обекти; EMOC – прилагателни, които изразяват емоции и др. Някои характеристики са съставни, защото могат да бъдат изразени чрез други. Има характеристики, които са антоними. Използването им в една и съща връзка е забранено. Има характеристики, които са вариации на други. Семантичните характеристики, заедно с граматическите характеристики, осигуряват проверка на съгласието на думите при тълкуване на връзки в текста.

В момента всички инструменти, разработени в рамките на проекта AOT (включително системата за набиране), са безплатен междуплатформен софтуер. Демонстрация и подробна документация са достъпни на уебсайта.

Системи за извличане на информация и представяне на знания

Има и други системи, които съдържат компоненти за семантичен анализ. Те обаче имат значителни недостатъци за изследване: трудно е да се намерят описания, които не са безплатни и свободно разпространявани или не работят с текстове на руски език. Те включват OpenCalais (http://www.opencalais.com/opencalais-api/), RCO (http://www.rco.ru/?page_id=3554), Abbyy Compreno (https://www.abbyy.com /ru-ru/isearch/compreno/), SemSin (http://www.dialog-21.ru/media/1394/
kanevsky.pdf), DictaScope (http://dictum.ru/) и др.

Заслужава да се спомене системата за извличане на данни от неструктурирани текстове Pullenti (http://semantick.ru/). Тя зае първо място в песни T1, T2, T2-m и второ място в T1-l на конференцията Dialog 2016 в състезанието FactRuEval. На уебсайта на разработчиците на системата Pullenti има и демо версия на семантичен анализатор, който ви позволява да изградите семантична мрежа въз основа на изречение.

Инструменталната среда DECL (http://ipiranlogos.com/) е разработена в края на 90-те години и е използвана за изграждане на експертни системи (ES), обвивки за ES, логико-аналитични системи (LAS), лингвистични процесори (LP), осигуряващи обработка и автоматично извличане на знания от потоци от неформализирани документи на естествен език.

Системата за машинен превод "ЕТАП-3" е предназначена за анализ и превод на текстове на руски и английски език. Системата използва трансформацията на текстове на естествен език в тяхното семантично представяне в универсалния мрежов език. Както бе споменато по-рано, маркирането на синтактичния корпус „Национален корпус на руския език“ се извършва от лингвистичния процесор ETAP-3, базиран на принципите на теорията „Значение Û Текст“.

Напоследък се появяват все повече системи за представяне на бази от знания под формата на графики. Тъй като обемът на информацията непрекъснато се увеличава с невероятна скорост, такива системи трябва да поддържат изграждането и актуализирането на бази от знания автоматично. Автоматичното изграждане на бази от знания може да се извърши на базата на структурирани източници на данни.

Примери за такива системи: Yago (http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/), DBpedia (http://wiki.dbpedia . org/), Freebase (https://developers.
google.com/freebase/), Графа на знанието на Google (https://developers.google.com/knowledge-graph/), OpenCyc (http://www.opencic.org/). Друг подход ви позволява да извличате информация от отворени ресурси в интернет без човешка намеса: ReadTheWeb (http://rtw.ml.cmu.edu/rtw/), OpenIE (http://nlp.stanford.edu/
software/openie.html), Google Knowledge Vault (https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf). Такива системи са експериментални, всяка от тях има свои собствени характеристики. Например, Knowledge Vault се опитва да вземе предвид несигурностите; на всеки факт се присвоява коефициент на доверие и произход на информацията. По този начин всички твърдения са разделени на тези, които имат голяма вероятност да бъдат верни, и тези, които могат да бъдат по-малко вероятни. Прогнозирането на факти и техните свойства се извършва с помощта на методи за машинно обучение, базирани на много голям брой текстове и съществуващи факти. В момента хранилището на знанията съдържа 1,6 милиарда факта. Системата NELL, разработена като част от проекта ReadTheWeb в университета Карнеги Мелън, съдържа повече от 50 милиона твърдения с различна степен на достоверност. Около 2 милиона 800 хиляди факта имат висока степен на доверие. Процесът на обучение на NELL също все още не е завършен.

Нека направим следните изводи. С развитието на компютърните технологии и постоянното нарастване
обеми текстова информация, изследванията в областта на автоматичната обработка на текст са насочени към приложния аспект. Възможностите на повечето инструменти са ограничени до морфологичен и синтактичен анализ в комбинация с методи от теорията на вероятностите и математическата статистика. Така беше решена само избрана част от най-простите задачи. Други проблеми все още трябва да бъдат разрешени.

Както видяхме, има много причини за това. Например, има мнение, че всяко правило в синтаксиса има своя аналог в семантиката. Този постулат се нарича хипотеза от правило към правило. Всъщност тази кореспонденция не е едно към едно и това е основната трудност. Наистина, всяко синтактично правило (парс дърво) може да бъде свързано със семантично правило (парс дърво), но няма да е единственото. В обратната посока, подобно на семантично правило, се сравнява синтактично правило, но не непременно единственото. Именно тази неяснота води до неразрешими засега проблеми в областта на автоматичната обработка на текстове. Във връзка с това разсъждение възниква въпросът за избора на желаното сравнение от голям брой възможни варианти.

От всичко казано по-горе може да се направи още един много важен извод. Процесите на генериране и тълкуване на изявление не трябва да се разглеждат отделно, те са неразривно свързани
себе си. Когато изразява мислите си, човек се фокусира върху това дали събеседникът му ще го разбере. В процеса на генериране на изявление човек като че ли „препроверява“ себе си, моделирайки как събеседникът ще възприеме информацията. Подобен механизъм е налице при тълкуване на твърдение. Когато осмисляме това, което сме чули или прочели, ние отново „сверяваме“ знанията и представите си за света. Само благодарение на това успяваме да изберем подходящото значение.

Съвременните изследователи са склонни да смятат, че желаният избор може да бъде направен с допълнителна база от знания за света. Такава база от знания трябва да съдържа обща семантична информация за понятията и връзките между тях, така че при достъп до нея подходящият контекст на твърдението да може да бъде определен автоматично. Би помогнало да се вземат предвид натрупаните знания за света, които не присъстват експлицитно в конкретно изказване, но пряко засягат неговия смисъл.

Литература

  1. Мелчук И.А. Опит в теорията на лингвистичните модели „Значение-текст”. М .: Езици на руската култура, 1999. 346 с.
  2. Лахути Д.Г., Рубашкин В.Ш. Семантичен (концептуален) речник за информационни технологии // Научна и техническа информация. 2000. № 7. С. 1–9.
  3. Падучева Е.В. Динамични модели в семантиката на лексиката. М .: Езици на славянската култура, 2004. 608 с.
  4. Тузов В.А. Компютърна семантика на руския език. Санкт Петербург: Издателство на Санкт Петербургския държавен университет, 2003. 391 с.
  5. Национален корпус на руския език. URL: http://www.ruscorpora.ru/ (дата на достъп: 22.08.2016 г.).
  6. Апресян В.Ю. и др.Нов тълковен речник на синонимите на руския език. М. – Виена: Езици на славянската култура – ​​Виенски славянски алманах, 2004. 1488 с.
  7. Хорошилов А.А. Методи за автоматично установяване на семантичното сходство на документи въз основа на техния концептуален анализ // Електронни библиотеки: обещаващи методи и технологии, електронни колекции: tr. XV Всеруски научен конф. RCDL" 2013. Ярославъл: Издателство ЯрГУ, 2013. С. 369–376.
  8. Рубашкин В.Ш. Представяне и анализ на значението в интелигентни информационни системи. М.: Наука, 1989. 189 с.
  9. Лахути Д.Г., Рубашкин В.Ш. Средства и процедура за концептуална интерпретация на входни съобщения на естествен език // Изв. Академия на науките на СССР. сер. Технически киберн. 1987. № 2. С. 49–59.
  10. Рубашкин В.Ш. Семантичен компонент в системи за разбиране на текст // KII-2006. Тр. 10 национални конф. според изкуствените разузнаване с междунар част. 2006. URL: http://www.raai.org/resurs/papers/kii-2006/#dokladi (дата на достъп: 23.08.2016).
  11. Падучева Е.В. Семантика на типа и отправна точка // Изв. Академия на науките на СССР: Сер. осветен и език 1986. Т. 45. № 5. С. 18–25.
  12. Падучева Е.В. Предикатни имена в лексикографски аспект // Научно-технически. инф. 1991. Сер. 2. № 5. С. 21–31.
  13. WordNet. Лексикална база данни за английски език. URL: http://wordnet.princeton.edu/ (достъпен на 23.08.2016 г.).
  14. Семантичен уеб. URL: https://ru.wikipedia.org/wiki/Semantic_net (дата на достъп: 23.08.2016 г.).
  15. Мински М. Теория на рамковата система на Мински // Доклади на семинара по теоретични въпроси при обработката на естествен език (TINLAP "75). 1975, стр. 104–116.
  16. Хабаров С.П. Представяне на знания в информационни системи: записки от лекции. URL: http://www.habarov.spb.ru/bz/bz07.htm (дата на достъп: 23.08.2016 г.).
  17. Луценко Е.В. Представяне на знания в информационни системи: електроника. учебник помагало за студенти. Краснодар: Издателство КубГАУ, 2010. 428 с.
  18. Константинова I.S., Митрофанова O.A. Онтологиите като системи за съхранение на знания // Vseros. конкурентен селекция стат. по приоритет посока „Информационни и телекомуникационни системи”. 2008. 54 стр.
  19. Разин В.В., Тузовски А.Ф. Представяне на знания за времето, като се вземе предвид несигурността в семантичните WEB онтологии // Dokl. Томска държава Университет по системи за управление и радиоелектроника. 2013. № 2 (28). стр. 157–162.
  20. Patel-Schneider P.F., Horrocks I. et al. SWRL: Език за семантични уеб правила, съчетаващ OWL и RuleML // World Wide Web Consortium (W3C). 2004. URL: http://www.w3.org/Submission/SWRL (дата на достъп: 18.08.2016).
  21. Филмор Ч. Случаят за случай. Proc. Texas Symp. on Language Universals, 1967, 134 p.
  22. Fillmore Ch. The Case of Case // Ново в чуждестранната лингвистика. М.: Прогрес, 1981. С. 369–495.
  23. Даути Д. Тематични прото-роли и подбор на аргументи // Език, 1991, том. 67, бр. 3, стр. 547–619.
  24. Норвиг П., Ръсел С. Изкуствен интелект: модерен подход. М.: Уилямс, 2007. 1408 с.
  25. Jurafsky D., Martin J. Обработка на реч и език: Въведение в обработката на естествен език, компютърната лингвистика и разпознаването на реч. 2008, 1024 стр.
  26. Батура Т.В., Мурзин Ф.А. Машинно-ориентирани логически методи за показване на семантиката на текст на естествен език: монография. Новосибирск: Издателство на NSTU, 2008. 248 с.
  27. Темпорална логика. URL: https://ru.wikipedia.org/wiki/Temporal_logic (дата на достъп: 23.08.2016 г.).
  28. Вендлер З. Глаголи и времена. Философски преглед, 1957, кн. 66, бр. 2, стр. 143–160.
  29. Падучева Е.В. Лексикална аспектност и класификация на предикатите според Маслов-Вендлер // Въпроси на лингвистиката. 2009. № 6. С. 3–21.
  30. Извод в логически модели. Метод на разрешаване. URL: http://www.aiportal.ru/articles/knowledge-models/method-resolution.html (дата на достъп: 11.08.2016 г.).
  31. Boral H., Redfield S. Морфология на машината за бази данни. Proc. 11-ти стажант. конф. Very Large Data Bases, 1985, стр. 59–71.
  32. Fushimi S., Kitsuregawa M., Tanaka H. Преглед на системата на паралелна релационна база данни GRACE. Proc. 12-ти стажант. конф. Very Large Data Bases, 1986, pp. 209–219.
  33. Танака Х. Машина за паралелен извод. IOS Press Publ., 2000, 296 с.
  34. Отворено познание. URL: http://opencog.org/ (дата на достъп: 23.08.2016 г.).
  35. Анализатор на граматика на връзките. AbiWord, 2014. URL: http://www.abisource.com/projects/link-grammar/ (дата на достъп: 20.08.2016).
  36. CMU Link Grammar анализатор на естествен език. URL: https://github.com/opencog/link-grammar/ (дата на достъп: 22.08.2016 г.).
  37. RelEx Dependency Relationship Extractor. OpenCog. URL: http://wiki.opencog.org/wikihome/index.php/Relex (дата на достъп: 22.08.2016 г.).
  38. Сокирко А.В. Семантични речници при автоматична обработка на текст (по материали от системата DIALING). дис. ...канд. тези. Sci. М.: MGPIIYA, 2001. 120 с.
  39. Автоматична обработка на текст. URL: http://www.aot.ruhttp://aot.ru/ (дата на достъп: 23.08.2016 г.).
  40. Prószéky G. Машинен превод и хипотезата правило към правило. Нови тенденции в преводознанието (В чест на Кинга Клауди). Budapest: Akademiai Kiadó, 2005, pp. 207–218.

Думата семантика идва от старогръцки език: σημαντικός sēmantikos, което означава „значим“, и като термин е използвана за първи път от френския филолог и историк Мишел Бреал.

Семантиката е науката, която изучава значението на думите(лексикална семантика), много отделни букви (в древните азбуки), изречения - семантични фрази и текстове. Тя е близка до други дисциплини като семиология, логика, психология, теория на комуникацията, стилистика, философия на езика, лингвистична антропология и символна антропология. Набор от термини, които имат общ семантичен фактор, се нарича семантично поле.

Във връзка с

Съученици

Какво е семантика

Тази наука изучава лингвистично и философско значениеезик, езици за програмиране, формални логики, семиотика и провежда анализ на текст. Свързано е с:

  • със значение на думите;
  • думи;
  • фрази;
  • знаци;
  • символи и какво означават, тяхното обозначение.

Проблемът с разбирането е обект на много изследвания в продължение на дълъг период от време, но темата е била разглеждана предимно от психолози, а не от лингвисти. Но само в лингвистиката изучава се тълкуването на знаци или символи, използвани в общности при определени обстоятелства и контекст. В този възглед звуците, изражението на лицето, езикът на тялото и проксемиката имат семантично (смислено) съдържание и всяко от тях включва няколко отделения. В писмения език неща като структурата на параграфа и пунктуацията съдържат семантично съдържание.

Официалният анализ на семантиката се пресича с много други области на изследване, включително:

  • лексикология;
  • синтаксис;
  • прагматизъм;
  • етимология и др.

От само себе си се разбира, че определението за семантика също е добре дефинирано поле само по себе си, често със синтетични свойства. Във философията на езика семантиката и референцията са тясно свързани. Други свързани области включват филология, комуникации и семиотика.

Семантиката контрастира със синтаксиса, изучаването на комбинаториката на езиковите единици (без позоваване на тяхното значение) и прагматиката, изучаването на връзките между символите на даден език, тяхното значение и потребителите на езика. Полето на изследване в този случай също има значителни връзки с различни репрезентативни теории за значението, включително истински теории за значението, теории за кохерентност на значението и теории за съответствието на значението. Всеки от тях е свързан с общофилософско изследване на реалността и представяне на смисъла.

Езикознание

В лингвистиката семантиката е подполе, посветено на изследването на значението, присъщи на нивата на думи, фрази, изречения и по-широки единици на дискурса (анализ на текст или разказ). Изследването на семантиката също е тясно свързано с предметите на представяне, референция и обозначение. Основните изследвания тук са насочени към изучаване на значението на знаците и изучаване на връзките между различни езикови единици и съединения като:

  • омонимия;
  • синонимия;
  • антонимия
  • метонимия;

Ключовият проблем е как да се придаде повече значение на големи парчета текст в резултат на състава на по-малки смислови единици.

Монтаг граматика

В края на 60-те години Ричард Монтегю (Semantics Wikipedia) предложи система за дефиниране на семантични записи от гледна точка на ламбда смятане. Монтегю показа, че значението на един текст като цяло може да бъде разложено на значенията на неговите части и на относително малки правила за комбиниране. Концепцията за такива семантични атоми или примитиви е фундаменталназа езика на менталната хипотеза от 70-те години.

Въпреки своята елегантност, граматиката на Монтагю беше ограничена от зависима от контекста променливост в значението на думата и доведе до няколко опита за включване на контекст.

За Монтегю езикът не е набор от етикети, прикрепени към нещата, а набор от инструменти, важността на елементите от които се крие в това как функционират, а не в тяхната привързаност към нещата.

Конкретен пример за това явление е семантичната неяснота, значенията не са пълни без някои елементи на контекста. Никоя дума няма значение, което може да бъде идентифицирано независимо от това, което е в близост до нея.

Формална семантика

Произлиза от работата на Монтегю. Силно формализирана теория за семантиката на естествения език, в която на изразите се присвояват етикети (значения), като индивиди, стойности на истината или функции от един към друг. След това истинността на едно изречение и, което е по-интересно, неговата логическа връзка с други изречения, се оценява спрямо текста.

Истински условна семантика

Друга формализирана теория, създадена от философа Доналд Дейвидсън. Целта на тази теория е свързване на всяко изречение на естествен език с описание на условията, при които то е вярнонапример: "снегът е бял" е вярно тогава и само ако снегът е бял. Задачата е да се достигне до истински условия за всякакви изречения от фиксирани значения, приписани на отделни думи и фиксирани правила за комбинирането им.

На практика условната семантика е подобна на абстрактен модел; Концептуално обаче те се различават по това, че истинно-условната семантика се стреми да свърже езика с изявления за реалния свят (под формата на метаезични изказвания), а не с абстрактни модели.

Концептуална семантика

Тази теория е опит да се обяснят свойствата на аргументната структура. Предположението в основата на тази теория е, че синтактичните свойства на фразите отразяват значенията на думите, които ги заглавяват.

Лексикална семантика

Лингвистична теория, която изследва значението на една дума. Тази теория разбира това значението на една дума е напълно отразено в нейния контекст. Тук значението на една дума се крие в нейните контекстуални връзки. Тоест всяка част от изречението, която има смисъл и се комбинира със значенията на други компоненти, се обозначава като семантичен компонент.

Изчислителна семантика

Компютърната семантика се фокусира върху обработката на лингвистичното значение. За тази цел са описани специфични алгоритми и архитектура. В рамките на тази рамка алгоритмите и архитектурите също се анализират по отношение на възможността за решаване, времева/пространствена сложност, необходими структури от данни и комуникационни протоколи.

Защо значението представлява интерес за философите и психолозите и защо се смята за спорен „въпрос“, не е трудно да се разбере. Помислете за привидно невинния въпрос: „Какво е значението на думата крава?“ Разбира се, това не е конкретно животно. Може би тогава името крава е целият клас животни? Всички крави са различни по един или друг начин; и във всеки случай никой не знае или не би могъл да знае всички членове на класа крави, но все пак бих искал да мисля, че знаем значението на думата крава и можем правилно да я използваме, за да обозначим конкретни животни, които имаме невиждано досега. Има ли едно или повече свойства, които правят кравите различни от всички други обекти, които наричаме по различен начин? Разсъждавайки по този начин, се оказваме потопени във философски дебат между „номиналисти“ и „реалисти“, който продължава под една или друга форма от времето на Платон до наши дни. Дали нещата, които наричаме с едно и също име, имат някакви общи „съществени” свойства, по които могат да бъдат идентифицирани (както биха казали „реалистите”), или нямат нищо общо помежду си, освен името, което според установените обичай, който сме се научили да прилагаме към тях (както може да каже един „номиналист“)? И кравата не е особено труден случай. В края на краищата може да се приеме за даденост, че кравите могат да бъдат определени от гледна точка на биологична родово-видова класификация. Какво ще кажете за думата маса? Масите се предлагат в различни форми и размери, изработени са от различни материали и се използват за различни цели. Но масите са, поне физически, наблюдаеми и осезаеми обекти; и за тях е възможно да се състави определен списък от определящи характеристики. Какво можем да кажем за думи като истина, красота, доброта, доброта, добро качество и т.н.? Дали всички тези неща, които описваме като „красиви“ или „добри“, имат някакво общо свойство? Ако е така, как да го идентифицираме и опишем? Може би трябва да се каже, че значението на думи като истина, красота и доброта е „концепцията” или „идеята”, свързана с тях в „ума” на говорещите съответния език,^ и като цяло, че „значенията” са „концепции“ или „идеи“? Да се ​​каже това означава отново да се заровим във философски и психологически дебати, тъй като много философи и психолози са много съмнителни относно възможността за съществуване на концепции (или дори „ум“). Но дори и да оставим тези трудности настрана или да откажем да ги разглеждаме, ще открием, че има други въпроси, свързани със смисъла и имащи повече или по-малко философско естество. Има ли смисъл да се каже, че някой е използвал дума със значение, различно от това, което означава думата „наистина“? Има ли дори „истинско“ или „правилно“ значение на една дума?

9.1.4. СТОЙНОСТ „СТОЙНОСТИ“

Досега говорихме само за значенията на думите. Също така казахме за изреченията, че имат значение. Терминът "смисъл" използван ли е тук в същия смисъл? Между другото, често казваме, че изреченията и комбинациите от думи са или не са „смислени“, но обикновено не казваме, че думите не са „смислени“. Тогава възможно ли е да се посочи разлика, а може би цяла поредица от разлики, между понятията „да бъдеш значим“ и „да имаш значение“? Тези и много други свързани въпроси са били обсъждани повече от веднъж от философи и лингвисти. Привличането на вниманието към множеството значения на „смисъла“ се е превърнало в трюизъм при излагането на семантичната теория.

Наред с философските въпроси има и такива, които пряко попадат в компетенциите на лингвиста. Философите, подобно на първия човек, когото срещнат, обикновено приемат „думите“ и „изреченията“ за очевидни факти. Един лингвист не може да направи това. Думите и изреченията са за него преди всичко единици на граматическо описание; Наред с тях се разпознават и други граматични единици. Лингвистът трябва да разгледа общия въпрос за това как граматическите единици от различни видове са свързани с единиците на семантичния анализ. По-специално, той трябва да разгледа въпроса дали трябва да се прави разлика между „лексикално“ и „граматично“ значение.

Никой все още не е представил, поне в общи линии, задоволителна и разумна теория на семантиката. И това трябва да бъде ясно признато при всяко обсъждане на проблемите на тази дисциплина. Въпреки това, липсата на последователна и пълна теория на семантиката не означава, че досега не е постигнат абсолютно никакъв напредък в областта на теоретичното изследване на значението. По-долу е даден кратък преглед на най-важните постижения, постигнати през последните години от лингвисти и философи.

Вече условно дефинирахме семантиката като наука за значението; и това определение е единственото нещо, което обединява всички семантици. Веднага щом започнем да се запознаваме с конкретни семантични произведения, се сблъскваме с такова разнообразие от подходи за дефиниране и установяване на смисъл, че това озадачава неопитния читател. Правят се разграничения между „емоционално“ и „концептуално“ значение, между „значимост“ и „означаване“, между „перформативно“ и „описателно“ значение, между „смисъл“ и „референция“, между „денотация“ и „конотация“, между „знаци” и „символи”, между „екстензионално” и „интензия”, между „импликация”, „включване” и „предпоставка”, между „аналитично” и „синтетично” и т.н. Терминологията на семантиката е богата и направо объркващо, тъй като използването на термини от различни автори се характеризира с липса на каквато и да е последователност и еднообразие. Поради това термините, които въвеждаме в тази глава, не е задължително да имат същото значение, което имат в други трудове по семантика.

Започваме с кратка критика на традиционния подход към дефинирането на значението.

9.2. ТРАДИЦИОННА СЕМАНТИКА

9.2.1. НАЗВАНЕ НА НЕЩА

Традиционната граматика се основава на предположението, че думата (в смисъла на "токен"; срв. §5.4.4) е основната единица на синтаксиса и семантиката (срв. също §1.2.7 и §7.1.2). Думата се смяташе за „знак“, състоящ се от две части; ще наречем тези два компонента формадумите и неговите значение. (Не забравяйте, че това е само едно от значенията, които терминът „форма“ има в лингвистиката; „формата“ на думата като „знак“ или лексикална единица трябва да се разграничава от специфичните „случайни“ или флективни „форми“ в която думата се появява в изречения; виж § 4.1.5.) Много рано в историята на традиционната граматика възниква въпросът за връзката между думите и „нещата“, към които те се отнасят или които „обозначават“. Древногръцките философи от времето на Сократ, а след тях и Платон, формулират този въпрос с термини, които оттогава са често използвани в обсъждането му. За тях семантичното отношение, което съществува между думите и „нещата“, е „назоваване“; и тогава възникна следващият проблем: дали „имената“, които даваме на „нещата“, са от „естествен“ или „конвенционален“ произход (вж. § 1.2.2). С развитието на традиционната граматика стана обичайно да се прави разлика между значението на една дума и „нещото“ или „нещата“, които са „назовани“ от думата. Средновековните граматици формулират разграничението по следния начин: формата на думата (тази част от dictio, която се характеризира като vox) обозначава „нещата“ посредством „концепция“, свързана с формата в съзнанието на говорещите даден език; и тази концепция е значението на думата (нейното значение). Ние ще считаме тази концепция за традиционната гледна точка за връзката между думите и „нещата". Както вече беше споменато, тази гледна точка по принцип е в основата на философското дефиниция на „части на речта" в съответствие с характерното за тях „средство за обозначаване" (срв. § 1.2.7). Без да навлизаме в подробно изложение на традиционната теория за „означаването“, ще отбележим само, че терминологията използвана в тази теория не изключва възможността за двусмислена или недиференцирана употреба на термина „означава“): може да се каже, че формата на думата „означава“ „концепцията“, под която „нещата“ са включени (чрез „абстрахиране" от техните „случайни" свойства); може също да се каже, че той „означава" самите „неща". Що се отнася до връзката между „понятия“ и „неща“, тя, разбира се, е била обект на значителни философско несъгласие (несъгласието между „номиналистите” и „реалистите” е особено поразително; срв. § 9.1.3) Тук можем да пренебрегнем тези философски различия.

9.2.2. СПРАВКА

Тук е полезно да се въведе съвременен термин за „нещата”, разглеждани от гледна точка на „назоваването”, „назоваването” им с думи. Това е терминът референт. Ще кажем, че отношението, което съществува между думите и нещата (техните референти), е отношението препратки (корелация): думи корелиратс неща (и не ги „означавайте“ или „именувайте“). Ако приемем разграничението между форма, значение и референт, тогава можем да дадем познато схематично представяне на традиционния възглед за връзката между тях под формата на триъгълник (понякога наричан „семиотичен триъгълник“), изобразен на фиг. 23. Пунктираната линия между форма и референт показва, че връзката между тях е непряка; формата е свързана със своя референт чрез опосредстващо (концептуално) значение, което се свързва с всеки поотделно. Диаграмата ясно илюстрира важната точка, че в традиционната граматика една дума е резултат от комбинирането на специфична форма със специфично значение.

Вече споменахме философските и психологическите спорове относно статута на „концепциите“ и „идеите“ в „ума“ (вж. §9.1.3). Традиционната семантика издига съществуването на „понятия“ до принципа на всички теоретични конструкции и следователно (почти неизбежно) насърчава субективността и интроспекцията в изследването на значението. Както пише Хаас, „емпиричната наука не може да разчита изцяло на изследователска методология, която се свежда до това хората да правят наблюдения в собствените си умове, всеки в своя собствен“. Тази критика предполага приемането на възгледа, че семантиката е или трябва да бъде емпирична наука, възглед, който е желателно, доколкото е възможно, да не се обвързва с такива противоречиви философски и психологически въпроси като разграничението между „тялото " и "дух" или статуса на "концепции." Ние ще се придържаме към тази гледна точка, когато разглеждаме семантиката в тези глави. Трябва да се подчертае обаче, че методологическото отхвърляне на „ментализма“ не означава възприемане на „механизъм“, както смятат някои лингвисти. „Механистичното“ и „позитивистко“ определение на Блумфийлд за значението на една дума като цялостно „научно“ описание на нейния референт е по-вредно за напредъка в семантиката, отколкото традиционното определение по отношение на „концепции“, тъй като дефиницията на Блумфийлд дава преференциално внимание на сравнително малък набор от думи в рамките на речника на естествените езици, думи, които съответстват на „неща“, които по принцип могат да бъдат описани с помощта на физическите науки. Освен това, той се основава на две имплицитни и необосновани предположения: (i) че „научното“ описание на референтите на тези думи е свързано с начина, по който тези думи се използват от говорещите даден език (повечето говорещи имат малка представа за „научното“ описание); (ii) че значението на всички думи в крайна сметка може да бъде описано с едни и същи термини. Вярно е, че подходът на Блумфийлд (намиращ се и при други автори) може да се счита за зависим от „реалистичен“ възглед за връзката между езика и „света“, възглед, който не се различава значително от гледната точка на много „концептуалисти“; това най-малко предполага предположението, че тъй като има, например, думата интелигентност, тогава има и нещо, към което тя се отнася (и това „нещо“, предполага се, в крайна сметка ще бъде описано по задоволителен начин с помощта на „науката“ ); щом има дума любов, значи има и нещо, на което тази дума отговаря и т.н. г. Позицията, към която трябва да се придържа лингвистът, е тази, която е неутрална по отношение на „ментализма“ и „механизма“; това е позиция, която е в съответствие и с двете гледни точки, но не предполага нито една от тях.

9.2.7. ОПРЕДЕЛЕНИЕ „СТЕНСИВНО“.

Имплицитно в предишния параграф е друга критика на традиционната семантика (както и някои съвременни теории). Вече видяхме, че терминът „смисъл“, при обикновената му употреба, сам по себе си има много „значения“. Когато зададем въпрос на някого - „Какво е значението на думата х? - в хода на ежедневния (не философски или тясно специализиран) разговор получаваме (и това изобщо не ни учудва) различни по форма отговори в зависимост от обстоятелствата и ситуацията, в която задаваме този въпрос. Ако се интересуваме от значението на дума на език, различен от нашия, отговорът на въпроса ни най-често е превод. („Преводът“ повдига всякакви проблеми от семантичен интерес, но ние няма да ги засягаме засега; вж. § 9.4.7.) За нас сега по-разкриваща ситуация е, в която питаме за значенията на думите в нашия собствен език (или на друг език, който „знаем“, поне „отчасти“ - като цяло понятието „пълно владеене на език“ е, разбира се, измислица). Да предположим, че искаме да разберем значението на думата крава в неправдоподобната (но удобна за нашите цели) ситуация, когато на съседна поляна има няколко крави. Може да ни кажат: „Виждате ли онези животни там? Това са крави." Този начин на предаване на значението на думата крава включва елемент от това, което философите наричат остензивно определение. (Остензивна (визуална) дефиниция е тази, която директно „сочи“ към съответния обект.) Но остензивната дефиниция сама по себе си никога не е достатъчна, тъй като лицето, което тълкува тази „дефиниция“, трябва преди всичко да знае значението на „посочването“ жест.в даден контекст (и също така да се знае, че намерението на говорещия е именно да даде "дефиниция") и, което е по-важно, той трябва правилно да идентифицира обекта, за който се "позовава". В случая с нашия хипотетичен пример думите „тези животни“ ограничават възможността за неразбиране. (Те не го елиминират напълно; но ще приемем, че „дефиницията“ на значението на крава е интерпретирана задоволително.) Теоретичната значимост на този твърде опростен и доста нереалистичен пример е двойна: първо, той показва трудността да се обясни означаваща всяка дума без използването на други думи, за да се ограничи и направи по-ясно "областта" на "индикация" (това потвърждава идеята, че вероятно е невъзможно да се установи и може би дори да се знае значението на една дума без също познаване на значението на други думи, с които е "свързан"; например крава "крава" е свързана с животно "животно"); второ, остензивното определение се прилага само към сравнително малък набор от думи. Представете си например безсмислието да се опитвате да обясните по този начин значението на думите true „правилно, вярно“, beautiful „красиво, красиво, великолепно“ и т.н.! Значението на такива думи обикновено се обяснява, макар и не винаги успешно, с помощта на синоними (значенията на които се предполага, че вече са известни на лицето, което задава въпроса) или с помощта на доста дълги дефиниции от типа, който обикновено се дава в речниците. И отново тук ясно се проявява неизбежната кръговрат на семантиката: в речника няма нито една точка, която да може да се вземе като отправна точка и от която да се изведе значението на всичко останало. Този проблем с "кръговостта" ще бъде обсъден по-долу (вж. §9.4.7).

9.2.8. КОНТЕКСТ

Друга особеност на ежедневните ситуации, в които се питаме за значението на думите, е, че често ни се казва: „Зависи от контекста“. („Дайте ми контекста, в който срещнахте тази дума, и аз ще ви кажа нейното значение.“) Често е невъзможно да се определи значението на една дума, без да се „постави в контекст“; и полезността на речниците е пряко зависима от броя и разнообразието от „контексти“, които са дадени в тях за думите. Често (и това е може би най-честият случай) значението на дадена дума се обяснява по следния начин: дава се „синоним“, указващ „контекстуалните“ ограничения, регулиращи употребата на въпросната дума (добавено: „развалени (от яйца) )"; гранясало: „развалено (от масло)" и т.н.). Факти като разнообразието от начини, по които установяваме значението на думите на практика, „кръговостта“ на речника и съществената роля на „контекста“ не получават пълно теоретично признание в традиционната семантика.

9.2.9. „ЗНАЧЕНИЕ“ И „ИЗПОЛЗВАНЕ“

Тук можем да споменем известния и много популярен лозунг на Витгенщайн: „Не търсете значението на една дума, търсете нейната употреба“. Терминът "използване" сам по себе си не е по-ясен от термина "смисъл"; но като заменя един термин с друг, семантикът изоставя традиционната тенденция да се дефинира „смисълът“ от гледна точка на „означаването“. Собствените примери на Витгенщайн (в по-късната му работа) показват, че той вярва, че "употребите", в които се срещат думите в даден език, са от много разнообразно естество. Той не изложи (и не декларира намерението си да изложи) теория за „използването“ на думите като теория на семантиката. Но може би имаме право да извлечем следните принципи от програмното изявление на Витгенщайн. Единственият тестов критерий, приложим към езиковите изследвания, е „използването“ на езикови изказвания в различни ситуации в ежедневието. Изрази като „значението на дума“ и „значението на изречение (или предложение)“ са изпълнени с опасността да ни подведат, тъй като ни склоняват да търсим „значенията“, които те имат, и да идентифицираме техните „значения“. ” със същности като физически обекти, „концепции”, дадени на „ума”, или „състояния на нещата” във физическия свят.

Нямаме преки доказателства относно разбирането на изказванията, а по-скоро имаме данни за тях недоразумение(недоразумение) - когато нещо е "нарушено" в процеса на комуникация. Ако, например, кажем на някого да ми донесе червената книга, която е на масата горе, и той ни донесе книга с различен цвят, или кутия вместо книга, или отиде долу да търси книга, или нещо напълно неочаквано, тогава съвсем основателно можем да кажем, че той е „разбрал погрешно“ цялото или част от нашето изявление (разбира се, възможни са и други обяснения). Ако той направи това, което се очаква от него (тръгне в правилната посока и се върне с правилната книга), тогава можем да кажем, че е разбрал правилно изявлението. Искаме да подчертаем, че (в случай като този) има prima facie „поведенчески“ факти, че не е възникнало недоразумение. Напълно възможно е, ако продължим да изпитваме много упорито неговото "разбиране" на думите донеси, или червено, или книга, ще дойде момент, когато нещо, което е направил или казал, ще разкрие, че неговото "разбиране" на тези думи е малко по-различно от нашето, че той прави заключения от твърдения, съдържащи тези думи, които ние не правим (или, обратно, че ние правим заключения, които той не прави), или че той ги използва за обозначения на малко по-различен клас обекти или действия. Нормалната комуникация се основава на предположението, че всички „разбираме“ думите по един и същи начин; това предположение се нарушава от време на време, но ако това не се случи, фактът на „разбирането“ се приема за даденост. Дали имаме или нямаме едни и същи „концепции“ в „ума“ си, когато говорим помежду си, е въпрос, на който не може да се отговори освен по отношение на „използването“ на думите в изказванията. Твърдението, че всеки "разбира" една и съща дума малко по различен начин, вероятно е вярно, но по-скоро безсмислено. Семантиката се занимава с обяснение на степента на еднаквост в „използването“ на езика, което прави нормалната комуникация възможна. След като се откажем от възгледа, че „смисълът“ на една дума е това, което тя „означава“, ние съвсем естествено признаваме, че трябва да бъдат установени определени връзки от различни видове, за да се обясни „употребата“. Два от „факторите“, които трябва да бъдат разграничени, са справка(за което вече говорихме по-горе) и значение(смисъл).

9.2.10. НЕДЕТЕРМИНИСТИЧНА СТОЙНОСТ

И така, ние предлагаме да изоставим мнението, че „смисълът“ на една дума е това, което тя „означава“, и в процеса на комуникация това „означено“ се „предава“ (в известен смисъл) от говорещия на слушащия; по-скоро сме готови да се съгласим, че определеността (сигурността) на значението на думите не е нито необходима, нито желателна. Както видяхме, използването на езика в нормални ситуации може да се обясни въз основа на много по-слабо допускане, а именно, че има съгласие между говорещите даден език относно „използването“ на думите (за какво се отнасят, какво те предполагат и т.н.), което е достатъчно, за да изясни „недоразумението“. Това заключение трябва да се има предвид при всеки анализ на „значенията“ на думите и изреченията. Ще приемем това за даденост в следващите раздели на тези две глави за семантиката.

Трябва да се направят още две точки относно социално предписаните изказвания като „Как си? "Здравейте!". Те обикновено имат характера на „готови“ образувания, тоест те се научават от носителите на езика като неанализирани цели единици и, съвсем очевидно, не се конструират отново във всеки случай, когато се използват в обстоятелства, които, следвайки Furs, ние може да нарече „типични повтарящи се събития във веригата на социалния процес“. Тъй като те са от такова естество, би било възможно да се обяснят в рамките на „бихейвиористката“ концепция: въпросните изказвания биха могли да бъдат описани като „условни отговори“ на ситуациите, в които се случват. Този факт не трябва да се пренебрегва от семантика. Голяма част от нашата ежедневна употреба на езика може да бъде адекватно описана с „бихевиористки“ термини и може да включва „играене“ на определени „роли“ в изпълнението на предписани от обществото, „ритуални“ модели на поведение. Когато се разглеждат от гледна точка на този аспект на използването на езика, човешките индивиди проявяват поведение, подобно на това на много животни, чиито "комуникационни системи" се състоят от различни "готови изказвания", използвани в специфични ситуации. По-типичните човешки аспекти на езиковото поведение, които зависят от генеративните свойства на езика, както и от семантичните понятия за значение, референция и смисъл, не могат да бъдат правдоподобно обяснени чрез разширяването на „бихейвиористките“ понятия за „стимул“ и „отговор“ към тях. Вярно е обаче, че човешкият език включва и „поведенчески“ компонент. Въпреки че няма да кажем повече за това по-нататък, теоретично трябва да признаем тази истина тук.

9.3.7. "ФАТИЧНО ОБЩЕНИЕ"

В тази връзка е необходимо да се спомене и аспектът на езиковото поведение, към който Б. Малиновски прилага термина „фатична комуникация“. Той обърна внимание на факта, че много от нашите изказвания неправилно се приписват като тяхна единствена или основна функция на предаване или търсене на информация, даване на заповеди, изразяване на надежди, нужди и желания или дори „проявяване на емоции“ (в неясния смисъл, в който семантиката често използвайте последния израз); всъщност те служат за установяване и поддържане на чувство за социална солидарност и социално самосъхранение. Много „готови“ твърдения като How do you do? „Здравей!“, социално предписано в определени контексти, може да изпълнява точно тази функция на „фатична комуникация“. Въпреки това има много други изказвания, които са повече или по-малко свободно изградени от говорещите, но в същото време предават информация и служат за целите на „фатичната комуникация“. Пример може да бъде фразата It's another beautiful day, произнесена (по предположение) като първа фраза в разговор между купувач и собственик на магазин.Ясно е, че основната функция на това изявление не е да „предаде“ на собственика на магазина какво - информация за времето; това е ясен пример за „фатична“ комуникация.“ В същото време това изказване все още има значение, което е различно от значението на безброй други изказвания, които могат да бъдат намерени в този контекст и също така служат за целите на „фатичната" комуникация"; и следващата „стъпка" в разговора обикновено е свързана с това конкретно изказване въз основа на неговото значение. Следователно трябва да правим разлика между този аспект на „използването" на изказвания, който могат да бъдат приписани на прилагането на „фатична комуникация“ и тази част, която трябва да бъде изолирана като тяхното значение (ако имат значение според нашата дефиниция), но ние признаваме, че дори когато едно изказване има и двата аспекта, доминиращата част от "използването" на изказването може да бъде или първият, или вторият аспект. Малиновски явно преувеличава, когато твърди, че предаването на информация е една от „най-периферните и високоспециализирани функции“ на езика.

9.3.8. РАЗШИРЯВАНЕ НА КОНЦЕПЦИЯТА „ИМАЩ ЗНАЧЕНИЕ“ ЗА ВСИЧКИ ЕЗИКОВИ ЕДИНИЦИ

Досега илюстрирахме концепцията за значение само във връзка с цели твърдения, разглеждани като неразложими единици. Сега ще продължим да разглеждаме изказвания, а не изречения и ще продължим да се обръщаме към интуитивната концепция за "контекст"; но сега ще обобщим понятието за значение от гледна точка на следния принцип: всеки езиков елемент, който се появява в изказване, има значение, освен ако не е напълно определено („задължително“) в даден контекст.

Ясно е, че концепцията за значение (както е дефинирана тук) се прилага на всички нива на анализ на изказване, включително фонологично ниво. Например, има много контексти, в които думите lamb "агне" и ram "овен" могат да се използват с еднакъв успех и съответните изказвания могат да се различават само в тези думи. Тъй като тези изказвания очевидно се различават по значение (референтите на думите агне и овен са различни и, най-общо казано, импликациите, „съдържащи се“ в съответните изказвания, са различни), тогава фонемите /l/ и /r/ не само имат значение, но също имат различни значения в тези твърдения. Съществуват и други изказвания, съдържащи думи, различни от агне и овен, в които разликата в значението може да се изрази единствено чрез фонологичната опозиция /l/ - /r/. Както видяхме в една от предишните глави (вж. § 3.1.3), фонологичната структура на конкретни езици се основава в крайна сметка на способността за диференциране на фонемите (по-точно, върху способността за диференциране на техните „отличителни черти“), ограничени от определени ограничения, наложени от допълнителен принцип на фонетично сходство. Следователно има основателни причини за прилагане на концепцията за значение дори на нивото на фонологичен анализ. Струва си да се отбележи обаче, че в случай на фонетично различни, но „сходни“ звуци, наличието на значение задължително предполага различно значение, поне в някои контексти. На „най-високите“ нива това не е така. Когато говорим за езици, в които звуците [l] и [r] се срещат, но никога не правят разлика между изказванията, казваме, че в тези езици тези звуци са в отношение на допълнително разпространение или свободна вариация (с други думи, че те са алтернативни фонетични реализации на една и съща фонологична единица; срв. § 3.3.4). В контексти, в които звуците на речта, иначе обособени като отделни фонологични единици, имат едно и също значение, те могат съвсем основателно да бъдат характеризирани като синоними. Примери за това са началните гласни в алтернативни произношения на думата икономика (обратният случай е диференциалното качество на едни и същи гласни в beat /bi:t/ : bet /bet/ и т.н.) или моделите на ударение на controversy: controversy.

Въпреки че семантикът теоретично трябва да признае принципа, че притежаването на значение се прилага на фонологично ниво, в практическата си работа той обикновено не се занимава със значението на фонологичните единици. Причината е, че фонологичните единици никога нямат предметна корелация и не влизат в никакви семантични отношения, с изключение на отношенията на еднаквост и разлика в значението. Освен това връзката на еднаквостта на значението, когато се среща между фонологични единици (фонологична „синонимия“, както е илюстрирано по-горе), е спорадична и несистематична. Тя трябва да бъде описана от гледна точка на алтернативни правила за изпълнение за конкретни думи; след като тези правила бъдат получени, нищо повече не е необходимо. Най-общо казано (трябва да се спомене специално случаят със „звуковата символика“ - семантично интересно явление, което няма да разглеждаме тук поради ограничените възможности; вж. § 1.2.2), „значението“ на дадена фонологична единица е просто неговата разграничимост от всички други фонологични единици (ако има такива), които могат да се появят в същия контекст.

9.3.9. ОГРАНИЧЕНИ КОНТЕКСТИ

Сега можем да се обърнем към разграничението между изказвания и изречения (вж. §5.1.2). Трябва да имате предвид две неща. Първо. Когато използваме език, за да общуваме помежду си, ние произвеждаме не изречения, а изказвания; такива изказвания се произвеждат в специфичен контекст и не могат да бъдат разбрани (дори в границите, посочени по-горе за тълкуването на термина „разбиране“; виж § 9.2.9) без познаване на съответните контекстуални характеристики. Освен това, в хода на разговор (да приемем, че имаме работа с разговор), контекстът непрекъснато се развива, в смисъл, че „абсорбира“ от казаното и случващото се всичко, което е от значение за продукцията и разбиране на последващи изказвания. Краен случай на контексти, които не са „разработени“ в този смисъл, биха били тези, в които участниците в разговора не разчитат на предварително знание един за друг, нито на „информацията“, съдържаща се в предишни изречени изказвания, но в които те използват повече общи мнения, обичаи и предпоставки, които преобладават в дадена специфична „сфера на разсъждение” и в дадено общество. Такива контексти – ще ги наречем ограничени контексти(ограничени контексти) - сравнително рядко, тъй като разбирането на повечето твърдения зависи от информацията, съдържаща се в предишни твърдения. Не трябва да изпускаме от поглед връзките между изказвания и конкретни контексти.

Втората точка е следната: тъй като изреченията никога не се произвеждат от говорещите (в края на краищата изреченията са теоретични единици, установени от лингвистите с цел описание на ограниченията на разпространението върху появата на класове от граматични елементи), не може да има пряка връзка между изреченията и конкретни контексти. В същото време изказванията имат граматична структура, която зависи от тяхното „извеждане“ от изреченията, а граматичната структура на изказванията е или може да бъде семантично релевантна. Това е особено ясно в случай на синтактична „двусмисленост“ (вж. § 6.1.3). Освен това (с изключение на такива „готови“ изрази като „Как си? „Здравей!“), изказванията се произвеждат от говорещите и се разбират от слушателите въз основа на закономерностите в конструкцията и трансформациите, определени за изреченията от правилата на граматиката. Понастоящем нито лингвистиката, нито която и да е друга наука, занимаваща се с изучаването на „механизмите“, лежащи в основата на производството на изказвания, са в състояние да направят някакви категорични твърдения за това как знанието за абстрактните отношения, които се поддържат между граматическите елементи в изреченията, взаимодействат с различни свойства на контекстите, което води до формирането и разбирането на изказвания, в които се намират „корелати“ на тези граматични елементи. Самият факт, че има определено взаимодействие между граматическата структура на езика и съответните контекстуални характеристики, изглежда неоспорим и трябва да вземем предвид този факт.

Тъй като по принцип не можем да идентифицираме нито онези действителни елементи, които говорещият „избира“ в процеса на формиране на изказвания, нито всички релевантни характеристики на конкретни контексти, можем да приемем като методологично решение принципа, който лингвистите обикновено следват в практиката, и а именно, да се разгледат семантичните отношения между изказванията от гледна точка на семантичните отношения, които се поддържат между изреченията, въз основа на които често се смята, че изказванията са „създадени“, когато са произведени от носители на езика в ограничен контекст. (Концепцията за „ограничен контекст“ все още трябва да се запази, тъй като, както ще видим по-долу, е невъзможно да се формулират семантичните отношения, които съществуват между изреченията, без поне в малка степен да се вземе предвид „контекстуализацията“; вж. § 10.1.2.) След това ще бъдат извиквани свойства на определени контексти (във форма, която, поне засега, може да се характеризира като ad hoc описание), за да се отчетат „остатъчните“ семантично релевантни аспекти на изказванията. Това, което представихме тук като съзнателно, методологично решение обаче не трябва да се приема така, сякаш искаме да подчертаем предимството на граматическото над контекстуалното в психологическите процеси на производство и разбиране на изказване.

9.3.10. ЕЛЕМЕНТИТЕ НА ДЪЛБОКАТА СТРУКТУРА ИМАТ ЗНАЧЕНИЕ В ИЗРЕЧЕНИЯТА

Сега можем да приложим концепцията за „имащ значение“ към граматическите елементи, от които се генерират изречения посредством правила, които определят конструкцията и трансформацията на техните основи (вж. § 6.6.1). Тъй като имането на значение включва „избор“, следва, че никакви елементи, въведени в изречения чрез задължителни правила, не могат да имат значение в нашия смисъл. (Фикшиви елементи като do (спомагателният глагол) в Искате ли да отидете? нямат значение; вж. § 7.6.3.) Освен това, ако приемем, че всички „избори“ се извършват във връзка с избора на елементи в "дълбоката" структура (тези елементи са или "категории", или "характеристики"; срв. § 7.6.9), тогава ще стане ясно, че концепцията за наличие на значение не е обвързана с единици от определен ранг. Първо, разграничението в езика на такива единици като морфеми, думи и групи от думи (фрази) се основава до известна степен на „повърхностна“ структура (§ 6.6.1); и, второ, има много „граматически категории“ (време, настроение, аспект, род, число и т.н.; срв. § 7.1.5), които могат или не могат да бъдат реализирани в морфеми или в думи, но които съставляват системи на „избори“ в предложенията. Въпросът дали може или не може да се направи строго разграничение между „лексикално“ и „граматично“ значение, като се вземе предвид точно какво значение имат елементите, ще бъде разгледан по-долу (вж. § 9.5.2). Тук е достатъчно да се отбележи, че концепцията за наличие на значение се отнася еднакво за елементи от двата типа в "дълбоката" структура на изреченията. Освен това, тази концепция се взема предвид, изрично или имплицитно, във всички съвременни лингвистични теории. Класове елементи (означени или със спомагателни, или с крайни символи - виж § 6.2.2) се установяват във всяка точка на "избор" в процеса на генериране на изречения.

От казаното следва, че нито един елемент в изречението няма значение, освен ако не е член на един от синтактично определени класове в "дълбоката" структура на изречението: и именно този факт оправдава предположението, почти универсално направено от лингвисти, логици и философи, че наборът от елементи, имащи значение в определен език, е, поне в много висока степен, съизмерим с набора от крайни „компоненти“ и „характеристики“ на този език. От това обаче не следва, че всеки „компонент“ и всяка „характеристика“ ще имат значение във всяко изречение, където се срещат. Този важен момент понякога се пренебрегва от лингвистите и следователно заслужава малко по-подробно разглеждане.

Целият проблем се свежда до разграничението между граматична и семантична приемливост. Както видяхме в една от предишните глави (вж. § 4.2.12 и следващите), граматичността е онзи аспект на приемливостта на изказванията, който може да бъде обяснен от гледна точка на правила за конструиране и трансформация, които определят допустимите комбинации от разпределителни класове на елементи ("категории" и "признаци") в изречения. Обикновено се смята, че граматиката на всеки език произвежда, по-специално, безкраен брой изречения, които са неприемливи в различни отношения; и стана традиционно да се описва поне един вид неприемливост, като се характеризират въпросните предложения като „безсмислени“ или „без съдържание“. Нека следните изречения са генерирани от английската граматика (и следователно са граматически правилни):

(a) Джон пие мляко (бира, вино, вода и т.н.) „Джон пие мляко (бира, вино, вода и т.н.)“

(б) Джон яде сирене (риба, месо, хляб и т.н.) „Джон яде сирене (риба, месо, хляб и т.н.)“

(c) Джон пие сирене (риба, месо, хляб и т.н.) „Джон пие сирене (риба, месо, хляб и т.н.)“

(d) Джон яде мляко (бира, вино, вода и т.н.) „Джон яде мляко (бира, вино, вода и т.н.).“

Нека освен това приемем, че всички тези изречения, когато са генерирани, са снабдени с едно и също структурно описание: че глаголите пия и ям, както и съществителните мляко, бира, вино, вода "вода", сирене "сирене", риба " риба", месо "месо", хляб "хляб" и т.н. не се отличават в лексиката с никакви съответни синтактични характеристики. Очевидно е, че при определено разбиране на термините „приемливо“ и „неприемливо“, твърдения, изведени от изречения, групирани в класове (a) и (b), са приемливи, докато твърдения, изведени от изречения в групи (c) и (d ) са неприемливи (при „естествени“ обстоятелства). Трябва ли да описваме този тип приемливост и неприемливост въз основа на критерия „смисленост” (в смисъла на този термин, който предлагаме да подчертаем чрез термина „значимост”) – този въпрос ще разгледаме по-долу. Тук искаме да подчертаем, че наборите от елементи, които могат да се появят и имат значение на глагол и обект в тези изречения, са силно ограничени подмножества на онези набори от елементи, чието появяване е разрешено от правилата на граматиката. Отново, екстремният случай тук е, когато появата на даден елемент се определя изцяло от контекста на други елементи в изречението. Пример за пълна предопределеност на това ниво е появата на думата зъби в I bith him with my false teeth. Както ще видим по-долу (вж. § 9.5.3), това изречение разкрива интересен тип синтагматична „предпоставка“ от семантична гледна точка, която обикновено е скрита, но която може да бъде представена изрично, когато се появи нейното „синтактично отражение“ в изречението " под формата на "определение" (в този пример - невярно "вмъкнато"). Ако думата teeth никога не се среща в изречения, различни от тези, в които е изцяло определена от контекста си, тя няма да има значение на английски и семантикът няма да има какво да каже за нея.

Целта на нашата дискусия беше да покажем как точно понятието за значение може и трябва да бъде пренесено от нивото на доста „конкретни“ случаи, когато става въпрос за, от една страна, граматически правилни, неструктурирани цели твърдения и, от друга страна , твърдения, които се различават минимално по своята фонологична структура, до по-„абстрактно“ ниво, на което се прилага към по-важния и много по-голям клас изречения, генерирани от правилата на граматиката. Идеята за значение се подкрепя от факта, че отразява интуитивния принцип, че „смисълът предполага избор“ в определени контексти. Прехвърлянето му на по-„абстрактно“ ниво се основава на методологично решение, чиято мотивация има два аспекта: първо, това решение признава факта, че специфични контекстуални характеристики, влияещи върху производството и интерпретацията на изказвания, могат да бъдат описани само ad hoc; и второ, този подход задоволително свързва семантичната интерпретация на изреченията с тяхното синтактично описание. Ако се установи, че някакъв определен елемент има значение в определен клас изречения, тогава можем да попитаме какво значение има този елемент; и на този въпрос може да се отговори по различни начини, както ще видим в следващия раздел.

9.3.11. "ЗНАЧЕНИЕ"

Сега трябва да се спрем накратко на понятието „значимост“ (вж. §9.3.1). На пръв поглед е напълно оправдано да искаме да идентифицираме значението с пълна приемливост по отношение на специфични контексти в случай на твърдения и по отношение на по-общи ограничени контексти в случай на изречения. Но вече видяхме, че има много слоеве на приемливост (разположени "над" граматичния слой), които, въпреки че често се описват без уточнение като "семантични", все пак могат да бъдат разграничени от това, което традиционно се нарича "съдържание" или "значимост" " (вж. § 4.2.3). Някои твърдения могат да бъдат осъдени като „богохулни“ или „неприлични“; други може да се считат за приемливи при определени употреби на език (молитви, митове, приказки, научна фантастика и т.н.), но да бъдат неприемливи в ежедневния разговор. Едва ли е препоръчително да се прави опит за дефиниция на „значимост“, която да обхваща всички тези различни „измерения“ на приемливостта. Да вземем пример от английския: въпреки че глаголът die се използва свободно във връзка с одушевени съществителни, включително имена на лица, има общоприето табу в английския език срещу използването му във връзка с баща ми, майка ми. ", брат ми " брат ми" и сестра ми "сестра ми" (т.е. по отношение на най-близките членове на семейството на говорещия); Така Баща ми почина снощи би се считало за неприемливо, но не и Баща му почина снощи. Тогава, очевидно, правилното обяснение на недопустимостта на изречението Баща ми почина снощи трябва да е такова, че да можем да кажем, първо, че е „смислено“, тъй като, ако се използва в противоречие с табуто, то ще бъде разбрано (всъщност може да се твърди, че самото табу зависи от възможността за разбиране на това изречение), и, второ, че семантичната връзка между баща ми почина снощи и баща му почина снощи е идентична с връзката между баща ми дойде снощи и Баща му дойде снощи "Баща му дойде снощи" и т.н. Традиционно значението на граматически правилните изречения се обяснява от гледна точка на някои общи принципи на съвместимост на "значенията" на техните съставни елементи. Може да се каже например, че изреченията Джон яде мляко и Джон пие хляб са безсмислени, тъй като глаголът яде е съвместим само със съществителни (в обектна функция), обозначаващи твърди вещества, подходящи за консумация вещества, и глаголът пия „да пия“ - със съществителни, обозначаващи течни вещества, годни за консумация. (Имайте предвид, че от тази гледна точка изречението Джон яде супа може да се разглежда като семантично аномално, имащо „социална приемливост“ само по силата на специална конвенция, външна на общите правила за тълкуване на английските изречения.) Има големи последици свързани с концепцията за значимост, трудности (може да твърдим, например, че Джон яде мляко е „смислено“ изречение, въпреки че обстоятелствата, при които може да се използва, са донякъде необичайни). Независимо от това, традиционното обяснение на тази концепция от гледна точка на „съвместимост“ изглежда до голяма степен разумно. Ще разгледаме някои от най-новите формулировки на тази концепция в следващата глава (вж. § 10.5.4).

9.4.1. СПРАВКА

Терминът „препратка“ („съотношение“) беше въведен по-рано за връзката, която се осъществява между думите, от една страна, и нещата, събитията, действията и качествата, които те „заменят“, от друга (вж. §9.2 .2 ). По-горе беше посочено, че при определени условия въпросът „Какво е значението на думата х? може да се отговори с помощта на „остензивно“ определение – чрез посочване или по друг начин директно посочване референт(или референти) на дадена дума (вж. § 9.2.7). Има добре известни философски трудности, свързани с точната дефиниция на понятието „референция“, които не е необходимо да се разглеждат тук. Нека приемем, че връзката на препратката (понякога наричана „денотация“) задължително трябва да се вземе предвид, когато се конструира всяка задоволителна теория на семантиката; с други думи, в известен смисъл можем да кажем, че поне някои речникови единици във всички езици могат да бъдат поставени в съответствие с определени „свойства“ на физическия свят.

Предположението, което направихме, не означава, че разглеждаме препратката като семантично отношение, към което могат да бъдат сведени всички други отношения; Нито означава, че всички речникови единици на даден език имат препратка. „Препратката“, както се разбира в тази работа, е задължително свързана с основните предположения за „съществуване“ (или „реалност“), които са извлечени от нашето пряко възприятие на обекти във физическия свят. Когато казваме, че определена дума (или друга единица със значение) „се отнася до някакъв обект“, имаме предвид, че референтът на думата е обект, който „съществува“ (е „реален“) в същия смисъл, в който казваме че конкретни хора, животни и неща „съществуват“; това също предполага, че по принцип може да се даде описание на физическите свойства на въпросния обект. Тази концепция за "физическо съществуване" може да се счита за фундаментална за дефинирането на семантичното отношение на референцията. Прилагането на термините „съществуване“ и „позоваване“ може да бъде разширено по няколко начина. Например, въпреки че няма такива обекти като брауни, еднорози или кентаври (такова ще бъде нашето предположение), би било съвсем разумно да им се припише фиктивно или митично „съществуване“ в разсъжденията от определен вид; и така можем да кажем, че думите гоблин, еднорог или кентавър имат препратка на английски (в рамките на съответното разсъждение). По подобен начин можем да разширим използването на термините „съществуване“ и „препратка“, за да включим такива теоретични конструкции на науката като атоми, гени и т.н., и дори напълно абстрактни обекти. Важно е обаче да се отбележи, че източникът на тези „аналогични“ разширения на понятията „съществуване“ и „препратка“ трябва да се търси в тяхното фундаментално или основно приложение към физически обекти в хода на „ежедневната“ езикова употреба .

От тази интерпретация на понятието за препратка следва, че в речника на един език може да има много единици, които не са свързани чрез препратка към никакви единици извън езика. Например, може да се мисли, че няма такива неща като интелигентност или доброта, с които се свързват думите интелигентен и добър, въпреки че психолог или философ винаги може да постулира съществуването на такива същности в рамките на някаква конкретна теория на психологията или етика и може дори да твърдят, че тяхната „реалност“ може да бъде демонстрирана чрез някакво „остензивно“ определение. Фактът, че на различни нива на такива софистични конструкции могат да възникнат разногласия между техните автори по отношение на „реалността“ на определени въображаеми „обекти“, не променя общото твърдение, че референцията предполага съществуване. Би било безполезно да се настоява, че всички лексикални единици трябва нещокорелират, ако имаме предвид, че в определени случаи е невъзможно да се изтъкнат други доказателства за съществуването на това „нещо“, освен самия факт на наличието на някаква лексикална единица, „съотнесена“ с това „нещо“.

Във връзка с понятието референция могат да се отбележат още два момента. Въпреки че сме съгласни, че някои лексикални единици се отнасят до обекти и свойства на обекти извън езика, ние не сме длъжни да заключим логически, че всички обекти, обозначени с определена дума, образуват „естествен клас“ (независимо от „конвенцията““, мълчаливо приета от членовете на даден речеви колектив, за да се субсумират тези обекти „под“ някакъв общ термин); с други думи, описаната по-горе позиция е съвместима или с „номинализма“, или с „реализма“ във философската семантика. Второ, препратката към лексикална единица не трябва да бъде точна и напълно дефинирана в смисъл, че винаги е ясно дали определен обект или свойство попада или не попада в обхвата на дадената лексикална единица: вече видяхме, че такова предположение не е необходимо, за да се обясни „разбирането“ на изказванията в процеса на нормална комуникация (вж. § 9.2.9). Доста често „референтните граници“ на лексикалните единици са несигурни. Невъзможно е например да посочим напълно определена точка, в която трябва да прокараме разделителна линия между референтите на думите хълм и планина, пиле, пиле; млад петел; кокошка; пилешко месо и кокошка. , зелен „зелен“ и синьо "синьо; синьо, лазурно; синкаво" и т.н. Но това не означава, че понятието за препратка не е приложимо към такива думи. Характерна особеност на езиците е, че те налагат определена лексикална „категоризация“ на реалния свят и, така да се каже, чертаят „произволни“ граници на различни места. Както ще видим, това е една от причините, поради които често е невъзможно да се установят лексикални еквивалентности между различните езици. Фактът, че „референтните граници“ са „произволни“ и неопределени, обикновено не води до прекъсване на взаимното разбиране, тъй като „точното“ включване на обект „под“ една или друга лексикална единица е много рядко уместно; и когато се окаже уместно, се обръщаме към други системи за идентификация или спецификация. Например, ако искаме да обозначим едно от две лица, всяко от които може да се нарече или с думата момиче, или с думата жена, можем да ги различим едно от друго по име, по относителна възраст, по цвят на косата, по начина, по който са облечени и т.н. Въпреки че референтите на думата момиче се „припокриват” с референтите на думата жена, двете думи не са синоними; тяхната относителна позиция на възрастовата скала е фиксирана и има много случаи, в които само една от тях е подходящата дума за използване. „Неточността“ на референцията, която илюстрирахме, далеч не е дефект на езика (както смятат някои философи), а прави езика по-ефективно средство за комуникация. Абсолютната "прецизност" е недостижима, тъй като няма ограничение за броя и естеството на разграниченията, които могат да бъдат направени между различни обекти; и едва ли има някаква заслуга в насилственото правене на повече разграничения, отколкото е необходимо за настоящите цели.

9.4.2. СЕНС

Сега трябва да въведем понятието "смисъл". Под значениедумата се отнася до нейното място в системата от връзки, в които тя влиза с други думи в речника на езика. Ясно е, че тъй като значението трябва да се дефинира от гледна точка на отношенията, които се осъществяват между единиците на речника, то не носи със себе си никакви основни предположения за съществуването на обекти или свойства извън речника на въпросния език.

Ако два елемента могат да се появят в един и същ контекст, тогава те имат значениев този контекст; и освен това може да се чудим дали Какво означавате имат. Както видяхме, една част или компонент от значението на определени елементи може да се опише по отношение на тяхната препратка. Независимо дали два елемента имат препратка или не, можем да попитаме дали те, в контекста или контекстите, в които се срещат и двата, имат едно и също значение или не. Тъй като същата стойност е синонимия- има връзка, която се осъществява между две (или повече) речникови единици; тя е свързана със значение, а не с препратка. Поради причини, които не е необходимо да разглеждаме тук, понякога може да е удобно да се каже, че две единици имат една и съща препратка, но се различават по значение; и, разбира се, естествено е да се каже, че единиците могат да бъдат синоними, дори ако им липсва препратка. Може да се приеме, че (за единици с референция) идентичността на референцията е необходимо, но не достатъчно условие за синонимия.

Теоретичните съображения за синонимията често са неадекватни поради две неоправдани предположения. Първият от тях е, че два елемента не могат да бъдат "перфектно синоними" в един контекст, освен ако не са синоними във всички контексти. Това заключение понякога е оправдано чрез позоваване на разграничението между „концептуално“ и „емоционално“ значение. Но самото това разграничение се нуждае от обосновка. Не може да се отрече, че изборът на даден говорещ на една единица, а не на друга, се определя от „емоционални асоциации“. Това обаче не означава, че „емоционалните асоциации“ винаги са уместни (дори ако са общи за всички членове на речевата общност). И не може просто да се разглежда като предпоставка твърдението, че думите винаги носят „асоциации“, изведени от употребата им в друг контекст. Следователно ще отхвърлим предположението, че думите не могат да бъдат синоними в някои контексти, освен ако не са синоними във всички контексти.

Второто предположение, което често се прави от семантиците, е, че синонимията е връзка на идентичност, поддържана между две (или повече) независимо дефинирани значения. С други думи, въпросът дали две думи - a и b - са синоними, се свежда до въпроса дали a и b означават една и съща същност, едно и също значение. В рамките на подхода към семантиката, който очертаваме в тази книга, няма да е необходимо да постулираме съществуването на независимо дефинируеми значения. Синонимията ще бъде дефинирана по следния начин: две (или повече) единици са синоними, ако изреченията, произтичащи от заместването на една единица с друга, имат едно и също значение. Това определение изрично се основава на априорното понятие за „еднаквост на значението“ за изречения (и изказвания). Ще се върнем към този въпрос по-късно. Тук искаме само да подчертаем идеята, че връзката на синонимията се определя като връзка, която се осъществява между лексикалните единици, а не между техните значения. Синонимността на лексикалните единици е част от тяхното значение. Същата идея може да бъде формулирана в по-обща форма: това, което наричаме значение на лексикална единица, представлява целия набор семантични отношения(включително синонимия), в която влиза с други единици в речниковия състав на езика.

9.4.3. ПАРАДИГМАТИЧНИ И СИНТАГМАТИЧНИ СМИСЛЕНИ ВРЪЗКИ

В допълнение към синонимията има много други семантични отношения. Например съпруг и съпруга не са синоними, но са семантично свързани по начин, който не съществува между съпруг и сирене или водород; добро и лошо имат различни значения, но са по-близки от добро и червено или кръгло; knock "чукам; ударя", bang "удрям, чукам; пляскам; грохот", tap "леко ударя, почуквам" и rap "леко ударя; почуквам, почуквам" са свързани чрез връзка, която не се отнася за думите почуквам и ям "яж, яж" " или се възхищавам "да се възхищавам". Отношенията, илюстрирани тук, са парадигматичен(всички членове на набори от семантично свързани термини могат да се срещат в един и същи контекст). Думите също могат да бъдат свързани една с друга синтагматично; срв.: blond “рус” и hair “коса”, bark “лай” и dog “куче”, kick “ритам, ритам, ритам” и foot “крак” и др. (Общи принципи за разграничаване на парадигматични и синтагматични отношения, виж § 2.3.3.) Тук няма да разглеждаме въпроса дали тези синтагматични и парадигматични отношения (както предлагат някои семантици) могат да бъдат дефинирани от гледна точка на тяхното „разстояние“ от синонимията по скала на еднаквост и значение на разлика: алтернатива подходът към това ще бъде описан в следващата глава. Тук просто правим предположението, че поне някои области от речника са разделени на лексикални системиКакво от това? семантична структураТези системи трябва да бъдат описани от гледна точка на семантични връзки, които се осъществяват между лексикалните единици. Ние считаме това твърдение за усъвършенствана формулировка на принципа, според който „значението на всяка единица е функция от мястото, което тя заема в съответната система“ (срв. § 2.2.1, където се сравняват руските и английските термини за родство) .

През последните години беше свършена много работа за изучаване на лексикалните системи в речника на различни езици, особено във връзка с такива полета(или региони), като родство, цвят, флора и фауна, мерки и тежести, военни звания, морални и естетически оценки, както и различни видове знания, умения и разбирания. Резултатите допълнително демонстрираха стойността на структурния подход към семантиката и потвърдиха прогнозите на учени като Хумболт, Сосюр и Сапир, че речниците на различни езици (поне в определени области) не е изоморфенче има семантични разграничения, които се правят на един език, а не на друг; Освен това категоризирането на конкретни полета на различни езици може да се извърши по различни начини. Изразявайки този факт със сосюровски термини, се казва, че всеки език налага специфично формадо априори недиференцирани веществоплан на съдържанието (вж. § 2.2.2 и § 2.2.3). За да илюстрираме тази концепция, можем да вземем (като субстанция) полето на цвета и да видим как това понятие се тълкува или „формулира“ на английски.

За простота първо ще разгледаме само тази част от полето, която е покрита с думите червено, оранжево, жълто, зелено и синьо. Всеки от тези термини е референтно неточен, но относителната им позиция в тази лексикална система е фиксирана (и като цяло те покриват по-голямата част от видимия спектър): оранжевото е между червено и жълто, жълтото е между оранжево и зелено и т.н. д. значението на всяка от тези думи включва индикация, че те принадлежат към тази конкретна лексикална система на английския език и че в тази система те стоят една с друга в връзка на съседство (или, може би по-точно, „намират се между“). Може да изглежда, че понятието за значение тук е излишно и че за да се опише значението им, би било напълно достатъчно да се вземе предвид препратката към всеки от термините за цвят. Нека обаче разгледаме условията, при които човек може да знае (или може да се смята, че знае) препратката към тези думи. Дете, което учи английски, не може да придобие първо референцията на думата зелено, а след това на свой ред референцията на думата синьо или жълто, така че в определен момент да може да се каже, че знае референцията на една дума, но не знае референцията на другия. (Разбира се, чрез остензивния начин на дефиниция той може да разбере, че думата зелено се отнася до цвета на тревата или листата на определено дърво, или цвета на една от роклите на майка му: но препратката към думата зелено е по-широк от всеки конкретен случай на нейното използване и познаването на нейната референция включва и познаване на границите на тази референция.) Трябва да се приеме, че за определен период от време детето постепенно научава позицията на думата зелено по отношение на думите синьо и жълто и думите жълто по отношение на думите зелено и оранжево и т.н. докато , докато не знае позицията на всеки цветен термин спрямо съседния му в дадена лексикална система и приблизителния обхват на границите на региона в континуума на дадено поле, което се покрива от всяка дума. Неговото знание за значението на цветните термини по този начин задължително включва знание както за тяхното значение, така и за тяхната референция.

Полето, обхванато от петте цветови термина, обсъдени по-горе, може да се разглежда като недиференцирана (перцептивна или физическа) субстанция, върху която английският налага някаква специфична форма чрез очертаване на граници на определени места и към така получените пет области прилага определена лексикална класификация (наричайки ги с думи червено, оранжево, жълто, зелено и синьо). Често се отбелязва, че други езици налагат различна форма на това вещество, тоест разпознават в него различен брой региони и чертаят граници на други места. По отношение на горния пример можем да кажем, че руски думи синИ синзаедно покриват приблизително същата област като английската дума blue; обозначаващи специални, макар и съседни цветове и заемащи равнопоставена позиция в системата с думи зеленоИ жълто, те не трябва да се разглеждат като думи, които обозначават различни нюанси на един и същи цвят по същия начин, както червено и червено, заедно с други думи, подразделят областта, покрита от думата червено на английски (вж. § 2.2.3).

Връзката между цветовите термини и тяхното значение не може да бъде осмислена по директния начин, който сме правили досега. Разликата в препратката към думите червено, оранжево, жълто, зелено и синьо може да бъде описана от гледна точка на вариация тонове(отражения на светлина с различни дължини на вълната). Физиците правят разлика между две други променливи, когато анализират цвета: господство, или яркост (отразяване на повече или по-малко светлина), и насищане(степен на свобода от бели примеси). Цветните региони, обозначени на английски с думите черно, сиво и бяло, се отличават главно с лекота, но позоваването на някои други често използвани цветови термини трябва да се даде, като се вземат предвид и трите измерения, по които цветът може да варира, например: кафяво “ кафяво” се отнася до цветовата гама, която е разположена в тон между червено „червено” и жълто „жълто”, има относително ниска светлота и наситеност; розовото се отнася до цвят, който е червеникав на тон, има доста висока лекота и много ниска наситеност. Анализът на тези факти може да доведе до идеята, че веществото на цвета на листните въшки е триизмерен (физически или перцептивен) континуум.

Но това твърдение също изглежда прекалено опростено. Не само езиците се различават по относителното тегло, което придават на измеренията - оттенък, светлота и наситеност - в организацията на техните системи за цветово означение (например латинският и гръцкият изглежда ценят лекотата, а не нюанса) ; Има езици, в които цветовите разграничения се правят въз основа на напълно различни принципи. В класическото си изследване по тази тема Конклин показа, че четирите основни „цветови термина“ на езика Хануну (език, роден във Филипините) са свързани с лекота (включително обикновено бяло и светли нюанси на други „английски цветове“), тъмнина (включително английско черно, виолетово, синьо, тъмнозелено и тъмни нюанси на други цветове), "влажност" (обикновено свързана със светлозелено, жълто и светлокафяво и т.н.) и "сухота" (обикновено свързана с кестеняво, червено, портокал и др.). Че разграничението между „мокро“ и „сухо“ не е просто въпрос на тон („зелен“ срещу. „червено“: това разграничение може да е очевидно въз основа на най-често срещаните английски преводи на въпросните два термина), става ясно от факта, че „лъскав, влажен, кафявопарче прясно отрязан бамбук" се описва с дума, която обикновено се използва за светлозелен цвят и т.н. Конклин заключава, че "цветът, в тесния смисъл на думата, не е универсално понятие в западноевропейските езици"; че опозициите, по отношение на които се определя цветното вещество в различни езици, могат да зависят преди всичко от връзката на лексикалните единици с онези свойства на обектите в естествената среда на човек, които са важни за дадена култура. Що се отнася до езика Ханунбо, системата от неговите определения очевидно се основава на типичния външен вид на свежи, млади („мокри“, „сочни“) растения. В това отношение си струва да се отбележи, че английските речници често дефинират основни цветови термини във връзка с типичните свойства на човешката среда (например в речника може да се каже, че синьото съответства на цвета на ясното небе, червеното на цвета на кръв и др.).

9.4.6. СЕМАНТИЧНА „ОТНОСИТЕЛНОСТ“

Цветното поле беше обсъдено доста подробно, защото много често се използва като пример, за да се демонстрира как един и същедно вещество може да има различни форми, наложени му от различните езици. Сега знаем, че дори в случая с цветното обозначение имаме всички основания да се съмняваме във възможността за априорно постулиране на идентичността на „субстанцията на съдържанието“. Описанията на Конклин на категориите "цвят" в Hanunoo естествено трябва да ни наведат на мисълта, че лингвистично релевантните дефиниции на субстанцията на цвета едва ли винаги са тези измерения, които са избрани като фундаментални от естествените науки. Това води до общото заключение, че езикът на дадено общество е неразделна част от неговата култура и че лексикалните разграничения, направени от всеки език, обикновено отразяват важни (от гледна точка на тази култура) свойства на обекти, институции и дейности. на обществото, в което функционира езикът. Това заключение се потвърждава от редица скорошни изследвания в различни области на лексиката на различни езици. С оглед на факта, че естествената среда на различните общества може да бъде много различна (да не говорим за техните социални институции и модели на поведение), самата възможност за плодотворно разглеждане на семантичната структура като резултат от суперпозицията на формата върху нейната основа (перцептивна) , физическа или концептуална) субстанция изглежда много съмнителна, обща за всички езици. Както каза Сапир: „Световете, в които живеят различни общества, са отделни светове, а не един и същ свят с различни етикети, прикрепени към него.“

Дори ако приемем, че различните общества живеят в „специални светове“ (и ние ще се върнем към този въпрос скоро), все още може да се твърди, че всеки език налага някаква специфична форма върху субстанцията на „света“, в който функционира. Това е вярно до известна степен (както видяхме, например, в случая с цветовите термини). Важно е обаче да се знае, че лексикалните системи не трябва да се изграждат на базата на предварително определена „основна“ субстанция. Нека, например, думите честност "честност, правдивост, искреност, праволинейност, целомъдрие, добродетел, благоприличие", искреност "искреност, откровеност, праволинейност, честност", целомъдрие "целомъдрие, девственост, чистота, чистота, добродетел, строгост, простота , скромност , сдържаност, въздържание, въздържание", вярност "вярност, преданост, лоялност, точност, коректност" и др. попадат в една лексикална система с думата добродетел "добродетел, морал, целомъдрие, добро качество, положителна черта, достойнство. " Структурата на тази система може да бъде описана от гледна точка на семантичните отношения, които се осъществяват между нейните членове. От тази гледна точка въпросът дали има някакви „съществени“ корелации между лексикални единици и разпознаваеми черти на характера или модели на поведение е без значение. Ако се наблюдават такива корелации, те ще бъдат описани по-скоро като справка, отколкото като значение. Накратко, приложимостта на понятието за субстанция в семантиката се определя от същия постулат за „съществуване” като понятието за референция (вж. § 9.4.1).

Твърдението, че „световете, в които живеят различни общества, са специални светове“, често се тълкува като прокламиране на езиков „детерминизъм“. Дали Сапир (или Хумболт преди него и Уорф след него) са вярвали, че нашата категоризация на света се определя изцяло от структурата на нашия роден език е въпрос, който няма да обсъждаме тук. Повечето учени са съгласни, че лингвистичният детерминизъм, разбиран в този силен смисъл, е несъстоятелна хипотеза. Възприетата по-горе гледна точка обаче, според която езиците отразяват в своята лексика различия, които са важни от гледна точка на културата на обществата, в които функционират, отчасти ни склонява към позицията на езикова и културна „относителност“ . Ето защо трябва да подчертаем безспорния факт, че разбирането на структурата на лексикалните системи на езици, различни от нашия роден, е необходимо и напълно възможно както при овладяването им за практически цели, така и при изучаването на техния речник. Възможността за превод от един език на друг очевидно зависи от това.

9.4.7. СЪВПАДАНЕ НА КУЛТУРИ

Културите (както терминът се използва от антрополози и социолози) не са в пряко съответствие с езиците. Например много от институциите, обичаите, облеклото, мебелите, храната и т.н., които се провеждат във Франция и Германия, наблюдаваме и в Англия; други се оказват характерни за отделни страни или за определени региони или социални класи на една страна. (Връзката между език и култура е, разбира се, много по-сложна, отколкото предполага това опростено представяне: политическите граници не съвпадат с езиковите граници, дори ако без доказателства считаме концепцията за единна речева общност за донякъде легитимна; културни прилики може да се намери между различни социални групи в различни страни и т.н.). Като цяло може да се твърди, че между всеки две общества ще има по-голяма или по-малка степен на културно припокриване; и може да се окаже, че определени черти ще присъстват в културата на всички общества. Практическият опит в изучаването на чужди езици (в нормалните условия, в които се използват тези езици) предполага, че бързо идентифицираме определени обекти, ситуации и знаци, когато културите съвпадат и лесно научаваме думите и изразите, приложени към тях. Значенията на други думи и изрази се усвояват по-трудно и правилното им използване идва, ако изобщо идва, само в резултат на дълга разговорна практика. Теоретичната интерпретация на тези факти от нашия опит може да бъде следната: входът към семантичната структура на друг език се отваря от зоната на съвпадение на културите; и след като веднъж сме прекъснали този кръг от значения чрез идентифициране на единиците в тази област (вж. § 9.4.7, относно неизбежния "кръгов" характер на семантиката), можем постепенно да подобрим и изясним познанията си за останалата част от речника отвътре, чрез придобиване на препратка към лексикални единици и семантични отношения, свързващи единици в контекста на тяхната употреба. Истинският билингвизъм включва овладяване на две култури.

9.4.8. "ПРИЛОЖЕНИЕ"

Ако единиците на различни езици могат да бъдат поставени в съответствие една с друга въз основа на идентифициране на общи характеристики и ситуации на две култури, можем да кажем, че тези единици имат едно и също приложение. Причината за използването на този термин вместо „препратка“ се дължи на две съображения. На първо място, предложеният термин обозначава връзката, която се осъществява между ситуации и изрази, които се срещат в тези ситуации (например връзката между Извинете ме „Извинете ме“, Благодаря „Благодаря“ и т.н. и различни характерни ситуации в кои са тези твърдения); това очевидно не е референтна връзка. Второ, необходимо е също така да се вземе предвид семантичната идентификация на лексикални единици, които нямат препратка; желателно е да се каже например, че английската дума sin "грех" и френската дума peche имат едно и също приложение, въпреки че може да е много трудно или дори невъзможно да се установи този факт от референтна гледна точка. Може да се случи втората от тези причини за въвеждане на понятието „приложение“ да изчезне, след като бъде изградена всеобхватна и задоволителна теория на културата. Понастоящем тълкуването на приложението, подобно на процеса на превод, зависи основно от интуицията на двуезичните говорещи. Това не означава, че понятието няма обективно съдържание, тъй като двуезичните говорещи обикновено се споразумяват помежду си за употребата на повечето думи и изрази в езиците, които използват.

Този раздел не каза нищо за това как се установяват парадигматичните и синтагматичните семантични отношения. Преди да се обърнем към този въпрос, трябва да разгледаме възможността за разширяване на понятията за препратка и значение и към граматическите единици.

9.5. „ЛЕКСИКАЛНО“ ЗНАЧЕНИЕ И „ГРАМАТИЧЕСКО“ ЗНАЧЕНИЕ

9.5.1. "СТРУКТУРНИ СТОЙНОСТИ"

При разглеждането на въпроса за „граматическите категории“ се позовахме на традиционната, „аристотелова“ гледна точка, според която само главните части на речта (съществителни, глаголи, „прилагателни“ и наречия) са „смислени“ в пълен обем. смисъл на термина (те „обозначават“ „понятия“, които съставляват „материята“ на дискурса), а останалите части на речта участват във формирането на общия смисъл на изреченията, налагайки определена граматична „форма“ върху „съдържанието“ ” на дискурса (вж. § 7.1.3). Изненадващо подобни възгледи се защитават от много противници на традиционната граматика.

Например Фриз прави разлика между „лексикални“ и „структурни“ значения и този контраст точно отразява „аристотеловото“ разграничение между „материални“ и „формални“ значения. Основните части на речта имат „лексикално“ значение; и е дадено в речник, който е свързан с определена граматика. Напротив, разграничението между субект и обект в изречението, опозицията в определеност, време и число и разграничението между твърдения, въпроси и искания са всички разлики, свързани със „структурните значения“. („Общото лингвистично значение на всяко изказване се състои от лексикалните значения на отделните думи плюс такива структурни значения... Граматиката на езика се състои от средства за сигнализиране на структурни значения.“)

Концепцията на Frieze за “структурно значение” включва най-малко три различни вида семантична функция; други лингвисти използват термина „граматично значение“ (за разлика от „лексикално значение“) в същия смисъл. Споменатите три вида „значение“ са: (1) „значението“ на граматичните единици (обикновено спомагателни части на речта и второстепенни граматически категории); (2) „значението“ на граматичните „функции“ като „субект“, „обект“ или „модификатор“; (3) „смисъл“, свързан с понятия като „декларативен“, „въпросителен“ или „повелителен“ при класифицирането на различни типове изречения. Важно е да се прави разлика между тези типове „граматически значения“ и ние ще ги разгледаме на свой ред по-долу.

9.5.2. ЛЕКСИЧНИ И ГРАМАТИЧНИ ЕДИНИЦИ

Предложени са различни критерии за разграничаване на граматични и лексикални единици. Най-задоволителният от тях (и единственият, който ще споменем тук) е формулиран от Мартине, Халидей и други по отношение на парадигматична опозиция в рамките на затворен, или отворенмного алтернативи. Затворен набор от единици е набор с фиксиран и обикновено малък брой членове, например набор от лични местоимения, времена, родове и т.н. Отворен набор е набор с неограничен, неопределено голям брой членове, напр. клас от съществителни или глаголи в даден език. Използвайки това разграничение, можем да кажем, че граматичните единици принадлежат към затворени множества, а лексикалните единици принадлежат към отворени множества. Това определение съответства на традиционното разграничение между значимите части на речта, от една страна, и спомагателните части на речта и второстепенните граматически категории, от друга. За разлика от някои други предложени дефиниции, той не е обвързан с езици от един морфологичен „тип“ (например „флективни“ езици; вж. § 5.3.6). Нека засега приемем, че това определение е правилно и че (въз основа на разграничението между затворени и отворени множества) всички елементи, въведени в дълбоката структура на изреченията, могат да бъдат класифицирани като „граматически“ и „лексикални“. Сега възниква въпросът дали има принципна разлика между значението на граматичните и лексикалните единици.

Първо, отбележете, че лексикалните единици, според традиционното виждане, имат както „лексикално“, така и „граматично“ значение (както „материално“, така и „формално“ значение; срв. §9.5.1). Използвайки терминологията на схоластичната, „спекулативна“ граматика, можем да кажем, че конкретна лексикална единица, например крава, не просто „обозначава“ някаква специфична „концепция“ (това е „материалното“ или „лексикалното“ значение на единицата въпросното) , но в същото време прилага определен „начин на обозначаване“ на явления под формата например на „вещества“, „качества“, „действия“ и т.н. (срв. § 1.2.7 и § 7.1.1). Въпреки че сега лингвистите рядко се изразяват с тези термини, тази обща концепция за разграничение между "лексикалното" и "граматическото" значение на лексикалните елементи все още се използва. Освен това изглежда до известна степен оправдано.

Например, Лермонтов има известно стихотворение, което започва с думите: Бяло е самотното платно... Тази фраза е трудна (и може би невъзможна) за превод на английски, тъй като ефектът й зависи от факта, че на руски „имащ свойството бяло“ може да бъде „изразено“ с помощта на „глагол“ (тогава същото се изразява с думи бяло, което в изречения, които не са маркирани с време, вид и модалност, обикновено се използва без „глагола да бъде“; ср § 7.6.3). Комбинация самотно платноможе да се преведе на английски като "самотно платно" ( плаваме съществително, а самотен е „прилагателно“). От традиционна гледна точка „глаголът“ представлява „притежаване на свойството бяло“ като „процес“ или „дейност“, „прилагателно“ като „качество“ или „състояние“. Спецификата на предпочитания избор в този случай на „глагол“, а не на „прилагателно“ може да бъде показана със средствата на английския език само с помощта на доста неадекватна парафраза като „Има самотно платно, което се откроява (или дори блести) нататък) бяло (на фона на морето или небето)..." Проблеми от този вид са добре известни на тези, които превеждат от един език на друг. Теоретичният въпрос, който ни интересува тук, е: можем ли да кажем, че има специфично „граматично значение“, свързано с всяка от основните части на речта?

Вече видяхме, че разграничението между „глагол“ и „прилагателно“ в общата синтактична теория е труден проблем: в някои езици такова разграничение изобщо не се прави; в други езици редица синтактични характеристики са свързани с това разграничение и в определени случаи те могат да си противоречат (вж. § 7.6.4). Но основният критерий, критерият, отразяващ традиционното разграничение между „активност“ и „качество“, се крие в специфичното разграничение между „динамично“ и „статично“ (вж. § 8.4.7). На руски тази разлика в „граматическото значение“ е „наложена“ върху „лексикалното значение“, което е общо за двата „глагола“ побелявати за „прилагателно“ бяло. При този подход традиционната теория за "средствата за отбелязване" трябва да се приеме за правилна: тя, разбира се, трябва да бъде преформулирана в рамките на по-задоволителна теория за синтактичната структура.

В същото време не трябва да изпускаме от поглед общия принцип, че „да имаш смисъл включва избор“. Ако описаният език позволява избор на „вербален“ или „прилагателен“ израз (ограничаваме се до разликата, илюстрирана в нашия пример), тогава използването на единия или другия от тези методи вече попада в обхвата на семантичен анализ на езика. Освен това можем да попитаме дали дадените два "начина" на изразяване имат едно и също значение или не; и ако се различават по значение, тогава можем да попитаме каква е семантичната разлика между тях. Ако това разграничение може да се свърже с някакво граматическо разграничение в дълбоката структура (напр. „динамичен“ срещу. "статично"), тогава терминът "граматично значение" е доста подходящ за този случай. Но това не означава, че изборът на „глагол“ вместо „прилагателно“ винаги е свързан с разлика в „граматичното значение“. В много случаи определено „лексикално значение“ се свързва с една част на речта, но не и с друга. Накратко, по този въпрос, както и по много други, лингвистичната теория трябва да намери баланс между „концептуална” и „формална” граматика (вж. § 7.6.1). Не трябва да се твърди, че „обозначението на дейност“ е част от „значението“ на всеки „глагол“ или че „обозначението на качество“ е част от „значението“ на всяко „прилагателно“.

Традиционно се смята, че лексикалните единици имат както „лексикално“ („съществено“), така и „граматично“ („формално“) значение. Обикновено се счита, че граматичните единици имат само „граматическо“ значение. В предишната глава видяхме, че някои единици, действащи като „глаголи“ в повърхностната структура на изреченията, могат да бъдат интерпретирани като „лексикални реализации“ на аспектни, каузативни и други „граматически“ различия. Ще оставим настрана въпроса доколко тези хипотези отговарят на реалността. В сегашното състояние на синтактичната теория разграничението между граматични и лексикални единици е доста неясно. Причината е, че разграничението между отворени и затворени набори от алтернативи може да се приложи само към позиции на избор в дълбоката структура на изреченията; но, както видяхме, възможни са много различни гледни точки относно това къде се намират тези позиции на „избор“.

Основното, което трябва да се подчертае тук, е следното: изглежда, че няма значителна разлика между „вида значение“, свързан с лексикалните единици, и „вида значение“, свързан с граматическите единици, в случаите, когато тези два класа елементи имат дълбоко значение , структурите могат да бъдат ясно разграничени. Понятията „смисъл“ и „препратка“ се отнасят и за двата вида елементи. Ако има някакво обобщение, което може да се направи по отношение на значението на граматическите елементи (а някои чисто граматически елементи, както си спомняме, нямат никакво значение; вж. §8.4.1), то изглежда е, че граматическите „избори“ са свързани с общи понятия за пространствена и времева корелация, причинно-следствена връзка, процес, индивидуация и т.н. - понятия от типа, разгледан в глави 7 и 8. Въпреки това, не можем да кажем предварително, че в структурата на който и да е конкретен език, като понятията, дори ако са лесни за идентифициране, непременно ще бъдат „граматизирани“, а не „лексикализирани“.

9.5.3. „ЗНАЧЕНИЕ“ НА ГРАМАТИЧНИТЕ „ФУНКЦИИ“

Вторият клас явления в структурата на английския език, към които Фрийз (и други) прилага термина „структурно значение“ (или „граматично значение“), може да се илюстрира с такива понятия като „субект“, „обект“ и „дефиниция“ . Книгата на Фриз е написана преди съвременната теория за трансформационния синтаксис и той разглежда изключително повърхностната структура (в рамките на доста ограничена концепция). Следователно голяма част от това, което той казва за тези „функционални“ понятия, макар и правилно, едва ли е от значение за семантичния анализ. Същото може да се каже и за повечето съвременни лингвистични теории.

Съвсем ясно е, че някои граматически отношения, които се осъществяват на ниво дълбока структура между лексикални единици и комбинации от лексикални единици, са от значение за семантичния анализ на изреченията. Според Чомски „функционалните“ понятия „субект“, „директен обект“, „предикат“ и „основен глагол“ съставляват основните дълбоки връзки между лексикалните единици; Katz, Fodor и Postal наскоро се опитаха да формализират теорията на семантиката с набор от „проекционни правила“, работещи върху лексикални единици, които са свързани с тези отношения в рамките на изреченията (вж. §10.5.4). Понятия като "субект", "предикат" и "обект" бяха обсъдени в предишната глава; и ние видяхме, че тяхната формализация в обща синтактична теория изобщо не е толкова очевидна, колкото предполага Чомски. От това следва, че статусът на „проекционни правила“, тълкуващи изречения въз основа на тези понятия, също изглежда съмнителен.

При разглеждането на „преходността“ и „ергативността“ ние посочихме, че много от „преките обекти“ на английските изречения могат да бъдат генерирани чрез вмъкване на едноместни конструкции като „предикати“ на двуместни конструкции и чрез въвеждането на нов „агентивен“ субект. Но също така видяхме, че има други двуместни преходни конструкции, които не могат да бъдат генерирани задоволително от тази схема. Този факт сам по себе си подсказва, че връзката „директен обект” не може да получи едно единствено тълкуване при семантичния анализ на изреченията. Традиционната граматика разграничава много различни видове "пряк обект". Един от тях може да бъде споменат тук, защото (независимо от неговия статус в теорията на синтаксиса) той несъмнено е много важен в семантиката. Имаме предвид „резултатен обект“ (или „ефект“).

„Резултатният обект“ може да се илюстрира със следните две изречения:

(1) Не е четене на книга „Той чете книга.“

(1) Не пише книга „Той пише книга.“

Книгата, посочена в изречение (1), съществува преди и независимо от това да бъде прочетена, но книгата, посочена в изречение (2), все още не съществува - тя възниква след завършване на дейността, описана в това изречение. Поради това разграничение, книгата в (1) традиционно се разглежда като „обикновен“ обект на глагола четене, докато книгата в (2) се описва като „резултатен обект“. От семантична гледна точка всеки глагол, който има „обект на резултат“ със себе си, може да се нарече „екзистенциален каузатив“. Най-често срещаният „глагол“ в английския език, попадащ в този клас, е make и вече посочихме, че той също е „каузативен спомагателен глагол“ (вж. §8.3.6 и §8.4.7). Същият този „глагол“ действа, подобно на глагола do „to do“, като „заместващ глагол“ във въпросителни изречения. Въпрос като Какво правиш? "Какво правиш?" носи по-малко предпоставки за „предиката“ на изречението, което отговаря на въпроса (глаголът може да бъде преходен или непреходен, но трябва да е глагол за „действие“; срв. § 7.6.4). Въпрос: Какво правиш? „Какво правиш?“, напротив, предполага, че съответната „дейност“ е „резултатна“ и има за цел или ограничение „съществуването“ („съществуването“) на някакъв „обект“. В редица европейски езици тази разлика се появява, макар и не толкова ясно, колкото в английския. (Например на френски Qu" est-ce que tu fais? може да се преведе на английски или като „Какво правиш?", или като „Какво правиш?"). Но това не означава, че за тези езици разграничението между "обикновени" обекти и "резултатни обекти" е без значение.

Значението на концепцията за „екзистенциален каузатив“ произтича от факта, че в изречения, съдържащи конструкция с „резултатен обект“, често има висока степен на взаимозависимост между конкретен глагол или клас глаголи и конкретно съществително име или клас от съществителни имена. Например, невъзможно е да се даде задоволителен семантичен анализ на съществителното картина „картина“, без да се идентифицират неговите синтагматични връзки с такива глаголи като боя „да рисувам, рисувам, пиша“ и рисувам „да рисувам, рисувам“; обратно, фактът, че тези глаголи могат да имат като свой "резултатен обект" съществителното изображение, трябва да се вземе предвид като част от тяхното значение.

Тази концепция за синтагматична взаимозависимост, или предпоставка, играе важна роля в анализа на лексиката на всеки език (вж. § 9.4.3). Той има много по-широка приложимост, отколкото могат да покажат нашите примери. Има предпоставки, които възникват между специфични класове съществителни и глаголи, когато съществителното е предмет на глагол (например птица : летя, риба : плувам); между „прилагателни“ и съществителни (рус „рус“: коса „коса“, добавено „гнило“: яйце „яйце“); между глаголи и "обикновени" обекти (карам "да карам": sag "кола"); между глаголи и съществителни, които имат „инструментални“ отношения с тях (bite „хапя“: зъби, kick „давам“: foot „крак, крак“) и т.н. Много от тези отношения са между специфични класове лексикални единици, които не могат да бъдат формулирани по друг начин отколкото от някакъв набор от „проекционни правила“ (ad hoc правила) в рамките на трансформационния синтаксис, очертан от Чомски.

Поради факта, че все още няма напълно задоволителна синтактична рамка, в рамките на която би било възможно да се формулират различни семантични отношения, които служат като средство за структуриране на речника на езиците, ние няма да се опитваме да формулираме набори от „проекционни правила“, които работят върху дълбоки граматически отношения. В следващата глава ще разгледаме няколко особено важни парадигматични връзки между класове лексикални единици; техният анализ ще бъде извършен неофициално. Предполагаме, че тези отношения биха могли да бъдат формулирани по-елегантно от гледна точка на някакво по-задоволително описание на граматическите отношения на ниво дълбока структура.

9.5.4. „ЗНАЧЕНИЕ“ НА „ВИДОВЕ ИЗРЕЧЕНИЯ“

Третият клас от „значения“, които обикновено се считат за „граматически“, може да се илюстрира чрез разграничението между „декларативни“, „въпросителни“ и „повелителни“ изречения. В скорошната работа по трансформационната теория се наблюдава тенденция да се въвеждат граматични елементи като „въпросителния маркер“ и „императивния маркер“ в дълбоките NS структури на изреченията и след това да се формулират правилата на трансформационния компонент по такъв начин че присъствието на един от тези „маркери“ ще „включи» съответното правило за трансформация. Тук не разглеждаме синтактичните предимства на тази формулировка на разграничението между различните „видове изречения“, ние се интересуваме от нейната семантична същност.

Предполага се (от Кац и Постал), че тези "маркери" са семантично подобни на лексикалните и граматическите елементи, които се срещат като съставни части в ядрата на изреченията. Например „маркер за императивност“ е записан в речника и е снабден с указание, „което го характеризира като имащо приблизително следното значение: „говорещият отправя искане (моли, изисква, настоява и т.н.), така че. ” Но това мнение се основава на объркване в използването на термина „смисъл“. Той заобикаля противоречията, които възникват във връзка с разграниченията, направени в семантиката между „смисъл“, „препратка“ и други видове „значения“. Ако продължим да използваме термина "смисъл" за всички видове разграничими семантични функции, тогава можем с основание да кажем, че има разлики в "смисъла" между съответните твърдения, въпроси и команди (които не са непременно "изразени" чрез декларативно, въпросителни и повелителни изречения, съответно - но за простота пренебрегваме този факт). Въпреки това, въпросът дали две лексикални единици имат "еднакво значение" или не обикновено се тълкува във връзка с концепцията за синонимия - еднакво значение. Това е парадигматично отношение, т.е. отношение, което или се държи, или не, между единици, срещащи се в един и същ контекст, в един и същ „тип изречение“. В следващата глава ще видим, че понятието „синонимия“ между хИ приможе да бъде описан от гледна точка на набор от импликации, „следващи“ от две изречения, които се различават само по това, че на мястото, където в един случай стои х, в друг - струва си при. Но тези съображения просто не се отнасят за съответните декларативни и въпросителни (повелителни) изречения (например: Вие пишете писмото "Вие пишете писмо" срещу. Пишеш ли писмото? — Писмо ли пишеш? или Напиши писмото! "Напиши писмо!"). Въпреки че съответните членове на различни "видове изречения" могат да бъдат характеризирани като различни по "значение", не може да се каже, че се различават по значение. Няма нужда да се опитваме да формализираме теорията на семантиката по такъв начин, че „значението“ на „въпросителния маркер“ или „императивния маркер“ да може да бъде описано със същите термини като „значението“ на лексикалните единици,

Слово – основната структурно-семантична единица на езика, служеща за назоваване на предмети и техните свойства, явления, отношения от действителността, притежаваща набор от специфични за всеки език семантични, фонетични и граматични характеристики. В една дума се разграничават следните структури: фонетична (организиран набор от звукови явления, които образуват звуковата обвивка на думата), морфологична (набор от морфеми), семантична (набор от значения на дума).

Семантична структура на думата - подреден набор от взаимосвързани елементи, образуващи определен обобщен модел, в който лексико-семантичните опции се противопоставят един на друг и се характеризират един спрямо друг.

Лексико-семантичен вариант (LSV) – двустранна единица, чиято формална страна е звуковата форма на думата, а съдържателната страна е едно от значенията на думата.

Думите, които имат само едно значение, се представят в езика от един лексико-семантичен вариант, полисемантичните думи - от редица лексико-семантични варианти, съответстващи на броя на различните му значения.

Анализът на значението на една дума показва, че думите обикновено имат повече от едно значение. Думи, които имат едно значение, т.е. моносемантичен , сравнително малко. Те обикновено включват научни термини, например: водород, молекула. Повечето английски думи са двусмислени думи. Колкото по-често се използва една дума, толкова повече значения има тя. Например думата маса има поне 9 значения в съвременния английски: 1) а парче на мебели; 2) на лица седнал при на маса; 3) пея. Храната, поставена на масата, ястия; 4) тънко плоско парче камък, метал, дърво и др.; 5) мн. каменни плочи; 6) думи, изрязани в тях или написани върху тях (десетте таблицидесет заповеди); 7) подредено подреждане на факти, цифри и т.н.; 8) част от инструментална машина, върху която се работи; 9) равна площ, плато.Наричат ​​се думи, които имат много значения полисемантичен . От това следва, че концепцията за семантична структура е приложима само за многозначни думи, тъй като семантичната структура всъщност е структурата на LSV и ако една дума има само един LSV, тя не може да има структурата на LSV.

Семантичната структура на думата включва набор от лексико-семантични опции, организирани по определен начин и образуващи подреден набор, йерархия. Съществуват различни класификации, които отразяват разликата в подходите към семантичната структура на думата и йерархичните връзки на нейните елементи.

Прилагане синхронен подход За да изследваме семантичната структура на една дума, можем да различим следните основни типове значения:

    основно значение на думата , което разкрива най-голяма парадигматична фиксация и относителна независимост от контекста;

    частни (вторични, производни) стойности , които, напротив, показват най-голяма синтагматична фиксация и не се определят в забележима степен от парадигматични отношения;

    номинативно значение , който е пряко насочен към предмети, явления, действия и качества на действителността;

    номинативно-производно значение , което е второстепенно спрямо него. Например в думата ръказначението „крайна част на човешка ръка отвъд китката“ (дай ми ръката си) е номинативно, а значенията „нещо като ръка“ (часовата стрелка, минутната стрелка), „служител, който работи с ръцете си“ (фабриката е поела двеста допълнителни ръце) са номинативни производни;

    пряка (собствена) стойност , пряко свързан с обекти и явления на материалната реалност, той може да бъде идентифициран чрез запознаване със самите реалности и последните действат в това отношение като задължително условие и обективен критерий за определяне на семантичния обхват на думата;

    фигуративен (метафоричен, образен, образен) , което се придобива от дума в резултат на съзнателното й използване в речта за обозначаване на обект, който не е негов обичаен или естествен референт. Преносните значения се формират от прякото значение според определени модели на семантична изводност и се реализират само в определени контекстуални условия. Те не само назовават предмет или явление, но и го характеризират въз основа на приликата му с друг обект или явление. Семантична структура на глагола да умравключва следните LSV: 1. престават да живеят, изтичат (пряко значение); 2. губят жизнени сили, слабеят, припадат (Умира надеждата/интересът; умря шумът/разговорът); 3. да бъде забравен, изгубен (Славата му никога няма да умре); 4. гниене (цветя/растения умират). Стойностите 2, 3, 4 са преносими.

Значенията са преносими "време"думи 'пясък': Пясъците свършват; значение 'печеля'с една дума 'земя': Тя получи богат съпруг; Той спечели първата награда.

    Според обектите на именуване и социалното предназначение значенията се делят на концептуални и стилистични. Идеен тези лексикални значения се наричат , в които предметно-понятийната ориентация е водеща и определяща; стилистичен (културно-исторически) са онези значения, при които функцията за назоваване и обозначаване на предмети и понятия се съчетава с функцията за характеризиране на самите думи.

    Сред концептуалните лексикални значения има абстрактно стойности , например свидетел – 1. доказателство, свидетелство; И специфичен , напр. свидетел – 2. човек, който познава събитие от първа ръка и е готов да го опише; 3. лице, което дава показания под клетва пред съд; 4. лице, което полага подписа си върху документ; общи съществителни И собствен именителен И местоименен (прономинални значения). Особено подчертано специален значения, присъщи на термини и професионализми.

    Стилистични значения разпознават се значенията на думите, принадлежащи към различни стилистични слоеве от лексиката на езика и области на употреба. Стилистично значение имат и архаизмите и неологизмите, диалектизмите и екзотизмите, като не само думите, но и отделните ЛСВ могат да бъдат архаични, неологични, диалектни и екзотични.

    При анализа на връзката между думите в езика и речта се използват понятията интензивно значение (значения на една дума като езикова единица) и екстензионален значение (придобито от дадена дума в даден контекст на речевата й употреба). За да обозначи значението на думата „като такава“, в абстракция от цялото разнообразие от възможни речеви ситуации на нейното използване, терминът също често се използва речниково значение .

От друга страна, значенията на „речта“ се разделят на обичайно (установени значения, приети в езика, в който думата обикновено и естествено се използва, т.е. отразяващи синтагматични връзки, характеризиращи собствената семантика на думата) и от време на време значения (прикрепени към дадена дума в даден контекст на използване на речта и представляващи известно отклонение от обичайното и общоприетото, т.е. значения, които, тъй като не са резултат от редовна комбинация от думи, са изключително контекстуални). Например значението на глагола да седна в изречението „Къде да настаня всички тези хора?“ е обичайно в изречението „Тя влезе в хола и седна на ръба на един стол, за да не седне нейният добър гросгрейн костюм“ (Дж. и Е. Бонет) е случаен.

Използване диахронен подход означава класификация на значенията според техните генетични характеристики и в съответствие с тяхната нарастваща или намаляваща роля в езика и позволява идентифицирането на следните типове значения:

    оригинал (оригинал) ценности и производни , получени от тях. Например в семантиката на думата тръба първоначалното значение е ‘музикален духов инструмент, състоящ се от една тръба’, а производните са ‘тръба от дърво, метал и др., специално за пренос на вода, газ и др.’; ‘тясна тръба от глина, дърво и др. с купа в единия край за всмукване на тютюнев дим“ и др. Освен това при такава класификация често има нужда да се изолира междинно значение, което диахронно е една от връзките в семантичното развитие на думата между първоначалното и вече установените производни значения. Например в семантичната структура на съществително дъска значението „маса“, като метонимичен пренос, действа като междинна връзка между значението „разширена повърхност от дърво“ (което от своя страна е междинно между „маса“ и първоначалното значение - „дълго тънко обикновено тясно парче нарязан дървен материал ') и значението „комитет“, също свързано с метонимичен пренос. Така с диахронен подход значението на думата дъска може да се представи в следната форма:

дълго тънко обикновено тясно парче нарязан дървен материал

разширена повърхност от дърво

(метонимичен пренос)

(метонимичен пренос)

    етимологично значение – значението, което е исторически най-ранно;

    архаичен смисъл – значение, изместено от употреба от по-нова дума, но запазено в редица устойчиви комбинации, например: значение "изглед"на думата Изчервяване: при на първи Изчервяване"На пръв поглед"; значението на думата "дух" призрак: да се дайте нагоре на призрак"да се откажа от духа"; значение "частица"на думата колет: част и колет"неразделна част от"; в същото време думата съществува с различно значение (значения) като активен елемент на съвременната лексика.

    остаряло значение – излязло от употреба значение;

    съвременно значение – значение, което е най-често срещаното в съвременния език.

СЕМАНТИЧЕН ПРИНЦИП НА КЛАСИФИКАЦИЯ НА ЧАСТИ НА РЕЧТА

Има няколко принципа за разделяне на пълноценните думи в категории. Един от тези принципи е семантичният принцип. По-специално беше разгледано (Панов М. В. За частите на речта на руския език // Научни доклади на висшето училище. Филологически науки, 1960, № 4). Според идеята частите на речта трябва да имат определена общност, като тази общност не трябва да бъде коренна, а афиксална и да се отнася не до звука на афиксите (форма), а до тяхното значение (съдържание). Всъщност словоформи страхливец, страхливец,страхлив,въпреки че споделят обща коренна морфема, те не могат да бъдат класифицирани като една част на речта. Словоформи написаИ плашило, сънливИ тласък, сладоледИ голям,въпреки че съдържат формално идентични афиксални елементи -l-, -n~, -oe,очевидно принадлежат към различни части на речта. Следователно е необходимо да се открие някаква смислена афиксална общност, която да служи като основа за разделяне на думите на части на речта.

В основата на класификацията стои един изключително общ смисъл – участие в назоваващата функция. Има няколко такива функции. Един от тях - процедурност- се вижда във всяка глаголна словоформа, независимо от значението на корена, който може да няма процедурно значение. Друга функция - знак. Той идва след процеса в йерархията на функциите. Въз основа на отсъствието на процедурната функция и наличието на функцията на атрибута, прилагателното се разграничава като част от речта. В същото време причастието като част от речта не се отделя, тъй като има процесуална функция. Това обстоятелство е в основата на класифицирането на причастните форми като части на речта. Третата функция е пряка или непряка връзка с обекта. На тази основа прилагателното и глаголът се противопоставят на наречието. Първите директно характеризират обекта: прилагателното е непроцесуално, глаголът (с причастие!) е процесуален. Наречието не характеризира директно обект, то изпълнява функцията на характеристика на самата характеристика, т.е. глагол или прилагателно. Същата функция на атрибута на атрибута се изпълнява и от герундия. Въпреки това, за разлика от наречията, герундиите имат процедурен характер.

Словоформите, които нямат нито едно от посочените значения в своята афиксна част, са съществителни, които при по този начин на въпроса включват кардинални и сборни числителни. Всички останали граматически разлики между словоформите не влияят върху идентифицирането на частите на речта.

Подобен - функционално-семантичен - подход за идентифициране на части от речта в руския език беше извършен преди това . Той беше склонен да разграничи четири независими части на речта в руския език: съществително, прилагателно, глагол и наречие. Въпреки това, въз основа на разглеждането на идентифицираните от него семантично-функционални категории лексеми, беше възможно да се открие напрегнато място в системата от руски части на речта, идентифицирани по този начин. Гледа фрази провеждам състезаниеИ провеждане на състезание.Първата фраза е естествена както лексикално, така и граматически. Втората фраза също е лексикално естествена. Но граматически това е незаконно: раса- наречие, т.е. знак за знак, но тичам- съществително, т.е. граматически не е знак или процес. Колокация Бягай бързо- както лексикално, така и граматически последователни. Колокация бързо бяганеграматически също логично, но лексикално - не, защото лексик тичамне е нещо обективно. Така противопоставянето на прилагателни и наречия в разглеждания аспект се оказва донякъде размито. Могат да се дадат много примери, когато наречие действа като знак по отношение на

на съществително директно: бъркани яйца,подстригана коса, криволичеща опашкаи т.н.

В сравнение с традиционно идентифицираните части на речта, предложената схема се различава по някои характеристики. В тази схема няма местоимения или числителни. Тези загуби обаче са логически неизбежен резултат от последователното прилагане на семантико-функционалния принцип на разделяне. В съответствие с този принцип всички традиционно разпределени местоимения се разпределят между съществителни, прилагателни и наречия. Числата споделят същата съдба. Редните се включват в прилагателните, количествените и събирателните в съществителните, а словоформите като два пъти, три пъти,въпреки че са свързани с броене, тъй като традиционно са били свързани с наречията, те остават сред наречията дори и с посочения подход. Класификацията според принципа на „наименуваща функция“ само в изключително общите си значения дава схема, напомняща традиционните части на речта. По принцип класификацията, базирана на този принцип, може да бъде детайлизирана. След това ще доведе до идентифициране на групи от лексеми (или словоформи), които имат функционална и семантична общност. Така например в рамките на глаголите могат да се разграничат групи от лични и нелични глаголи; в рамките на наречията група наречия, обозначаващи характерен признак, и група наречия, обозначаващи състояние (студено ми е, той няма време),и т.н.

Въпреки обективната стойност на разглежданата класификация и нейното особено значение за семантиката и синтаксиса, тя не може напълно да задоволи специалист в областта на морфологията, тъй като не отчита в достатъчна степен морфологичните категории, представени или непредставени в определена група лексеми или словоформи. Последното обстоятелство - действителните морфологични характеристики на думите - може да се използва като основа за различна идентификация на частите на речта.

МОРФОЛОГИЧЕН ПРИНЦИП НА КЛАСИФИКАЦИЯ НА ЧАСТИ НА РЕЧТА

СЪЩИЯТ НАБОР ОТ МОРФОЛОГИЧНИ КАТЕГОРИИ. Класификацията на лексемите може да се основава на изразяването на едни и същи морфологични категории. В случая лексемите къща, животно, зимаобразуват една група, защото всичките им словоформи изразяват морфологичните категории число, падеж и само тези категории. От друга страна, всички тези лексеми ще бъдат противопоставени на лексемите мил, стар, голям,тъй като всички словоформи на последния изразяват такива морфологични категории като пол, число, случай, краткост-пълнота.

Въпреки това, класифицирането според принципа на „тежестта на същия набор от морфологични категории“ не винаги води до толкова ясни резултати, както в гореописания случай на контрастиращи съществителни и прилагателни. директор

Основни трудности възникват, когато различните словоформи на една лексема изразяват различни набори от морфологични категории.

Най-сложната структура в това отношение в руския език са словоформите, традиционно включени в глагола. Дори формите на сегашно и минало време се различават по набора от изразени морфологични категории. Настоящето изразява категория лице, липсващо в миналото. И в миналото е изразена категорията пол, която отсъства в настоящето. Морфологичните категории на глаголите във формите на показателното, подчинителното и повелителното наклонения не съвпадат. Още по-фрапиращи са различията в наборите от морфологични категории на личните форми на глагола и инфинитив, личните форми на глагола и причастията, инфинитив и причастия. С всичко това, както инфинитивът, така и личните форми на всички настроения, и причастието, и герундийът трябва да се считат за словоформи на една лексема, тъй като значенията, които разграничават тези словоформи, могат да се считат за задължителни и редовни (вижте повече за това в раздела „Глагол“). От това обстоятелство следва, че класификацията според принципа на „изразяване на същия набор от морфологични категории“ може да се извършва последователно само за словоформи. За лексемите такава класификация е принципно невъзможна.

Друго обстоятелство затруднява прилагането на този критерий. Това се крие във факта, че сред руските лексеми има много, които се състоят от една словоформа и следователно не изразяват нито една морфологична категория. Токени като палто, такси, хидро,според принципа на „изразяване на морфологични категории“ те са рязко противопоставени на повечето руски съществителни, които изразяват морфологични категории както на число, така и на случай в техните словоформи. Токени от тип бежово, каки,семантично идентични с прилагателните, не притежават никакви морфологични категории, присъщи на прилагателните. Следователно класификацията според принципа на „изразяване на морфологични категории“ е възможна само за граматически оформени словоформи.

В този случай ще бъдат представени следните видове словоформи:

1) съществителни (експресен падеж и число); Това включва също количествени и сборни числителни;

2) прилагателни (изричен падеж, число, род и краткост/пълнота);

3) инфинитиви (изразяват вид и глас);

4) причастия (изразява аспект);

5) причастия (изричен падеж, число, род, краткост/пълнота, вид, глас, време);

6) глаголи на индикативното настроение на сегашно/бъдеще време (експресно число, вид, глас, време, лице, настроение);

7) глаголи на индикативното настроение на миналото време (експресно число, пол, аспект, глас, време, настроение);

8) глаголи на подчинителното настроение (експресно число, пол, аспект, глас, настроение);

9) повелителни глаголи (изразяват число, вид, глас, лице, настроение);

10) граматически нехарактеризирани словоформи: несклоними съществителни и прилагателни, сравнителна степен и наречия.

Точно така трябва да изглеждат независимите части на речта в руския език, ако тяхната идентификация се основава на една единствена характеристика - наличието на общи морфологични характеристики, изразени в самата словоформа.

В сравнение с традиционните части на речта, тази класификация се оказва по-компактна за име (няма различни категории местоимения, кардинални и поредни числа) и много по-малко компактна за глагол.

СЪЩИЯТ НАБОР ОТ ЧЛЕНОВЕ НА ПАРАДИГМАТА. В рамките на морфологичния подход за идентифициране на части от речта е възможна друга класификация. Може да се основава на структурните характеристики на парадигмата. Ясно е, че в този случай съществителните, например, ще бъдат противопоставени на прилагателните. В крайна сметка парадигмата на последното включва противопоставянето на словоформите по род, което отсъства при съществителните. Вярно е, че в този случай нито съществителните, нито прилагателните биха могли да запазят своето единство. Освен това такова раздробяване би възникнало не само поради непроменяеми съществителни и прилагателни. Сред съществителните голяма група лексеми, които имат словоформи само на едно число (единствено или множествено число, няма значение), трябва да бъдат противопоставени на лексеми, които имат форми и на двете числа (къщи-къщиИ младост, мляко).След това в категорията на лексемите като младост, млякоНеобходимо е да се включат числителни - събирателни и количествени, както и лични и въпросителни местоимения. В крайна сметка всички тези лексеми имат словоформи само от едно число.

Прилагателните лексеми ще бъдат разделени на три части: лексеми с кратки и пълни словоформи (бял),лексеми само с пълноформатни думи (голям),лексеми само с кратки словоформи (радвам се).

За разлика от съществителните и прилагателните поради самото естество на набора от словоформи, глаголът в този случай трябва да бъде разделен на няколко групи в зависимост от наличието или отсъствието на аспектна двойка, личната форма на пасивния залог, определени причастия и герундии и т.н.

СИНТАКТИЧЕН ПРИНЦИП НА КЛАСИФИКАЦИЯ НА ЧАСТИ НА РЕЧТА

Не трябва да забравяме, че действителният морфологичен подход за идентифициране на части от речта остава напълно безсилен по отношение на непроменяемите думи. Тук са възможни само семантични и синтактични подходи.

Когато се прилага към непроменяеми думи, тоест към лексеми, състоящи се от една дума, синтактичният принцип се оказва много ефективен. Същността на този принцип е да се определят онези видове лексеми, с които думите, които ни интересуват, могат или не могат да се комбинират, както и да се разберат функциите, които тези думи изпълняват в изречение. Така сред непроменяемите думи съществителните се съчетават със съществителни, прилагателни и глаголи (ВЕЦ Сибир, Красноярскводноелектрическа централа, изграждане на водноелектрическа централа),са субект, сказуемо, обект, определение, обстоятелство; прилагателни се съчетават със съществителни (бежов костюм), са определение или предикат; наречията се комбинират с глаголи и прилагателни (облечен като лято, топъл като лято),са обстоятелства от различен тип.

В допълнение, този принцип на разделяне изисква разпознаване сред непроменяемите думи като специален клас от така наречените форми на сравнителна степен, сравнителен. Тези думи, за разлика от съществителните, прилагателните и наречията, се комбинират само с глаголи и съществителни (стоостарявам, братът е по-голям от сестрата).Освен това използването на синтактичен критерий изисква избор на група думи, които се отнасят само до изречението като цяло (може би може бине, разбира се, какво доброи т.н.). Тези думи обикновено се наричат ​​модални думи. По този начин използването на синтактичен критерий ни позволява да идентифицираме части от речта от непроменяеми думи. Важно е да се отбележи, че изборът на съществителни и прилагателни сред непроменяемите думи може да се извърши въз основа на семантичен критерий. Семантичният критерий лесно разграничава наречията от неизменяемите думи. Но само прилагането на синтактичен критерий въвежда различни градации сред наречията.

Един опит за изолиране на специална част от речта въз основа на синтактичния принцип на класифициране на словоформите беше широко обсъждан в руската граматична литература. Говорим за словоформи, които не са глаголни, а се използват като сказуемо (той е студен, радваме се, трябва, твърде мързелив да работи, твърде мързелив да говории т.н.). Тези словоформи получиха статут на специална част от речта, така наречената държавна категория. Комбинацията от всички тези словоформи в една част на речта отчита общността на тяхната синтактична функция и определена семантична хомогенност, свързана с тази общност, отбелязана в самото име „категория на състоянието“. Морфологично всички тези словоформи се характеризират по различен начин: Студне изразява морфологични категории, радвам се, трябваима номер мързел, липса на време- число, падеж.

Последователното прилагане на синтактичния принцип към всички словоформи води до парадоксални изводи. Така че кратките прилагателни, например, трябва да се противопоставят на пълните. Първият може да действа както като определение, така и като предикат, докато вторият може да действа само като предикат. Синтактичните функции на различните глаголни форми - лични, причастни, причастни - ще бъдат определени по различен начин. Вярно е, че въз основа на синтактичните функции словоформите на кардиналните и колективните числителни могат да бъдат противопоставени на словоформите на самите съществителни: известно е, че кардиналните и колективните числителни не могат да се комбинират с прилагателни.

Може би дефинирането на синтактични функции във връзка с лексемите би могло да доведе до по-познати резултати? Това е грешно. В рамките на една лексема съжителстват различно морфологично оформени словоформи. По абсолютно същия начин различните словоформи на една и съща лексема могат да изпълняват различни синтактични функции. Следователно класификацията, основана на принципа на „синтактичната функция“ за лексемите, е невъзможна по принцип, точно както класификацията, основана на хомогенен морфологичен дизайн, е невъзможна за лексемите.

РЕЗУЛТАТИ ОТ РАЗЛИЧНИ КЛАСИРАНИЯ

Можем да направим някои изводи. Проблемът с идентифицирането на частите на речта е проблемът с класифицирането на словоформите.

Семантичният критерий в неговите най-обобщени значения откроява четири класапълнозначни словоформи – съществително, прилагателно, глагол и наречие.

Морфологичният критерий подчертава девет класаформализирани словоформи и неоформени словоформи.

Синтактичният критерий, приложен към морфологично нехарактеризирана група, ни позволява да разграничим сред последните съществителни, прилагателни, наречия, сравнение (сравнителна степен), категория на състоянието и модални думи. По принцип е възможно да се приложи синтактичният критерий към словоформите, но резултатите от него ще противоречат на резултатите от морфологичния и семантичен анализ.

ПРИНЦИПИ НА КЛАСИФИКАЦИЯ И ТРАДИЦИОННО УЧЕНИЕ ЗА ЧАСТИ НА РЕЧТА

От горното става ясно, че традиционната доктрина за частите на речта е априорна класификация, чиито логически основи са много разнородни. Въпреки това, тази класификация дава възможност да се постави всяка дума или лексема в подходяща категория. Има място за съществителни, прилагателни, числителни, глаголи и наречия. В същото време, поради логическо несъвършенство, традиционната класификация разделя това, което по някакви логични причини трябва да бъде заедно.

Училищните цифри, например, съчетаващи кардинални колективни и редни числителни на семантична основа, отделят последните от прилагателните, въпреки тяхната морфологична и синтактична общност. Желанието да се разграничи категорията състояние сред руските части на речта се обяснява с факта, че единици със същите синтактични функции съществуват и в категорията „съществителни“ (липса на време, мързел),и в раздела „прилагателни“. (радвам се, много)и в секцията „наречия“. (скучно, забавно).

Именно в „априорния“ характер се крие както силата на традиционната доктрина за частите на речта - проверената от векове способност да се характеризира всеки обект - така и нейната слабост, отвореността към критика на логическите основи, лежащи в основата на класификацията.

Не може да не се отбележи още едно предимство на традиционната класификация на частите на речта. Някои единици, оставайки доста логични, могат да бъдат поставени едновременно в една и друга категория. Това е много удобно, тъй като в редица области на системата от части на речта има постоянни преходи (прилагателни в съществителни, причастия в прилагателни и т.н.).

Всички тези обстоятелства предопределят жизнеспособността на традиционната доктрина за частите на речта.

Както вече беше отбелязано, учението за частите на речта е важно не само за морфологията, но и за други раздели на описанието на руския език. Традиционната доктрина за частите на речта не отразява резултатите от нито една от горните класификации (сравнете с критериите за дефиниране на дума), но представлява един вид компромис между всички тези принципи. Значителна роля за постигането на такъв компромис играе фактът, че частите на речта, идентифицирани по различни причини, образуват групи с много различни размери. Сравнете например съществителните имена и така наречената категория състояние, глагол и модални думи.

ЛИТЕРАТУРА ПО ТЕМАТА

„ЧАСТИ НА РЕЧТА КАТО ЛЕКСИКО-ГРАМАТИЧЕСКИ КЛАСОВЕ ДУМИ“

Жирмунский В. М. За естеството на частите на речта и тяхната класификация - В книгата: Въпроси на теорията на частите на речта въз основа на материала на езиците от различни типове. Л., 1965.

П а н о в М. В. За частите на речта на руския език - Научни доклади на висшето училище. Филол. науки, 1960, № 4.

С т е б л и н - Каменски М. И. По въпроса за частите на речта.- Вестник на Ленинградския държавен университет, 1954, № 6.

Щерба Л. В. За частите на речта на руския език - В книгата: Избрани произведения по руски език. М., 1957. .-