LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Електроніка. Обчислювальна техніка → Формальна модель мови як основа прогресивних інформаційних технологій

трансформації та схеми зв'язку чітко визначені, то і організація довільного повідомлення може бути визначена чітко та однозначно на формальному рівні.

Використання поняття базової семантико-синтаксичної структури замість неокресленого терміну “словосполучення” дає змогу подати структурну організацію довільного повідомлення як взаємопов'язану множину типових базових структур. Більш формально ця теза виглядатиме наступним чином: довільне повідомлення визначається базовою семантико-синтаксичною структурою, елементами якої можуть бути або окремі слова, або цілі структури, елементами яких, знову ж таки, можуть бути або слова, або структури, елементами яких можуть бути . . . тощо, аж до рівня окремих слів. Таке уявлення окремого повідомлення, орієнтованого на єдину, чітко визначену структуру, вбачається більш конструктивним та перспективним для формування інформаційних технологій, орієнтованих на опрацювання природної мови.

Визнання рекурсивної схеми організації мовного матеріалу означає, у загальному випадку, і рекурсивну схему функціонування лінгвістичного процесора. Завдання синтаксичного аналізатора зводиться до декомпозиції вхідного повідомлення за окремими монопредикатними структурами (базовими структрами або їх трансформаціями).

Формалізми запропонованої моделі мови, що проаналізовані в основній частині, дозволяють подати узагальнену схему опису об'єкта та дії, враховуючи вже одночасно монопредикатний та поліпредикатний організаційні рівні. Звідси випливає, що опис окремої складової базової семантико-синтаксичної структури може одночасно актуалізуватися на атрибутивному, об'єктному та ситуаційному рівнях. Ієрархія використання окремих засобів визначатиметься актуальним членуванням, проте пріоритет атрибутивного рівня тут незаперечний. Отож матимемо принциповий висновок, що опис окремої складової повідомлення може враховувати одночасно формалізми монопредикатного та поліпредикатного рівнів. Подамо узагальнене визначення складових окремого повідомлення


OBJ = OBJ / Attr(Obj) * OBJ /

Attr(Attr) * Attr(Obj) * OBJ / Attr(Obj) * Attr(Attr) * OBJ /

(Attr(Attr) * Attr(Obj))і, і =1, m) * OBJ /

(Attr(Obj) * Attr(Attr))j, j= 1, n) * OBJ /

OBJ * Attr(Obj) / OBJ * Attr(Attr) * Attr(Obj) / (12)

OBJ * (Attr(Attr) * Attr(Obj))і, і =1, m) /

OBJ * (Attr(Obj) * Attr(Attr))j, j= 1, n) /

OBJ – “бути частиною” – OBJ1 /

OBJ – “бути в родинних стосунках” - OBJ2 /

OBJ – “бути в кількісних відношеннях” - OBJ3 /

OBJ – “бути назвою” - OBJк /

OBJ – R1 – SBOп1 /

OBJ – R2 – SBOп2 /

OBJ – R2 – SBOп3.


Важливо тут підкреслити рекурсивний характер формування опису окремого об'єкта: на об'єктному рівні об'єкт OBJ визначається знову ж таки через OBJ, а на ситуаційному рівні прикметою виступає вже окрема ситуація. Узагальнена схема опису дії, що враховує монопредикатний та поліпредикатний рівні теж досить складна

MOV = MOV / Attr(Mov) * MOV /

Attr(Attr) * Attr(Mov) * MOV /

Attr(Mov) * Attr(Attr) * MOV /

(Attr(Attr) * Attr(Mov))і, і =1, m) * MOV /

(Attr(Mov) * Attr(Attr))j, j= 1, n) * MOV /

MOV * Attr(Mov) /

MOV * Attr(Attr) * Attr(Mov) / (13)

MOV * (Attr(Attr) * Attr(Mov))і, і =1, m) /

MOV * (Attr(Mov) * Attr(Attr))j, j= 1, n) /

MOV1, MOV2, … MOVn (схеми ускладнення предикатора ) /

MOV – R (Attr(Mov)) – SBO.

Важливо лише пам'ятати, що окрема структура актуалізується не лише через описи об'єктів та дій але й включає до свого складу службові елементи мови для відтворення синтаксичних відношень. Аналіз виразів (12) та (13) однозначно розкриває рекурсивну природу формування основних складових базової семантико-синтаксичної структури. Отже, у загальному випадку, мовний матеріал визначається рекурсивною організацією, і головна функція рекурсивного аналізатора – вилучення з мовного повідомлення окремих базових семантико-синтаксичних структур та ідентифікація зв'язків між ними.


Додаток В. База знань

Запропонована модель мови, звичайно, визначає і новий підхід до розбудови основних складових мовної системи - бази знань та лінгвістичного процесора. Визначальною інформативною одиницею накопичення, збереження та використання знань постаєбазовасемантико-синтаксична структура мовного повідомлення. Це структурне утворення значною мірою впливає і на структурну організацію бази знань. Особливості функціонування бази знань визначають і морфологічне оформлення лексичних одиниць у повідомленні. Тут ще раз підтверджено висновок, що на стадії синтезу повідомлення семантика відтворюваного визначатиме синтаксис повідомлення, який реалізується через відповіднеморфологічне оформлення; для сприйняття (аналізу) мовного повідомлення ці залежності актуалізуються у зворотному напрямку: морфологічне оформлення та службові елементи мови визначатимуть синтаксичну структуру повідомлення, яка актуалізуючись через конкретне наповнення складових, повною мірою відтворює зміст повідомлення.

Проектування бази знань на шляху моделювання мовної поведінки спирається на загальну схему інформаційного забезпечення людини та запропоновану формальну модель мови. Основні принципові моменти проектування БЗ вбачаються наступними:

  • база знань повинна інтегрувати знання, які формуються на різних інформаційних рівнях (образному, акустичному, символьному тощо); практично перевірена можливість інтеграції образної та символьної інформації в межах системи сприйняття просторових відношень та системи “Дійсність-Текст”; система ЛП-БЗ орієнтована була на використання акустичної інформації;

  • одиницею подання, накопичення та перетворення знань постає окремий квант довкілля, що на мовному рівні відтворюється базовою семантико-синтаксичною структурою; знання відносно фрагмента довкілля подаються множиною пов'язаних базових структур;

  • окремими фрагментами в БЗ подана інформація стосовно актуалізації мовними засобами категорій часу та простору через ієрархічну послідовність базових елементів; розділи БЗ “семантичне поле часу”, та “семантичне поле простору” частково реалізовані на різних стадіях моделювання мовної поведінки (модель “Дійсність-Текст” та система ЛП-БЗ);

  • в БЗ передбачена можливість накопичення інформації енциклопедичного характеру, що дозволяє значним чином підвищити семантичний потенціал БЗ; в системі ЛП-БЗ в режимі навчання накопичувалася енциклопедична інформація за темою “Людина”.

  • для забезпечення ефективного моделювання мовної діяльності в системі ЛП-БЗ була забезпечена функціонально-структурна єдність обох складових; перша вимога означає, що елементом опрацювання інформації в БЗ та ЛП буде однотипне структурне утворення - базова семантико-синтаксична структура, друга – вимагає діалектичного зв'язку між БЗ та ЛП (результати роботи ЛП накопичуються в БЗ, в свою чергу, БЗ забезпечує ефективне функціонування ЛП).

Певні властивості функціонування системи ЛП-БЗ були перевірені на шляху моделювання мовної діяльності. В