LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Електроніка. Обчислювальна техніка → Формальна модель мови як основа прогресивних інформаційних технологій

межах дипломного проектування було створено систему ЛП-БЗ для моделювання окремих виявів мовної діяльності людини. ЛП побудовано за схемою флективного аналізатора, де передбачена можливість звернення до БЗ у випадках невизначеності аналізу на флективному рівні. В базі знань актуалізована була також можливість подання енциклопедичної інформації стосовно людини, просторових та часових відношень.

На окремих стадіях моделювання мовної діяльності були перевірені різні схеми побудови та використання БЗ. Формувалися БЗ для опрацювання текстової (письмової), мовленнєвої (акустичної) та образної інформації. Експериментально перевірена концепція інтеграції символьної та образної інформації в межах єдиної бази знань, коли зміст мовного повідомлення визначається на образному (графічному) рівні.


Додаток Д. Лінгвістичний процесор

Лінгвістичний процесор – ядро формування природно-мовних технологій. Цей розділ відіграє найважливішу роль на шляху моделювання мовної діяльності. Усі попередні знання про мову, об'єднані в межах запропонованої формальної моделі, визначаються як “мовна компетенція” і повинні бути зведені до єдиної системи обробки символьної інформації - лінгвістичного процесора. Перспективні комп'ютерні технології, що орієнтовані на опрацювання природно-мовної інформації, можливо реалізувати лише за умови ефективного функціонування лінгвістичного процесора.

Лінгвістичний процесор – це власне система, що безпосередньо опрацьовує мовний матеріал, спираючись на знання щодо мовної організації на всіх рівнях. Виходячи з тези, що мова – це вища форма відтворення довкілля (реального або віртуального), яке існує в триєдності часу, простору та дії, ЛП повинен враховувати відповідні мовні засоби для опису цих категорій. Відтворення динамічного світу актуалізується дискретним чином через подання або окремої ситуації, або їх множини. Мовна компетенція щодо цього рівня визначається запропонованою формальною моделлю мови і повинна охоплювати: формалізми актуалізації базової семантико-синтаксичної структури (вираз (11)), схеми трансформування базової структури (десь близько двох десятків), схеми поєднання монопредикатних структур в межах окремого повідомлення (півтора десятка схем).

У загальному випадку, відтворення середовища актуалізується таким чином, що значення (зміст) відтворюваної ситуації визначає синтаксичну структуру повідомлення, яка в свою чергу реалізується через відповідні морфологічні засоби; тому морфологічна складова ЛП також пов'язана з відповідними схемами актуалізації базової структури, її трансформуванням та схемами взаємодії. ЛП орієнтується на флективний аналізатор, що працюватиме з інформацією, зібраною в таблицях допустимих флексій.

Продуктивною інформативною складовою лінгвістичного процесора вважаються також знання щодо використання мовних засобів для відтворення часових та просторових відношень. Кожна така складова, у загальному випадку, може мати досить складну структуру, що визначається як диференціацією систем відліку, так і схемами їх взаємодії. Особливості актуалізації просторових та часових відношень ретельно проаналізовані та закладаються до ЛП. Важливими складовими ЛП вбачаються також дані стосовно комунікативної організації окремого повідомлення (таблична інформація), мовні засоби забезпечення зв'язності текстової інформації та схеми рекурсивної організації мовного матеріалу, що зумовлюють також і рекурсивну схему роботи лінгвістичного процесора.

Робота лінгвістичного процесора орієнтована на діалектичну взаємодію з базою знань (з одного боку, ЛП в своїй роботі спирається на інформацію, що зберігається в БЗ, а з іншого - результати роботи ЛП накопичуються в БЗ). Відповідно до різних виявів мовної діяльності для ЛП передбачаються режими роботи, що відповідають не лише аналізу але й синтезу мовного повідомлення; наша мовна компетенція використовується не лише на стадії сприйняття мовного повідомлення але й для його породження. Практично на рівні моделювання співвідношення “Дійсність-Текст” була перевірена можливість використання ЛП для генерації мовного повідомлення; тут враховувалися певні залежності формальної моделі та були актуалізовані кілька стратегій опису довкілля.

Перевага визначеного підходу до проектування ЛП в тому, що опрацювання мовного матеріалу завжди орієнтовано на формалізми запропонованої моделі мови і спирається на базову семантико-синтаксичну структуру. В такому випадку, невпорядкована схема пошуку невизначеної структури замінюється чітко визначеною процедурою пошуку відомих конструкцій, реалізованих за відомими схемами та поєднаних відповідним чином; тож значно підвищується прогнозуючий потенціал ЛП як на стадії аналізу, так і синтезу мовного повідомлення.


Додаток Е. Система сприйняття просторових відношень.

В межах запропонованої концепції структурно-функціональної єдності ЛП-БЗ була створена модель мовної діяльності, що відтворює процес сприйняття людиною просторових відношень (П-відношень); тут по суті моделюється робота ЛП, що стосується аналізу просторової складової базової семантико-синтаксичної структури. В цьому випадку безпосередньо пов'язуються функції ЛП та БЗ, і мова йдеться про створення моделей “розуміння “ природної мови. Звичайно – це вузька предметна сфера, що обмежена лише просторовими відношеннями, проте вона постає важливою складовою на стадії формування ЛП.

На шляху моделювання реалізована плідна концепція використання “образотворчих засобів семантики” (за Ю. Д. Апресяном), коли змістовна інтерпретація поняття подається через його графічний образ – це найповніша семантична характеристика (для певного класу термінів, звичайно). Тут, по суті, моделюється фрагмент бази знань, що одночасно реалізується на двох рівнях – образному та символьному (інтегруються особливості систем обробки образної та символьної інформації, де предметна сфера обмежена просторовими відношеннями побутової лексики). На шляху розбудови моделі вирішені такі питання як: вибір базових просторових відношень та їх класифікація, графічна інтерпретація окремих лексичних одиниць, урахування систем відліку просторових відношень та схеми їх взаємодії. Особливість моделі в тому, що вона дійсно оперує зі змістом (смислом) окремих складових повідомлення, який актуалізується на графічному рівні.

На рівні БЗ актуалізовано фрагмент знань, відповідальний за сприйняття просторових відношень. На графічному рівні подані базові П-відношення, що визначаються побутовою лексикою, відповідають умовам повноти відтворення довкілля та мають нульове перекриття між собою; серед них виділяються два класи просторових відношень (відношення напрямку та відстані). В БЗ забезпечена інваріантність просторових відношень щодо розмірів сцени та напрямку сприйняття простору. БЗ для П-відношень реалізовано одночасно на графічному та символьному рівнях (моделюється тут взаємодія між першою та другою сигнальними системами).

На рівні ЛП в системі забезпечена семантична інтерпретація довільного відношення через базові складові. Запропоновано узагальнену процедуру формування “динамічного