LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Електроніка. Обчислювальна техніка → Формальна модель мови як основа прогресивних інформаційних технологій

все структурне різноманіття синтаксичної організації мовного повідомлення, що не виходить за межі атомарного речення. Проте, часом в повідомленні зустрічається інформація, що не пов'язана безпосередньо із змістовною стороною відтворюваної ситуації. Інформація подібна визначається комунікативним аспектом організації мовного повідомлення і відтворює ті чи інші аспекти процесу комунікації.

Особливістю комунікативної організації є факт, що відповідні мовні засоби впливають лише на організацію процесу спілкування. Та все ж, можливість вилучення цих характеристик з мовного матеріалу, з подальшим їх використанням, постає однією з обов'язкових умов функціонування систем обробки природно-мовної інформації. В роботі аналізуються особливості організації комунікативних засобів та подається їх класифікація. Вилучення таких засобів із повідомлення постає суттєвим допоміжним етапом на шляху аналізу мовного повідомлення. Це буде, по суті, перший етап обробки мовної інформації, що пов'язаний з розподілом повідомлення на змістовну та комунікативну складові; змістовна інформація у подальшому структурується за синтактичними складовими (структура SBO та її трансформації), а комунікативна складова подає допоміжну інформацію щодо характеру спілкування.


Розділ 9. Зв'язність текстової інформації

Подано аналіз структурного оформлення мовного матеріалу, що виходить вже за межі окремого повідомлення. У роботі запропоновано схему "координатного" зв'язку тексту, що пояснює, яким чином одне повідомлення пов'язується з наступним для відтворення цілісності зовнішнього середовища. Розглядаються схеми послідовного, паралельного та комбінованого типів опису певного фрагмента довкілля та відповідне використання мовних засобів. Цей розділ практично завершує подання формальної моделі мови, яка охоплює головні особливості структурної організації довільного мовного повідомлення на монопредикатному та поліпредикатному рівнях.

Якщо простежити витоки формального підходу до розбудови моделі мови та урахувати науково-методологічні засади системного підходу до аналізу мовної діяльності взагалі, то можемо зробити висновок, що запропоновані формалізми спираються на загальнолюдські особливості опрацювання символьної інформації і постають як плідна основа формування універсального синтаксису.

Основна частина дисертації окреслює найважливіші моменти розбудови формальної моделі мови, що постають плідною основою не лише організації мовного матеріалу, але й мовної діяльності, взагалі. Використання запропонованих формалізмі на шляху створення сучасних інформаційних технологій, орієнтованих на опрацювання природно-мовного матеріалу (читай, на моделювання мовної діяльності людини), вимагає ретельного дослідження цілого спектру важливих та цікавих проблем. У цьому напряму здобувачем виконані вже вагомі напрацювання, що дозволяють вирішувати окремі вузлові питання формування сучасних інформаційних ПМ-технологій. Певним чином ці проблеми значно поглиблюють конкретні напрями розбудови формальної моделі. Проте, щоб не порушувати цілісність подання запропонованої моделі, такі питання винесені до додатків.

У додатках наведені найважливіші пропозиції щодо використання запропонованої формальної моделі для сучасних технологій, орієнтованих на опрацювання ПМ-інформації.


Додатки


Додаток А. Кількісні оцінки актуалізації базової структури

Формальне визначення базової семантико-синтаксичної структури дозволяє кількісно оцінити можливі варіанти актуалізації такої конструкції. Для флективних мов, що визначаються довільним порядком використання окремих складових повідомлення, вдається виконати підрахунки на різних рівнях актуалізації повідомлення (об'єктному, атрибутивному). Якщо базова структура визначається N складовими, то кількість можливих варіантів актуалізації такого повідомлення характеризується наступними значеннями: на об'єктному рівні матимемо N! варіантів; на атрибутивному рівні ця кількість складатиме 2N варіантів (враховуються пре- та постпозиційні схеми використання атрибутивних членів Attr(Obj); на рівні використання складових подвійної атрибуції Attr(Attr) матимемо ще 2N варіантів відтворення повідомлення; порушення цілісності відтворення окремих актантів у повідомленні подає ще 24 варіантів поширення повідомлення.

Якщо кожен з варіантів відрізняється позицією хоча б одного елемента, то для повідомлення з N складовими, кожен з яких поширюється і на атрибутивному рівні, загальна кількість можливих схем актуалізації базової структури складатиме N!*2N*2N*24 варіантів. Для аналітичних мов (англійської, наприклад) ця кількість трохи зменшиться і становитиме (N-2)!*2N*2N*24. Для повідомлення з N=8 складовими, визначеними на атрибутивному рівні і на рівні подвійної атрибуції, загальна кількість можливих варіантів актуалізації повідомлення складатиме

К= 8!*28*28*24 = 8!* 220 . Це вражаюча кількість варіантів можливих реалізацій окремої структури, що складає близько сорока мільярдів! Звідси випливає цікавий висновок – відповідь на питання - чому до цього часу не було визначено базову структуру мовного повідомлення. Дійсно, здіймаючись від найпростіших мовних конструкцій до складних, дуже важко розгледіти узагальнені особливості мовної організації серед такого різноманіття структур. Наш підхід протилежний – ми йдемо від максимально повної схеми відтворення окремої ситуації дійсності до більш простих, що визначаються як трансформації узагальненої структури.


Додаток Б. Явище рекурсії в природній мові

Формальне визначення базової семантико-синтаксичної структури та результати досліджень розділів 2.2 та 2.3. необхідним чином підводять нас до визнання рекурсивної схеми організації окремого повідомлення і мовного матеріалу взагалі. Ідея рекурсивної організації повідомлення лежить на поверхні мовної компетенції людини і була притаманна вже першим кваліфікованим спостереженням над мовною організацією (картезіанська граматика Пор - Рояля, спостереження В. фон Гумбольдта, праці Ф. де Сосюра, Н. Хомського). Проте всі ці пропозиції пов'язані з рекурсивною організацією повідомлення, де елементом рекурсії вважалося структурно-неокреслене поняття словосполучення.

Запропонована формальна модель, що принципово заперечує використання словосполучення як структурного елемента повідомлення і за кожною такою структурою вбачає стандартну базову схему, дозволяє запропонувати рекурсивну схему формування повідомлення, де елементом рекурсії постає базова семантико-синтаксична структура, що отримує однозначне визначення на формальному рівні. Рекурсивна організація мовного повідомлення, у загальному випадку, зумовлюється використанням породжувальних семантико-синтаксичних функцій.

Визнання структури SBO основною та єдиною структурною одиницею формування мовного матеріалу має важливий системотворчий характер. Довільне повідомлення може бути актуалізовано окремою базовою структурою чи її трансформацією (монопредикатний рівень) або сукупністю монопредикатних структур (поліпредикатний рівень організації мовного матеріалу). Якщо власне базова структура, її