LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Електроніка. Обчислювальна техніка → Формальна модель мови як основа прогресивних інформаційних технологій

ПМ-інформації, свідчить формування державної науково-технічної програми “Образний комп'ютер” та пропозиції щодо програми “Інформація. Мова. Інтелект”.


Зв'язок роботи з науковими програмами, планами, темами

Результати дисертаційних досліджень увійшли до міжнародної програми “Комп'ютеризація природних мов”, яку було прийнято на початку вересня 1999 року в Болгарії. Текст угоди та наукові матеріали подані в працях першого міжнародного семінару “Комп'ютеризація природних мов”, Болгарія, Варна, курорт “Св. Костянтина”, 3-7 вересня, 1999. Проект орієнтовано на формування перспективних інформаційних технологій саме у сфері використання природної мови. Угоду на початковому етапі підписали Болгарія, Росія, Татарстан та Україна. Кисленко Ю. І. за дорученням ректора НТУУ “КПІ” брав активну участь як на стадії опрацювання загальної концепції розвитку природно-мовних технологій, так і на стадії формування наукової основи угоди.

За двома напрямами дисертаційні матеріали увійшли до угоди. По-перше, запропонована Ю. Кисленко формальна модель мови була прийнята як продуктивна платформа формування мовних та міжмовних технологій. Плідною виявилася концепція стосовно дихотомії граматичних засобів на загальний та конкретний синтаксис а також уявлення про рекурсивну схему організації мовного матеріалу, звідки випливає також і рекурсивна процедура його обробки. По-друге, продуктивною виявилася також концепція інтегрування систем обробки образної та символьної інформації на шляху формування природно-мовних технологій для моделювання окремих складних функцій мовної діяльності людини. На сучасному етапі продовжується плідна співпраця в рамках цієї угоди стосовно реалізації перспективних розробок.

В межах співпраці між НТУУ “КПІ” та Міжнародним науково-навчальним центром інформаційних технологій та систем подано пропозиції до державної науково-технічної програми “Образний комп'ютер”. Співпраця передбачається за напрямами: створення лінгвістичного процесора, формування бази знань для моделювання мовної діяльності, інтеграція систем опрацювання образної (зорової, акустичної) та символьної інформації. Вирішується питання про співпрацю на рівні використання образної інформації дотику.

Результати дисертаційних досліджень використовуються також для підготовки фахівців з напряму природно-мовних технологій: в межах Національного технічного університету “КПІ” на кафедрі технічної кібернетики було відкрито спеціалізацію “Гнучкі комп'ютеризовані системи в природно-мовних технологіях”; на факультетах інформатики та лінгвістики КПІ читаються курси з системної організації мови, що спираються на запропоновану формальну модель; відповідні курси прочитано в Рівненському державному гуманітарному університеті та Острозькій академії.


Сучасний стан справ у напряму інформаційних ПМ-технологій

Поточний стан справ у сфері інформаційних технологій, орієнтованих на використання природної мови, досить однозначно визначається тезою: титанічні зусилля багатьох наукових колективів поки що не привели до бажаних результатів. Так з посиланням, наприклад, на найважливіші досягнення у сфері автоматичного перекладу (огляд робіт через Іnternet), можемо констатувати: обчислювальні системи п'ятого покоління, які були зорієнтовані на використання ПМ-процесора та накопичення ПМ-знань, ще не створені; системи машинного перекладу не вийшли з експериментальної стадії і кваліфіковані перекладачі не користуються їхніми послугами; концепція використання бази знань для ПМ-технологій уявляється досить перспективною, проте їй бракує адекватної теоретичної підтримки; використання мов – посередників (типу Інтерлінгва) для подання семантичної інформації є малоефективним.

Усі вказані вади ПМ-технологій, власне, зумовлені відсутністю адекватної моделі природної мови. Стан справ стосовно проблем формалізації природної мови найкраще визначимо, коли звернемося до визнаних авторитетів у цій галузі. Концентрований погляд на сучасний стан мовознавства зводиться до того, що мова - це система взаємопов'язаних одиниць різних рівнів, де мало розумногологічного порядку, і багато видатних лінгвістів, зокрема Уітні, Ф. де Соссюр, вважали мову погано організованим сховищем (дивись: Якушин В.В. Гипотезы о происхождении языка - М.: Наука, 1984 - с. 18).

Предметніше аналіз сучасних синтаксичних концепцій подає Астахова Л. І. (Предложение и его членение – Днепропетровск: ГУ, 1992). Суть її критичних зауважень полягає в тому, що:

по-перше, багаторічна критика основних положень формальної граматики вже по суті "підготувала суспільну психологію до заперечення теорії речення";

по-друге, автор підтримує думку Р. Г. Піотровського, який вважав мовознавство не експериментально-теоретичною (що грунтується на масовій обробці емпіричного матеріалу), а переважно описово-спекулятивною наукою, де основні граматичні положення ілюструються ретельно підібраним мовним матеріалом, а не довільною повною вибіркою (Лингвистические уроки машинного перевода // Вопросы языкознания - N4 – 1985 – С. 18-27);

по-третє (найголовніше), незадовільний стан більшості положень сучасної теорії речення свідчить лише про хибність основних базових понять, закладених в цю теорію. Очевидно, необхідно замінити ці підвалини, а в синтаксичній науці взагалі потрібно чітко визначити сам об'єкт наукових пошуків та правильно розставити акценти.

Ці критичні зауваження не тільки відтворюють сучасний стан мовознавства, але й стимулюють наукові пошуки у вказаній сфері. О. С. Нарін'яні в передмові до збірника, присвяченому поданню знань та діалоговій взаємодії (Диалоговое взаимодействие и представление знаний - Новосибирск, 1985), зауважує, що все очевиднішою постає необхідність перебудови формальної моделі мови, яка повинна відтворювати найважливіші функції мови як засобу спілкування.


Мета дослідження

Мета дослідження – формування технологій, орієнтованих на обробку природно-мовної інформації, які б досить ефективно моделювали найважливіші вияви мовної діяльності людини – такі, наприклад як: опрацювання (синтез та аналіз) текстової інформації; обробка мовленнєвої (акустичної) інформації; переклад з однієї мови на іншу; подання, накопичення та формування нових знань; пошук інформації; інтеграція систем обробки образної та символьної інформації тощо. Проте цієї мети зможемо досягти лише через створення адекватної формальної моделімови, яка і стане основою формування нових прогресивних ПМ-технологій. Тож головні зусилля будуть спрямовані спочатку на розбудову формальної моделі природної мови.

Необхідно створити модель природної мови, що грунтуватиметься на формальних засадах, матиме достатню пояснювальну силу стосовно найважливіших виявів мовної діяльності та буде несуперечливою щодо визнаних лінгвістичних фактів. Така модель створюється на засадах об'єднання основних досягнень структурної, когнітивної та генеративної лінгвістики; до розбудови моделі залучаються наукові надбання не лише лінгвістів, але й психологів та фізіологів,