LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Електроніка. Обчислювальна техніка → Формальні моделі та методи синтезу швидкодіючих багатозначних структур мовних систем

слів, словосполучень та речень, котрі вона розуміє. Таким чином смисл речення є предикат, який задає визначений зв’язок L(X,Y) поміж смислом та відповідним йому фрагментом тексту. Тут X=(x1, x2,…, xm) змінний вектор смислу, m – число його компонент, а y1, y2, … , yn – деякий фрагмент тексту, де y1, y2, … , yn – букви, які стоять на 1,2, ... , n місцях фрагменту. На підставі наданої моделі базується процес формалізації (математичний опис) природної мови, який запропоновано у роботі.

У роботі використовується апарат алгебри предикатів. Останню трактуємо як алгебру, носієм якої є множина M усіх предикатів Um, де U – непорожня множина всіляких змінних, яку називатимемо універсумом, тобто U={x1, x2,…, xm}. Множина U може бути як скінченною, так нескінченною. У першому випадку простір Um називатимемо скінченним, а в іншому – нескінченним. Тут x1, x2,…, xm – всілякі місця предметів. Тому їх інакше називатимемо предметними змінними. Якщо предмет a знаходиться на місці xi (i=), то будемо казати, що змінна xi приймає значення a та маємо такий запис xi=a. Якщо a1, a2,..., am U та x1=a1, x2=a2, ..., xm= am, то пишемо (a1, a2,..., am) Um і кажуть, що предметний вектор (набір) належить предметному простору Um. Число m називатимемо вимірністю простору Um. Будь-яку підмножину T простору Um називатимемо m-місцевим відношенням, яке задано на Um. Для формульного запису таких відношень будемо використовувати функції у вигляді Q(x)=Q(x1, x2,…, xm), яке відбиває Um у множину = {0,1}, що називатимемо предикатами, які визначені на Um. Елементи множини назватимемо логічними.

Нехай T – множина усіх відношень на Um, Q – множина усіх предикатів на Um. Відношення T та предикат Q називатимемо відповідними одне одному, якщо при будь-яких x1, x2,…,xm маємо:

(1)

Згідно з (1) можливий перехід від будь-якого відношення T до відповідного йому предикату Q. Предикат Q, що знаходимо по (1), називатимемо характеристичною функцією відношення T.

Предикатом розпізнавання предмета aU за змінною xi (i=) називатимемо умову

Предикат a(xi) будемо розглядати як предикат a(x1, x2,…, xi,..., xm) із P усі аргументи якого, крім xi, неістотні. Вираз у вигляді a(xi), де (i=), aU, замінимо на xia: тут a називатимемо показником для змінної xi .

Алгеброю предикатів над M називатимемо множину T з базисними елементами xia (i=, aU) та базисними операціями: дизюнкція, конюнкція, заперечення. Виключення з базису даної алгебри операції заперечення дозволяє отримати дизюнктивно-конюнктивну алгебру. Доведено її повноту.

Природну мову будемо уявляти як математичний об’єкт (якась алгебра). При цьому смисл (зміст) думок можна висловити реченнями і текстами, що з точки зору їх математичної природи будемо розглядати як предикати. Наша відправна точка у даних міркуваннях: думки – це предикати. Таким чином, кожне речення виражає деяку функцію з двійковим значенням, тобто задає деякий предикат P(x) = l. Незалежною змінною х даної функції буде змінна ситуація, залежною – істинна змінна l. Після підставлення замість змінної х конкретної постійної ситуації х=а задане речення стає істинним (l = 1) або хибним (l = 0). Це залежить від того чи відповідає чи ні зміст цього речення ситуації а, до якої воно віднесено. Будемо розглядати змінну ситуацію як набір х=(х1, х2,…, хm) предметних змінних х1, х2,…, хm. Будь-яка постійна ситуація х=а повинна бути набором а=(а1, а2,…, аm) деяких предметів х1 = а1, х2 = а2,…, хm= аm .Таким чином кожне речення повинно висловлювати деякий предикат P(х1, х2,…, хm) = l, що представляє залежність істинної змінної l від предметних змінних х1, х2,…, хm. Проте будь-яке речення за природно-мовною формою відрізняється від математичної формули тим, що виражає не усю функцію P(х1, х2,…, хm), а тільки її ім’я Р. І це так, бо кожен раз, коли людина перетворює те чи інше речення у відповідну до нього думку вона добудовує його до предикату. При цьому вона додає до нього (як до ім’я предикату) відсутні предметні змінні. Тільки після цього речення стає доступним для розуміння. Та, навпаки, перетворюючи деяку думку у речення, людина виключає з неї предметні змінні, що дозволяє передавати іншим людям не саму думку, а лише її ім’я.

Таким чином в роботі алгебра розглядається як інструмент дослідження, але не як його предмет. Розглянемо та побудуємо відповідні реляційні моделі лінгвістичних зв’язків елементів фонетичного рівня та морфології української мови за допомогою алгебри предикатів.

У третьому розділі об’єктом моделювання є відношення, що базуються на лінгвістичних зв'язках, які існують між різними елементами фонетичного рівня української мови. На підставі вивчення даних фонетики, математично описуються відношення, що зв'язують окремі фонеми з системою їх фонетичних ознак:

у1 – ознака голосності звуку зі значеннями: г – голосна, п – приголосна;

у2 – ознака шумності приголосних зі значеннями: ш – шумова, нш – нешумова;

у3 – ознака вокалізації звуку зі значеннями: дз – дзвінка, г – глуха;

у4 – ознака проривності звуку зі значеннями: пр – проривна, щ – щілинна;

у5, у6 – ознаки веляризації та лабілізації звуку зі значеннями: м, с, в – мала, середня, велика відповідно;

у7 – ознака палаталізації зі значеннями: т, м – тверда, м'яка відповідно;

у8 – ознака назалізації зі значеннями: р – ротова, н – носова;

у9 – ознака вібрантності зі значеннями: с – спокійна, т – тремтяча;

у10 – ознака місця артикуляції звуку зі значеннями: г – губна, п – передньоязикова, з – задньоязикова;

у11 – ознака локалізації передньоязикової шумової фонеми зі значеннями:
з – зубна, п – піднебінна;

у12 – ознака африкативності передньоязикових шумових фонем зі значеннями:
аф – африката, неаф – неафриката.

Встановлено зв'язки між звуками Y мови у визначеному фонетичному контексті Z та відповідними їм буквами українського алфавіту Х у вигляді тернарного відношення Ф (X, Y, Z), яке названо букво-фонемним.

Математична модель лінгвістичних зв'язків, що регулюють процес переходу від фонетичного подання слів до їх графічного запису й навпаки, буде мати вигляд: