LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Філологічні науки → Лексична та граматична семантика іменників у словнику української мови (назви знарядь праці та споруд)

граматична семантика іменників української мови, серед яких окремо розглянуто лексеми на позначення знарядь праці та споруд. Інструментом у цьому дослідженні є створена ЛБД LPart, з відображенням структури лівої частини словникової статті. У ній зафіксовано 52 925 іменників української мови, лексикографічно опрацьованих у СУМі.

Ґрунтуючись на теоретичних засадах ІТЛС, структуру граматичної семантики іменникових лексем розглянуто з погляду її елементарних складових інформаційних елементів, які набувають ролі граматичних параметрів і виступають формальними репрезентантами граматичної семантики. Такими елементами є: число (параметр на позначення числа), рід (параметр на позначення роду), парадигма (параметр на позначення парадигматичного (словозмінного) класу), стиль (параметр з відображенням функціонально-стильової диференціації). В окремий умовно визначений параметр компонент виділено лексемний варіант реєстрового слова, специфіка якого зумовлена морфологічними (кореневими, коренево-суфіксальними), фонетичними або акцентуаційними відмінностями. Виділення таких елементів здійснене в процесі декомпозиції лівої частини словникових статей, що передбачало встановлення її структурного складу.

Виявлені граматичні параметри у структурі лівої частини словникової статті є ієрархічно упорядкованими. На найвищому рівні такої ієрархії виділяється комплекс, з яким співвідноситься параметр на позначення числа, нижче – блок, з яким співвідноситься параметр на позначення роду, за ним – підблок, що співвідноситься з параметром на позначення парадигматичного (словозмінного) класу, під яким – компонент з відображенням варіативності реєстрового слова. У такий спосіб встановлюється механізм структурування лівої частини словникової статті іменника, що відображено системою вкладень, яка формально визначається у такий спосіб:

L(х)=ЧКРБППК, (8)

де у лівій частині словникової статті L(х) виділяються: ЧК – сукупність числових комплексів, РБ – сукупність рід-блоків, ПП – сукупність парадигматичних підблоків, К – сукупність компонентів, а символом позначено входження кожного наступного елемента в попередній.

Побудова моделі лексикографічної системи з відображенням граматичної семантики полягала у встановленні способів кількісного співвідношення виділених параметрів граматичної семантики. З цією метою ЛБД LPart переформовано у вторинну ЛБД LPart Decomp відповідно до програмного запиту і в такий спосіб автоматично визначено способи кількісного комбінування граматичних параметрів у лівих частинах словникових статей іменників української мови. Результати фіксувалися у ЛБД, основне відношення якої подано в таблиці 3:


Таблиця 3.

Фрагмент бази даних ЛБД LPart Decomp з відображенням кількісного комбінування граматичних параметрів у лівих частинах словникової статті іменників


ID Stat

ID IN

Компонент

Парадигма

Рід

Число

1898

1011

БАЛКА#РИ

iв,

мн.

1898

1012

БАЛКА#РЦІ

iв,

мн.

1898

2111

БАЛКА#Р

а,

ч.

одн.

1898

2122

БАЛКА#РЕЦЬ

рця,

ч.

одн.

1898

2213

БАЛКА#РКА

и,

ж.

одн.

При цьому у полі ID Stat фіксувався порядковий номер словникової статті, представленої реєстровим словом; у полі ID IN відображалися граматичні параметри у порядку їх виявлення програмою; поля Компонент, Парадигма, Рід та Число фіксували відповідний параметр, що відображався у словниковій статті.

Автоматично встановлені комбінації параметрів граматичної семантики кваліфікуються за допомогою спеціально розробленої нотації – системи умовних письмових позначень, представлених в аналітичній числово-буквеній формі. Здійснений у такій системі запис позначено терміном сигнатура. Кожна L(х) визначалася власною сигнатурою, що свідчить про належність до певного сигнатурного типу чи класу.

За допомогою автоматичного аналізу комбінування формальних репрезентантів граматичної семантики іменників було визначено граничні межі кількісного співвідношення кожного з параметрів у межах будь-якої L(х). Відповідно до механізму вкладень встановлено правила:

1. Числових комплексів у межах одного реєстрового ряду може бути 1 або 2:

L(х)=ЧК₁ або L(х)=ЧК₁+ЧК₂;

2. Рід-блоків у межах одного числового комплексу може бути 1, 2 або 3:

ЧК=РБ₁ , ЧК=РБ₁+РБ₂ або ЧК=РБ₁+ РБ₂+ РБ₃;

3. Парадигматичних (словозмінних) підблоків у межах одного рід-блоку може бути 1, 2 або 3:

РБ=ПП₁ , РБ=ПП₁+ПП₂ або РБ=ПП₁+ПП₂+ПП₃;

4. Компонентів у межах одного парадигматичного підблоку може бути 1, 2 або 3:

ПП=К₁ , ПП=К₁+К₂ або ПП=К₁+К₂+К₃.

Виведені правила, що визначають кількісну параметризацію граматичної семантики іменників української мови, можна вважати за такі, що стосуються організації граматичної підсистеми іменника не тільки у словниковому відображенні, а й у системі мови загалом.

Параметризацію граматичної семантики з урахуванням кількісних співвідношень параметрів у межах лівої частини словникової статті відображає граф 1:

Граф 1.

З метою автоматичного визначення кількісного комбінування параметрів граматичної семантики у межах лівої частини словникової статті іменників було розроблено нотацію з відповідними позначеннями структурних елементів: комплексу, блоку, підблоку та компонента, за якою:

1. Для формального відображення елемента компонент використано цифрові символи, що вказують на загальну кількість компонентів, які реалізуються в межах кожного підблоку, блоку та комплексу лівої частини словникової статті.

2. Для формального відображення в нотації елемента підблок, що формується параметром на позначення парадигматичного класу, використано позиційні умовні позначення. Загальну кількість підблоків у нотації відображено через одно- (х₁), дво- (х₁х₂) чи тричленний (х₁х₂х₃) числовий запис.

3. Для відображення в нотації структурного елемента блок, що формується параметром на позначення роду, застосовано символ крапки „ . ", який фіксується лишеза наявності одночасно двох чи