LibRar.Org.Ua — Бібліотека українських авторефератів

Загрузка...

Головна Культура. Наука. Освіта → Автоматическая коррекция орфографических ошибок

Автоматическая коррекция орфографических ошибок
171



УДК 004.4’412

АВТОМАТИЧЕСКАЯ КОРРЕКЦИЯ ОРФОГРАФИЧЕСКИХ ОШИБОК.
Гниловская Л.П.
Факультет вычислительной математики и кибернетики Московского государственного универ-
ситета им. М.В. Ломоносова, Москва, Россия

Гниловская Н.Ф.
Крымская Республиканская универсальная научная библиотека им. И. Франко, Симферополь, Ук-
раина

Предоставление читателям библиотек возможности использования каталогов и полнотексто-
вых документов на электронных носителях облегчает поиск необходимой информации, экономит вре-
мя, позволяет произвести наиболее полный отбор и изучение материалов. При создании баз данных про-
изводится ввод текстовой информации. Орфографические ошибки, появляющиеся в таких текстах, не
редкость. Современные текстовые редакторы предлагают варианты для их исправления, что требует
вмешательства пользователя. Автор статьи предлагает автоматическую коррекцию орфографиче-
ских ошибок, основанную на морфемном анализе.

Granting to readers of libraries of an opportunity of use of catalogues and text-through documents on
electronic carriers facilitates search of the necessary information, saves time, allows to make the fullest selection
and studying of materials. At creation of databases input of the text information is made. The spelling errors
appearing in such texts, not a rarity. Modern text editors offer variants for their correction that demands inter-
vention of the user. The author of clause offers the automatic correction of spelling errors based on the mor-
phemic analysis.

Проникновение электронной информации во все слои человеческой деятельно-
сти заставляет библиотечные учреждения активно осваивать современные информаци-
онные технологии, внедрять автоматизированные системы, создавать электронные
библиотеки, развивать Интернет-услуги. Цивилизованный библиотечный мир одно-
значно воспринимает эти изменения как одну из характерных тенденций общества бу-
дущего, как систему, облегчающую доступ пользователей к информационному ресурсу.
Нарастание потоков электронной информации во всех сферах человеческой дея-
тельности резко повышает статус библиотеки как информационного и общественного
института. Чтобы полно и оперативно удовлетворять информационные запросы со-
временного пользователя, библиотека должна быть в центре внедрения современных
технологий и использования электронной информации. Реальностью сегодняшнего дня
стали электронные издания, число которых постоянно увеличивается. Библиотеки, не
имеющие в фонде тех или иных электронных изданий и предоставляющие к ним дос-
туп через Интернет, уже с полным на это основанием включают их библиографические
описания в свои каталоги и предоставляют их пользователям.
Дальнейшая информатизация общества и расширение сферы применения ин-
формационных технологий в библиотечной практике в современных условиях порож-
дают новые виды и формы обслуживания пользователей библиотек. Главная особен-
ность – самостоятельность пользователя в работе с компьютерными ресурсами библио-
© Гниловская Л.П., Гниловская Н.Ф.
Культура народов Причерноморья, 2004 г. № 48. Т.2
172
Гниловская Л.П., Гниловская Н.Ф.

теки. Это требует обеспечения определенного уровня обслуживания и заставляет биб-
лиотекарей более тщательно относится к системе автоматизации, к возможностям ин-
формационных технологий, внедряемых в библиотечную практику.
Научная библиотека Московского университета им. М. В. Ломоносова - одна из
старейших библиотек России: основана в 1756 году. Она является подразделением
МГУ, самоуправляемого государственного вуза Российской федерации. Ежегодно здесь
обслуживается более 60 тысяч постоянных читателей, из которых 52 тысячи - сотруд-
ники и учащиеся университета. Количество посещений составляет 1,8 млн. в год. Кни-
говыдача - 4 млн. экземпляров. За год читателям выдается более 80 тыс. справок. К их
услугам 16 абонементов и 60 читальных залов на 3300 мест. В штате библиотеки более
700 сотрудников, работающих в 38 отделах: 19 отделах обслуживания, 17 функцио-
нальных, 2 научных - редких книг и рукописей и компьютеризации информационно-
библиотечных процессов. Универсальный фонд научной и учебной литературы насчи-
тывает 8,5 млн. единиц хранения, в том числе 2,5 млн. на иностранных языках. В отде-
ле редких книг и рукописей более 200 тыс. единиц хранения: средневековые, греческие,
латинские, французские, немецкие, восточные и славянские рукописи, русские рукопи-
си XVIII-XIX вв., архивные материалы XVIII-XIX вв., западноевропейские инкунабулы
и палеотипы, славянские и русские старопечатные книги; редкие русские издания
XVIII-XX вв. Библиотека обеспечивает литературой работу 21 учебного подразделения
МГУ: механико-математический факультет, факультет вычислительной математики и
кибернетики, физический факультет, химический факультет, биологический факультет,
факультет фундаментальной медицины, факультет почвоведения, геологический фа-
культет, географический факультет, высший колледж наук о материалах, исторический
факультет, филологический факультет, факультет иностранных языков, философский
факультет, социологический факультет, экономический факультет, юридический фа-
культет, факультет журналистики, факультет психологии, институт стран Азии и Аф-
рики, институт государственного управления и социальных исследований. Одним
из
главных направлений работы библиотеки является пополнение ее фондов. Комплекто-
вание отечественной литературой ведется на основе государственного бесплатного обя-
зательного экземпляра, который библиотека получает с 1920 года, прямых контактов с
издательствами, книготорговыми организациями. Фонд иностранной литературы в зна-
чительной степени пополняется за счет изданий, получаемых по международному кни-
гообмену, (библиотека имеет около 1000 партнеров по обмену в 63 странах), благодаря
дарам различных организаций и частных лиц, а также в результате валютной подписки
на периодические издания.
В 1987 году началась компьютеризация библиотеки МГУ. Был организован от-
дел компьютеризации информационно-библиотечных процессов, создано современное
программное обеспечение, позволяющее комплексно решить вопрос перевода библио-
течного дела на компьютерную технологию. В эксплуатации находится система "Биб-

Культура народов Причерноморья, 2004 г. № 48. Т.2
Автоматическая коррекция орфографических ошибок
173



лиотека 4.0", получившая широкое распространение в библиотеках России. Данная сис-
тема использует формат US MARC библиотеки Конгресса США. Она может приме-
няться как на отдельном персональном компьютере, так и в локальной сети, позволяет
компьютеризировать все библиотечные процессы, начиная с комплектования литерату-
ры и заканчивая информационным обслуживанием читателей.
С 1990 года все новые поступления книг заносятся в электронный каталог. В на-
стоящее время объем электронного каталога составляет около 280 тысяч названий.
Кроме основного каталога книг ведутся отдельные каталоги по различным областям
знаний на основе росписи журнальных статей. Имеется полнотекстовая база данных
учебников. В помещениях научной библиотеки МГУ читатели имеют доступ к полным
текстам статей журналов Научной Электронной Библиотеки eLIBRARY.RU. Предос-
тавление читателям возможности пользоваться электронными каталогами, различными
по тематике базами данных и полными текстами учебников и отраслевых журналов
значительно облегчает тематический поиск необходимой информации, экономит время,
позволяет произвести наиболее полный отбор и изучение документов.
При создании различных по назначению баз данных производится ввод тексто-
вой информации, осуществляемый двумя способами – набором вручную или сканиро-
ванием. Как правило, при этом возникают одни и те же проблемы. Если набирать текст
вручную, то возможны опечатки и появляется необходимость