Новости Республики Коми | Комиинформ

Öньö Лав: Работа по созданию национального корпуса коми языка требует объединения усилий

Öньö Лав: Работа по созданию национального корпуса коми языка требует объединения усилий
Öньö Лав: Работа по созданию национального корпуса коми языка требует объединения усилий
logo

Межрегиональная лаборатория информационной инфраструктуры финно-угорских языков при Академии госслужбы и управления подводит итоги работы за 2013 год и верстает планы на будущее.

Как рассказала Финно-угорскому порталу заведующая лабораторией Марина Федина, в уходящем году специалистам лаборатории удалось больше запланированного. Кроме того, что математики-лингвисты разрабатывали новые электронные продукты, они занимались и образовательной деятельностью, проведя пять выездных семинаров для учителей коми языка в различных районах Коми. В будущем году образовательная работа продолжится в рамках шести выездных семинаров.

Самым крупным продуктом минувшего года М.Федина назвала электронные версии словарей и создание системы проверки коми орфографии в режиме онлайн и оффлайн.

В будущем году лаборатории предстоит большая работа с термино-орфографической комиссией по стандартизации современной коми орфографии и кодифицированию языковых норм в соответствии с современными изменениями. "Произойдет обновление нормирования всех орфографических правил коми языка", - уточнила завлабораторией.

Кроме того, продолжится масштабная работа по созданию корпуса коми языка в виде электронной версии всех печатных изданий, когда-либо выходивших на коми языке. Над созданием глобального виртуального архива трудится коми-пермяцкий ученый Öньö Лав. "В республике много книг, газет, которые сейчас малодоступны. Мы хотим сделать их общим достоянием. Цель - создать единую базу, доступную для всех, чтобы наследие сохранилось в случае утраты бумажных носителей. Главное препятствие для опубликования - авторские права", - пояснил ученый. По его словам, работа по дигитализации культурного наследия идет по всему миру, однако для ее успешной реализации необходимо объединить усилия всех заинтересованных организаций.

Больше всего времени в работе отнимает сканирование бумажных носителей, одна страница занимает 3-4 минуты, а их общее количество превышавет несколько сот тысяч. "Для сравнения, корпус коми-пермяцкого языка составляет семь миллионов слов, наследие Коми богаче в пять-шесть раз", - отметил Öньö Лав. Мечта специалистов лаборатории - бесконтактный сканер, который используют для подобных работ в других странах. Стоимость агрегата колеблется в пределах миллиона рублей, и лаборатория не располагает такими средствами. "Надеемся на то, что к проблеме подкючатся республикаснкие власти", - заключил ученый.