Цифровое будущее осетинского языка

В Северной Осетии активно реализуется проект по цифровизации осетинского языка – один из приоритетных шагов в сохранении и развитии родной речи в эпоху цифровых технологий. Работа началась ещё в 2023 году: тогда осетинский язык был интегрирован в крупнейшие языковые платформы – Яндекс и Google.

«Для обучения искусственного интеллекта (ИИ) потребовался так называемый языковой корпус – массив текстов и речевых образцов. Для сравнения: в романе «Война и мир» – около 35 тысяч фраз, тогда как для качественного синтеза и распознавания речи требуется миллионы фраз. На первом этапе в Яндекс передали 100 тысяч фраз, что позволило создать первую версию ИИ, способного воспроизводить речь на осетинском языке», – рассказал Александр Нартиков, советник главы республики по вопросам развития и цифровизации осетинского языка.

Однако качество требует улучшения. В этой связи в республике учреждён Фонд цифрового развития осетинского языка, на базе которого запущена специализированная платформа для совместной работы над расширением языкового корпуса. В проекте примут участие переводчики, филологи, музыковеды и носители языка. Реализация рассчитана до двух лет, но первые результаты станут заметны уже на промежуточных этапах.

«Особое внимание уделяется созданию голоса осетинского языка. Планируется объявить открытый конкурс на лучший голос – аналогично голосу «Алисы» в Яндексе. Компания готова бесплатно организовать профессиональную студийную запись выбранного голоса в Москве, чтобы ИИ мог синтезировать естественную, эмоциональную речь», – подчеркнул Александр Нартиков.

Не менее важна и задача распознавания устной речи: для этого всех желающих приглашают записывать фразы на диктофон или смартфон – даже с шумом улицы или фоновыми помехами. Это позволит ИИ научиться понимать разные акценты, диалекты и интонации, обеспечивая точное взаимодействие с пользователями.

Важный принцип проекта – некоммерческая, общественная собственность на результаты. Все наработки станут достоянием республики и будут использоваться в образовательных, культурных и туристических целях.

«В частности, ведётся работа по развитию туристического приложения, изначально разработанного резидентом ИТ-отрасли – компанией «Цифровая Алания» (включённой в реестр российских IT-компаний и получившей государственный грант). По решению правительства Северной Осетии, приложение будет передано республике – в ведение министерства культуры, которое возглавит его развитие с акцентом на культурное наследие: исторические памятники, музеи, традиции. Приложение уже доступно для скачивания и будет обновлено: появятся новые сервисы, актуализированные маршруты и мультимедийный контент», – пояснил Александр Нартиков.

Проект объединяет усилия министерства культуры, министерства экономики и ИТ-сообщества – с целью не только сохранить язык, но и сделать его живым, востребованным инструментом в цифровой среде: от онлайн-обучения до умных туристических гидов.