Накануне важного праздника в Якутии — Дня республики — в Переводчике появился якутский язык. Теперь все желающие могут переводить слова и фразы с якутского на 98 языков и обратно. Сервис доступен на сайте и в мобильном приложении.
По данным переписи населения 2010 года, якутским языком владеют более 450 тысяч человек, проживающих в основном на территории Якутии. Теперь люди, которые говорят и пишут на якутском, могут использовать Переводчик для чтения текстов на иностранном языке. Как и для многих других языков народов России, для якутского языка существует очень мало параллельных текстов, необходимых для обучения машинного переводчика. В Якутии команде Яндекса помогли энтузиасты, которые собрали около 50 тысяч фраз на якутском и их переводы на русский.
Переводчик разрабатывали в несколько этапов. Сперва команда сервиса обучила нейросеть на тех примерах, которые удалось собрать благодаря энтузиастам. Затем обогатила полученную модель данными из родственных языков. Якутский язык относится к тюркским языкам, поэтому для обогащения применили созданную ранее пантюркскую модель — она учитывает морфологию, лексику и синтаксис сразу нескольких таких языков. А чтобы нейросеть научилась составлять грамотные предложения на русском языке, использовали большие корпуса русских текстов и методику обратного перевода.
«Мало где в мире на территории одной страны можно встретить такое разнообразие языков, как в России. Это огромное богатство, и добавление языков разных народов в Яндекс.Переводчик — один из способов их сохранения. Мы рады, что благодаря технологиям и бесценной помощи энтузиастов, смогли добавить в наш Переводчик якутский язык», — рассказывает Антон Дворкович, заместитель руководителя отдела машинного перевода Яндекса.
«Идея создать машинный перевод для якутского языка возникла ещё в 2017 году. Последние полтора года на общественных началах ведётся сбор двуязычных русско-якутских текстов, подготовка эталонных якутско-русских переводов для оценки качества перевода. Качество машинного перевода для якутского языка уже приближается к человеческому, но ещё требует совершенствования. Совместно с командой Яндекс.Переводчика мы продолжим собирать данные для достижения ещё более высокого результата. Машинные переводчики — один из важных инструментов по сохранению исчезающих языков. По моему мнению, компания „Яндекс“ является единственной компанией в мире, которая ведёт работу по сохранению языков народов России с помощью машинного перевода», — сообщил Алексей Иванов, научный сотрудник Национальной библиотеки Якутии, энтузиаст, инициатор поддержки якутского языка в машинных переводчиках.
Источник: Пресс-служба компании Яндекс
Яндекс.Переводчик освоил якутский язык
НИА-Саха