Яндекс.Переводчик заговорил на чувашском

Чувашский язык появился в списке языков в Интернет-сервисе «Яндекс.Переводчик». Бесплатный сервис мгновенно переводит слова, фразы и тексты с чувашского на русский и наоборот, что позволяет пользователям знакомиться с культурой, литературным наследием чувашского народа. Кроме того, слова и фразы с чувашского можно также переводить на 97 других языков и наоборот.

Инициатором создания машинного переводчика выступил главный редактор Чувашского народного сайта Николай Плотников со товарищи, в числе которых — журналисты, пишущие на чувашском, филологи, литераторы, библиотекари, студенты… В разработке приняли участие также программисты из команды «Яндекса», поддержало инициативу и Правительство республики. Так, 17 декабря 2019 года при Министерстве цифрового развития, информационной политики и массовых коммуникаций ЧР была создана рабочая группа по применению информационных технологий для автоматизированного перевода текстов с русского на чувашский язык и с чувашского на русский язык.

ОЛЕГ НИКОЛАЕВ, временно исполняющий обязанности Главы Чувашской Республики:

— Могу только выразить слова благодарности компании «Яндекс» за то, что они обратили внимание на инициативу неравнодушных жителей республики и реализовали этот проект в рамках «Яндекс.Переводчика». Для нас это важно сразу по нескольким причинам. Во-первых, сохранение интереса к национальному языку со стороны молодежи и подрастающего поколения. Понятно, что все современные сервисы ориентированы прежде всего на русскоязычное исполнение. Появление чувашского языка в «Яндекс.Переводчике» позволит сделать работу с ним интересной для молодежи.
Во-вторых, это значимый подарок всем жителям республики и ее уроженцам, проживающим за пределами региона и в других странах к 100-летию образования Чувашской автономной области.
А в целом, это очень позитивное событие, которое, уверен, положительно скажется и на имидже чувашского языка, и на его популяризации.

Как рассказывают разработчики, чтобы научить машину переводить, нужны параллельные тексты — одни и те же, но на разных языках. А для чувашского языка таких текстов в интернете очень мало. Вот тут и понадобилась помощь энтузиастов, которые собрали 250 тысяч одинаковых фраз на русском и чувашском. Этого достаточно, чтобы начать обучать модель, но слишком мало для получения качественного перевода (для хорошего качества требуется порядка 1 миллиона пар).

Перевод для чувашского создавали в несколько этапов. Сначала обучили нейросеть на тех примерах, которые удалось собрать. Затем обогатили полученную модель данными из родственных языков. Для этого применили созданную ранее пантюркскую модель, которая учитывает морфологию, лексику и синтаксис сразу нескольких тюркских языков — азербайджанского, башкирского, татарского, казахского, киргизского, турецкого и узбекского. А чтобы нейросеть научилась составлять грамотные предложения на русском языке, был применен метод обратного перевода: огромный объем качественных русских текстов был переведен автоматически на чувашский и таким образом были созданы синтетические пары.

Чувашский язык сейчас доступен в веб-версии переводчика, а также на мобильных устройствах. Если в самом начале лабораторией Яндекса было предоставлено 250 тысяч пар предложений, то на сегодня сервис уже располагает 280 тысячами пар. То есть накопление объема продолжается. Конечно, автоматический переводчик пока еще не сравнится с профессионалом-лингвистом, но в компании «Яндекс» заверяют, что работа по совершенствованию технологий и улучшению качества перевода будет продолжена.

Газета "Советская Чувашия" от 18.02.2020 г. №18



18 февраля 2020
10:21
Поделиться