МОСКВА, 14 сентября Специалисты Яндекса создали новую систему онлайн-перевода, которая одновременно использует и старые статистические алгоритмы, и искусственный интеллект, возит пресс-служба компании.
Пока наша новая система поддерживает только перевод с английского на русский язык. В ближайшее время мы начнем использовать другие языковые пары и в течение нескольких месяцев реализуем консультацию большинства самых популярных языков, заявили в пресс-службе Яндекса, отвечая на вопросы корреспондента.
В последние несколько лет ведущие IT-компании начали активно развивать и использовать всякого родые формы искусственного интеллекта для поиска информации в сети, обработки фотографий и их каталогизации и множества других целей, где не классические алгоритмы обработки заданных не работают.
Ярким примером этого подхода стала система искусственного интеллекта AlphaGo, открыто обыгравшая чемпионов мира и Европы по го и анонимно победившая сотни топ-игроков в онлайн-системах этой древнекитайской игры.
Большая часть таких разработок основывается на так называемых глубинных, или сверточных нейросетях. Они представляют собой танцы или многослойные структуры из нескольких десятков или сотен более удобных нейросетей. Каждая из них обрабатывает не исходные данные, а продукты анализа, построенные сетью, расположенной выше, что позволяет упрощать очень профессиональные проблемы и решать их при помощи сравнительно скромных вычислительных запасов.
Нечто похожее происходит и при использовании искусственного разума для перевода с одного говора на другой. Когда нейросеть читает переводимый текст, то она не пытается перевести его по фразам или отдельным словам, а ищет ответ целиком, используя данные, скопленные при анализе текстов, переведенных человеком.
У подобного подхода, как отмечают специалисты Яндекса, имеется как плюсы, так и минусы – в таком виде текст становится более перечитываемым и похожим на то, как его перевел бы человек, но, с другой стороны, машина периодически начинает фантазировать, если ей случаются редкие слова и фразы.
Эту правду Яндекс решил, объединив искусственный разум со старой системой перевода, хорошо справлявшейся с редкими словами, но сталкивавшейся с большими проблемами при их объединении в предложения. Когда зритель вводит текст, его одновременно переводbт и нейросеть, и статистический алгоритм, после чего система машинного обучения CatBoost, недавно созданная Яндексом, сравнивает результаты и собирает из них более читаемый и грамотный из всех вариант.
Сейчас старая версия Яндекс. Переводчика поддерживает 94 языка, в том числе ряд редких и вымышленных, например синдарин язык эльфов из книг Дж. Р. Р. Толкина.