Meta создала цифрового полиглота
Meta создала цифрового полиглота
Фантастика становится реальностью на наших глазах. Вспомните вавилонскую рыбку из романа Дугласа Адамса. Крошечное существо, мгновенно переводившее любой язык во вселенной. Теперь нечто подобное появилось в реальности. Meta создала цифрового полиглота, способного переводить речь без каких-либо промежуточных шагов.
Читайте также: Экзамен по истории для ИИ: какие результаты?
Назвали это чудо техники SEAMLESSM4T. И оно действительно творит чудеса. До сих пор все переводчики работали по принципу эстафеты. Сначала один модуль преобразовывал речь в текст, второй переводил текст на другой язык, а третий озвучивал результат.
Новый подход позволил обойтись без этих промежуточных шагов. ИИ-полиглот понимает речь на 101 языке и может говорить на 36 языках. При переводе в текст список доступных языков расширяется до 96. Это значительно превосходит возможности существующих переводчиков.
За этим достижением стоят месяцы кропотливой работы. Цифровой мозг впитал 4,5 миллиона часов звучащей речи из интернета. Сначала он учился на специально отобранных примерах — 330 тысяч часов записей. А потом, как прилежный ученик, продолжил самообучение.
Meta создала настоящего цифрового полиглота с открытым кодом
В сравнительных испытаниях система показала себя блестяще. Она обходит конкурентов на 8 % при переводе речи в текст. При прямом речевом переводе разрыв достигает 23 %. Но главный триумф — это работа в шумной обстановке. Там, где другие спотыкаются, SEAMLESSM4T-V2 уверенно распознает речь.
Наушники со встроенным переводчиком. Пока фантастика. Фото: Анастасия Милош
Создатели решили поделиться своим изобретением с миром. Исходный код системы открыт для всех. Любой разработчик может взять его за основу и создать что-то новое. Особенно ценным это может стать для незрячих людей.
Конечно, система не идеальна. Диалекты и невнятная речь пока ставят ее в тупик. Иногда она, как и все системы искусственного интеллекта, может выдавать фантазии вместо реального перевода. Создатели видят в своем детище не замену человеку-переводчику.
Скорее это умный помощник для изучения языков и повседневного общения. Своеобразный мостик между разными языковыми мирами. Возможно, скоро мы увидим наушники с встроенным переводчиком. Или очки, показывающие субтитры к живой речи. Технология уже здесь, осталось только грамотно ее применить.
Читайте также:
- В Ахене запустили квантовый узел для передачи данных
- Искусственный интеллект научился клонировать себя
- Ученые создали кольчугу из молекул