Meta apuesta por la IA para crear el mejor traductor universal del mundo
Bautizada de forma oficial como SeamlessM4T, se trata del más reciente esfuerzo de Meta por crear una tecnología basada en la inteligencia artificial.
El dueño de Meta, Mark Zuckerberg, no vacila cuando se trata de Inteligencia artificial. Su último gran movimiento tiene que ver con el desarrollo de un modelo multimodal y multilingüe capaz de traducir y transcribir cerca de 100 idiomas en texto y voz.
Bautizada de forma oficial como SeamlessM4T, se trata del más reciente esfuerzo de Meta por crear una tecnología basada en la inteligencia artificial que ayude a conectar a las personas entre distintos idiomas. La misma sería capaz de lo siguiente:
- Reconocimiento de voz en casi 100 idiomas
- Traducción de voz a texto para casi 100 idiomas de entrada y salida
- Traducción de voz a voz, compatible con casi 100 idiomas de entrada y 36 (incluido el inglés) de salida.
- Traducción de texto a texto en casi 100 idiomas
- Traducción de texto a voz, compatible con casi 100 idiomas de entrada y 35 (incluido el inglés) de salida.
Se integrará con las redes sociales de Meta
De acuerdo a El País, la intención de la compañía sería integrar estas capacidades en sus plataformas principales, como Facebook, Instagram, WhatsApp, Messenger y la nueva Threads.
Y por supuesto, el objetivo de esta plataforma sería facilitar la comunicación entre todas las personas del mundo, para que no haya ningún tipo de barrera.
Para desarrollar esta tecnología, Meta se valió de los metadatos de “SeamlessAlign” el mayor conjunto de datos abiertos de traducción multimodal hasta la fecha, con un total de 270.000 horas de alineaciones de voz y texto.
Noticia destacada: 33 empresas tienen intención de realizar negocios con Bariven, según Fedeindustria
No es la primera incursión de Meta en la IA multilingüe. Según el blog oficial de Meta, el desarrollo de SeamlessM4T también se basa en los avances realizados a lo largo de los años para crear un traductor universal.
Por ejemplo, hace un año Meta presentó No Language Left Behind (NLLB), un modelo de traducción automática de texto a texto compatible con 200 idiomas e integrado en Wikipedia como uno de los principales proveedores de traducción.
También se anunció una demostración del Universal Speech Translator, el primer sistema de traducción directa de voz a voz para el hokkien, una lengua sin un sistema de escritura muy extendido.
Y a principios de este año se presentó Massively Multilingual Speech, que ofrece reconocimiento de voz, identificación de idiomas y tecnología de síntesis de voz en más de 1.100 idiomas.
No es la única en invertir en este tipo de tecnologías
Desde luego, el gigante Meta no es para nada el único que invierte recursos para desarrollar sofisticadas herramientas de traducción y transcripción con inteligencia artificial.
Google está creando lo que denomina Universal Speech Model, que forma parte de un esfuerzo más amplio del gigante tecnológico por construir un modelo capaz de entender los 1.000 idiomas más hablados del mundo.
Por su parte, Mozilla ha creado Common Voice, una de las mayores colecciones multilingües de voces para entrenar algoritmos de reconocimiento automático del habla.
Lea más contenido interesante y actual:
Farmatodo realiza plan de expansión y ya cuenta con 182 farmacias a escala nacional
Profranquicias: «No existe ninguna declaración oficial» hasta el momento sobre el regreso de algunas marcas al país
Somos uno de los principales portales de noticias en Venezuela para temas bancarios, económicos, financieros y de negocios, con más de 20 años en el mercado. Hemos sido y seguiremos siendo pioneros en la creación de contenidos, análisis inéditos e informes especiales. Nos hemos convertido en una fuente de referencia en el país y avanzamos paso a paso en América Latina.