La IA 'Rosetta' de Facebook puede extraer texto de mil millones de imágenes diarias

Únase a nosotros en el boletín informativo Suscríbase a nuestro boletín para obtener un resumen diario de lo que sucede en la tecnología entregado directamente en su bandeja de entrada. Suscribir

Urupong vía Getty Images

Las personas en línea tienden a comunicarse no solo con palabras, sino también con imágenes. Para una plataforma como Facebook con más de 2 mil millones de usuarios activos mensuales, eso significa que se publica una gran cantidad de imágenes todos los días, incluidos los memes. Para incluir imágenes con texto en resultados de búsqueda de fotos relevantes, para darles a los lectores de pantalla una manera de leer lo que está escrito en ellos y asegurarse de que no contengan discursos de odio y otras palabras que violen la política de contenido del sitio web, Facebook ha creado y desplegó un sistema de aprendizaje de máquina a gran escala llamado "Rosetta".

Facebook necesitaba un sistema de reconocimiento óptico de caracteres que pudiera procesar grandes volúmenes de contenido de manera regular, por lo que tuvo que crear su propia tecnología. Según la red social, Rosetta extrae texto de más de mil millones de imágenes y marcos de video en una amplia variedad de idiomas todos los días en tiempo real.

En una nueva publicación de blog, la compañía explicó cómo funciona Rosetta: comienza por detectar regiones rectangulares en imágenes que potencialmente contienen texto. A continuación, utiliza una red neuronal convolucional para reconocer y transcribir lo que está escrito en esa región, incluso palabras no inglesas o alfabetos no latinos, como el árabe y el hindi. Para entrenar el sistema, Facebook usó una mezcla de imágenes públicas anotadas por humanos y máquinas.

Varios equipos dentro de Facebook e Instagram ya están usando Rosetta para mostrar más contenido y vigilar sus plataformas. La compañía planea seguir aumentando la cantidad de idiomas que puede entender y mejorar la extracción de texto de los marcos de video.

Hablando de idiomas, Facebook también ha agregado 24 nuevos idiomas a sus servicios de traducción automática, incluidos serbio, bielorruso, marathi, cingalés, telugu, nepalí, kannada, urdu, punjabi, camboyano, pashto, mongol, zulú, xhosa y somalí. Facebook admite que las traducciones para esos idiomas se encuentran en una etapa temprana, por lo que aún tendrán muchos errores. Sin embargo, planea seguir mejorando e introducir más idiomas en el futuro.

Comments are closed.