Innovación

Microsoft crea una IA que describe imágenes mejor que los humanos

Microsoft crea una IA que describe imágenes mejor que los humanosMicrosoft crea una IA que describe imágenes mejor que los humanos

¿En cuántas cosas superan ya las máquinas al ser humano? Por lo pronto, en la descripción de imágenes, ya que el sistema de IA diseñado por Microsoft confirma hacerlo mejor que las personas de carne y hueso.

El gigante tecnológico de Bill Gates puede presumir de haber desarrollado un sistema de Inteligencia Artificial tan bueno para describir imágenes que puede hacerlo incluso mejor que los humanos. Además, multiplica por dos el funcionamiento del anterior modelo de subtítulos de imágenes de la compañía, en funcionamiento durante el último lustro.

Una de las buenas noticias para los desarrolladores es que Microsoft no solo usará este sistema de IA a partir de ahora, sino que también lo compartirá públicamente como parte de los servicios cognitivos de Azure. 

La aplicación de Microsoft para personas ciegas y con discapacidad visual, Seeing AI, ya lanzó el nuevo sistema de inteligencia artificial, contribuyendo a narrar el entorno. El sistema inteligente también estará disponible en PowerPoint para la web, Windows y Mac, convirtiendo las presentaciones en experiencias increíbles y más potentes.

Microsoft recomienda estudiar Inteligencia Artificial para reciclarte tras la COVID-19

“Los subtítulos de las imágenes constituyen uno de los problemas más difíciles de la IA. Representa no sólo la comprensión de los objetos en una escena, sino cómo interactúan y cómo describirlos”, dijo Eric Boyd, CVP de Azure AI, en una entrevista con Engadget. Gracias a este increíble avance, las personas ciegas y con discapacidad visual podrán mejorar su experiencia de navegación por Internet y el mundo que les rodea con mayor comodidad y facilidad. 

Lo que realmente se destaca del trabajo de Microsoft es la rapidez con la que se ha puesto a disposición del mundo exterior. Xuedong Huang, director de tecnología de los servicios cognitivos de Azure AI y su equipo entrenaron el modelo con imágenes que tenían etiquetas de palabras específicas, lo que proporcionaba un lenguaje visual al sistema, algo difícil de conseguir.

“Este entrenamiento previo de vocabulario visual es esencialmente la educación necesaria para entrenar el sistema; estamos tratando de educar esta memoria motora”, revela el experto en el blog de la compañía.

Imagen | Coolcaesar/Wikipedia

Fuente | Interesting Engineering

Te recomendamos

Sobre el autor

Andrea Núñez-Torrón Stock

Licenciada en Periodismo y creadora de la revista Literaturbia. Entusiasta del cine, la tecnología, el arte y la literatura.