Ingenio humano: Kippei Matsuda’s journey from NFL AI competition winner to AI solution developer at Kawasaki Robotics.

Blog

El ingeniero de Kawasaki Robotics Kippei Matsuda logró una hazaña notable al ganar la competición «NFL Health & Safety – Helmet Assignment» en 2022, un evento ferozmente competitivo organizado por la National Football League (NFL) y Amazon.com, Inc. en Kaggle, una plataforma global de competición de análisis de datos de IA. Hablamos con Matsuda sobre cómo ganó la competición frente a ambiciosos desarrolladores de IA a nivel mundial y cómo Kawasaki Robotics está desarrollando actualmente la tecnología para diversas soluciones.

Kippei Matsuda: Departamento de Desarrollo de Tecnología Robótica, Centro de Desarrollo de Tecnología de Sistemas, División de Desarrollo Tecnológico. Dr. (Ingeniería)

Describa el reto de la NFL, la solución y qué lo hizo apasionante.

El objetivo de la competición era identificar las colisiones de los jugadores. Más de 1.000 científicos de datos de todo el mundo compitieron para crear una solución precisa utilizando imágenes de partidos de la NFL e información de sensores. El fútbol americano es conocido por ser uno de los deportes más duros y exigentes físicamente del mundo, con contactos de alto impacto, y aunque los jugadores llevan equipos de protección, las lesiones son frecuentes. Las colisiones en la cabeza, en particular, a menudo provocan lesiones graves o discapacidades, y ha sido un reto encontrar formas de reducir el impacto de las colisiones junto con un tratamiento eficaz después de que se produzca una lesión.

Si pudiéramos identificar con precisión qué jugadores sufrieron impactos en la cabeza durante un partido, podríamos administrar un tratamiento eficaz y avanzar en la investigación sobre los efectos de los cascos y cómo mitigar el impacto. Hacer este tipo de investigación manualmente llevaría muchísimo tiempo, así que la NFL convocó este concurso para utilizar la tecnología de IA para resolver este problema.

La clave para ganar este concurso fue integrar con éxito dos tipos de datos distintos, el vídeo y la información de los sensores. Utilizamos imágenes de vídeo para identificar las colisiones de los jugadores y estimamos sus posiciones mediante sensores colocados en los jugadores. El desarrollo de un sistema de inteligencia artificial que analizaba y predecía meticulosamente incluso los cambios más pequeños en la posición y postura de los jugadores, como agacharse o caerse, nos diferenció de los demás. Esta innovación mejoró significativamente nuestra precisión en comparación con otros participantes. Como resultado, nuestra velocidad de procesamiento fue 83 veces más rápida que la operación manual, y tareas que llevaban 3-4 días ahora podían completarse en sólo 2 horas, lo que fue muy apreciado.

Kippei Matsuda

En general, el análisis de imágenes con IA consiste en detectar objetos en las imágenes, pero en esta competición tuvimos que considerar en la pantalla las posiciones tridimensionales (3D) de los jugadores en el campo, lo que supuso un reto apasionante que nunca antes habíamos hecho. Es difícil analizar datos porque tienes que mirarlos una y otra vez, pero el vídeo de la NFL era tan impactante que disfruté viéndolo una y otra vez. Gracias a ello, al final de la competición era capaz de imaginarme los movimientos de los jugadores con sólo mirar los títulos de los vídeos.

¿Qué le llevó a participar en el desafío de la NFL y cuáles fueron los resultados?

Todo empezó cuando pensé que podía formar parte de mis estudios. Los aspectos teóricos se pueden aprender en libros y otras fuentes, pero saber utilizar datos reales y ejecutar una simulación es difícil. Como desarrollador, tocar y analizar datos y repetir el método de ensayo y error es esencial. El concurso me atrajo porque proporcionaba materiales que conducían al aprendizaje práctico.

«Participar en el concurso me permitió poner en práctica el desarrollo de IA»

Kippei Matsuda

Sinceramente, nunca sentí que el concurso en sí fuera duro; lo difícil fue encontrar tiempo para mis estudios y mi familia, ya que trabajaba en ello durante mi tiempo personal. Cuando estaba jugando con mis hijos en el parque, de repente pensaba: «Quizá podría hacer esa parte de esta manera», y me molestaba. Me costaba relajarme.

Estaba en el tren y temblaba. Desde el principio de este proyecto, no pensé que pudiera ganar, pero cuando lo hice, me emocioné. No me quejo de haber ganado y estaba feliz de compartir la noticia con todos los que me rodeaban. Aquel día apenas pude trabajar.

¿Cómo trabaja hoy con la visión de IA en Kawasaki Robotics?

Actualmente participo en el desarrollo de productos que utilizan la visión por IA específicamente para la robótica. La IA analiza las imágenes captadas por las cámaras y las procesa de varias formas; por ejemplo, en nuestra solución de despaletización, procesa imágenes del producto que hay que descargar. Las soluciones de despaletización se utilizan para mejorar la eficacia de la descarga en centros de distribución y fábricas. La solución de despaletización está equipada con visión 3D AI y es capaz de realizar análisis muy sofisticados de la carga que manipula.

La solución de despaletizado de Kawasaki Robotics está equipada con visión 3D AI y es capaz de realizar análisis altamente sofisticados de la carga que manipula. Al especializarnos en la descarga, hemos conseguido un alto rendimiento a un bajo coste.

Kippei Matsuda

La descarga manual es muy costosa y requiere mucho tiempo, y las soluciones robóticas convencionales no son lo bastante flexibles para realizar este trabajo. En este sentido, nuestra solución de despaletización ha conseguido aumentar la precisión y la velocidad de las operaciones de descarga automatizada en comparación con las soluciones convencionales.

Por ejemplo, con las soluciones de sistemas robóticos convencionales, todos los tamaños y formas de los paquetes deben registrarse antes de ser recogidos. Si los paquetes con formas no registradas entran en el flujo de trabajo, no pueden procesarse. Sin embargo, nuestra solución de despaletización sólo requiere que se registren los tamaños más pequeño y más grande, y todos los paquetes pueden procesarse.

En los sistemas robóticos convencionales, el robot debe conocer el tamaño y la forma correctos del producto que manipula. Se necesita una cámara para reconocer y confirmar el tamaño y la forma del producto. Si se confirma que es correcto, el brazo del robot recogerá el producto; enseñar al sistema es un proceso que lleva mucho tiempo.

Nuestra solución de despaletizado no requiere ningún registro previo del producto, salvo las dimensiones mínimas y máximas, lo que reduce considerablemente el tiempo de aprendizaje.

KippeiMatsuda

La principal razón del éxito de la solución de despaletización de Kawasaki Robotics es que combinamos un hardware de cámara de bajo coste con nuestro sólido software de IA para procesar imágenes de productos complejos sin un montón de complementos. Conseguimos una solución de alto rendimiento y fácil de usar centrándonos en el desarrollo de un sistema de despaletización y, al reducir las funciones, logramos un mejor rendimiento de costes que los productos de otras empresas, lo que facilita a las empresas la introducción del producto».

Sr. Himekawa, responsable del desarrollo del producto (pertenece a la Sección 2 de Sistemas de Uso General, Departamento de Sistemas de Uso General, División de Robots)

¿Cómo seguirán desarrollándose la despaletización y las soluciones de IA?

Creo que la eficacia de las soluciones de despaletización aumentará a medida que se recopilen más y más datos y progrese el aprendizaje de la IA. Por ejemplo, una de las dificultades a la hora de desarrollar una solución de despaletizado eran los hilos y las cintas en la superficie de los paquetes. Cuando la IA los ve, puede confundir las cuerdas con los límites del cartón. Entonces puede decidir que la caja es más pequeña de lo que es en realidad y cogerla por error. Sin embargo, si el sistema se utiliza en varios sitios en el futuro y se recogen datos, podrá aprender múltiples variaciones de paquetes. Entonces, aunque una caja tenga cuerdas, cinta adhesiva o pegatinas, el robot podrá descargarla adecuadamente basándose en su experiencia pasada sin dejarse engañar. Será necesario recopilar muchos datos de buena calidad para el robot.

También creo que la IA, llamada modelo de infraestructura, será clave. Un ejemplo es ChatGPT, que ha atraído mucha atención en los últimos años. Como el modelo subyacente se entrena a partir de una gran cantidad de datos, tiene una capacidad de reconocimiento muy alta, una especie de sentido común. Los modelos fundamentales pueden manejar una gran variedad de información, como texto, imágenes y sonido, y tienen potencial para ampliar drásticamente el uso de robots, no sólo en logística. En el futuro, me gustaría ampliar el uso de la IA haciendo un buen uso de los datos y el modelo básico.

Haga clic aquí para acceder a la página del producto Depalletizing Solution (japonés)