L’ingegnere di Kawasaki Robotics Kippei Matsuda ha compiuto un’impresa straordinaria vincendo il concorso “NFL Health & Safety – Helmet Assignment” nel 2022, un evento altamente competitivo ospitato dalla National Football League (NFL) e da Amazon.com, Inc. su Kaggle, una piattaforma globale di analisi dei dati AI. Abbiamo parlato con Matsuda di come ha vinto la competizione contro ambiziosi sviluppatori di AI a livello globale e di come Kawasaki Robotics stia attualmente sviluppando la tecnologia per varie soluzioni.

Descrivete la sfida dell’NFL, la soluzione e cosa l’ha resa entusiasmante?
Il concorso mirava a identificare le collisioni tra giocatori, con più di 1.000 scienziati dei dati in tutto il mondo in competizione per costruire una soluzione accurata utilizzando i filmati delle partite della NFL e le informazioni dei sensori. Il football americano è noto per essere uno degli sport più duri e fisicamente impegnativi al mondo, con contatti ad alto impatto e, sebbene i giocatori indossino protezioni, gli infortuni sono frequenti. Le collisioni con la testa, in particolare, spesso causano lesioni gravi o disabilità, ed è stato difficile trovare modi per ridurre l’impatto delle collisioni e un trattamento efficace dopo un infortunio.
Se potessimo identificare con precisione quali giocatori hanno subito un impatto alla testa durante una partita, potremmo somministrare efficacemente il trattamento e far progredire la ricerca sugli effetti dei caschi e su come mitigare l’impatto. Svolgere questo tipo di ricerca manualmente sarebbe estremamente dispendioso in termini di tempo, quindi la NFL ha indetto questo concorso per utilizzare la tecnologia AI per risolvere questo problema.
La chiave per vincere questa competizione è stata la riuscita integrazione di due tipi di dati distinti, le informazioni video e quelle dei sensori. Abbiamo utilizzato le immagini video per identificare le collisioni dei giocatori e abbiamo stimato le posizioni dei giocatori utilizzando i sensori ad essi collegati. Lo sviluppo di un sistema di intelligenza artificiale che analizzava e prevedeva meticolosamente anche i più piccoli cambiamenti di posizione e postura dei giocatori, come accovacciarsi o cadere, ci ha contraddistinto. Questa innovazione ha migliorato notevolmente la nostra precisione rispetto agli altri partecipanti. Di conseguenza, la nostra velocità di elaborazione è stata 83 volte superiore a quella delle operazioni manuali e i compiti che richiedevano 3-4 giorni potevano ora essere completati in sole 2 ore, il che è stato molto apprezzato.
Kippei Matsuda
In generale, l’analisi delle immagini dell’intelligenza artificiale comporta il rilevamento di oggetti nelle immagini, ma in questa competizione abbiamo dovuto considerare le posizioni tridimensionali (3D) dei giocatori in campo sullo schermo, una sfida entusiasmante che non avevamo mai affrontato prima. È difficile analizzare i dati perché bisogna guardarli più volte, ma il video della NFL era così potente che mi sono divertito a guardarlo più volte. Grazie a questo, alla fine della competizione, ero in grado di immaginare i movimenti dei giocatori solo guardando i titoli dei video.

Cosa l’ha spinta a partecipare alla sfida NFL e quali sono stati i risultati?
Tutto è iniziato pensando che potesse far parte dei miei studi. Gli aspetti teorici possono essere appresi da libri e altre fonti, ma sapere come utilizzare i dati reali ed eseguire una simulazione è difficile. Come sviluppatore, toccare e analizzare i dati e ripetere prove ed errori è essenziale. Sono stato attratto dal concorso perché forniva materiali che portavano all’apprendimento pratico”.
“Partecipare al concorso mi ha permesso di mettere in pratica lo sviluppo dell’intelligenza artificiale”.
Kippei Matsuda
Onestamente, non ho mai pensato che il concorso in sé fosse difficile; ciò che è stato difficile è stato trovare il tempo per i miei studi e la mia famiglia, dato che ho lavorato a questo progetto durante il mio tempo libero. Quando giocavo con i miei figli al parco, all’improvviso pensavo: “Forse potrei fare quella parte in questo modo”, e mi preoccupavo. Era difficile rilassarsi.
Ero in treno e tremavo. Fin dall’inizio di questo progetto, non pensavo di poter vincere, ma quando l’ho fatto ero entusiasta. Non mi sono lamentata della vittoria e sono stata felice di condividere la notizia con tutti quelli che mi circondavano. Quel giorno non sono riuscito a lavorare!
Come lavora oggi alla Kawasaki Robotics con la visione AI?
Attualmente mi occupo dello sviluppo di prodotti che utilizzano la visione AI specificamente per la robotica. L’intelligenza artificiale analizza le immagini catturate dalle telecamere e le elabora in vari modi; ad esempio, nella nostra soluzione di depalettizzazione, elabora le immagini dei prodotti che devono essere scaricati. Le soluzioni di depalettizzazione sono utilizzate per migliorare l’efficienza di scarico nei centri di distribuzione e nelle fabbriche. La soluzione di depalettizzazione è dotata di visione AI 3D ed è in grado di effettuare analisi altamente sofisticate del carico che gestisce.
La soluzione di depallettizzazione di Kawasaki Robotics è dotata di visione AI 3D ed è in grado di effettuare analisi altamente sofisticate del carico che gestisce. Specializzandoci nello scarico, abbiamo ottenuto prestazioni elevate a costi contenuti.
Kippei Matsuda
Lo scarico manuale è molto costoso e richiede molto tempo, e le soluzioni robotiche convenzionali non sono abbastanza flessibili per gestire il lavoro. A questo proposito, la nostra soluzione di depalettizzazione è riuscita ad aumentare la precisione e la velocità delle operazioni di scarico automatizzate rispetto alle soluzioni convenzionali.

Ad esempio, con le soluzioni robotiche tradizionali, tutte le dimensioni e le forme delle confezioni devono essere registrate prima di essere prelevate. Se i colli di forma non registrata entrano nel flusso di lavoro, non possono essere lavorati. La nostra soluzione di depallettizzazione, invece, richiede la registrazione solo delle dimensioni più piccole e più grandi e tutti i colli possono essere lavorati.
Nei sistemi robotizzati tradizionali, il robot deve conoscere le dimensioni e la forma corretta del prodotto da trattare. Per riconoscere e confermare le dimensioni e la forma del prodotto è necessaria una telecamera. Se viene confermata la correttezza, il braccio robotico preleva il prodotto, ma l’apprendimento del sistema richiede molto tempo.
La nostra soluzione di depalettizzazione non richiede alcuna registrazione preliminare del prodotto, a parte le dimensioni minime e massime, riducendo in modo significativo i tempi di apprendimento.
Kippei Matsuda
Il motivo principale per cui la soluzione di depallettizzazione di Kawasaki Robotics ha avuto successo è che abbiniamo un hardware di telecamere a basso costo con il nostro robusto software di intelligenza artificiale per elaborare immagini complesse di prodotti senza un mucchio di componenti aggiuntivi. Abbiamo ottenuto una soluzione ad alte prestazioni e facile da usare concentrandoci sullo sviluppo di un sistema di depalettizzazione e, restringendo le funzioni, abbiamo ottenuto prestazioni migliori in termini di costi rispetto ai prodotti di altre aziende, rendendo più facile per le aziende introdurre il prodotto.

Come continueranno a svilupparsi le soluzioni di depalettizzazione e AI?
Credo che l’efficienza delle soluzioni di depallettizzazione aumenterà con la raccolta di un numero sempre maggiore di dati e con i progressi dell’apprendimento dell’intelligenza artificiale. Ad esempio, una delle difficoltà nello sviluppo di una soluzione di depallettizzazione era rappresentata dalle stringhe e dai nastri sulla superficie delle confezioni. Quando l’intelligenza artificiale li vede, può confondere le stringhe con i confini del cartone. Potrebbe quindi decidere che la scatola è più piccola di quanto sia in realtà e prenderla per errore. Tuttavia, se in futuro il sistema verrà utilizzato in diversi siti e verranno raccolti dati, sarà in grado di apprendere più varianti di confezioni. In questo modo, anche se una scatola presenta lacci, nastro adesivo o adesivi, il robot potrà scaricarla in modo appropriato in base alla sua esperienza passata, senza essere tratto in inganno. Sarà necessario raccogliere molti dati di buona qualità per il robot.
Penso anche che l’intelligenza artificiale, chiamata modello di infrastruttura, sarà fondamentale. Un esempio è ChatGPT, che ha attirato molta attenzione negli ultimi anni. Poiché il modello sottostante è stato addestrato sulla base di una grande quantità di dati, ha una capacità di riconoscimento molto elevata, una sorta di buon senso. I modelli fondamentali sono in grado di gestire una varietà di informazioni, tra cui testo, immagini e suoni, e hanno il potenziale per espandere drasticamente l’uso dei robot, non solo nella logistica. In futuro, vorrei espandere l’uso dell’IA facendo buon uso dei dati e del modello di base.
Fare clic qui per la pagina del prodotto Depalletizing Solution (giapponese)