FlyPose: Verso una robusta stima della posa umana da viste aeree

FlyPose: Stima della posa umana da viste aeree

I Veicoli Aerei senza Equipaggio (UAV) sono sempre più utilizzati in prossimità degli umani per applicazioni come la consegna di pacchi, il monitoraggio del traffico, la risposta ai disastri e le ispezioni delle infrastrutture. Garantire un funzionamento sicuro e affidabile in questi ambienti popolati da umani richiede una precisa percezione delle pose e delle azioni umane da una prospettiva aerea. Questa prospettiva sfida i metodi esistenti con bassa risoluzione, angoli di visualizzazione accentuati e (auto-)occlusione, soprattutto se l’applicazione richiede modelli realizzabili in tempo reale.

In questo contesto, è stato sviluppato FlyPose, una pipeline leggera di stima della posa umana dall’alto per immagini aeree. Attraverso l’addestramento multi-dataset, FlyPose raggiunge un miglioramento medio di 6.8 mAP nel rilevamento delle persone attraverso i set di test di Manipal-UAV, VisDrone, HIT-UAV e il nostro dataset personalizzato. Per la stima della posa umana 2D, si registra un miglioramento di 16.3 mAP sul difficile dataset UAV-Human. FlyPose funziona con una latenza di inferenza di ~20 millisecondi, inclusa la pre-elaborazione su un Jetson Orin AGX Developer Kit ed è implementato a bordo di un UAV quadrotor durante esperimenti di volo. È stato anche pubblicato FlyPose-104, un dataset di stima della posa umana aerea, piccolo ma impegnativo, che include annotazioni manuali da prospettive aeree difficili.

Il codice e i dati sono disponibili su: https://github.com/farooqhassaan/FlyPose.


Paper: ArXiv.org