Archives des .NET Core - Valentin Lecerf's Blog

Reading Time: 4 minutes

Introduction

Dans le cadre d’un projet, j’ai Ã©tÃ© challengÃ© pour effectuer de la reconnaissance de main levÃ©e Ã partir d’un flux camÃ©ra streaming dans l’objectif que pendant une sÃ©ance de vote, nous puissions comptabilisÃ© les votes pour, contre et en dÃ©duire l’abstention.

Ce projet a utilisÃ© plusieurs technologies AWS et du .NET Core ainsi que du C.

Si vous souhaitez en savoir plus, je vous invite Ã consulter l’article medium ici: Valentin Lecerf â Medium

Les challenges Ã relever

Pour vous mettre un peu dans le contexte. Imaginez une salle de rÃ©union remplie, une application web blazor projetÃ©e sur un projecteur permettant de diffuser un support et permettant pendant des sessions de vote d’afficher les rÃ©sultats dans un temps trÃ¨s rÃ©duit.

Une camÃ©ra de rÃ©union USB qui filme l’ensemble de la scÃ¨ne. Voila alors un peu le contexte de la situation du challenge Ã relever. Nous avons dans le cadre de se projet surmonter beaucoup de challenge mais je vais me concentrer sur la partie qui fait l’objet de cet article: l’IA.

Nous avons donc un flux vidÃ©o Ã notre disposition d’un cÃ´tÃ© et le cloud de l’autre, comment donc s’en sortir et dÃ©tecter, comptabiliser des votes Ã main levÃ©es? AprÃ¨s Ã©normÃ©ment de recherche, personne ne c’Ã©tait jusqu’alors intÃ©ressÃ© Ã ce challenge.

Voici un peu donc les Ã©tapes de rÃ©flexion pour dÃ©patouiller le problÃ¨me:

Le traitement du flux vidÃ©o

Pour effectuer du traitement sur ma vidÃ©o et bÃ©nÃ©ficier de la puissance du cloud, dÃ©jÃ il faut que mon flux vidÃ©o se retrouve dans le cloud justement. AWS Propose un service Kinesis permettant le streaming video bonne nouvelle c’est ce que je recherche! Comment effectuer le stream maintenant? je n’ai qu’a ma disposition un SDK…

Bah on va faire du C++!

Et c’est partie dans la folle aventure d’un dÃ©veloppement de petit programme se basant sur le SDK AWS ainsi que gstreamer afin de balancer le flux vidÃ©o sur le kinesis. Premier challenger: Les rÃ©glages. Pour rappel ma camÃ©ra est en USB, la performance est dÃ©pendant de ma machine vu que c’est elle qui traite l’image, l’encode et la balance sur le service Kinesis. Il faut donc trouver le bon rÃ©glage entre QualitÃ© & Performance et cela Ã pris pas mal de temps!

D’une maniÃ¨re Ã©vidente, une camÃ©ra en RTSP aurait Ã©tÃ© plus performante dans notre cas mais on fait avec!

La reconnaissance de main levÃ©e

Une fois que j’ai mon flux vidÃ©o sur le service Kinesis je n’ai plus qu’a le traiter!

Dans la panoplie des services IA AWS je demande SageMaker 🙂 SageMaker est un service AWS permettant l’implÃ©mentation d’algorithme de machine learning, de faire de l’entrainement, etc… plus d’info ici: Amazon SageMaker – Machine Learning – Amazon Web Services

La premiÃ¨re idÃ©e qui m’est venu Ã l’esprit Ã©tait de construire un modÃ¨le, lâentraÃ®ner avec des images de main et faire de la reconnaissance sur des frame de la vidÃ©o. Alors ok Ã§a marchait par contre pas mal d’erreur et l’entrainement du modÃ¨le demande trop de temps. Afin qu’un modÃ¨le soit performant et efficace il faut une quantitÃ© de donnÃ©es importante et malgrÃ© un petit script pour rÃ©cupÃ©rer les images de main sur le web ce n’Ã©tait pas suffisant. Et puis un jour, pendant un Ã©change avec un mec de chez AWS (dÃ©dicace Ã Benjamin!), il me souffle une autre idÃ©e Ã l’oreille. Utiliser un modÃ¨le prÃ© entrainÃ©! Mais quel con, pourquoi j’y ai pas pensÃ© avant au lieu de faire mon galÃ©rien Ã entraÃ®ner mon propre modÃ¨le!

Et la nous sommes partis sur la mise en place dans sagemaker de notre python pour utiliser MXNet et ModelZoo, ce qui est fabuleux c’est que modelzoo propose un modÃ¨le prÃ©-entrainÃ© pour de la position humaine, ben enfin de compte nous on veut avoir la position des bras et main pour en dÃ©duire si la main est levÃ©e non? donc avec l’aide de Benjamin nous avons fait notre petit script pour utiliser les coordonnÃ©es des diffÃ©rents membres de chaque Ãªtre humain afin de les comparer par exemple aux Ã©paules ou Ã la tÃªte afin d’en dÃ©duire si oui ou non il a levÃ© la main droite ou gauche.

Et voila, Eureka!

LâhÃ©bergement des diffÃ©rentes ressources

Je ne me suis pas Ã©talÃ© la dessus dans cet article mais autour de cela nous avions pas mal de composant permettant de remplir le besoin initialement dÃ©finit dans notre scÃ©nario, comme je l’ai dis un site blazor en .net 3.1, une tripotÃ© de lambda, sagemaker, kinesis, dynamoDB, ECS, EKS, Polly,Alexa… bref pas mal de monde!

Principe de fonctionnement de la reconnaissance par vidÃ©o

Et sur Azure, on l’aurait fait comment ?

Mieux bien Ã©videmment 😉 Non je dÃ©conne ou pas 😀

Aujourd’hui les cloud providers proposent plus ou moins des services similaires, c’est juste un nom et un principe de fonctionnement qui change potentiellement.

Pour la partie hÃ©bergement du site web, je me serais tournÃ© vers un appservice tout simplement, des azure function, du cosmoDB Ã la place de la dynamoDB d’Amazon, de l’azure service bus et de l’event hub, du cognitive services et puis du media service avec du machine learning et Ã§a devrait faire l’affaire.

Bref, lâexpÃ©rience dans azure est bien Ã©videmment possible c’est l’intÃ©gration qui est juste diffÃ©rente! Mais Ã§a peut Ãªtre intÃ©ressant de reproduire ce scÃ©nario dans azure pour comparer les intÃ©grations, les possibilitÃ©s et les performances!

Conclusion

Rien n’est impossible, tout est faisable et encore plus simplement avec le cloud!

Bon l’inconvÃ©nient de la reconnaissance du vote Ã main levÃ© c’est que juridiquement en france…. bah c’est mort… mais bon peut Ãªtre un jour 🙂

Si vous voulez en savoir plus, je vous invite Ã consulter:

Article Original en Anglais: Valentin Lecerf â Medium

A bientÃ´t pour le prochain article!

valentin lecerf | août 6, 2021 | .NET Core, Cloud, DÃ©veloppement, Uncategorized| amazon, azure, blazor, IA, learning, machine, python | 0 Comments

.NET Core

La reconnaissance de main levÃ©e par IA