[Stage M2] Apprentissage automatique pour l’analyse de simulations de rupture de gouttes

When:
30/06/2021 – 01/07/2021 all-day
2021-06-30T02:00:00+02:00
2021-07-01T02:00:00+02:00

Offre en lien avec l’Action/le Réseau : – — –/– — –

Laboratoire/Entreprise : CORIA / LITIS
Durée : 6 mois
Contact : simon.bernard@univ-rouen.fr
Date limite de publication : 2021-06-30

Contexte :
L’atomisation est présente dans de nombreuses applications telles que l’injection de carburant, l’irrigation par aspersion, le séchage par pulvérisation ou l’extinction des incendies. Ce processus est généralement divisé en deux régimes : le régime d’atomisation primaire, où le jet se déstabilise en créant de grandes structures liquides et le régime d’atomisation secondaire, où ces grandes structures se divisent en petites gouttes sphériques. Ces gouttelettes finales restent sphériques à cause de l’effet dominant de la tension de surface. La prédiction précise de la distribution finale de la taille des gouttes est nécessaire pour améliorer les applications concernées par l’atomisation. En particulier, la taille des gouttes est l’un des principaux facteurs des émissions finales des moteurs automobiles.
Afin de réaliser cette prédiction il faut établir des modèles de rupture secondaire qui permettent de savoir, à partir de l’état d’une goutte, la probabilité de rupture. De nombreux modèles ont été proposés dans la littérature. Les modèles actuels sont basés sur des corrélations empiriques prenant en compte des paramètres comme la turbulence environnante ou la vitesse de glissement. La diversité des effets provocant la rupture fait qu’à ce jour aucun modèle n’a permis une prédiction fiable sur l’ensemble de régimes utilisés dans l’industrie.
Le but de ce stage est d’utiliser les algorithmes d’apprentissage machine (Machine Learning) pour produire de meilleures prédictions de l’atomisation secondaire.

Sujet :
Le contexte applicatif posent plusieurs défis à l’apprentissage automatique. Tout d’abord, le nombre de gouttes étudiées est limité par le coût de génération qui reste non négligeable. On envisage la génération de quelques milliers de gouttes pour réaliser notre étude, ce qui, au regard de la tâche d’apprentissage est relativement faible. En particulier, ce volume de donnée est bien en deçà des volumes généralement nécessaires à l’apprentissage profond (Deep Learning). Bien que ce soit difficile à estimer de façon précise, car dépendant à la fois du problème et de la méthode utilisée, nous savons que la quantité de données nécessaire à l’apprentissage profond est plutôt de l’ordre de plusieurs millions de données. Ensuite, chaque donnée (goutte) de la base d’apprentissage est décrite par un volumede 64x64x64 voxels, eux-même décrits par 6 descripteurs numériques. Cela implique que la dimension du problème d’apprentissage est de l’ordre du million, ce qui est bien supérieur aux nombre de données disponibles. Ces situations sont connues pour être particulièrement difficiles à traiter en apprentissage machine et nécessite des méthodes dédiées. Finalement, la base d’apprentissage sera constituée d’un nombre très inégal de gouttes qui subissent une rupture au cours du temps et de gouttes stables. Ce déséquilibre est une difficulté supplémentaire, qui nécessite également des méthodes d’apprentissage spécifiques.
Ces trois problématiques d’apprentissage, i.e. l’apprentissage en grande dimension, avec de petits échantillons et en présence de données débalancées ont déjà été étudiés par le passé au Laboratoire LITIS, et solutionnées notamment avec des méthodes de forêts aléatoires et d’ensembles de classifieurs. Ces travaux ont démontré l’efficacité de ces approches pour ces types de problèmes, c’est pourquoi nous les envisageons pour ce projet, sans pour autant s’y restreindre.
Ce stage sera financé par l’ANR DropBreak et peut déboucher sur un contrat d’ingénieur d’études de 6 mois financées dans le cadre d’un projet RIN (Région Normandie – Union Européenne). Le contenu de ce contrat de 6 mois est dans la continuité des tâches proposées dans le stage.
Résultats attendus pour la rédaction du rapport de stage :
• Étude bibliographique des outils d’apprentissage machine adaptées,
• Préconisation d’une procédure d’apprentissage adaptée pour la problématique physique posée.

Profil du candidat :
Étudiant en Master 2 ou dernière année d’école d’ingénieurs, d’un cursus mathématique/informatique, idéalement avec une spécialisation en science des données.

Formation et compétences requises :
Compétences attendues:
• Bonnes connaissances des méthodes d’apprentissage machine.
• Programmation Python
• Goût pour la physique.

Adresse d’emploi :
Ce stage a lieu au laboratoire de physique CORIA et/ou au laboratoire d’informatique LITIS (selon autorisations d’accès), tous deux à l’Université de Rouen Normandie, campus du Madrillet.
En fonction de l’évolution de la situation sanitaire, il pourrait avoir lieu entièrement ou en partie en télétravail mais le candidat devra avoir la possibilité de se rendre sur place si besoin.

Document attaché : 202012160835_StageM2-2021-CORIA-LITIS.pdf