Description
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité...), les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.
Au sein d'Orange Innovation, vous serez intégré(e) dans une équipe de recherche composée d'une dizaine de chercheurs et doctorants spécialistes du traitement d'antenne et du Deep Learning. Notamment, vous serez entouré.e par des spécialistes du format Ambisonique et de traitement d'antenne neuronal et travaillerez étroitement avec une doctorante impliquée sur le codage spatial neuronal.
Votre rôle est d'effectuer un travail de Post doc sur : " Séparation de sources par IA générative appliquée à des contenus ambisoniques". Ces travaux seront menés dans le cadre du projet ANR DEESSE "Deep Generative Spatial Source Separation", lancé début 2025.
Contexte global et problématique du sujet
La prise de son mains-libres utilisée par certains services de communication vocale offre l'avantage de l'ergonomie en libérant les mains de l'utilisateur. En contrepartie, ce type de prise de son souffre d'arfacts liés à l'éloignement du locuteur : bruit ambiant, écho, interférences... Afin de rendre à la voix son intelligibilité, des techniques de rehaussement sont appliquées.
Dernièrement, les technologies de séparation ont bénéficié de la démocratisation des antennes de microphones des devices. Avec les informations spatiales, ces traitements multicanals sont plus performants que les versions monocanales. La généralisation du deep learning au traitement du signal audio est incontournable avec des résultats excellents (par exemple challenge Sound Demixing 2023)
Cependant, ces méthodes ont des limites traités dans le projet ANR DEESSE :
l'approche discriminative retenue, qui consiste à appliquer un masque temps-fréquences, génère des artefacts audibles comme des résidus d'interférences ou une voix dégradée,
les réseaux, entraînés sur des bases de données synthétiques, fonctionnent mal en situations réelles, du fait du caractère rudimentaire des moteurs de simulation acoustique.
Objectif scientifique - résultats et verrous à lever
L'objectif du travail de postdoc consiste à développer des méthodes de séparation de sources audio multicanal robustes en condition réelle.
Dans ce travail, les données multicanal seront au format Ambisonique : de nombreuses antennes du marché encodent dans ce format,devenu le format générique de représentation pour les contenus VR et supporté par les plus récents codeurs audio comme IVAS du 3GPP. Plus précisément, on désire dans ce post-doc investiguer comment des architectures causales de type encodeur-décodeur monocanal comme DAC peuvent répondre à notre problématique de séparation de sources. On s'intéressera à la façon de représenter les données spatiales au format Ambisonique et à la manière de conditionner le réseau pour extraire de la source d'intérêt identifiée par sa position. Enfin, pour répondre à la problématique de généralisation, on investiguera les approches de type GAN (Generative Adversarial Network).
Profil recherché
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
Maitrise des techniques d'apprentissage automatique, réseaux de neurones profonds
Maitrise des techniques de traitement du signal, audio.
Connaissances approfondies en Python, Bash etc.
Rigueur et créativité
Notions de propriété intellectuelle
Formation demandée (master, diplôme d'ingénieur, doctorat, domaine scientifique et technique ...)
Diplôme niveau bac+8 (Thèse et Master ou école d'ingénieur en Informatique et réseaux) dans le domaine du traitement du signal ou acoustique ET de l'apprentissage automatique.
Une connaissance du domaine de l'audio est impérative
Expériences souhaitées (stages,projets, TPs ...)
Thèse dans le domaine du traitement du signal et de l'apprentissage automatique
Expérience en apprentissage automatique, notamment réseaux de neurones profonds (DNN), framework PyTorch
Expérience en traitement du signal audio (filtrage, réduction de bruit, codage)
Informations complémentaires
Informations complémentaires
Contrat | : | CDD |
Durée du contrat | : | 12 mois |
Lieu de la mission | : | Ille-et-Vilaine Cesson-sévigné |
Niveau d'étude | : | Bac + 5 et plus : DEA, DESS, mastère, MBA... |
Expérience | : | Débutant |
Poste(s) disponible(s) | : | 1 |
Poste de cadre | : |
Oui
|
Début de la mission | : | Dès que possible |
Salaire : | : | Part variable, intéressement, participation, restaurant d'entreprise, participation frais de transport, réduction produits et services, activités s |
Secteur | : | Direction |