STAGE - Transcription de la parole en texte : vers un modèle entièrement neuronal précis et efficace à Rennes F/H



Référence : 33873319
Date de dépot : 09/10/2020
Entreprise : Orange

Descriptif
Description : Au sein de la direction DATA & AI et du département AI Tools & Technologies, dont des activités sont centrées sur l'analyse du langage, de la parole et du dialogue, l'équipe « Multimedia contents Analysis technologieS » (MAS) mène depuis plusieurs années des travaux de recherche sur l'apprentissage neuronal appliqué à divers contenus (image, audio, vidéo). Récemment, l'équipe MAS s'est spécialisée sur les applications liées à l'analyse de la voix et notamment sur la transcription de la parole en texte. Dans ce contexte, elle travaille sur l'étude, le prototypage et le déploiement de différents systèmes de reconnaissance de la parole pour servir les besoins du groupe.


Sous la responsabilité d'un chercheur de l'équipe MAS, vous contribuerez à un projet de recherche à travers toutes ses étapes. Ce projet portera sur la transcription automatique de la parole en texte à partir de modèles complétement neuronaux.
Concernant la transcription de la parole en texte, les modèles neuronaux proposés actuellement dans la littérature s'avèrent particulièrement précis, dépassant des solutions plus traditionnelles. Néanmoins, l'utilisation de ces modèles est limitée par leur complexité en termes de temps de calcul.
Le but de ce stage sera d'explorer différentes méthodes de réduction de complexité (à la fois au niveau de l'inférence mais aussi au niveau de l'entraînement du réseau).
Une première phase consistera en une analyse bibliographique des modèles neuronaux appliqués à la voix, des techniques de réduction de la complexité et des techniques d'accélération de l'entraînement.
Par la suite, vous collaborerez avec d'autres membres de l'équipe pour rechercher et développer une solution originale à ce problème tout en gardant une maitrise sur la dégradation des résultats.
Enfin, vous aurez l'occasion de communiquer autour de cette solution.


Profil recherché
Profil recherché : En dernière année d'ingénieur ou de Master2 (préférentiellement orienté recherche) dans le domaine de l'apprentissage automatique ou d'un domaine technique connexe.

Compétences :
Vous avez les compétences (scientifiques et techniques) suivantes :
    • Compétences en informatique : maitrise d'au moins un langage de programmation, idéalement python, connaissance de l'environnement unix, connaissance d'un gestionnaire de version
    • Expérience (projets, stage) en machine learning et maitrise des techniques de l'IA, une expérience en apprentissage automatique appliqué à des données audio est un plus
    • Rigueur et créativité
 

Le plus de l'offre :
Dans le cadre de ce stage, vous rejoignez une entité à la pointe de l'innovation et des technologies de l'IA. Vous aurez l'occasion de travailler sur une problématique avec des aspects recherche important mais qui a un aussi grand intérêt industriel.

Niveau d'étude : Bac + 3 : licence
Expérience : Entre 1 et 3 ans d'expérience
Lieu de la mission : Bretagne - CESSON SEVIGNE
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Contrat : Stage
Durée du contrat : for 6 to 12 months
Début de la mission : 20/10/4400

Entreprise
Nom de l'entreprise : Orange
Site Web : http://www.orange.jobs
Contact : Monsieur Service Recrutement
Adresse : 78-84 rue Olivier de Serres
75015 Paris
France


Vous devez être connecté pour postuler à cette offre.

Connectez vous maintenant




Ou inscrivez vous

C'est simple et totalement gratuit