Stage - Apprentissage d'un modèle d'analyse d'opinion sur des données hétérogènes (TALN/NLP)



Référence : 33873314
Date de dépot : 09/10/2020
Entreprise : Orange

Descriptif
Description : Au sein d'Orange, dans la division Data&IA, notre équipe Deskiñ est spécialisée dans le traitement automatique de la langue naturelle : elle permet de mieux analyser les avis de ses clients, en recherchant de nouveaux algorithmes d'extraction et de classification, puis en développant des technologies et services pour Orange.


Pour une bonne écoute des avis et des besoins du client, il est nécessaire de définir des grilles d'analyse d'opinion bien adaptées. L'énorme diversité des domaines d'application couverts par les services Orange (téléphonie, télévision, banque, B2C, B2B,...) produit des grilles d'analyse d'opinion qui varient d'un domaine à l'autre et qui évoluent avec chaque service. Pour cette raison il est impératif de pouvoir apprendre des modèles d'analyse d'opinion avec des grilles d'analyse hétérogènes. Le but étant de produire des modèles génériques capables de mieux comprendre l'avis du client quel que soit le service.
Nous avons développé pour cela une solution complète d'apprentissage et d'exécution à base de réseau de neurones profonds et d'embeddings contextuels (BERT, XLMR).
Cependant, cette solution a besoin d'une étude sur les recouvrements et différences des grilles d'analyse d'opinion, mais aussi d'une évaluation intensive, pour garantir ses performances dans chaque domaine et dans chaque langue du footprint d' Orange. De la même façon, il est nécessaire de rechercher et d'intégrer des nouvelles sources des données et d'évaluer leur impact dans les performances des modèles.
Ce stage est une opportunité de découvrir et mettre en œuvre le cycle d'apprentissage et évaluation de modèle pour l'étiquetage multi-label de tokens, sur des données hétérogènes par une méthode de masquage, en s'appuyant sur des technologies d'un cloud grand public.


Profil recherché
Profil recherché : Le stage est destiné à un profil ingénieur ou master recherche en intelligence artificielle, data science ou linguistique computationnelle.

Compétences :
Il requiert une grande curiosité scientifique combinée à des talents de développeur et un intérêt pour le TALN.
 

Le plus de l'offre :
Vous serez intégré-e à une équipe de développeurs et de chercheurs en Intelligence Artificielle  spécialisée en Traitement automatique de la langue (TALN).

Niveau d'étude : Bac + 3 : licence
Expérience : Entre 1 et 3 ans d'expérience
Lieu de la mission : Bretagne - Lannion
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Contrat : Stage
Durée du contrat : for 6 to 12 months
Début de la mission : 25/10/4400

Entreprise
Nom de l'entreprise : Orange
Site Web : http://www.orange.jobs
Contact : Monsieur Service Recrutement
Adresse : 78-84 rue Olivier de Serres
75015 Paris
France


Vous devez être connecté pour postuler à cette offre.

Connectez vous maintenant




Ou inscrivez vous

C'est simple et totalement gratuit