Stage - Classification précoce de séries temporelles F/H



Référence : 34059378
Date de dépot : 13/11/2020
Entreprise : Orange

Descriptif
Description : Le Big Data et l'intelligence artificielle constituent aujourd'hui de puissants leviers pour Orange, permettant à la fois de réinventer la relation client mais également d'optimiser et d'automatiser la gestion de nos réseaux, d'améliorer l'expérience client et d'apporter un avantage différenciant vis-à-vis de nos clients.
Orange développe ainsi des produits et des services à base d'intelligence artificielle autour de technologies du traitement du langage naturel, du dialogue et des agents conversationnels, de la reconnaissance de formes ou de l'analyse prédictive. L'ambition est aujourd'hui d'accélérer la diffusion des savoir-faire technologiques, aussi bien sur les applications que sur les algorithmes et outils, avec l'ensemble des filiales et directions métier du groupe.
Vous rejoignez l'équipe Business and Research Artificial Intelligence solutioNs (BRAIN) au sein du département “Data Intelligence et Algorithmes” d'Orange Labs Services, composée d'experts en Machine Learning, et d'architectes et développeurs avec un réel savoir-faire algorithmique et opérationnel. Elle a pour mission :
    • de contribuer au développement de la plateforme DIOD, en particulier sur les domaines liés à l'analyse de données et l'intelligence artificielle (outils, service et environnements d'analyse de données)
    • d'aider les autres directions d'OLS, et ponctuellement les directions métiers et nos filiales à développer l'usage du machine learning et de l'analyse de données dans leur métier, soit lors de leur phase d'appropriation soit dans la phase de mise en œuvre d'applications requérant une expertise technique importante


La littérature scientifique sur les séries temporelles traite diverses tâches d'apprentissage, telles que la “prévision” ; le “clustering” ; la “classification” de séries temporelles qui consiste à assigner à une série temporelle l'une des classes présentes dans un ensemble prédéfini.
Ce stage s'intéressera à  la classification précoce de séries temporelles, où les séries sont observées au fur et à mesure, et dont l'objectif est de déclencher les prévisions avant que les séries observées ne soient complètes.
La classification précoce de séries temporelles est utile dans les applications où il est essentiel d'agir rapidement. En effet, la collecte de plus d'information permet souvent d'obtenir une meilleure décision, mais attendre peut peux représenter un coût (pannes, sécurité, …). Il s'agit donc d'optimiser le compromis entre la qualité des prédictions et leur précocité.
Dans ce contexte, Orange a développé une méthode qui est décrite dans [1] et qui a été récemment améliorée dans [2]. Ce formalisme utilise en entrée des coûts (i.e. mauvaise classification, et coût d'attente) et a pour but d'en estimer une espérance pour les instants futurs.
Le but de ce stage est de mettre au point une nouvelle méthode appartenant à cette famille, en exploitant une méthode de clustering prédictif [3, 4]. Cette nouvelle approche a vocation à être sans paramètre utilisateur et permettra une utilisation plus simple en pratique.
Le stagiaire s'appropriera les méthode(s) de classification précoce [1] et [2], ainsi que la méthode de clustering prédictif [3, 4]. Il fera une étude « benchmark » sur les données de l'UCR (https://www.cs.ucr.edu/~eamonn/time_series_data_2018/) dans le cas où les séries temporelles sont complètes et décrites par des descripteurs telle que [5]). Puis le développement de la nouvelle méthode précoce sera mené ainsi que des expérimentations comparatives. La rédaction d'un article scientifique sera envisagée si les résultats expérimentaux sont probants.


Profil recherché
Profil recherché : Le profil souhaité est BAC + 5, Master Industriel (ou recherche) informatique et/ou statistiques ou école d'ingénieur.
Intérêt pour les aspects applicatifs et théoriques du sujet.

Compétences :
Les connaissances en Python et Scikit-learn sont indispensables.
Des connaissances minimales en statistiques, mathématiques et/ou apprentissage statistique sont indispensables.
Intérêt pour les aspects applicatifs et théoriques du sujet.
 

Le plus de l'offre :
Vous serez au sein d'une équipe composée de chercheurs en Machine Learning, de Data Scientists et d'experts en machine learning dans une direction d'innovation.

Niveau d'étude : Bac + 3 : licence
Expérience : Entre 1 et 3 ans d'expérience
Lieu de la mission : Île-de-France - Chatillon
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Contrat : Stage
Durée du contrat : for 6 to 12 months
Début de la mission : 27/11/2020

Entreprise
Nom de l'entreprise : Orange
Site Web : http://www.orange.jobs
Contact : Monsieur Service Recrutement
Adresse : 78-84 rue Olivier de Serres
75015 Paris
France


Vous devez être connecté pour postuler à cette offre.

Connectez vous maintenant




Ou inscrivez vous

C'est simple et totalement gratuit