Génération automatisée d'APIs sur des corpus de données tabulaires hétérogènes à l'aide de techniques d'ingénierie des connaissances



Référence : 33896982
Date de dépot : 14/10/2020
Entreprise : Orange

Descriptif
Description : Au sein de la direction  Data & IA, le département INK (Intelligence, Network and Knowledge) est spécialisé dans les domaines de la Data Science, du Big Data et de l'ingénierie des connaissances. Il met à profit des techniques d'intelligence artificielle sur des applications variées parmi lesquelles l'optimisation et l'automatisation de la gestion des réseaux mobiles/fixes/véhiculaires, la gouvernance des données et l'amélioration de l'expérience client.
Le stage se déroule dans les locaux d'Orange sur le parc d'activités du Techn'hom à Belfort.


Dans le cadre du projet de recherche DAGOBAH visant à proposer des solutions innovantes pour le stockage, le référencement et la recherche de jeux de données tabulaires, cette offre de stage propose de concevoir et d'implémenter un système permettant de générer automatiquement des APIs pour l'interrogation de données tabulaires syntaxiquement et sémantiquement hétérogènes. Pour cela, le système développé s'appuiera sur un ensemble de technologies préexistantes qui devront travailler de concert : les algorithmes d'annotations et de génération de connaissances DAGOBAH, la librairie SPARQL Transformer (https://pypi.org/project/SPARQLTransformer/) et l'outil grlc (http://grlc.io/). Le système devra démontrer une réelle capacité à simplifier la manipulation de corpus de tables pour des utilisateurs non experts en ingénierie des connaissances. Pour aller plus loin, un volet supplémentaire sur la traduction de requêtes en langage naturel en requêtes SPARQL pourra être ouvert en fin de stage selon l'avancement.
    • Dans une première étape, l'étudiant réalisera une montée en compétence sur les technologies du Web Sémantique, une prise en main des algorithmes d'annotation déjà développés dans le projet DAGOBAH et des outils SPARQL Transformer et grlc.
    • Dans un second temps, le stagiaire participera à la conception, l'implémentation et la valorisation d'un système de génération automatisée d'APIs sur des corpus de tables hétérogènes.
Vous participez à la réalisation d'un système d'interrogation de données tabulaires qui viendra enrichir un projet de recherche Orange nommé DAGOBAH :
    • Vous contribuez à la conception et l'implémentation du système en Python et en tirant parti des technologies du Web sémantique.
    • Vous collaborez à la rédaction de rapports techniques et de documentation ainsi qu'à l'éventuelle valorisation scientifique des travaux.
Vous participez à la vie de l'équipe de recherche DAGOBAH via des réunions de suivi du projet.


Profil recherché
Profil recherché : Vous préparez une formation de niveau Bac +5 (master ou école d'ingénieurs)

Compétences :
    • Vous maitrisez plusieurs technologies du Web Sémantique et plus particulièrement les langages de représentation de connaissances RDF/RDFS et OWL ainsi que le langage d'interrogation SPARQL.
    • Vous possédez les compétences nécessaires au développement de logiciels et avez une bonne connaissance du langage Python.
    • Vous aimez trouver des solutions pour répondre à un besoin et ne craignez pas de vous remettre en question.
    • Vous êtes capable de mener à bien un sujet et d'être force de proposition.
    • Vous êtes enthousiaste, autonome et proactif.
    • Vous avez un bon sens de l'analyse et êtes rigoureux dans l'exécution de votre mission.

Le plus de l'offre :
Vous serez intégré au sein d'une équipe de recherche dynamique, à la pointe de l'innovation et de l'expertise dans le domaine de l'ingénierie des connaissances. Vous contribuez à un projet de recherche mêlant plusieurs domaines de l'IA : l'ingénierie des connaissances, le machine learning et le deep learning.
Le stage pourra donner lieu à des activités de valorisation industrielles (brevets) ou scientifiques (publications) selon les résultats obtenus.

Niveau d'étude : Bac + 3 : licence
Expérience : Entre 1 et 3 ans d'expérience
Lieu de la mission : Franche-Comté - Belfort
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Contrat : Stage
Durée du contrat : for 6 to 12 months
Début de la mission : 31/10/4400

Entreprise
Nom de l'entreprise : Orange
Site Web : http://www.orange.jobs
Contact : Monsieur Service Recrutement
Adresse : 78-84 rue Olivier de Serres
75015 Paris
France


Vous devez être connecté pour postuler à cette offre.

Connectez vous maintenant




Ou inscrivez vous

C'est simple et totalement gratuit