Description
                        
                                                        Nous sommes l'un des principaux opérateurs de télécommunications et de services numériques dans le monde. Nous servons 291 millions de clients, particuliers, professionnels et grandes entreprises au 31 décembre 2024 : nous sommes notamment l'un des leaders mondiaux des services de télécommunication pour les entreprises multinationales, sous la marque Orange Business.
          
          Ce stage consiste à développer une méthode de génération de données synthétiques multi-entities et cohérentes, en s'appuyant sur nos prototypes existants. L'objectif est de faciliter le partage sécurisé de données pour la modélisation des risques financiers dans le secteur bancaire en Afrique de l'Ouest, en utilisant l'outil open source Khiops.
Contexte
Nous travaillons avec un grand acteur bancaire en Afrique de l'Ouest, spécialisé dans l'octroi de prêts via mobile. Pour améliorer nos modèles de risque tout en respectant la confidentialité des données, nous souhaitons développer des jeux de données synthétiques réalistes et sécurisés. Cela facilitera aussi le partage d'informations avec nos partenaires experts en modélisation de risques.
Ce que vous allez faire
Ce stage consiste à concevoir une méthode pour générer des données synthétiques complexes, impliquant plusieurs types d'entités (clients, comptes, transactions, produits financiers, etc.) et leurs relations. Vous vous appuyez sur nos travaux et prototypes existants, notamment ceux réalisés pour la génération de données mono-table, pour accélérer le développement.
Vous utilisez notre outil open source Khiops, qui permet de modéliser et générer des données sans recourir à des techniques de deep learning coûteuses.
Vos missions principales sont :
- Définir une approche pour créer des jeux de données cohérents et réalistes, en respectant les relations entre différentes entités.
- Développer un prototype pour générer ces données synthétiques multi-entities, en intégrant des aspects temporels.
- Évaluer la qualité et la confidentialité des données produites.                        
                                                            Profil recherché
                                    
                                                                        Étudiant(e) en Data Science, Statistique, Informatique ou domaine équivalent.
Niveau bac+5
Intérêt pour la modélisation de données, la confidentialité et la génération de données synthétiques.
Connaissance ou curiosité pour les outils open source comme Khiops est un plus.
Rigueur, créativité et capacité à travailler en autonomie.                                    
                                                    Informations complémentaires
                        
                            
                                
                                    
                                    	
										Informations complémentaires
										
                                        
                                                                                    
                                                | Contrat | : | Stage | 
                                        
                                                                                    
                                                | Durée du contrat | : | 6 mois | 
                                                                                
                                            | Lieu de la mission | : | Côtes-d'Armor Caouënnec-lanvézéac | 
                                                                                    
                                                | Niveau d'étude | : | Bac + 5 et plus : DEA, DESS, mastère, MBA... | 
                                        
                                                                                    
                                                | Expérience | : | Débutant | 
                                        
                                                                                    
                                                | Poste(s) disponible(s) | : | 1 | 
                                        
                                        
                                            | Poste de cadre | : | Non | 
                                                                                    
                                                | Début de la mission | : | Dès que possible | 
                                        
                                        
                                                                                                                        
                                            | Secteur | : | Informatique, Télécommunications |