Évaluation de l'utilisation des LLMs pour l'extraction de données scientifiques à partir de documents hétérogènes

Total Energies
7 hours ago
Posted date7 hours ago
N/A
Minimum levelN/A
Internship / ApprenticeshipEmployment type
Internship / ApprenticeshipContext & Environment
Au sein de la brancheOneTech de TotalEnergies, vous rejoindrez le Centre de Recherche de Solaize, situé à 15 minutes au sud de Lyon.
Le site regroupe plus de 300 chercheurs dans un environnement verdoyant .
Il constitue l'un des principaux centres de R&D de TotalEnergies, dédié notamment :
Les activités implantées sur le site évoluent constamment pour répondre aux objectifs et aux ambitions de la compagnie TotalEnergies en matière de neutralité carbone et d'accessibilité à des énergies abordables et propres pour le plus grand nombre.
Activities
TotalEnergies s'inscrit dans une ambition climat forte, visant la neutralité carbone à horizon 2050. Cette transformation s'accompagne d'une digitalisation accrue de la R&D, avec la mise en place d'approches prédictives pour accélérer le développement de nouvelles molécules et matériaux répondant aux besoins des mobilités durables. Dans ce cadre, l'exploitation efficace des données scientifiques issues de sources variées (articles, documents techniques, fichiers semi-structurés) est un levier essentiel pour innover plus rapidement et de manière responsable.
Les modèles de langage (LLMs) offrent des perspectives inédites pour automatiser cette extraction et faciliter l'accès à l'information.
Objectifs du stage :
️ Moyens et outils utilisés :
Candidate Profile
Formation Bac+5 : Ecole ingénieur / Master
Niveau d'anglais : B2
️ Période de stage : 6 mois
Des compétences en informatique et data science sont recherchées, notamment en intelligence artificielle et apprentissage automatique, traitement automatique des langues (NLP), ainsi qu'une maîtrise des langages et outils courants (Python - pandas, NumPy, PyTorch/TensorFlow - APIs et intégration de modèles LLM).
Additional Information
TotalEnergies values diversity, promotes individual growth and offers equal opportunity careers.
Apply
<
A propos de OneTech :
Créée par TotalEnergies pour accompagner sa transformation vers les énergies renouvelables, OneTech regroupe les expertises techniques et R&D des branches (Exploration & Production, Raffinage Chimie, Marketing & Services et Gas, Renewables & Power).
Avec 3 400 ingénieurs et techniciens répartis sur plusieurs sites en Europe, elle s'organise autour de trois pôles : Industriel - Recherche & Développement - Fonctions supports
OneTech est un pilier de la stratégie multi-énergies de TotalEnergies.
Au sein de la brancheOneTech de TotalEnergies, vous rejoindrez le Centre de Recherche de Solaize, situé à 15 minutes au sud de Lyon.
Le site regroupe plus de 300 chercheurs dans un environnement verdoyant .
Il constitue l'un des principaux centres de R&D de TotalEnergies, dédié notamment :
- Au développement de solutions ainsi que de moyens de mesure et de contrôle des émissions de gaz à effet de serre
- À la formulation de produits à faible empreinte environnementale et décarbonés pour les mobilités thermique, électrique et pour l'industrie (carburants non fossiles d'origine renouvelable, lubrifiants, fluides caloporteurs, bitumes, etc.)
Les activités implantées sur le site évoluent constamment pour répondre aux objectifs et aux ambitions de la compagnie TotalEnergies en matière de neutralité carbone et d'accessibilité à des énergies abordables et propres pour le plus grand nombre.
Activities
TotalEnergies s'inscrit dans une ambition climat forte, visant la neutralité carbone à horizon 2050. Cette transformation s'accompagne d'une digitalisation accrue de la R&D, avec la mise en place d'approches prédictives pour accélérer le développement de nouvelles molécules et matériaux répondant aux besoins des mobilités durables. Dans ce cadre, l'exploitation efficace des données scientifiques issues de sources variées (articles, documents techniques, fichiers semi-structurés) est un levier essentiel pour innover plus rapidement et de manière responsable.
Les modèles de langage (LLMs) offrent des perspectives inédites pour automatiser cette extraction et faciliter l'accès à l'information.
Objectifs du stage :
- Évaluer différentes solutions LLM (Copilot, ChatGPT, MistralAI) en mode interactif (chat) et via API.
- Définir et tester des modes opératoires pour l'extraction de données scientifiques à partir, d'articles scientifiques, de documents techniques, de fichiers Excel semi-standardisés.
- Familiariser l'équipe avec l'écosystème LLM interne (LLM Hub TotalEnergies, outils associés).
- Proposer des recommandations pour l'intégration des LLMs dans les workflows existants.
️ Moyens et outils utilisés :
- Accès aux solutions LLM internes et externes (LLM Hub, Copilot, etc.).
- Collaboration avec l'équipe R&D spécialisée en science des données
Candidate Profile
Formation Bac+5 : Ecole ingénieur / Master
Niveau d'anglais : B2
️ Période de stage : 6 mois
Des compétences en informatique et data science sont recherchées, notamment en intelligence artificielle et apprentissage automatique, traitement automatique des langues (NLP), ainsi qu'une maîtrise des langages et outils courants (Python - pandas, NumPy, PyTorch/TensorFlow - APIs et intégration de modèles LLM).
Additional Information
TotalEnergies values diversity, promotes individual growth and offers equal opportunity careers.
Apply
- X
<
A propos de OneTech :
Créée par TotalEnergies pour accompagner sa transformation vers les énergies renouvelables, OneTech regroupe les expertises techniques et R&D des branches (Exploration & Production, Raffinage Chimie, Marketing & Services et Gas, Renewables & Power).
Avec 3 400 ingénieurs et techniciens répartis sur plusieurs sites en Europe, elle s'organise autour de trois pôles : Industriel - Recherche & Développement - Fonctions supports
OneTech est un pilier de la stratégie multi-énergies de TotalEnergies.
JOB SUMMARY
Évaluation de l'utilisation des LLMs pour l'extraction de données scientifiques à partir de documents hétérogènes

Total Energies
La Celle-sous-Gouzon
7 hours ago
N/A
Internship / Apprenticeship
Évaluation de l'utilisation des LLMs pour l'extraction de données scientifiques à partir de documents hétérogènes