Projet de thèse de trois ans dans le domaine de l'IA : état de l'art sur les modèles de validation des chatbots

Postulez dès maintenant
Gênes, Rome
Centre de compétences et ingénierie

Orizzonte Sistemi Navali, une entreprise leader en ingénierie des systèmes dans le domaine naval, offre la possibilité de réaliser une activité de thèse dédiée à la validation de chatbots basés sur l'IA dans un contexte technico-industriel. Le projet fait partie d'un programme de numérisation du support et de la maintenance de systèmes navals complexes. L'objectif est de soutenir la consultation de manuels techniques par le biais d'un chatbot IA et de définir des méthodologies solides pour évaluer leur qualité et leur fiabilité.

Activités et responsabilités

La ressource doit développer une cartographie structurée de l'état de l'art sur les méthodologies de validation des chatbots/LLM dans des contextes éclairés par une documentation spécifique (manuels, procédures, base de connaissances), en accordant une attention particulière au domaine technico-industriel. L'étudiant s'occupera des activités suivantes :

· Collecte et classification des approches/métriques pour l'évaluation des chatbots (automatiques, humains, hybrides)

· Concentrez-vous sur les concepts clés : précision par rapport à la pertinence, similitude sémantique, robustesse aux requêtes ambiguës ou hors de portée, aspects de fiabilité/confiance

· Mettre en œuvre des outils de comparaison automatique entre les réponses des chatbots et le contenu original (vérité fondamentale) grâce à des techniques de similarité sémantique et de précision de récupération.

· Réaliser une analyse comparative (avantages/inconvénients, données requises, coûts, répétabilité)

Produire un rapport final contenant une proposition de « cadre de validation » applicable au contexte commercial.

Exigences

  • Diplôme de trois ans en cours (génie informatique/mathématiques/IA/science des données ou domaine connexe)
  • Intérêt pour le NLP/LLM et l'évaluation des systèmes d'IA
  • Capacité à lire et à résumer des articles scientifiques (EN)
  • Connaissances de base de Python, des intégrations et des métriques NLP
  • Familiarité avec les concepts de RAG/base de connaissances

Des compétences spécifiques

Remplissez le formulaire suivant pour postuler :

Merci ! Votre candidature a été reçue !
Oups ! Une erreur s'est produite lors de l'envoi du formulaire.