Projet de thèse de trois ans dans le domaine de l'IA : mise en œuvre d'un système d'IA pour des transcriptions fiables de séminaires techniques (Speech-to-Text + Refinement)

Postulez dès maintenant
Gênes, Rome
Centre de compétences et ingénierie

Orizzonte Sistemi Navali propose un projet de thèse de trois ans visant à générer et à optimiser les transcriptions obtenues à partir de vidéos de séminaires techniques/de formation enregistrés sur la plateforme Teams. L'objectif est d'obtenir des textes précis, lisibles et cohérents avec une terminologie technique, afin d'améliorer et de rendre le patrimoine informationnel de l'entreprise plus utilisable grâce à l'indexation et à la consultation.

Activités et responsabilités

La ressource traitera des activités suivantes :

· Testez et comparez différents systèmes de synthèse vocale sur un ensemble de vidéos professionnelles

· Définition d'un pipeline : extraction audio → transcription → post-traitement → validation

· Évaluation de la qualité avec mesures et analyse des erreurs (fiabilité, cohérence terminologique, lisibilité)

· Élaboration de directives et de bonnes pratiques pour rendre le processus reproductible

Exigences

  • Diplôme de trois ans en cours (génie informatique/mathématiques/IA/science des données ou domaine connexe)
  • Connaissances de base de Python
  • Intérêt pour la PNL et la reconnaissance vocale et l'expérimentation sur des modèles d'IA
  • Connaissance des modèles et des bibliothèques Transformer
  • Expérience (même basique) avec les outils STT (par exemple Whisper ou équivalent)
  • Intérêt pour les applications de l'IA dans le domaine de la gestion des connaissances (indexation, balisage, synthèse)

Des compétences spécifiques

Remplissez le formulaire suivant pour postuler :

Merci ! Votre candidature a été reçue !
Oups ! Une erreur s'est produite lors de l'envoi du formulaire.