Un sistema basato sull'AI che migliora l’accuratezza dei sottotitoli nei video online, rendendo i contenuti educativi più accessibili per le persone sorde e ipoudenti.
Anno accademico
2025/2026
Un sistema basato sull'AI che migliora l’accuratezza dei sottotitoli nei video online, rendendo i contenuti educativi più accessibili per le persone sorde e ipoudenti.
Gemini Sync è un progetto sviluppato dalle studentesse Marianna Marchese e Matilde Sergio che indaga il ruolo dell’intelligenza artificiale nel migliorare l’accessibilità dei contenuti video.
La ricerca alla base del progetto evidenzia come il 74% dei giovani utilizzi i video online come strumento di apprendimento, mentre le persone sorde o ipoudenti dipendono quasi esclusivamente dai sottotitoli automatici per accedere a questi contenuti. Tuttavia, i sistemi di captioning oggi disponibili presentano in media 7,7 errori al minuto, trasformando un video educativo di dieci minuti in un’esperienza frammentata e difficile da seguire.
Per rispondere a questo problema, il progetto introduce un approccio che privilegia l’accuratezza rispetto alla velocità. Gemini Sync implementa infatti un ritardo intenzionale di 1,5 secondi nella generazione dei sottotitoli, creando un breve margine temporale che consente all’intelligenza artificiale di Google Gemini di analizzare non solo l’audio ma anche il contesto visivo e semantico del video prima di produrre il testo.
Questo “buffer di precisione” permette di migliorare significativamente la qualità delle caption, portando l’accuratezza fino al 99%. L’interfaccia prevede inoltre un sistema di supporto alla comprensione: selezionando una parola o un passaggio poco chiaro, l’utente può ricevere una spiegazione contestuale immediata, adattata al proprio livello di conoscenza.
Il progetto propone così una riflessione sul rapporto tra tempo, tecnologia e accessibilità, dimostrando come anche un piccolo intervallo possa trasformare radicalmente l’esperienza di fruizione dei contenuti digitali.