Common Voice è il database vocale aperto più grande al mondo, e ciò permette a chiunque di creare tecnologie di riconoscimento vocale
A seguito della presentazione del navigatore Firefox, la collaborazione tra Sardware, gruppo di attivisti per la tecnologia in lingua sarda, e Mozilla, l’azienda californiana, non si è fermata. Proprio in questi giorni, Sardware ha presentato il progetto Common Voice, un’iniziativa creata con l’obiettivo di facilitare lo sviluppo di tecnologie di riconoscimento vocale per tutte le lingue, comprese quelle minorizzate. Common Voice si basa sulla collaborazione delle e degli utenti che, offrendo la propria voce, contribuiscono a creare corpora di audio per addestrare motori statistici di riconoscimento vocale. A questo scopo servono molte ore di registrazioni di composizione diversa in termini di varietà geografica, genere ed età: infatti, più vario sarà il corpus, più precisi saranno i sistemi di riconoscimento vocale del futuro.
Riconoscimento vocale in sardo
“Può essere anche un gioco divertente da insegnare ai più piccoli”, dice Maurizio Piroddi, membro di Sardware e padre di due bambini. “La filosofia di Mozilla è proprio opposta a quella delle grandi aziende tecnologiche, sostiene Gianfranca Orunesu, membro di Sardware: “infatti, gli attuali sistemi di riconoscimento vocale funzionano soltanto per le lingue egemoniche, ma anche quelli sono stati creati con un utilizzo problematico dei dati degli utenti”.
Il funzionamento della piattaforma è molto semplice: per contribuire, le/gli utenti possono cliccare sul collegamento https://commonvoice.mozilla.org/sc e scegliere “chistiona”, se vogliono offrire la propria voce, o “ascurta”, se vogliono aiutare a validare le voci. C’è anche la possibilità di aggiungere frasi scritte. Volendo, ci si può creare un account che permetterà di monitorare i progressi.
Un’esperienza vincente in catalano
Common Voice ha già avuto un grande effetto in altre lingue vicine alla nostra. Il catalano a oggi ha circa 4.000 ore di registrazione, il che lo rende la prima lingua di Common Voice per numero di ore. Adrià Martín, membro di Sardware e ricercatore in tecnologie per la traduzione, è del parere che il coinvolgimento della società è fondamentale per affrontare le sfide odierne delle lingue minorizzate: “Common Voice è stato adottato dal governo catalano: dagli attivisti al presidente del governo, molta gente ha contribuito offrendo la propria voce e incoraggiando altri a fare lo stesso. Anche squadre come il Barcellona hanno pubblicizzato il progetto durante le partite allo stadio”.
Usa il sardo nei tuoi dispositivi!
Gli studi sostengono che in questo secolo scomparirà tra il 50 e il 90% delle lingue del mondo. Sardware pensa che ogni persona abbia la responsabilità di contribuire a mantenere il sardo in vita e, per questo, invita chiunque a evitare la delegazione linguistica. Una società informata deve essere coinvolta nell’utilizzo dei prodotti tradotti in sardo. Perciò Sardware incoraggia la comunità sarda a tenersi informata sugli strumenti che ha a disposizione e ricorda l’importanza di far crescere la coscienza linguistica nelle discussioni con la famiglia e tra le amicizie. Come affermato, il sardo è patrimonio di chiunque e l’utilizzo delle tecnologie per la traduzione è un piccolo sacrificio che può avere un grande impatto.
Tutta la nostra intelligenza
Sono diversi i progetti di Sardware per fornire alla comunità sarda un ecosistema di applicazioni libere, etiche e in sardo.” Abbiamo bisogno di tutta la nostra intelligenza”, sostengono. Per questo Sardware incoraggia a fare delle donazioni (visita il sito https://www.sardware.org/dona/) o a aderire al gruppo: “Ogni aiuto sarà fondamentale per continuare a mantenere vivo il sardo in ambito digitale”!