Langues autochtones en IA : Google dévoile WAXAL avec partenaires africains

Home > Blog > Technologie > Langues autochtones en IA : Google dévoile WAXAL avec partenaires africains

Langues autochtones en IA : Google dévoile WAXAL avec partenaires africains

Google et des institutions africaines lancent WAXAL, un dataset vocal massif et open-source couvrant 21 langues autochtones, pour démocratiser l’IA en Afrique subsaharienne.

Naissance de WAXAL : une réponse au fossé linguistique africain

Fruit de trois ans de collaboration financée par Google Research Africa, le projet WAXAL (« parler » en wolof) fournit pour la première fois des données vocales de haute qualité pour plus de 100 millions de locuteurs.

Alors que les assistants vocaux et traducteurs en temps réel dominent l’Occident, l’Afrique et ses plus de 2 000 langues restaient à la traîne faute de datasets adaptés. WAXAL change la donne avec 1 250 heures de parole transcrite naturellement et plus de 20 heures d’enregistrements studio pour voix synthétiques.

Les langues autochtones au cœur du projet

Les partenaires africains – Makerere University (Ouganda), University of Ghana, Digital Umuganda (Rwanda) et l’African Institute for Mathematical Sciences – ont piloté la collecte, conservant la propriété pleine des données sous licence ouverte sur Hugging Face. Voici les 21 langues couvertes par WAXAL :

  • Afrique de l’Ouest : Akan, Ewe, Fante, Fulani, Hausa, Igbo, Yoruba
  • Afrique de l’Est : Luganda, Swahili, Kikuyu, Dholuo, Acholi
  • Afrique australe/centrale : Shona, Lingala, Malagasy, et autres comme Dagaare, Dagbani, Ikposo, Masaaba, Nyankole, Rukiga, Soga

Applications concrètes pour l’Afrique

Ce dataset open-source ouvre la voie à des innovations locales en IA vocale, particulièrement cruciales dans les zones à faible alphabétisation :

  • Assistants vocaux pour services agricoles et santé
  • Transcriptions médicales et éducatives en langues locales
  • Automatisation client pour PME panafricaines
  • Outils d’accessibilité pour personnes handicapées

Leadership africain et souveraineté numérique

Contrairement aux approches top-down des géants tech, WAXAL adopte un modèle « community-first » où les universités africaines dirigent la collecte et la qualité, avec Google en facilitateur technique. « L’impact ultime est l’empowerment des Africains pour bâtir leur tech dans leurs langues », souligne Aisha Walcott-Bryant, Head of Google Research Africa. Joyce Nakatumba-Nabende de Makerere ajoute : « L’IA doit parler nos contextes pour transformer nos communautés. »

Impact économique et recherche renforcée

Déjà, WAXAL dope la recherche universitaire ougandaise et ghanéenne, formant étudiants et chercheurs à l’IA linguistique. À terme, il pourrait catalyser les startups spécialisées en voie AI pour santé, éducation et agriculture, secteurs où 80% des Africains préfèrent interagir oralement. Ce dataset s’inscrit dans l’élan post-N-ATLAS (Nigeria, 2025) pour une IA véritablement africaine.

Perspectives : vers une IA panafricaine inclusive

Disponible dès aujourd’hui sur Hugging Face, WAXAL invite chercheurs, étudiants et entrepreneurs à créer des outils scalables reflétant la diversité linguistique du continent. Alors que l’IA générative explose, ce projet stratégique positionne l’Afrique comme acteur, non simple consommateur, de la tech vocale mondiale.

✍️ Vous souhaitez apporter une contribution ?

Écrivez-nous pour un article invité : [email protected]

Écrire à la rédaction
Share this article
Share this Article:
Partner Content:
Provider:
APO Group
Join our newsletter

Join the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.