Google und ein Konsortium afrikanischer Forschungseinrichtungen haben den WAXAL-Datensatz vorgestellt, eine bedeutende neue Initiative zur Behebung einer der größten Herausforderungen der künstlichen Intelligenz (KI) auf dem Kontinent: ihrer Unfähigkeit, die meisten afrikanischen Sprachen zu interpretieren und zu verstehen.
Das Projekt liefert einen umfangreichen, offenen Sprachdatensatz, der 21 subsaharische afrikanische Sprachen umfasst und Sprachtechnologie für mehr als 100 Millionen Menschen zugänglich macht, die von der KI-Wirtschaft ausgeschlossen sind.
Der WAXAL-Datensatz ist das Ergebnis einer dreijährigen Zusammenarbeit, die von Google finanziert und von lokalen Universitäten und Gemeinschaftsgruppen geleitet wurde.
Er umfasst 1.250 Stunden transkribierte, natürliche Sprache und mehr als 20 Stunden studioqualitative Aufnahmen, die darauf abzielen, hochauflösende synthetische Stimmen zu entwickeln. Er zielt auf Sprachen wie Hausa, Yoruba, Luganda, Igbo und Acholi ab, von denen viele von Dutzenden Millionen gesprochen werden, aber für kommerzielle Sprachsysteme weitgehend unsichtbar bleiben.
Bei all den Diskussionen über globale KI sind Sprachtechnologien nach wie vor stark auf Englisch und eine kleine Handvoll europäischer und asiatischer Sprachen ausgerichtet. Afrika, Heimat von über 2.000 Sprachen, wurde an den Rand gedrängt.
Diese Lücke ist nicht akademisch; sie bestimmt, wer digitale Dienste nutzen kann, wer Zugang zu Bildungs- und Gesundheitstools hat und wer Unternehmen auf Basis moderner KI-Plattformen aufbauen kann. Google bezeichnete die Arbeit als einen Schritt zur Verringerung einer langjährigen Datenlücke, die viele afrikanische Sprachen von Sprachassistenten und anderen Tools ferngehalten hat.
Über die direkte Behebung dieses Ungleichgewichts hinaus ist das Projekt genauso wichtig wie die Daten selbst.
Anders als bei früheren Initiativen, bei denen afrikanische Sprachdaten extrahiert und anderswo gespeichert wurden, wurde WAXAL vor Ort von afrikanischen Institutionen geleitet. Die Makerere-Universität in Uganda, die Universität von Ghana und Digital Umuganda in Ruanda überwachten die Datenerfassung, das Community-Engagement und die Sprachverwaltung mit technischer Unterstützung von Google Research Africa.
Entscheidend ist, dass diese Institutionen das Eigentum an den Daten behalten. Das ist ein bemerkenswerter Wandel in einem Bereich, der oft dafür kritisiert wird, extraktive Dynamiken unter dem Banner der Offenheit zu reproduzieren.
Laut Aisha Walcott-Bryant, Leiterin von Google Research Africa: „Die ultimative Wirkung von WAXAL ist die Stärkung der Menschen in Afrika. Dieser Datensatz bietet die entscheidende Grundlage für Studenten, Forscher und Unternehmer, um Technologie nach ihren eigenen Bedingungen, in ihren eigenen Sprachen zu entwickeln und schließlich über 100 Millionen Menschen zu erreichen."
„Wir freuen uns darauf zu sehen, wie afrikanische Innovatoren diese Daten nutzen, um alles zu schaffen, von neuen Bildungstools bis hin zu sprachaktivierten Diensten, die greifbare wirtschaftliche Möglichkeiten auf dem gesamten Kontinent schaffen", fügte sie hinzu.
Aisha Walcott-Bryant, Leiterin von Google Research Africa
Diese Darstellung wird von den beteiligten Universitäten geteilt. Joyce Nakatumba-Nabende, eine leitende Dozentin an der Makerere-Universität, sagte:
„Damit KI in Afrika eine echte Wirkung entfalten kann, muss sie unsere Sprachen sprechen und unsere Kontexte verstehen. Der WAXAL-Datensatz gibt unseren Forschern die hochwertigen Daten, die sie benötigen, um Sprachtechnologien zu entwickeln, die unsere einzigartigen Gemeinschaften widerspiegeln. In Uganda hat er bereits unsere lokale Forschungskapazität gestärkt und neue studenten- und fakultätsgeführte Projekte unterstützt."
An der Universität von Ghana wies der außerordentliche Professor Isaac Wiafe auf das Ausmaß des öffentlichen Engagements hin:
„Für uns an der Universität von Ghana geht die Wirkung von WAXAL über die Daten selbst hinaus. Es hat uns befähigt, unsere eigenen Sprachressourcen aufzubauen und eine neue Generation von KI-Forschern auszubilden. Über 7.000 Freiwillige haben sich uns angeschlossen, weil sie wollten, dass ihre Stimmen und Sprachen Teil der digitalen Zukunft werden. Heute hat diese kollektive Anstrengung ein dezentrales Ökosystem der Innovation in Bereichen wie Gesundheit, Bildung und Landwirtschaft geschaffen. Dies beweist, dass sich die Möglichkeiten überall erweitern, wenn die Daten vorhanden sind."
Es gibt Grund für vorsichtigen Optimismus. Offene Sprachdatensätze können Barrieren für lokale Startups und Forscher senken, denen die Ressourcen fehlen, um Daten in großem Maßstab zu sammeln. Sie können auch die Abhängigkeit von ausländischen APIs reduzieren, die afrikanische Sprachen selten gut unterstützen, wenn überhaupt.
Der WAXAL-Datensatz
Dennoch garantieren Datensätze keine Ergebnisse; der Aufbau zuverlässiger Sprachsysteme erfordert nachhaltige Investitionen, lokale Bereitstellung und kommerzielle Wege, die den Wert im Land halten. Googles Rolle als Geldgeber und Organisator wird Prüfungen auf sich ziehen, insbesondere darüber, wie WAXAL-Daten in Zukunft von globalen Unternehmen verwendet werden.
Vorerst markiert die Veröffentlichung des WAXAL-Datensatzes einen konkreten Schritt hin zu einem sprachlich inklusiveren KI-Ökosystem. Er löst nicht Afrikas KI-Herausforderungen, aber er geht eine grundlegende an. Sprache ist oft die natürlichste Schnittstelle zur Technologie. Sicherzustellen, dass KI Afrika in all seiner Vielfalt sprechen hören kann, ist längst überfällig.
Der Beitrag Google schult KI in 21 afrikanischen Sprachen, darunter Yoruba, Hausa und Igbo erschien zuerst auf Technext.


