Google și un consorțiu de instituții africane de cercetare au lansat setul de date WAXAL, un nou efort major de… Postarea Google pregătește AI în 21 de limbi africaneGoogle și un consorțiu de instituții africane de cercetare au lansat setul de date WAXAL, un nou efort major de… Postarea Google pregătește AI în 21 de limbi africane

Google va antrena AI în 21 de limbi africane, inclusiv Yoruba, Hausa și Igbo

2026/02/02 22:00

Google și un consorțiu de instituții de cercetare africane au lansat setul de date WAXAL, un nou efort major de a corecta una dintre provocările majore ale inteligenței artificiale (AI) de pe continent, incapacitatea sa de a interpreta și înțelege majoritatea limbilor africane.

Proiectul oferă un set de date vocal vast și deschis care acoperă 21 de limbi africane subsahariene și aduce tehnologia vocală la peste 100 de milioane de oameni excluși din economia AI.

Setul de date WAXAL este produsul unei colaborări de trei ani finanțată de Google și condusă de universități locale și grupuri comunitare.

Include 1.250 de ore de vorbire naturală transcrisă și peste 20 de ore de înregistrări de calitate studio destinate construirii de voci sintetice de înaltă fidelitate. Vizează limbi precum Hausa, Yoruba, Luganda, Igbo și Acholi, multe dintre acestea fiind vorbite de zeci de milioane, dar rămân în mare parte invizibile pentru sistemele comerciale de vorbire.

Google și universitățile africane lansează setul de date WAXAL pentru a antrena AI în 21 de limbi africane, inclusiv Yoruba, Hausa și Igbo

În ciuda tuturor discuțiilor despre AI globală, tehnologiile vocale se înclinează încă puternic către engleză și un număr restrâns de limbi europene și asiatice. Africa, care găzduiește peste 2.000 de limbi, a fost lăsată la margine.

Acea diferență nu este academică; ea determină cine poate folosi serviciile digitale, cine poate accesa instrumentele de educație și sănătate și cine poate construi companii pe platformele moderne de AI. Google a încadrat această lucrare ca pe un pas către reducerea unei lacune de date de lungă durată care a ținut multe limbi africane departe de asistenții vocali și alte instrumente.

De ce contează setul de date WAXAL pentru arhitectura AI a Africii

Dincolo de abordarea directă a acestui dezechilibru, proiectul contează la fel de mult ca datele în sine.

Spre deosebire de inițiativele anterioare în care datele vocale africane erau extrase și deținute în altă parte, WAXAL a fost condus pe teren de instituții africane. Universitatea Makerere din Uganda, Universitatea din Ghana și Digital Umuganda din Rwanda au supravegheat colectarea datelor, implicarea comunității și administrarea limbilor, cu sprijin tehnic de la Google Research Africa.

Crucial, aceste instituții păstrează proprietatea datelor. Aceasta este o schimbare notabilă într-un domeniu adesea criticat pentru reproducerea dinamicii extractive sub steagul deschiderii.

Conform Aisei Walcott-Bryant, șefa Google Research Africa, "Impactul final al WAXAL este împuternicirea oamenilor din Africa. Acest set de date oferă fundația critică pentru studenți, cercetători și antreprenori de a construi tehnologie în propriii lor termeni, în propriile lor limbi, ajungând în final la peste 100 de milioane de oameni."

"Așteptăm cu nerăbdare să vedem inovatorii africani folosind aceste date pentru a crea totul, de la noi instrumente educaționale până la servicii cu comandă vocală care creează oportunități economice tangibile pe tot continentul", a adăugat ea. 

Google și universitățile africane lansează setul de date WAXAL pentru a antrena AI în 21 de limbi africane, inclusiv Yoruba, Hausa și IgboAisha Walcott-Bryant, șefa Google Research Africa

Această abordare este reflectată de universitățile implicate. Joyce Nakatumba-Nabende, conferențiar senior la Universitatea Makerere, a declarat:

"Pentru ca AI să aibă un impact real în Africa, trebuie să vorbească limbile noastre și să înțeleagă contextele noastre. Setul de date WAXAL oferă cercetătorilor noștri datele de înaltă calitate de care au nevoie pentru a construi tehnologii de vorbire care reflectă comunitățile noastre unice. În Uganda, a întărit deja capacitatea noastră de cercetare locală și a susținut noi proiecte conduse de studenți și facultate."

La Universitatea din Ghana, profesorul asociat Isaac Wiafe a subliniat amploarea implicării publice: 

"Pentru noi la Universitatea din Ghana, impactul WAXAL depășește datele în sine. Ne-a împuternicit să construim propriile noastre resurse lingvistice și să pregătim o nouă generație de cercetători AI. Peste 7.000 de voluntari s-au alăturat nouă pentru că își doreau ca vocile și limbile lor să aparțină viitorului digital. Astăzi, acel efort colectiv a declanșat un ecosistem de inovare în domenii precum sănătatea, educația și agricultura. Acest lucru dovedește că atunci când datele există, posibilitățile se extind peste tot."

Există motive pentru un optimism prudent. Seturile de date vocale deschise pot reduce barierele pentru startup-urile locale și cercetătorii care nu au resursele necesare pentru a colecta date la scară largă. De asemenea, pot reduce dependența de API-uri străine care rareori susțin bine limbile africane, dacă o fac deloc.

Google și universitățile africane lansează setul de date WAXAL pentru a antrena AI în 21 de limbi africane, inclusiv Yoruba, Hausa și IgboSetul de date WAXAL

Totuși, seturile de date nu garantează rezultate; construirea de sisteme vocale fiabile necesită investiții susținute, implementare locală și căi comerciale care mențin valoarea în țară. Rolul Google ca finanțator și organizator va invita examinare, în special în jurul modului în care datele WAXAL sunt folosite de companiile globale în viitor.

Deocamdată, lansarea setului de date WAXAL marchează un pas concret către un ecosistem AI mai inclusiv din punct de vedere lingvistic. Nu rezolvă provocările AI ale Africii, dar abordează una fundamentală. Vocea este adesea interfața cea mai naturală cu tehnologia. A ne asigura că AI poate auzi Africa vorbind, în toată diversitatea sa, este de mult timp așteptată.

Postarea Google antrenează AI în 21 de limbi africane, inclusiv Yoruba, Hausa și Igbo a apărut prima dată pe Technext.

Declinarea responsabilității: Articolele publicate pe această platformă provin de pe platforme publice și sunt furnizate doar în scop informativ. Acestea nu reflectă în mod necesar punctele de vedere ale MEXC. Toate drepturile rămân la autorii originali. Dacă consideri că orice conținut încalcă drepturile terților, contactează service@support.mexc.com pentru eliminare. MEXC nu oferă nicio garanție cu privire la acuratețea, exhaustivitatea sau actualitatea conținutului și nu răspunde pentru nicio acțiune întreprinsă pe baza informațiilor furnizate. Conținutul nu constituie consiliere financiară, juridică sau profesională și nici nu trebuie considerat o recomandare sau o aprobare din partea MEXC.