Yapay Zekâ Eğitim Verisi ve Yerel Bilgi: Amazon ve Yeni Gine Örneği
Amazon ve Yeni Gine’deki 12 bin 495 farklı şifalı bitki isminin %75’i yalnızca bir yerel dile özgü. Ve yapay zekâ bunu bilmiyor.
Yapay zekâyı, insanlığın sahip olduğu bütün bilginin yalnızca küçük, çarpık ve internette var olan bir kesitiyle eğitiyoruz. Hangi bilginin ve kültürün dominant olacağını belirleyen sömürgecilik kültürü, folklor ve yerel gelenekleri görünmez kılıyor.
Yapay zekânın eğitim verisinin büyük ölçüde Batı merkezli yazılı kaynaklara dayanması, bu sistemlerin Batılı kaynaklardaki norm ve perspektifleri ‘daha doğru’ olarak öğrenip çoğaltmasına neden oluyor.
AI modelinin eğitildiği verinin çoğu, yerel toplulukların bilgi ve dillerini içermiyor. Bu da yapay zekâ ürünlerinin dünyanın çoğunun bilgi birikimini göz ardı ettiği anlamına geliyor.
Ne yapılabilir?
- Çeşitlilik: Veri setlerimizi genişletirken coğrafi, kültürel ve dilsel çeşitliliği artırmalı; Küresel Güney ve yerel topluluklardan veri dahil etmeliyiz.
- Şffaflık: Büyük teknoloji şirketleri, eğitim verilerinin menşei konusunda daha şeffaf olmalı. Böylece eksiklikler ve önyargılar tespit edilebilir.
- Yerel bilgi: Yerel bilgi ve dilleri belgeleyen çalışmalıarı desteklemeli; kültürel çeşitliliğin korunmasına ve gelişmesine katkı sağlamalıyız.
- Farkındalık ve eğitim: Kullanıcıları, yapay zekâ sistemlerinin sınırlılıkları ve önyargıları konusunda bilinçlendirmeli; sorgulayan ve eleştirîl bir yaklaşımı teşvik etmeliyiz.
- Kapsayıcı geliştirme: Yapay zekâ geliştiricileri, veri mühendisleri ve politika yapıcıları, eğitim süreçlerine farklı kültürlerden uzmanları dahil etmeli; kapsayıcı ve adil sistemler tasarlamalıdır.
Türkiye’nin yerel üretken yapay zekâ hedeflerine ulaşabilmesi için veri setlerinde yerli dilleri ve kültürleri de kapsayan çalışmalar yürütmesi gerekiyor.