Yapay zekayla çalışan algoritmalar hızla yükseliyor. Metinleri görsele dönüştüren DALL-E ve sorulara hızlı bir şekilde yüksek doğruluk payıyla cevap veren ChatGPT tüm dünyada büyük yankı uyandırdı. Özellikle ChatGPT, piyasaya sürüldüğü Aralık ayından bu yana çok kısa bir sürede milyonlarca kullanıcıya ulaştı. 

Üç saniyede insan sesini taklit edebiliyor
Metinden ses oluşturabilen yapay zeka modeli ‘VALL-E’ Microsoft tarafından tanıtıldı. Bu yapay zeka algoritmasının sadece üç saniyede insan sesini taklit edebildiği belirtiliyor. Üstelik yapay zeka modelinin konuşan kişinin duygusunu tespit ederek benzer bir ses tonunu ortaya çıkardığı ifade edildi.

Detaylıca eğitildi

Microsoft, VALL-E’nin ortaya koyduğu bazı örnekleri GitHub aracılığıyla yayımladı. Örneklerde yapay zekanın zaman zaman robot sesiyle konuştuğu ancak genellikle insan sesini birebir taklit ettiği ortaya çıktı. Bir makalede araştırmacılar, başarının sırrını söyledi. Buna göre, VALL-E modeli, 7 binden fazla konuşmacıdan 60 bin saatlik İngilizce dilindeki ses kayıtları ile eğitildi. 

Gelişmeler ürkütüyor

Ars Technica’nın aktardığı bilgilere göre, VALL-E beraberinde bir takım endişeleri de gündeme getirdi. Yapay zekanın bu hızlı gelişimi kimi insanlar için oldukça ürkütücü. Çünkü kötü niyetli kişiler bir başkasının kimliğine bürünerek taklit edebilir ve dolandırıcılık faaliyetlerini bu tür sistemler aracılığıyla yürütebilir.  

 

 

(Microsoft)