ChatGPT'nin geliştiricisi OpenAI, 15 Saniyelik Kayıttan Ses Klonlayabilen Yeni Teknolojisini Duyurdu
ChatGPT'nin geliştiricisi OpenAI, 'Voice Engine' adını verdiği yeni teknolojisinin 15 saniyelik tek ses örneği kullanarak orijinal konuşmacıya çok benzeyen bir konuşma üretebildiğini duyurdu.
OpenAI, şirketi yeni ses klonlama teknolojisi olan "Voice Engine" hakkında bilgi verdi. Bu teknoloji, sadece yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine oldukça benzeyen bir konuşma üretebiliyor. Açıklamada, bu teknolojinin 2022 yılında geliştirildiği belirtilirken, "kötüye kullanım potansiyeli" nedeniyle daha geniş bir sürüm için temkinli ve bilinçli bir yaklaşım benimsendiği vurgulandı.
"İnsanların seslerine benzeyen konuşmalar üretmenin özellikle de seçim yılında ciddi riskler taşıdığının farkındayız." denilen açıklamada, bu kapsamda ABD'nin de dahil olduğu çok sayıda uluslararası ortakla birlikte çalışılarak geri bildirim toplandığı belirtildi.
Anadolu Ajansı'nın haberine göre; Güvenlik endişelerine ilişkin, Voice Engine'in test aşamasındaki kullanıcı partnerlerine, kişi veya kuruluşların kimliğini kullanmanın yasaklandığı, orijinal konuşmacının rızasının gerektiği ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı açıklandı.
Çeviri De Yapabilecek
Açıklamada ayrıca, Voice Engine'in orijinal konuşmacının sesini koruyarak çeviri yapabileceği de kaydedildi.
Video ve podcast gibi içerik üreticilerinin bu özellikten faydalanarak "kendi sesleriyle" dünyaya ulaşabileceği, çevrilen seste orijinal konuşmacının "aksanını" da koruyabileceği bilgisi paylaşıldı.
Kaynak: