Google Translatotron konuşmaları direkt tercüme edecek!
Google, ilk kez konuşmaları doğrudan bir dilden diğerine çevirebilen "Translatotron" isimli bir çeviri modeli üzerinde çalıştığını duyurdu. Yapay zeka desteğiyle çalışacak Translatotron, kullanıcıların seslerini farklı dillere çevirecek ve sesten sese çeviri yapan ilk çeviri uygulaması olacak.
Başka bir dil konuşmak kolaylaşıyor...
Google, konuşmacının sesini ve ahengini korurken, konuşmayı bir dilden diğerine doğrudan dönüştürebilen, türünün ilk örneği olan bir çeviri modeli üzerinde çalıştığını açıkladı.
Translatotron adlı hizmet bir konuşmacının sesini, metne ve konuşmaya geri çevirme adımları olmadan, uçtan uca doğrudan başka bir dile çevirecek. Bu güne kadar ki çeviri uygulamalarında sesten metine, metinden sese doğru adımlar izleniyor ve hata olasılığı artıyordu. Google, Translatotron ile bu hataları en aza indirmeyi amaçlıyor.
Google Translatotron, ses girişi alan, bunu işleyen ve hedef dilde yeni bir spektrogram üreten bir dizi-sıralı ağ modeli kullanıyor. Sonuçta, çeviri esnasındaki geçiş sırasında bir şeylerin kaybolma ihtimalinin daha az olduğu, çok daha hızlı bir çeviri deneyimi amaçlanıyor.
Translatotron'da konuşmacının sesini korumak için isteğe bağlı çalışan bir kodlayıcı da bulunacak. Bu sayede tercüme edilmiş ses biraz robotik olsa da konuşmacının bazı ses öğelerinin etkili şekilde korunması sağlanacak.
Kullanıcının ses karakteristiğini koruyarak, aynı ses tonuyla farklı dillere çeviriyi mümkün kılacak servis, şirketin dünyada yaygın olarak kullanılan çeviri platformu Google Translate'i farklı bir boyuta taşıyacak.
Yapay zeka desteğiyle çalışan Translatotron'un çeviri kalitesi belli ölçme yöntemleriyle ölçüldü. Sonuçlara göre Translatotron, sesten sese birçok dilde nitelikli ve hızlı çeviri yapabiliyor.
Translatotron'un bir konuşmacının sesini koruma girişimi örneklerini Google Research'ün GitHub sayfasındaki çevirilerde dinlemek mümkün. Ve bu örnekler oldukça iyi, ama bu bir başlangıç.
Çalışmanın konuşmadan konuşmaya çeviri sistemleri üzerine gelecekteki araştırmalar için başlangıç noktası olması bekleniyor.
Translatotron platformunun ne zaman hizmete sunulacağı ise açıklanmadı.
Google, son aylarda mevcut çevirilerinde ince ayar yaparak, bu alandaki çıtayı biraz daha üste taşımıştı. Geçen yıl, Google Translate’te bölge temelli telaffuzlarda çeşitli dilleri konuşabilen ve gerçek zamanlı çeviri özelliğine daha fazla dil ekleyen aksanları sundu. Bu yılın başlarında, Google Asistan akıllı diller ve 26 dil arasında konuşabilen bir "tercüman modu" devreye soktu.