OpenAI’nin Yeni Ses Üretim Modelleri

Dünya genelinde yapay zeka alanında öncü bir isim olan OpenAI, yeni nesil ses üretim modellerini API’sine entegre etti. Şirket, bu modellerin önceki sürümlerine göre daha gelişmiş olduğunu iddia ediyor. OpenAI Ürün Müdürü Olivier Godement, “Önümüzdeki aylarda daha fazla temsilcinin ortaya çıktığını göreceğiz. Bu nedenle genel tema, müşterilerin ve geliştiricilerin yararlı, kullanılabilir ve doğru yapay zeka sohbet botlarından yararlanmalarına yardımcı olmak” şeklinde açıklama yaptı.
OpenAI, metinden sese yeni modeli “gpt-4o-mini-tts”‘nin yalnızca daha ayrıntılı ve gerçekçi sesli konuşma sağlamakla kalmayıp, aynı zamanda önceki nesil konuşma sentezleme modellerine kıyasla daha fazla yönlendirilebilirlik sunduğunu belirtiyor. Bu yenilikler, kullanıcıların deneyimlerini daha da zenginleştiriyor.
Geliştirilen yapay zeka sohbet botları, kullanıcıların isteğine bağlı olarak farklı ses tonları ve karakterlerde yanıt verebiliyor. Örneğin, çılgın bir bilim adamı veya sakin bir öğretmen sesiyle iletişim kurma imkanı sunulmakta. OpenAI’daki ürün ekibinden Jeff Harris, amaçlarının, müşterilerin ve kullanıcıların hem ses deneyimini iyileştirmek hem de ürünlerini kişiselleştirmelerine olanak tanımak olduğunu vurguladı.
- Yeni ses modeli: gpt-4o-mini-tts
- Önceki nesil modellerden daha yönlendirilebilir
- Kullanıcı isteğine bağlı ses tonları ve karakterler
- Ses deneyimi iyileştirme ve kişiselleştirme imkanı



