- Gelişmiş ses modu ChatGPT Metinle aynı sohbet penceresine entegre olur.
- Kullanıcılar tek bir arayüzde konuşabilir, gerçek zamanlı transkriptleri görüntüleyebilir ve resim, harita veya diğer görselleri alabilir.
- Klasik sanal asistan tarzı yalnızca sesli deneyimi korumak için "Ayrı Mod"u etkinleştirme seçeneği aynı kalıyor.
- Güncelleme web'de ve şu anda yayınlanıyor: uygulamalar cepleri iOS ve Android'de tüm kullanıcılara yönelik, ücretli hesaplar için ekstra özelliklerle.

Asistan OpenAI Bu, çevremizle ilişki kurma biçimimizde önemli bir adımdır. yapay zeka. Bundan sonra, ChatGPT'nin ses modu ayrı bir ekran olmaktan çıkıyor ve artık doğrudan metin sohbetiyle bir arada bulunuyor, günlük kullanımı kolaylaştırıyor ve gereksiz birçok pencere geçişini ortadan kaldırıyor.
Bu güncellemeyle herkes ChatGPT ile konuşun, görün konuşmanın dökümü ve haritalar, resimler veya diğer görsel içerikleri alın Aynı sohbet dizisinden ayrılmadan. Buradaki fikir, deneyimi doğal bir sohbete yaklaştırmak; ses ve ekranın ayrı olmak yerine birlikte çalışmasını sağlamaktır.
Sohbet içindeki sesli mod: Tam olarak neler değişiyor?
Şimdiye kadar ChatGPT'de ses kullanmak isteyenler, özel bir ses arayüzüne atlaKlasik mavi küre veya alışılmış sohbetten farklı bir tam ekran modu hakimdi. Bu durum, özellikle kullanıcı konuşurken önceki mesajları incelemek veya görsel bilgilere başvurmak istediğinde biraz sorun yaratıyordu.
Yeni versiyonla birlikte, Gelişmiş ses modu doğrudan yazma çubuğundan etkinleştirilir.Metin kutusunun sağındaki ses dalgası simgesine dokunarak. Ortamda ani bir değişiklik olmaz: aynı konuşma dizisi ve tüm geçmiş görünür kalır.
Bu simgeye basıldığı anda ChatGPT dinlemeye başlar ve Ekranda konuşulanların canlı dökümünü gösterir.Hem kullanıcı hem de asistan için. Sonuç, sohbette görünenler üzerindeki kontrolünüzü kaybetmeden konuşmayı sesli olarak takip edebileceğiniz hibrit bir deneyim.
Entegrasyon aynı zamanda asistanın diyalog sırasında etkileşimde bulunmasına da olanak tanıyor. Gerçek zamanlı görseller ekleyin Haritalar, ilgili görseller, web sayfası parçacıkları veya diğer kaynaklar gibi. Tüm bunlar, ses modundan çıkmanıza veya ek pencereler açmanıza gerek kalmadan aynı konu başlığı altında gömülü olarak sunulur.
Pratik bir ayrıntı şudur ki Yazma ve konuşma arasında sürekli geçiş yapabilirsinizSesli mod aktif olsa bile, kullanıcı sorgunun bir kısmını yazmayı tercih ederse sistem bunu kabul edip sesli olarak yanıt veriyor ve böylece konuşmanın sürekliliği sağlanıyor.

Daha doğal ve daha hızlı bir deneyim: gecikme, duygular ve GPT-5.1
Ses ve metin entegrasyonu kendi kendine gerçekleşmez. OpenAI, Sesli etkileşimi daha akıcı hale getirmek için teknik ayarlamalar yapıldıİki kişi arasındaki bir konuşmanın hızına yakın yanıt süreleriyle. Şirket, 200 milisaniye civarında yanıtlar bildiriyor ve bu da bekleme hissini önemli ölçüde azaltıyor.
Aynı zamanda asistan şunları da içerir: seslerin tonlamasında ve ifade gücünde iyileştirmelerAmaç, bunları daha az robotik ve daha günlük bir sohbet gibi duyurmaktır. Amaç, kullanıcının daha kişisel bir ton algılamasını sağlamak, ince nüansları ve duyguları aktarırken aynı zamanda otomatik bir araç olarak kalmasını sağlamaktır.
Teknik düzeyde, bu yeni özellikler entegrasyona dayanmaktadır GPT-5.1 gibi daha yeni modellerperdenin, hızın ve vuruş şeklinin daha hassas bir şekilde ayarlanmasına olanak tanır IA Ses yoluyla yanıt verir. Bu gelişmeler asistanı bir insan muhataba dönüştürmese de, sentetik seslerle tipik olarak ilişkilendirilen mesafenin bir kısmını azaltır.
Bu yaklaşım, endüstrinin şu yöndeki eğilimine uygundur: daha zengin çok modlu etkileşimlermetin, ses ve görsellerin tek bir akışta birleştirildiği bir çözümdür. Rakip çözümlerle karşılaştırıldığında, İkizler burcu Canlı yayın GoogleOpenAI'nin yaklaşımı, kullanıcıları bir bağlamdan diğerine atlamaya zorlamak yerine, her şeyi aynı arayüzde entegre etmektir.
Son kullanıcı için pratik sonuç şudur: eller serbest görüşme yapılabilir çok daha sürekliAynı zamanda konsültasyonun gerektirdiği durumlarda harita üzerinde yön bulma, grafik inceleme veya ekranda diyagram izleme gibi görsel desteklerden de yararlanılabiliyor.

Nasıl etkinleştirilir, hangi cihazlarda etkinleştirilir ve ücretsiz ve ücretli kullanıcılar arasındaki farklar
Yeni ses deneyimi hem web hem de mobil uygulamalarda kademeli olarak kullanıma sunulacak iOS için ChatGPT'den ve AndroidÇoğu durumda, uygulamayı ilgili mağazadan güncellemek veya web sürümünü yenilemek değişikliği kullanılabilir hale getirecektir.
Son sürüm yüklendikten sonra erişim basittir: Metin kutusunun yanındaki ses dalgası simgesine dokunmanız yeterli Sohbetten itibaren uygulama kullanıcıyı dinler ve ekran değiştirmeden, konuşmanın transkriptini ve yanıtlarını pencerede görüntüler.
Servisin ücretsiz versiyonunu kullananlar için çevrimiçi ses modu mevcut. Hiçbir ek ücret ödemeden mevcuttur, ancak sınırlamalar vardır El tiempo kullanım Ücretli bir aboneliğiniz yoksa. Ancak ChatGPT Plus, Pro veya Teams gibi planlar daha fazla sohbet dakikası ve daha ayrıntılı seslere sahip gelişmiş bir ses modu ve geliştirilmiş ses yetenekleri.
Aslında varlar iki farklı ses deneyimi: Herhangi bir kullanıcının erişebileceği, daha geleneksel tanıma ve sentez teknolojilerine dayanan standart bir model ve daha güçlü modellerin yeteneklerinden yararlanarak daha etkileyici yanıtlar ve gerçek zamanlı olarak daha cilalı bir etkileşim sunan gelişmiş bir model.
İspanya ve Avrupa'nın geri kalanında güncelleme diğer pazarlardakiyle aynı kalıbı izliyor: Mobil cihazlarda ve web'de kademeli olarak etkinleştiriliyorBu nedenle, tüm kullanıcılar aynı gün içinde bu güncellemeyi alamıyor. Yine de OpenAI, güncellemenin bölgesel kısıtlamalar olmaksızın, ücretsiz ve ücretli planlar arasındaki farkın ötesinde tüm hesaplara ulaşacak şekilde tasarlandığını belirtiyor.

Daha fazla kullanıcı kontrolü: "Ayrı mod" ve ses ayarları
Metin ve ses entegrasyonu varsayılan yaklaşımdır, ancak OpenAI, klasik yalnızca sesli deneyimi ortadan kaldırmadıSohbeti veya yazıyı görmeden daha sürükleyici bir etkileşimi tercih edenler için hâlâ "Ayrı Mod" adı verilen seçeneği kullanma seçeneği mevcut.
Bu mod şuradan etkinleştirilebilir: ChatGPT ayarları menüsü, Ses Modu bölümündeUygulama etkinleştirildiğinde, kullanıcıyı geleneksel bir dijital asistanla konuşmaya benzer şekilde yalnızca sesli görüşmeye ayrılmış bir ortama sokan önceki tasarıma geri dönüyor.
Entegre arayüz ile ayrı mod arasında geçiş yapma Aktivasyon sayısında herhangi bir sınırlama yoktur.Kullanıcı birini deneyebilir, diğerine dönebilir ve ayarları istediği kadar düzenleyebilir. Bu esneklik, hem sohbet geçmişinin her zaman görünür olmasını önemseyenlere hem de temiz, ses odaklı bir ekrandan memnun olanlara hitap etmeyi amaçlamaktadır.
Arayüz türünü seçmenin yanı sıra ayarlara erişmek de mümkündür sesin bazı yönlerini özelleştirinÖrneğin, farklı mevcut sesler arasında seçim yapmak gibi. Gelişmiş modda, bu sesler daha doğal ve biraz daha zengin bir tonlamayla duyulacak şekilde tasarlanmıştır, ancak yine de yardımcı araç işlevlerini korurlar.
Şirketin her iki seçeneği de koruması, belli bir ölçüde dikkatli olunduğunu gösteriyor: Tüm kullanıcılar tasarım değişikliklerini hemen kabul etmiyorTek bir arayüze geçiş, önceki akışa alışmış olanlar arasında direnç yaratabilir. Bu nedenle güncelleme, eski alışkanlıklara kapıyı kapatmadan yeni özellikler sunuyor.
Avrupa'da üretkenlik, yeni kurulan şirketler ve kullanım örnekleri üzerindeki etkisi
Ses ve metni tek bir pencerede birleştirmek, yalnızca ev kullanıcıları için rahatlığı artırmakla kalmıyor; aynı zamanda Otomasyonla çalışan yeni başlayanlar ve ekipler için yeni olanaklarDikte, sözlü yanıtlar ve görsel içeriklerin tek bir arayüzde birleştirilebilmesi, asistanların ve konuşma araçlarının oluşturulmasını kolaylaştırır.
Avrupa bağlamında bu entegrasyon özellikle şu durumlarda faydalı olabilir: hibrit ve uzaktan çalışma ortamlarıEkranda belgeleri, haritaları veya gösterge panellerini incelerken hızlı sesli sorgulama yapma olanağının giderek daha fazla değer kazandığı bir dönemdeyiz. Müşteri hizmetleri, çevrimiçi eğitim veya teknik destek gibi sektörler bu çok modlu yaklaşımdan faydalanabilir.
Kurucular ve teknik ekipler için erişim sağlamak Metin ve ses için tek bir ortam, kavram kanıtını kolaylaştırır ve ayrı arayüzler tasarlamaya gerek kalmadan ses girişini entegre eden ürünlerin geliştirilmesi. Kodsuz araçlarla bile, aynı iş akışında dikte, sözlü yanıtlar ve görsel öğeleri birleştiren asistanlarla denemeler yapmak daha kolaydır.
Ayrıca, web sürümü ve mobil uygulamalardan erişilebilen bir ses modunun varlığı erişilebilirlik engellerini azaltır Klavyede yazmayı tercih etmeyen veya görme güçlüğü çeken kişiler için, ihtiyaç duyduklarında görsel bilgi vermeden cevapları duyabilme.
Bu hamle, hem İspanya'da hem de kıtanın geri kalanında bir yapay zeka endüstrisine uyuyor. kullanım ve yatırımda bir genişleme anı yaşanıyorOpenAI'nin de aralarında bulunduğu büyük platformlar, kullanılabilirlikteki küçük iyileştirmelerin kitlesel benimsemede büyük fark yaratabileceğinin bilincinde olarak, daha eksiksiz ve benimsenmesi daha kolay deneyimler sunmak için rekabet ediyor.
Bu değişiklikle ChatGPT, bir adım daha ileri gidiyor Konuşma, okuma ve içerik görüntülemenin aynı yerde gerçekleştiği gerçek anlamda çok modlu bir etkileşimEntegre arayüz veya ayrı mod arasında seçim yapma olanağı, seslerin hızında ve doğallığında yapılan iyileştirmelerle bir araya gelerek asistanı, hem bireysel kullanıcılar hem de iş akışlarına ek komplikasyonlar olmadan ses eklemek isteyen kuruluşlar için günlük kullanımda daha konforlu bir konuma getiriyor.
Genel olarak bayt ve teknoloji dünyası hakkında tutkulu bir yazar. Bilgilerimi yazarak paylaşmayı seviyorum ve bu blogda da bunu yapacağım; size gadget'lar, yazılım, donanım, teknolojik trendler ve daha fazlasıyla ilgili en ilginç şeyleri göstereceğim. Amacım dijital dünyada basit ve eğlenceli bir şekilde gezinmenize yardımcı olmaktır.