- Opus 4.5 önde gidiyor programación ve acenteler, SWE-Bench'te %80,9 ile rakiplerinden daha iyi.
- Yeni çaba parametresi ve fiyat milyon token başına 5/25 USD'ye düştü.
- Chrome, Excel ve Claude Code'da güncellemeler, güçlendirilmiş güvenlik ve bellek.
- Sıkı kullanım sınırlamaları ve %10 bulut primi ile bölgesel uç noktalar.
Claude Opus 4.5 İşte burada ve net bir hedefle geliyor: programlama, akıllı ajanlar ve ofis görevlerinde zirveye yerleşmek. Anthropic'in önerisi görkemli başlıklarla sınırlı değil; kağıt üzerinde, nasıl kullandığımızı yeniden tanımlayabilecek rakamlar, karşılaştırmalar ve ürün değişiklikleriyle birlikte geliyor. IA gerçek işte.
Sektördeki diğer devlerle doğrudan rekabetin ötesinde, Güncelleme, token verimliliğinde ve çaba kontrolünde bir sıçrama içeriyorGüvenlik, araç kullanımı, bellek ve çok sayıda yeni uygulama entegrasyonundaki iyileştirmelerin yanı sıra, bu yalnızca daha hızlı bir model değil: uzun, çoklu aracılı ve daha az sürtünmeli çalışma döngüleri için tasarlanmış bir platform.
Opus 4.5 nedir ve neden bu kadar büyük bir karışıklığa yol açtı?
Bu hamle, rakiplerin hamlelerinden sadece birkaç gün sonra geldi ve yankı uyandıran bir konumlandırmaya sahip: Anthropic bunu en yetenekli modeli olarak sunuyor ve Her görev için daha iyi yapay zeka programlama, aracı yönetimi ve bilgisayar kullanımındaŞirket ayrıca derinlemesine araştırma, belge oluşturma ve görsel ve matematiksel akıl yürütme konusundaki değerini de vurguluyor.
Teori alanında kalmaktan kaçınmak için firma, modelin Diğer ölçütleri de geride bırakıyor: İkizler burcu 3 Pro ve GPT-5.1 Codex-Max Yazılım mühendisliği testlerinde. Pratikte ise fikir açıktır: daha az adım, daha fazla hassasiyet ve karmaşık iş akışlarında araçlarla daha iyi koordinasyon.

Ölçülen performans: kıyaslamalar ve gerçek dünya testleri
Yazılım mühendisliği için kıyaslama ölçütü olan SWE-Bench Verified'da, Opus 4.5 %80,9 doğruluk oranına ulaşıyorHem öncüllerini hem de üst düzey rakiplerini geride bırakıyor. Bu veri, yalnızca oyun alıştırmalarını değil, GitHub projelerinde gerçek dünya sorunlarını çözme becerisini ölçtüğü için önemli.
Anthropic daha da ileri giderek mühendisler için gerçek işe alım testiŞirkete göre, iki saat süren ve zorluk derecesine göre derecelendirilen testte, modelin sadece egzersizleri çözmekle kalmayıp aynı zamanda... Tüm insan adaylarını yendi Aynı sınava girenler, hipotezlerin paralel hesaplanması gibi stratejilere güvenerek.
Günlük ofis işlerinde de sıçrama göze çarpıyor: elektronik tablolarda daha iyi sonuçlarFinansal modellerde doğrulukta %20 ve verimlilikte %15 artış bildirilmesinin yanı sıra, organize etme yeteneği de veritabanlarıKonuyu dağıtmadan sunumlar hazırlayın ve uzun raporlar yazın.
Tüm bunlar, dahili testlerde 200.000'e kadar jetonun uzun vadeli bağlamı ve güçlendirilmiş çalışma belleği yönetimi tarafından desteklenmektedir. Uzun konuşmalar otomatik özetlerden faydalanır pencere sınırlarına takılmadan tutarlılığı sağlamak.
Verimlilik, maliyet ve yeni çaba parametresi
Farklılaştırıcı faktörlerden biri de fiyattır: API fiyatı, milyon giriş ve çıkış token'ı başına 15 ve 75 dolardan 5 ve 25 dolara düştü.Bu, daha önce günlük kullanım için çok pahalı olan otomasyonların önünü açıyor.
Tasarrufu en üst düzeye çıkarmak için temel teknik unsur, düşük, orta ve yüksek seviyelerde olmak üzere çaba parametresidir. Orta çaba seviyesinde, Opus 4.5, %76 daha az çıktı belirteci kullanılarak SWE-Bench Doğrulamasında Sonnet 4.5'in performansıyla eşleşiyorBüyük bir çabayla, Sonnet 4.5'i 4,3 puan geride bırakıyor ve yine de %48 daha az token harcıyorBuradaki yenilik sadece kontrol değil, aynı zamanda modeli değiştirmeden muhakemenin derinliğini değiştirebilme yeteneğidir.
Bu ayarlama tüm yanıtı etkiler: metin, araç çağrıları ve genişletilmiş düşünmeAz çabayla daha öz ve etkili cevaplar elde edersiniz; çok çabayla karmaşık senaryolar için detaylı analizler ve kapsamlı açıklamalar elde edersiniz.
Faturalandırma aynı zamanda pratik nüansları da ortaya koyar: Anthropic, isteklere birkaç jeton ekleyen otomatik optimizasyonları tanırAncak sistem tarafından eklenen bu token'ların ücretlendirilmediğini belirtiyor. Küçük detaylar, evet, ancak ölçeklendirme sırasında önemliler.
Koddan daha fazlası: ajanlar, ofis otomasyonu ve bilgisayar kullanımı
Opus 4.5 programlamada yüksek hedeflere sahip, ancak Gelişimleri bununla sınırlı değilModel, profesyonel belgeler, elektronik tablolar ve sunumlar oluşturmada ve birden fazla kaynak içeren araştırma görevlerinde, ilgili bağlamı kaybetmeden uzun konuları yönetmede mükemmeldir.
Ajan yeteneklerinde koordinasyon bir üst seviyeye çıkıyor: Alt acente ekiplerinin etkili yönetimi Uzun iş akışlarında saatlerce işleri bölebilen, önceliklendirebilen ve istikrarlı bir şekilde ilerleyebilen karmaşık çoklu ajan sistemleri için.
Bilgisayar kullanımı cephesinde, güncelleme şunları içeriyor: Ekrandaki bölgelerin ayrıntılı incelenmesi için yakınlaştırma eylemi Tam çözünürlükte. Bu, küçük yazıları okumak, yoğun bilgi içeren arayüzleri analiz etmek veya harekete geçmeden önce ayrıntıları doğrulamak için kullanışlıdır.
Akıl yürütme, araçlar ve belleğin birleşimi Opus 4.5'in şunları yapmasına olanak tanır: Görevler arasında göç ve kod yeniden düzenleme, rapor oluşturma ve masaüstü otomasyonu yer alıyor. daha az tur ve daha az jeton israfı ile.
Güvenlik ve sağlamlık: hizalama ve hızlı enjeksiyon
Özerklik, kontrol ve güvenilirlikBurada Anthropic, bunun kendi iddiası olduğunu iddia ediyor daha sağlam bir şekilde hizalanmış model Sistem davranışını saptırmaya çalışan talimat enjeksiyon saldırılarına karşı bugüne kadar somut ilerleme kaydedildi.
Bu da küçük bir ayrıntı değil: Araçlara erişimi olan ajanların konuşlandırılması ek savunmalar gerektirir.Şirket, kullanılabilirlikten ödün vermeden bariyerleri güçlendirdiğini savunuyor. Bununla birlikte, hassas senaryolarda iyi tasarım uygulamaları ve insan gözetimi öneriyor.
Ekosistem ve uygulamalar: Claude Code, Chrome ve Excel'deki yenilikler
Güncelleme sadece modelle sınırlı kalmıyor. Ürün yığınını da kapsıyor. Claude Code planlama modunu iyileştiriyorBaşlamadan önce açıklayıcı sorular sorun ve inceleme ve kontrolü kolaylaştırmak için planla birlikte düzenlenebilir bir dosya oluşturun.
Tarayıcıda, Chrome için Claude, Max kullanıcıları için yayınlandıGörevleri birden fazla sekmede yönetme ve daha uzun çalışma oturumlarında eylemleri koordine etme vaadiyle. Elektronik tablolarla çalışanlar için, Claude for Excel, Max, Team ve Enterprise'a geliyorGrafikler, pivot tablolar ve dosya yüklemeleri için destek ile.
Uygulamada en pratik yeni özelliklerden biri de şu: Uzun konuşmalar artık sıkışmıyorSistem, oturumları uzatmak için gerektiğinde önceki bağlamı otomatik olarak özetler, böylece kararların tutarlılığı ve izlenebilirliği sağlanır.
Tüm bunlar, Opus 4.5'in piyasaya sürülmesiyle birlikte geliyor API ve ana bulut platformlarındaBu, özel dağıtımları beklemeden mevcut boru hatlarına entegrasyonu kolaylaştırır.
Farklı ihtiyaçlara yönelik üç 4.5 modeli: Opus, Sonnet ve Haiku
4.5 ailesi üç profile ayrılmıştır. Opus 4.5 en üst düzey zekadır Üst düzey uzmanlık gerektiren görevler için pratik performans, profesyonel mühendislik ve gelişmiş ajanlar sunar. Efor parametresini kabul eden tek çözümdür.
Sonnet 4.5 Kodlama ve karmaşık aracılar için temel araçtır. Sistem planlama ve tasarımı, güvenlik mühendisliği gibi tüm geliştirme yaşam döngüsünde iyileştirmeler sağlar. daha doğru talimatların ardından ve gerçeklere dayalı ilerleme güncellemeleri ile özlü ve doğal bir iletişim tarzı.
Ajan yeteneklerinde Sonnet 4.5, odaklanmayı koruyarak saatlerce otonom olarak çalışır. bağlamın ve belirteç bütçesinin farkında olarak Gerçek zamanlı olarak. Paralel araç çağrılarını kullanır, birden fazla kaynağı daha iyi koordine eder ve uzun oturumlar arasında durumu korur.
Haiku 4.5 Hız ve maliyete odaklanıyor, Sonnet 4'ün iki katından fazla hıza sahip ve fiyatının üçte biri fiyatına neredeyse sınır ötesi bir performans sunuyor. İlk kez düşünce Haiku çizgisine kadar uzandı, isteğe bağlı düşünce özeti ile, araç çağrıları ve düşünce belirteci bütçe kontrolü arasında serpiştirilmiş.
Bununla birlikte, Antropik kataloğuna dengeyi geri kazandırıyorSon aylarda Opus 4.1'i gölgede bırakan Sonnet 4.5, artık maliyet, hız ve kapasite açısından her iki modelin yerini geri alıyor.
Araçları ve yeni API'leri kullanma: Günlük olarak neler değişiyor?
Çoklu araç iş akışları için Anthropic şunları sunar: programatik araç çağrılarıModel, yürütme kabı içindeki araçları çağıran, gidiş-dönüş gecikmesini azaltan ve verileri bağlam penceresine yüklemeden önce filtreleyen kod yazabilir.
Yüzlerce aletiniz varsa, yeni araç arama Yalnızca ihtiyaç duyulanları keşfetmenize ve dinamik olarak yüklemenize olanak tanır. İki çeşidi vardır: Araçla düzenli ifade kalıpları kullanmak tool_search_tool_regex_20251119ve doğal dil sorguları aracılığıyla tool_search_tool_bm25_20251119, tüm kataloğu yüklemeyerek 10.000 ila 20.000 bağlam belirtecinin tasarruf edilmesini sağlar.
Çağrıların doğruluğunu artırmak için katkıda bulunabilirsiniz araç kullanımına dair örnekler modeli karmaşık şemalar boyunca yönlendirecek geçerli girdilerle; ve bağlam konusunda endişeleriniz varsa, bağlam düzenleme Token limiti yaklaştığında eski çağrıları ve sonuçları otomatik olarak temizler.
Uygulama kontrolünde 4.5 modelleri durdurmaya yönelik yeni sebepler içeriyor: model_context_window_exceeded bağlam penceresine ulaşıldığını belirtmek için, onu en üstten farklılaştırır max_tokensve nedeni refusal Bu güncelleme, sistemin güvenlik nedeniyle içerik oluşturmayı reddetmesi durumunda ortaya çıkan sorunları ele alır. Ayrıca, araçlara parametre aktarılırken satır sonlarını koruyan bir hatayı da düzeltir.
Genişletilmiş düşünme, bir iç sürecin özeti Mesajlaşma API'sinde ve iletim sırasında, küçük gecikmelerle parçalı teslimatlar halinde gelebilir; kritik bir şey değil, ancak UX için akılda tutmaya değer akış.
Geliştirme araçları: metin düzenleyici ve kod yürütme
Claude'un metin düzenleyicisini kullanıyorsanız, yeni bir sürüm var: araç türü text_editor_20250728 isimle str_replace_based_edit_toolve komut undo_edit Artık desteklenmiyor. Sonnet 3.7'den geçiş yapıyorsanız dikkat edin.
Kod yürütme için aşağıdakiler önerilir: versiyon code_execution_20250825, bu da ekliyor komutlar Bash ve dosya manipülasyonu. Eski sürüm code_execution_20250522 Hala mevcut, ancak yalnızca Python Yeni uygulamalarda önerilmez.
Bu değişiklikler, desteğin yanı sıra, araçların serpiştirilmiş kullanımı ve genişletilmiş düşünmeModelin akıl yürüttüğü, araçlara danıştığı ve yapay sıçramalar yapmadan konuşmayı sürdürdüğü daha doğal akışlara doğru yönelirler.
Fiyatlandırma, uç noktalar ve bulut kullanılabilirliği
Giriş yapan her bir milyon token için fiyat 5 dolara, çıkış yapan her bir milyon token için ise 25 dolara düştüğünde, 4.5 modelleri rekabetçi fiyatları koruyorAyrıca uç noktaların bulut sağlayıcıları üzerinden tüketilmesi durumunda da yeni bir özellik bulunuyor.
AWS Bedrock ve Google Vertex AI, küresel ve bölgesel uç noktalar sunar Opus 4.5, Sonnet 4.5 ve Haiku 4.5 için bölgesel servisler, %10 fiyat farkıyla coğrafi yönlendirmeyi garanti eder. Anthropic'in tescilli API'si varsayılan olarak küreseldir ve bu değişiklikten etkilenmez.
Opus 4.5 şu şekilde mevcuttur: Anthropic'in uygulamaları, API'si ve ana platformlarıAmazon Bedrock gibi entegrasyonlar da dahil olmak üzere. Bu, El tiempo iş ortamlarında uygulamaya yöneliktir.
Sınırlamalar ve küçük yazılar: Bilmeniz gerekenler
Şu an için Aşil tendonu şu: kullanım limitleri ve kotalarıPro ve Max planlarında bile token'lar hızla tükeniyor ve sayaç ilk mesajdan itibaren her beş saatte bir sıfırlanıyor. Opus en güçlü plan olduğu için token'ları daha hızlı tüketiyor ve bu da ayda 20 hatta 100 dolar ödeyen kullanıcılar için hayal kırıklığına yol açıyor.
Antropik, ulaşılabilirliği önceliklendirir. Amerika Birleşik Devletleri ve Batı AvrupaLatin Amerika veya Asya-Pasifik'te faaliyet gösteriyorsanız, gecikme artabilir ve yerel dil desteği daha sınırlı olabilir. Kritik dağıtımlara başlamadan önce gerçek zamanlı gecikmeyi ölçmeniz önerilir.
Bir diğer nokta ise bağlantı ve bulut hizmetlerine bağımlılıkExcel ve Chrome gibi entegrasyonlar bulut hizmetlerine dayanır. Şirket içi dağıtımlar gerektiren düzenlemeye tabi sektörler için, özel dağıtımların müzakere edilmesi veya belirli senaryolarda açık modellerin değerlendirilmesi gerekecektir.
Son olarak, Opus 4.5'ten en iyi şekilde yararlanmak için; Hızlı mühendislik, bağlam yönetimi ve hata ayıklama konusunda eğitimİyi uygulamalar olmadan kapasite israf edilir ve sembolik harcamalar artar; şirket içi eğitime yatırım yapmakta fayda var.
Strateji ve karşılaştırma: OpenAI ve Google'a kıyasla nerede yer alıyor?
Opus 4.5 ile Anthropic kendini şu şekilde konumlandırıyor: profesyoneller ve geliştiriciler için birinci sınıf sağlayıcıHassasiyet ve güvenilirliğin en önemli olduğu uygulamalarda başa baş rekabet, alıcıya fayda sağlayan bir fiyat ve yetenek savaşını başlattı ve performans, maliyet ve efor kontrolünün birleşimi güçlü bir cazibe oluşturuyor.
Rakipleriyle karşılaştırıldığında Opus 4.5 şu konularda öne çıkıyor: otonom araçlar ve aracılarla iş akışlarıÇoklu modalitede veya saf akıl yürütmede, bazı rakip modellerle aradaki fark daha küçüktür, ancak 4.5 ekosisteminin işlev kümesi, kalıcılık ve koordinasyon gerektiren üretim senaryolarında ölçekleri değiştirir.
Ne zaman göç etmeli ve şirket içinde nasıl değerlendirilmeli?
Claude 3.5 veya Opus 4.1'den geliyorsanız, geçişi yapmayı düşünün karmaşık akıl yürütmeye, yüksek token hacmine veya aracı yeteneğine ihtiyacınız var Araçlara erişim ile. Aylık 10 milyondan fazla token ile tasarruf, yeniden yapılandırma çabasını telafi etti.
Kopuş kaymaları olan ve olmayan antropik belge göç yolları: Sonnet 3.7'den Sonnet 4.5'e, Haiku 3.5'ten Haiku 4.5'e (daha fazla değişiklik) ve Opus 4.1'den Sonnet 4.5 veya Opus 4.5'e sorunsuz yükseltmeler. Üretim ortamlarını taşımadan önce kontrol listelerini gözden geçirmeniz önerilir.
Karar vermek için kendinize yeterli hacimde tekrarlayan süreçleriniz olup olmadığını sorun, veriler ve doğrulama kriterleri üzerinde kontrolVe tasarruf edilen saatleri, hataları ve yanıt sürelerini ölçen net KPI'lar. Metrikler olmadan, her pilot geride kalır.
Güvenli benimseme için pratik kontrol listesi: gizlilik politikaları ve DPA, sınırlı kavram kanıtı (örneğin, destek biletleri veya toplantı özetleri), iki önemli kişinin şirket içi eğitimi, uyarılarla maliyet izleme ve hizmetin değişmesi veya başarısız olması durumunda bir acil durum planı.
Geliştiriciler için: Cursor ve Claude Code'da Opus 4.5 kullanın
Opus 4.5'in günlük geliştirmedeki avantajlarından yararlanmak için, Bir Anthropic hesabı oluşturun ve bir API anahtarı oluşturunPlanınıza (Max, Team veya Enterprise) göre modele erişimi etkinleştirin ve aşağıdakiler dahil olmak üzere her zamanki araçlarınızı yapılandırın: Derin Arama Kodlayıcısı.
İmleç'e şunu ekleyin: Modeller bölümündeki Anthropic API anahtarı Yapay zeka destekli sohbet panelinde Opus 4.5'i seçin. Sohbet destekli otomatik tamamlama ve çoklu aracı akışlarıyla doğrudan IDE üzerinden çalışabilirsiniz; araca göre gelişmiş modellere basitleştirilmiş erişim sağlayan ücretli bir Cursor Pro planı da mevcuttur.
Claude Code'da proje dizininizde CLI'yi başlatın, Şifrenizle giriş yapın Seçim komutunu kullanarak modeli değiştirin. Ardından, koda dokunmadan önce adımlar önermek için planlama modunu etkinleştirin ve bunu yeniden düzenlemek, hata ayıklamak veya hedef odaklı betikleri çalıştırmak için kullanın.
En iyi uygulamalar: Gerektiğinde şablonlar arasında geçiş yapın (Hafif görevler için Haiku veya Sone, Akıl gerektirdiğinde opusSürüklenmeyi önlemek ve hız sınırlarına uymak için token kullanımını izleyin. Üçüncü taraf araçlarda yetkilendirme hataları ortaya çıkarsa, hesabınızda modelin etkinleştirildiğinden ve istemcinin en son sürümünü kullandığınızdan emin olun.
Sıkça sorulan sorular için lütfen danışın araçlar yardım merkezi ve forumlarAPI anahtarı sözleşmeli planla eşleşmediğinde, genişletilmiş düşünmede parçalanmış yanıtlar veya yetkisiz model mesajları gibi bilinen olayların listelendiği yer.
Yukarıdakilerin tümü ışığında, Opus 4.5, kıyaslama gücünü, ince ayarlı maliyet kontrolünü ve platform iyileştirmelerini bir araya getiriyor Bu, onu yazılım mühendisliği, ofis otomasyonu ve otonom ajanlar için özellikle cazip kılıyor. Deneyimi tam olarak tamamlamak için kullanım sınırları sorunu henüz çözülmedi, ancak yön açık: token başına daha yüksek kalite ve gerçek, sürdürülebilir çalışmalara daha iyi hazırlanmış bir ekosistem.
Genel olarak bayt ve teknoloji dünyası hakkında tutkulu bir yazar. Bilgilerimi yazarak paylaşmayı seviyorum ve bu blogda da bunu yapacağım; size gadget'lar, yazılım, donanım, teknolojik trendler ve daha fazlasıyla ilgili en ilginç şeyleri göstereceğim. Amacım dijital dünyada basit ve eğlenceli bir şekilde gezinmenize yardımcı olmaktır.
