- „Opus 4.5“ pirmauja programavimo ir agentų, kurių SWE-Bench rodiklis siekia 80,9 % ir yra geresnis nei konkurentų.
- Naujas pastangų parametras ir kainos sumažėjimas iki 5/25 USD už milijoną žetonų.
- „Chrome“, „Excel“ ir „Claude Code“ atnaujinimai su sustiprinta sauga ir atmintimi.
- Griežti naudojimo apribojimai ir regioniniai galiniai taškai su 10 % debesijos priemoka.
Claude'o Opus 4.5 Jis čia ir turi aiškų siekį: užimti aukščiausią poziciją programavimo, išmaniųjų agentų ir biuro užduočių srityse. „Anthropic“ pasiūlymas neapsiriboja grandiozinėmis antraštėmis; jame pateikiami skaičiai, palyginimai ir produktų pakeitimai, kurie teoriškai galėtų iš naujo apibrėžti, kaip mes naudojame... IA realiame darbe.
Be tiesioginės konkurencijos su kitais sektoriaus gigantais, Atnaujinimas apima žetonų efektyvumo ir pastangų kontrolės šuolįKartu su patobulinimais saugumo, įrankių naudojimo, atminties srityse ir daugybe naujų programų integracijų, tai ne tik greitesnis modelis: tai platforma, sukurta ilgiems, daugiaagentiniams ir mažiau sklandiems darbo ciklams.
Kas yra „Opus 4.5“ ir kodėl jis sukėlė tokį ažiotažą?
Tai įvyko vos kelios dienos po konkurentų veiksmų, pasižymint įspūdinga pozicija: „Anthropic“ pristato jį kaip pajėgiausią savo modelį ir Geresnis dirbtinis intelektas kiekvienai užduočiai programavimo, agentų valdymo ir kompiuterių naudojimo srityseĮmonė taip pat pabrėžia savo vertę atliekant išsamius tyrimus, kuriant dokumentus ir atliekant vizualinį bei matematinį samprotavimą.
Kad nepasiliktų teorijos srityje, įmonė tvirtina, kad modelis Jis pranoksta kitus standartus, pvz. Dvyniai 3 Pro ir GPT-5.1 Codex-Max programinės įrangos inžinerijos testavimo srityje. Ir praktiškai idėja aiški: mažiau žingsnių, didesnis tikslumas ir geresnis koordinavimas su įrankiais sudėtinguose darbo eigose.

Išmatuotas našumas: etaloniniai rodikliai ir realaus pasaulio testai
Programinės įrangos inžinerijos etalonu „SWE-Bench Verified“ „Opus 4.5“ pasiekia 80,9 % tikslumąlenkia tiek savo pirmtakus, tiek geriausius konkurentus. Šie duomenys yra svarbūs, nes jie matuoja gebėjimą spręsti realias problemas „GitHub“ projektuose, o ne tik atliekant pratimus.
Antropotika nuėjo toliau su Tikras inžinierių įdarbinimo testasDviejų valandų trukmės ir pagal sudėtingumą įvertintas testas, anot bendrovės, parodė, kad modelis ne tik išsprendė pratimus, bet ir... Jis įveikė visus žmonių kandidatus kurie laikė tą patį egzaminą, remdamiesi tokiomis strategijomis kaip lygiagretus hipotezių skaičiavimas.
Kasdienėse biuro užduotyse šuolis taip pat pastebimas: geresni rezultatai skaičiuoklėsepranešama, kad finansinių modelių tikslumas padidėjo 20 %, o efektyvumas – 15 %, be to, padidėjo gebėjimas organizuoti duomenų bazėsRengti pristatymus ir rašyti ilgas ataskaitas neprarandant temos.
Visa tai palaiko ilgalaikis iki 200 000 žetonų vidinių testų kontekstas ir sustiprintas darbinės atminties valdymas, kai Ilgiems pokalbiams naudingos automatinės santraukos išlaikyti nuoseklumą neperžengiant langų apribojimų.
Efektyvumas, kaina ir naujas pastangų parametras
Vienas iš skiriamųjų veiksnių yra kaina: API kaina nukrenta nuo 15 USD ir 75 USD už milijoną įėjimo ir išėjimo žetonų iki 5 USD ir 25 USD.atitinkamai. Tai atveria duris automatizavimui, kuris anksčiau buvo per brangus kasdieniam naudojimui.
Pagrindinis techninis elementas, siekiant maksimaliai padidinti taupymą, yra pastangų parametras, turintis žemą, vidutinį ir aukštą lygius. Esant vidutinėms pastangoms, „Opus 4.5“ našumas atitinka „Sonnet 4.5“ našumą „SWE-Bench Verified“ teste, naudojant 76 % mažiau išvesties žetonų.Didelėmis pastangomis, Jis 4,3 procentinio punkto lenkia „Sonnet 4.5“ ir vis tiek išleidžia 48 % mažiau žetonų.Naujovė čia yra ne tik kontrolė, bet ir galimybė keisti samprotavimo gylį nekeičiant modelio.
Šis koregavimas veikia visą atsakymą: tekstas, įrankių iškvietimai ir išplėstinis mąstymasĮdėjus mažai pastangų, gausite glaustesnius ir efektyvesnius atsakymus; įdėjus daugiau pastangų – išsamią analizę ir išsamius sudėtingų scenarijų paaiškinimus.
Atsiskaitymas taip pat pateikia praktinių niuansų: „Anthropic“ atpažįsta automatinius optimizavimus, kurie prie užklausų prideda nedaug žetonųTačiau jis patikslina, kad už šiuos sistemos pridėtus žetonus mokestis netaikomas. Smulkmenos, taip, bet jos svarbios keičiant dydį.
Daugiau nei kodas: agentai, biuro automatizavimas ir kompiuterių naudojimas
„Opus 4.5“ siekia aukštų tikslų programavimo srityje, bet Jų patobulinimai tuo nesibaigiaModelis puikiai tinka kuriant profesionalius dokumentus, skaičiuokles ir pristatymus, taip pat atliekant tyrimo užduotis su keliais šaltiniais, valdant ilgas gijas neprarandant aktualaus konteksto.
Agento galimybių srityje koordinavimas kyla į aukštesnį lygį: Efektyvus subagentų komandų valdymas Sudėtingoms daugiaagentėms sistemoms, galinčioms padalinti darbą, nustatyti prioritetus ir stabiliai dirbti valandų valandas ilguose darbo eigose.
Kalbant apie kompiuterio naudojimą, atnaujinime yra įtrauktas priartinimo veiksmas, skirtas išsamiai ekrane esančių sričių apžiūrai visa raiška. Tai naudinga skaitant smulkų šriftą, analizuojant sąsajas su didele informacija arba tikrinant detales prieš imantis veiksmų.
Samprotavimo, įrankių ir atminties derinys leidžia „Opus 4.5“ imtis Užduotys apima perkėlimą ir kodo pertvarkymą, ataskaitų generavimą ir darbalaukio automatizavimą. su mažiau ėjimų ir mažiau žetonų švaistymo.
Saugumas ir patikimumas: lygiavimas ir greitas įpurškimas
Autonomija kelia klausimų dėl kontrolės ir patikimumasČia „Anthropic“ teigia, kad tai yra jos tvirtiau suderintas modelis Iki šiol padaryta konkreti pažanga kovojant su instrukcijų injekcijos atakomis, kuriomis bandoma nukreipti sistemos elgesį.
Tai nėra smulkmena: Agentų, turinčių prieigą prie įrankių, diegimas reikalauja papildomų apsaugos priemonių.Bendrovė tvirtina, kad sustiprino barjerus nepakenkdama naudojimo patogumui. Nepaisant to, ji rekomenduoja gerą projektavimo praktiką ir žmogaus priežiūrą jautriais atvejais.
Ekosistema ir programos: kas naujo „Claude Code“, „Chrome“ ir „Excel“
Atnaujinimas neapsiriboja modeliu. Jis apima ir visą produktų rinkinį. Claude Code patobulina savo planavimo režimąPrieš pradėdami, užduokite patikslinančius klausimus ir sukurkite redaguojamą failą su planu, kad būtų lengviau peržiūrėti ir kontroliuoti.
Naršyklėje, „Claude for Chrome“ išleista „Max“ vartotojamssu pažadu valdyti užduotis keliuose skirtukuose ir koordinuoti veiksmus ilgesnių darbo sesijų metu. Tiems, kurie dirba su skaičiuoklėmis, „Claude for Excel“ ateina į „Max, Team and Enterprise“, su diagramų, suvestinių lentelių ir failų įkėlimo palaikymu.
Programėlėje viena praktiškiausių naujų funkcijų yra ta, kad Ilgi pokalbiai nebeužstringaSistema automatiškai apibendrina ankstesnį kontekstą, jei reikia, kad pratęstų sesijas, išlaikydama sprendimų nuoseklumą ir atsekamumą.
Visa tai pasiekiama kartu su „Opus 4.5“ prieinamumu API ir pagrindinėse debesijos platformoseTai palengvina integraciją į esamus kanalus, nelaukiant specialių diegimų.
Trys 4.5 modeliai skirtingiems poreikiams: Opus, Sonnet ir Haiku
4.5 šeima suskirstyta į tris profilius. „Opus 4.5“ – tai aukščiausio lygio išmanumas Pasižymi praktišku našumu aukšto lygio specializuotoms užduotims, profesionaliai inžinerijai ir pažangiems agentams. Tai vienintelis, kuris priima pastangų parametrą.
Sonnet 4.5 Tai kodavimo ir sudėtingų agentų darbo įrankis. Jis patobulina visą kūrimo ciklą: sistemų planavimą ir projektavimą, saugumo inžineriją, tikslesnis nurodymų laikymasis ir glaustą bei natūralų bendravimo stilių, pateikiant faktais pagrįstus atnaujinimus apie pažangą.
Kalbant apie agento galimybes, „Sonnet 4.5“ dirba autonomiškai valandų valandas, išlaikydama dėmesį. suvokiant kontekstą ir simbolinį biudžetą realiuoju laiku. Jis naudoja lygiagrečius įrankių iškvietimus, geriau koordinuoja kelis šaltinius ir išsaugo būseną tarp ilgų sesijų.
Haiku 4.5 Jame daugiausia dėmesio skiriama greičiui ir kainai, pasiekiamas beveik aukščiausio lygio našumas už trečdalį kainos, o greitis daugiau nei dvigubai didesnis nei „Sonnet 4“. Pirmą kartą pristatomas... mintis išsiplėtė iki Haiku eilutės, su pasirenkama minčių santrauka, įterpta tarp įrankių iškvietimų ir minčių žetonų biudžeto valdymo.
Su tuo, antropologinis atkuria katalogo pusiausvyrąPastaraisiais mėnesiais „Sonnet 4.5“ nustelbė senesnįjį „Opus 4.1“; dabar kiekvienas modelis atgauna savo vietą pagal kainą, greitį ir talpą.
Įrankių ir naujų API naudojimas: kas keičiasi kasdien
„Anthropic“ pristato daugiafunkciniams darbo eigoms programinių įrankių iškvietimaiModelis gali rašyti kodą, kuris iškviečia įrankius vykdymo konteineryje, sumažindamas duomenų perdavimo delsą ir filtruodamas duomenis prieš juos įkeliant į kontekstinį langą.
Jei turite šimtus įrankių, naujasis ieškoti įrankių Tai leidžia atrasti ir dinamiškai įkelti tik tai, ko reikia. Yra du variantai: naudojant reguliariosios išraiškos šablonus su įrankiu tool_search_tool_regex_20251119ir per natūralios kalbos užklausas su tool_search_tool_bm25_20251119, sutaupant nuo 10 000 iki 20 000 konteksto žetonų neįkeliant viso katalogo.
Norėdami pagerinti iškvietimų tikslumą, galite prisidėti įrankių naudojimo pavyzdžiai su galiojančiomis įvestimis, kurios padėtų modeliui valdyti sudėtingas schemas; o jei nerimaujate dėl konteksto, yra konteksto redagavimas kuris automatiškai išvalo senus skambučius ir rezultatus, kai artėja žetonų riba.
Vykdymo kontrolėje 4.5 modeliuose yra naujų stabdymo priežasčių: model_context_window_exceeded kad būtų parodyta, jog pasiektas kontekstinis langas, atskiriant jį nuo viršaus max_tokensir priežastis refusal Šis naujinimas išsprendžia problemas, kylančias, kai sistema dėl saugumo priežasčių atsisako generuoti turinį. Be to, ištaisoma klaida, dėl kurios perduodant parametrus įrankiams išsaugomi eilučių lūžiai.
Išplėstinis mąstymas grąžina vidaus proceso santrauka pranešimų API, o perduodant jis gali atvykti fragmentiškai su nedideliais vėlavimais; nieko kritinio, bet verta tai turėti omenyje dėl naudotojo patirties transliacijos.
Kūrimo įrankiai: teksto redaktorius ir kodo vykdymas
Jei naudojate Claude'o teksto redaktorių, yra nauja versija: įrankio tipas text_editor_20250728 su vardu str_replace_based_edit_toolir komandą undo_edit Jis nebepalaikomas. Atkreipkite dėmesį, jei migruojate iš „Sonnet 3.7“.
Kodo vykdymui rekomenduojama: versija code_execution_20250825, kuris prideda komandos Bash ir failų manipuliavimas. Senesnis variantas code_execution_20250522 Jis vis dar prieinamas, bet kadangi jis yra tik Pitonas Nerekomenduojama tai daryti naujiems įdiegimams.
Šie pokyčiai, kartu su parama Įprastas įrankių naudojimas ir išplėstinis mąstymasJie siekia natūralesnių tėkmių, kuriose modelis samprotauja, konsultuojasi su įrankiais ir tęsia pokalbį be dirbtinių šuolių.
Kainodara, galiniai įrenginiai ir debesies prieinamumas
Kainai nukritus iki 5 USD už milijoną įeinančių ir 25 USD už milijoną išeinančių žetonų, 4.5 modeliai išlaiko konkurencingas kainasTaip pat yra nauja funkcija, skirta galiniams taškams, kai jie naudojami per debesijos paslaugų teikėjus.
AWS Bedrock ir "Google" „Vertex AI“ siūlo pasaulinius ir regioninius galinius taškus „Opus 4.5“, „Sonnet 4.5“ ir „Haiku 4.5“ versijose regioninės paslaugos garantuoja geografinį maršrutizavimą su 10 % kainos priedu. „Anthropic“ patentuota API pagal numatytuosius nustatymus yra pasaulinė ir šis pakeitimas jai įtakos neturi.
„Opus 4.5“ galima įsigyti „Anthropic“ programos, API ir pagrindinės platformos, įskaitant tokias integracijas kaip „Amazon Bedrock“. Tai sumažina El Tiempo diegimui verslo aplinkoje.
Apribojimai ir smulkus šriftas: ką turėtumėte žinoti
Achilo kulnas šiuo metu yra naudojimo apribojimai ir kvotosNet ir „Pro“ bei „Max“ planuose žetonai greitai baigiasi, o skaitiklis atstatomas kas penkias valandas nuo pirmos žinutės. Kadangi „Opus“ yra galingiausias planas, jis taip pat greičiau eikvoja žetonus, todėl vartotojai, mokantys 20 ar net 100 USD per mėnesį, gali nusivilti.
Antropic teikia pirmenybę prieinamumui. Jungtinės Valstijos ir Vakarų EuropaJei veikiate Lotynų Amerikoje arba Azijos ir Ramiojo vandenyno regione, delsa gali padidėti, o vietinės kalbos palaikymas gali būti labiau ribotas. Prieš įsipareigojant imtis svarbių diegimų, patartina išmatuoti delsą realiuoju laiku.
Kitas punktas yra priklausomybė nuo ryšio ir debesijos paslaugųIntegracijos, tokios kaip „Excel“ ir „Chrome“, priklauso nuo debesijos paslaugų. Reguliuojamuose sektoriuose, kuriuose reikalingas diegimas vietoje, reikės derėtis dėl privačių diegimų arba konkrečiais atvejais apsvarstyti atvirus modelius.
Galiausiai, norint išnaudoti visas „Opus 4.5“ galimybes, reikia Mokymai greitosios inžinerijos, konteksto valdymo ir derinimo srityseBe gerų praktikų, pajėgumai švaistomi, o simbolinės išlaidos sparčiai auga; verta investuoti į vidinius mokymus.
Strategija ir palyginimas: kaip ji dera su „OpenAI“ ir „Google“
Su „Opus 4.5“ „Anthropic“ save pozicionuoja kaip aukščiausios kokybės paslaugų teikėjas profesionalams ir kūrėjamsKonkurencija akis į akį srityse, kuriose svarbiausia tikslumas ir patikimumas, sukėlė kainų ir pajėgumų karą, kuris naudingas pirkėjui, o našumo, kainos ir pastangų kontrolės derinys yra galingas masalas.
Palyginti su konkurentais, „Opus 4.5“ pasižymi darbo eigos su autonominiais įrankiais ir agentaisMultimodalumo arba grynojo samprotavimo atveju atotrūkis nuo kai kurių konkuruojančių modelių yra mažesnis, tačiau 4.5 ekosistemos funkcijų rinkinys lemia svarstykles gamybos scenarijuose, kuriems reikalingas atkaklumas ir koordinavimas.
Kada migruoti ir kaip tai įvertinti įmonėje
Jei naudojatės „Claude 3.5“ arba „Opus 4.1“ programomis, apsvarstykite galimybę pereiti prie kitos versijos, kai jums reikia sudėtingo mąstymo, didelio žetonų kiekio arba agento gebėjimų su prieiga prie įrankių. Sutaupius daugiau nei 10 milijonų žetonų per mėnesį, padengėme pertvarkymo pastangas.
Antropomorfiniai dokumentai dokumentuoja migracijos maršrutus su ir be atsiskyrimo poslinkių: Sonnetas nuo 3.7 iki 4.5 sonetas, nuo 3.5 iki haiku 4.5 (daugiau pakeitimų) ir sklandų atnaujinimą iš „Opus 4.1“ į „Sonnet 4.5“ arba „Opus 4.5“. Prieš perkeliant gamybinę aplinką, patartina peržiūrėti kontrolinius sąrašus.
Norėdami priimti sprendimą, paklauskite savęs, ar turite pasikartojančių procesų su pakankamu kiekiu, duomenų ir patvirtinimo kriterijų kontrolėIr aiškūs KPI, kurie matuoja sutaupytas valandas, klaidas ir reagavimo laiką. Be metrikų bet kuris bandomasis projektas lieka nepastebimas.
Praktinis saugaus diegimo kontrolinis sąrašas: privatumo politika ir duomenų apsaugos teisė (DPA), ribotas koncepcijos įrodymas (pavyzdžiui, pagalbos užklausos arba susitikimų santraukos), dviejų pagrindinių asmenų vidiniai mokymai, sąnaudų stebėjimas su įspėjimais ir nenumatytų atvejų planas paslaugos pasikeitimo ar gedimo atveju.
Kūrėjams: naudokite „Opus 4.5“ kursorių ir Claude'o kode
Norint pasinaudoti „Opus 4.5“ privalumais kasdieniame kūrime, Sukurkite „Anthropic“ paskyrą ir sugeneruokite API raktąAktyvuokite prieigą prie modelio pagal savo planą („Max“, „Team“ arba „Enterprise“) ir sukonfigūruokite įprastus įrankius, įskaitant Deepseek koduotojas.
Žymeklyje pridėkite Antropinio API raktas modelių skyriuje ir dirbtinio intelekto valdomame pokalbių skydelyje pasirinkite „Opus 4.5“. Galite dirbti su pokalbių pagalba automatinio užbaigimo ir kelių agentų srautais tiesiai IDE; yra mokamas „Cursor Pro“ planas, kuris, anot įrankio, suteikia supaprastintą prieigą prie išplėstinių modelių.
„Claude Code“ paleiskite CLI savo projekto kataloge, Prisijunkite naudodami savo slaptažodį ir pakeiskite modelį naudodami pasirinkimo komandą. Tada įjunkite planavimo režimą, kad būtų siūlomi veiksmai prieš jums liečiant kodą, ir naudokite jį pertvarkymui, derinimui arba tikslinių scenarijų vykdymui.
Geriausia praktika: perjunkite šablonus pagal poreikį (pvz., „Haiku“ arba „Sonet“ lengvoms užduotims, Opusas, kai to reikalauja samprotavimasStebėkite žetonų naudojimą, kad išvengtumėte nukrypimų ir laikytumėtės tarifų apribojimų. Jei trečiųjų šalių įrankiuose atsiranda autorizacijos klaidų, patikrinkite, ar jūsų paskyroje įjungtas modelis ir ar naudojate naujausią kliento versiją.
Dėl dažnai užduodamų klausimų kreipkitės įrankių pagalbos centre ir forumuose, kur išvardijami žinomi incidentai, tokie kaip fragmentiški atsakymai išplėstiniame mąstyme arba neautorizuoti modelio pranešimai, kai API raktas neatitinka sutartyje numatyto plano.
Atsižvelgiant į visa tai, kas išdėstyta pirmiau, „Opus 4.5“ apjungia galingą lyginamosios analizės pajėgumą, tiksliai suderintą sąnaudų kontrolę ir platformos patobulinimus. Dėl to jis ypač patrauklus programinės įrangos inžinerijai, biuro automatizavimui ir autonominiams agentams. Norint visapusiškai išplėsti patirtį, dar reikia išspręsti naudojimo apribojimų klausimą, tačiau kryptis aiški: aukštesnė kiekvieno žetono kokybė ir geriau paruošta ekosistema realiam, ilgalaikiam darbui.
Aistringas rašytojas apie baitų pasaulį ir technologijas apskritai. Man patinka dalytis savo žiniomis rašydamas, būtent tai ir darysiu šiame tinklaraštyje, parodysiu jums įdomiausius dalykus apie programėles, programinę įrangą, techninę įrangą, technologijų tendencijas ir kt. Mano tikslas – padėti jums paprastai ir smagiai naršyti skaitmeniniame pasaulyje.
