Claude Opus 4.5: uudet ominaisuudet, hinnat ja todelliset parannukset

Mundobytes » Tekoäly » Claude Opus 4.5: kaikki uudet ominaisuudet, hinnat ja parannukset

Opus 4.5 johtaa ohjelmointi ja agentit, joiden osuus SWE-Benchissä on 80,9 % ja kilpailijoita parempi.
Uusi työmääräparametri ja hinnanlasku 5/25 USD:iin miljoonaa tokenia kohden.
Päivityksiä Chromessa, Excelissä ja Claude Codessa, vahvistettu tietoturva ja muisti.
Tiukat käyttörajoitukset ja alueelliset päätepisteet 10 %:n pilvipreemiolla.

Tekoälykuva ja tuottavuus Claude Opus 4.5:n avulla

Claude Opus 4.5 Se on täällä, ja sillä on selkeä tavoite: asemoimaan itsensä ohjelmoinnin, älykkäiden agenttien ja toimistotehtävien huipulle. Anthropicin ehdotus ei rajoitu mahtipontisiin otsikoihin; se sisältää lukuja, vertailuja ja tuotemuutoksia, jotka paperilla voisivat määritellä uudelleen tapamme käyttää... IA oikeassa työssä.

Suoran kilpailun lisäksi muiden alan jättiläisten kanssa, Päivitys tuo mukanaan harppauksen token-tehokkuuteen ja työmäärän hallintaanTietoturvan, työkalujen käytön, muistin ja lukuisten uusien sovellusintegraatioiden parannusten ohella se ei ole vain nopeampi malli: se on alusta, joka on suunniteltu pitkille, moniagenttisille ja vähemmän kitkattomia työsyklejä varten.

Aiheeseen liittyvä artikkeli:

Vibe-työskentely Excelissä ja Wordissa: agenttitila ja Office-agentti

Mikä on Opus 4.5 ja miksi se on aiheuttanut niin paljon kohua?

Se tapahtuu vain päiviä kilpailijoiden siirtojen jälkeen, ja siinä on vakuuttava positio: Anthropic esittelee sen kyvykkäimpänä mallinaan ja Parempi tekoäly jokaiseen tehtävään ohjelmoinnissa, agenttien hallinnassa ja tietokoneen käytössäYritys korostaa myös arvoaan perusteellisessa tutkimuksessa, dokumenttien luomisessa sekä visuaalisessa ja matemaattisessa päättelyssä.

Välttääkseen teorian rajoissa pysymisen yritys väittää, että malli Se ylittää muut vertailuarvot, kuten Kaksoset 3 Pro ja GPT-5.1 Codex-Max ohjelmistokehityksen testauksessa. Ja käytännössä idea on selvä: vähemmän vaiheita, enemmän tarkkuutta ja parempi koordinointi työkalujen kanssa monimutkaisissa työnkuluissa.

Claude Opus 4.5 -uutiset

Mitattu suorituskyky: vertailuarvot ja tosielämän testit

Ohjelmistokehityksen vertailukohdassa SWE-Bench Verified Opus 4.5 saavuttaa 80,9 %:n tarkkuudenpäihittää sekä edeltäjänsä että huippukilpailijansa. Tämä data on tärkeää, koska se mittaa kykyä ratkaista tosielämän ongelmia GitHub-projekteissa, ei vain harjoitusleikkien aikana.

Antrooppinen on mennyt pidemmälle todellinen insinöörien rekrytointitestiKahden tunnin mittaisessa ja vaikeusasteeltaan arvioidussa testissä yrityksen mukaan malli ei ainoastaan ratkaissut harjoituksia, vaan myös... Hän voitti kaikki ihmisehdokkaat jotka suorittivat saman kokeen, luottaen strategioihin, kuten hypoteesien rinnakkaislaskentaan.

Myös jokapäiväisissä toimistotehtävissä harppaus on havaittavissa: parempia tuloksia laskentataulukoissaraportoitujen 20 %:n tarkkuuden ja 15 %:n tehokkuuden parannusten kanssa rahoitusmalleissa, sekä organisointikyvyn parantumisen tietokannatValmistele esityksiä ja kirjoita pitkiä raportteja menettämättä aihetta.

Kaikkea tätä tukee pitkäaikainen, jopa 200 000 tokenin sisäinen testaus ja vahvistettu työmuistin hallinta, jossa Pitkät keskustelut hyötyvät automaattisista yhteenvedoista säilyttääkseen yhdenmukaisuuden törmäämättä ikkunarajoituksiin.

Kuva tekoälyagentista ja työkaluista

Tehokkuus, kustannukset ja uusi työmääräparametri

Yksi erottava tekijä on hinta: API-hinta laskee 15 ja 75 dollarista miljoonaa sisään- ja ulostulotokenia kohden 5 ja 25 dollariin.Tämä avaa oven automaatioille, jotka olivat aiemmin liian kalliita jokapäiväiseen käyttöön.

Säästöjen maksimoinnin kannalta keskeinen tekninen elementti on työmääräparametri, jolla on matala, keskitaso ja korkea taso. Keskitasoisella työmäärällä Opus 4.5 vastaa Sonnet 4.5:n suorituskykyä SWE-Bench Verified -testauksessa käyttäen 76 % vähemmän lähtötokeneja.Suurilla ponnisteluilla Se ylittää Sonnet 4.5:n 4,3 prosenttiyksiköllä ja käyttää silti 48 % vähemmän tokeneitaUutuus tässä ei ole pelkästään hallinta, vaan myös kyky vaihdella päättelyn syvyyttä muuttamatta mallia.

Tämä säätö vaikuttaa koko vasteeseen: teksti, työkalukutsut ja laajennettu ajatteluPienellä vaivalla saat ytimekkäämpiä ja tehokkaampia vastauksia; suurella vaivalla saat yksityiskohtaisen analyysin ja kattavia selityksiä monimutkaisiin tilanteisiin.

Laskutus tuo mukanaan myös käytännön vivahteita: Anthropic tunnistaa automaattiset optimoinnit, jotka lisäävät pyyntöihin vain vähän tokeneitaHän kuitenkin selventää, että järjestelmän lisäämistä tokeneista ei veloiteta. Pieniä yksityiskohtia kyllä, mutta niillä on merkitystä skaalattaessa.

Korjaa virhe 8DDD0020 Microsoft Updatessa

Enemmän kuin koodia: agentit, toimistoautomaatio ja tietokoneen käyttö

Opus 4.5 tähtää ohjelmoinnissa korkealle, mutta Heidän parannuksensa eivät lopu tähänMalli on erinomainen ammattimaisten dokumenttien, laskentataulukoiden ja esitysten luomisessa sekä useiden lähteiden tutkimustehtävissä, halliten pitkiä säikeitä menettämättä olennaista kontekstia.

Agenttien ominaisuuksissa koordinointi nousee tasolle: Aliagenttitiimien tehokas hallinta Monimutkaisille moniagenttijärjestelmille, kykenevä jakamaan työtä, priorisoimaan ja etenemään vakaasti tuntikausia pitkissä työnkuluissa.

Tietokoneen käytön osalta päivitys sisältää mm. zoomaustoiminto näytön alueiden yksityiskohtaiseen tarkasteluun täydellä resoluutiolla. Tämä on hyödyllistä pienen präntin lukemiseen, tiheän tiedon rajapintojen analysointiin tai yksityiskohtien tarkistamiseen ennen toimenpiteisiin ryhtymistä.

Päättelyn, työkalujen ja muistin yhdistelmä mahdollistaa Opus 4.5:n toteuttaa tehtäviin kuuluvat migraatio ja koodin uudelleenjärjestely, raporttien luominen ja työpöydän automatisointi. vähemmillä vuoroilla ja vähemmällä pelimerkkien hukalla.

Turvallisuus ja kestävyys: kohdistus vs. nopea injektio

Autonomia herättää kysymyksiä kontrollista ja luotettavuusTässä Anthropic väittää, että tämä on sen vakaammin linjattu malli Tähän mennessä on tapahtunut konkreettista edistystä järjestelmän toimintaa muuttamaan pyrkiviä käskyjen injektiohyökkäyksiä vastaan.

Tämä ei ole mikään pikkujuttu: Työkaluihin pääsyn omaavien agenttien käyttöönotto vaatii lisäsuojatoimia.Yritys väittää vahvistaneensa esteitä käytettävyyttä vaarantamatta. Silti he suosittelevat hyviä suunnittelukäytäntöjä ja ihmisen valvontaa herkissä tilanteissa.

Ekosysteemi ja sovellukset: Uutta Claude Codessa, Chromessa ja Excelissä

Päivitys ei rajoitu pelkästään malliin. Se ulottuu koko tuotepinoon. Claude Code parantaa suunnittelutilaansaEnnen aloittamista, kysy selventäviä kysymyksiä ja luo muokattava tiedosto suunnitelmasta helpottaaksesi tarkistusta ja hallintaa.

selaimessa, Claude for Chrome on julkaistu Max-käyttäjillelupauksella hallita tehtäviä useilla välilehdillä ja koordinoida toimia pidempien työistuntojen aikana. Niille, jotka työskentelevät laskentataulukoiden kanssa, Claude for Excel tulee Maxille, Teamille ja Enterpriselle, tukien kaavioille, pivot-taulukoille ja tiedostojen latauksille.

Sovelluksen yksi käytännöllisimmistä uusista ominaisuuksista on se, että Pitkät keskustelut eivät enää juutu jumiinJärjestelmä tiivistää automaattisesti edellisen kontekstin tarpeen mukaan istuntojen pidentämiseksi, säilyttäen päätösten johdonmukaisuuden ja jäljitettävyyden.

Kaikki tämä tulee saataville Opus 4.5:n kanssa vuonna API:ssa ja tärkeimmillä pilvialustoillaTämä helpottaa integrointia olemassa oleviin putkiin ilman erillisten käyttöönottojen odottamista.

Kolme 4.5-mallia eri tarpeisiin: Opus, Sonnet ja Haiku

4.5-perhe on jaettu kolmeen profiiliin. Opus 4.5 on äärimmäisen älykäs Käytännön suorituskykyä korkean tason erikoistehtäviin, ammattimaiseen suunnitteluun ja edistyneille agenteille. Se on ainoa, joka hyväksyy työmääräparametrin.

Sonetti 4.5 Se on koodauksen ja monimutkaisten agenttien työjuhta. Se tuo parannuksia koko kehityssykliin: järjestelmäsuunnitteluun ja -suunnitteluun, tietoturvatekniikkaan, tarkempia ohjeita noudattaen ja ytimekäs ja luonnollinen viestintätyyli, jossa edistymispäivitykset perustuvat faktoihin.

Agenttien ominaisuuksien osalta Sonnet 4.5 työskentelee itsenäisesti tuntikausia säilyttäen keskittymisensä. kontekstin ja nimellisen budjetin tuntemuksena reaaliajassa. Se käyttää rinnakkaisia työkalukutsuja, koordinoi paremmin useita lähteitä ja säilyttää tilan pitkien istuntojen välillä.

Haiku 4.5 Se keskittyy nopeuteen ja kustannuksiin saavuttaen lähes huippusuorituskyvyn kolmanneksen hinnalla ja yli kaksinkertaisella nopeudella Sonnet 4:ään verrattuna. Se tuo ensimmäistä kertaa ajatus ulottui Haiku-linjaan, valinnaisella ajatusyhteenvedolla, työkalukutsujen ja ajatusmerkkibudjetin hallinnan välissä.

Tämän myötä antropologinen palauttaa luettelonsa tasapainonViime kuukausina Sonnet 4.5 on jättänyt vanhemman Opus 4.1:n varjoonsa; nyt jokainen malli on valtaamassa takaisin paikkansa kustannusten, nopeuden ja kapasiteetin suhteen.

Mikä on SRT-tiedosto? Mihin se on tarkoitettu ja miten se avataan

Työkalujen ja uusien API-rajapintojen käyttö: mikä muuttuu päivittäin

Monityökalutyönkulkuja varten Anthropic esittelee ohjelmalliset työkalukutsutMalli voi kirjoittaa koodia, joka kutsuu työkaluja suoritussäiliössä, mikä vähentää edestakaisen matkan viivettä ja suodattaa dataa ennen sen lataamista konteksti-ikkunaan.

Jos sinulla on satoja työkaluja, uusi etsi työkaluja Sen avulla voit löytää ja ladata dynaamisesti vain tarvittavat tiedot. On olemassa kaksi muunnelmaa: työkalun avulla voidaan käyttää regex-malleja tool_search_tool_regex_20251119ja luonnollisen kielen kyselyiden avulla tool_search_tool_bm25_20251119, mikä säästää 10 000–20 000 kontekstitunnusta lataamatta koko luetteloa.

Voit parantaa kutsujen tarkkuutta osallistumalla esimerkkejä työkalujen käytöstä kelvollisilla syötteillä mallin ohjaamiseksi monimutkaisten järjestelmien läpi; ja jos olet huolissasi kontekstista, on olemassa kontekstin muokkaus joka tyhjentää automaattisesti vanhat kutsut ja tulokset, kun merkkien raja lähestyy.

Suorituksenohjauksessa 4.5-mallit sisältävät uusia pysäytyssyitä: model_context_window_exceeded osoittamaan, että konteksti-ikkuna on saavutettu, erottaen sen yläreunasta max_tokensja syy refusal Tämä päivitys korjaa ongelmia, joita ilmenee, kun järjestelmä kieltäytyy luomasta sisältöä turvallisuussyistä. Lisäksi se korjaa virheen, joka säilyttää rivinvaihdot työkaluille parametreja välitettäessä.

Laajennettu ajattelu palauttaa sisäisen prosessin yhteenveto viestirajapinnassa, ja lähetettäessä se voi saapua fragmentoituneina toimituksina pienillä viiveillä; ei mitään kriittistä, mutta se kannattaa pitää mielessä käyttökokemuksen kannalta streaming.

Kehitystyökalut: tekstieditori ja koodin suorittaminen

Jos käytät Clauden tekstieditoria, siitä on uusi versio: työkalun tyyppi text_editor_20250728 nimen kanssa str_replace_based_edit_toolja komento undo_edit Sitä ei enää tueta. Huomaa, jos siirryt Sonnet 3.7:stä.

Koodin suorittamiseen suositellaan seuraavaa: versio code_execution_20250825, joka lisää komennot Bash ja tiedostojen manipulointi. Vanha versio code_execution_20250522 Se on edelleen saatavilla, mutta koska se on vain Python Sitä ei suositella uusiin käyttöönottoihin.

Nämä muutokset, yhdessä tuen kanssa työkalujen käyttö ja laajennettu ajatteluNe pyrkivät luonnollisempiin virtauksiin, joissa malli perustelee, konsultoi työkaluja ja jatkaa keskustelua ilman keinotekoisia hyppyjä.

Hinnoittelu, päätepisteet ja pilvipalveluiden saatavuus

Kun hinta laskee 5 dollariin miljoonaa tokenia kohden sisään tullessa ja 25 dollariin miljoonaa tokenia kohden ulos mennessä, 4.5-mallit säilyttävät kilpailukykyiset hinnatPäätepisteille on myös uusi ominaisuus, kun niitä kulutetaan pilvipalveluntarjoajien kautta.

AWS Bedrock ja Google Vertex AI tarjoaa globaaleja ja alueellisia päätepisteitä Opus 4.5:lle, Sonnet 4.5:lle ja Haiku 4.5:lle alueelliset palvelut takaavat maantieteellisen reitityksen 10 %:n hintapreemiolla. Anthropicin oma API on oletusarvoisesti globaali, eikä tämä muutos vaikuta siihen.

Opus 4.5 on saatavilla seuraavissa kielissä: Anthropicin sovellukset, API ja pääalustat, mukaan lukien integraatiot, kuten Amazon Bedrock. Tämä vähentää aika käyttöönottoa varten liiketoimintaympäristöissä.

Rajoitukset ja pienellä präntätty teksti: mitä sinun tulisi tietää

Akilleen kantapää on tällä hetkellä käyttörajoitukset ja kiintiötJopa Pro- ja Max-paketeissa tokenit loppuvat nopeasti, ja laskuri nollautuu viiden tunnin välein ensimmäisestä viestistä. Koska Opus on tehokkain paketti, se myös kuluttaa tokeneita nopeammin, mikä turhauttaa käyttäjiä, jotka maksavat 20 tai jopa 100 dollaria kuukaudessa.

Antrooppinen priorisoi saatavuutta. Yhdysvallat ja Länsi-EurooppaJos toimit Latinalaisessa Amerikassa tai Aasian ja Tyynenmeren alueella, viive voi kasvaa ja paikallisten kielten tuki voi olla rajoitetumpaa. On suositeltavaa mitata reaaliaikainen viive ennen kriittisiin käyttöönottoihin sitoutumista.

Toinen seikka on riippuvuus yhteyksistä ja pilvipalveluistaIntegraatiot, kuten Excel ja Chrome, perustuvat pilvipalveluihin. Säännellyillä aloilla, jotka vaativat paikallisia käyttöönottoja, yksityisistä käyttöönottoista on neuvoteltava tai avoimia malleja on harkittava tietyissä tilanteissa.

Lopuksi, Opus 4.5:n täysi hyöty edellyttää Koulutus nopeaan suunnitteluun, kontekstin hallintaan ja virheenkorjaukseenIlman hyviä käytäntöjä kapasiteettia hukataan ja nimikkeelliset menot kasvavat pilviin; sisäiseen koulutukseen kannattaa panostaa.

Metan MusicGenin käyttö paikallisesti lataamatta tiedostoja pilveen

Strategia ja vertailu: miten se sopii yhteen OpenAI:n ja Googlen kanssa

Opus 4.5:n myötä Anthropic asemoituu ensiluokkainen tarjoaja ammattilaisille ja kehittäjilleKilpailu tarkkuutta ja luotettavuutta ensisijaisesti vaativissa sovelluksissa on käynnistänyt hinta- ja ominaisuuskilpailun, josta ostaja hyötyy. Suorituskyvyn, kustannusten ja työmäärän hallinnan yhdistelmä on tehokas houkutin.

Kilpailijoihin verrattuna Opus 4.5 loistaa työnkulut autonomisten työkalujen ja agenttien avullaMultimodaalisuudessa tai puhtaassa päättelyssä ero joihinkin kilpaileviin malleihin on pienempi, mutta 4.5-ekosysteemin toimintojen joukko kääntää vaakakupin tuotantoskenaarioissa, jotka vaativat pitkäjänteisyyttä ja koordinointia.

Milloin siirtyä ja miten sitä arvioidaan yrityksen sisällä

Jos käytät Claude 3.5:tä tai Opus 4.1:tä, harkitse siirtymistä seuraavaan versioon. tarvitset monimutkaista päättelykykyä, suurta token-määrää tai agenttikykyä ja pääsy työkaluihin. Yli 10 miljoonalla tokenilla kuukaudessa säästöt kompensoivat uudelleenkonfigurointityön kustannukset.

Antrooppiset dokumentit muuttoreitteistä irtautuneiden siirtymien kanssa ja ilman: Sonetti 3.7 - Sonet 4.5, Haiku 3.5 - Haiku 4.5 (lisää muutoksia) ja sujuvat päivitykset Opus 4.1:stä Sonnet 4.5:een tai Opus 4.5:een. On suositeltavaa tarkistaa tarkistuslistat ennen tuotantoympäristöjen siirtämistä.

Päätöksen tekemiseksi kysy itseltäsi, onko sinulla toistuvia prosesseja, joilla on riittävä määrä, datan ja validointikriteerien hallintaJa selkeät KPI-mittarit, jotka mittaavat säästettyjä tunteja, virheitä ja vasteaikoja. Ilman mittareita mikä tahansa pilottihanke jää harhailemaan.

Käytännön tarkistuslista turvalliseen käyttöönottoon: tietosuojakäytännöt ja DPA, rajattu konseptitodistus (esimerkiksi tukipyynnöt tai kokousyhteenvedot), kahden avainhenkilön sisäinen koulutus, kustannusten seuranta hälytyksillä ja varautumissuunnitelma palvelun muuttuessa tai vikaantuessa.

Kehittäjille: Käytä Opus 4.5:tä Cursorissa ja Claude-koodissa

Jotta Opus 4.5:tä voidaan hyödyntää päivittäisessä kehityksessä, Luo Anthropic-tili ja luo API-avainAktivoi käyttöoikeus malliin sopimuksesi mukaisesti (Max, Team tai Enterprise) ja määritä tavalliset työkalusi, mukaan lukien Deepseek-kooderi.

Lisää Kohdistin-kohtaan Antrooppinen API-avain mallit-osiossa ja valitse tekoälypohjaisesta chat-paneelista Opus 4.5. Voit työskennellä chat-avusteisen automaattisen täydennyksen ja usean agentin työnkulkujen kanssa suoraan IDE:ssä; saatavilla on maksullinen Cursor Pro -tilaus, joka työkalun mukaan mahdollistaa yksinkertaistetun pääsyn edistyneisiin malleihin.

Käynnistä Claude Codessa komentorivikäyttöliittymä projektihakemistossasi. Kirjaudu sisään salasanallasi ja muuta mallia valintakomennolla. Aktivoi sieltä suunnittelutila, joka ehdottaa vaiheita ennen koodiin koskemista, ja käytä sitä uudelleenjärjestelyyn, virheenkorjaukseen tai tavoitteellisten komentosarjojen suorittamiseen.

Parhaat käytännöt: vaihda mallien välillä tarpeen mukaan (Haiku tai Sonnet kevyisiin tehtäviin, Opus, kun järki sitä vaatiiSeuraa tokenien käyttöä estääksesi ajautumisen ja noudattaaksesi nopeusrajoituksia. Jos kolmannen osapuolen työkaluissa ilmenee valtuutusvirheitä, tarkista, että tililläsi on malli käytössä ja että käytät asiakasohjelman uusinta versiota.

Usein kysyttyihin kysymyksiin vastaa työkalujen tukikeskus ja foorumit, jossa luetellaan tunnettuja tapauksia, kuten fragmentoituneita vastauksia laajennetussa ajattelussa tai luvattomia malliviestejä, kun API-avain ei vastaa sovittua suunnitelmaa.

Kaiken edellä mainitun valossa, Opus 4.5 yhdistää suorituskyvyn vertailuanalyysin, hienosäädetyn kustannustenhallinnan ja alustaparannukset Tämä tekee siitä erityisen houkuttelevan ohjelmistokehitykselle, toimistoautomaatiolle ja autonomisille agenteille. Käyttörajoitusten ongelma on vielä ratkaisematta, jotta kokemus olisi täydellinen, mutta suunta on selvä: korkeampi laatu tokenia kohden ja ekosysteemi, joka on paremmin valmistautunut todelliseen, jatkuvaan työhön.

Isaac

Intohimoinen kirjoittaja tavujen maailmasta ja tekniikasta yleensä. Rakastan jakaa tietämykseni kirjoittamalla, ja sen aion tehdä tässä blogissa, näyttää sinulle kaikki mielenkiintoisimmat asiat vempaimista, ohjelmistoista, laitteistoista, teknologisista trendeistä ja muusta. Tavoitteeni on auttaa sinua navigoimaan digitaalisessa maailmassa yksinkertaisella ja viihdyttävällä tavalla.