- Pidev tähelepanu ja pikad väljasõidud: üle 30 tunni keskendumist ja kuni 64 000 žetooni.
- Praktilised täiustused arvuti ja brauseri kasutamisel, kus OSWorldis tõusis see 61,4%-ni.
- programmeerimine otsast lõpuni Claude'i koodiga, kontrollpunktide ja VS Code'i laiendusega.
- Tugevdatud platvorm: mälu, konteksti puhastamine ja agendi SDK täpsete õigustega.

Anthropic on Claude Sonnet 4.5-ga sammu astunud, tõstes lati väga tihedas turul veidi kõrgemale. OpenAI ja Google'i vahelLühidalt, see on nende seni kõige õhem mudel, millel on märkimisväärne agentide, programmeerimise ja arvutikasutuse kasv just seal, kus konkurents kõige rohkem raskustes on. võrdluspiloot, aga ka praktiliste täiustustega kasutajatele, kes otsivad iga päev tõelist tootlikkust.
Selle väljalaske olulisuse mõistmiseks tasub heita pilk sarja päritolule. Sonnet 3.7 tutvustas hübriidset arutluskäiku, mis juba märkis ära erinevuse kodeerimises ja analüüsis, ning Sonnet 4 kinnistas selle strateegia assistentidele stabiilse valikuna. fookuse kestus, usaldusväärsust ja tööriistad, tugevdades oma positsiooni pikkades projektides, kus järjepidevus ja kontekstuaalne mälu on kõik.
Mida Sonnet 4.5 tegelikult pakub ja mis selle teistest eristab
Teadaanne keskendub kolmele aspektile: tundide kaupa töötavad agendid, otsast lõpuni programmeerimine ja arvuti kasutamise oskuslikum oskus. Anthropicu sõnul suudab mudel keerulistele ülesannetele tähelepanu pöörata enam kui 30 tunniks, mis pole seda tüüpi süsteemidele tüüpiline. püsiv vastupidavus See võimaldab teil planeerida ja teostada pikki töid ilma, et mudel hajuks või kaotaks oma niidi, mis on selge eelis refaktoriseerimisel, andmeprojektides või tihedates aruannetes.
Teine oluline täiustus on väljundi pikkus: see toetab nüüd kuni 64 000 tokeni vastuseid, nii et saate genereerida suuri koodiplokke, tehnilisi dokumente või ulatuslikke analüüse ilma konteksti korduvalt tükeldamata. vähem tulekut ja minekut ja vähem hõõrdumist dokumendi või keeruka tarkvaramooduli materialiseerimisel.
Lisaks on arendajatel uus hoob: kontroll selle üle, kui kaua mudel enne reageerimist mõtleb. See avab ukse kiiruse ja sügavuse tasakaalu peenhäälestamisele iga juhtumi puhul eraldi. reguleerige kiirust ja sügavustSee võib tunduda väikese detailina, aga töövoo tasandil on sellel vahe.
Arvuti ja brauseri kasutamine: hüppa OSWorldi
Üks valdkondi, milles Anthropic kõige rohkem uhkustab, on arvuti praktiline kasutamine. OSWorldi võrdlustestis, mis hindab reaalseid töölauaülesandeid, saavutab Sonnet 4.5 tulemuse 61,4%, võrreldes eelmise versiooni 42,2%-ga. töölauaülesannete täiustamine toetab selliseid stsenaariume nagu veebisaitidel navigeerimine, arvutustabelite manipuleerimine või konkurentsianalüüsi tegemine väiksema inimjärelevalvega.
Brauseri integratsioon on samuti pluss. Chrome'i laiendus on saadaval neile, kes on varem registreerunud, ja see toimib veebiuuringute protsesside või kerge automatiseerimise tutvustusena. koguda teavet, vähendades kasutajate mikrohaldust korduvate ülesannete puhul.
Lõpp-lõpuni programmeerimine: disainist refaktoreerimiseni
Kui on üks valdkond, kus Anthropic soovib kõrvale astuda, siis see on tarkvaraarendus. Ettevõte väidab, et Sonnet 4.5 hõlmab kogu elutsüklit: suurte projektide planeerimist, juurutamist, testimist, hooldust, parandusi ja refaktoreerimist. Claude Code'i tugi, eesmärk on olla tehniliste meeskondade pidev abiline, mitte ainult üksikute koodijuppide generaator.
Numbrid on olemas: SWE-bench Verified testis, mis hindab koodiprobleemide lahendamist reaalsetes stsenaariumides, saavutas mudel tulemuse 77,2%. Selle tulemusega edestab see alternatiive, nagu GPT-5 Codex ja Gemini 2.5 Pro, vastavalt jagatud andmetele. struktuuriliste muutuste paranemine ja kümnete failide vahel tuleb säilitada järjepidevus.
Praktikas on teatatud pikematest seanssidest, kus süsteem suudab oma osa refaktoriseerimisel, vastutuse jagamisel ja puhaste arhitektuuride stabiliseerimisel hoida. kaaspiloot, kes ei kaota niiti, midagi, mille all igaüks, kes on selle all kannatanud, teab, et see on üsna keeruline.
Claude Code: uus nägu, kontrollpunktid ja VS Code
Mudeli ümber olev ökosüsteem pakub igapäevaseks kasutamiseks uusi funktsioone. Liides terminal Claude Code'i on selguse ja mugavuse huvides uuendatud ning Visual Studio Code'i uus laiendus integreerib viisardi otse IDE-sse. integreerimine IDE-sse ja aitab keskendumist säilitada.
Kontrollpunktide funktsioon toimib turvavõrguna. See võimaldab teil käivitada suuri ülesandeid ja koheselt eelmise oleku juurde tagasi pöörduda, kui midagi ei lähe ootuspäraselt. kontrollpunktid Väldi pikkade toimingute tellimise hirmu, sest alati on olemas kindel tagasivõtmise võimalus, mis ei sõltu iga sammu käsitsi meelespidamisest.
Claude'i rakendus: koodianalüüs ja failide loomine
Claude'i rakenduses, mis on saadaval veebis ja mobiilis iOS y Android, tutvustatakse võimalusi andmete analüüsimiseks koodi abil, failide loomiseks ja teabe visualiseerimiseks tavalistes Office'i vormingutes. See funktsioon on tasuliste pakettide eelvaates avatud. vestluste dokumentideks muutmine vestlusest endast lahkumata.
Samal ajal on Claude'i Chrome'i laiendus nüüd saadaval neile, kes eelmisel kuul ootenimekirjaga liitusid. brauseris olev lihas, koos selliste kasutusjuhtudega nagu allikate konsolideerimine, ülesannete kontrollnimekirjad või hästi juhendatud andmete kogumine.
Arendajaplatvorm: kontekst, mälu ja õigused
Platvormi tasandil on prioriteediks agentide pikemaajaline käitamine madalamate kognitiivsete kuludega. Kasutusele on võetud süsteem, mis kustutab automaatselt vananenud konteksti, et hoida vestlus agiilsena ilma olulist teavet kaotamata. mälu tööriist, vältides andmete ja otsuste pidevat kordamist.
Claude Agent SDK avab juurdepääsu põhitööriistadele, kontekstihaldusmehhanismidele ja õiguste raamistikele, millele Claude Code on üles ehitatud. samad tükid, et agentide piirid, võimalused ja kohustused saaks täpselt määratleda.
Isegi operatiivsel tasandil muutub kontekstihaldus detailseks: päästikuid saab seadistada ajaloo puhastamiseks märgimahu järgi, teatud tööriistakõnede säilitamiseks ja tagamaks, et alati jääb alles minimaalne teostatav töömaht. kontekstuaalne hügieen mis aitab seansse pikendada ilma, et mudel vana tekstiga takerduks.
Kujuta ette koos Claude'iga: uurimistöö eelvaade
Lisaks mudelile käivitab Anthropic ajutise eelvaate nimega Imagine with Claude. Selles katses genereerib süsteem tarkvara lennult ilma eelnevalt määratletud funktsioonide või eelnevalt kirjutatud koodita. keskkond, mis toodab osi nõudmisel, nagu elav mudel, mis kohandub eesmärgiga.
See on vihje programmeeritavate agentide tulevikule, kus spetsifikatsiooni ja teostuse vahelised piirid on hägused. paindlikumad torujuhtmed ja need on tahkestunud kasutatavateks tööriistadeks vähemate vahendajatega.
Kasutusjuhud: küberturvalisusest sisuni
Anthropic on suunatud laiale rakenduste spektrile, alustades tehnilistest ja ettevõtte meeskondadest. küberjulgeolek, peitub potentsiaali agentides, mis suudavad haavatavusi tuvastada ja parandada ilma pideva inimese sekkumiseta. haavatavuste tuvastamine ja parandamine, mis kiirendab reageerimisaega.
Finantsvaldkonnas on võtmeroll regulatiivsete muudatuste jälgimisel ja riskijuhtimisel. Seda toetab 92% tulemus Valsi tehisintellekti testis, mis on loodud noorema finantsanalüütiku oskuste hindamiseks. kontrollide automatiseerimine, alati kriitilise tähtsusega inimeste järelevalve all.
Produktiivsuse osas on rõhk eri vormingutes kontorifailide redigeerimisel ja loomisel Claude'ist lahkumata. ideede teisendamine toimivateks dokumentideksja siin kasutab mudel oma uusi pikki väljundvõimalusi, et tarnida terviklikumaid detaile.
Uurimistöö puhul on sise- ja välisandmete integreerimine kesksel kohal: alates allikate kogumisest kuni viidete ja lisadega aruannete koostamiseni. säilitada järjepidevust tundide kaupa, kus niit tavaliselt enamikul osalejatel katkeb.
Sisu loomisel on rõhk nüansirikkal mõistmisel ja sügavamal semantilisel analüüsil. kohanda tooni, struktuuri ja faktilist täpsust, midagi kriitilist toimetuslikes artiklites või tehnilises dokumentatsioonis, mis peab olema korras.
Võrdlusnäitajad, võrdlused ja ettevaatusabinõud
Sonnet 4.5 võrdlustulemused näevad head välja: OSWorldil 61,4%, mis on 19,2 punkti võrra parem tulemus kui eelmisel versioonil; SWE-pink Kontrollitud, alternatiividest eespool OpenAI y Google92% Vals AI finantsorientatsiooniga ettevõtetes. võrdlusaluste tugi.
Siiski tasub meeles pidada, et võrdlusalused ei vasta pärismaailmale. On oht kogemata mõnda neist testidest harjutada või kujundada hinnanguid, mis sobivad paremini teatud mudelitega. positiivne üllatus, viidates programmide käegakatsutavatele edusammudele võrreldes varasemate lemmikutega.
Saadavus, paketid ja hinnad
Sonett 4.5 on saadaval Claude'i veebisaidil ja aadressil apps iOS ja Android igale kasutajale. Paralleelselt saavad arendajad selle integreerida Claude'i arendajaplatvormilt ning ka Amazon Bedrocki ja Google Cloud Vertex AI kaudu. laialdane kasutuselevõtt mis hõlbustab nii kiiret testimist kui ka tõsiseid projekte tootmises.
Tasuta pakett töötab seansi limiidiga, mis lähtestatakse iga viie tunni järel, ja muutuva sõnumite arvuga, mis põhineb praegusel nõudlusel. 3 dollarit miljoni žetooni kohta ja 15 dollarit miljoni väljundmärgi kohta, säilitades sama skeemi nagu Sonnet 4-l.
Konkurents ja turukontekst
Käivitamine sobib võidujooksuga, mis ei lase vaibuda. OpenAI surub peale oma GPT-5 liiniga ja Google jätkab survestamist Kaksikud, seega on igal iteratsioonil kaal. vastupidavatele ainetele keskendunud positsioon See tundub praegusel hetkel mõistliku seisukohana.
Varasemates osades on perekonna modellid juba tõestanud, et suudavad vastu pidada ebatavalistele maratonidele, alates ülipikkadest mängudest kuni kestvate refaktoriseerimisseanssideni. normaliseeritud toote mahutavuse järgi, mitte labori kurioosumina ega ühekordse demona.
Ohutus ja töökindlus
Anthropic rõhutab, et Sonnet 4.5 on läbinud välised kontrollid, et kinnitada selle turvalisust ja jõudlust. Samal ajal nõuab ettevõte vestlusrobotites levinud problemaatiliste käitumismustrite, näiteks sisutu meelituse või väärarusaamu tugevdavate vastuste vähendamist. välised turvaülevaated, mis on ülioluline mudeli jaoks, mis soovib integreeruda tõsistesse töövoogudesse.
Reguleeritavate õiguste, paremini määratletud tööriistade ja peenema kontekstihalduse kombinatsioon aitab ametnikel õigel teel püsida. prognoositavus ja auditeeritavus, kaks võlusõna ettevõtluskeskkonnas.
Tuttav kogemus: kaosest korra juurde
Kõige silmatorkavamate kasutusjuhtude hulgas on tüüpiline lugu kaootilisest repositooriumist, mis pikaleveninud seansi järel lõpeb puhta arhitektuuri, selge vastutuse jaotuse ja lõpuks kompileeruva projektiga. kümneid uusi faile, pärast seda, kui modellil paluti enne vastamist aega mõelda.
Korduv moraal on see, et isegi kui tulemus vajab kohendamist, kompenseerib selle juba korra ja struktuuri edasiminek. aeg investeerinud. võti pärandprojektide jaoks garantiidega.
Lisaks figuuride säravusele pakub Sonnet 4.5 selge tõlgenduse: mida pikemad ja keerukamad on ülesanded, seda rohkem kasutatakse ära nende uut vastupidavust ja laiendatud väljundit. pikk väljundvõimsus ja vastupidavus, uute funktsioonide komplekt sobib ideaalselt.
Anthropic pakub välja mudeli, mis on loodud selleks, et püsida energiline ja töötada tundide kaupa mõistlikult, kasutades tööriistu, mis sobivad arendajate, analüütikute ja uurimisrühmade igapäevatöösse. kannatlik liitlane pikkade ülesannete jaoks, mida toetavad võrdlusandmed, platvormi täiustused ja juba testimiseks ja juurutamiseks saadaval olev pakkumine.
Kirglik kirjanik baitide maailmast ja üldse tehnoloogiast. Mulle meeldib jagada oma teadmisi kirjutamise kaudu ja just seda ma selles ajaveebis teengi, näitan teile kõike kõige huvitavamat vidinate, tarkvara, riistvara, tehnoloogiliste suundumuste ja muu kohta. Minu eesmärk on aidata teil digimaailmas lihtsal ja meelelahutuslikul viisil navigeerida.