Claude Opus 4.5: nye funktioner, priser og reelle forbedringer

Mundobytes » Kunstig intelligens » Claude Opus 4.5: alle de nye funktioner, priser og forbedringer

Opus 4.5 fører an programmering og agenter, med 80,9% i SWE-Bench og bedre end konkurrenterne.
Ny indsatsparameter og prisfald til 5/25 USD pr. million tokens.
Opdateringer i Chrome, Excel og Claude Code med forbedret sikkerhed og hukommelse.
Strenge brugsgrænser og regionale slutpunkter med en cloud-præmie på 10%.

AI-billede og produktivitet med Claude Opus 4.5

Claude Opus 4.5 Den er her, og den kommer med en klar ambition: at positionere sig i toppen inden for programmering, intelligente agenter og kontoropgaver. Anthropics forslag stopper ikke ved storslåede overskrifter; det kommer med tal, sammenligninger og produktændringer, der på papiret kan omdefinere, hvordan vi bruger IA i det rigtige arbejde.

Ud over direkte konkurrence med andre giganter i sektoren, Opdateringen inkorporerer et spring i tokeneffektivitet og indsatskontrolSammen med forbedringer i sikkerhed, værktøjsbrug, hukommelse og en række nye applikationsintegrationer er det ikke bare en hurtigere model: det er en platform designet til lange, multi-agent og mindre gnidningsfri arbejdscyklusser.

relateret artikel:

Vibe arbejder i Excel og Word: Agenttilstand og Office-agent

Hvad er Opus 4.5, og hvorfor har det skabt så meget røre?

Det kommer blot få dage efter konkurrenternes træk, med en rungende positionering: Anthropic præsenterer den som sin mest kapable model, og Bedre AI til enhver opgave inden for programmering, agentstyring og computerbrugVirksomheden fremhæver også sin værdi inden for dybdegående research, dokumentoprettelse samt visuel og matematisk ræsonnement.

For at undgå at forblive i teoriens sfære fastholder firmaet, at modellen Den overgår andre benchmarks som f.eks. Gemini 3 Pro og GPT-5.1 Codex-Max inden for softwareudviklingstest. Og i praksis er ideen klar: færre trin, mere præcision og bedre koordinering med værktøjer i komplekse arbejdsgange.

Claude Opus 4.5 nye udgivelser

Målt ydeevne: benchmarks og tests i den virkelige verden

I benchmarken for softwareudvikling, SWE-Bench Verified, Opus 4.5 opnår en nøjagtighed på 80,9%og overgår både sine forgængere og topkonkurrenter. Disse data er vigtige, fordi de måler evnen til at løse virkelige problemer i GitHub-projekter, ikke bare øvelser.

Antropisk er gået videre med en en rigtig ansættelsestest for ingeniørerTesten, der var tidsbestemt til to timer og bedømt efter dens sværhedsgrad, gik ifølge virksomheden ud på, at modellen ikke kun løste øvelserne, men også... Han slog alle de menneskelige kandidater som tog den samme eksamen, og benyttede sig af strategier som parallel beregning af hypoteser.

I de daglige kontoropgaver er springet også mærkbart: bedre resultater i regnearkmed rapporterede stigninger i nøjagtighed på 20% og effektivitet på 15% i finansielle modeller, udover evnen til at organisere databaserForbered præsentationer og skriv lange rapporter uden at miste tråden.

Alt dette understøttes af en langsigtet kontekst med op til 200.000 tokens i intern testning og forstærket arbejdshukommelsesstyring, hvor Lange samtaler drager fordel af automatiske opsummeringer for at opretholde konsistens uden at støde på vinduesgrænser.

Billede af AI-agent og værktøjer

Effektivitet, omkostninger og den nye indsatsparameter

En differentierende faktor er prisen: API-prisen falder fra $15 og $75 pr. million entry- og exit-tokens til $5 og $25.henholdsvis. Dette åbner døren for automatiseringer, der tidligere var for dyre til daglig brug.

Det vigtigste tekniske element for at maksimere besparelser er indsatsparameteren med lave, mellem og høje niveauer. Ved mellem indsats, Opus 4.5 matcher Sonnet 4.5's ydeevne på SWE-Bench Verified med 76% færre output-tokensMed stor indsats, Den overgår Sonnet 4.5 med 4,3 procentpoint og bruger stadig 48% færre tokens.Det nye her er ikke kun kontrollen, men også muligheden for at variere dybden af ræsonnementet uden at ændre modellen.

Denne justering påvirker hele svaret: tekst, værktøjsopkald og udvidet tænkningMed en lav indsats får du mere præcise og effektive svar; med en stor indsats får du detaljerede analyser og omfattende forklaringer på komplekse scenarier.

Fakturering introducerer også praktiske nuancer: Anthropic genkender automatiske optimeringer, der tilføjer få tokens til anmodningerHan præciserer dog, at disse tokens, der tilføjes af systemet, ikke opkræves. Små detaljer, ja, men de betyder noget, når man skalerer.

Ret fejl 8DDD0020 i Microsoft Update

Mere end kode: agenter, kontorautomation og computerbrug

Opus 4.5 sigter højt inden for programmering, men Deres forbedringer stopper ikke derModellen udmærker sig ved at oprette professionelle dokumenter, regneark og præsentationer samt ved researchopgaver med flere kilder, hvor den håndterer lange tråde uden at miste relevant kontekst.

I agentfunktioner går koordineringen et niveau op: Effektiv ledelse af underagentteams Til komplekse systemer med flere agenter, i stand til at opdele arbejde, prioritere og opnå stabile fremskridt i timevis i lange arbejdsgange.

På computerbrugsfronten indeholder opdateringen en zoomfunktion til detaljeret inspektion af områder på skærmen i fuld opløsning. Dette er nyttigt til at læse småt, analysere grænseflader med tæt information eller verificere detaljer, før der foretages handling.

Kombinationen af ræsonnement, værktøjer og hukommelse gør det muligt for Opus 4.5 at påtage sig Opgaverne omfatter migrering og kodeomstrukturering, rapportgenerering og desktopautomatisering. med færre ture og mindre spild af poletter.

Sikkerhed og robusthed: justering versus hurtig injektion

Autonomi rejser spørgsmål om kontrol og pålidelighedHer hævder Antropisk, at dette er dens mere robust justeret model Til dato har der været konkrete fremskridt mod instruction injection-angreb, der forsøger at afbøje systemadfærd.

Dette er ikke en ubetydelig detalje: Implementering af agenter med adgang til værktøjer kræver yderligere forsvar.Virksomheden fastholder, at den har styrket barriererne uden at gå på kompromis med brugervenligheden. Alligevel anbefaler de god designpraksis og menneskeligt tilsyn i følsomme scenarier.

Økosystem og apps: Nyheder i Claude Code, Chrome og Excel

Opdateringen stopper ikke ved modellen. Den strækker sig til produktstakken. Claude Code forbedrer sin planlægningstilstandFør du går i gang, stil afklarende spørgsmål og opret en redigerbar fil med planen for at lette gennemgang og kontrol.

I browseren, Claude til Chrome er udgivet til Max-brugeremed løftet om at administrere opgaver på tværs af flere faner og koordinere handlinger i længere arbejdssessioner. For dem, der arbejder med regneark, Claude for Excel kommer til Max, Team og Enterprise, med understøttelse af diagrammer, pivottabeller og filuploads.

I appen er en af de mest praktiske nye funktioner, at Lange samtaler sidder ikke længere fastSystemet opsummerer automatisk den foregående kontekst efter behov for at forlænge sessioner, hvilket sikrer konsistens og sporbarhed af beslutninger.

Alt dette kommer sideløbende med tilgængeligheden af Opus 4.5 i API'en og på de vigtigste cloudplatformeDette letter integration i eksisterende pipelines uden at skulle vente på dedikerede implementeringer.

Tre 4.5-tums modeller til forskellige behov: Opus, Sonnet og Haiku

4.5-familien er organiseret i tre profiler. Opus 4.5 er den ultimative intelligens Med praktisk ydeevne til specialiserede opgaver på højt niveau, professionel teknik og avancerede agenter. Det er den eneste, der accepterer indsatsparameteren.

Sonnet 4.5 Det er arbejdshesten til kodning og komplekse agenter. Det bringer forbedringer på tværs af hele udviklingslivscyklussen: systemplanlægning og -design, sikkerhedsteknik, mere præcis opfølgning på instruktioner og en præcis og naturlig kommunikationsstil med faktabaserede statusopdateringer.

I agentfunktioner arbejder Sonnet 4.5 autonomt i timevis, samtidig med at den bevarer fokus. med bevidsthed om konteksten og tokenbudgettet i realtid. Den bruger parallelle værktøjskald, koordinerer bedre flere kilder og bevarer tilstanden mellem lange sessioner.

Haiku 4.5 Den fokuserer på hastighed og omkostninger og opnår ydeevne i absolut topklasse til en tredjedel af prisen, med mere end dobbelt så hastighed som Sonnet 4. Den bringer for første gang tanken udvidet til Haiku-linjen, med valgfri tankeopsummering, ispækket mellem værktøjskald og budgetkontrol med tanketoken.

Med dette, antropisk genopretter balancen i sit katalogI de seneste måneder har Sonnet 4.5 overskygget den ældre Opus 4.1; nu genvinder hver model sin plads med hensyn til pris, hastighed og kapacitet.

Hvad er en SRT-fil? Hvad det er til og hvordan man åbner

Brug af værktøjer og nye API'er: hvad der ændrer sig dagligt

Til arbejdsgange med flere værktøjer introducerer Anthropic programmatiske værktøjskaldModellen kan skrive kode, der kalder værktøjer i en udførelsescontainer, hvilket reducerer round-trip latency og filtrerer data, før de indlæses i kontekstvinduet.

Hvis du har hundredvis af værktøjer, er det nye søg efter værktøjer Det giver dig mulighed for kun at opdage og dynamisk indlæse det, der er nødvendigt. Der er to variationer: brug af regex-mønstre med værktøjet tool_search_tool_regex_20251119og gennem naturlige sprogforespørgsler med tool_search_tool_bm25_20251119, hvilket sparer 10.000 til 20.000 konteksttokens ved ikke at indlæse hele kataloget.

For at forbedre nøjagtigheden af indkaldelser kan du bidrage eksempler på brug af værktøjer med gyldige input til at guide modellen gennem komplekse ordninger; og hvis du er bekymret for kontekst, er der kontekstredigering som automatisk rydder op i gamle kald og resultater, når tokengrænsen nærmer sig.

I udførelseskontrol inkluderer 4.5-modellerne nye årsager til stop: model_context_window_exceeded for at angive, at kontekstvinduet er nået, og adskille det fra toppen af max_tokensog årsagen refusal Denne opdatering løser problemer, der opstår, når systemet af sikkerhedsmæssige årsager nægter at generere indhold. Derudover retter den en fejl, der bevarer linjeskift, når parametre overføres til værktøjer.

Udvidet tænkning returnerer en opsummering af den interne proces i messaging API'en, og når den sendes, kan den ankomme i fragmenterede leverancer med små forsinkelser; intet kritisk, men det er værd at huske på for brugeroplevelsen af streaming.

Udviklingsværktøjer: teksteditor og kodeudførelse

Hvis du bruger Claudes teksteditor, er der en ny version: type værktøj text_editor_20250728 med navn str_replace_based_edit_toolog kommandoen undo_edit Det understøttes ikke længere. Bemærk, hvis du migrerer fra Sonnet 3.7.

Til kodeudførelse anbefales følgende: udgave code_execution_20250825, hvilket tilføjer kommandoer Bash og filmanipulation. Den ældre variant code_execution_20250522 Den er stadig tilgængelig, men da den kun er Python Det anbefales ikke til nye implementeringer.

Disse ændringer, sammen med støtte fra intersfereret brug af værktøjer og udvidet tænkningDe stræber efter mere naturlige flow, hvor modellen ræsonnerer, konsulterer værktøjer og fortsætter samtalen uden kunstige spring.

Priser, slutpunkter og cloud-tilgængelighed

Med prisen faldende til $5 pr. million tokens, der kommer ind, og $25 pr. million, der kommer ud, 4.5-modellerne holder konkurrencedygtige priserDer er også en ny funktion til endpoints, når de forbruges via cloud-udbydere.

AWS grundfjeld og Google Vertex AI tilbyder globale og regionale endpoints For Opus 4.5, Sonnet 4.5 og Haiku 4.5 garanterer regionale tjenester geografisk ruteføring med en pristillæg på 10%. Anthropics proprietære API er som standard global og påvirkes ikke af denne ændring.

Opus 4.5 er tilgængelig i Anthropics applikationer, API og primære platforme, inklusive integrationer som Amazon Bedrock. Dette reducerer El tiempo til implementering i forretningsmiljøer.

Begrænsninger og småt med småt: hvad du bør vide

Achilleshælen er for øjeblikket brugsgrænser og kvoterSelv for Pro- og Max-abonnementer løber tokens hurtigt tør, og tælleren nulstilles hver femte time fra den første besked. Da Opus er det mest kraftfulde abonnement, forbruger det også tokens hurtigere, hvilket fører til frustration for brugere, der betaler $20 eller endda $100 om måneden.

Antropisk prioriterer tilgængelighed. USA og VesteuropaHvis du opererer fra Latinamerika eller Asien-Stillehavsområdet, kan latenstiden øges, og den lokale sprogunderstøttelse kan være mere begrænset. Det anbefales at måle latenstiden i realtid, før du forpligter dig til kritiske implementeringer.

Et andet punkt er afhængighed af konnektivitet og cloud-tjenesterIntegrationer som Excel og Chrome er afhængige af cloud-tjenester. For regulerede sektorer, der kræver lokale implementeringer, skal private implementeringer forhandles, eller åbne modeller skal overvejes i specifikke scenarier.

Endelig kræver det at få mest muligt ud af Opus 4.5 Træning i prompt engineering, konteksthåndtering og debuggingUden god praksis spildes kapacitet, og udgifterne til symbolske ydelser stiger voldsomt; det er værd at investere i intern træning.

Sådan bruger du Metas MusicGen lokalt uden at uploade filer til skyen

Strategi og sammenligning: hvor den passer ind i forhold til OpenAI og Google

Med Opus 4.5 positionerer Anthropic sig som Premium-udbyder til professionelle og udviklereDenne konkurrence, der konkurrerer direkte i applikationer, hvor præcision og pålidelighed er altafgørende, har udløst en pris- og kapacitetskrig, der gavner køberen, og kombinationen af ydeevne, omkostninger og indsatskontrol er en stærk lokkemiddel.

Sammenlignet med konkurrenter udmærker Opus 4.5 sig ved arbejdsgange med autonome værktøjer og agenterI multimodalitet eller ren ræsonnement er forskellen til nogle konkurrerende modeller mindre, men sættet af funktioner i 4.5-økosystemet tipper vægtskålen i produktionsscenarier, der kræver vedholdenhed og koordinering.

Hvornår skal man migrere, og hvordan skal man evaluere det i virksomheden

Hvis du kommer fra Claude 3.5 eller Opus 4.1, så overvej at tage springet, når du har brug for kompleks ræsonnement, høj tokenvolumen eller agentkapacitet med adgang til værktøjer. Med over 10 millioner tokens om måneden opvejede besparelserne omkonfigurationsindsatsen.

Antropiske dokumenterer migrationsruter med og uden udbrydningsskift: Sonnet 3.7 til Sonnet 4.5, Haiku 3.5 til Haiku 4.5 (flere ændringer) og problemfri opgraderinger fra Opus 4.1 til Sonnet 4.5 eller Opus 4.5. Det anbefales at gennemgå tjeklisterne, før produktionsmiljøer flyttes.

For at træffe beslutningen, spørg dig selv, om du har gentagne processer med tilstrækkelig volumen, kontrol over data og valideringskriterierOg klare KPI'er, der måler sparede timer, fejl og svartider. Uden målinger går enhver pilot i stå.

Praktisk tjekliste til sikker implementering: privatlivspolitikker og databeskyttelsesaftaler. begrænset bevis på konceptet (for eksempel supportsager eller møderesuméer), intern træning af to nøglepersoner, omkostningsovervågning med advarsler og en beredskabsplan i tilfælde af ændringer eller fejl i tjenesten.

For udviklere: Brug Opus 4.5 i Cursor og Claude Code

For at udnytte Opus 4.5 i den daglige udvikling, Opret en Anthropic-konto og generer en API-nøgleAktivér adgang til modellen i henhold til din plan (Max, Team eller Enterprise) og konfigurer dine sædvanlige værktøjer, herunder Deepseek-koder.

I markøren skal du tilføje Antropisk API-nøgle i modelsektionen og vælg Opus 4.5 i det AI-drevne chatpanel. Du kan arbejde med chatassisteret autofuldførelse og multi-agent flows direkte i IDE'en; der er en betalt Cursor Pro-plan, der ifølge værktøjet giver forenklet adgang til avancerede modeller.

I Claude Code skal du starte CLI'en i din projektmappe, Log ind med din adgangskode og ændr modellen ved hjælp af select-kommandoen. Derfra aktiverer du planlægningstilstanden for at foreslå trin, før du berører koden, og bruger den til at refaktorere, fejlfinde eller køre målrettede scripts.

Bedste fremgangsmåder: Skift mellem skabeloner efter behov (Haiku eller Sonnet til lette opgaver, Opus når ræsonnement kræver detOvervåg tokenbrug for at forhindre afvigelser og respekter hastighedsgrænser. Hvis der opstår godkendelsesfejl i tredjepartsværktøjer, skal du kontrollere, at din konto har modellen aktiveret, og at du bruger den nyeste version af klienten.

For ofte stillede spørgsmål, kontakt venligst værktøjernes hjælpecenter og fora, hvor kendte hændelser såsom fragmenterede svar i udvidet tænkning eller uautoriserede modelmeddelelser er angivet, når API-nøglen ikke matcher den aftalte plan.

I lyset af alt ovenstående, Opus 4.5 kombinerer benchmarking-styrke, finjusteret omkostningskontrol og platformsforbedringer Dette gør det særligt attraktivt for softwareudvikling, kontorautomation og autonome agenter. Problemet med brugsgrænser er endnu ikke løst for at fuldende oplevelsen, men retningen er klar: højere kvalitet pr. token og et økosystem, der er bedre forberedt på reelt, vedvarende arbejde.

Isaac

Passioneret forfatter om bytes-verdenen og teknologien generelt. Jeg elsker at dele min viden gennem skrivning, og det er det, jeg vil gøre i denne blog, vise dig alle de mest interessante ting om gadgets, software, hardware, teknologiske trends og mere. Mit mål er at hjælpe dig med at navigere i den digitale verden på en enkel og underholdende måde.