- Opus 4.5 leitet ein Programmierung und Agenten, mit 80,9 % im SWE-Bench und besser als die Konkurrenz.
- Neuer Aufwandsparameter und Preissenkung auf 5/25 USD pro Million Token.
- Aktualisierungen in Chrome, Excel und Claude Code mit verbesserter Sicherheit und Speicherkapazität.
- Strenge Nutzungsbeschränkungen und regionale Endpunkte mit einem Cloud-Aufschlag von 10 %.
Claude Opus 4.5 Es ist da und verfolgt ein klares Ziel: sich an die Spitze in den Bereichen Programmierung, intelligente Agenten und Büroanwendungen zu positionieren. Anthropics Angebot beschränkt sich nicht auf vollmundige Schlagzeilen; es enthält Zahlen, Vergleiche und Produktänderungen, die – zumindest auf dem Papier – unsere Art der Nutzung revolutionieren könnten. IA im realen Arbeitsalltag.
Abgesehen vom direkten Wettbewerb mit anderen Branchenriesen, Das Update beinhaltet einen Quantensprung in der Token-Effizienz und der Aufwandskontrolle.Neben Verbesserungen bei Sicherheit, Werkzeugnutzung, Speicher und einer Vielzahl neuer Anwendungsintegrationen handelt es sich nicht nur um ein schnelleres Modell: Es ist eine Plattform, die für lange, multiagentenbasierte und weniger reibungslose Arbeitszyklen konzipiert ist.
Was ist Opus 4.5 und warum hat es so viel Aufsehen erregt?
Dies geschieht nur wenige Tage nach den Aktionen der Konkurrenz und mit einer deutlichen Positionierung: Anthropic präsentiert es als sein leistungsfähigstes Modell und das Bessere KI für jede Aufgabe in den Bereichen Programmierung, Agentenmanagement und ComputernutzungDas Unternehmen hebt außerdem seinen Wert in den Bereichen eingehende Recherche, Dokumentenerstellung sowie visuelles und mathematisches Denken hervor.
Um nicht im Bereich der Theorie zu verharren, behauptet das Unternehmen, dass das Modell Es übertrifft andere Maßstäbe wie zum Beispiel Gemini 3 Pro und GPT-5.1 Codex-Max im Bereich des Software-Engineering-Testings. Und in der Praxis ist die Idee klar: weniger Schritte, höhere Präzision und bessere Koordination mit Tools in komplexen Arbeitsabläufen.

Gemessene Leistung: Benchmarks und Tests unter realen Bedingungen
Im Benchmark für Softwareentwicklung, SWE-Bench Verified, Opus 4.5 erreicht eine Genauigkeit von 80,9 %.Es übertrifft sowohl seine Vorgänger als auch die führenden Konkurrenten. Diese Daten sind wichtig, da sie die Fähigkeit messen, reale Probleme in GitHub-Projekten zu lösen, und nicht nur spielerische Übungen.
Anthropic ist mit einem noch weiter gegangen. realer Einstellungstest für IngenieureDer zweistündige Test, dessen Schwierigkeitsgrad bewertet wurde, bestand laut Hersteller darin, dass das Modell die Aufgaben nicht nur löste, sondern auch... Er hat alle menschlichen Kandidaten besiegt. die dieselbe Prüfung ablegten und dabei auf Strategien wie die parallele Berechnung von Hypothesen zurückgriffen.
Auch bei alltäglichen Büroarbeiten ist der Sprung spürbar: bessere Ergebnisse in Tabellenkalkulationenmit gemeldeten Genauigkeitssteigerungen von 20 % und Effizienzsteigerungen von 15 % bei Finanzmodellen, zusätzlich zur Fähigkeit zur Organisation DatenbankenErstellen Sie Präsentationen und verfassen Sie ausführliche Berichte, ohne den roten Faden zu verlieren.
All dies wird durch einen langfristigen Kontext von bis zu 200.000 Token in internen Tests und ein verstärktes Arbeitsgedächtnismanagement unterstützt, wobei Längere Gespräche profitieren von automatischen Zusammenfassungen. um Konsistenz zu gewährleisten, ohne an die Grenzen des Fensters zu stoßen.
Effizienz, Kosten und der neue Aufwandsparameter
Ein Unterscheidungsmerkmal ist der Preis: Der API-Preis sinkt von 15 bzw. 75 US-Dollar pro Million Entry- und Exit-Token auf 5 bzw. 25 US-Dollar.Dies öffnet die Tür für Automatisierungen, die zuvor für den alltäglichen Gebrauch zu teuer waren.
Der entscheidende technische Faktor zur Maximierung der Einsparungen ist der Aufwandsparameter mit den Stufen niedrig, mittel und hoch. Bei mittlerem Aufwand, Opus 4.5 erreicht die gleiche Leistung wie Sonnet 4.5 auf SWE-Bench Verified, benötigt aber 76 % weniger Ausgabetoken.Mit großer Mühe Es übertrifft Sonnet 4.5 um 4,3 Prozentpunkte und verbraucht dabei dennoch 48 % weniger Token.Die Neuheit besteht hier nicht nur in der Kontrolle, sondern auch in der Möglichkeit, die Tiefe der Argumentation zu variieren, ohne das Modell zu verändern.
Diese Anpassung wirkt sich auf die gesamte Antwort aus: Text, Werkzeugaufrufe und erweitertes DenkenMit geringem Aufwand erhalten Sie prägnantere und effizientere Antworten; mit hohem Aufwand erhalten Sie detaillierte Analysen und ausführliche Erklärungen für komplexe Sachverhalte.
Die Abrechnung bringt auch praktische Nuancen mit sich: Anthropic erkennt automatische Optimierungen, die Anfragen nur wenige Token hinzufügen.Er stellt jedoch klar, dass diese vom System hinzugefügten Token nicht berechnet werden. Kleine Details, ja, aber sie spielen bei der Skalierung eine Rolle.
Mehr als nur Code: Agenten, Büroautomation und Computernutzung
Opus 4.5 setzt hohe Ziele in der Programmierung, aber Ihre Verbesserungen hören damit nicht auf.Das Modell eignet sich hervorragend zur Erstellung professioneller Dokumente, Tabellenkalkulationen und Präsentationen sowie zur Bearbeitung von Rechercheaufgaben mit mehreren Quellen und zur Verwaltung langer Gedankengänge, ohne den relevanten Kontext aus den Augen zu verlieren.
Bei den Agentenfähigkeiten geht die Koordination eine Stufe höher: Effektives Management von Subagententeams Für komplexe Multiagentensysteme, die in der Lage sind, Aufgaben aufzuteilen, Prioritäten zu setzen und in langen Arbeitsabläufen über Stunden hinweg stetig voranzukommen.
Im Bereich der Computernutzung beinhaltet das Update Folgendes: Zoomfunktion zur detaillierten Untersuchung von Bildschirmbereichen in voller Auflösung. Dies ist nützlich zum Lesen von Kleingedrucktem, zur Analyse von Benutzeroberflächen mit vielen Informationen oder zur Überprüfung von Details vor dem Handeln.
Die Kombination aus Vernunft, Werkzeugen und Speicher ermöglicht es Opus 4.5, Folgendes durchzuführen Zu den Aufgaben gehören Migration und Code-Refactoring, Berichtserstellung und Desktop-Automatisierung. mit weniger Spielzügen und weniger Tokenverschwendung.
Sicherheit und Robustheit: Ausrichtung versus sofortige Einspritzung
Autonomie wirft Fragen nach Kontrolle und ZuverlässigkeitHier behauptet Anthropic, dass dies seine robusteres, ausgerichtetes Modell Bis heute wurden konkrete Fortschritte im Kampf gegen Befehlsinjektionsangriffe erzielt, die versuchen, das Systemverhalten zu manipulieren.
Dies ist kein unwichtiges Detail: Der Einsatz von Agenten mit Zugriff auf Tools erfordert zusätzliche Schutzmaßnahmen.Das Unternehmen beteuert, die Sicherheitsvorkehrungen verstärkt zu haben, ohne die Benutzerfreundlichkeit zu beeinträchtigen. Dennoch empfiehlt es bewährte Designpraktiken und die Hinzuziehung eines Experten in sensiblen Situationen.
Ökosystem und Apps: Was ist neu in Claude Code, Chrome und Excel?
Das Update beschränkt sich nicht auf das Modell. Es erstreckt sich auf die gesamte Produktpalette. Claude Code verbessert seinen PlanungsmodusBevor Sie beginnen, stellen Sie klärende Fragen und erstellen Sie eine bearbeitbare Datei mit dem Plan, um die Überprüfung und Kontrolle zu erleichtern.
Im Browser, Claude für Chrome ist für Max-Nutzer veröffentlicht.mit dem Versprechen, Aufgaben über mehrere Registerkarten hinweg zu verwalten und Aktionen in längeren Arbeitssitzungen zu koordinieren. Für alle, die mit Tabellenkalkulationen arbeiten, Claude für Excel ist jetzt für Max, Team und Enterprise verfügbar., mit Unterstützung für Diagramme, Pivot-Tabellen und Datei-Uploads.
Eine der praktischsten neuen Funktionen der App ist, dass Lange Gespräche bleiben nicht länger steckenDas System fasst den vorherigen Kontext bei Bedarf automatisch zusammen, um Sitzungen zu verlängern und so Konsistenz und Nachvollziehbarkeit der Entscheidungen zu gewährleisten.
All dies geht einher mit der Verfügbarkeit von Opus 4.5 in die API und auf den wichtigsten Cloud-PlattformenDies ermöglicht die Integration in bestehende Pipelines, ohne auf dedizierte Bereitstellungen warten zu müssen.
Drei 4.5-Zoll-Modelle für unterschiedliche Bedürfnisse: Opus, Sonnet und Haiku
Die 4.5-Familie ist in drei Profile unterteilt. Opus 4.5 ist die ultimative Intelligenz Mit praktischer Leistung für anspruchsvolle Spezialaufgaben, professionelles Engineering und hochentwickelte Agenten. Es ist das einzige, das den Aufwandsparameter akzeptiert.
Sonnet 4.5 Es ist das Arbeitspferd für die Programmierung und komplexe Agenten. Es bringt Verbesserungen im gesamten Entwicklungszyklus: Systemplanung und -design, Sicherheitsentwicklung, genauere Anweisungen folgen und ein prägnanter und natürlicher Kommunikationsstil mit faktenbasierten Fortschrittsberichten.
In puncto Agentenfunktionen arbeitet Sonnet 4.5 stundenlang autonom und behält dabei den Fokus bei. unter Berücksichtigung des Kontextes und des Token-Budgets in Echtzeit. Es nutzt parallele Toolaufrufe, koordiniert mehrere Quellen besser und erhält den Zustand zwischen langen Sitzungen aufrecht.
Haiku 4.5 Es konzentriert sich auf Geschwindigkeit und Kosten und erzielt eine nahezu Spitzenleistung zu einem Drittel des Preises bei mehr als der doppelten Geschwindigkeit des Sonnet 4. Es bietet zum ersten Mal Dieser Gedanke wurde auf die Haiku-Linie ausgedehnt., mit optionaler Gedankenzusammenfassung, die zwischen Werkzeugaufrufen und der Budgetkontrolle für Gedankentoken eingestreut ist.
Damit wird Anthropic stellt das Gleichgewicht in seinem Katalog wieder herIn den letzten Monaten hat Sonnet 4.5 den älteren Opus 4.1 in den Schatten gestellt; jetzt erobern beide Modelle ihren Platz in Bezug auf Kosten, Geschwindigkeit und Kapazität zurück.
Nutzung von Tools und neuen APIs: Was ändert sich täglich?
Für Workflows mit mehreren Werkzeugen führt Anthropic ein programmatische WerkzeugaufrufeDas Modell kann Code schreiben, der Tools innerhalb eines Ausführungscontainers aufruft, wodurch die Roundtrip-Latenz reduziert und Daten gefiltert werden, bevor sie in das Kontextfenster geladen werden.
Wenn Sie Hunderte von Werkzeugen haben, die neuen Werkzeuge suchen Es ermöglicht Ihnen, nur das zu ermitteln und dynamisch zu laden, was benötigt wird. Es gibt zwei Varianten: die Verwendung von regulären Ausdrücken mit dem Tool. tool_search_tool_regex_20251119und durch natürlichsprachliche Abfragen mit tool_search_tool_bm25_20251119Dadurch werden 10.000 bis 20.000 Kontext-Token eingespart, da nicht der gesamte Katalog geladen wird.
Um die Genauigkeit der Vorladungen zu verbessern, können Sie beitragen Beispiele für die Werkzeugverwendung mit gültigen Eingaben, um das Modell durch komplexe Abläufe zu führen; und falls Ihnen der Kontext wichtig ist, gibt es Kontextbearbeitung Dabei werden alte Aufrufe und Ergebnisse automatisch bereinigt, wenn sich das Token-Limit nähert.
Im Bereich der Ausführungskontrolle beinhalten die Modelle 4.5 neue Gründe für einen Abbruch: model_context_window_exceeded um anzuzeigen, dass das Kontextfenster erreicht wurde, und es so vom oberen Rand zu unterscheiden max_tokensund der Grund refusal Dieses Update behebt Probleme, die auftreten, wenn das System aus Sicherheitsgründen die Generierung von Inhalten verweigert. Außerdem wird ein Fehler behoben, der dazu führte, dass Zeilenumbrüche beim Übergeben von Parametern an Tools erhalten blieben.
Weiterdenken führt zu einem Ergebnis Zusammenfassung des internen Prozesses In der Messaging-API kann es bei der Übertragung zu fragmentierten Paketen mit leichten Verzögerungen kommen; nichts Kritisches, aber es ist gut, dies im Hinblick auf die Benutzerfreundlichkeit zu beachten. Streaming.
Entwicklungswerkzeuge: Texteditor und Codeausführung
Wenn Sie Claudes Texteditor verwenden, gibt es eine neue Version: Werkzeugtyp text_editor_20250728 mit name str_replace_based_edit_toolund der Befehl undo_edit Es wird nicht mehr unterstützt. Hinweis für alle, die von Sonnet 3.7 migrieren.
Für die Codeausführung wird Folgendes empfohlen: Version code_execution_20250825was hinzufügt Befehle Bash- und Dateimanipulation. Die Legacy-Variante code_execution_20250522 Es ist noch erhältlich, aber da es nur Python Für Neuimplementierungen wird es nicht empfohlen.
Diese Änderungen, zusammen mit der Unterstützung von abwechselnde Verwendung von Werkzeugen und erweitertem DenkenSie drängen auf natürlichere Abläufe hin, in denen das Modell schlussfolgert, Werkzeuge konsultiert und das Gespräch ohne künstliche Sprünge fortsetzt.
Preisgestaltung, Endpunkte und Cloud-Verfügbarkeit
Bei einem Preisverfall auf 5 US-Dollar pro Million eingehender und 25 US-Dollar pro Million ausgehender Token. Die 4.5-Modelle bieten weiterhin wettbewerbsfähige Preise.Außerdem gibt es eine neue Funktion für Endpunkte, wenn diese über Cloud-Anbieter genutzt werden.
AWS Bedrock und Google Vertex AI bietet globale und regionale Endpunkte. Für Opus 4.5, Sonnet 4.5 und Haiku 4.5 garantieren regionale APIs geografisches Routing gegen einen Preisaufschlag von 10 %. Die proprietäre API von Anthropic ist standardmäßig global und von dieser Änderung nicht betroffen.
Opus 4.5 ist verfügbar in Anwendungen, API und Hauptplattformen von Anthropiceinschließlich Integrationen wie Amazon Bedrock. Dies reduziert die zeit zur Implementierung in Geschäftsumgebungen.
Einschränkungen und Kleingedrucktes: Was Sie wissen sollten
Die Achillesferse ist im Moment die Nutzungslimits und KontingenteSelbst bei den Pro- und Max-Tarifen gehen die Tokens schnell zur Neige, und der Zähler wird alle fünf Stunden ab der ersten Nachricht zurückgesetzt. Da Opus der leistungsstärkste Tarif ist, werden die Tokens auch schneller verbraucht, was bei Nutzern, die 20 oder sogar 100 Dollar pro Monat zahlen, zu Frustration führt.
Anthropic priorisiert Verfügbarkeit. Vereinigte Staaten und WesteuropaBei Standorten in Lateinamerika oder im asiatisch-pazifischen Raum kann die Latenz höher sein und die Unterstützung lokaler Sprachen eingeschränkter. Es empfiehlt sich, die Latenz in Echtzeit zu messen, bevor kritische Implementierungen vorgenommen werden.
Ein weiterer Punkt ist die Abhängigkeit von Konnektivität und Cloud-DienstenIntegrationen wie Excel und Chrome basieren auf Cloud-Diensten. Für regulierte Branchen, die lokale Installationen erfordern, müssen private Bereitstellungen ausgehandelt oder in bestimmten Szenarien offene Modelle in Betracht gezogen werden.
Um Opus 4.5 optimal zu nutzen, ist schließlich Folgendes erforderlich: Schulung in prompter Entwicklung, Kontextmanagement und DebuggingOhne gute Vorgehensweisen werden Kapazitäten verschwendet und die Ausgaben für Alibi-Maßnahmen schnellen in die Höhe; es lohnt sich, in interne Schulungen zu investieren.
Strategie und Vergleich: Wo positioniert es sich im Vergleich zu OpenAI und Google?
Mit Opus 4.5 positioniert sich Anthropic als Premium-Anbieter für Fachleute und EntwicklerIm direkten Wettbewerb bei Anwendungen, bei denen Präzision und Zuverlässigkeit von größter Bedeutung sind, hat dieser Wettbewerb einen Preis- und Leistungskampf entfacht, der dem Käufer zugutekommt, und die Kombination aus Leistung, Kosten und Aufwandskontrolle ist ein starker Anreiz.
Im Vergleich zu Konkurrenzprodukten zeichnet sich Opus 4.5 durch folgende Merkmale aus: Arbeitsabläufe mit autonomen Werkzeugen und AgentenBei Multimodalität oder reinem Denken ist die Kluft zu einigen konkurrierenden Modellen kleiner, aber die Funktionsmenge des 4.5-Ökosystems gibt in Produktionsszenarien, die Ausdauer und Koordination erfordern, den Ausschlag.
Wann sollte man migrieren und wie kann man dies innerhalb des Unternehmens bewerten?
Wenn Sie von Claude 3.5 oder Opus 4.1 kommen, sollten Sie den Umstieg in Erwägung ziehen, wenn Sie benötigen komplexe Schlussfolgerungen, ein hohes Token-Volumen oder Agentenfähigkeiten. mit Zugang zu den entsprechenden Tools. Bei über 10 Millionen Token pro Monat gleichen die Einsparungen den Aufwand für die Umstrukturierung aus.
Anthropische Dokumente über Migrationsrouten mit und ohne Abspaltungen: Sonett 3.7 bis Sonett 4.5, Haiku 3.5 bis Haiku 4.5 (weitere Änderungen) und reibungslose Upgrades von Opus 4.1 auf Sonnet 4.5 oder Opus 4.5. Es wird empfohlen, die Checklisten vor dem Wechsel der Produktionsumgebungen zu überprüfen.
Um diese Entscheidung zu treffen, fragen Sie sich, ob Sie wiederkehrende Prozesse mit ausreichendem Volumen haben. Kontrolle über Daten und ValidierungskriterienUnd klare KPIs, die eingesparte Stunden, Fehler und Reaktionszeiten messen. Ohne Kennzahlen ist jeder Pilot orientierungslos.
Praktische Checkliste für eine sichere Einführung: Datenschutzrichtlinien und Datenschutzvereinbarungen beschränkter Machbarkeitsnachweis (zum Beispiel Support-Tickets oder Besprechungszusammenfassungen), interne Schulung von zwei Schlüsselpersonen, Kostenüberwachung mit Warnmeldungen und ein Notfallplan für den Fall, dass sich der Service ändert oder ausfällt.
Für Entwickler: Verwenden Sie Opus 4.5 im Cursor- und Claude-Code.
Um Opus 4.5 im täglichen Entwicklungsalltag optimal nutzen zu können, Erstellen Sie ein Anthropic-Konto und generieren Sie einen API-Schlüssel.Aktivieren Sie den Zugriff auf das Modell entsprechend Ihrem Plan (Max, Team oder Enterprise) und konfigurieren Sie Ihre gewohnten Tools, einschließlich Deepseek-Programmierer.
Fügen Sie in Cursor Folgendes hinzu: Anthropischer API-Schlüssel im Abschnitt „Modelle“ Wählen Sie im KI-Chat-Panel Opus 4.5 aus. Sie können direkt in der IDE mit chatgestützter Autovervollständigung und Multi-Agent-Abläufen arbeiten; es gibt einen kostenpflichtigen Cursor Pro-Plan, der laut Anbieter einen vereinfachten Zugriff auf erweiterte Modelle ermöglicht.
Starten Sie in Claude Code die CLI in Ihrem Projektverzeichnis. Melden Sie sich mit Ihrem Passwort an Ändern Sie das Modell mithilfe des Auswahlbefehls. Aktivieren Sie anschließend den Planungsmodus, um sich Schritte vorschlagen zu lassen, bevor Sie Code bearbeiten, und nutzen Sie ihn zum Refactoring, Debuggen oder Ausführen zielgerichteter Skripte.
Bewährte Vorgehensweise: Je nach Bedarf zwischen Vorlagen wechseln (Haiku oder Sonett für einfache Aufgaben, Opus, wenn die Vernunft es erfordertÜberwachen Sie die Token-Nutzung, um Abweichungen zu vermeiden und die Ratenbegrenzungen einzuhalten. Falls Autorisierungsfehler in Drittanbieter-Tools auftreten, prüfen Sie, ob das entsprechende Modell für Ihr Konto aktiviert ist und ob Sie die neueste Client-Version verwenden.
Häufig gestellte Fragen finden Sie in der entsprechenden Publikation. die Tools, das Hilfecenter und die Foren, wobei bekannte Vorfälle wie fragmentierte Antworten beim erweiterten Denken oder nicht autorisierte Modellnachrichten aufgelistet werden, wenn der API-Schlüssel nicht mit dem vertraglich vereinbarten Plan übereinstimmt.
In Anbetracht all dessen, Opus 4.5 vereint leistungsstarke Benchmarks, optimierte Kostenkontrolle und Plattformverbesserungen. Dies macht es besonders attraktiv für Softwareentwicklung, Büroautomation und autonome Systeme. Die Frage der Nutzungsbeschränkungen muss noch geklärt werden, um das Nutzererlebnis vollständig abzurunden, aber die Richtung ist klar: höhere Qualität pro Token und ein Ökosystem, das besser für reale, nachhaltige Arbeit gerüstet ist.
Leidenschaftlicher Autor über die Welt der Bytes und der Technologie im Allgemeinen. Ich liebe es, mein Wissen durch Schreiben zu teilen, und genau das werde ich in diesem Blog tun und Ihnen die interessantesten Dinge über Gadgets, Software, Hardware, technologische Trends und mehr zeigen. Mein Ziel ist es, Ihnen dabei zu helfen, sich auf einfache und unterhaltsame Weise in der digitalen Welt zurechtzufinden.
