Claude Opus 4.5:新機能、価格、改善点

最終更新: 25/11/2025
  • Opus 4.5がリード プログラミング エージェントは、SWE-Bench で 80,9% と競合他社を上回っています。
  • 新しい努力パラメータと価格が 100 万トークンあたり 5/25 USD に下がります。
  • Chrome、Excel、Claude Code が更新され、セキュリティとメモリが強化されました。
  • 厳格な使用制限と 10% のクラウド プレミアムによる地域エンドポイント。

Claude Opus 4.5 による AI 画像と生産性

クロード・オーパス4.5 ついに登場。明確な野望を掲げて。プログラミング、インテリジェントエージェント、そしてオフィス業務の分野でトップの座に立つ。アントロピックの提案は壮大な見出しに留まらず、数字や比較、そして製品の変更点も盛り込まれており、紙面上では私たちのAIの使い方を再定義する可能性がある。 IA 実際の仕事では。

この分野の他の大手企業との直接的な競争を超えて、 このアップデートではトークンの効率と労力管理が飛躍的に向上しましたセキュリティ、ツールの使用、メモリ、および多数の新しいアプリケーション統合の改善に加えて、これは単なる高速モデルではありません。長時間のマルチエージェントで摩擦の少ない作業サイクル向けに設計されたプラットフォームです。

雰囲気のあるExcel Word
関連記事
Excel と Word で動作する Vibe: エージェント モードと Office エージェント

Opus 4.5 とは何ですか? なぜこれほど話題になっているのですか?

これは、競合他社が明確なポジショニングで動き出したわずか数日後のことである。 アントロピックはこれを最も有能なモデルとして提示しており、 あらゆるタスクに最適なAI プログラミング、エージェント管理、コンピュータの使用同社はまた、徹底的な調査、文書作成、視覚的および数学的推論における価値も強調しています。

理論の領域に留まるのを避けるために、同社はモデルを これは、次のような他のベンチマークを上回っています。 双子座 3 Pro と GPT-5.1 Codex-Max ソフトウェアエンジニアリングのテストにおいて。そして実際に、その考え方は明確です。ステップ数を減らし、精度を高め、複雑なワークフローにおけるツールとの連携を向上させます。

クロード・オーパス 4.5 新リリース

測定されたパフォーマンス:ベンチマークと実際のテスト

ソフトウェアエンジニアリングのベンチマークであるSWE-Bench Verifiedでは、 Opus 4.5は80,9%の精度を達成先行製品とトップクラスの競合製品を凌駕するパフォーマンスを発揮しました。このデータは、単なるプレイ演習ではなく、GitHubプロジェクトにおける現実世界の課題解決能力を測定するものであるため、重要です。

アントロピックはさらに進化し、 エンジニアの実際の採用テスト同社によれば、このテストは2時間かけて難易度が評価され、モデルは問題を解くだけでなく、... 彼は人間の候補者全員に勝利した 仮説の並列計算などの戦略に頼って、同じ試験を受けた人々。

日常のオフィス業務でも、この飛躍は顕著です。 スプレッドシートでより良い結果財務モデルの精度が20%、効率が15%向上したと報告されているほか、組織化能力も向上している。 データベース話の筋を見失うことなく、プレゼンテーションを準備し、長いレポートを作成します。

これらはすべて、内部テストにおける最大200.000万トークンの長期コンテキストと強化されたワーキングメモリ管理によってサポートされており、 長い会話は自動要約で改善される ウィンドウの制限に達することなく一貫性を維持します。

AIエージェントとツールのイメージ

効率、コスト、そして新たな努力パラメータ

差別化要因の 1 つは価格です。 API の価格は、エントリー トークン 100 万枚あたり 15 ドルとエグジット トークン 100 万枚あたり 75 ドルから、5 ドルと 25 ドルに下がります。それぞれです。これにより、これまでは日常的に使用するには高価すぎた自動化が可能になります。

節約を最大化するための重要な技術的要素は、低、中、高の3段階の労力パラメータです。中程度の労力では、 Opus 4.5は、SWE-Bench VerifiedでSonnet 4.5のパフォーマンスに匹敵し、出力トークンを76%削減しました。多大な努力で、 ソネット4.5を4,3パーセントポイント上回り、それでもトークン消費量は48%少ない。ここでの目新しい点は、制御だけでなく、モデルを変更せずに推論の深さを変更できることです。

この調整は応答全体に影響します。 テキスト、ツールの呼び出し、拡張思考少ない労力で、より簡潔で効率的な回答が得られ、大きな労力で、複雑なシナリオの詳細な分析と広範な説明が得られます。

請求には実用的なニュアンスも導入されます。 Anthropicはリクエストにトークンをほとんど追加しない自動最適化を認識しますしかし、システムによって追加されたトークンは課金されないことを明確にしています。確かに細かい点ですが、スケーリングにおいては重要です。

  Microsoft Update のエラー 8DDD0020 を修正する

コード以上のもの:エージェント、オフィスオートメーション、コンピュータの使用

Opus 4.5はプログラミングにおいて高い目標を掲げていますが、 彼らの改善はそれだけに留まらないこのモデルは、専門的なドキュメント、スプレッドシート、プレゼンテーションの作成、および複数のソースを使用した調査タスクに優れており、関連するコンテキストを失うことなく長いスレッドを管理します。

エージェントの機能では、調整がさらにレベルアップします。 サブエージェントチームの効果的な管理 複雑なマルチエージェント システムの場合、長いワークフローで作業を分割し、優先順位を付け、何時間も安定して進行することができます。

コンピュータの使用面では、このアップデートには 画面上の領域を詳細に検査するためのズームアクション フル解像度で。小さな文字を読んだり、情報量の多いインターフェースを分析したり、行動を起こす前に詳細を確認したりするのに役立ちます。

推論、ツール、記憶の組み合わせにより、Opus 4.5は タスクには、移行とコードのリファクタリング、レポート生成、デスクトップ自動化が含まれます。 ターン数が少なくなり、トークンの無駄も減ります。

安全性と堅牢性:アライメントと迅速な注入

自律性は制御に関する疑問を提起し、 信頼性ここで、アントロピックはこれが より堅牢に整合されたモデル 現在までに、システムの動作を逸らそうとする命令インジェクション攻撃に対する具体的な進歩がありました。

これは些細なことではありません。 ツールにアクセスできるエージェントを展開するには、追加の防御が必要です。同社は、ユーザビリティを損なうことなくセキュリティを強化したと主張している。しかしながら、デリケートな状況においては、適切な設計と人間による監視を推奨している。

エコシステムとアプリ: Claude Code、Chrome、Excel の新機能

アップデートはモデルだけに留まらず、製品スタック全体にまで及びます。 クロード・コードが計画モードを改善始める前に、明確な質問をして、レビューと管理を容易にするための計画を記載した編集可能なファイルを作成します。

ブラウザでは、 Claude for ChromeがMaxユーザー向けにリリースされました複数のタブにまたがるタスク管理や、長時間の作業セッションにおけるアクションの調整が可能になります。スプレッドシートを使用する人にとっては、 Excel 版 Claude が Max、Team、Enterprise に登場チャート、ピボット テーブル、ファイルのアップロードをサポートします。

アプリで最も実用的な新機能の一つは 長い会話が滞ることがなくなりましたシステムは、セッションを延長するために必要に応じて以前のコンテキストを自動的に要約し、決定の一貫性と追跡可能性を維持します。

これらすべてはOpus 4.5の発売と並行して行われ、 APIと主要なクラウドプラットフォームこれにより、専用のデプロイメントを待たずに既存のパイプラインへの統合が容易になります。

さまざまなニーズに対応する3つの4.5モデル:Opus、Sonnet、Haiku

4.5 ファミリは 3 つのプロファイルに分かれています。 Opus 4.5は究極のインテリジェンスです 高度な専門タスク、プロフェッショナルエンジニアリング、そして高度なエージェントのための実用的なパフォーマンスを備えています。努力パラメータを受け入れる唯一のツールです。

ソネット4.5 コーディングや複雑なエージェント開発の主力ツールです。システム計画・設計、セキュリティエンジニアリングなど、開発ライフサイクル全体にわたって改善をもたらします。 より正確な指示に従う 事実に基づいた進捗状況の更新を伴う、簡潔で自然なコミュニケーション スタイル。

エージェント機能では、Sonnet 4.5 は集中力を維持しながら何時間も自律的に動作します。 文脈とトークン予算を意識して リアルタイムで。並列ツール呼び出しを使用し、複数のソースをより適切に調整し、長時間のセッション間で状態を保持します。

俳句4.5 速度とコストに重点を置き、Sonnet 4の2倍以上の速度で、価格の3分の1で最先端のパフォーマンスを実現しました。 俳句の分野にまで広がった思考オプションの思考要約がツール呼び出しと思考トークン予算制御の間に挿入されます。

これにより、アントロピック カタログのバランスを回復ここ数か月、Sonnet 4.5 は旧型の Opus 4.1 の影に隠れていましたが、現在では各モデルがコスト、速度、容量の面で地位を取り戻しつつあります。

  .SRT ファイルとは何ですか?用途と開け方

ツールと新しいAPIの使用:日々変化するもの

マルチツールワークフロー向けに、Anthropicは プログラムによるツール呼び出しこのモデルは、実行コンテナ内でツールを呼び出すコードを記述できるため、ラウンドトリップの待ち時間を削減し、データをコンテキスト ウィンドウに読み込む前にフィルター処理することができます。

何百ものツールをお持ちの場合は、新しい ツールを探す 必要なものだけを検出し、動的にロードすることができます。2つのバリエーションがあります。ツールで正規表現パターンを使用する方法と、 tool_search_tool_regex_20251119そして自然言語クエリを通じて tool_search_tool_bm25_20251119カタログ全体をロードしないことで、10.000 ~ 20.000 個のコンテキスト トークンを節約できます。

召喚の精度を向上させるために、貢献することができます ツールの使用例 有効な入力で複雑なスキームを通してモデルを導く。そして、もし文脈が気になるなら、 コンテキスト編集 トークン制限に近づくと、古い呼び出しと結果が自動的にクリーンアップされます。

実行制御では、4.5 モデルに停止の新しい理由が追加されました。 model_context_window_exceeded コンテキストウィンドウに到達したことを示すために、 max_tokensそしてその理由 refusal このアップデートでは、セキュリティ上の理由からシステムがコンテンツの生成を拒否した場合に発生する問題に対処しています。また、ツールにパラメータを渡す際に改行が保持されるバグも修正されています。

拡張思考は 内部プロセスの概要 メッセージングAPIでは、送信時に小さな遅延を伴う断片的な配信で到着する可能性があります。重大なものではありませんが、UXのために考慮する価値があります。 ストリーミング.

開発ツール: テキストエディタとコード実行

Claude のテキスト エディターを使用する場合は、新しいバージョンがあります。 ツールの種類 text_editor_20250728 名前で str_replace_based_edit_tool、およびコマンド undo_edit サポートは終了しました。Sonnet 3.7から移行する場合はご注意ください。

コード実行については、以下が推奨されます。 バージョン code_execution_20250825、追加します コマンド Bashとファイル操作。レガシーバリアント code_execution_20250522 まだ入手可能ですが、 Python 新しい実装には推奨されません。

これらの変更は、 道具の散在的使用と拡張思考モデルが推論し、ツールを参照し、人為的なジャンプなしで会話を継続する、より自然なフローを推進します。

価格、エンドポイント、クラウドの可用性

価格が100万トークンあたり5ドル、100万トークンあたり25ドルに下落し、 4.5モデルは競争力のある価格を維持クラウド プロバイダー経由でエンドポイントが使用される場合の新機能もあります。

AWS Bedrockと グーグル Vertex AIはグローバルおよび地域のエンドポイントを提供します Opus 4.5、Sonnet 4.5、Haiku 4.5では、地域限定のサービスで10%の追加料金で地理的ルーティングが保証されます。Anthropic独自のAPIはデフォルトでグローバルであり、この変更の影響を受けません。

Opus 4.5は Anthropicのアプリケーション、API、主要プラットフォームAmazon Bedrockなどの統合も含まれています。これにより、 時間 ビジネス環境での実装向け。

制限事項と細則:知っておくべきこと

現時点での最大の弱点は 使用制限と割り当てProプランやMaxプランでもトークンはすぐに消費され、最初のメッセージから5時間ごとにカウンターがリセットされます。Opusは最も強力なプランであるため、トークンの消費も早く、月額20ドル、あるいは100ドルを支払っているユーザーにとってはフラストレーションの原因となっています。

Anthropic は可用性を優先します。 アメリカと西ヨーロッパ中南米またはアジア太平洋地域から運用している場合、レイテンシが増加し、現地言語のサポートが制限される可能性があります。重要な導入を行う前に、リアルタイムのレイテンシを測定することをお勧めします。

もう一つのポイントは 接続性とクラウドサービスへの依存ExcelやChromeなどの統合はクラウドサービスに依存しています。オンプレミスでの導入が必要な規制対象分野では、プライベートな導入について交渉するか、特定のシナリオではオープンモデルを検討する必要があります。

最後に、Opus 4.5を最大限に活用するには プロンプトエンジニアリング、コンテキスト管理、デバッグのトレーニング適切なプラクティスがなければ、容量が無駄になり、トークンの支出が急増します。社内トレーニングに投資する価値があります。

  クラウドにファイルをアップロードせずにMetaのMusicGenをローカルで使用する方法

戦略と比較:OpenAIとGoogleとの比較

Opus 4.5では、Anthropicは プロフェッショナルと開発者向けのプレミアムプロバイダー精度と信頼性が最も重要となるアプリケーションで直接競合するこの競争により、購入者に利益をもたらす価格と機能の戦争が勃発し、パフォーマンス、コスト、労力管理の組み合わせが強力な魅力となっています。

ライバル製品と比較して、Opus 4.5は 自律ツールとエージェントによるワークフローマルチモーダル性や純粋推論においては、競合モデルとの差は小さくなりますが、4.5 エコシステムの機能セットは、持続性と調整を必要とする生産シナリオにおいて大きな利点となります。

移行時期と社内での評価方法

Claude 3.5またはOpus 4.1から移行する場合は、 複雑な推論、大量のトークン、またはエージェント機能が必要な場合 ツールへのアクセスが可能。月間10万トークン以上の節約により、再構成にかかる労力を相殺できます。

Anthropic は、離脱シフトの有無にかかわらず移住ルートを記録しています。 Sonnet 3.7 から Sonnet 4.5、Haiku 3.5 から Haiku 4.5 (さらなる変更点)、そしてOpus 4.1からSonnet 4.5またはOpus 4.5へのスムーズなアップグレード。本番環境に移行する前に、チェックリストを確認することをお勧めします。

決定を下すには、十分な量の反復プロセスがあるかどうかを自問してください。 データと検証基準の制御節約時間、エラー、応答時間を測定する明確なKPIも必要です。指標がなければ、どんなパイロットも迷子になってしまいます。

安全な導入のための実践的なチェックリスト:プライバシーポリシーとDPA 限定された概念実証 (例: サポート チケットや会議の概要)、2 人の主要人物に対する社内トレーニング、アラートによるコストの監視、サービスの変更や障害が発生した場合の緊急時対応計画などです。

開発者向け: カーソルとクロードコードでOpus 4.5を使用する

Opus 4.5を日常の開発に活用するには、 Anthropicアカウントを作成し、APIキーを生成するプラン(Max、Team、またはEnterprise)に応じてモデルへのアクセスを有効にし、以下の通常のツールを設定します。 ディープシークコーダー.

カーソルに、 モデルセクションのAnthropic APIキー AI搭載チャットパネルでOpus 4.5を選択してください。IDE内でチャットアシストによるオートコンプリートやマルチエージェントフローを直接操作できます。ツールによると、有料のCursor Proプランでは、高度なモデルへのアクセスが簡素化されるとのことです。

Claude Codeでは、プロジェクトディレクトリでCLIを起動し、 パスワードでログイン 選択コマンドを使ってモデルを変更します。そこからプランニングモードを起動すると、コードに触れる前に手順が提案され、リファクタリング、デバッグ、目標指向スクリプトの実行などに利用できます。

ベストプラクティス: 必要に応じてテンプレートを切り替える(軽いタスクの場合はHaikuまたはSonnet、 論理的に要求される作品トークンの使用状況を監視し、ドリフトを防ぎ、レート制限を遵守してください。サードパーティ製ツールで承認エラーが表示される場合は、アカウントでモデルが有効になっていること、およびクライアントが最新バージョンであることを確認してください。

よくある質問については、 ツールのヘルプセンターとフォーラムAPI キーが契約プランと一致しない場合、拡張思考における断片的な応答や不正なモデル メッセージなどの既知のインシデントがリストされます。

上記のすべてを考慮して、 Opus 4.5は、ベンチマークの強さ、微調整されたコスト管理、プラットフォームの改善を組み合わせています これは、ソフトウェアエンジニアリング、オフィスオートメーション、自律エージェントにとって特に魅力的です。使用制限の問題は、エクスペリエンスを完全に充実させるためにまだ解決する必要がありますが、方向性は明確です。トークンあたりの品質向上と、実際の継続的な作業に適したエコシステムの構築です。