はじめに
あなたは今、AIの歴史における重要な転換点を目撃しています。
2025年9月29日。まさに昨日にリリースされたClaude Sonnet 4.5は、開発者たちが「数ヶ月前には絶対に作れなかった製品が、突然作れるようになった」と口を揃える、画期的なモデルです。
私も今日は午後は出かけて夜、家に戻ってClaudeを開いたら4.5になってて驚きました。
Opusは4.1だったので「あ!今日アプデ入ったんだ!」となって狂喜。
どこが進化したのか調べてまとめました。
Claudeを2年半つかってきた私 AIたぬき が解説します。
また以下の内容をまとめたポッドキャストも用意しました。
読む時間のない方は音声でSonnet4.5の特徴をしれます。
【ポッドキャスト】Claude Sonnet 4.5の登場でナニが変わったか?
ここへきてエンジニアも驚く進化とは?
エンジニアは30時間も自律的にコーディングを続ける能力に驚き、金融アナリストは人間のレビューがほとんど不要なレポート作成に目を見張っています。
最近、AI業界では「もう大きな進歩は望めない」という減速説が語られていました。しかしAnthropicは、このSonnet 4.5で明確に反論しました。業界標準のベンチマークでは、OpenAIのChatGPT-5すら上回る性能を示しています。
特筆すべきは、この劇的な性能向上が追加コストなしで提供されている点です。あなたが今日Claudeを開けば、昨日までと同じ料金で、格段に賢くなったAIアシスタントを使えます。
この記事では、世界最高のコーディング能力、30時間働き続けるエージェント機能、専門家も驚く深い知識、そして改善された安全性という四つの柱を中心に、Sonnet 4.5の全貌を解き明かしていきます。AIの最前線で今、何が起きているのか、一緒に見ていきましょう。
なぜ今、Sonnet 4.5が注目されるのか
AI業界では最近、「もう大きな進歩は望めない」という声が聞かれるようになっていました。しかしAnthropicは、このSonnet 4.5のリリースで「減速の噂は大げさすぎる」と明確に反論しています。実際、業界標準のベンチマークでは、OpenAIのChatGPT-5すら上回る性能を示しました。
重要なのは、この性能向上が価格据え置きで実現されている点です。
価格据え置きおねがいします。20ドルでClaudeを使えるなんてめちゃありがたいです。そのかわり時間あたりのトークン制限があるのでChatGPTほどは大量にやり取りできません。それでも上限に達したら5時間待てばまた使えます。 上限の目安はイマイチ時と場合によるのですが20ドル課金ですと延々5時間やりとりまでは出来ない肌感です。はやく100ドル課金したいです。
前モデルのSonnet 4と同じ価格(100万トークンあたり3ドル/15ドル)のまま、能力だけが飛躍的に向上しています。つまり、今日からあなたは追加コストなしで、格段に賢いAIアシスタントを使えるようになったのです。
(本当にありがたい感謝です)
Claude Sonnet 4.5 ベンチマーク結果まとめ
Claude Sonnet 4.5が各種ベンチマークで記録した驚異的なスコア一覧です。
コーディング能力
- Agentic coding(SWE-bench Verified): 82.0%(並列テスト時間計算あり) – 業界最高
- Agentic terminal coding(Terminal-Bench): 50.0%
エージェントツール使用能力
- Retail(小売業務): 86.2%
- Airline(航空業務): 70.0%
- Telecom(通信業務): 98.0% – ほぼ完璧
- Computer use(OSWorld): 61.4%
数学・推論能力
- High school math competition(AIME 2025):
- Python使用時: 100% – 完全正解
- ツールなし: 87.0%
- Graduate-level reasoning(GPQA Diamond): 83.4%
多言語・視覚認識
- Multilingual Q&A(MMMLU): 89.1%
- Visual reasoning(MMMU validation): 77.8%
専門分野
- Financial analysis(Finance Agent): 55.3%
特に注目すべきは、通信業務で98.0%、**高校数学競技で100%**という圧倒的なスコアです。実務レベルのタスクにおいて、人間と同等かそれ以上の精度を実現しています。

主要企業が語るClaude Sonnet 4.5の実力
テック界隈を代表する企業もSonnet 4.5についてさっそく感想を発表しています。
主要企業が語るClaude Sonnet 4.5の実力
実際にClaude Sonnet 4.5を導入した大手企業から、具体的な評価が寄せられています。

開発ツール企業の評価
Cursor(開発ツール)- Michael Truell CEO
「最先端のコーディング性能を目の当たりにしています。特に長時間にわたるタスクで顕著な改善が見られます。多くの開発者がCursorでClaudeを選び、最も複雑な問題を解決しているのには理由があります」
GitHub – Mario Rodriguez 最高製品責任者
「Claude Sonnet 4.5はGitHub Copilotの中核的な強みを増幅させています。初期評価では、マルチステップ推論とコード理解において大幅な改善が見られ、Copilotのエージェント体験が複雑でコードベース全体にまたがるタスクをより適切に処理できるようになっています」
エンターテインメント・デザイン企業の評価
Netflix – Eric Wendelin(GenAI for Developer Productivity テックリード)
「Claude Sonnet 4.5はソフトウェア開発タスクにおいて優れた性能を発揮しています。コードベースのパターンを学習し、正確な実装を提供します。デバッグからアーキテクチャまで、深い文脈理解をもってすべてを処理し、開発速度を変革しています」
Canva – Danny Wu(AI製品責任者)
「Claude Sonnet 4.5は、私たちの最も複雑で長時間にわたるタスク(コードベースのエンジニアリングから製品機能、研究まで)において印象的な進歩を遂げています。目に見えてより知的になり、大きな飛躍です。2億4000万人以上のユーザーがCanvaでデザインできる範囲を押し広げるのに役立っています」
Figma – David Kossnick(AI製品責任者)
「Claude Sonnet 4.5は初期テストでFigma Makeを顕著に改善しました。プロンプトと反復処理がより簡単になっています。チームは、Figmaが誇る設計品質を維持しながら、より機能的なプロトタイプとスムーズなインタラクションでアイデアを探索し検証できます」
これらの評価から見えてくるのは、Sonnet 4.5が特に長時間タスク、コードベース全体の理解、複雑な推論において、実務レベルで大きな違いを生み出しているという点です。単なる性能向上ではなく、開発者の働き方そのものを変える可能性を秘めています。
世界最高のコーディングモデルが生まれた理由
Sonnet 4.5が「世界最高のコーディングモデル」と呼ばれる理由は、単に速いからではありません。実際のソフトウェア開発能力を測るSWE-bench Verifiedという評価で、最先端の成績を収めたからです。
特筆すべきは、社内のより精密なベンチマークでの結果です。前モデルのSonnet 4では9パーセントあったエラー率が、Sonnet 4.5ではゼロパーセントに削減されました。完全にゼロです。
あるテストユーザーは、このモデルが30時間以上も自律的にコーディングを続けるのを体験しました。エンジニアが数ヶ月かかる複雑なアーキテクチャ設計を、劇的に短い時間で解決できるようになったのです。以前は9時間の連続が最大でした。これは「AIがコードを書く」という次元ではなく、「AIが設計思想を理解して実装する」という新しい段階に入ったことを意味します。
30時間働き続けるAIエージェントの誕生
Sonnet 4.5の最も革新的な側面は、エージェント能力の飛躍です。ここで言う「エージェント」とは、人間が常に指示を出さなくても、自律的に判断してタスクを進められるAIシステムのことです。
実世界のコンピュータータスクをテストするOSWorldというベンチマークで、Sonnet 4.5は61.4パーセントのスコアを記録しました。わずか4ヶ月前にSonnet 4が記録した42.2パーセントから、大幅な飛躍です。これは、Claudeがブラウザを操作してウェブサイトを閲覧したり、スプレッドシートに記入したり、複雑なタスクを最後まで完遂できるようになったことを示しています。
複雑なマルチステップタスクにおいて、30時間以上も集中を保って作業を続ける能力が確認されています。これまでのAIモデルは長時間のタスクでは途中で方向性を見失うことが多かったのですが、Sonnet 4.5はゴールを見失わずに作業を継続できます。
この能力を支えるために、Anthropicは「Claude Agent SDK」という開発者向けツールも公開しました。
下記のデモ動画では、Claude がブラウザを直接操作し、ウェブサイトを操作したりスプレッドシートへ入力したりする様子を確認できる。
専門家も驚く深い知識と推論能力
金融、法律、医学、STEM分野の専門家たちが、Sonnet 4.5について口を揃えて言うのは、「以前のモデルとは次元が違う」ということです。
金融分析の現場では、リスク評価や構造化商品の分析において、人間によるレビューをほとんど必要としない「投資適格の洞察」を提供できるようになりました。法律分野では、訴訟記録全体を分析して、裁判官向けの意見書の優れた初稿を作成できます。これらは単なる要約ではなく、深い理解に基づいた分析です。
これが可能になった背景には、モデルの推論能力の向上があります。Sonnet 4.5は、表面的な情報処理ではなく、文脈を深く理解して論理的な推論を行えるようになっています。

開発者たちが語る「使用感」の変化
実際にSonnet 4.5を使った開発者たちからは、興味深い感想が寄せられています。
早期アクセス権を持っていたAugment Codeのテストでは、アプリ全体をゼロから作成するタスクで、前モデルより20分早く完了し、しかも最終的な変更内容の質も格段に向上したと報告されています。
面白いのは、モデルの「個性」に関する観察です。同僚からの報告によると、Sonnet 4.5は立ち往生したときに「明確化のための質問をするのが好き」で、「マークダウンファイルで大量のドキュメントを作成する傾向がある」そうです。これは、モデルが自分の限界を認識し、適切に人間に助けを求められるようになったことを示しています。
モデルの「雰囲気」はSonnet 4と似ているものの、より良く、より簡潔に結果を出せると評されています。
AIたぬきの感想
まだ1時間ほどしか使用していませんが、文章生成においては違いをまだ感じていません。もともとsonnet4.1のころから見事でしたので劇的な変化は感じていません。
ただコードについては明らかにスピードが速くなりました。体感20%以上はやくなっているのではないでしょうか。まだ実装していませんがChromeの拡張作成のスピードは「もうできたの?」といったレベルです。
仕事上の実務的な判断はさらに明確で的確になっている気がします。とくにマーケティング的な相談などはSonnet 3.5まではトンチンカンなことを回答してくることも珍しくありませんでした。
Sonnet4.1になって内容を反映しないトンチンカンな回答は無くなりました。
Sonnet4.5になって回答により精度が増しました。これは今までのやりとり理を記憶するメモリー機能が実装されたことも関係すると思われます。
安全性とアライメントの大幅改善
性能向上だけでなく、安全性の面でも大きな進歩がありました。Sonnet 4.5は、Anthropicがこれまでにリリースした中で「最もアラインメント(整合性)が取れたモデル」です。
以前のClaudeモデルと比較して、迎合性(過度におべっかを使う傾向)、欺瞞、権力志向、妄想的思考を助長する傾向といった懸念される行動が大幅に減少しています。
エージェント機能が強化されたことで、新たなセキュリティリスクも生まれました。特に「プロンプトインジェクション攻撃」(悪意のある指示を混入させてAIを誤動作させる攻撃)に対する防御が重要になります。Sonnet 4.5は、この分野でも大きな進歩を遂げています。
さらに、AI安全レベル3(ASL-3)の保護の下でリリースされており、化学、生物、放射線、核(CBRN)兵器に関連する危険な入力や出力を検出するフィルターも搭載されています。
あなたの仕事にどう活かせるか
ここまで技術的な話が続きましたが、実際にあなたの日常業務でSonnet 4.5をどう活かせるのでしょうか。
コーディング業務では、複雑なバグの修正や、既存コードベースへの新機能追加が格段にスムーズになります。デバッグからアーキテクチャ設計まで、深い文脈理解を持って対応できるため、開発速度が劇的に向上します。
文書作成では、専門的なレポートや分析資料の作成で、人間によるレビューを最小限に抑えられます。金融レポート、法律文書、技術ドキュメントなど、高度な専門知識が必要な分野でも、投資適格レベルの初稿を作成できます。
長時間のリサーチや分析作業では、30時間以上も集中を保って作業を続ける能力が活きます。大量のデータを分析して洞察を引き出したり、複数の情報源を統合して包括的なレポートを作成したりといった作業を、AIが自律的に進められます。
ブラウザ操作やスプレッドシート作業では、実際のコンピュータータスクを人間のように実行できます。定型業務の自動化が、これまでになく現実的になりました。
コスト効率という「隠れた革命」
Sonnet 4.5の真の革命は、これだけの性能向上が追加コストなしで実現されている点です。前モデルと同じ価格設定のまま、能力だけが飛躍的に向上しています。
この価格効率は、Anthropicの内部効率改善によって実現されました。具体的には、モデル自体のコーディング能力が向上したことで、より速く動作できるようになったのです。
さらに注目すべきは、前月にリリースされたOpusモデルの5分の1の価格で提供されている点です。より高い性能を、大幅に安いコストで利用できるようになりました。
内部コード編集ベンチマークでのエラー率ゼロパーセントという結果は、「より低いコストでより高いツール成功率」を意味します。これは実務では作業の手戻りが激減することを意味します。
今後の展望:不可能が可能になる時代
Anthropicの最高製品責任者は、このモデルが「数ヶ月前には単に不可能だった製品」を企業が構築できる扉を開いていると述べています。
実際、開発者コミュニティでは、Sonnet 4.5を使って新しいタイプのアプリケーションを構築する動きが活発になっています。30時間以上自律的に動作できるエージェント能力を活かした、長期間のタスク自動化システムや、専門知識を活かした高度な分析ツールなどです。
Claude Agent SDKの公開により、開発者は自分で高性能なエージェントを構築できるようになりました。カスタマーサポート、データ分析、コンテンツ制作など、様々な分野で新しい可能性が開かれています。
まとめ:今日から使える最先端AI
Claude Sonnet 4.5は、コーディング、エージェント能力、専門知識、安全性のすべてにおいて、前例のない進化を遂げました。しかも、この性能向上は追加コストなしで提供されています。
AIの「減速説」が語られる中、Anthropicはフロンティアがまだ大きく動いていることを証明しました。開発者たちが「不可能が可能になった」と語る転換点に、私たちは立ち会っています。
あなたが日常的にClaudeを使っているなら、今日から追加料金なしで、この最先端の能力を活用できます。コーディング、文書作成、データ分析、あらゆる業務で、これまでとは次元の違う体験が待っています。
ChatGPTは現在月額 22ドルからになっていますが、Claudeはまだ20ドルなのです。
最高性能をもっとも低価格で利用できることに感謝しています。
技術の進化は止まりません。そして、その最前線にいるのは、今この記事を読んでいるあなた自身です。Sonnet 4.5という強力なツールを手に、新しい可能性に挑戦してみてください。数ヶ月前には不可能だったことが、今日からできるようになっているかもしれません。
コメント