2025年2月25日にClaude 3.7 Sonetがリリースされました。
Claude 3.7 Sonnetは、有料のCopilotプランをご利用のすべてのお客様にご利用いただけるようになりました。この新しいソネットモデルは、Copilotのインシデントモードと非インシデントモードの両方をサポートしています。初期のテストでは、エージェントシナリオで特に強力な改善が見られました。
GitHubの内部評価では、このモデルは、ガイダンスに従う能力、複雑なタスクの細分化、新しいUI(ヒューマンレビュー)の構築において、以前のモデルよりも優れていることがわかりました。
私たちはSonnet 3.5と3.6を使用して、いくつかのJava、JavaScriptベースのプロジェクトのコードを改善するために数ヶ月を費やしましたが、3.7はすぐに見栄えが良く、より現代的で改善されたコードを提供しました。
以前は、より短い長さのレスポンスを持つ小さなコードスニペットを提供し、完全なコード、より長いレスポンス、欠落のないレスポンスなどを提供することを常に思い出させました。 3.7のレスポンスは、フォルダ構造、依存関係のインストール、初期プロジェクト設定、ライブラリを作成する方法を教えてくれ、その後、それぞれ数千行のコードを持つ各JSXページで動作し、バグや参照、ライブラリの問題なく動作します。
あなたが開発者でなくても、適切なCSS、アニメーション、色、最新のUIを使用して素晴らしいウェブサイトを作成するのに3分もかかりません。
本記事はAnthropicのウェブサイトに掲載された文章を再作成しました。
以前に書かれた「ChatGPT vs Claude」関連記事はここをクリックしてください。

Claude 3.7 Sonnetは、特にコーディングとフロントエンドのWeb開発において大きな進歩を遂げました。 このモデルとともに、エージェントコーディングのためのコマンドラインツールであるClaude Codeも紹介します。Claude Codeは限定的な研究用プレビューとして提供されており、開発者はターミナルから直接Claudeにかなりのエンジニアリング作業を委任することができます。
Claude 3.7 Sonnetは、無料、プロ、チーム、エンタープライズを含むすべてのClaudeプラン、Anthropic API、Amazon Bedrock、Google CloudのVertex AIで利用できるようになりました。拡張思考モードは、無料のClaudeプランを除くすべてのプランで利用できます。
標準思考モードと拡張思考モードの両方で、Claude 3.7 Sonnetの価格は以前のバージョンと同じです:入力トークン1百万個あたり3ドル、出力トークン1百万個あたり15ドル(思考トークンを含む)。
Claude 3.7 Sonnet: フロンティア推論の実用化
Claude 3.7 Sonnetは、市場に出回っている他の推論モデルとは異なる哲学でClaude 3.7 Sonnetを開発しました。 人間が迅速な反応と深い思考のために1つの脳を使用するように、推論は完全に分離されたモデルではなく、フロンティアモデルの統合された機能であるべきだと考えています。 この統合されたアプローチは、ユーザーによりスムーズな体験を提供します。
Claude 3.7 Sonnetは、この哲学をいくつかの方法で実装しています。
- まず、Claude 3.7 Sonnetは通常のLLMと推論モデルの両方の機能を備えています。モデルが通常通りに回答する場合と、回答する前にもっと長く考えさせたい場合を選択することができます。標準モードでは、クロード3.7ソネットはクロード3.5ソネットのアップグレードバージョンです。拡張思考モードでは、答えを見つける前に自分自身を振り返るので、数学、物理学、指示に従うこと、コーディング、その他多くのタスクでより良い結果を得ることができます。一般的に、モデルのプロンプトはどちらのモードでも同様に機能します。
- 第二に、APIを介してClaude 3.7 Sonnetを使用する場合、ユーザーはインシデントの予算を管理することができます:Nトークンを超えないようにClaudeに指示することができ、Nの値は最大128,000トークンという出力制限まで可能です。これにより、回答の質とスピードとコストのトレードオフが可能になります。
第三に、推論モデルを開発する過程で、数学やコンピュータサイエンスのコンテスト問題にはあまり最適化せず、企業が実際にLLMを使用する方法をよりよく反映する実際のタスクに焦点を当てました。
初期のテストでは、Claudeのコーディング能力が全体的に優れていることが証明されました。Cursorは、Claudeが複雑なコードベースの処理から高度なツールの使用まで、さまざまな分野で大幅な改善を示し、実際のコーディングタスクで再びトップレベルであることを確認しました。Cognitionは、Claudeがコード変更計画とフルスタック更新の処理において、他のどのモデルよりも優れていることを発見しました。 Vercelは、複雑なエージェントワークフローに対するClaudeの優れた精度を強調し、Replitは、他のモデルが行き詰まったところでClaudeを導入し、洗練されたWebアプリとダッシュボードをゼロから構築することに成功しました。Canvaの評価では、Claudeは、優れたデザインセンスと大幅に削減されたエラーで、生産可能なコードを一貫して生成しました。

Claude 3.7 Sonnetは、実際のソフトウェア問題を解決するAIモデルの能力を評価するSWE-bench Verifiedで最先端のパフォーマンスを達成しました。

Claude 3.7 Sonnetは、ユーザーとツールの相互作用を通じて複雑な実世界のタスクでAIエージェントをテストするフレームワークであるTAU-benchで最先端のパフォーマンスを達成しました。

Claude 3.7 Sonnetは、指示追従、一般的な推論、マルチモード機能、エージェントコーディングに優れており、拡張思考は数学と科学において顕著な改善をもたらします。伝統的なベンチマークを超え、ポケモンゲームのゲームプレイテストで以前のすべてのモデルを上回りました。
Claudeコード
2024年6月以降、Sonnetは世界中の開発者に好まれるモデルになりました。Claudeは、開発者により多くの権限を与えるために、最初のエージェントコーディングツールであるClaude Codeを限定的な研究用プレビューとしてリリースしました。
Claude Codeは、コードの検索と読み取り、ファイルの編集、テストの作成と実行、コードのコミットとGitHubへのプッシュ、コマンドラインツールの使用を可能にするアクティブなコラボレーションツールです。
Claude Codeは初期の製品ですが、テスト駆動型開発、複雑な問題のデバッグ、大規模なリファクタリングに特に役立ちます。
初期のテストでは、Claude Codeは通常45分以上かかる手作業が必要な作業を一度に完了し、開発時間とオーバーヘッドを削減しました。
今後数週間、Claude Codeは使用状況に基づいて改善を続けていく予定です。 (ツール呼び出しの安定性の向上、長期実行コマンドのサポートの追加、アプリ内レンダリングの改善、そしてClaudeの機能に対する独自の理解の拡大)。
ClaudeがClaudeコードを通じて目指すのは、開発者がClaudeをどのように使用しているかをよりよく理解し、今後のモデル改善に役立てることです。
利用可能性と価格
Claude 3.7 Sonnetを使用してカスタムAIソリューションを構築したい開発者は、Anthropic API、Amazon Bedrock、Google CloudのVertex AIで利用できます。
Claude 3.7 Sonnetとシンプルなチャットエクスペリエンスでコラボレーションしたいビジネスユーザーやコンシューマー向けに、Claude3.7 SonnetはClaude.aiでWeb、iOS、Androidのすべてのユーザーに利用可能です。
Claude 3.7 Sonnetの価格は、入力トークン1百万個あたり3ドル、出力トークン1百万個あたり15ドルから始まり、インスタントキャッシュで最大90%のコスト削減、バッチ処理で50%のコスト削減が可能です。詳細は価格ページをご覧ください。
Claudeでコードベースを作成する
Claude.aiのコーディングエクスペリエンスも改善され、すべてのClaudeプランでGitHubの統合機能を利用できるようになりました。開発者はコードリポジトリをClaudeに直接接続することができます。
Claude 3.7 Sonnetは、これまでに開発された最高のコーディングモデルです。個人、仕事、オープンソースプロジェクトに対する理解が深まるにつれて、最も重要なGitHubプロジェクト全体で、バグ修正、機能開発、ドキュメントの作成において、より強力なパートナーになります。
責任ある開発
Claudeは外部の専門家と協力し、Claude 3.7 Sonnetがセキュリティ、安全性、信頼性の基準を満たしていることを確認するために、Claude 3.7 Sonnetの広範なテストと評価を実施しました。また、Claude 3.7 Sonnetは、有害なリクエストと無害なリクエストをより細かく区別し、以前のバージョンよりも不要な拒否が45%減少しました。
このシステムカードは、さまざまなカテゴリの新しい安全性結果をカバーしており、他のAIラボや研究者が作業に適用できる責任ある拡張ポリシーの評価に関する詳細な分析を提供します。このカードでは、コンピュータの使用に関連する新たなリスク、特にプロンプトインジェクション攻撃についても取り上げており、これらの脆弱性を評価し、Claudeを訓練して抵抗し、軽減する方法を説明しています。 また、推論モデルの潜在的な安全性の利点、つまり、モデルがどのように意思決定を行うかを理解する能力と、モデルの推論が本当に信頼でき、信頼できるかを調査しています。
未来を見据える
Claude 3.7 SonetとClaudeは、人間の能力を真に拡張できるAIシステムに向けて重要な一歩を踏み出しました。 深く考え、自律的に作業し、効果的に協働する能力を備えたClaude 3.7は、AIが人間が成し遂げることができることを豊かにし、拡張する未来に私たちを近づけます。

新しい機能を探求し、それらを活用することで、どのような成果を生み出すことができるのか楽しみです。Claudeは、モデルの改善と進化を続けるために、ユーザーからのフィードバックをお待ちしています。
ありがとうございます。