・Anthropicが新AI対話モデル「Claude 3.5 Sonnet」をリリース。従来モデルを上回る知性と高速性を実現。
・新機能「Artifacts」で対話的なワークスペースを提供。ビジョン能力も大幅に強化。
・安全性とプライバシーを重視し、外部専門家と協力して評価・改良を実施。今年中に更なる新モデルをリリース予定。
Anthropic社は2024年6月21日、人工知能対話モデル「Claude」シリーズの最新版となる「Claude 3.5 Sonnet」の提供を開始しました。Claude 3.5 Sonnetは、現行の「Claude 3 Opus」を大幅に上回るパフォーマンスを実現しています。
従来モデルを上回る知性と高速性
Anthropicによると、「Claude 3.5 Sonnetは、大学院レベルの推論能力(GPQA)、学部レベルの知識(MMLU)、コーディング能力(HumanEval)において、新たな業界標準を打ち立てています」とのことです。ニュアンスやユーモア、複雑な指示の理解力が大きく向上し、自然で親しみやすい文章を高品質で生成できるそうです。
さらに、Claude 3.5 SonnetはClaude 3 Opusの2倍の速度で動作します。Anthropicは「このパフォーマンス向上と手頃な価格設定により、Claude 3.5 Sonnetは文脈を考慮したカスタマーサポートや複数のワークフローの調整など、複雑なタスクに理想的です」と述べています。
「内部評価では、Claude 3.5 Sonnetはコーディング問題の64%を解決し、38%にとどまったClaude 3 Opusを上回りました」とのこと。適切な指示とツールを与えると、Claude 3.5 Sonnetは洗練された推論とトラブルシューティング能力を使って、独立してコードを書き、編集し、実行できるそうです。
ビジョン能力も大幅に強化
「Claude 3.5 Sonnetは、当社最強のビジョンモデルでもあり、標準的なビジョンベンチマークでClaude 3 Opusを上回りました」とAnthropicは説明しています。特にグラフや図表の解釈など、視覚的な推論を必要とするタスクで大きな改善が見られるとのことです。不完全な画像からテキストを正確に文字起こしすることもでき、「小売、物流、金融サービスにおいて、テキストよりも画像やグラフィック、イラストからより多くの洞察を得られる可能性があります」と述べられています。
「Artifacts」機能で対話的なワークスペースに
Anthropicは「Claude.ai」上に新機能「Artifacts」の提供も開始しました。ユーザーがClaudeにコードスニペットやテキスト文書、ウェブサイトデザインなどのコンテンツ生成を依頼すると、会話と並んで専用のウィンドウにそれらのArtifactsが表示されます。「ユーザーはClaudeの生成物をリアルタイムで確認、編集、改善できる動的なワークスペースが生まれ、AIが生成したコンテンツをプロジェクトやワークフローにシームレスに統合できます」とAnthropicは説明しています。
この機能は、Claudeが対話AIからコラボレーション環境へと進化する第一歩だそうです。将来的にはチームや組織全体で知識やドキュメント、作業を一元管理でき、Claudeがオンデマンドのチームメイトとして機能するようになるとのことです。
安全性とプライバシーへのコミットメント
Anthropicは、厳格なテストと誤用防止のトレーニングにより、Claude 3.5 Sonnetの安全性を確保。知性が大きく向上したにもかかわらず、「レッドチーム評価ではASL-2のままであると結論づけられました」と述べています。
また、外部の専門家と協働して最新モデルの安全メカニズムをテスト・改良しているそうです。「英国人工知能安全研究所(UK AISI)にClaude 3.5 Sonnetを提供し、事前配備の安全性評価を実施してもらいました。UK AISIはテスト結果を米国人工知能安全研究所(US AISI)と共有しました」とのことです。
Anthropicは「外部の専門家からのフィードバックを統合し、新しい悪用の傾向を考慮に入れた堅牢な評価を確保しています」と述べています。例えば、児童保護団体Thornの専門家からのフィードバックを活用し、分類器の更新とモデルの微調整を行ったそうです。
なお、Anthropicは「当社のAIモデル開発を導く中核的な憲法原則の1つがプライバシーです。ユーザーが明示的に許可しない限り、ユーザーが提出したデータを生成モデルのトレーニングに使用することはありません」と強調しています。
新たなマイルストーンを目指して
Anthropicは「知性、スピード、コストのトレードオフ曲線を数ヶ月ごとに大幅に改善することを目指しています」と述べ、今年中に「Claude 3.5 Haiku」と「Claude 3.5 Opus」をリリース予定とのことです。
次世代モデルファミリーに加え、企業向けのモダリティや機能、エンタープライズアプリケーションとの統合なども開発中だそうです。ユーザーの設定に応じて好みや対話履歴を記憶する「Memory」機能なども検討されているとのことです。
Anthropicは「常にClaudeの改善に取り組んでおり、ユーザーの皆様からのフィードバックをお待ちしております。開発ロードマップへの情報提供とユーザーエクスペリエンス向上にご協力ください」とコメントしています。