英語ニュース
Anthropic、Claude Managed Agentsに「ドリーミング」など追加、自己改善するAIエージェントを実現

Anthropicは、Claude Managed Agentsの新機能として、過去の活動を分析しメモリを自動整理する「ドリーミング」や、設定した基準に基づき出力を自己修正する「アウトカム」を公開しました。これに加えて、リーダー役のエージェ

続きを読む
英語ニュース
Anthropic、AIの価値観を事前に教え込む新手法「モデル仕様ミッドトレーニング」を発表

Anthropicの研究チームは、AIの振る舞いを規定する「モデル仕様」とその背後にある理由を学習させる新手法「MSM」を発表しました。事前学習と微調整の間にこの段階を挟むことで、デモンストレーションだけでは不十分だった未学習領域への適切な

続きを読む
英語ニュース
Anthropic、Claudeの内部活性を文章化する新技術「自然言語オートエンコーダー(NLA)」を発表

Anthropicは、AIモデルの内部処理を人間が理解できる自然言語に変換する新手法「自然言語オートエンコーダー(NLA)」を発表しました。この手法はAIが自身の内部状態を説明する仕組みで、モデルが外部には出さない「隠れた動機」や「テストさ

続きを読む
英語ニュース
Qwen、LLMの内部動作を解明する解釈可能性ツールキット「Qwen-Scope」を公開

Qwenチームは、Qwen3および3.5シリーズの内部動作を可視化・解明するための解釈可能性ツールキット「Qwen-Scope」を公開しました。本ツールはスパースオートエンコーダ(SAE)を用いて複雑な情報を解釈可能な特徴に分解し、明示的な

続きを読む
英語ニュース
OpenAI、ChatGPTの標準モデルを「GPT-5.5 Instant」に刷新――事実精度向上と個別最適化を強化

OpenAIは、ChatGPTの標準モデルを「GPT-5.5 Instant」に更新し、専門分野でのハルシネーションを大幅に削減するとともに、数学や図表の推論精度を向上させました。応答スタイルも見直され、冗長な表現や過剰な装飾を抑えることで

続きを読む