Anthropic、Claude Managed Agentsに「ドリーミング」など追加、自己改善するAIエージェントを実現
2026年5月13日
Anthropicは、Claude Managed Agentsの新機能として、過去の活動を分析しメモリを自動整理する「ドリーミング」や、設定した基準に基づき出力を自己修正する「アウトカム」を公開しました。これに加えて、リーダー役のエージェ
Anthropic、AIの価値観を事前に教え込む新手法「モデル仕様ミッドトレーニング」を発表
2026年5月12日
Anthropicの研究チームは、AIの振る舞いを規定する「モデル仕様」とその背後にある理由を学習させる新手法「MSM」を発表しました。事前学習と微調整の間にこの段階を挟むことで、デモンストレーションだけでは不十分だった未学習領域への適切な
Anthropic、Claudeの内部活性を文章化する新技術「自然言語オートエンコーダー(NLA)」を発表
2026年5月11日
Anthropicは、AIモデルの内部処理を人間が理解できる自然言語に変換する新手法「自然言語オートエンコーダー(NLA)」を発表しました。この手法はAIが自身の内部状態を説明する仕組みで、モデルが外部には出さない「隠れた動機」や「テストさ
Qwen、LLMの内部動作を解明する解釈可能性ツールキット「Qwen-Scope」を公開
2026年5月10日
Qwenチームは、Qwen3および3.5シリーズの内部動作を可視化・解明するための解釈可能性ツールキット「Qwen-Scope」を公開しました。本ツールはスパースオートエンコーダ(SAE)を用いて複雑な情報を解釈可能な特徴に分解し、明示的な
OpenAI、ChatGPTの標準モデルを「GPT-5.5 Instant」に刷新――事実精度向上と個別最適化を強化
2026年5月9日
OpenAIは、ChatGPTの標準モデルを「GPT-5.5 Instant」に更新し、専門分野でのハルシネーションを大幅に削減するとともに、数学や図表の推論精度を向上させました。応答スタイルも見直され、冗長な表現や過剰な装飾を抑えることで
