リスニング - つくもち屋

2026年5月13日

Anthropicは、Claude Managed Agentsの新機能として、過去の活動を分析しメモリを自動整理する「ドリーミング」や、設定した基準に基づき出力を自己修正する「アウトカム」を公開しました。これに加えて、リーダー役のエージェ

2026年5月12日

Anthropicの研究チームは、AIの振る舞いを規定する「モデル仕様」とその背後にある理由を学習させる新手法「MSM」を発表しました。事前学習と微調整の間にこの段階を挟むことで、デモンストレーションだけでは不十分だった未学習領域への適切な

2026年5月11日

Anthropicは、AIモデルの内部処理を人間が理解できる自然言語に変換する新手法「自然言語オートエンコーダー（NLA）」を発表しました。この手法はAIが自身の内部状態を説明する仕組みで、モデルが外部には出さない「隠れた動機」や「テストさ

2026年5月10日

Qwenチームは、Qwen3および3.5シリーズの内部動作を可視化・解明するための解釈可能性ツールキット「Qwen-Scope」を公開しました。本ツールはスパースオートエンコーダ（SAE）を用いて複雑な情報を解釈可能な特徴に分解し、明示的な

2026年5月9日

OpenAIは、ChatGPTの標準モデルを「GPT-5.5 Instant」に更新し、専門分野でのハルシネーションを大幅に削減するとともに、数学や図表の推論精度を向上させました。応答スタイルも見直され、冗長な表現や過剰な装飾を抑えることで