OpenAI、推論・翻訳・文字起こしを実現する3つの新音声モデルをAPIで提供開始
2026年5月9日
OpenAIは、GPT-5級の推論能力を持ち、自然な対話や複雑なツール実行が可能な「GPT-Realtime-2」など、3つの新しい音声モデルをAPIに追加しました。多言語のリアルタイム翻訳や低遅延の文字起こしに特化したモデルも含まれており
マイクロソフト、Word向け「Legal Agent」を発表 ― 契約レビューを構造化ワークフローで自動化
2026年5月9日
マイクロソフトは、契約書の修正(レッドライン作成)やレビューといった煩雑な実務を支援する、Word専用の法務特化型AIエージェント「Legal Agent」を発表しました。本ツールは、法務エンジニアが設計した構造化ワークフローや専用の編集ア
Google CloudとSalesforce、提携を拡大 AIエージェントが両社プラットフォームを横断して業務を自動化
2026年5月8日
Google CloudとSalesforceは、AIエージェントが両社のプラットフォームを横断して業務を自動化できるよう提携を拡大しました。Salesforceの「Agentforce」とGoogleの「Gemini Enterprise
Microsoft Research、強化学習で3D整合性を高める動画生成フレームワーク「World-R1」を発表
2026年5月6日
Microsoft Researchは、動画生成における3次元的な不整合を解消する新フレームワーク「World-R1」を発表しました。この手法は、既存モデルのアーキテクチャを変更せずに強化学習(Flow-GRPO)を活用し、3D基盤モデルか
Sakana AI、音声対話AIの応答速度と知識力を両立する新アーキテクチャ「KAME」を発表
2026年5月5日
Sakana AIは、高速な応答と高度な知識を両立させたリアルタイム音声対話AIの新アーキテクチャ「KAME」を発表しました。このモデルは、音声直接生成(S2S)モデルとバックエンドのLLMを連結した「タンデム構造」を採用しており、バックエ
