英語ニュース
OpenAI、推論・翻訳・文字起こしを実現する3つの新音声モデルをAPIで提供開始

OpenAIは、GPT-5級の推論能力を持ち、自然な対話や複雑なツール実行が可能な「GPT-Realtime-2」など、3つの新しい音声モデルをAPIに追加しました。多言語のリアルタイム翻訳や低遅延の文字起こしに特化したモデルも含まれており

続きを読む
英語ニュース
マイクロソフト、Word向け「Legal Agent」を発表 ― 契約レビューを構造化ワークフローで自動化

マイクロソフトは、契約書の修正(レッドライン作成)やレビューといった煩雑な実務を支援する、Word専用の法務特化型AIエージェント「Legal Agent」を発表しました。本ツールは、法務エンジニアが設計した構造化ワークフローや専用の編集ア

続きを読む
英語ニュース
Google CloudとSalesforce、提携を拡大 AIエージェントが両社プラットフォームを横断して業務を自動化

Google CloudとSalesforceは、AIエージェントが両社のプラットフォームを横断して業務を自動化できるよう提携を拡大しました。Salesforceの「Agentforce」とGoogleの「Gemini Enterprise

続きを読む
英語ニュース
Microsoft Research、強化学習で3D整合性を高める動画生成フレームワーク「World-R1」を発表

Microsoft Researchは、動画生成における3次元的な不整合を解消する新フレームワーク「World-R1」を発表しました。この手法は、既存モデルのアーキテクチャを変更せずに強化学習(Flow-GRPO)を活用し、3D基盤モデルか

続きを読む
英語ニュース
Sakana AI、音声対話AIの応答速度と知識力を両立する新アーキテクチャ「KAME」を発表

Sakana AIは、高速な応答と高度な知識を両立させたリアルタイム音声対話AIの新アーキテクチャ「KAME」を発表しました。このモデルは、音声直接生成(S2S)モデルとバックエンドのLLMを連結した「タンデム構造」を採用しており、バックエ

続きを読む