【生成AIニュースメモ】Qwen1.5-110B: Qwen1.5シリーズの初の100B超モデルが登場(2024/4/26)
2024年4月26日
最近、オープンソースコミュニティでは1000億パラメータを超える大規模モデルが続々と登場しています。これらのモデルは、ベンチマーク評価やチャットボットの性能で目覚ましい結果を示しています。今回、Qwenチームは「Qwen […]
【生成AIニュースメモ】Snowflake、真にオープンなエンタープライズグレードの大規模言語モデル「Arctic」を提供開始(2024/4/25)
2024年4月25日
データクラウド企業のSnowflake社が最もオープンなエンタープライズグレードの大規模言語モデル(LLM)「Snowflake Arctic」の提供を発表しました。 最高水準のインテリジェンスと効率性を実現 Snowf […]
【生成AIニュースメモ】小型言語モデルPhi-3-mini(2024/4/23)
2024年4月23日
Phi-3-miniの概要 Phi-3-miniは、わずか38億のパラメータを持つ小型の言語モデルです。しかし、33兆トークンで学習させたことにより、Mixtral 8x7BやGPT-3.5と同等の性能を達成したと報告さ […]
【生成AIニュースメモ】YouTubeの動画から作成された大規模なテキストデータ「YouTube-Commons」(2024/4/19)
2024年4月19日
オープンリサーチ推進のため、YouTubeの動画から作成された大規模なテキストデータ「YouTube-Commons」の公開が発表されました。 CC-BYライセンス動画の書き起こしを収録 YouTube-Commonsは […]