生成AIニュース
【生成AIニュースメモ】DeepSeek-V2: 最先端の大規模オープンソース言語モデルが登場(2024/5/7)

DeepSeek-AIが開発した大規模言語モデルDeepSeek-V2の詳細がGitHubリポジトリで公開されました。DeepSeek-V2は、効率的な推論を実現する革新的なアーキテクチャを採用した、強力かつ経済的なMi […]

続きを読む
生成AIニュース
【生成AIニュースメモ】rinnaが日本語特化のLLMモデル「Llama 3 Youko 8B」を公開(2024/5/1)

英語と日本語の大規模データを用いて事前学習を実施 AIスタートアップのrinnaは、Meta社の大規模言語モデル「Llama 3 8B」を日本語に特化させた「Llama 3 Youko 8B」を公開しました。rinnaに […]

続きを読む
生成AIニュース
【生成AIニュースメモ】NIIが大規模言語モデル「LLM-jp-13B v2.0」を公開(2024/4/30)

国立情報学研究所(NII)が主宰するLLM勉強会(LLM-jp)が、大規模言語モデル「LLM-jp-13B」の後続モデル「LLM-jp-13B v2.0」およびその構築に使用した全リソースを2024年4月30日に公開しま […]

続きを読む
生成AIニュース
【生成AIニュースメモ】StarCoder2-15B-Instruct: 完全に透明性のある自己整合型コード生成モデルの登場(2024/4/30)

大規模言語モデル(LLM)に自然言語の指示に従う能力を与えるインストラクションチューニングの手法が注目を集めています。しかし、プログラミングタスクにおいては、人手で作成された高コストな指示や、巨大で制約の多い独自LLMに […]

続きを読む
生成AIニュース
【生成AIニュースメモ】新たな医療分野特化の大規模言語モデル「OpenBioLLM-8B」と「OpenBioLLM-70B」が登場(2024/4/27)

Saama AI Labsは、医療分野に特化した大規模言語モデル「OpenBioLLM-70B」と「OpenBioLLM-8B」を発表しました。これらのモデルは、医療・ライフサイエンス分野の独自の言語や知識を理解し、高い […]

続きを読む