・米国のAIスタートアップDeepSeekが、GPT-4と同等の性能を持つコード特化型AIモデル「DeepSeek-Coder-V2」をオープンソースで公開。
・DeepSeek-Coder-V2は、338のプログラミング言語をサポートし、文脈長は最大12.8万トークンで、コーディングと数学のベンチマークでGPT-4などを上回る性能を発揮。
・DeepSeek-Coder-V2は無料で利用可能で商用利用もサポートしており、オープンソースのコード支援AIの新たな選択肢として注目される。
DeepSeekは独自開発した大規模言語モデル「DeepSeek-Coder-V2」をオープンソースで公開しました。DeepSeek-Coder-V2は、OpenAIのGPT-4と同等の性能を発揮するコード特化型のAIモデルです。
6兆トークンの事前学習でGPT-4級の性能を実現
DeepSeek-Coder-V2は、高品質かつ多様性に富んだコーパス(データセット)から6兆トークンを学習することで、GPT-4に匹敵するコーディング能力と数学的推論能力を獲得しました。DeepSeek社は発表文で「DeepSeek-Coder-V2は、事前学習を継続することで、DeepSeek-Coder-V2-Baseのコーディングと数学的推論能力を大幅に向上させ、同時に一般的な言語タスクでも同等の性能を維持した」と説明しています。
338のプログラミング言語に対応、文脈長は最大12.8万トークン
先行モデルのDeepSeek-Coderと比較して、DeepSeek-Coder-V2はコード関連タスク、推論能力、汎用性で大幅な進歩を遂げました。サポートするプログラミング言語は86から338に拡大し、文脈長(一度に処理できるテキストの長さ)は1.6万トークンから12.8万トークンへと8倍に拡張されています。
ベンチマークでGPT-4、Claude、Geminiを上回る性能を発揮
DeepSeek-Coder-V2は、各種ベンチマークテストにおいて驚異的な結果を残しています。同社によると、コーディングと数学のベンチマークでは、OpenAIのGPT-4 Turbo、AnthropicのClaude 3 Opus、AI21 LabsのGemini 1.5 Proといった有力クローズドソースモデルを上回ったとのことです。
無料で利用可能、商用利用もサポート
DeepSeek-Coder-V2は現在、GitHubのHugging Faceで無料公開中です。利用可能なモデルは「DeepSeek-Coder-V2-Lite-Base」(パラメータ数160億)と「DeepSeek-Coder-V2-Lite-Instruct」(パラメータ数160億)の2種類で、推論にはNVIDIA A100 80GBのGPU 8基以上が必要とされています。さらに、商用利用が可能なライセンスも提供される予定です。
DeepSeekは「DeepSeek-Coder-V2は、クローズドソースの最先端コード特化型AIに匹敵する、あるいはそれ以上の性能を、オープンソースコミュニティに提供します」とコメントしています。AIを活用したソフトウェア開発の新たな選択肢として、大きな注目を集めそうです。