・IBMが企業向けの大規模言語モデル「Granite」をオープンソースとして公開。
・Graniteは116のプログラミング言語で書かれたコードでトレーニングされ、幅広いタスクで高い性能を発揮。
・IBMはオープンイノベーションを信じており、コミュニティによる自由な革新を期待している。
IBMが、企業向けの大規模言語モデル「Granite」をオープンソースとして公開しました。この発表は、コーディングをできるだけ多くの開発者にとって簡単にすることを目的としています。
モデルの概要
Graniteコードモデルファミリーは、116のプログラミング言語で書かれたコードを使用してトレーニングされた、3億から340億のパラメーターの規模のモデル群です。ベースモデルと命令に従うモデルの2つのバリエーションがあり、複雑なアプリケーションの最新化タスクからオンデバイスのメモリ制約のあるユースケースまで、幅広い用途に対応しています。
オープンソース化の理由
IBMは、効果的なシステムは1人の個人によって作られることはないと考えており、オープンイノベーションの力を信じています。一般的な生成AIモデルの人気は高まっていますが、企業での導入は慎重に進められています。大規模なモデルは計算コストが高く、ライセンスが不明確であることが多いためです。IBMは、多くのユースケースに対応できる最高のパフォーマンスとコスト効率を持つコードLLMを公開することで、オープンコミュニティが自由に革新できるようにしたいと考えています。
モデルの性能
Graniteコードモデルは、コード生成、修正、説明、編集、翻訳など、幅広いタスクで高い性能を発揮します。HumanEvalPack、HumanEvalPlus、RepoBenchなどのベンチマークでテストした結果、Python、JavaScript、Java、Go、C++、Rustなどの主要なプログラミング言語において、他のオープンソースモデルと同等以上の性能を示しました。
IBMは、Graniteコードモデルを使って、新しいコード生成ツール、最先端の編集ソフトウェアなど、さまざまなものが構築されることを期待しています。また、今後数週間のうちに、IBMリサーチ内で設計・育成・リリースされたGraniteファミリーの他のモデルやモダリティについても共有する予定だそうです。