・Saama AI Labsが医療分野特化の大規模言語モデル「OpenBioLLM」を発表
・OpenBioLLMは高品質な医療データを用いて学習し、同規模のモデルを上回る性能を示す
・現時点ではOpenBioLLMは研究開発ツールとして位置づけられ、臨床応用には慎重な検証が必要
Saama AI Labsは、医療分野に特化した大規模言語モデル「OpenBioLLM-70B」と「OpenBioLLM-8B」を発表しました。これらのモデルは、医療・ライフサイエンス分野の独自の言語や知識を理解し、高い精度でテキストを生成できるよう設計されています。
最先端の手法で医療知識を学習
OpenBioLLMは、高品質な医療データを用いて学習しており、解剖学的構造や生理学的プロセス、診断基準、治療ガイドラインなどの専門知識を深く理解しているとのことです。また、大規模言語モデルの最新技術を取り入れ、医療分野に適したチューニングを行っています。
同規模のモデルを上回る性能
70Bパラメータを持つOpenBioLLM-70Bは、GPT-4やGemini、Meditron-70Bなどの大規模モデルと比較して、医療分野のベンチマークで高いスコアを達成しています。また8Bパラメータの小規模版OpenBioLLM-8Bも、同程度の規模の医療系モデルの中ではトップクラスの性能を示しているようです。
医療テキストの要約や質問応答に活用
Saama AI Labsによると、OpenBioLLMは臨床ノートやカルテデータから重要な情報を抽出して要約したり、幅広い医療関連の質問に答えたりできるとのこと。医療用語の理解を生かして、症状や薬剤、解剖学的部位などの重要概念を的確に認識できます。また分類タスクにも優れた性能を発揮するようです。
研究開発ツールとしての位置づけ
OpenBioLLMは現時点では患者ケアや臨床判断に直接使用するべきではなく、医療従事者の支援ツールとして研究開発目的で活用することが推奨されています。バイアスや不正確さが含まれる可能性があるため、臨床応用には慎重な検証が必要だと開発者は述べています。
Saama AI Labsは研究者やデベロッパーとの協業を歓迎しており、GitHubでOpenBioLLMのコードを公開しています。医療AIの発展に貢献するオープンソースプロジェクトとして、今後の展開が期待されます。