業績
2025年12月25日
継続学習で医療AIの精度向上を実現:国際共同研究

各国の病院データを共有せずにAIモデルを順次学習させる「継続学習」という手法が、医療現場ごとの環境の違いを乗り越え、気管挿管チューブの位置検出精度を高めることを実証しました。
論文
NEJM AI
https://doi.org/10.1056/AIoa2500522
著者談
今回は、Harvard Medical SchoolのDr. Rajpurkarにお声がけいただき、日本からは唯一、本研究に協力させていただきました。当初はこれほど多くの共同研究者が参加する大規模なプロジェクトになるとは想像していませんでしたが、世界中の研究者と連携できたことは素晴らしい経験であり、今後のさらなる協力関係が楽しみです。特に、コラボレーターのWendy、Cassandra、Jenniferには、非常に円滑なコミュニケーションをとっていただき感謝しています。彼らとの共同研究は他にも進行中ですので、徐々に成果として世に出ていくことと思います。次回のプロジェクトでは、ぜひ私たちが主研究者として関わり、研究をリードしていきたいと考えています。
論文概要
医療分野における人工知能(AI)モデルは、開発時には高い性能を示しても、実際に別の病院で運用を始めると精度が低下してしまうという課題があります。これは、患者さんの背景や使用するX線撮影装置などの環境が病院ごとに異なるためです。そこで本研究では、各病院のデータを外部に出すことなく、AIモデルだけを病院から病院へと順次移動させて学習を重ねる「継続学習」という手法の効果を検証しました。対象としたタスクは、集中治療室などで撮影される胸部X線画像から、気管挿管チューブが適切な位置にあるかを判断することです。世界5大陸、12カ国にわたる23の病院が参加した大規模な国際共同研究となりました。
論文詳細
本研究では、2021年を中心とした合計2,313名の成人患者の胸部X線画像を解析しました。検証にあたり、開発時の元のモデル、配備先の病院データだけで再学習させたファインチューニングモデル、そして複数の病院を順番に巡って学習させた継続学習モデルの3つのアプローチを比較しました。精度の評価は、医師が判断すべきチューブの先端から気管分岐部までの距離について、AIの予測との誤差(平均誤差)を測定することで行われました。
その結果、元のモデルの平均誤差は16.39mmでしたが、各病院で個別に調整を行ったファインチューニングモデルでは12.49mmまで改善しました。さらに、今回提案した継続学習モデルでは、平均誤差が10.58mmとなり、最も高い精度を達成しました。特筆すべきは、各病院から提供された学習用データはわずか50枚程度であったにもかかわらず、従来の手法を上回る結果が得られた点です。これは、限られたデータ数であっても、継続学習を取り入れることで、AIモデルが多様な臨床環境に適応し、より汎用的な性能を獲得できる可能性を示唆しています。