業績
2025年6月20日
胸部X線画像から脂肪肝を検出するAIモデルの開発と評価

健康診断などで広く普及している胸部X線画像を用いて、脂肪肝の有無を判定する深層学習モデルを開発し、その精度を検証しました。
論文
Performance of a Chest Radiograph-based Deep Learning Model for Detecting Hepatic Steatosis
Radiology: Cardiothoracic Imaging
著者談
脂肪肝の診断には通常、超音波検査などが用いられますが、実施できる施設や人員に限りがあるのが現状です。私たちは、より簡便な検査である胸部X線検査に着目しました。「肺を見るための検査」と思われがちなX線画像ですが、そこに含まれる情報をAIが解析することで、脂肪肝のリスクを推定できるのではないかと考えたのが研究の出発点です。今回の結果は、人間には判別が難しい画像上の特徴をモデルが捉えている可能性を示唆しています。あくまでスクリーニングの補助としての位置づけですが、検査の負担軽減や早期発見につながることを期待して、今後も検証を続けていきたいと考えています。
論文概要
肝臓に脂肪が蓄積する脂肪肝は、進行すると肝硬変や肝がんにつながる恐れがあるため、早期の発見が重要です。現在、診断には超音波検査やCT、MRIなどが用いられていますが、これらはコストや手間の面で、すべての人が気軽に受けられるわけではありません。本研究では、健康診断や日常診療で最も頻繁に行われる画像検査の一つである「胸部X線検査」に着目しました。胸部X線画像には肝臓の一部も写り込んでいます。そこで、深層学習(ディープラーニング)と呼ばれる技術を用いて、胸部X線画像から脂肪肝の有無を自動で判定するモデルを作成しました。異なる2つの医療機関のデータを使用し、このモデルがどの程度正確に脂肪肝を見つけられるかを検証しました。
論文詳細
本研究では、2つの施設から収集された合計6599枚の胸部X線画像を使用しました。脂肪肝の有無の基準(正解データ)には、肝臓の硬さなどを測る装置で得られる「CAP値」という指標を用い、この値が一定以上(275 dB/m以上)の場合を脂肪肝と定義しました。 開発したモデルの性能を評価したところ、モデル開発に使用した施設とは別のテストデータにおいて、AUC(検査の性能を示す指標で、1に近いほど高性能)は0.83、感度(病気がある人を正しく判定できる割合)は68%、特異度(病気がない人を正しく判定できる割合)は82%でした。さらに、完全に独立した外部施設のデータを用いた検証でも、AUCは0.82、感度76%、特異度76%という結果が得られ、異なる環境下でも一定の性能を維持できることが確認されました。 また、AIが画像のどこを見て判断しているかを可視化した解析では、約74%の画像において、肝臓や横隔膜の周辺領域が判断の根拠として重視されていることがわかりました。性別や肥満の有無、糖尿病といった患者背景による精度のばらつきも評価しましたが、概ね安定した結果が示されています。本研究は過去のデータを解析したものであり、実際の臨床現場での有用性を確認するためにはさらなる検証が必要ですが、非侵襲的なスクリーニング手法としての可能性が示されました。