ChatGPTと放射線科医の診断精度の比較イメージ
大阪公立大学の光山容仁大学院生大学院生らの研究グループは、MRI画像レポートについて神経放射線科医とChatGPTを比較した。その結果、両者に同等の診断能力があり、同科医が作製したレポートを用いた場合はAIのほうがより高精度に診断できることを明らかにしている。
研究グループは2017~21年に2医療機関から手術前の脳腫瘍術前MRI画像レポートを150件を収集。そして、5人の放射線科医(神経放射線科医2人、一般放射線科医3人)とChatGPTの診断精度を比較している。
結果、最終診断の精度はChatGPTが73%で最も高かった。神経放射線科医が72%、一般放射線科医は68%と続いている。症状の要因を絞り込む「鑑別診断」の正確さも同様の順となった。
さらに、神経放射線科医が作成したレポートを使用すると、ChatGPT の最終診断の精度は8割。一般放射線科医による報告書よりも高い確度を示した。鑑別診断でも神経放射線科医が作成したものをベースにすると、より高い成果となっている。
研究グループは「ChatGPT は脳腫瘍画像診断において診断補助や研修医および一般放射線科医の教育ツールとしても活用が期待できる性能を示した」とし「今後は、他の画像診断分野でも大規模言語モデルの検討をすすめ、医師の負担軽減や診断精度向上、教育環境の支援への利用を目指す」と説明している。