ChatGPTの肺癌に関する応答の可読性分析
カテゴリ:手術支援
公開日:2026年2月19日
タイトル:Readability analysis of ChatGPT's responses on lung cancer
雑誌名:Sci Rep. 2024 Jul 26; 14(1): 17234. doi: 10.1038/s41598-024-67293-2. Epub 2024 Jul 26.
概 要:
本研究は、肺癌に関する医療情報を得るためにChatGPTが生成した応答の可読性を評価することを目的としています。患者はインターネットを通じて医療情報を取得することが多く、AI技術の進展により、ChatGPTのような大規模言語モデルが利用されています。Medscapeの肺癌セクションでよくある質問をレビューし、定義、病因、リスク因子、診断、治療、予後に関する80の質問をChatGPTに10回投げかけました。生成された応答は、さまざまな可読性指標を用いて評価されました。
方 法:
この研究では、80の質問をChatGPTに10回投げかけ、生成された応答の可読性を評価しました。使用した可読性指標には、Flesch Reading Ease、Flesch-Kincaid Grade Level、Gunning FOG Scale、SMOG Index、Automated Readability Index、Coleman-Liau Index、Linsear Write Formula、Dale-Chall Readability Score、Spache Readability Formulaが含まれます。
結 果:
ChatGPTの応答の平均可読性スコアは、Flesch Reading Easeが40.52、Flesch-Kincaid Grade Levelが12.56、Gunning FOG Scaleが13.63、SMOG Indexが14.61、Automated Readability Indexが15.04、Coleman-Liau Indexが14.24、Linsear Write Formulaが11.96、Dale-Chall Readability Scoreが10.03、Spache Readability Formulaが5.93でした。これらの結果は、生成された応答が「コラージュ」以上の可読性であり、難解であることを示しています。
結 論:
ChatGPTが生成した肺癌に関する応答は、可読性が中程度であり、一般の人々にとっては難解であることが明らかになりました。将来的には、異なる教育レベルや年齢層に適した応答を生成できるようにプログラムされることが期待されます。