MEDICINE & AI

ChatGPT-4oは系統的レビューにおけるデータ抽出の第二の評価者として機能する

カテゴリ:高齢者医療・介護

公開日:2026年2月19日

タイトル:ChatGPT-4o can serve as the second rater for data extraction in systematic reviews 雑誌名:PloS One. 2025; 20(1): e0313401. 概 要: この研究は、系統的レビューにおけるデータ抽出のためにChatGPT-4oの有効性を評価し、人間のレビューアと比較することを目的としています。系統的レビューは多くの証拠を明確にし、臨床試験からガイドラインへの知識の移転を支援しますが、時間がかかります。AIの活用によりデータ抽出プロセスを効率化できる可能性がありますが、その効果の検証が必要です。 方 法: 運動による転倒リスク低減に関する系統的レビューからの論文を用いた比較研究を実施しました。ChatGPT-4oによって抽出されたデータを、2人の独立した人間のレビューアによる基準データと比較しました。抽出データは完全に正確から誤ったデータまでの5つのカテゴリーに分類し、有効性を評価しました。また、異なるChatGPT-4oアカウントを使用した2回のセッションでのデータ抽出の再現性も評価しました。 結 果: ChatGPT-4oは11本の論文から合計484のデータポイントを抽出しました。AIのデータ抽出の正確性は92.4%(95% CI: 89.5%から94.5%)であり、誤ったデータは5.2%(95% CI: 3.4%から7.4%)でした。2回のセッション間の再現性は高く、全体の一致率は94.1%でした。ただし、情報が報告されていない場合は再現性が低下し、一致率は77.2%でした。 結 論: ChatGPT-4oの系統的レビューにおけるデータ抽出の有効性と再現性は高く、第二のレビューアとしての資格があると評価されました。今後、データの要約においてもさらなる進展が期待されます。