記事詳細｜ ChatGPT-4oは系統的レビューにおけるデータ抽出の第二の評価者として機能する

ChatGPT-4oは系統的レビューにおけるデータ抽出の第二の評価者として機能する

カテゴリ：高齢者医療・介護

公開日：2026年2月19日

タイトル：ChatGPT-4o can serve as the second rater for data extraction in systematic reviews 雑誌名：PloS One. 2025; 20(1): e0313401. 概　要：この研究は、系統的レビューにおけるデータ抽出のためにChatGPT-4oの有効性を評価し、人間のレビューアと比較することを目的としています。系統的レビューは多くの証拠を明確にし、臨床試験からガイドラインへの知識の移転を支援しますが、時間がかかります。AIの活用によりデータ抽出プロセスを効率化できる可能性がありますが、その効果の検証が必要です。方　法：運動による転倒リスク低減に関する系統的レビューからの論文を用いた比較研究を実施しました。ChatGPT-4oによって抽出されたデータを、2人の独立した人間のレビューアによる基準データと比較しました。抽出データは完全に正確から誤ったデータまでの5つのカテゴリーに分類し、有効性を評価しました。また、異なるChatGPT-4oアカウントを使用した2回のセッションでのデータ抽出の再現性も評価しました。結　果： ChatGPT-4oは11本の論文から合計484のデータポイントを抽出しました。AIのデータ抽出の正確性は92.4%（95% CI: 89.5%から94.5%）であり、誤ったデータは5.2%（95% CI: 3.4%から7.4%）でした。2回のセッション間の再現性は高く、全体の一致率は94.1%でした。ただし、情報が報告されていない場合は再現性が低下し、一致率は77.2%でした。結　論： ChatGPT-4oの系統的レビューにおけるデータ抽出の有効性と再現性は高く、第二のレビューアとしての資格があると評価されました。今後、データの要約においてもさらなる進展が期待されます。

「高齢者医療・介護」の記事一覧へ

MEDICINE & AI

ChatGPT-4oは系統的レビューにおけるデータ抽出の第二の評価者として機能する