MEDICINE & AI

医療コミュニケーションにおけるChatGPTとBardの可読性の比較:メタアナリシス

カテゴリ:診断支援・画像解析

公開日:2026年2月19日

タイトル:Comparison of the readability of ChatGPT and Bard in medical communication: a meta-analysis 雑誌名:BMC Med Inform Decis Mak. 2025 Sep 01; 25(1): 325. doi: 10.1186/s12911-025-03035-2. Epub 2025 Sep 01. 概 要: 本研究は、医療コミュニケーションにおけるChatGPTとBardの可読性に関する複数の研究結果を統合することを目的としています。59件の研究を分析し、Flesch Reading Ease Score(FRE)とFlesch Kincaid Grade Level(FKGL)を用いて、両者のテキスト生成能力を比較しました。結果として、Bard/Geminiによって生成されたテキストの可読性はChatGPT-3.5/-4.0よりもわずかに優れていることが示されましたが、研究の質や出版バイアスに限界があることも指摘されています。 方 法: PubMed、Ovid/Medline、CINAHL、Web-of-Science、Scopus、GoogleScholarを用いて文献検索を行い、ChatGPT-3.5/-4.0およびBard/Geminiに関するオリジナル研究を対象としました。研究の質は修正Downs-and-Blackチェックリストを用いて評価し、テキストの簡略化および生成に関するメタアナリシスを実施しました。主要評価指標はFREとFKGLです。 結 果: 59件の研究から2342項目が分析され、FREにおいてChatGPT-3.5/-4.0とBard/Geminiの間に有意差は見られませんでしたが、FKGLは境界的有意差を示しました。特に、ChatGPT-3.5とBardの比較ではFREが有意に低く、FKGLは有意に高い結果が得られました。全体的に、Bardの方が可読性が高い傾向が見られました。 結 論: Bard/Geminiによって生成されたテキストの可読性は、ChatGPT-3.5/-4.0よりもわずかに優れていることが示されました。ChatGPTの簡略化されたテキストはBardに対して改善の傾向がありましたが、研究の質や出版バイアスが結果に影響を与える可能性があるため、標準化された報告が研究の質とチャットボットの開発を向上させることが期待されます。