臨床文書のための人工知能ベースの音声認識の性能評価:系統的レビュー
カテゴリ:医療現場の業務効率化
公開日:2025年10月24日
タイトル:Evaluating the performance of artificial intelligence-based speech recognition for clinical documentation: a systematic review.
雑誌名:BMC Med Inform Decis Mak. 2025 Jul 01; 25(1): 236. doi: 10.1186/s12911-025-03061-0. Epub 2025 Jul 01.
概 要:
この研究は、臨床文書作成におけるAI駆動の音声認識システムの性能を評価するための系統的レビューです。従来の手動転写方法は時間がかかり、エラーが発生しやすく、医療従事者の疲弊を招くため、AIを用いた自動転写システムが注目されています。本レビューでは、AI転写ツールの臨床での使用に関する研究を網羅的に調査し、精度や時間効率、ユーザー満足度などの結果を報告しています。
方 法:
MEDLINE、Embase、Cochrane Libraryを用いて、2025年2月16日までのAI転写ツールに関する研究を検索しました。対象は、AIベースの転写ソフトを使用する臨床医を含む研究で、精度(単語誤り率など)、時間効率、ユーザー満足度を報告するものです。データは系統的に抽出され、研究の質はQUADAS-2ツールを用いて評価されました。研究デザインや結果の異質性により、ナラティブ合成が行われました。
結 果:
29件の研究が基準を満たしました。報告された単語誤り率は、制御された発話設定で0.087から、会話や複数話者のシナリオで50%以上まで幅がありました。F1スコアは0.416から0.856までの変動が見られました。一部の研究では文書作成時間の短縮やノートの完全性の向上が示されましたが、他の研究では編集負担の増加や専門用語やアクセントのある音声に対するエラーが残ることが指摘されました。最近の大規模言語モデル(LLM)に基づくアプローチは自動要約機能を提供しましたが、臨床安全を確保するためには人間のレビューが必要でした。
結 論:
AIベースの転写システムは臨床文書の改善の可能性を示していますが、精度、適応性、ワークフロー統合において課題があります。ドメイン特化型のトレーニング、リアルタイムのエラー修正、電子健康記録との相互運用性の向上が、臨床実践での効果的な導入に不可欠です。今後の研究は、LLM駆動の要約機能を取り入れた次世代の「デジタルスクリプト」に焦点を当てるべきです。