MEDICINE & AI

非語彙的会話音は臨床文書化技術の障害となるか?

カテゴリ:医療現場の業務効率化

公開日:2026年1月29日

タイトル:"Mm-hm," "Uh-uh": are non-lexical conversational sounds deal breakers for the ambient clinical documentation technology? 雑誌名:J Am Med Inform Assoc. 2023 Mar 16; 30(4): 703-711. 概 要: 本研究は、患者と医療者の会話を臨床文書に変換するための自動音声認識(ASR)と自然言語処理(NLP)を使用した環境臨床文書化技術の性能を評価しました。特に、Mm-hmやUh-uhといった非語彙的会話音(NLCS)がASRの性能に与える影響を調査しました。これらの音は、臨床会話において重要な情報を伝えるために一般的に使用されますが、現在のASR技術では十分に認識されていないことが示されました。 方 法: 本研究では、Google Speech-to-Text Clinical Conversation(Google ASR)とAmazon Transcribe Medical(Amazon ASR)の2つのASRエンジンを評価しました。36件のプライマリケアの診療データを用いて、単語誤認率(WER)を定量的および定性的に分析し、NLCSの誤認が臨床文書の質に与える影響を検討しました。 結 果: 評価データ中の135,647語のうち、3284語(2.4%)がNLCSでした。その中で、76語(全体の0.06%、NLCSの2.3%)が臨床的に関連する情報を伝えるために使用されました。全体のWERは、Google ASRで11.8%、Amazon ASRで12.8%でしたが、NLCSの認識性能は低く、Googleでは40.8%、Amazonでは57.2%のWERを示しました。臨床的に関連する情報を伝えるNLCSでは、94.7%(Google)および98.7%(Amazon)が誤認識されました。 結 論: 現在のASRソリューションは、特に臨床的に重要な情報を伝えるNLCSを適切に認識できないことが明らかになりました。NLCSの誤認識は臨床文書の不正確さを招き、新たな患者安全リスクを引き起こす可能性があります。