プライマリケアの電子健康記録におけるコードシーケンスの潜在的バイアスの特定:コード頻度の決定因子に関する後ろ向きコホート研究
カテゴリ:公衆衛生・予防医療
公開日:2026年2月19日
タイトル:Identifying potential biases in code sequences in primary care electronic healthcare records: a retrospective cohort study of the determinants of code frequency
雑誌名:BMJ Open. 2023 Sep 27; 13(9): e072884.
概 要:
本研究は、プライマリケアの電子健康記録における長期疾患(LTC)の診断コードの頻度が、病気のコーディングインセンティブ、一般開業医(GP)、患者の社会人口統計的特性、診断年によってどのように影響を受けるかを調査することを目的としています。2015年から2022年の間にClinical Practice Research Datalink Aurumデータセットに寄与したイングランドのGPを対象に、2015年1月1日から2019年12月31日までに少なくとも1件の新規LTCが診断されたすべての患者を含めました。結果として、QOFプログラムに含まれる条件は、含まれない条件よりも年間コーディング率が高いことが示されました。
方 法:
この研究は後ろ向きコホート研究であり、2015年から2022年の間にClinical Practice Research Datalink Aurumデータセットに寄与したイングランドのGPからのデータを使用しました。対象は、2015年1月1日から2019年12月31日までに少なくとも1件の新規LTCが診断されたすべての患者で、合計3,113,724人が含まれました。主要評価指標は、診断後の1年目および2年目におけるLTCの診断コードの数です。
結 果:
合計3,113,724人の患者が含まれ、7,723,365件の新規LTCが記録されました。QOFに含まれる条件は、含まれない条件に比べて年間コーディング率が高く(1.03 vs 0.32、p<0.0001)、GPによるコード頻度には有意なばらつきが見られました。患者の社会人口統計的特性との関連も確認され、特に低所得地域に住む人々でコーディング率が高い傾向が見られました。また、2020年のフォローアップ期間においては、COVID-19パンデミックの影響でコード頻度が低下しました。
結 論:
新たに診断されたLTCの診断コードの頻度は、患者の社会人口統計的特性、QOFへの病気の含有、GPの実践、COVID-19パンデミックの影響など、さまざまな要因によって影響を受けることが示されました。自然言語処理や時系列に基づくコードシーケンスを使用する方法は、これらの要因を考慮して潜在的なバイアスを最小限に抑える必要があります。