宮脇敦士「医療ビッグデータから見えてくるもの」
医療・健康・介護のコラム
最もリスクが高いグループに介入すれば最も効果が高い……とは限らない
年齢、性別、持病など性質別の解析も
次に気になるのは、誰によく効いて誰に効かないのか、誰に対して治療や介入をすべきなのか、ということになります。
薬によっては、腎臓病や糖尿病のある人に対してどれだけ効くのかなど、患者さんの性質ごとにフォーカスを当てて、臨床試験をすることで、この問題に取り組もうとしています。また様々な性質(男女、年齢、持っている病気)ごとに分類して効果を測定する「層別解析(グループごとの解析)」を行っている場合もあります。
しかし、これでも、患者さんに対する薬の効果を規定する他の多くの因子がすべて勘案されているとは言えず、個人に対する効果を予測するには、まだ粗いかもしれません。
さらには、まだ重要と思われていないファクターが効果の大きさに(複雑に)影響しているかもしれません。これは、もっと個人個人に近いところまで介入の効果を予測できないか?という発想(precision medicine)につながっていきます。
機械学習と大きなサイズのデータによるアプローチ
この問題を乗り越えるのが、機械学習と大きなサイズのデータによるアプローチです。特に最近使われだした、Causal forest と呼ばれる機械学習の手法(※1、2)は、個人レベルでの介入の効果の大きさを推定することができます。
理論的な詳細はここでは省きますが、この方法では、データにある様々な患者さんの性質をもとに、患者さんをいくつかのタイプに分け、そのタイプごとに薬の効果を計算し、最後にその作業を何回も繰り返して平均を取るイメージです。ただし、このアプローチを精度良く行うには、比較的大きなサンプルサイズが必要になります。
この手法の面白いところは、個人レベルでどれだけ効くのかをこれまでよりもさらに精緻(せいち)に推定できるだけではなく、これまでわかっていなかった効果の大きな集団を見つけられる可能性があるということです。効果の大きい集団と効果の小さい集団の性質を単純に比較することで、薬や治療がより効きやすい集団を新たに見いだすことができるかもしれません。
私たちが専門にしている公衆衛生分野では、ポピュレーションアプローチとハイリスクアプローチというものがあります。前者は集団全員に対する公衆衛生学的介入、後者は、一部の病気のリスクが高い人に対する介入です。
効率的な介入方法をいかにして見いだすか
例えば、国中で売られているパンに含まれている食塩の量を一律に10%減らす、という政策はポピュレーションアプローチ、減塩健診で引っかかった人に対する健康指導はハイリスクアプローチです。このハイリスクアプローチは、より効果の高い人にフォーカスすることで、介入の費用対効果を上げることができる面があります。
しかし、このように個人レベルの効果のばらつきがわかるようになると、費用対効果の点から、「ハイリスクな集団に介入する」だけではなく、「効果の大きさが大きい集団に介入する」という発想が出てきます。
図のように、病気Aを予防するあるプログラムの効果が、Aを発症するリスクが最も高い集団よりも中くらいのリスクの集団で大きければ、中くらいのリスクにフォーカスを当ててそのプログラムを行うことが、効率的かもしれません(高リスクの集団は放置するのでなく、別のプログラムが適しているのかもしれません)。
2 / 3
【関連記事】
※コメントは承認制で、リアルタイムでは掲載されません。
※個人情報は書き込まないでください。