文字サイズ:
  • 標準
  • 拡大

宮脇敦士「医療ビッグデータから見えてくるもの」

医療・健康・介護のコラム

ビッグデータは何が「ビッグ」なの? どんどん溜まっていく 圧倒的なサイズ感の持つ強みとは

  • このエントリーをはてなブックマークに追加
  • チェック

統計学的な差が得られなかったアビガンの臨床試験

 では、ビッグデータを利用する利点は一体何なのでしょうか?

 まず何と言っても、そのデータのサイズです。日常的に収集されるデータであるため、何百万、時には何億、何兆にも上ります。このサイズ感は、ビッグデータの圧倒的な武器になります。

 データのサイズ感が重要である例を一つあげましょう。

 昨年、新型コロナウイルスが流行し始めた頃、期待を集めた日本産の薬がありました。ファビピラビル(商品名:アビガン)です。

 2020年3月上旬から5月中旬までの間に、医師主導による臨床試験が行われました。この臨床試験に関しては色々と議論がありますが、とりあえず、結果は69人(投与した群36人 vs [最初は]投与しなかった群33人)を比較して、6日目までのウイルス消失率が66.7% vs 56.1%だったとのことでした(https://www.fujita-hu.ac.jp/news/j93sdv0000006eya.html)。

 一見すると、投与した群の方が、ウイルス消失率が高く、効果があるように見えます。しかし、この研究では残念ながら、統計学的に意味のある差(有意差)は認められませんでした。

もし10倍の人数を集められていれば……

 ここでいう統計学的な差を表す数字がP値(Pはprobability=確率のPです)というもので、この臨床試験ではP値=0.27でした。

 これは、仮にアビガンの効果がまったくなかったとしても、同じような試験を繰り返しやったら、今回みたいな10ポイント近くの差が、4回に1回くらいは出てしまう、ということを意味しています。

 こういった偶然に起きてしまう確率が、20回に1回未満(P値<0.05)になってくると、その差は統計学的に「ありそうな」差、とみなされます。

 事後的にはなってしまうので、本当はやってはいけない計算なのですが、もしこの臨床試験が、10倍の600人ほど集められていれば、かなりの確率で、統計学的に意味のある差を見いだすことができたと推計されます(厳密にはP値<0.05となる確率が80%以上という意味です)。

 このように、サンプル数が少ないというだけで、「効果があるのか、ないのか、何とも言い難い」という結果になってしまうことがよくあります。

大きなサンプルサイズだからこそ証明できること

 ここに、数百万単位のデータを用いた分析の意義があります。

 もちろん臨床試験とビッグデータを用いた研究を同列に扱うべきではないのですが、それでも、意味のある差であれば、大きなサンプル数を用意して、その差を統計学的に証明することができます(逆に言えば、それでも差が証明できなければ、本当に差がないということになります)。

 また、コストの点もビッグデータの利点です。ビッグデータは、ほうっておくとどんどん「勝手に」溜まっていきます。そのため、わざわざ自分からデータを集めにかかる必要がなく、その手間やかかる費用が圧倒的に安くすみます。

 上記のアビガンを始めとする厳格な「臨床試験」はお金も時間も人手もかかります。それが、対象者数を十分に集められなかった大きな原因であり、このような問題は世界中で起こっています。そのため、ビッグデータを用いてまず関連がありそうかを検討し、それをクリアすれば臨床試験に進む、という流れも一部にあります。

2 / 3

  • このエントリーをはてなブックマークに追加
  • チェック

miyawaki-atsushi_prof

宮脇 敦士(みやわき・あつし)

 2013年、東京大学医学部医学科卒業、医師免許取得。せんぽ東京高輪病院・東京大学医学部附属病院で初期研修後、東京大学大学院医学系研究科社会医学専攻にて、医療政策・応用統計を専攻し、19年に博士号取得。東京大学特任研究員、筑波大学研究員、日本学術振興会特別研究員、Harvard T.H. Chan School of Public Health 客員研究員などを経て、20年から東京大学大学院医学系研究科社会予防医学講座助教。大規模データを用いて良質な医療を皆に届けるにはどうすればよいかということを研究している。

宮脇敦士「医療ビッグデータから見えてくるもの」の一覧を見る

コメントを書く

※コメントは承認制で、リアルタイムでは掲載されません。

※個人情報は書き込まないでください。

必須(20字以内)
必須(20字以内)
必須 (800字以内)

編集方針について

投稿いただいたコメントは、編集スタッフが拝読したうえで掲載させていただきます。リアルタイムでは掲載されません。 掲載したコメントは読売新聞紙面をはじめ、読売新聞社が発行及び、許諾した印刷物、読売新聞オンライン、携帯電話サービスなどに複製・転載する場合があります。

コメントのタイトル・本文は編集スタッフの判断で修正したり、全部、または一部を非掲載とさせていただく場合もあります。

次のようなコメントは非掲載、または削除とさせていただきます。

  • ブログとの関係が認められない場合
  • 特定の個人、組織を誹謗中傷し、名誉を傷つける内容を含む場合
  • 第三者の著作権などを侵害する内容を含む場合
  • 企業や商品の宣伝、販売促進を主な目的とする場合
  • 選挙運動またはこれらに類似する内容を含む場合
  • 特定の団体を宣伝することを主な目的とする場合
  • 事実に反した情報を公開している場合
  • 公序良俗、法令に反した内容の情報を含む場合
  • 個人情報を書き込んだ場合(たとえ匿名であっても関係者が見れば内容を特定できるような、個人情報=氏名・住所・電話番号・職業・メールアドレスなど=を含みます)
  • メールアドレス、他のサイトへリンクがある場合
  • その他、編集スタッフが不適切と判断した場合

編集方針に同意する方のみ投稿ができます。

以上、あらかじめ、ご了承ください。

最新記事