宮脇敦士「医療ビッグデータから見えてくるもの」
医療・健康・介護のコラム
気軽に扱えるデータから医療の課題を分析する
NDBオープンデータを用いて
この数か月、私は研究で米国のロサンゼルスにいて、米国の「医療ビッグデータ」を分析しています。
執筆時点(2021年末)は、オミクロン株や寒い気候もあって、COVID-19の感染者数が過去最高を記録しています。ロサンゼルスでも増加傾向にあるようで、周囲にも感染者がちらほら出てきています。
この間、サンフランシスコに出張したときも、乗務員スタッフの感染拡大のため、飛行機が8時間以上も遅れてしまい、昼に着く予定が、着いたら夜中、という羽目になりました。ただ、入院率や死亡率は今のところそんなに上昇しておらず、店内飲食や公共の場所では、マスクやワクチンパスポートを提示させられますが、特に利用制限が追加されてはいません。
クリスマスから年始は、様々な店が休みになります。オフィスに来る人も減り、私も家にいる時間が長くなりました。そこで少しデータを使って遊ぶことにしました。
私は研究者で、論文を書くことが仕事なので、普段は自分の研究テーマで使っているもの以外のデータはあまり触りません。しかし、例えば、有名なブロガーさんのように、世の中のデータを「見える化」してみる試みは、結構好きなのです。ですから、前からじっくり見てみたいと思っていた公開データで遊んでみることにしました。
データの名前は、National Database(NDB)オープンデータ、というものです。
https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000177182.html
これは、日本全国の公的医療保険でカバーされる医療サービス(診療行為や薬剤など)を、サービスごとに何回提供されたかを集計しているものです。
1 / 5
【関連記事】
徐々に使いやすいものになっていけば
もぐちゃん
NDBデータベースの使いにくさは、宮脇先生のご指摘の通りだと思います。例えば、何らかの事象が発生、その影響について数か月以内に何らかの分析を行う...
NDBデータベースの使いにくさは、宮脇先生のご指摘の通りだと思います。例えば、何らかの事象が発生、その影響について数か月以内に何らかの分析を行う必要がある場合、NDBデータベースからデータ提供を受けて分析するという方法は採用できません。実際に提供を受けるまでに数か月単位の時間がかかるからです。例えば、宮脇先生の「喘息(ぜんそく)による入院が激減」(東京大学サイト掲載資料を閲覧)についての研究は、NDBデータベースのデータは利用されていないです。これは2020年10月までにまとめられている研究結果です。COVID-19が確認されてから2020年5月までの状態について、NDBデータベースを利用して分析することは不可能です。もっとも、時間をかけることが可能な長期的な研究については、全国データを用いた分析が可能となるNDBデータベースのデータを利用するほうが適切です。NDBオープンデータは簡単に何かを確認したい場合は非常に便利なデータですが、(1)とりまとめまでに時間がかかること。現在、HPに掲載されている最新版は2019年度版です(2)集計単位が基準値未満の項目は非表示になっていること等、まだまだ改善いただきたい点があります。(1)については月次ベースでの公表があると利便性が高まります。(2)については、NDBオープンデータから個人情報が判明するような事例は考えにくく、非表示の仕組みは不要です。なお、非表示の仕組みについては、第5回より条件が緩められています。最初から完璧なデータベースはありえないので、利用者が増えることで、徐々に使いやすいものになっていけばよいと思っています。
つづきを読む
違反報告