宮脇敦士「医療ビッグデータから見えてくるもの」
医療・健康・介護のコラム
SNSやインターネットの検索情報から分かるコロナの流行予測
利用者の行動パターンを分析
「ビッグデータ」の医学や公衆衛生における活用は、病院の利用や健康についての情報など、医学に直接関係するものだけではありません。
どんどん新しい「ビッグデータ」を利用する流れができてきています。その一つが、ソーシャル・ネットワーキング・サービス(SNS)などのソーシャルメディアの利用です。
私たちは日々、TwitterやFacebookなどのSNS、それから、Googleやyahoo!の検索など、インターネット上で様々な行動をしています。このインターネット利用の行動パターンをうまく分析することで、多くのIT系の企業が、消費者の好みを分析したり、株式市場の予測をしたりしていることはよく知られていると思います。
それは、病気の発生という集団レベルのイベントについても同様です。過去20年、インターネットやソーシャルメディアの発展に伴うような形で、これらのデータは、病気、特に感染症の発生予測に使われてきました。
私たちが熱を出したり、風邪を引いたりしたなと思ったとき、近くの病院や風邪薬について、インターネットで調べたことはないでしょうか? また、SNS上で、「頭痛がする……」などつぶやいたことはないでしょうか?
これらのインターネット上の情報は、利用する人の健康に関連する行動を反映しています。
インフルエンザの流行予測に活用の歴史
ソーシャルメディアの情報は、特にインフルエンザの流行予測に使われてきました。
インフルエンザは、ワクチンや治療薬が普及しているにもかかわらず、日本でも年間3000人程度、世界では、25万~50万人が毎年亡くなる疾患です。特に高齢者では、インフルエンザに罹患(りかん)したことをきっかけに、もともとある心臓や肺の病気が悪くなる人も多いので、それも含めると、私たちの健康に与える影響はとても大きいのです。
厄介なことに、年によって流行の程度やウイルスの遺伝子型が異なったり、ワクチンが効きにくいかもしれない新型インフルエンザが出現したりするため、流行を予測して早期に適切な公衆衛生上の対策をとることが、とても重要とされています。
それに対応するため、多くの国で、インフルエンザ様症状の報告を集計する仕組みがありますが、途上国をはじめとして、その仕組みが不十分だったり、タイムラグがあったりして、十分に機能していないこともあります。米国ですら、新型コロナウイルス感染症の流行前は、それに、1~2週間程度のタイムラグがあることが知られていました。
例えば、米国では、2009年の時点で、Googleの検索ログを分析し、インフルエンザの合併症や症状に関わる45個の検索ワードのパターンを用いることで、当時100%に近い形で、インフルエンザ様症状の推移を予測することができたことが示されています(これをもとにして、2015年まで、Googleは、Google Flu Trendsというサービスで、リアルタイムのインフルエンザ流行度を提供していました)。
さらには、TwitterのつぶやきやWikipediaの記事閲覧などでも、とても良い精度で従来の方法よりも早く(ほぼリアルタイムで)、インフルエンザの流行を感知することができたことがわかっています。他にも熱帯地方で流行するデング熱の流行のリアルタイムの監視にも使える可能性がわかっています。
1 / 2
【関連記事】
※コメントは承認制で、リアルタイムでは掲載されません。
※個人情報は書き込まないでください。