数学者と医師が語る、医療ビッグデータの活用法

数学者と医師が語る、医療ビッグデータの活用法

文:長倉克枝 写真:斎藤隆悟(写真は左から木村さん、河原林さん)

社会や暮らしの課題をITで解決するーー。そんな試みが広がっている。

大量のデータを活用して新たな価値創出を目指すビッグデータ時代。日本はデータの収集から解析する人工知能まですでに欧米に遅れをとっている状態だが、現状を打開すると期待されているのが医療ビッグデータだ。世界に先駆け超少子高齢化社会に突入する日本は、多くの課題や経験も得られる。そのため、いち早く課題に向き合って、ヘルスケアや医療のビッグデータを収集し活用して解決に挑んでいけるからだ。

だが、現実にはプライバシーの問題や、データ収集から利活用まで課題が山積みだ。国立情報学研究所ビッグデータ数理国際研究センター長の河原林健一氏は、企業や社会に眠る大量のデータを解析して、課題解決に導くのが数学者の役割と考えているが、企業秘密や情報セキュリティの壁にぶち当たっている。一方、Appleの医学研究向けアプリ開発プラットフォームResearchKitを使い日本で初めてiPhoneアプリを開発し臨床研究を行った慶應義塾大学病院の循環器外科医師、木村雄弘氏は診療現場で日々生み出される大量のデータを有効利用したいと悩みを抱える。

それぞれの課題に向き合い取り組んできた両氏に、ビッグデータ利活用をめぐって日本が抱える課題と、その解決法を語ってもらった。

ビッグデータ時代の数学者と医師

ー 河原林先生はビッグデータ解析の研究と人材育成をされていますが、どのような問題意識で研究に取り組まれているのでしょうか?

河原林健一(以下・河原林) ビッグデータ解析と言われていますが、世間ではまだまだブラックボックスの中で行われていて、使えるような結果が出ているわけではありません。データを持っている人はデータを出さない、解析ができる人はデータを持っていない、という分離した状況です。

ビッグデータの元となるデータは意味がなく見える数字や文字の集まりのようなもので、解析できる形にデータクリーニングするには、すごい時間がかかります。時間配分で言うと、データの取得とクリーニングをする時間が全体のほぼすべてを占め、解析をする時間は全体の1%くらいです。また、業界によって出てくるデータも全部違うので、それを理解して、どんなデータがきても解析できるような人材を育てなければいけないと思っています。そのために、数学的な基礎を中心に人材育成を進めています。

GoogleやFacebookといった海外のデータ解析で有名な企業では、基礎のしっかりした数学者がたくさんいます。そういうところがデータを収集して解析することで、勝っているわけです。

河原林健一
国立情報学研究所ビッグデータ数理国際センター長、教授 河原林健一氏

ー 木村先生は医師ですが、ご自身でプログラミングもされます。データの扱いについてどのようにお考えですか。

木村雄弘(以下・木村) 私は不整脈診療が専門で、診療録を利用した臨床研究も行っています。臨床研究を通じて医学的根拠(エビデンス)を構築するためには、データの量と質の両立が必要です。匿名化された膨大なデータをクリーニングして解析するわけですが、医療分野の専門家だけでは最適なデータ解析手法を選択できるとは限りませんし、厳密な数学的仕組みを理解して統計解析を行っているわけではありません。データを扱う専門家と一緒にやったほうがより精度の高い解析ができると思います。

ー 臨床研究のための情報収集をするiPhoneアプリ「Heart & Brain」を昨年リリースされました。

木村 このアプリはiPhoneを持っている人なら誰でも無料でダウンロードでき、研究参加に同意した研究参加者はアプリの中で不整脈や脳梗塞のリスクに関する質問に回答したり、簡単なテストをしたりします。ヘルスケアを含めたこれらのデータは自動的に蓄積されていきます。昨年11月に公開して、既に数か月で1万人以上の方のデータが集まっています。データの量を担保する情報収集の仕組みとしては革命的と思っています。

河原林 ビッグデータ時代は、完全にゲームチェンジが起こっています。数学とか統計とか基礎的な研究をしている私たちが、医療分野と仕事をすることは20年前には考えられませんでした。

医療業界で進まないビッグデータの利活用

ー 木村先生は不整脈の治療をされていますが、普段の診療や手術の中で、どれくらいのデータが得られるのでしょうか?

木村 不整脈手術を例に挙げると、術中の心臓の動きや電気の状態のデータはリアルタイムで測定、記録されています。1回の手術で何百行の数字の入った数百ものデータファイルが保存されていきます。

こうした特殊な機器を利用した手術以外でも、日々の診療の中で自然に溜まっていくデータは膨大で、すべてが有効に活用されているとはいえません。DPCなど国が整備しているデータベースデータには手が届きませんし、電子カルテに記録されているデータでさえも、統計解析のために保存されているわけではないので、そのままでは使えません。

日常診療で蓄積されたデータを解析し、医療者にフィードバックして、医療現場を改善していこうといった流れで自然にデータを使えるといいのですが、他診療科、他病院となると、とても扱いきれません。まず、データのバリエーションが非常に多いので、解析するには既往歴などの患者さんの背景を揃えるだけでも大変です。SS-MIX2は採血データのようなデジタルデータにはいいかもしれませんが、アナログなデータもたくさんあります。さらに共同研究者の社会的、政治的問題などまで考えると他診療科、他施設にまたがる共同研究は複雑なものになります。

河原林 (笑)そうそう。そういうことがいっぱいあるんですよね。医療ビッグデータの利活用がなぜ進まないかと言ったら、データ解析の技術的な問題以前のところがほぼすべてですね、正直なところ。

データの扱いは難しいんですよ。それぞれにデータの取得方法が違うのがひとつ。もうひとつは法律の壁があります。医療データは個人情報ですから、不整脈のデータは患者のものなのか、病院のものなのか、グレーですよね。

ビッグデータ時代の一番の問題はプライバシーです。それとそのデータが誰の所有かという問題。それがはっきりしないと、データの取得がうまくいきません。

欧米では、データを国が持てるように、法律を変えようとしています。日本でもようやく動き始めていますが、欧米に比べるとだいぶ遅れています。

木村 学会が主導権をもって、フォーマットを揃えて患者背景や投薬、手術内容などのデータ入力をしていこうという動きはあります。学会や国が主体となることで、包括的にデータを収集できますが、利用できる医師は限られることが多いです。こういったデータを誰もが利用できるインフラができるといいですね。

河原林 データベースをうまく作れば解析はできてしまうんですよ。データの量があるほど解析は楽になります。今のビッグデータ時代、今までと違うのはさまざまな人達が連携して進めていく必要があるということです。具体的には、データを取得して蓄積すること、クリーニング、解析をひとりでカバーできることではないので、さまざまな人達と一緒にそれができる仕組みやインフラをつくることが一番重要になります。

木村 インフラをつくり上げるのはかなり大変ですよね。それとメンテナンスも、資金、工数、セキュリティをクリアした体制を作るのは簡単ではないですね。

単独の病院で行う小規模な臨床研究でさえ、データを取得して蓄積してそれを維持していくのは結構大変です。大きな組織が統括的に行って、それを誰もが利用できたら素晴らしいですね。

木村雄弘
慶應義塾大学医学部循環器内科医師 木村雄弘氏

医療ビッグデータ利活用は日本が世界に貢献できる分野

ー これまでに、企業やアカデミアでうまく仕組みをつくってきたところはありますか?

河原林 アカデミアではそこまでできません。企業との共同研究が精一杯ですが、研究者が入れるのは本当に最後の部分だけ。フレームワークまでは関われませんが、本来は全体像を共有して進めていけるほうがいい。

木村 企業主導で、私たち医療者と河原林先生のような解析の先生が一緒になってできる枠組みはどうでしょうか。我々が倫理的問題を解決して医学データを集め、解析の先生にデータ解析をお願いして、企業がそれをどう活用するかという流れは、出口が明確ですね。アカデミアだけでやっていたのでは、誰がつくるのか? 誰のデータか? と堂々巡りになってしまいます。

ただ、利害関係が明白な会社がやると、個人情報をビジネスに利用していいのかという問題にもなってしまいます。会社が自社の製品のデータを調べるのは当然だと思いますが、売上を上げるために好意的なデータ解析をしているのではないか、という視点だけが先行してしまうのはよくない流れですね。

河原林 でもそういうことをGoogleやマイクロソフトはやっているんですよね。Appleは国がデータを出せといっても嫌だと言う権力を持っている。アメリカの企業は積極的にそうやってグレーゾーンを破っていきますね。問題が発生しても、全世界にとって利益になるなら積極的にやっていこうという考えを持っている。

ところが、日本企業はそれがなかなかありません。どうやったら失点を減らすか、という考え方です。そうすると後ろ向きになるという悪循環です。アメリカのように積極的なところにやられてしまいます。武器を持っていながら武器を使わない、という状態がずっと続いています。歯がゆいけれど、なんとかしないといけません。

木村 例えば、飲食店や食事のアプリは、ユーザーがどこで何を食べたかったかが調査できます。そこに、その人の健康状態や病気の情報を付加すれば、もっと健康志向な検索結果を表示できると思います。でも、個人情報を使ってこれを食べた方がいいですよと宣伝することはグレーかもしれません。ユーザーも、病気のことを企業に知られるのはどうなのかと心配になってしまいます。

河原林 ビッグデータを扱う中でどうしても個人情報やプライバシーの問題が入ってきます。それに対してアカデミア、一般の人たち、企業とのコンセンサスがとれるようになると、ビッグデータ利活用の流れは大きく変わってきます。

日本人は特に、個人情報をつかって儲ける、ということに抵抗があります。ビッグデータ解析でどんなメリットが得られるのか、普通の人たちが実感しにくいのですね。

ー 臨床研究では、研究としてデータを扱うということで、法律の問題をクリアしながら良い事例を作っていけるのではないでしょうか。

河原林 そうですね。臨床研究が一番いい例と思うんです。それがいい例になってトリガーになれば。

木村 臨床研究は情報収集の仕組みとしてはいいですが、情報を匿名化するのが原則なので、参加者に結果を直接還元できません。臨床研究で得られたエビデンスが、結果的に参加者を含めた社会全体のメリットになることはあります。しかし臨床研究として収集した情報から直接診断を還元することは、倫理、薬事法など様々な問題が出てきます。遠隔診療が進めばこういったことが解決されていくと思います。

河原林 今、人工知能と言われていますが、医療ビッグデータを人工知能で解析することは、日本が世界的に貢献できる分野だと思っています。日本は世界に先立って、超少子高齢化社会を迎える。それに関するデータを私たちは最初に持つことができるわけです。

今やらないといけないのは、データを取得して記録していくこと。うまくいったこと、失敗したこと、あらゆるデータを蓄積して、日本がこの社会を経験して何がうまくいって何がうまくいかなかったかを伝えることが、ビッグデータと人工知能の時代に日本ができる一番大きなことです。

木村先生がおっしゃったような手術中に出てくるデータや、長期的な患者のデータ、そういったものをぜひ保存して、時期が来たらデータベース化して解析できる形にしてほしい。

木村 私も人工知能には興味があります。病気が予知できるようになったらいいですよね。医療ビッグデータはもともとゲノム時代から始まっていますが、遺伝子を調べれば全ての将来が予想できるわけではないと思います。臨床研究や日常の診療で生まれるデータの蓄積を解析し、生活習慣、環境から将来の健康を予測していけるようになったらいいなと思います。

プロフィール/敬称略

河原林健一(かわらばやし・けんいち)
国立情報学研究所ビッグデータ数理国際センター長、教授

1998年慶応義塾大学理工学部卒業、2001年慶応義塾大学大学院博士課程修了、09年国立情報学研究所教授。12年から科学技術振興機構 (JST)の「河原林巨大グラフプロジェクト」の研究総括を担当。08年日本IBM科学者賞、13年日本学術振興会賞・日本学士院奨励賞、15年 日本数学会春季賞.専門は離散数学,理論計算機科学,アルゴリズムなど。

木村雄弘(きむら・たけひろ)
慶應義塾大学医学部循環器内科医師

2003年慶應義塾大学医学部卒業、11年慶應義塾大学医学部大学院卒業。現在、慶應義塾大学病院の循環器内科医として不整脈診療を担当し、主に心房細動のカテーテル治療、ペースメーカー手 術などを専門としている。一時期医師をはなれ習得したIT技術を生かして、2015年よりApple社のResearchKitを利用した臨床研究アプリ"Heart & Brain"を自身でプログラミングし、臨床研究の新たな情報収集の枠組みの可能性を追求。医療・ヘルスケアとIT及びビッグデータとの融合を目指した研究開発を行っている。

関連リンク

最新記事

この記事をシェアする

シェアする

この記事のURLとタイトルをコピーする

コピーする

(c) Recruit Co., Ltd.