1. HOME
  2. ナレッジ&インサイト
  3. Thought Leaderに訊く
  4. 2018年
  5. 個別データを晒さずに知見を共有

個別データを晒さずに知見を共有

2018年12月

ビッグデータの利活用への期待が高まる中、データ保護が重要な課題となっている。プライバシー保護や情報セキュリティを確保しながら、データの活用を促進する仕組みの将来像はどのようなものか。データサイエンス分野において世界的な権威であり、ビッグデータの活用を通した国際的な取り組みにも核となる役割を担われているアレックス・ペントランド教授に語っていただいた。

語り手

MITコネクション科学・人間工学研究所 所長
アレックス・サンディ・ペントランド氏

MITメディアラボ所長、メディアラボアジア・インド研究所所長などを経て、現在、MITコネクション科学・人間工学研究所 所長。世界でも屈指の最も引用されている科学者。ハーバード・ビジネス・レビューのマッキンゼー賞や国防高等研究計画局(DAPRA)のインターネット40周年記念賞、ブランデス賞などを受賞。また全米技術アカデミーのメンバーであり、世界経済フォーラムにおいてリーダー的存在。

聞き手

株式会社野村総合研究所 金融ITイノベーション事業本部長 常務執行役員
林 滋樹

1988年 野村総合研究所入社。PMS開発部に配属。保険システム部、金融ソリューション部門プロジェクト開発室長、金融ITイノベーション推進部長を経て、2007年に野村ホールディングス株式会社に出向。09年にNRIに戻り、保険システム推進部長。12年 執行役員 保険ソリューション事業本部副本部長。2014年 同本部長。2016年 常務執行役員。2017年より金融ITイノベーション事業本部長。

ソーシャル物理学とは

林:

 本日は、ペントランド教授にお話をおうかがいする機会をいただけて光栄です。

 日本のビジネス環境には閉塞感が漂っているように感じます。それは、一つには、GoogleやAmazonのような世界的なプラットフォーマーが自分たちの仕事を奪っていくのではないかといった恐怖心からくるものだと思います。2つ目として、日本は世界の中でも高齢化が進んでおり、働き方をどうするのか、高齢者の資産をどう移転すべきかということに対して社会的に強いプレッシャーがかかっていることです。3つ目は、日本の社会の特徴ですけれども、提供するサービスが過剰なゆえにその発展を妨げたり、個人情報保護法のように法制度が厳しくて逆に消費者のために全くなっていないといったことによる要因もあります。

 教授が提唱されている「社会物理学(ソーシャル物理学)」や「Network Intelligence」はこうした状況を克服するキーワードになるのではないかと考えています。

 そこでまず、イノベーションにつながる成果が出ています社会物理学について教えていただけたらと思います。

ペントランド:

 実はこの「社会物理学」という言葉は、非常に古くからあります。1800年頃、「物理学」という言葉が出てきたのと同じ頃に生まれました。しかし当時は、人々の行動を理解するには、データの面でも、数学の面でも、十分ではありませんでした。それに対して、私がこれまで行ってきた研究は、新しいデータソースや先端的なAI、機械学習の技術を用いて、より洗練された人間のモデルを構築することでした。

 人々について理解するためのモデルには、伝統的に2つのタイプがあります。一つは、アダム・スミス流の「合理的個人」のモデルです。このモデルでは、個々人はそれそれが合理的に行動することが想定されています。もう一つは東洋の伝統に基づくもので、人々を「社会の組織」として理解します。すなわち、個々人の行動は複雑に絡み合って不可分なため、社会全体を一つの生き物と捉えるわけです。

 面白いことに、アダム・スミス自身は合理的個人ではなく東洋モデルを信じていました。彼は、人間というのは両方のモデルを混ぜあわせたようなものだと言っています。

 実際、ビッグデータを使って、人々がどこに行って、何を買い、どう行動しているかを分析すると、人々がその両方をあわせ持っていることが観察できます。そこで見て取れるのが、人々が他人の行動を観察して学び取る社会的学習を行っていることです。個人にとって最適な選択をするためには良い情報が必要です。他人から学ぶことは、何がうまくいき、何がうまくいかないかの情報を得るための最良な方法なのです。

林:

 各人が学習を通して、社会を構成する他の人たちと同じような行動をするようになるわけですね。

ペントランド:

 そうです。しかしその裏で、社会はイノベーションも必要としています。個人はただ単に他人の真似をするだけでなく、自らいろいろ試してみることが必要とされているのです。つまり、個人の行動には「社会学習」と「探索」の両方の面があるわけです。

 両者がうまく機能するための重要な条件の一つは「よい情報があること」です。ですから、社会がうまく機能することを阻む2つの敵は、「秘密主義」と「広告」になります。

林:

 AIや機械学習を用いた解析はデータが大量にあり時系列的に変化しない分野では有効ですが、今おっしゃったような、情報の流れや人の意思決定といった常に変化するものを扱うのは簡単ではなさそうです。

ペントランド:

 はい。機械学習にしてもAIにしても、経済学でいう均衡の概念に基づいています。物事が定常状態にあると仮定しているわけです。また、こうしたAIや機械学習では、分析の対象について全く知識がないところから始まります。大量のデータが必要となる理由の一つもそこにあり、トレンドや流行を検出するのがそれほど得意でないことも意味します。

 われわれの分析は、通常のAIや機械学習に比べてずっと効率的な手法を用いています。特に物事が常に非常に早いスピードで変化する金融市場のトレンドの分析などではわれわれの手法が有用です。

「データ」ではなく「知見」を共有する

林:

 ペントランド教授は、データの安全性やプライバシー保護を図りながらいかにデータを共有するかについての技術的な研究にも取り組んでいらっしゃいます。

ペントランド:

 AIや機械学習はすべてデータの話なので、データをどう収集するかは非常に重要なテーマです。

 人間にとっての自然な学習方法は、個人が得た何らかの結論を互いに共有することです。このことは、機械学習においても、人々が持つデータを共有する必要があることを示唆しています。しかし、データを共有するとき、われわれはプライバシーやセキュリティについても考慮しなければいけません。そこで私は、プライバシーやセキュリティを保護しながら、「知見」を共有できるアプローチを開発しました。大事なのは「データ」ではなくデータから導かれる「知見」を共有する点です。

 これはどういうことか。このアプローチの第一のポイントは、「あなたは私にデータを渡す」のではなく、「私があなたに質問する」というところです。私はあなたに関するデータのコピーをどこにも作りません。あなたのデータはあなたが保持し続けます。あなたは、誰がその質問をしているのか、なぜ質問しているのか、何を質問しているのかを見て、答えるかどうか決めるのです。

林:

 個人が一つ一つの質問について答えるべきかどうかを判断するのは負担ではないでしょうか?

ペントランド:

 はい。ですから、そういう人たちは自分の代わりに判断し行動してくれる機関に加入することができます。

 これは、人々がお金を管理してもらうために銀行や証券会社に行くのとよく似ています。お金のための「銀行」があるように、自分のデータを保持してもらうための「データ銀行」があるのだと想像してください。

 ポイントの二つ目は、このプロセス全体が特殊な暗号技術を用いて行われることです。このプロセスではデータが元の形に復元されることはありません。また、法的にも「データを共有した」とは見なされません。

林:

 こうした全く新しいデータ共有の構想が、どうして今、必要とされているのでしょうか?

ペントランド:

 サイバー犯罪、サイバー攻撃は今後ますます拡大するでしょう。ですから従来のファイアウォールよりはるかに頑強なシステムが必要とされています。これまでとは大きく異なるITインフラを採用しない限り、基本的な安全性は達成できないという認識が高まっています。われわれの構想では、ファイアウォールもパスワードもいらなくなります。暗号化されたデータは盗まれても構わないのです。

 ここで重要なのは、だからといって、すべてを変えないといけないような提案では、利用者の負担を大きくするばかりで、実現するのは難しいということです。

 われわれの提案では、利用者にお願いするのはたった一つで「もしあなたが答えたいと思ったら、私の質問に答えてください」ということです。答えたくなければ答える必要はありません。また、これならば手持ちの古いパソコンでも対応できます。

 このやり方は従来に比べてハードウェアの面でもソフトウェアの面でも対応しやすいと思います。事前にどんな質問がなされるか正確に分かりますし、質問の合法性も判断できますので、法的観点からも対応しやすいでしょう。

林:

 一からこうした仕組みを作るのであればよいのですが、既にデータが共有されている中で、それらを新しいシステムに移行するのは難しいのではないでしょうか。

ペントランド:

 既にデータが共有されているのなら、それはそれで構わないと思います。しかし、それもいずれは、質問に答える形に移行するかもしれません。実際、それが今、欧州でやろうとしていることです。

 今日、情報セキュリティ上の重大なリスクの一つは、データの移動に起因するものです。エコシステムにプレーヤーが多すぎて、自分のデータに何が起きたか分からないからです。信頼する機関にデータを渡したとしても、その機関がデータ処理会社に下請けに出し、さらにその会社も別の会社に下請けに出しています。誰がどうデータを処理したのか、把握するのは困難です。

 しかし今お話した方法であれば、こうしたリスクを最小限に抑えることができます。データがどこに行ったかも正確にトラッキングできます。新しいデータ共有の技術はどのように活用できるか?

林:

 こうしたデータ共有方法は、具体的にどのように活用できるのでしょうか。

ペントランド:

 例えば、ある銀行が自分と同じ投資先に他の銀行も投資しているのかどうか知りたいと考えているとします。同じ投資先に多くの銀行が投資をしていると、リスクとなるからです。ところが、そうした情報は顧客データですので、互いの情報を知ることはできません。われわれの方法では、顧客のデータを共有したり銀行の秘密を晒したりせずに、全体でどれだけ投資しているか知ることが可能となります。

林:

 法律を遵守しながら、みんなのリスクを引き下げることができるわけですね。

ペントランド:

 そうです。

 これをもう一歩進めて、こうした質問をすべての金融機関に行いトレンドを検出することができれば、金融システム全体のリスクの引き下げにつなげられるかもしれません。

 今日、どの国でも中央銀行や金融機関は指標となるデータなどを算出していますが、たいていはトレンドを明確に示せるほどのものにはなっていませんし、リアルタイム性もありません。われわれの手法では個別データを晒さずに知見を共有できるので、金融システムの理解や管理を向上させられるでしょう。

林:

 金融に関するリアルタイムのデータとはどんなものでしょうか。

ペントランド:

 たとえば、一般にあまり使用されていない基本的なデータの一つに、小売店への客の出入りがあると思います。

 現在、小売店のデータといえば、たいていは1カ月、1週間、あるいは1日の売上のデータではないでしょうか。ところが、これではどれだけの人がその店舗に入ったか、購入したのはどの地域の人たちだったか、などはわかりません。われわれは実際にこうした調査を行う会社を持っていて、モールなどにシステムを設置しています。これを使えば、どの地域が好調かといった都市の経済的な状況がよくわかります。一日単位でデータが得られるので、金融システムを左右する人間の行動パターンも見えてくるわけです。

林:

 集計データなので、プライバシーを侵害する恐れもないわけですね。

ペントランド:

 その通りです。

 こうしたシステムは既に政府の政策立案、防犯、保健計画などに用いられています。イスラエルでは国をあげてイノベーションを促進しており、特に交通分野における知見の共有が進んでいます。その仕組みでは、企業がメリットを受けられるようにしています。中国では、多くの人が成長を享受できるためのデータ共有に焦点が置かれています。

 それから、国連が採択した「持続可能な開発目標(SDGs)」においても、「持続可能性」や「公正性」といった、社会に関するさまざまな指標を計測するために、こうした技術が用いられています。持続可能な開発のために革新的なデータ活用を促すGlobal Partnership for Sustainable Development Dataの理事を私が務めているのもそういう理由からです。

林:

 先ほど「個人にとってよい意思決定は社会にもよい影響を及ぼす。そのためには「よい情報」が必要だ」というお話がありました。しかし、質問形式のアンケートでは、どんなに具体的な質問をされても、人はうそをついたり、気分によって違う答え方をするのではないでしょうか。

ペントランド:

 これは大変難しい質問です。しかし社会はこれに対してある程度答えを持っていると思います。たとえば、日本には他の国と同じように、国の統計局があります。彼らが発表する、社会に関する統計は幅広く信用されていますが、統計に問題がある場合もありますし、それは一般的に認知されています。

 私は、こうした問題を克服するのは、科学の進化の長期的なプロセスだと見ています。社会は、社会自身について、よりよく理解するための方法を身につけてきました。欠陥があれば修正し、必要があれば刷新してきました。人間はこれを200年間やり続けてきました。

林:

 社会物理学もそうした過程で生まれてきたわけですね。

ペントランド:

 そうです。

 そして今、よりよい社会を実現するための最大の障壁は何かといえば、私は、「データを共有できないこと」だと思っています。これまでは個人のプライバシーや企業の機密情報の問題があって、ある種の質問については質問することすら難しかったわけです。しかし、これは克服できない問題ではありませんでした。われわれの開発した手法を利用することで、データの秘密をリスクに晒すことなく、知見を得られるようになったわけです。

国ごとのデータ保護法制の違い

林:

 新しいデータ共有の仕組みを活用するとき、重要なのは各国の法制度にどう対応するかという問題だと思います。国や地域で法制度が大きく異なっていると対応も難しいのではないでしょうか。

ペントランド:

 そうですね。ですから、私の研究グループでは、どの国や地域においても整合的でよく似た基準が作られることを目指しています。整合性が限られると、有用性が限定されてしまうからです。

 私が米国だけでなく、EU、中国などと共同で事業を進めているのもその点を重視しているからです。多くのメジャープレーヤー間で整合性が図られていれば様々な可能性が広がります。日本も他地域と整合性の高い制度を構築すべきだと思います。

林:

 今、整合性の高いシステムが重要と言われましたが、現実にはEU、米国、中国のデータ保護法制は、それぞれ異なる方向に向かっているように感じます。

ペントランド:

 私はそうは思いません。私は、欧州のEU一般データ保護規則(GDPR)導入に向けた初期段階の議論に携わっていました。そこでわかったのは、欧州が何か規格を採用すれば、米国もそれに対して整合性を図らなくてはならなくなるということです。両者にまたがるビジネスがあまりにも多いからです。

 もちろん欧州と米国ではプロセスが大きく異なります。欧州にはナポレオン法の概念があります。どんな不都合が起き得るのかを予め想定し、事前にそれに対処しようとします。一方、アメリカ法では、不都合が発生してから矯正しようとします。

林:

 中国はどうですか?

ペントランド:

 中国では、法律という概念そのものがまだ非常に新しいと言ってよいでしょう。しかし、中国でもGDPRにかなり類似した個人情報保護法ができています。データ共有構想に関して私が書いた本は、最近中国政府によって翻訳され、中国で出版されました。われわれの研究は中国の国営企業からも資金提供されており、この分野の関心は非常に高いと思います。データ共有に対する心理的な壁をどう超えるか?

林:

 日本ではデータの安全性について、企業も個人も越えなければならない心理的な壁があるように感じています。たとえば、われわれは、自宅のパソコンや企業のコンピューターセンターにあったデータが、クラウドに乗ってどこにあるかわからない状況になることに非常に抵抗を感じています。これはどちらかといえば論理的なものではなく、心情的な問題かもしれません。

ペントランド:

 確かに、「暗号化されたデータは安全かつ有益だ」ということを人々が消化しきれていない、という問題はあります。

林:

 長い間、人間は宗教や国家といった権威に依存してきたところがあります。とりわけ日本人はそうした傾向が強いと思います。一方、ペントランド教授が目指しているのは、国家ではなく市民が自ら情報を管理しようとする、民主主義の究極的な姿ではないでしょうか。そこに日本人がたどり着くのは簡単でないように感じます。

ペントランド:

 私は、日本人は社会を支えたいと思う気持ちが非常に強いと感じています。家のごみ出しも皆決められた時間にきちんと行っていますよね。

 そう考えると、例えば「社会の誰もがよりよい医療を受けられるように、データを共同利用する「データコープ」にあなたのデータを提供してください」と言えば、日本人は動いてくれるのではないでしょうか。

 これが、"data for good"、「社会の利益のためのデータ利用」という考え方です。ただし、人々から理解を得るには、やりとりも非常に具体的でなければなりません。単に「データをください。いろいろやりますから」ではダメです。「あなたの健康について質問する権利をください。それを使って病院をこれだけよくできます」とか、「家計について質問する権利をください。そうすれば、より安定した、より安全な金融システムにすることができます」と説得する必要があります。目的を特定し、具体的な質問をすることが大事なわけです。

 アメリカでは、これは「インフォームド・コンセント」と呼ばれています。人々は事前に、何が行われるのか、なぜ行われるのかを知っている必要があるわけです。やめたくなったときにやめる権利もなければなりません。ヨーロッパのGDPRも基本的にこれと同じです。

林:

 中国はどうでしょうか。

ペントランド:

 中国では望もうと望むまいと、国家を支えるためにデータを提供しなければならない状況です。とはいえ、米国でもこうした状況はある程度当てはまります。特定のデータを提供しないと重要な権利が奪われてしまうため、実際にはデータの提供を余儀なくされるケースは少なくありません。

企業がデータを共有する動機

林:

 日本の企業もビッグデータの活用はもう一歩のところまで来ていると思います。ただ、会社同士がデータを共有して一緒に何かをやることに対しては強い抵抗感があります。

 たとえば電子マネーを発行する鉄道会社は誰がどこで乗って、どこで降りたかといった情報を持っています。しかし、それを鉄道以外の情報に使うことには社会的な抵抗が非常に大きい。コンビニ会社のデータと一緒にすれば、高齢者に対して新しいサービスを提供できるかもしれませんが、なかなか難しいのが現状です。

ペントランド:

 実はわれわれがセネガルとコロンビアで手掛けているプロジェクトはそういうタイプのものです。民間企業と行政の持つデータを併せて分析することで、貧困層やマイノリティの人たちをはじめ、社会全体にとって役立つ知見を得ようとするものです。

 ではなぜ企業は自分達が収集したデータをオープンデータ・リソースとして社会と共有しようとするのか?最大の理由は、企業は、公に向けたサービスとしてデータを提供することで、社会に貢献するよき市民になることができるからです。

 企業が提供するのは、「地域ごと」などの集計されたデータです。こうした平均化されたデータは企業にとってさほど価値のあるものではないでしょう。しかし、市民はそうした集計されたデータを公正かつオープンなものとして活用し、知見を得ることができます。また企業は、こうしたデータを提供することで、「データや知見を共有すれば社会に役立つ可能性がある」という考えを人々に根づかせることもできます。データの提供は社会に貢献する手段ですが、社会を教育する機会にもなるわけです。

 たとえばある通信会社で、われわれの研究を支援してくれているのはマーケティング部門です。同社はデータを国、企業、人々に提供することで、社会に役立つ活動をしていることをアピールしているわけです。

林:

 面白いですね。マーケティング部門が窓口の会社は珍しくないのですか。

ペントランド:

 そうですね。このイニシアチブには、他に銀行や運輸会社も参加していますが、それらの会社でもマーケティング部門が窓口になっています。

 中国でも、こういうやり方は有効なのではないかと思っています。中国ではまだオープンデータ法制がどのようなものになるかわかりません。彼ら自身、どうすべきか迷っているところがあります。ですから企業としては、データを提供して「こう使うと役に立つよ」と示すことができれば、よい機会になるのではないかと思います。政府や当局が関心を持てば、「法律によってこういうデータ共有を認めるべきではないか」という議論もできるでしょう。

林:

 中国政府が法律を実際にどう執行していくかにも影響を与えるかもしれませんね。

ペントランド:

 そうです。規制当局や政治家に対して地道に、「データ共有はこんなに役立つのだから、制約を設けて潰してはいけない」と説得していく必要があると思います。

 日本も欧米と事情が少し異なるかもしれませんが、それほど大きな違いはないと思います。どこか日本の有力な大学などに参加していただいて、MITと共同でこうした取組みを支援できるとよいかもしれません。データをどう社会に役立てることができるか?何が制約になるか?といった議論をもっと喚起できるのではないでしょうか。

林:

 NRIは営利企業です。しかし社会に貢献する企業だからこそ収益を追求できるのだと私は思っています。NRIとしても、ぜひこうした議論に率先して関わっていきたいと思います。

 本日は、貴重なお話をありがとうございました。

(文中敬称略)

このページを見た人はこんなページも見ています