データを読み解くリテラシー

世間では統計学がブームらしい.
kaji-fig1Google のHal Varian氏は,2009年の時点で「今後 10 年間で最もセクシーな仕事は統計学者だ」と断言している.最近は日本でも統計学に関する本が売れているし,ビッグデータというキーワードにも手垢が付き始めている.私自身も研究者として,あるいは普通の市民として,様々な調査結果や統計データに接する機会が多くなっているような気がするが,その中には,首を傾げたくなるものも少なからず存在する.このボンヤリとした違和感は,統計学以前の,統計的な数字という「情報が作り出される仕組み」の取扱いに関する不適切さから来るのではないか,と最近は思いつつある.小文では,情報理論における「エルゴード性」というキーワードを軸に,この雑駁とした感じについて書いてみたい.

影の薄い「エルゴード性」

kaji-fig2エルゴード性は情報理論で学ぶ基礎的な概念の一つであるが,抽象的でイメージすることが難しいこともあり,多くの学生が「理解せずにやり過ごしてしまう」用語の代表例であろう.かくいう私自身も,授業の準備のため教科書を読みなおして「再発見」するまでは,意識の片隅にしか残っていなかったことを正直に告白しておく.エルゴード性とは,「時間平均とアンサンブル平均が等しくなる性質」と説明されることが多いが,この説明ではいまひとつピンと来ない.これは,既に理解している人が「頭で考えてひねり出したキレイな説明」である.もっと泥臭くて良いから,わかりやすい理解の方法はないものだろうか.

非エルゴード的=個性的?

少し乱暴な言い方になるが,エルゴード性とは「個々の情報源に個性がないこと」と理解するのが早いように思われる.まずは具体例で考えよう.

  1. 工場から出荷されるサイコロを無作為に1個選び出し,そのサイコロを100回振ったところ, 1の出た回数が17回だった.この結果から,サイコロが 1を出す確率を17/100≒1/6と推測した.

たった100回の試行結果から議論を一般化するのは少し強引な気もするが,議論の大筋としては妥当であろう.サイコロには色や形の違うものもあるが,統計的には,どれも同じような振舞いをする.すなわち,個々のサイコロには「個性がない」ということができる.どれでも良いから1個のサイコロを選び出してきて,そのサイコロの統計的な性質を分析してやれば,他のサイコロの統計的性質も同じようにわかるはずである.このように,1個の代表の振舞いから全体の統計量を推測できるのが,エルゴード性と呼ばれる性質である.では,上の例と同じ論理構造を持つ次の例を考えてみよう.繰り返しになるが,次の例と上の例とは同じ理屈になっており,出てくる単語や数字が少し違っているだけである点に注意して欲しい.

  1. 日本の成人男性を無作為に1人選び出し,その人の喫煙行動を100日間にわたって観察したところ,タバコを吸った日が90日あった.この結果から,日本人の成人男性の喫煙率を90/100=9/10と推測した.

kaji-fig3明らかにヘンである.サイコロのときに成り立った議論が,どうして喫煙行動では成り立たないのであろうか.理由は簡単である.喫煙行動は人によって異なるのが当然なので,1人の行動をいくら詳細に分析しても,その分析結果を全体に対して一般化することはできない.すなわち,集合や集団を構成する要素に「個性」があるときは,1個の代表の振舞いから全体の統計量を推測することはできないのである.このようなタイプの情報源(現象,行為)は,非エルゴード的であると言われる.

エルゴード性と統計データの読み方

この例からもわかるとおり,非エルゴード的な情報源からの出力について間違った取り扱いをしてしまうと,せっかく実験や調査をしてデータを集めてみても,誤った結論を導き出してしまうおそれがある.とくに,人間の行動や行為は非エルゴード的なものの代表であるため,その取扱いには十分な注意が必要である.非エルゴード性の「罠」を避けるためには,十分多数の情報源(文脈によっては,サンプル,被験者,モニターと理解してよい)を集めてこなくてはならない.しかし,単に数を集めれば良いというものではなく,その集め方についても慎重に検討する必要がある.たとえば,前述の喫煙率調査のやり方を改善するため,100人の被験者を集めることにしよう.100人くらい集めれば,個性の違いを平均化して正しい推測ができそうであるが,煙草の自動販売機の前で100人にアンケートを取るのはマズイやり方である.自販機の前をウロウロするという行為と,喫煙行動との間には強い相関があると考えられるからである.この場合であれば,喫煙行動と全く相関のないやり方,たとえば電話番号をランダムにダイヤルする等の方法で被験者を集めなければならない.

上で述べたような人工的な例であれば比較的わかりやすいが,我々が日常生活で接するのは,もっと微妙でわかりにくいものである.たとえば「日本人は1日平均50通のメールを受信する」といったレポートを目にする機会もあるが,その調査方法をよく調べてみると,パソコンサイト上のアンケートだったりする.膨大な数のメールへの対応に忙しくて,アンケートに回答する時間すら持ち合わせていない人は,最初から調査の対象に入れてもらえないのである.これなど,上で述べた「自販機前でアンケートを取る」のと大差ないように思われるが,この数字だけを信じて何か新しいビジネスなんかを立ち上げてしまうと,痛い目に遭いそうである.

kaji-fig4あるいは,携帯会社の電話の「つながりやすさ」を評価するのに,その会社と契約している人をモニターに選んで発着信の成功率を調べた,といった結果を見ることもあるが,あれなどもエルゴード性について理解しているのか,甚だ疑わしい.言うまでもなく,携帯電話の「つながりやすさ」は,いつ,どこに居るかという個人の行動パターンと密接に関係している.「ある携帯会社のカバーエリアにいる確率が高い人」がその会社と契約しているのだから,契約者をモニターとして調査すれば,「つながりやすさ」が高く出るのは当然であろう.

身近な問題として

世間に出回っている調査結果を笑うのは簡単であるが,研究活動を行う者にとっては,この問題は他人事ではない.とくに情報科学の分野では,ユーザの利便性や操作性を改善するタイプの研究が少なからず行われている.そのような研究の良し悪しを決めるのは,突き詰めていけば人間の主観的な評価である.被験者アンケートにより提案手法の有効性を確認しました,という学会発表を聞く機会も多いが,その被験者が同じ研究室の友人だったりすると,とたんに結果の信ぴょう性が疑わしくなる.人間を対象にした研究を行うにあたっては,非エルゴード的な対象物を取り扱っているのだということを肝に銘じておきたいところである.

おわりに

膨大なデータを統計的に読み解く能力の重要性は高まる一方である.しかし,数字として表れた情報だけを見て,その情報が生み出される「仕組み」に思いを致さないのは,情報の専門家ならずとも褒められたものではない.もちろん,誤った分析結果を流布する者の責任は問われなければならないが,そのような不正確な議論を盲目的に受け入れることも,ある意味同罪であるといえる.幸い,情報科学の先達は,既に多くの発見をしてくれている.学ぶべきことは,手元の教科書に書かれているかもしれない.そのことに気付くか,気付かないかは,学ぶ時の意識の持ち方次第である.教科書を読みなおして,何かを「再発見」するようでは,全然ダメなのである.

 

数理モデル?なにそれ?おいしいの?

池田和司 (教授): おいしいんです.数理モデルはいろいろな現象を数式で表したもので,数式にすることでその性質をより深く知ることができ,またある操作をした時にどんなことがおこるかを予測することができるようになります.数理情報学研究室ではこの数理モデルを利用して,脳情報学および適応システムを中心とするさまざまな問題を解決するとともに,新たな数理モデルを開発したりその性質を解析したりしています.
では,実際に数理モデルを使って研究をしている人に,どんな現象をモデル化してどのようにおいしいのかを聞いてみましょう.

小西卓哉 (D2): 私は数理モデルを関係データに応用する研究をしています.関係データとは複数の対象の関連を表したデータのことで,商品の購買履歴やソーシャルネットワークのようなWeb上のデータがその代表例です.他にも脳の神経ネットワークや遺伝子の相互作用情報も関係データとみなせ,自然科学の様々な場面に現れます.
このような関係データのための数理モデルには様々な方法がありますが,私は潜在変数をもつ確率モデルに注目しています.例えば商品の購買履歴にSF映画のDVDばかり買っているユーザが何人かいるとします.そうすると,このユーザたちは「SF映画好き」という潜在的なグループに属していそうだと推測できます.確率モデルは,このようなグループを潜在変数としてデータ(購買履歴)から推定できる方法です.潜在的グループを推定できれば,SF映画好きのユーザが買っている商品を別のSF映画好きのユーザにオススメしたり,興味の近いユーザを発見して紹介してくれるシステムが作れます.実際,私達が日々接しているWebサービスの多くに,このようなモデルが導入され,成功を収めています.関係データへの確率モデルの応用は,数理モデルが現実社会で活躍している例といえます.
fig1

山田達也 (D2): 私は生物現象のモデリングをしています.対象としているのは神経軸索の誘導現象です.
脳のような複雑な神経ネットワークが構成されるときにも,素過程としては,互いに離れた神経細胞同士の接続が必要となります.その時には,神経細胞から伸びる突起先端の成長円錐が,きちんとターゲットとなる別の神経細胞まで誘導されなければなりません.しかし,成長円錐は,細胞内外の分子濃度,運動する足場との間に発生する力,電気的なポテンシャルなど,様々な物理量を感知して運動を行うため,モデリングはそう簡単ではありませ
ん.
私はそのような現象を「物理量の変換」という素過程の連鎖と捉え,成長円錐が従う偏微分方程式の構築を行っています.また,机上の空論としないために,統計的な手法を用いて生物学的な実験データとの整合性やモデルの妥当性についての評価も行っています.
成長円錐の運動メカニズムを知ることによって,神経軸索の配線を自由に制御することが可能になるかもしれません.それが,脊髄損傷に対する再生医療の一助となればうれしいことです.
fig2

小出真子 (D1): 絵画の評価なんて個人に依存したものだから定量的には扱えない.一般的にはそう思われていて,私自身も長年そう思ってきました.しかし「個人に依存」とはいっても,芸術の評価には普遍性があります.ただし,画家はその普遍的な価値を理解出来ますが,一般の方はなかなか理解できません.そこで私は「画家・素人の鑑賞時視覚認知の違い」を軸に,この問題に取り組んでいます.
「違い」をみるためには何か基準を設けなければなりません.ここでモデルが利用できます.視覚認知は視線パターンと強く関係しており,視線パターンは人の低次視覚処理システムを模したモデルで予測できるのです.
私は「素人は画家より鑑賞経験が浅いので,高次処理は働いておらず予測モデルの通りに鑑賞する」という仮説を立て,実際に被験者に絵画を鑑賞してもらい,その時の視線を測定しました.その結果,確かに素人の視線はモデルに近く,画家の視線はモデルとは多少異なっていました.視覚認知は感性評価とはまた別の問題ですが,人の心は思っていたより単純なのかも,とも感じています.
数理モデルは人の内観にすら迫っていける可能性を秘めています.見えないものが見えてくるプロセスは魅力的です.
fig3

加藤綾華 (M2): 私は自動車を運転するドライバーの行動をモデル化する研究をしています.免許を取ってから日の浅い初心者ドライバーや免許は持っているがめったに運転しないペーパードライバーは,普段から運転経験を詰んだ熟練ドライバーに比べて道路を安全に走行するための運転能力がまだまだ身についておらず,交通事故を起こしやすい傾向があります.そのため教習所では,シミュレータを使った訓練や危険予知トレーニングシートを使った学習を行っています.
私は,より効率的な非熟練ドライバーの運転能力向上の訓練を目指して,運転中の安全確認やハンドルやアクセル操作などが非熟練ドライバーと熟練ドライバーでどのように違うのかを明らかにしたいと考えています.そのため,それぞれの運転操作や視線を計測する実験を行い,運転行動を説明できるモデルを構築しています.モデルの作成によって運転行動をより深く理解すれば,より効率的な指導や訓練が実現するでしょう.
この研究の成果は,非熟練ドライバーの交通事故を減らすだけでなく,私を含めこれから免許を取得する人たちにも役立つと思っています.
fig4

山村頼子 (M2): 私はてんかんのモデルを作っています.てんかんは脳の異常な電気活動に由来するけいれんや意識障害などの発作を主な症状とする病気で,主に薬で治療をします.それでは治せない患者さんには外科手術を行い,異常な電気活動を起こしている脳部位(てんかん焦点といいます)を切除します.そのため,後遺症が残ることがあります.
外科手術よりも脳に負担をかけない新しい治療法として,近年,局所脳冷却という手法が注目されています.これは,てんかん焦点周辺を冷やすと発作が止まるという性質を利用しています.
ところで,てんかん焦点を冷やすと発作が“クールダウン”するのは何故でしょうか.一見,直感的に納得できそうにも思える現象なのですが,実はその仕組みはよく分かっていません.そこで,数理モデルの出番です.
私は,てんかん焦点のモデルを計算機上に作って動かしてみることで,冷却がてんかん発作を止める仕組みを明らかにしようとしています.例えば,脳を冷やした時に細胞膜上のイオンチャネルに起きる変化が発作を止めるかどうかを調べるため,モデルの中でイオンチャネルの挙動を表す式だけに温度の変数を入れてシミュレーションを行います.実験結果と違う結果が出たら,イオンチャネルだけでなくシナプスにも温度依存性を入れてみる,などという具合に,モデルの挙動が実際の現象に近づくように改良していきます.
このモデル研究を活かして,患者さんの負担の小さいてんかん治療法を開発できたら,と思っています.
fig5