マンガ 統計学が最強の学問である
統計学の解説書ながら42万部超えの異例のロングセラーとなっている『統計学が最強の学問である』。そのメッセージと知見の重要性は、統計学に支えられるAIが広く使われるようになった今、さらに増しています。そしてこのたび、ついに同書をベースにした『マンガ 統計学が最強の学問である』が発売されました。本連載は、その刊行を記念して『統計学が最強の学問である』の本文を公開するものです。 第30回では、「計量経済学」と「統計学」の違いに注目して解説します。(本記事は2013年に発行された『統計学が最強の学問である』を一部改変し公開しています。)
計量経済学者とは経済学分野で統計学を用いる人たちの呼び名であるが、計量経済学と統計学の境界は少々見えにくいものかもしれない。
何十年か前であれば「社会や経済を扱っていれば計量経済学者」「農業や医療に携わるのが生物統計家」と素直に見分けられたのかもしれないが、生物統計学の中で生みだされた手法は現在では多くの分野で使われるようになっているし、それは計量経済学者たちにしても例外でない。というか、現代においてはフィッシャーやピアソンの生み出した手法や考え方を、わざわざ「生物統計学」ということのほうが珍しくなっている。一般的に「統計家」と言えば、心理学や社会調査などの明確な区別がない限りフィッシャーたちの生物統計学をバックグラウンドとした統計学をトレーニングされた者であることが多い。
たとえば現在の雇用の有無を結果変数、教育を受けた年数や過去の世帯収入、人種、居住地域といった社会的属性を説明変数とした回帰分析は、計量経済学者が行なうこともあるし、社会学分野の統計家が行なうこともあるだろう。だがそのような中でもやはり計量経済学者は統計家として特殊な立場にある。
表面上の違いをあえて挙げるならば、計量経済学者のほうが統計家よりも交互作用項を含む説明変数の選択についてより慎重な検討を行なう傾向にあるかもしれない。また、彼らはしばしば説明変数と結果変数の間に直線的な関係性だけでなく、データマイニングと統計学の違いのところで述べたような曲線的な関係性を考えることもある。たとえば単純に世帯収入を説明変数、生活に対する満足度を結果変数として回帰分析を行なった場合の回帰係数は、「年収が100万円増加した場合の効果はすべての人にとって平均的に同じ」と考える(図表51)。
一方、このグラフをよく見ると「年収300万円から400万円へ変化した場合と、900万円から1000万円へ変化した場合の生活満足度に対する影響は異なる」と考えられるかもしれない。つまり、世帯収入と生活満足度の関係性は曲線的なグラフのほうがよく当てはまりそうであるということである(図表52)。こうした曲線を表す数式を推定するということが「曲線的な関係性」を推定するということである。このような推定においては「世帯収入の2乗」とか「log(世帯収入)」を回帰分析の説明変数として用いることになる。
また、多くの統計家が二値の結果変数に対してロジスティック回帰を用いる一方で、計量経済学者はプロビット回帰という手法を好んで使う。プロビット回帰のほうがロジスティック回帰よりも数理的にキレイではあるのだが、推定された回帰係数がロジスティック回帰のオッズ比のように「約X倍になる」という形にはならず、直感的な解釈がしにくいという難点を持っている。
さらには、以前紹介したように統計家たちが因果推論のために傾向スコアを用いるような状況で、計量経済学者はトリートメントエフェクトモデルとか、Heckitだとか呼ばれる手法を好んで用いる。これはノーベル経済学賞受賞者であるジェームズ・ヘックマンが、1974年から1979年にかけての一連の論文の中で提案したものである。なお経済学系のバックグラウンドを持たない統計家が、この手法を使うところを私は今まで見たことがない。
統計学と計量経済学の「本質的」な違い
しかしながら、これらはあくまで表面的な違いであり、重要なのはその背景にある哲学である。
じつは経済学と統計学という学問は、一見同じように「社会に存在している数字を分析する学問」かもしれないが、ある意味真逆の哲学を持っている。計量経済学は経済学の中ではかなり統計学よりの考え方に基づく領域だが、それでもこのような考え方の溝が埋まりきるわけではない。
両者が持つ真逆の哲学とは、「帰納」と「演繹」のどちらを中心に組み立てられた学問であるかというものだ。
一般に、科学的推論の形式には大きく分けて帰納と演繹がある。
大まかに言えば、帰納とは個別の事例を集めて一般的な法則を導こうというやり方、演繹とはある事実や仮定に基づいて、論理的推論により結論を導こうという方法である。
フィッシャーの弟子であるC・R・ラオは「統計学の発展によって帰納的推論における不確かさが数量化され、帰納的推論がより正確になり、我々の思考に大きな躍進がもたらされた」と述べている。データとはすなわち個別の事例をわかりやすくまとめあげたものであり、統計学の目的は帰納的推論である。この場合、推定された回帰モデルなどが「事例を集めて導かれた一般的な法則」に該当するだろう。
一方、演繹の代表格としてニュートンの力学が挙げられる。彼は力に関するたった3つの法則を仮定することで、野球のボールから太陽系の惑星に至るまで、世界にあるほとんどのものの挙動をうまく説明することに成功した。
彼が仮定した3つの法則とは以下のようなものである。
①すべての物体は外部から力を加えられない限り速度(の大きさと向き)は変わらない。 ②物体が力を受けると、その力の働く方向に加速度が生じる。加速度は力の大きさに比例し、質量に反比例する。
③力は相互作用によって生じるものであり、一方が受ける力と他方が受ける力は向きが反対で大きさが等しい。
なお、これらの法則自体の真偽は判断しようがない、という点には注意したい。
たとえば1つめの法則は、言い換えるならば「物体の速度を変化させるものは力である」と言っているに過ぎないからだ。もちろん異なる意味で「力」という表現を使う人もいるかもしれないが、「ニュートンは今後こういう意味で力という言葉を使います」という宣言をしたものを間違っているとか正しいとか言うことはできないだろう。
あくまでニュートンが最初に提示した運動の法則は、「それほど異論は出ないだろう」という議論の前提だ。しかしながら、このシンプルな仮定によって得られる数式を使い、演繹を広げると、我々が目にするほとんどのものの動きはよく説明できる。また、そうして理論が組み立てられたことで、観察や実験に基づく理論の実証、すなわち帰納的な推論を行なうべき方向性の目途も立つのだ。
ニュートンのシンプルな仮定から世界のすべてを説明する理論体系を組み上げる、という美しいやり方は、物理学だけでなくその後のすべての分野の学者たちに影響を与えた。
たとえば共産主義の理論的背景を生み出したカール・マルクスは、人間社会にも自然と同様客観的な法則が存在しており、人類の歴史は生産力の発展だけで説明できるという唯物史観を提唱した。フィッシャー以前の統計学者の1人であるアドルフ・ケトレーは天体の挙動と同様に人間の挙動にも法則性が導き出せるのではないかと考え、社会物理学と称して人間に関するデータを収集した。ひょっとするとゴルトンもダーウィンの進化論を数学的に記述することで、生物学におけるニュートンのような存在になりたかったのかもしれない。
よりよいモデルを求める計量経済学者
彼らの試みの多くは成功しなかったが、物理学以外でニュートン的な研究方法に成功した数少ない学問の1つが経済学である。
経済学者はニュートンが「すべての物体は外部から力を加えられない限り速度は変わらない」と仮定したのと同様に、「あらゆる経済活動は物々交換にすぎない」とか、「消費者は期待される効用(満足感のようなもの)を最大化する行動を選ぶ」といった仮定から、価格や支出、貯蓄といったものの関係性を記述した連立方程式による演繹を繰り返すことで、個人や社会の均衡状態を説明しようとするのだ。
そのためなのか、計量経済学者はしばしば回帰分析の結果を応用して推計を行なう。疫学者にとってはタバコががんのリスクになっているということがわかればよいのだが、「ではこのリスクの推定が正しいとした場合に、日本全体でどれだけの損失なのか」という演繹を行なうのは計量経済学者の仕事だ。第18節で、喫煙が日本において毎年7兆円以上の経済損失となっているという結果について言及したが、これも計量経済学的な推計の結果である。
たとえば性別・年代・喫煙の有無によって、発がんのリスクが推定されるモデルが得られたのであれば、現時点での性・年代別喫煙率をもとに、現在の喫煙による将来の発がん者の人数が演繹できる。さらにそこへ、がん患者の医療費という新たなデータを用いれば、「タバコのせいで余計にかかると考えられる医療費」という経済的損失の額がさらに演繹できる。
ただし、この最終的な経済的損失という結論にたどり着くまでには、「この回帰係数は性別と年代さえ考慮すれば他の集団でも正しいものとする」とか、「がん患者1人あたりの医療費は今後も変化しないものとする」という仮定も成り立っていなければならない。
疫学者や生物統計家は、帰納によって一般的法則を導くと言っても、「どうせランダムサンプルなどではないし、誤差だって含まれているし、別の集団でこの回帰係数が丸々一致するかどうかはわからない」と、一般化の部分に関しては比較的謙虚である。あるいは一部の計量経済学者に言わせると「臆病」ですらある。そのため「あくまでこの調査した対象集団においては」という範囲で間違いのない因果推論だけを行ない、「他の集団で応用する時には注意してください」と断りを入れたうえで結果を報告する。興味のある原因と結果の関係性さえ誤りなく推論できれば、性別や年代といった他の変数を含むモデルを全国民に適用した場合の妥当性には二次的な関心しかない。
しかしながら計量経済学者にとって、演繹の対象にならないようなモデルは経済学の進歩に資するものではない。だから彼らは疫学者などよりも熱心に、ありとあらゆる手段を用いて当てはまりのよいモデルを作ろうとする。ランダムサンプリングによる社会調査データを解析しようとするのもその1つのやり方だ。よいモデルができればそれだけ今後の演繹によって誤った結論が導かれる可能性は少ないのである。ただし、いくらモデルの当てはまりがよいとは言っても、ニューラルネットワークの結果のように連立方程式の形で表せないようなものにはあまり興味がないそうだが。
なお、私はヘックマンのトリートメントエフェクトモデルと傾向スコアの間にも、こうした「演繹に利用するためのモデル」と「因果関係を歪める要因を調整するためのモデル」という思想の違いが現れているように感じる。
以前紹介した傾向スコアを用いた分析は、ランダム化比較実験と同様に「興味のある要因以外の条件はほぼ同じ」と見なせるようにするものだった。それに加えて傾向スコアを回帰モデルに用い、複数の説明変数が結果変数に与える影響を正確に分析できるようになったのは、ハーバードの教授であるロビンスたちによって書かれた1994年の論文の影響が大きい。しかしながら、ヘックマンは1970年代にはすでにこうした回帰分析の方法を提唱しており、それ以後も細かい手法面の改善を続けている。
別にだからといって、一部の口の悪い計量経済学者が言うように「統計学者は経済学者よりも研究のレベルが20年遅れ」というわけではない。疫学者や生物統計家からすれば、傾向スコアによる層別解析でランダム化比較実験のように「平均的にはその他の条件が等しい」という状態になっていると考えられるのなら、因果推論の用は足りる。しかしながら、計量経済学者にとっては「フェアな比較」はそれ自体目的ではなく、演繹のためのよりよいモデルを得るための手段に過ぎないのだ。
影響力を強める計量経済学
ほとんどの統計家は可能な限り仮定が少ないことを重視する。そもそもの仮定が間違っていては因果推論の結果が誤る可能性が大きくなるからだ。
だがその一方で、仮定がある程度正しいものであれば、演繹によってデータからより多くの情報を導くことができる、ということも事実である。そうした仮定の正しさを検証するためにだって統計学は有効なはずだし、そもそも統計学自体、何の仮定も置かずに必ず正しいと成立するようなものでもない。
計量経済学であろうが統計学であろうが、大事なのは推論された結果だけでなく、どのような仮定が背後にあり、またその仮定がどの程度確からしいかを理解するということである。こうした理解さえできていれば、推計の過程でどのような手法を用いたかというのはあくまで瑣末な問題にすぎない。
なおこのように演繹と帰納、あるいは理論と実証の間を繋ぐ計量経済学という重要な分野であるが、その地位が経済学の中で確固たるものとなったのはつい最近のことであるらしい。経済学分野の大物中の大物であるジョン・メイナード・ケインズは統計学的な手法を用いた計量経済学のことを「黒魔術のような怪しいもの」だと述べたし、経済学の中では計量経済学について良くも悪くも「理論なき計測」という表現がされる。これは経済学にとって理論がいかに大事で、当たり前のものであるかということをよく示している話だと思う。
統計学が「最強の学問」となったのと同様、計量経済学もデータの整備とITの発展で大きな力を持つようになった。おそらく今後もさらに、経済学の諸理論は計量経済学の実証にさらされて、我々の社会を豊かなものにしてくれるのだろう。