本当は噓つきな統計数字(門倉貴史著;幻冬舎新書)

「本当は噓つきな統計数字」門倉貴史著 幻冬舎新書

 科学の世界も、政治や経済の世界も統計数字が満ちあふれている。しかし、この統計数字は人々を説得するときに力を発揮すると同時に、真実を歪めることも多い。この根本原因は、データーのゆがみ、サンプルやカウント方法、確率の操作である。また、プラス要素とマイナス要素の比較がなされていない。最初から偏向した証拠をベース(確証バイアス)するなど、いわゆる偏向—バイアスがかかっているといった要素が、結論を歪める。
 
 また、科学的に確立されていない基準値の存在(閾値;いきち/境界値)によって政治的に調整されたりする。始めから結論にあわせたデータ収集やアンケート回答に噓がある場合等、統計数字に隠された様々な要素を具体例を上げながら示している。著者はエコノミストとして、様々な事例をポイントとしてあげており、我々の情報リテラシーを高めてくれる。数量バイアス、心理的偏向バイアス、エイジヒーピング(age heaping)サンプリングが母集団の特性を反映していない。確率や数字の操作が社会的に影響を与えた実例は無数にある。数えられないものを無理に数えた結果、イベントの参加人数にみられるカウント誤差、確率における不確実性(エルスバーグのパラドックス)の見方が誤ったばかりに起きたリーマンショックなどである。

 この中で印象的だったのが、黒人向けの慢性心不全治療薬バイデルの認可取り消し問題である。バイデルは黒人によく効くという申請をしたが、治験のデータ不足ということで認可されなかった。これはたったの49人であり、本来数千人を必要としている基準に満たなかった。これは特許の延長を狙った為に起きたのである。
 確率における母集団の主観によっても変化するベイズ統計学の説明も参考になる。この主観確率は迷惑メールのフィルターに応用されている。

 交絡因子もバイアスを生じる原因である。例えば、タバコは癌の原因として認知されるようになった。しかし、飲酒もかつてはそうであった。これはタバコを吸う人と飲酒との関係は相関性があり、タバコを吸うひとには飲酒量の多い人が重複しているという結果とからくるもので、飲酒単独では発がん性は少ない。これがタバコと癌の交絡因子である。この本では触れられていない。

 また、今日問題になっているTPPの経済効果について、これは統計のベースがなんであるかが公開されていない為に政策の溝が埋められない。国家の存亡が関わる事ではないか。経済産業省と農水省との経済効果の推定が正反対であることだ。経済産業省は自由化により、貿易が振興され、農産物に加え、関連産業への影響などGDPを年10兆円プラスとし、一方農水省は7兆9000億円のマイナス、内閣府は2.5〜3.5兆円押し上げられ、GDPは0.5%上がると、自省に都合の良いデータを作成し、政府間での調整が行なわれていない。データを集める人間の意図が大きく影響していることなのである。








Wikipedia より
オッズ比(オッズひ、Odds ratio)は、ある事象の起こりやすさを2つの群で比較して示す統計学的な尺度である。
オッズとは、ある事象の起こる確率をpとして、p/(1−p)の値をいう。確率論のほかギャンブルでも盛んに使われてきた数値である。
オッズ比はある事象の、1つの群ともう1つの群とにおけるオッズの比として定義される。事象の両群における確率をp(第1群)、q(第2群)とすれば、オッズ比は

オッズ比が1とは、対象とする条件あるいは事象の起こりやすさが両群で同じということであり、1より大きい(小さい)とは、条件あるいは事象が第1群(第2群)でより起こりやすいということである。オッズ比は必ず0以上である。第1群(第2群)のオッズが0に近づけばオッズ比は0(∞)に近づく。
例えば、男女それぞれ100人に先週ビールを飲んだかどうか聞いてみる。男性は80人が、女性は20人が先週ビールを飲んだと答えるとしよう。男性がビールを飲んだオッズは80対20つまり4/1=4で、女性は20対80つまり1/4=0.25である。4 / 0.25 = 16で、オッズ比は16となる。

オッズ比は医学の臨床試験の結果を示す方法としてよく用いられ、ベイズ統計学でも特に重要である。
オッズ比の対数をとると確率のロジットの差に等しい。ロジットはロジスティック関数の逆関数であって、ロジスティック回帰分析でもオッズ比は重要な意味を持つ。
[PR]
by katoujun2549 | 2011-01-24 14:31 | 書評 | Comments(0)