統計学が最強の学問である
データ社会を生き抜くための武器と教養
統計学が最強の学問である
データ社会を生き抜くための武器と教養
書籍情報
- 西内啓 著
- 定価:1760円(本体1600円+税10%)
- 発行年月:2013年01月
- 判型/造本:46並製
- 頁数:310
- ISBN:978-4-478-02221-4
内容紹介
統計学はどのような議論や理屈も関係なく、一定数のデータさえあれば最適な回答が出せる。そうした効能により旧来から自然科学で活用されてきたが、近年ではITの発達と結びつき、あらゆる学問、ビジネスへの影響力を強めている。こうした点から本書では統計学を「最強の学問」と位置付け、その魅力と可能性を伝えていく。
目次・著者紹介詳細を見る▼
目次
はじめに
第1章 なぜ統計学が最強の学問なのか?
01 統計リテラシーのない者がカモられる時代がやってきた
H・G・ウェルズの予言/あみだくじの必勝法/統計学を制する者が世界を制する
02 統計学は最善最速の正解を出す
統計学が最強の武器になるワケ/「疫学の父」ジョン・スノウの活躍/人類の寿命は疫学が伸ばした
03 すべての学問は統計学のもとに
「エビデンス」が医療を変えた/教育にも活かされるエビデンス/野球にも経済学にもおよぶ統計学の影響
04 ITと統計学の素晴らしき結婚
なぜ今、統計学が花開いたのか/フラミンガム研究の調査が2年に1回だったわけ/退屈だった「紙とペンの統計学」/「ビッグデータ」という言葉が流行るわけ/これからの10年で最もセクシーな職業
第2章 サンプリングが情報コストを激減させる
05 統計家が見たビッグデータ狂想曲
狂想曲を盛り上げる専門用語/データを活かすのにお金は要らない
06 部分が全体に勝る時
失業率25%!/ニューディール政策を支えた統計家たち/全数調査vsサンプリング調査/80年前と変わらないおっさんたち
07 1%の精度に数千万円をかけるべきか?
サンプリング調査への「よくある反論」/誤差を計算する方法/サンプルを1万増やしても標準誤差は0・3%しか変わらない/まずは、正しい判断に必要な最小十分のデータを
第3章 誤差と因果関係が統計学のキモである
08 ナイチンゲール的統計の限界
「ふ〜ん」としか言えないグラフ/データをビジネスに使うための「3つの問い」/「集計」だけでよかったのは19世紀まで
09 世間にあふれる因果関係を考えない統計解析
ツッコみどころが多すぎるグラフ/よくわからないまま使われる指標たち/死者・犯罪・暴動を生み出す食べ物とは?
10 「60億円儲かる裏ワザ」のレポート
買ってくれる人、買ってくれない人の違いは何か?/「あるある」は当てにならない/DMの送り方を変えるだけで売上が60億円アップする
11 p値5%以下を目指せ!
「誤差」を考えない試算は皮算用/「A/Bテスト」とはお馴染みの比較検討のこと/「0.1%」の差は出たけれど/「カイ二乗検定」と「p値」の登場
12 そもそも、どんなデータを解析すべきか?
裏ワザを見つける3つめのポイント/ビジネスにおける明確なゴール/それは利益につながっているのか?/CPU温度の解析がコスト削減につながった
13 「因果関係の向き」という大問題
因果関係には向きがある/ゲームと少年犯罪の因果関係は明らかにできるのか?/「フェア」じゃないからわからない/2つの解決法
第4章 「ランダム化」という最強の武器
14 ミルクが先か、紅茶が先か
「科学」の対象を拡大したランダム化比較実験/なぜ、ランダムでなくてはならないのか?/「1杯の完璧な紅茶の淹れ方」/オカルトとペテンの見破り方/研修やDMの効果測定にも
15 ランダム化比較実験が社会科学を可能にした
科学は「観察」と「実験」からなる/「誤差」あるものの科学/「誤差」への3つのアプローチ/『実験計画法』は農場で生まれた
16 「ミシンを2台買ったら1割引き」で売上は上がるのか?
「攻め」のための統計学/「誤り」と決めつけることの愚かさ/1億5000万ドルを稼いだクレーム対応/ランダムは意外とむずかしい
17 ランダム化の3つの限界
「現実」の壁/「倫理」の壁/「感情」の壁
第5章 ランダム化ができなかったらどうするか?
18 疫学の進歩が証明したタバコのリスク
タバコの箱を見てみよう/「ケースコントロール研究」の登場/天才フィッシャーからの反論/
世界中のデータによる再反論/「揃えきれていない条件」にどこまでこだわるべきか
19 「平凡への回帰」を分析する回帰分析
回帰分析とは何か/背の低い野村くんの恋愛/ダーウィンの従兄弟と優生学/
「平凡への回帰」の発見/「オリンピックの魔物」の正体
20 天才フィッシャーのもう1つの偉業
ゴルトンの回帰分析の限界/回帰係数自体にバラつきがある/統計学者も理解できなかった「真値」というアイディア/回帰分析を使うための基礎用語
21 統計学の理解が劇的に進む1枚の表
統計学の教科書は一般化線形モデルの扱いで2種類に分けられる/「1枚の表」の使い方/どの方法でも同じp値が得られるわけ/紛らわしい用語「一般線形モデル」
22 重回帰分析とロジスティック回帰
学者も多用する統計手法の主役/フェアな比較が崩れるシンプソンのパラドックス/層別解析でパラドックスは防げるが……/層分けを不要にする重回帰分析/オッズ比を用いるロジスティック回帰/回帰分析が読めれば「いいかげんな言説」が駆逐できる
23 統計学者が極めた因果の推論
回帰モデルを使う際は交互作用に注意する/ドツボにはまる変数選択作業/限りなくランダム化に近づく「傾向スコア」
第6章 統計家たちの仁義なき戦い
24 社会調査法vs疫学・生物統計学
統計学の6つの分野/正確さを追求する社会調査のプロたち/「妥当な判断」を求める疫学・生物統計家/終わりのない言い争い
25 「IQ」を生み出した心理統計学
「一般知能」の発明/知能を7つに分けた多因子知能説/心理統計家の考え方と手法/心理統計家は「質問紙」に命をかける/IQへの結論
26 マーケティングの現場で生まれたデータマイニング
意外なほど新しいデータマイニングの歴史/「おむつとビール」でバスケット分析/バスケット分析よりもカイ二乗検定を/人工知能の研究から生まれた高度な手法/なぜ、データマイニングの専門家は回帰モデルを「古臭い」と言うのか?/「予測」に役立つデータマイニング
27 言葉を分析するテキストマイニング
計量文献学が否定した「シェイクスピア=ベーコン説」/テキストマイニングの王道「形態素解析」とGoogleを支える「N-Gram」/ビジネスにおけるテキストマイニングの活用法/テキストマイニングを活かすコツはそれ以外の統計リテラシー
28 「演繹」の計量経済学と「帰納」の統計学
統計学と計量経済学の「表面的」な違い/統計学と計量経済学の「本質的」な違い/よりよいモデルを求める計量経済学者/影響力を強める計量経済学
29 ベイズ派と頻度論派の確率をめぐる対立
頻度論派はシンプルに考える/ベイズ派は「事前確率」と「事後確率」を考える/計量経済学と相性がいいベイズ統計/迷惑メールの判別に威力を発揮するベイズ統計
終章 巨人の肩に立つ方法
30 「最善の答え」を探せ
エビデンスのヒエラルキー/最高のエビデンス「系統的レビュー」と「メタアナリシス」/「最善の答え」は公開されている
31 エビデンスを探してみよう
日本語文献の探し方/英語文献の探し方/明らかになる課題
おわりに
参考文献
索引
著者
西内 啓(にしうち・ひろむ)
1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバード がん研究センター客員研究員を経て、現在はデータに基づいて社会にイノベーションを起こすためのさまざまなプロジェクトにおいて調査、分析、システム開発および戦略立案をコンサルティングする。著書に『コトラーが教えてくれたこと』(ぱる出版)、『サラリーマンの悩みのほとんどにはすでに学問的な「答え」が出ている』(マイナビ新書)、『世界一やさしくわかる医療統計』(秀和システム)など
電子書籍は下記のサイトでご購入いただけます。
(デジタル版では、プリント版と内容が一部異なる場合があります。また、著作権等の問題で一部ページが掲載されない場合があることを、あらかじめご了承ください。)
無料動画公開 八嶋智人が『統計学が最強の学問である』を講義
|
■TBSテレビ「ベストセラー講義」用 『統計学が最強の学問である』無料版
こちらからPDFファイルをダウンロードできます。
「ベストセラー講義」と連動したウェブ記事でも同じ内容を読むことができます。
■第5刷までの誤りについて
『統計学が最強の学問である』52頁に誤りがありましたので、下記のように訂正いたします。第6刷以降は修正が反映されております。誠に申し訳ございませんでした。
【52頁小見出し】
(誤) サンプルを1万増やしても標準誤差は0.3%しか変わらない
(正) サンプルを1万増やしても標準誤差は0.1%しか変わらない
【52頁本文】
(誤) サンプリングデータの数が100名分しかなければその標準誤差は9.5%
(正) サンプリングデータの数が100名分しかなければその標準誤差は4.6%
(誤) 「女性の割合が51%~89%と考えてほぼ間違いない」という
(正) 「女性の割合が61%~79%と考えてほぼ間違いない」という
(誤) 1000名いれば標準誤差は3%となり「女性の割合が64%~76%と考えてほぼ間違いない」
(正) 1000名いれば標準誤差は1.4%となり「女性の割合が67%~73%と考えてほぼ間違いない」
(誤) 8000名を超えて標準誤差が1%となると「女性の割合が68%~72%と考えてほぼ間違いない」
(正) 8000名を超えて標準誤差が0.5%となると「女性の割合が69%~71%と考えてほぼ間違いない」
(誤) (なお、1万名分使っても標準誤差は0.9%で、2万名分でも0.6%にしかならない)
(正) (なお、1万名分使っても標準誤差は0.4%で、2万名分でも0.3%にしかならない)