確率・統計について
確率と統計は、ひとことで言えば「はっきりしない出来事を、どうにか数字で掴もう」とする分野だ。コイン投げの結果みたいな身近な話から、機械学習の理屈まで、気づけば裏側で顔を出してくる。このページでは、場合の数 → 確率の基礎 → 確率変数と分布 → 確率過程という確率側の流れと、記述統計 → 多変量解析 → 時系列 → 推測統計という統計側の流れを、ひとつの地図として眺められるようにまとめてみた。
確率
ここでは確率まわりの基本的な道具を、ざっくり順番に並べていく。まずは「何通りあるか」を数える話から始めて、事象や条件付き確率といった土台、そこから確率変数といろいろな分布へ、最後は時間とともに動いていく確率過程まで、という流れになっている。
場合の数
「何通りあるのか」を数える、という地味だけど欠かせない作業の話。順列や組合せは確率の計算をしているとしょっちゅう出てくるので、ここで定義や使い分けをさらっと押さえておくと、あとがだいぶ楽になる。
確率の基礎
確率の話を始めるときに、まず手元に置いておきたい概念たちをまとめてある。事象や条件付き確率、ベイズの定理あたりは、このあとの章でも何度も顔を出す常連なので、ここでゆっくり馴染んでおくと先がスムーズになる。
- 事象
- 条件付き確率について
- ベイズの定理
- オッズ
- ロジット関数
確率変数と分布
ここからは、「出来事に数字を割り当てる」確率変数と、その動き方を表す分布の話に入っていく。離散型と連続型で扱いがどう変わるのか、よく出てくる分布にはどんなクセがあるのか、例を挟みながらのんびり眺めていけるとちょうどいい。
- 連続型と離散型の確率変数について
- 分布関数について
- モーメント母関数
- 特性関数
- 離散型確率分布
- 連続型確率分布
- 指数分布とポアソン分布の違いについて
- チェビシェフの不等式の証明
- クーポン・コレクター問題
- 大数の法則
- 中心極限定理
確率過程
時間が流れるにつれて、ゆらゆらと変わっていく確率的な現象を扱うのがこの節。窓口の待ち行列や機械の故障みたいな身近な場面を思い浮かべつつ、ポアソン過程やマルコフ連鎖といった定番のモデルに、少しずつ慣れていければそれで十分だ。
統計
データをうまく要約したり絵にしたりする記述統計から、いくつもの変数を一度に相手にする多変量解析、時間順に並んだデータを追いかける時系列、そして標本の向こう側にある母集団を推し量る推測統計まで、ひととおりまとめてある。
記述統計とデータの分析
手元のデータそのものを、まずはじっくり眺めてみるための道具をここに置いている。平均や分散みたいな一次元のものさしから、おなじみの可視化、指数や回帰の入り口まで、「どんなときに使うんだろう」と想像しながらのんびり見ていけると楽しい。
多変量解析
変数をいっぺんに相手にし始めると、一つずつ眺めていたときには気づかなかったつながりが、とたんに気になってくる。そんな関係性を整理するための相棒が、相関や共分散を行列でまとめて見る発想で、ここではそのあたりに触れていく。
時系列
時間順に並んだデータは、バラバラに拾ってきたサンプルの寄せ集めとはちょっと別物として扱う必要がある。過去と今のつながりをうまく捉えるために、自己相関や AR モデルといった時系列ならではの視点にも触れておきたい。
推測統計
手元にある標本を手がかりに、その後ろに広がっている母集団の姿を推し量っていく、そんな考え方を整理する節。点推定 → 区間推定 → 検定という流れを、関連する分布とセットで追いかけていくと、全体像がふっと見えやすくなる。
発展的な話題
確率をきっちり扱うための測度論的な土台や、分布どうしの「近さ」を測るアイデアなど、もう一段奥にある考え方をここにまとめておく。