統計
読み: とうけい
トウケイ:データを集めて要約し、母集団の傾向を推測・判断する学問
概要
統計は、データから「全体として何が言えそうか」を整理し、根拠をもって判断するための方法です。感覚や印象ではなく、数や不確実さも含めて説明できるのが強みです。統計が扱う2つの仕事
記述統計
集めたデータを「見やすく要約」します。推測統計
一部のデータから全体を「推測」します。- 母集団(ボシュウダン:調べたい対象全体)を、標本(ヒョウホン:そこから取り出した一部)から推定
- 不確実さを「信頼区間(シンライクカン:推定値が入る範囲の目安)」で示す
- 仮説検定(カセツケンテイ:差や効果が偶然かを検証する枠組み)
よく出る基本用語
変数と尺度
- 変数(ヘンスウ:人や物ごとに値が変わる項目)
- 尺度:数値の意味の違い
分布とばらつき
- 分布:値がどのあたりに多いかの形
- 平均だけでなく、ばらつきや外れ値も一緒に見るのが基本です。
相関と因果の注意
- 相関(ソウカン:一緒に増減しやすい関係)があっても、因果(インガ:原因と結果)とは限りません。
データの集め方が結論を左右する
- サンプリング(サンプリング:全体から一部を選ぶこと)が偏ると、結果も偏ります。
- よくある偏り
よく使う指標・手法(ざっくり)
- 回帰(カイキ:複数要因と結果の関係を式で表す)
- p値(ピーち:観測された差が偶然でも起きる度合いの指標の一つ)
- 効果量(コウカリョウ:差の大きさを尺度として表す)