読者です 読者をやめる 読者になる 読者になる

tak0kadaの何でもノート

発声練習、生存確認用。

医学関連は 医学ノート

「Think Stats」第2章を読んだ

統計 読書メモ thinkstats

単語をまとめた。2章はプロットが入ってくるので1章よりは手間が掛かりそう。

単語

英語 日本語 意味
mean 平均 \(\mu = \dfrac{1}{n} \displaystyle\sum_i x_i\)で定義する。
average 代表値 平均と違って任意に決める代表的な値(つまり散らばりが大きいと何の意味も持たない)。
central tendency 中心傾向 標本や母集団の特徴量の一つ。直感的な定義としては最も代表的な値。
spread 散らばり 標本や母集団の特徴量の一つ。直感的な定義としては、集団のばらつきを表す値。
variance 分散 \sigma^{2}\(= \dfrac{1}{n} \displaystyle\sum_i (x_i-\mu)^{2}\)で定義される。散らばりを定量的に評価するのに用いられる。
SD(standard deviation) 標準偏差 分散の2乗根\sigma。分散と違って標本と単位が同じなため扱いやすい。散らばりの評価によく用いられる。
frequency 頻度 値が標本に現れる回数。
histogram ヒストグラム 値から頻度への対応、あるいはこの対応を表すグラフ。
probability 確率 標本数で割った頻度。
normalization 正規化 頻度を標本数で割って確立を得る過程。
distribution 分布 標本に現れる値と頻度、確率の関係。
PMF(probability mass function) 確率質量関数 分布を値から確率への関数として表したもの。
mode 最頻値 標本中で最も頻度の多い値。
outlier 外れ値 中心傾向から離れた値。
trim トリミングする 外れ値をデータセットから取り除くこと。
bin ビン 近い値をまとめるために用いられる幅。
relative risk 相対危険度 2つの確率の比。分布の違いを測るために用いられる。
conditional probability 条件付き確率 ある条件が成立するという仮定のもとで求めた確率。
clinically significant 臨床的に意義のある グループ間の違いなど実用的な結果。