単語をまとめた。2章はプロットが入ってくるので1章よりは手間が掛かりそう。
単語
英語 | 日本語 | 意味 |
---|---|---|
mean | 平均 | \(\mu = \dfrac{1}{n} \displaystyle\sum_i x_i\)で定義する。 |
average | 代表値 | 平均と違って任意に決める代表的な値(つまり散らばりが大きいと何の意味も持たない)。 |
central tendency | 中心傾向 | 標本や母集団の特徴量の一つ。直感的な定義としては最も代表的な値。 |
spread | 散らばり | 標本や母集団の特徴量の一つ。直感的な定義としては、集団のばらつきを表す値。 |
variance | 分散 | \(= \dfrac{1}{n} \displaystyle\sum_i (x_i-\mu)^{2}\)で定義される。散らばりを定量的に評価するのに用いられる。 |
SD(standard deviation) | 標準偏差 | 分散の2乗根。分散と違って標本と単位が同じなため扱いやすい。散らばりの評価によく用いられる。 |
frequency | 頻度 | 値が標本に現れる回数。 |
histogram | ヒストグラム | 値から頻度への対応、あるいはこの対応を表すグラフ。 |
probability | 確率 | 標本数で割った頻度。 |
normalization | 正規化 | 頻度を標本数で割って確立を得る過程。 |
distribution | 分布 | 標本に現れる値と頻度、確率の関係。 |
PMF(probability mass function) | 確率質量関数 | 分布を値から確率への関数として表したもの。 |
mode | 最頻値 | 標本中で最も頻度の多い値。 |
outlier | 外れ値 | 中心傾向から離れた値。 |
trim | トリミングする | 外れ値をデータセットから取り除くこと。 |
bin | ビン | 近い値をまとめるために用いられる幅。 |
relative risk | 相対危険度 | 2つの確率の比。分布の違いを測るために用いられる。 |
conditional probability | 条件付き確率 | ある条件が成立するという仮定のもとで求めた確率。 |
clinically significant | 臨床的に意義のある | グループ間の違いなど実用的な結果。 |