読者です 読者をやめる 読者になる 読者になる

tak0kadaの何でもノート

発声練習、生存確認用。

医学関連は 医学ノート

「ロスマンの疫学」第1~3章を読んだ

ロスマンの疫学 統計 読書メモ

一人で勉強するのは辛いものだが、後輩が疫学に興味を持っているということなので、ロスマンの疫学の勉強会をすることにした。章末問題があるが、問題と解答が英語だが公開されているので毎回確認していく(が、以下の答えは自分勝手に書いたものなので気になる場合はリンク先へ)。

統計遺伝学の教室でシミュレーションしつつこの本を読んだ過程を記したブログも参考にしながら勉強したい。

第1章: 疫学的思考の紹介

  • 疫学: 疾病頻度の分布と決定要因を調べる学問。公衆衛生の基礎。
  • 交絡: 原因と結果の関係で注目している原因以外に関係する外部の要因が存在すること。例えば「AでBを説明しようと思った時にA以外の要素Cがあってそれが結果に影響していること」
  • 粗データ: データ全体を合計したもの
    (S氏の指摘に従い訂正)wiktionaryによると(statistics) Being in an unanalyzed form.とのこと。
  • 層化: 集団を何らかの基準で分類すること
  • 死亡リスク: ある集団、ある期間での死亡者数/(死亡者数+生存者数)
  • 選択バイアス: 母集団から標本を選んでくるときに無作為に選べていなく偏りがあること

問題解答

  1. 実際に関係があるのは流た年月なので「年齢」自体は原因とは言えなく、免疫状態など他の要因で交絡されているが、層化のための指標としては有効である。ただし一概に年齢が高い方がリスクが高い(あるいは低い)とは言えない。例えば乳幼児の死亡率が高い国と低い国では年齢ごとのリスクは異なる。
  2. 年齢など社会構成や生活環境が違う、と考えていたが解答によるとそもそも問いは「死亡数の違い」であって「死亡率」ではない。人口が違うのが最大の原因。
  3. (ある世代を除いて計算した死亡率)-(全体の死亡率)の絶対値が最大になる世代にしようということに。解答では世代ごとのリスク比や差を利用していた。

  4. 20150905213119
    年齢が高いほどリスクが高い(当たり前)
  5. 選択バイアス: 売れる前に死んだ演奏家は含まれない
  6. 年齢(時代)ごとに違う利き手の割合を示す場合、例えば以前より現在のほうが利き手の矯正をしない人が増えている。
  7. 集団に年齢構成の違いがある。年齢調整死亡率みたいなものを使うか、層化して年齢層ごとに比べる。

第2章: 疫学と公衆衛生の先駆者たち

この章は歴史的に重要な働きをした人を紹介している。

  • 公衆衛生: 系統だった手段で人々の健康を向上させる地域の努力。水道水の供給や感染症の制御が代表的。
  • ヒポクラテス: 医学の祖。迷信や呪術から、環境要因などで理解する用に変化させた。
  • アヴィセンナ: 実験と数量化、接触伝染
  • フラカストロ: 接触感染の概念を広めた。自己増殖する粒子、セミナリア
  • ジョン・グラント: 世界初の疫学、人口統計学者。死亡統計表を利用し、データに基づいて説明した。誤分類についても言及。
  • ベルナルディーノ・ラマツィーニ: 産業医学、職業病
  • ウィリアム・ファー: 保険数理表、人口動態統計
  • ジョン・スノウ: コレラ、麻酔ガス。コレラに関する自然実験で疫学研究デザインの先駆者になった。
  • センメルヴェイス・イグナーツ: 産褥熱、消毒
  • フローレンス・ナイチンゲール: 図表の利用。

[JavaScript] Chart.js を使って鶏頭図を描画する | unlinked logより

ただこのグラフは面積で割合を表して紛らわしいので棒グラフのほうが良い気がする。。

  • ジャネット・レーンクレイボン: 後ろ向きコホート、系統誤差、偶然誤差、想起バイアス、交絡
  • ウェイド・ハンプトン・フロスト: 黄熱病、リードフロストの感染症モデル

問題解答

  1. 国家の形ができたりとか統計を取ることが用意になる原因でもあったのかな?解答では「読者の解答を望む」としか書いていない。
  2. 常識にとらわれてデータを正しく見ることができなかったのでは?同上。
  3. 長所: 不要な研究がなされず費用の無駄が発生しにくい。倫理面に配慮していない研究を排除できる。
    短所: 時間がかかる。常識に反した結論が出るような研究は採用されにくい。

第3章: 因果関係とは何か?

  • 因果関係: ある事実と別のある事実との間に発生する、原因と結果の関係のこと。認識するためには観察するしかないので間違った認識をすることもあり得る。
  • 因果のパイモデル: 「パイ」はある疾患を起こすのに「十分原因」を表し、このパイは複数個存在しうる。それぞれのパイは更に「構成要素」に分割できるというモデル。パイを利用したのはそれぞれの構成要素に順番がついていないことを強調するためと思われる。(この本は疫学の本なのもあるのか、生物学的な因果関係には言及していなく、要素間の順位付けには慎重な立場をとっているように見える)
  • 構成要素は遺伝性と環境性に分けることができる。
  • ~が~の原因である、という時は結果への貢献度合いにかかわらずほんの少しでも貢献すればこの言い方ができる。
  • 原因の強さ: 集団に対して症例に関与している割合を分割表から計算したもの(因果関係の強さではない)
  • 原因の交互作用: 2つ以上の構成要素が疾患で見られること(関連や共同作用があるという意味ではない)
  • 寄与分画: 第4章へ。合計は100%を超えうる。
  • 誘導時間:原因構成要素が作用してから疾患が生じるまでの時間。
  • 潜伏期: 疾患が生じてから発見されるまでの時間。
  • 誘導時間を引き延ばすものは予防、縮めるものは促進しているといっていい。時間短縮するものは疾患の原因と言っていい。
  • 科学的推論過程: 演繹法帰納法反証主義など。
  • 反証主義: 反証可能性のある仮説の中で、反証されずに残っているものを信頼するという考え方。絶対に正しい真実はないと考え、否定的な観察結果を重視しする。
  • 一般化: 科学理論の精密化、つまり因果の推論作業。(数学や(数理)統計の分野の作業ではない)

因果関係の判定基準

基準 説明 問題が生じる場合、理由
Strength(強固性) 強い関連性 交絡がある場合
Consistency(一致性) 別の条件での再現性 矛盾した統計がある場合
Specificity(特異性) 原因と結果の一対一対応 1つの原因が複数の原因に対応している場合
Temporality(時間性) 原因のほうが先に起こる 正しいが証明するのは難しい
Biologic Gradient(生物学的用量関係) 相関関係の強さ 閾値現象
Plausibility(説得性) 他の理論との矛盾がない 主観的
Coherence(整合性) 上と同じ -
Experimental Evidence(実験的根拠) 実験結果 実験結果がない場合
Analogy(類似性) 既存の観察との類似 主観的(テキストでは類似と言ってもいろいろ、とある)

厚生労働省のページに参考資料がある。この判定基準は因果関係を正しく判定するものではない。推論、反証と併用するべき。

問題解答

  1. 結核菌は原因構成要素の1つで他にも構成要素はある(日本語だと紛らわしい問題)。
  2. 二人の農夫に会ってもらう、ということにしたが、テキストでは少なくとも2つの構成要素が必要不可欠なため、とある。
  3. ひとつ目の記事は他要因という点で正しいが遺伝性でも環境性でもある。ふたつ目の記事は全ての大腸癌は遺伝的要因があるので間違い。
  4. よい。
  5. 他の事象が構成要素なのか交絡要因なのか区別がつきにくいため。
  6. 200%、100%(定義参照)。
  7. 帰納法を盲信していると理論を支持する結果ばかり収集してしまうが、反証主義に則り推論と反証のプロセスを回すことでより科学の進歩が早くなる、とのこと。
  8. テキスト中の例、あるいは解答ではBCGとビタミンA、乳幼児死亡率の例がある。
  9. 閾値のある疾患だと原因要素の曝露が十分でない、あるいは多すぎる場合に変化が見られない。あるいは欠乏症、過剰症の両方がある場合がある。
  10. テキストでは(2)が正しい、とされているが、個人的には誤差が少なければどのような比率で調査しようが構わないと思う。