去年のメモがなぜか(後半のcontinuous methodについて調べものをしてからupしようみたいな意図で放置されていたのだろうが...)発掘されたので公開。
κメソッドやDNA-VIEWで有名なCharles Brennerのセミナーが法医学教室の主催で開かれたので参加してきた。専門家にこっそり混じって聞いていた関係で難しく、途中から眠くなってしまった。レベルにバラつきのある聴衆全員に分かりやすい発表をするのは難しい。
イントロ: ゆるい話
- 統計(あるいは数学)は現実のモデルである。
- 現実そのものではないので、定義が重要。正しいモデルは存在しない。
- 統計手法はレシピみたいに使うのではなく、そのモデルの仮定を理解すること。
- 問題の定義→モデルの定義→検証
- モデルは単純、抽象的、必要最低限のものから
本題: 混合試料分析の話
(ちょっと図の作りがまずいのにうpしてから気付いた)
今までのDNA鑑定のためのモデルであるExclusionモデルはアリルのピークの大きさを無視してきたが、測定精度の上昇に伴ってアリルのピークの大きさの違いが分かるようになっている。この情報を捨ててしまわずに利用するのがContinuousモデル。
Exclusion Method
上のように二つのアリルが観測され、それぞれの存在確率を$p$、$q$とする。被疑者を含まない一般の人が観測されたアリルを含む確率を$(p+q)^{2}$とし、$1-(p+q)^{2}$の確率で無関係と計算するモデル。このモデルの計算式から仮定を逆算すると
- アリルの型が合えば、観測に矛盾しない(含まれる)、合わなければ(含まれない)
- ピークの高さは一定
- アリルのドロップアウト・ドロップインは起こらない
- アリルの組み合わせなどは無視
などが分かる。
尤度比は
となる。
New Exclusion Method
アリルのピークの高さを「閾値以上」、「中間」、「低い」の3段階に分ける。(上のモデルではあり/なしの2段階)
Continuous Method
アリルのピークの高さを連続として考える。DNA-VIEWのデモを見た。いろいろと入力をした後、仮説についてのMAP推定値らしきものがたくさん出てくる。信頼区間は表示しない感じのソフトウェアだった。