友人が論文で使われている統計の意味が分からんと言っていたので首を突っ込んだ。論文はこちら。
雑なまとめ
- 目的
先天性の心房中隔欠損(ASD)の患者でカテーテルによる閉鎖と外科手術とで効果と長期的な安全性を比較する。 - 結果
718人の先天性ASD患者で調べたところ、カテーテルの方が再侵襲の割合が有意に高いがそれは最初の1年でのものが大半であった。長期死亡率は低いとは言えなかった。secondary outcomeは同じだった。
以下どんな統計手法を使っているか考えてみる。
論文中の統計の手法について
その1
こんな感じの表がある。
外科手術(n=383) | カテーテル手術(n=335) | p値 | |
---|---|---|---|
年齢 | 43(32-54) | 49(39-61) | <0.001 |
女性 | 273(71.3) | 233(69.6) | 0.613 |
合併症 | |||
冠動脈疾患 | 15(4.0) | 4(1.3) | 0.058 |
... | ... | ... | ... |
年齢は数量データだがその他はカテゴリーデータである。年齢はWelchのt検定、他は$\chi^{2}$検定をするのが普通。t検定はブートストラップ法だが5月16日に、$\chi^{2}$検定は5月17日に触ってみたことはある。
冠動脈疾患について$\chi^{2}$検定とfisherの正確検定をやってみる(年齢についてはデータがないので分からない。)
chisq.test(matrix(c(383-15,335-4,15,4), nrow=2, byrow=T)) fisher.test(matrix(c(383-15,335-4,15,4), nrow=2, byrow=T))
0.04192、0.03352になり一致しない。どんな検定を使ったのかわからず辛い。
ひとつ気になるのはそれぞれが独立だとしても、10項目検討すると有意水準0.05でも60%くらいの確率でしかすべて独立にはならないということ。全て並べる意味はあるのだろうか。