基礎講座 糖尿病と実践臨床統計学
4 欠測データの取り扱い
Diabetes Frontier Vol.25 No.4, 483-489, 2014
[はじめに] ほとんどすべての医学研究において, 予定していたすべてのデータを測定できることは稀であり, データ解析の際には欠測データ(missing data)の問題に少なからず直面する. 特に, 経時的に対象者を観察する経時観察研究(longitudinal studies)においては, ある時点までのすべての結果変数は観察されるが, それ以降のすべてのデータが欠測値となる脱落(drop-out)と呼ばれる欠測データが生じやすい. 欠測データが存在する場合の統計解析上の問題点は, サンプル数の減少に伴う推定精度の減少と, 対象者の状態あるいは特性に応じた選択的な欠測に伴うバイアスの問題である. 前者に関しては, 単純に, 欠測データが存在すると解析に貢献する対象者数(あるいは, 時点数)が減るので, 検出力の低下, あるいは信頼区間幅が広くなるという問題である.
※記事の内容は雑誌掲載時のものです。