6 横断研究
6.1 キーワード
コホート研究 (cohort study) には、いくつかの種類があります。
まず、ある1時点での調査を行うことを横断研究 (cross-sectional study)、複数の時点で調査を行うことを縦断研究 (longitudinal study) と言います。
横断研究では、通常、ある疾患 (ここではフレイル) の有病率や、さまざまな属性との関連を調べます。この属性を、RCT での介入に対して、コホート研究では暴露 (exposure) と言うこともあります。
横断研究では、統計手法としては、ロジスティック回帰 (logistic regression) がよく用いられます。これは、単一のアウトカムに対して、複数の属性を共変量 (covariate) として解析し、関連 (association) があるかどうかを調査します。最終的には、共変量ごとにオッズ比が得られます。
6.1.1 リスク比とオッズ比
ロジスティック回帰を理解するためには、まずオッズ比とリスク比を理解する必要があります。
まず、以下のオッズ比とリスク比を計算してみましょう。
| 疾患あり | 疾患なし | 合計 | |
|---|---|---|---|
| 暴露あり | 20人 | 80人 | 100人 |
| 暴露なし | 10人 | 90人 | 100人 |
| 合計 | 30人 | 170人 | 200人 |
リスク比 = \(\dfrac{ \dfrac{20}{100} }{ \dfrac{10}{100} } = 2.00\)
リスク比は簡単に理解できます。「暴露ありのほうが、暴露なしよりも 2.00 倍の疾患リスクがある」と解釈することができます。
オッズ比 = \(\dfrac{ \dfrac{20}{80} }{ \dfrac{10}{90} } = 2.25\)
このように、オッズ比はリスク比に近いけれども、ちょっと大袈裟にでる傾向があります。1
1 オッズ比は、1 より大きい場合はリスク比よりも大きく、1 より小さい場合はリスク比より小さく出ます。
このため、オッズ比 2.25 は、「暴露ありのほうが、暴露なしよりも 2.25倍の疾患リスクがある」と解釈することはできません (Tajeu et al. 2012; Holcomb Jr et al. 2001)。
なお、全体の有病率が低くなるほどオッズ比はリスク比に近づき、10% 以下ではほぼリスク比に近似できます。
| 疾患あり | 疾患なし | 合計 | |
|---|---|---|---|
| 暴露あり | 2人 | 98人 | 100人 |
| 暴露なし | 1人 | 99人 | 100人 |
| 合計 | 3人 | 197人 | 200人 |
リスク比は 2.00 のままですが、オッズ比は 2.02 になります。
上の表では、要因が一つ (暴露) だけでした。これを、複数に拡張したものがロジスティック回帰になります。また、2 値変数だけではなく数値も使用することができます。
横断研究では多くの場合、以下の調査を行います。
- 有病率を求める
- リスク因子のオッズ比を求める
これで全てではありません。例えば、Chapter 2 でみた Fried LP (2001) もコホート研究の一種です。
コホート研究の論文のガイドラインは、STROBE 宣言です。
6.2 有病率と関連要因の調査
ここでは多くの場合、以下の調査を行う横断研究について解説します。
- 有病率を求める
- リスク因子のオッズ比を求める
リスク因子のオッズ比を調査するためには、多変数ロジスティック回帰を行います。
説明変数が複数あるときに多変数 (multivariable)、アウトカム変数が複数あるときに多変量 (multivariate) とする (Hidalgo and Goodman 2013)
説明変数は、仮説や先行研究から決定することが多いようです。
6.3 ロジスティック回帰
ロジスティック回帰 (logistic regression) は、目的変数が 2値データ のときに用いられる代表的な統計手法です。
たとえば、次のような結果を予測する場合に使用されます。
- 疾患あり = 1
- 疾患なし = 0
このように、結果が「はい / いいえ」「ある / ない」のように 2 つの値をとる場合に適しています。
6.3.1 なぜ線形回帰ではなくロジスティック回帰か
通常の線形回帰では、予測値が 0 未満や 1 を超える可能性があります。
しかし、確率は
\[ 0 \le p \le 1 \]
の範囲でなければなりません。
そこでロジスティック回帰では、確率そのものではなく オッズの対数(log odds) をモデル化します。
6.3.2 モデル式
ロジスティック回帰の基本式は次の通りです。
\[ \log\left(\frac{p}{1-p}\right)=\beta_0 + \beta_1X_1 + \beta_2X_2 + \cdots \]
ここで、
- (p):イベントが起こる確率
- ():オッズ
- (_0):切片
- (_1):回帰係数(ベータ)
- (X_1):説明変数
を表します。
6.3.3 ベータ係数とオッズ比の関係
ロジスティック回帰を使った論文では、回帰係数 (\(\beta\)) が提示されることもあれば、オッズ比 (OR) が提示されることもあります。 回帰係数 (\(\beta\)) を指数変換するとオッズ比になる関係にあります。
\[ \text{OR}=e^{\beta} \]
\[ \beta=0.693 \]
であれば、
\[ e^{0.693}=2.0 \]
となります。
つまり、説明変数 (X_1) が 1 単位増加すると、オッズは 2 倍 になることを意味します。
6.3.4 解釈の例
年齢の係数が
\[ \beta=0.05 \]
だったとします。
このときオッズ比は
\[ e^{0.05}=1.051 \]
です。
これは、年齢が 1 歳増えるごとに、目的変数が 1 になるオッズが 約 1.05 倍(5.1%増加) することを意味します。
6.3.5 論文の例
- Liu W, Puts M, Jian F et al. (2020) Physical frailty and its associated factors among elderly nursing home residents in China. BMC Geriatrics, 20(1), 1-9.