6 横断研究

6.1 キーワード

コホート研究 (cohort study) には、いくつかの種類があります。

まず、ある１時点での調査を行うことを横断研究 (cross-sectional study)、複数の時点で調査を行うことを縦断研究 (longitudinal study) と言います。

横断研究では、通常、ある疾患 (ここではフレイル) の有病率や、さまざまな属性との関連を調べます。この属性を、RCT での介入に対して、コホート研究では暴露 (exposure) と言うこともあります。

横断研究では、統計手法としては、ロジスティック回帰 (logistic regression) がよく用いられます。これは、単一のアウトカムに対して、複数の属性を共変量 (covariate) として解析し、関連 (association) があるかどうかを調査します。最終的には、共変量ごとにオッズ比が得られます。

6.1.1 リスク比とオッズ比

ロジスティック回帰を理解するためには、まずオッズ比とリスク比を理解する必要があります。

まず、以下のオッズ比とリスク比を計算してみましょう。

	疾患あり	疾患なし	合計
暴露あり	20人	80人	100人
暴露なし	10人	90人	100人
合計	30人	170人	200人

リスク比 = \(\dfrac{ \dfrac{20}{100} }{ \dfrac{10}{100} } = 2.00\)

リスク比は簡単に理解できます。「暴露ありのほうが、暴露なしよりも 2.00 倍の疾患リスクがある」と解釈することができます。

オッズ比 = \(\dfrac{ \dfrac{20}{80} }{ \dfrac{10}{90} } = 2.25\)

このように、オッズ比はリスク比に近いけれども、ちょっと大袈裟にでる傾向があります。¹

¹ オッズ比は、1 より大きい場合はリスク比よりも大きく、1 より小さい場合はリスク比より小さく出ます。

Tajeu, Gabriel S, Bisakha Sen, David B Allison, and Nir Menachemi. 2012. “Misuse of Odds Ratios in Obesity Literature: An Empirical Analysis of Published Studies.” Obesity 20 (8): 1726–31.

Holcomb Jr, William L, Tinnakorn Chaiworapongsa, Douglas A Luke, and Kevin D Burgdorf. 2001. “An Odd Measure of Risk: Use and Misuse of the Odds Ratio.” Obstetrics & Gynecology 98 (4): 685–88.

このため、オッズ比 2.25 は、「暴露ありのほうが、暴露なしよりも 2.25倍の疾患リスクがある」と解釈することはできません (Tajeu et al. 2012; Holcomb Jr et al. 2001)。

なお、全体の有病率が低くなるほどオッズ比はリスク比に近づき、10% 以下ではほぼリスク比に近似できます。

	疾患あり	疾患なし	合計
暴露あり	2人	98人	100人
暴露なし	1人	99人	100人
合計	3人	197人	200人

リスク比は 2.00 のままですが、オッズ比は 2.02 になります。

上の表では、要因が一つ (暴露) だけでした。これを、複数に拡張したものがロジスティック回帰になります。また、2 値変数だけではなく数値も使用することができます。

横断研究では多くの場合、以下の調査を行います。

有病率を求める
リスク因子のオッズ比を求める

これで全てではありません。例えば、Chapter 2 でみた Fried LP (2001) もコホート研究の一種です。

コホート研究の論文のガイドラインは、STROBE 宣言です。

6.2 有病率と関連要因の調査

ここでは多くの場合、以下の調査を行う横断研究について解説します。

有病率を求める
リスク因子のオッズ比を求める

リスク因子のオッズ比を調査するためには、多変数ロジスティック回帰を行います。

説明変数が複数あるときに多変数 (multivariable)、アウトカム変数が複数あるときに多変量 (multivariate) とする (Hidalgo and Goodman 2013)

Hidalgo, Bertha, and Melody Goodman. 2013. “Multivariate or Multivariable Regression?” American Journal of Public Health 103 (1): 39–40.

説明変数は、仮説や先行研究から決定することが多いようです。

6.3 ロジスティック回帰

ロジスティック回帰 (logistic regression) は、目的変数が 2値データ のときに用いられる代表的な統計手法です。

たとえば、次のような結果を予測する場合に使用されます。

疾患あり = 1
疾患なし = 0

このように、結果が「はい / いいえ」「ある / ない」のように 2 つの値をとる場合に適しています。

6.3.1 なぜ線形回帰ではなくロジスティック回帰か

通常の線形回帰では、予測値が 0 未満や 1 を超える可能性があります。

しかし、確率は

\[ 0 \le p \le 1 \]

の範囲でなければなりません。

そこでロジスティック回帰では、確率そのものではなく オッズの対数（log odds） をモデル化します。

6.3.2 モデル式

ロジスティック回帰の基本式は次の通りです。

\[ \log\left(\frac{p}{1-p}\right)=\beta_0 + \beta_1X_1 + \beta_2X_2 + \cdots \]

ここで、

(p)：イベントが起こる確率
()：オッズ
(_0)：切片
(_1)：回帰係数（ベータ）
(X_1)：説明変数

を表します。

6.3.3 ベータ係数とオッズ比の関係

ロジスティック回帰を使った論文では、回帰係数 (\(\beta\)) が提示されることもあれば、オッズ比 (OR) が提示されることもあります。回帰係数 (\(\beta\)) を指数変換するとオッズ比になる関係にあります。

\[ \text{OR}=e^{\beta} \]

\[ \beta=0.693 \]

であれば、

\[ e^{0.693}=2.0 \]

となります。

つまり、説明変数 (X_1) が 1 単位増加すると、オッズは 2 倍 になることを意味します。

6.3.4 解釈の例

年齢の係数が

\[ \beta=0.05 \]

だったとします。

このときオッズ比は

\[ e^{0.05}=1.051 \]

です。

これは、年齢が 1 歳増えるごとに、目的変数が 1 になるオッズが 約 1.05 倍（5.1%増加） することを意味します。

6.3.5 論文の例

Liu W, Puts M, Jian F et al. (2020) Physical frailty and its associated factors among elderly nursing home residents in China. BMC Geriatrics, 20(1), 1-9.