観察研究でよく使われるロジスティック回帰分析を論文で表す時、どう英語で書くか、実例をチェック。
今回は2020年4月に“(dementia[Title]) AND logistic regression[Title/Abstract]”でPubMed検索して出てきた論文の中から、気になったタイトルの論文2本の記載方法を見てみました。
文献1:Barthold et al, PLoS One 2020
まずはスタチンと降圧薬の併用と認知症発症リスクの関係を調べた論文、”Barthold et al. Association of combination statin and antihypertensive therapy with reduced Alzheimer’s disease and related dementia risk. PLoS One 2020″から。
この論文を取り上げたのは、オープンアクセスなので誰でも本文を見れること、観察研究で病気のリスクファクターを調べるのにロジスティック回帰分析を用いて考えられる交絡の影響を調整するという王道なことをやっていることの2つが理由です。
論文の概要
アメリカのMedicareの記録を用いたretrospective cohort studyで、対象はベースラインでスタチンと降圧薬の両方を処方されていて、Alzheimer’s disease and related dementias (ADRD: という略しかたは初めてみました)と診断されておらず、抗認知症薬を処方されていないMedicare受益者694672人です。year t-2 and t-1でのスタチンおよび降圧薬の使用と、year tでのADRD診断の有無の関係を調べるのですが、その中でスタチン+非RAA系の降圧薬の組み合わせと、スタチン+RAA系降圧薬の組み合わせとで、ADRD発症リスクが違うかを見ようとしています。
当然、年齢や糖尿病などのその他の認知症リスクファクター、脂質異常症や高血圧を患っている期間などが交絡として考えられるので、それらを調整するため、ロジスティック回帰が行われています。
方法でのロジスティック回帰の記載
まずは方法でロジスティック回帰について触れている部分を提示します。一部、略語の説明の追加や、だらだら長い共変量の記載を省略しています。
We examined the association of combination antihypertensives(AHTs) and statin use (in year t-1 and t-2) and incident ADRD (year t). We used multivariable logistic regression to control for the potentially confounding roles of age, sex, …, and stroke.
説明はこのような構成です。
- year t-1 and t-2での降圧薬およびスタチンの使用と、year tでの認知症発症との関係を調べた。
- 多変量ロジスティック回帰を用い、年齢や・・・、脳卒中などの潜在的な交絡因子を調整した。
つまり、①何と何の関係を調べるか、②交絡になりうるものとしてどのようなものを考え、ロジスティック回帰で調整した、ということを明示しています。
結果でのロジスティック回帰の記載
次に、結果の記載の仕方です。
Fig 1 reports odd ratios (ORs) and 95% confidence intervals from logistic regressions ofADRD incidence that adjust for the patient and setting characteristics described above. Compared to individuals using statins combined with non-RAS AHTs, use of pravastatin and rosuvastatin in combination of ARB or ACEI was associated with reduced risk of ADRD (ACEI+pravastatin OR = 0.942 (CI: 0.899–0.986, p = 0.011), ACEI+rosuvastatin OR = 0.841 (CI: 0.794–0.892, p<0.001), …).
説明はこのような構成です。
-
Fig1で前述の因子を調整した、認知症発症に関するロジスティック回帰からのオッズ比とその95%信頼区間を示した。
-
非RAS系の降圧薬とスタチンを併用した対象と比較し、プラバスタチンやロスバスタチンとARBやACEIの併用は、認知症リスクの減少と関係した(ACEI+プラバスタチンのOR = 0.942 (CI: 0.899-0.986, p = 0.011), ACEI+リスバスタチンのOR = 0.841 (CI: 0.794-0.892, p < 0.001), …)。
ロジスティック回帰の結果を表現する際は、オッズ比と95%信頼区間、p値を記すのが重要です。良く言う、p値が小さいだけでなく、効果量をみろ、というやつですね。メインアウトカムなので、当然Figureやtableで表すことも大切です。この論文ではオッズ比に95%信頼区間のバーをつけ、1を含むかどうかを表す図を提示しています。
この研究のデザインについて
後ろ向きにデータベースからデータを集めているものの、ベースライン(year t-1 and t-2)でどの組み合わせでスタチンと降圧薬を用いているか、という違いから、縦断的に観察した後(year t)の認知症発症の有無を追跡しているため、コホート研究になります。コホート研究=前向き研究、というイメージがありますが、それは間違いで、この研究のように後ろ向きにデータを集めたコホート研究、retrospective cohort studyというものが成り立ちます。本論文のMethodsのStudy designの項の冒頭にもそのように記載されています。
694672人の対象に置いて、2%強(14000人程度)の患者が認知症を発症しています。ロジスティック回帰では、従属変数の各値をとる構成人数のうち、少ない方の人数の10分の1まで説明変数を入れることができます。なので、14000÷10 = 1400個の説明変数を入れることができます。
それに対し、本論文のロジスティック回帰では、年齢など13の交絡の可能性がある因子を共変量として調整しています。なので、今回の「スタチンと降圧薬の組み合わせ」という変数と、13の共変量、合わせて14の説明変数に対し、ロジスティック回帰分析をするのに十分(過ぎる)症例数になっています。
文献2: Lin et al. Medicine (Baltimore) 2020
次は、統合失調症や認知症患者が急性虫垂炎で入院すると、穿孔性虫垂炎であるリスクが高い、ということを報告した、”Lin et al.Increased risk of perforated appendicitis in patients with schizophrenia and dementia A population-based case-control study. Medicine (Baltimore) 2020″です。
この論文を選んだのは、精神疾患や中枢神経系の疾患の論文を探していたところに、穿孔性虫垂炎という意外な組み合わせの単語が目に入ったので、興味深くなって読んだ、というだけの理由です。
論文の概要
台湾のNHI受給者の中でランダムにピックアップされた100万人の縦断的なデータベース・LHIDから、18際以上で急性虫垂炎により入院した患者をピックアップし、穿孔性虫垂炎に至っていた患者と、穿孔していなかった急性虫垂炎の患者を、年齢性別を傾向スコアを用いて1:1にマッチングさせた2群を比較しています。
もともと精神疾患や認知症を含む中枢神経系疾患と診断されていたか、鎮痛剤の処方を受けていたか、などの情報が集められ、精神疾患や中枢神経疾患の有無が穿孔性虫垂炎のリスクと関係するかを、ロジスティック回帰で交絡になりうる因子を調整して調べています。
方法でのロジスティック回帰の記載
では、方法のロジスティック回帰分析に関する記載です。
The logistic regression model was used to calculate the adjusted odds ratio (OR) with 95% confidence interval (CI) for risks of perforated appendicitis associated with mental or CNS disorders. The multivariate logistic regression model was performed with adjustments for all potential confounding factors as listed in Table 1.
説明はこんな感じ。
- 穿孔性虫垂炎のリスクと精神疾患や中枢神経系疾患の関係を評価するため、ロジスティック回帰モデルを用いて調整オッズ比とその95%信頼区間を計算した。
- Table 1に示した全ての潜在的交絡因子を調整するために、多変量ロジスティック回帰を行なった。
やはり文献1と同じように、①何と何の関係を調べるか、②交絡になりうるものとしてどのようなものを考え、ロジスティック回帰で調整した、ということを明示しています。
結果でのロジスティック回帰の記載
次に結果でのロジスティック回帰に関する記載です。
able 2 contains the adjusted OR of appendiceal rupture inpatients with acute appendicitis for each variable listed in Table 1. Subjects with schizophrenia or dementia were associated with a high risk of appendiceal rupture, with an adjusted OR of 4.8 in schizophrenia (95% CI: 1.62–14.19, P=.005) and 2.01 in dementia (95% CI: 1.19–3.39, P=.009). However, subjects with other mental disorders were associated with a reduced risk of appendiceal rupture (adjusted OR=0.78, 95% CI: 0.65–0.93, P=.005). Other factors, such as affective disorder, Parkinson disease, stroke, and other CNS disorders, were not associated with a risk of perforated appendicitis.
内容はこんな感じです。
-
Table 2にTable 1に示された各変数に対する、急性虫垂炎での虫垂穿孔入院患者の調整オッズ比を示している。
-
統合失調症や認知症患者は、虫垂先行の高いリスクと関係しており、それぞれ調整オッズ比が統合失調症は4.8 (95%CI: 1.62-14.19, p = 0.005)で認知症は2.01 (95%CI: 1.19-3.39, p = 0.009)であった。その他の精神疾患は虫垂先行の低リスクと関係していた(調整オッズ比 0.78, 95%CI: 0.65-0.93, p = 0.005)。気分障害、パーキンソン病、脳卒中、その他の中枢神経疾患のような他の因子は、穿孔性虫垂炎のリスクと関係なかった。
やはり、結果としてオッズ比とその95%信頼区間、p値を提示しています。また、メインアウトカムなのでこちらはtableでデータを示しています。
この研究のデザインについて
既存のデータベースからデータを抽出し、急性虫垂炎に至った患者の中で、穿孔したかしないか、という結果で対象を2群にわけ、もともと精神疾患や中枢神経系の疾患があったか、というベースラインの状況を比較しているため、タイトルにも”case-control study”と記されています。
患者は穿孔群も非穿孔群も2792例で、ロジスティック回帰分析で説明変数に挙げられているのは23個なので、ロジスティック回帰分析にも耐える症例数になっています。
が、文献1と文献2でやっていることはほぼ同じです。あるデータベースの中から基準を満たす対象をピックアップし、ベースラインで疾患との関係を調べたい因子と交絡になりうる因子をピックアップし、フォローアップの際にある疾患を発症しているかどうかを調べ、関係を調べるためにロジスティック回帰を用いています。なぜ違う研究デザインが記されているのでしょう。この点に関して、文献2は気を使うべきことがあります。
文献2の大きな問題点として、次の2点が挙げられます。
- 穿孔群と非穿孔群で1:1にマッチングしているのであれば、対応のある検定で比較する必要があるが、それをしていない
- 傾向スコアでマッチングするのであれば、そもそも年齢・性別以外の交絡になりうる因子も全て傾向スコア算出に導入し、ベースラインの精神疾患や中枢神経系の疾患の有無で分けてマッチングし、穿孔性虫垂炎になりうる率の違いを比較すべきではないか(つまり、コホート研究として解析すべき)
どちらも論じ始めると長くなりそうなので挙げるだけとしますが、文献2の解釈は注意しないといけないでしょう。
Abstractをなんとなく見て、「統合失調症や認知症は知覚の変容や症状をうまく表現できないことから、急性虫垂炎になってもなかなか受診に繋がらないので、入院した時点では穿孔しているリスクが高いのかも」というようなことが書いてあり、何これ面白そう、と思って飛びついてしまいました。
論文でロジスティック回帰を説明する
文献2には問題がありそう、という脇道に逸れてしまいましたが、今回の本題に戻ります。
ロジスティック回帰を用いて論文を書く際に、方法・結果で以下のような記載が求められます。
ちなみに、このような統計解析に関する記載のガイドラインとして、以下のような本があります。研究をする上では必携かと思います。
回帰分析関連の投稿
おすすめ書籍:わかりやすい医学統計の報告-医学論文作成のためのガイドライン
論文で統計解析の結果をどのように報告するか、明確に指導されないことが多いかと思います。この本は、各統計解析結果のどのような統計量を、本文中や表(table)、図(figure)でどのように報告すべきかを、具体例も添えて提示してくれているガイドラインです。