首頁  |   網站導覽  |   會員登入  |  
首頁 » 分析方法 » 條件邏輯斯迴歸模式

條件邏輯斯迴歸分析
Conditional Logistic Regression Analysis
一般邏輯斯迴歸分析(Logistic regression)主要是針對二項式(binomial)依變數的獨立(independent)資料。 當資料為配對資料(matched data)或前、後測的成對資料(paired data)時, 資料間有時會具有較高的相依性(dependent), 此時需使用條件邏輯斯迴歸(Conditional logistic regression)來分析二項式的依變數, 利用條件式最大概似估計法(conditional maximum likelihood estimation)來估計模式參數。
使用本分析方法必須先定義個案的配對組別,同一配對組別的個案給予同一配對編號,為本方法中之"配對組別變數"。
請參考範例中的資料格式

本方法使用之R相關套件與參考文獻:
相關套件:stats、base、survival、MASS
參考文獻:
  1. R Core Team (2013). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL:http://www.R-project.org/.
  2. Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0
  3. Therneau T (2014). A Package for Survival Analysis in S. R package version 2.37-7. URL:http://CRAN.R-project.org/package=survival
  4. Terry M. Therneau and Patricia M. Grambsch (2000). _Modeling Survival Data: Extending the Cox Model_. Springer, New York. ISBN 0-387-98784-3.
範例D-3:子宮內膜癌配對病例對照研究資料

由於雌激素會刺激子宮內膜細胞增生,可能增加罹患子宮內膜癌的風險。研究者想瞭解 "雌激素治療使用狀況及常見病症對罹患子宮內膜癌(endometrial cancer)的影響",設計了配對病例對照研究(matched case-control study),於社區中收集63位子宮內膜癌病患,依照病例1、對照4的比例配對,為病患配對沒有罹病的對照個案。配對條件為:子宮內膜癌診斷時的年齡,找出該年年齡差距在一歲以內的對照個案、有相同的婚姻狀況及在相近的時間點進入社區,且限定對照個案是沒有做過子宮切除手術,尚有得子宮內膜癌之風險者。回溯病例及其配對對照共315人之相關資料,包含是否有膽囊疾病、是否有高血壓、是否肥胖、是否使用雌激素及雌激素使用狀況,並分析上述變數與子宮內膜癌是否有相關,研究對象紀錄如下表:

表:子宮內膜癌配對病例對照研究資料 (註一)
編號 1 2 3 4 5 313 314 315
配對組別 1 1 1 1 1 63 63 63
病例 1 0 0 0 0 0 0 0
年齡 74 75 74 74 75 70 69 69
膽囊疾病 No No No No No No No No
高血壓 No No No No No No Yes Yes
肥胖 Yes NA NA NA Yes NA Yes No
雌激素治療 Yes No No No Yes No Yes Yes
雌激素治療劑量 3 0 0 0 1 0 2 3
雌激素治療時間層級 4 0 0 0 3 0 3 3
使用非雌激素藥物 Yes No No No Yes No Yes Yes
註一:NA表示遺失值
配對組別:同一配對組別的個案給予同一編號
病例:1表病例、0表對照
膽囊疾病:Yes表患病、No表未患病
高血壓:Yes表患病、No表未患病
肥胖:Yes表患病、No表未患病
雌激素治療:Yes表是、No表否
雌激素治療劑量:劑量由低至高分為5級;0<1<2<3<4
雌激素治療時間層級:治療時間長短由短至長分為4級;0<1<2<3
使用非雌激素藥物:Yes表是、No表否
參考文獻:
  1. Breslow NE, and Day N, Statistical Methods in Cancer Research. Volume I: The Analysis of Case-Control Studies. IARC Scientific Publications, IARC:Lyon, 1980.

Q1:由於雌激素會刺激子宮內膜細胞增生,可能會增加罹患子宮內膜癌的風險。研究者設計一配對病例對照研究並記錄研究對象是否有膽囊疾病、高血壓、肥胖、及其使用雌激素治療的狀況,來觀察這些因子是否會影響子宮內膜癌的罹患機率。
統計方法:本資料由配對病例對照研究而來,依變數是病例(是否罹患子宮內膜癌),為二項式變數;自變數是雌激素治療的狀況及常見疾病等相關因子;"配對組編號變數" 為組別。由於資料為具相依性之配對資料,且依變數為二項式變數,可採用條件邏輯斯迴歸模式(Conditional logistic regression analysis),分析 "在控制配對條件下,膽囊疾病、高血壓、肥胖與使用雌激素治療的狀況對罹患子宮內膜癌的影響為何? "。
條件邏輯斯迴歸分析 - 分析結果
  • 分析方法:條件邏輯斯迴歸分析
  • 資料名稱:範例D-3
  • 依變數名稱:病例
  • 自變數名稱:膽囊疾病, 高血壓, 肥胖, 雌激素治療劑量, 使用非雌激素藥物, 雌激素治療時間層級
  • 配對組編號變數:組別
  • 計算時間:0.438秒

  • 變數訊息I
    類別變數(categorical)
    變數名稱
    Variable
    變數值
    Value
    編碼
    Coded
    個數
    Count
    膽囊疾病No0274
    Yes141
    高血壓No0207
    Yes1108
    肥胖No098
    Yes1167
    雌激素治療劑量00155
    1160
    2257
    3335
    使用非雌激素藥物No083
    Yes1232
    雌激素治療時間層級00155
    1132
    2244
    3327
    4440
    I:變數訊息皆不包含遺失值
  • 依變數訊息I
    變數名稱
    Variable
    變數值
    Value
    編碼
    Coded
    個數
    Count
    病例00252
    1163
    I:依變數訊息不包含遺失值

  • 變數選取:
    變數選取方法:Stepwise AIC法
    變數選取準則:min AIC(Akaike Information Criterion)
    使用者指定模式:病例 = 膽囊疾病 + 高血壓 + 肥胖 + 雌激素治療劑量 + 使用非雌激素藥物 + 雌激素治療時間層級
    AIC準則選取之較佳模式:病例 = 膽囊疾病 + 肥胖 + 雌激素治療劑量
    模式選取I,II,III
    變數 自由度 Deviance AIC值
    使用者指定模式 238 101.9 121.9
    系統選取較佳模式 243 107.82 117.82
    I:AIC與Deviance欄位中數值越小表示模式越佳
    II:由Deviance比較兩模式,P值(0.3141436) ≥ 0.05,表示系統選取之較佳模式適合且較為精簡
    III:在兩種情況下,模式中的Deviance值將可能不正確,不建議使用
     (i) 飽和模式(Saturated model)下的參數個數會隨樣本數而改變
     (ii)觀察值的個數太少
  • AIC準則選取之較佳模式係數估計:
    係數
    coefficient
    估計值
    estimation
    標準差
    std.err.
    華德檢定統計量
    Wald-statistic
    p-值
    p-value
    EXP
    (估計值)
    EXP(估計值)
    95%信賴區間
    上界lower 下界upper
    膽囊疾病(Yes)1.4540.5128.0730.0044.2781.5711.661
    肥胖(Yes)0.7630.4912.4140.122.1450.8195.616
    雌激素治療劑量(1)1.5510.5647.5610.0064.7151.56114.24
    雌激素治療劑量(2)1.2050.5714.460.0353.3361.09110.208
    雌激素治療劑量(3)2.3540.57916.546010.5263.38632.719
    I:依變數為病例
  • AIC準則選取之較佳模式訊息:
    使用的觀察值數目:248
    事件數(number of events): 50
    模式適合度(model fitness)
    檢定方法
    method
    統計量
    statistic
    自由度
    d.f.
    p值
    p-value
    概似比檢定(Likelihood ratio test) 34.42221 5 0
    華德檢定(Wald test) 22.88 5 0.00036
    分數(對數-秩)檢定(Score (Log-rank) test) 32.45491 5 0
    模式判定係數(R-square):0.1296
[重新分析]
影音教學內容為本系統資料處理與分析方法之操作說明,
可供使用者即時參考及線上自學,
輕鬆上手「雲端資料分析暨導引系統」!

步驟一:資料匯入
選擇要進行分析的資料檔或上傳檔案
您所選擇的資料檔為: