🗂 總目錄 | 📖 英文原文 | 📝 完整翻譯 | ⭐ 精華筆記(本篇)
統計方法學 (Statistical methodology)
- 資料型態:分析可用 SAS、STATA 等軟體執行。多數觀察性與實驗性研究蒐集量化資料 (quantitative data):
- 連續資料 (continuous data):以含中間值的實數測量(如身高 62.5 cm)。
- 離散資料 (discrete data):無中間值的實數(如家族中有皮膚癌病史的人數)。
- 資料中心量數:
- 平均數 (mean):含離群值的平均,離群值可能大幅偏移平均數。
- 中位數 (median):由低至高排序後正中間之值(第五十百分位數),不受離群值顯著影響。
- 眾數 (mode):資料集中最常出現的值(直方圖的峰值)。
- 離散程度:
- 變異數 (variance):資料點與平均數差之平方的平均。
- 標準差 (standard deviation):變異數的平方根,衡量資料與平均數的接近程度;標準差低表多數值貼近平均,標準差高表資料分布範圍廣。
- 常態(高斯)分布 (normal / Gaussian distribution):呈鐘形曲線;假定 68% 的資料落在平均數左右一個標準差內、95% 落在兩個標準差內、99.7% 落在三個標準差內。
- p 值 (p-value):結果可能純屬機率所致的可能性度量。一般以 p-value <0.05(小於 5%)為統計顯著的門檻;p 值越低,結果為真的可能性越高。
- 檢力 (power):揭示兩組間具統計顯著(p < 0.05)結果差異所需的資料點/受試者數目。檢力 = 1 減偽陰性率;檢力越高,偽陰性 (false negative) 可能性越低。一般 power >80% 視為具統計檢力。
- 檢力分析 (power analysis):研究開始前應執行,以決定揭示顯著結果所需的最少資料點。計算樣本數所需基本資訊:檢定類型(單側或雙側)、顯著水準(通常 0.05)、期望檢力(1-b,即 type II error,通常 0.8)、及效應量估計 (effect size estimate)。可用統計學家、統計軟體或線上檢力計算器產生樣本數。缺此分析可能資料點過少而結論不準,或受試者過多而造成使病人遭受不必要傷害的倫理風險。
- 參數檢定 (parametric tests):資料呈常態分布時用以比較平均數。
- t 檢定 (t-test):最知名的參數檢定,適用於常態分布的連續資料;所用 t 檢定視兩組變異數相等或不等而定。
- 配對 t 檢定 (paired t-test):樣本相關時使用,如前後對照研究、或配對樣本(如病例對照研究 case-control study)。
- 無母數檢定 (nonparametric tests):資料集非常態時使用,包括 Wilcoxon Mann–Whitney U-test、Kruskal–Wallis (H) test、Wilcoxon Signed-Rank test。
- 卡方檢定 (chi-squared test):比較觀察比例與期望比例時使用,如比較兩性間結節型黑色素瘤發生率與期望值(50:50)。
- 迴歸分析 (regression analysis):可檢驗多個自變項對特定結果的影響(如同時分析年齡、免疫狀態、所受治療、共病對 SCC 轉移率的影響)。以統計套件建模產生 r² 值,協助判斷結果中有多少變異源自所辨識的變項;例:若 r² = 0.78,表示 78% 的結果源自所定義的變項。
- 邏輯斯迴歸 (logistic regression):當依變項為二元時,用以建模事件發生機率,並為任一自變項產生 OR 與 p 值。