การพัฒนาตัวแบบทำนาย: จากการวิเคราะห์ถดถอยสู่ Machine Learning
แหล่งเรียนรู้เพื่อปูพื้นแนวคิดเกี่ยวกับการพัฒนาตัวแบบทำนายในงานวิจัยทางวิทยาศาสตร์สุขภาพ โดยเชื่อมโยงจากการวิเคราะห์ถดถอยแบบดั้งเดิม ไปสู่ regularized regression และ machine learning อย่างเป็นระบบ
คลิปวีดีโอ
ชุดบทความ: พื้นฐานตัวแบบทำนาย
- ทิศทางและแนวโน้มการนำตัวแบบทำนายมาใช้ในงานวิจัยทางวิทยาศาสตร์สุขภาพ
- ความรู้พื้นฐานและการประยุกต์ใช้ตัวแบบทำนายสำหรับการพัฒนางานวิจัยทางสาธารณสุข
ชุดบทความ: จาก Regression สู่ Predictive Modeling
- ข้อจำกัดของการวิเคราะห์ถดถอยแบบดั้งเดิมเมื่อนำมาใช้สร้างตัวแบบทำนาย
- Prediction ไม่เหมือน Explanation: ความแตกต่างที่นักวิจัยสุขภาพควรเข้าใจ
ชุดบทความ: Regularized Regression
- Regularized regression คืออะไร และทำไมจึงสำคัญในงานวิจัยสุขภาพ
- Ridge regression: แนวคิดและการประยุกต์ใช้
- LASSO regression: การคัดเลือกตัวแปรและการลดปัญหา overfitting
- Elastic net regression: ทางเลือกเมื่อ predictors มีจำนวนมากและสัมพันธ์กัน
ชุดบทความ: การประเมินและตรวจสอบความถูกต้องของตัวแบบทำนาย
- การประเมินประสิทธิภาพของตัวแบบทำนาย: discrimination, calibration และ overall performance
- AUC หรือ C-statistic คืออะไร และควรตีความอย่างไรในงานวิจัยสุขภาพ
- Calibration คืออะไร และทำไมตัวแบบที่มี AUC สูงอาจยังใช้งานจริงได้ไม่ดี
- Internal validation และ external validation ในการพัฒนาตัวแบบทำนาย
- Overfitting, optimism และการประเมินความเสถียรของตัวแบบทำนาย
ชุดบทความ: การรายงานและการนำตัวแบบทำนายไปใช้ในงานวิจัยสุขภาพ
- หลักการรายงานงานวิจัยด้าน prediction model สำหรับงานวิจัยสุขภาพ
- ข้อผิดพลาดที่พบบ่อยในการรายงานงานวิจัยเกี่ยวกับตัวแบบทำนาย
- ตัวแบบทำนายเพื่อการวิจัย กับตัวแบบทำนายเพื่อการใช้งานจริง ต่างกันอย่างไร
- ข้อพึงระวังในการตีความตัวแปรที่ถูกเลือกจาก LASSO regression
- จาก predictive model สู่ clinical/public health decision support
บทความวิชาการ
YouTube
การเรียนรู้ชีวสถิติด้วยตนเอง: จากพื้นฐานสู่ตัวแบบสถิติขั้นสูงสำหรับงานวิจัยสุขภาพ
พื้นที่การเรียนรู้ชีวสถิติด้วยตนเองสำหรับงานวิจัยทางวิทยาศาสตร์สุขภาพ โดยเชื่อมโยงบทเรียนพื้นฐานกับบทความวิชาการต่อยอด เพื่อเตรียมความเข้าใจสู่การใช้ตัวแบบสถิติขั้นสูง ได้แก่ GLMs, GEEs, mixed effects models และ GLMMs
คลิปวีดีโอ
- พื้นฐานชีวสถิติผ่าน บทเรียนแบบ Module
- สู่ตัวแบบสถิติขั้นสูงสำหรับงานวิจัยสุขภาพ ผ่านชุดบทความที่เกี่ยวข้องดังนี้
ชุดบทความ: จาก Linear Model สู่ Generalized Linear Models
- ข้อจำกัดของตัวแบบเชิงเส้นเมื่อตัวแปรผลลัพธ์ไม่ได้เป็นข้อมูลต่อเนื่อง
- Generalized Linear Models คืออะไร และทำไมจึงสำคัญในงานวิจัยสุขภาพ
- Family และ link function: แนวคิดสำคัญของ GLMs ที่นักวิจัยสุขภาพควรรู้
- Logistic, multinomial, ordinal และ Poisson regression ภายใต้กรอบ GLMs
ชุดบทความ: GEEs สำหรับข้อมูลวัดซ้ำและข้อมูลสัมพันธ์กัน
- ทำไมข้อมูลวัดซ้ำและข้อมูลแบบกลุ่ม จึงวิเคราะห์เหมือนข้อมูลอิสระไม่ได้
- Generalized Estimating Equations คืออะไร และเหมาะกับคำถามวิจัยแบบใด
- Population-averaged effect กับ subject-specific effect ต่างกันอย่างไร
- Working correlation structure ใน GEEs: แนวคิดและข้อพึงระวัง
ชุดบทความ: Mixed Effects Models และ GLMMs
- Linear Mixed Effects Models คืออะไร และเหมาะกับข้อมูลแบบใด
- Fixed effects และ random effects: ความหมายและการตีความ
- Random intercept และ random slope สำหรับข้อมูลวัดซ้ำ
- Generalized Linear Mixed Models คืออะไร
- GEEs กับ GLMMs ต่างกันอย่างไร และควรเลือกใช้อย่างไร
STATA Tips: เทคนิคเฉพาะทางสำหรับการวิเคราะห์ข้อมูลในงานวิจัยสุขภาพ
แหล่งรวบรวมบทความเกี่ยวกับเทคนิคการใช้ STATA ที่ต่อยอดจากพื้นฐาน โดยเน้นประเด็นที่นักวิจัยมักสับสน หรือ พบได้บ่อยในการวิเคราะห์ข้อมูลจริง เช่น การแปลผล regression การใช้ margins การจัดการข้อมูลวัดซ้ำ การใช้ GLMs/GEEs/mixed models และการจัดเตรียมผลลัพธ์สำหรับรายงานวิจัย หรือ ต้นฉบับบทความวิชาการ
ชุดบทความ: STATA Tips สำหรับการแปลผล Regression
- การใช้ margins เพื่อช่วยแปลผลหลังการวิเคราะห์ regression
- ความแตกต่างระหว่าง coefficient, adjusted mean, predictive margin และ marginal effect
- การใช้ marginsplot เพื่อสื่อสารผลลัพธ์จาก regression
- การแปลผล interaction term ใน STATA อย่างเป็นระบบ
- ทำไมค่า p-value ของ interaction กับผลจาก margins อาจทำให้ผู้วิจัยสับสน
ชุดบทความ: STATA Tips สำหรับข้อมูลวัดซ้ำและข้อมูลกลุ่ม
- การเตรียมข้อมูล long format สำหรับ repeated measures analysis
- การใช้ xtset และ mixed สำหรับข้อมูลวัดซ้ำ
- การกำหนด random intercept และ random slope ใน STATA
- การใช้ xtgee สำหรับ GEEs และการเลือก working correlation structure
- การเปรียบเทียบแนวคิดระหว่าง xtgee, mixed และ melogit
ชุดบทความ: STATA Tips สำหรับ GLMs และข้อมูลไม่ต่อเนื่อง
- การใช้ glm กับ family และ link function ให้เหมาะกับชนิดข้อมูล
- การวิเคราะห์ binary outcome ด้วย logit, logistic และ glm
- การวิเคราะห์ count data ด้วย Poisson regression และ negative binomial regression
- การตรวจสอบ overdispersion ใน count data
- การแปลผล incidence rate ratio, odds ratio และ risk ratio จาก STATA
ชุดบทความ: STATA Tips สำหรับการสร้างผลลัพธ์เพื่อตีพิมพ์
- การสร้างตารางผลลัพธ์ regression สำหรับ manuscript
- การใช้ estimates store, esttab หรือ outreg2 เพื่อจัดตารางผลลัพธ์
- การรายงาน adjusted effect พร้อม 95% confidence interval
- การสร้างกราฟที่เหมาะกับงานวิจัยสุขภาพ
- การส่งออกผลลัพธ์จาก STATA ไปใช้ใน Word และ Excel อย่างเป็นระบบ
ชุดบทความ: STATA Tips คำสั่งที่นักวิจัยส่วนใหญ่มักสับสน
- logit กับ logistic ต่างกันอย่างไร
- regress กับ glm, family(gaussian) link(identity) ต่างกัน หรือไม่
- anova, regress และ ancova เชื่อมโยงกันอย่างไรใน STATA
- robust standard error ควรใช้เมื่อใด
- clustered standard error ต่างจาก random effects อย่างไร
- missing values ใน STATA มีผลต่อการวิเคราะห์อย่างไร
- complete-case analysis กับ multiple imputation ควรเลือกอย่างไร
SEM และ Generalized SEM using STATA
แหล่งเรียนรู้สำหรับการทำความเข้าใจและประยุกต์ใช้ structural equation modeling และ generalized structural equation modeling ด้วยโปรแกรม STATA โดยเชื่อมโยงจาก regression, path analysis และ confirmatory factor analysis ไปสู่การวิเคราะห์ตัวแบบความสัมพันธ์เชิงโครงสร้างในงานวิจัยสุขภาพ ครอบคลุมทั้งข้อมูลต่อเนื่อง ข้อมูลทวิภาค ข้อมูลลำดับ และข้อมูลจำนวนนับ
ชุดบทความ: พื้นฐาน SEM สำหรับงานวิจัยสุขภาพ
- Structural Equation Modeling คืออะไร และเหมาะกับคำถามวิจัยแบบใด
- Path analysis, confirmatory factor analysis และ SEM แตกต่างกันอย่างไร
- ตัวแปรสังเกตได้และตัวแปรแฝงใน SEM คืออะไร
- Direct effect, indirect effect และ total effect ใน SEM
- Measurement model และ structural model: สององค์ประกอบสำคัญของ SEM
- ข้อจำกัดของ SEM แบบดั้งเดิมเมื่อนำมาใช้ในงานวิจัยสุขภาพ
ชุดบทความ: SEM using STATA
- การวิเคราะห์ path analysis ด้วยคำสั่ง sem ใน STATA
- การวิเคราะห์ confirmatory factor analysis ด้วยคำสั่ง sem ใน STATA
- การประเมิน model fit ใน SEM: CFI, TLI, RMSEA และ SRMR
- การวิเคราะห์ mediation model ด้วย SEM ใน STATA
- การตีความ standardized และ unstandardized coefficients ใน SEM
- การรายงานผล SEM สำหรับต้นฉบับบทความวิจัย
ชุดบทความ: Generalized SEM สำหรับงานวิจัยสุขภาพ
- Generalized SEM คืออะไร และทำไมจึงสำคัญในงานวิจัยสุขภาพ
- sem และ gsem ใน STATA แตกต่างกันอย่างไร
- เมื่อ outcome ไม่ใช่ข้อมูลต่อเนื่อง: ทำไม SEM แบบดั้งเดิมอาจไม่เพียงพอ
- การวิเคราะห์ path model เมื่อตัวแปรผลลัพธ์เป็น binary outcome
- การวิเคราะห์ตัวแปรผลลัพธ์แบบ ordinal outcome ด้วย generalized SEM
- การวิเคราะห์ count outcome ด้วย generalized SEM
- การใช้ latent variable ร่วมกับ binary และ ordinal indicators ใน gsem
ชุดบทความ: Mediation และ Path Model ด้วย SEM/GSEM
- Mediation analysis ในกรอบ SEM คืออะไร
- การวิเคราะห์ indirect effect ด้วยคำสั่ง sem และ nlcom ใน STATA
- การวิเคราะห์ mediation model เมื่อตัวแปรผลลัพธ์เป็น binary outcome
- การตีความ direct, indirect และ total effect ใน generalized SEM
- ข้อพึงระวังในการตีความ mediation analysis ในงานวิจัยเชิงสังเกต
- Mediation analysis ไม่ใช่หลักฐานเชิงสาเหตุโดยอัตโนมัติ: ประเด็นที่นักวิจัยควรเข้าใจ
ชุดบทความ: ประเด็นที่นักวิจัยส่วนใหญ่มักสับสนในการใช้ SEM/GSEM
- ค่า model fit ดี ไม่ได้แปลว่าโมเดลถูกต้องเสมอไป
- Modification indices ควรใช้ด้วยความระมัดระวังอย่างไร
- ขนาดตัวอย่างสำหรับ SEM และ GSEM ควรพิจารณาอย่างไร
- SEM กับ regression analysis ต่างกันอย่างไร
- SEM กับ path analysis ต่างกันอย่างไร
- SEM ด้วย STATA ต่างจากการใช้ AMOS อย่างไร
- ทำไม generalized SEM จึงเหมาะกับงานวิจัยสุขภาพมากกว่า SEM แบบดั้งเดิมในบางกรณี
- ข้อจำกัดของ generalized SEM ที่ควรรายงานในบทความวิจัย