วันเสาร์ที่ 24 กันยายน พ.ศ. 2554

ระบาด หน่วยที่ 6 (รุ่น สรุปโดยอาจารย์)

หน่วยที่ 6
สถิติที่ใช้ในวิทยาการระบาด

ลักษณะและองค์ประกอบของฐานข้อมูล
        ลักษณะฐานข้อมูลประกอบด้วย 1) ฐานข้อมูลเฉพาะผู้ป่วย (Cases Database) 2) ฐานข้อมูลประชากรเป้าหมาย (Complete Target Population Database) 3) ฐานข้อมูลการติดตามทางสิ่งแวดล้อม (Monitoring Environmental Database) และ 3) ฐานข้อมูลหลายระดับ (Multilevel Database)
           องค์ประกอบของข้อมูลประกอบด้วยรายละเอียดของข้อมูล หรือฟิลด์ (Fields) ต่างๆ ที่สามารถวิเคราะห์ทางวิทยาการระบาด เช่น เพศ อายุ ภูมิลำเนา ประวัติการเจ็บป่วย เป็นต้น เรียกฟิลด์ต่างๆ เหล่านี้ว่าตัวแปร (Variables) ซึ่งเกี่ยวข้องกับลักษณะของตัวแปร การจำแนกตัวแปรที่ศึกษาแบ่งตามระดับการวัด ได้ 4 ชนิด ดังนี้
                1) นามมาตรา (Nominal Scale) หมายถึง ตัวแปรที่สามารถแบ่งเป็นกลุ่ม พวก หรือชนิด ที่แยกกันได้โดยเด็ดขาด หรือตัวแปรนั้นมีเพียง 1 คำตอบเท่านั้น ตัวแปรนี้จัดเป็นตัวแปรเชิงคุณภาพ (Qualitative Variables) จำเป็นต้องกำหนดรหัสของแต่ละตัวแปรให้ชัดเจน เพราะตัวเลขที่บันทึกนั้นแทนความหมายของแต่ละกลุ่ม
                 2) อันดับมาตรา (Ordinal Scale) หมายถึง รายการย่อยของตัวแปรที่แบ่งออกมานั้นสามารถบอกลำดับความมากน้อยหรือสูงต่ำได้ แต่บอกขนาดความมากน้อยไม่ได้ ตัวแปรนี้จัดเป็นตัวแปรเชิงคุณภาพ (Qualitative Variables) จำเป็นต้องมีการกำหนดรหัสของแต่ละตัวแปรให้ชัดเจน เพราะตัวเลขที่บันทึกแทนความหมายของกลุ่มเหล่านั้น อาจจะเรียงลำดับจากระดับน้อยไปมาก (Positive Ranking) หรือเรียงจากมากไปหาน้อย (Negative Ranking) หรือไม่ได้มีการเรียงลำดับก็ได้เช่นเดียวกับ Nominal Scale
                3) ช่วงมาตรา (Interval Scale) ตัวแปรที่สามารถบอกถึงขนาดของความแตกต่างกันได้ แต่ค่าศูนย์ไม่เป็นศูนย์จริง หน่วยวัดในเรื่องเดียวกันนั้น มีค่า 0 แตกต่างกัน เป็นตัวแปรเชิงปริมาณ (Quantitative) ในกรณีนี้สามารถบันทึกเป็นระบบตัวเลขได้โดยตรงซึ่งจะเป็นเลขจำนวนเต็ม หรือมีทศนิยมก็ได้ (Value or Numeric)
                4) อัตราส่วนมาตรา (Ratio Scale) หมายถึง ตัวแปรที่บอกถึงปริมาณความแตกต่างและสามารถเปรียบเทียบความแตกต่างเป็นจำนวนเท่าได้ (Ratio) ตัวแปรชนิดนี้จะมีศูนย์จริง ค่า 0 แต่ละหน่วยจะมีค่าเท่ากันหมด ตัวแปรนี้เป็นตัวแปรเชิงปริมาณ (Quantitative) ในกรณีนี้สามารถบันทึกเป็นระบบตัวเลขได้โดยตรงซึ่งจะเป็นเลขจำนวนเต็มหรือมีทศนิยมก็ได้ (Value or Numeric) ได้เช่นเดียวกับ Interval Scale
                สำหรับข้อมูลที่เป็น Interval หรือ Ratio Scale ผู้วิจัยบางรายลงข้อมูลเป็นแบบ Nominal Scale หรือ Ordinal Scale โดยมีการจัดกลุ่มของค่าตัวแปรเหล่านั้น เช่น ตัวแปรอายุ มีการจัดกลุ่มอายุเป็นวัยต่างๆ (วัยทารก วัยเด็ก วัยรุ่น วัยแรงงาน และวัยสูงอายุ) ตัวแปรรายได้ จัดเป็นกลุ่มรายได้ (รายได้น้อย รายได้ปานกลาง และรายได้สูง) การกำหนดรหัสจะมีความสำคัญต่อตัวแปรที่เป็น Nominal หรือ Ordinal Scale แต่มีข้อจำกัดในการใช้สถิติสำหรับการวิเคราะห์ต่อไป
                แต่ลักษณะฟิลด์ในฐานข้อมูลจะมีลักษณะอื่นๆ ได้แก่ ตัวอักษร (Character or String) เช่น ชื่อ-สกุล ที่อยู่อาศัยของบุคคล เป็นต้น ฟิลด์ต่างๆ เหล่านี้ไม่สามารถนำไปวิเคราะห์ทางสถิติได้ แต่ใช้เพื่อการตรวจสอบ หรือติดตามผลการศึกษาเท่านั้น ส่วน วันที่ (Date) เช่น วันที่การป่วยเป็นโรค วันที่รักษาหาย เป็นต้น บางครั้งนำมาวิเคราะห์เพื่อศึกษาลักษณะรูปแบบการเกิดโรค (Pattern of Disease) แต่ส่วนใหญ่นำไปสร้างเป็นตัวแปรใหม่เพื่อใช้ในการวิเคราะห์ต่อไป เช่น ระยะเวลาป่วย ระยะเวลารอดชีพ เป็นต้น
สถิติที่ใช้ในการวิเคราะห์ทางวิทยาการระบาดเชิงพรรณนา
การวิเคราะห์ความสัมพันธ์อย่างหยาบและการแปลผล การวิเคราะห์ความสัมพันธ์ระหว่างปัจจัยที่น่าจะเป็นสาเหตุของการเกิดโรค (X) โดยแบ่งออกเป็นกลุ่มที่สัมผัสปัจจัย หรือกลุ่มเสี่ยง (E+) และกลุ่มที่ไม่ได้สัมผัสปัจจัย หรือกลุ่มไม่เสี่ยง (E-) และตัวแปรการเกิดโรค (Y) โดยแบ่งออกเป็น กลุ่มที่เป็นโรค (D+) และกลุ่มที่ไม่ได้สัมผัสปัจจัย หรือกลุ่มไม่เสี่ยง (D-) วิธีการวิเคราะห์ความสัมพันธ์อย่างหยาบดังนี้
                                                                                ผลลัพธ์ (Outcome; Y)
ปัจจัย(X)
เป็นโรคD+(=1)
ไม่เป็นโรค
D-(=2)
รวม
เสี่ยง [E+(=1)]
a
b
R1
ไม่เสี่ยง [E-(=2)]
c
d
R2
รวม
C1
C2
n
                                           สูตรสำหรับตาราง 2x2 จะมีลักษณะดังนี้

             1. ความเสี่ยงสัมพัทธ์อย่างหยาบ (Crude Relative Risk) เป็นสถิติที่ใช้สำหรับการศึกษาทางระบาดวิทยาแบบโคฮอร์ต หรือแบบทดลอง ซึ่งในแต่ละกลุ่มที่มีระดับความเสี่ยงต่างกัน (กลุ่มที่มีความเสี่ยงมากและกลุ่มที่มีความเสี่ยงน้อย) จะมีโอกาสการเกิดโรคนั้นต่างกันหรือไม่
               
               
            2. ออดส์เรโชอย่างหยาบ (Crude Odds Ratio) เป็นสถิติที่ใช้สำหรับการศึกษาทางวิทยาการระบาดแบบเคส-คอนโทรล แต่สำหรับการศึกษาทางวิทยาการระบาดแบบภาคตัดขวาง ซึ่งแปลผลเช่น เดียวกับ Relative Risk
            3. สถิติทดสอบไค-สแควร์แบบเพียร์สัน (Pearson Chi-Square Test) เป็นสถิติที่ใช้เพื่อทดสอบความสัมพันธ์ระหว่างปัจจัยสาเหตุ (Exposure; X) และตัวแปรตาม (Outcome; Y) เป็นสถิติทดสอบความสัมพันธ์อย่างหยาบ (Crude association) โดยไม่มีการควบคุมอิทธิพลของตัวแปรภายนอกหรือตัวแปรกวน ภายใต้การทดสอบสมมติฐานว่าง (Ho: X และ Y ไม่สัมพันธ์กัน) โดยกำหนดระดับนัยสำคัญทางสถิติ (Level of Significance; a)
                สถิติทดสอบไค-สแควร์ มีเงื่อนไขที่สำคัญคือ ค่าความคาดหวัง (Eij) ต้องมีค่ามากกว่า 5 หรือมีค่าน้อยกว่า 5 ไม่เกินร้อยละ 20 ถ้าผลการทดสอบด้วยไค-สแควร์พบว่า มีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติระหว่างปัจจัยกับการเกิดโรค (p<0.05) ไม่สามารถระบุทิศทางได้ ต้องพิจารณาค่า Relative Risk หรือ Odds Ratio ร่วมด้วย
           4. สถิติทดสอบไค-สแควร์ปรับความต่อเนื่อง (Correction c2 หรือ Yate’s Correction) เป็นค่าสถิติทดสอบความสัมพันธ์เช่นเดียวกับ Pearson Chi-Square ได้เฉพาะการวิเคราะห์ความสัมพันธ์สำหรับตารางแบบ 2x2 เท่านั้น ซึ่งมีค่า df = 1 แต่มีการปรับความต่อเนื่อง นักวิจัยทางด้านวิทยาการระบาดนิยมใช้มากกว่าสถิติทดสอบไค-สแควร์แบบเพียร์สัน
                สถิติทดสอบไค-สแควร์ มีเงื่อนไขที่สำคัญคือ ค่าความคาดหวัง (Eij) มีค่ามากกว่า 5 เท่านั้น
           5. สถิติการทดสอบฟิชเชอร์ (Fisher’s Exact Test) เป็นสถิติทดสอบความสัมพันธ์อย่างหยาบระหว่างปัจจัยที่น่าจะเป็นสาเหตุ (Exposure) กับการเกิดโรค (Outcome) เช่นเดียวกับการทดสอบไค-สแควร์ เฉพาะตาราง 2x2 และใช้เฉพาะค่า Minimum Expected Frequencies น้อยกว่า 5 เท่านั้นแต่คำนวณค่าความน่าจะเป็นโดยตรงจากตารางข้อมูล (p-value) วิธีการพิจารณาผลการทดสอบสมมติฐานว่าง ใช้ความน่าจะเป็น 2 ทาง
เทคนิคการวิเคราะห์ MH Odds Ratio และการทดสอบ Effect Modification
            การวิเคราะห์ MH Odds Ratio เป็นสถิติสำหรับการวิเคราะห์ความสัมพันธ์ระหว่างปัจจัยที่ต้องการทดสอบ (Exposure) กับการเกิดโรค (Outcome) โดยมีการควบคุมตัวแปรกวน (Adjusted Confounding Factor Effect) เป็นการวิเคราะห์ทางสถิติเพื่อวิเคราะห์ความสัมพันธ์ระหว่างปัจจัยกับการเกิดโรคตามกลุ่มย่อยๆ ของตัวแปรกวน เรียกว่า Stratification Analysis จะได้ค่า OR แต่ละกลุ่มย่อยของตัวแปรกวน แล้วนำมารวมกันตามสูตร Mantel-Haenszel จะได้ Mantel Haenzel Odds Ratio (ORMH) สามารถวิเคราะห์ได้เฉพาะปัจจัย (Exposure) ที่สนใจและการเกิดโรค (Outcome) แบบ 2x2 เท่านั้น และตัวแปรกวน (Confounding Factors) ต้องเป็นข้อมูลเชิงคุณภาพแบ่งกลุ่มได้ตั้งแต่ 2 กลุ่มขึ้นไป ค่า ORMH เป็นค่า Odds Ratio ที่ควบคุมอิทธิพลตัวแปรกวนแล้ว บางทีเรียกว่า Common Odds Ratio โดยไม่มีอิทธิพลโมดิฟิเคชัน (Effect Modification)
                ในการศึกษาความสัมพันธ์ระหว่างปัจจัย (Exposure = E) กับการเกิดโรค (Disease = D) โดยควบคุมปัจจัยบางประการหรือตัวแปรกวน (Confounding Factor = C) ซึ่ง Confounding Factor มีลักษณะดังนี้
                1. มีความสัมพันธ์ต่อการเกิดโรค (D)
                2. มีความสัมพันธ์ต่อ Exposure (E)
                3. ไม่ได้อยู่ในเส้นทางความสัมพันธ์ (pathway) ระหว่าง Exposure (E) กับการเกิดโรค (D) ดังภาพ

               
เทคนิคการวิเคราะห์ด้วย Multiple Logistic Regression Analysis และการทดสอบ
Interaction Effect
                การวิเคราะห์ Multiple Logistic Regression Analysis เป็นสถิติที่ใช้ในการทดสอบความสัมพันธ์ระหว่างปัจจัยที่น่าจะเป็นสาเหตุของโรคหลายตัว (Exposures) กับการเกิดโรค (Outcome) และอาจจะมีตัวแปรกวน (Confounding Factors) ร่วมอยู่ในสมการด้วยหลายตัว เรียกว่าการศึกษาความสัมพันธ์เชิงสาเหตุ (Etiological Model) หรือหาสมการทำนายเหตุการณ์ในสิ่งที่สนใจว่า จะมีโอกาสเกิดโรค/ไม่เกิดโรคขึ้น (Outcome) โดยใช้ตัวแปรอิสระต่างๆ (Independent Variables) เป็นตัวทำนายร่วมกันด้วยเทคนิคของ Multivariate Analysis เรียกว่า การศึกษาเพื่อการพยากรณ์ (Prognostic Model) คุณสมบัติของตัวแปรตาม (Y) เป็นผลของการตอบสนองที่ปรากฏออกมาเป็น 2 ลักษณะเท่านั้น (Binary, Dichotomous Outcome) เช่น เป็นโรค/ไม่เป็นโรค, หาย/ไม่หาย หรือตาย/ไม่ตาย เป็นต้น เรียกว่า วิธีการวิเคราะห์ Binary Logistic Regression analysis เป็นการวิเคราะห์ความสัมพันธ์ระหว่างความน่าจะเป็นของการเกิดการตอบสนอง หรือการเกิดโรค Prob (Y=1) โดยใช้ตัวแปรอิสระ x1, x2,...,xp 
ข้อตกลงเบื้องต้นของ Binary Logistic Regression Analysis
                1. ตัวแปรตาม (Y) เป็นตัวแปรประเภททวิ (Binary) ที่มีการแจกแจงแบบ Binomial มีสัดส่วนของการเกิด Outcome (Y=1) อยู่ระหว่าง 0.1-0.9 (0.1<p<0.9)
                2.  ตัวแปรอิสระ (X1, X2, X3,...Xp) มีคุณสมบัติดังนี้
                                2.1 เป็นตัวแปรประเภท Interval/Ratio Scale ที่มีการแจกแจงแบบปกติ และมีความแปรปรวนร่วมระหว่างตัวแปรเป็นไปในรูปเดียวกัน (Multivariate Normal Distributed with Equal Covariance Matrices) หรือ
                                2.2 เป็นตัวแปรเชิงคุณภาพ (Dichotomous/Categorical Variables)หรือ
                                2.3 เป็นตัวแปรเชิงปริมาณที่ไม่ต่อเนื่อง/หรือต่อเนื่อง (Discrete/Continuous) ที่มีลักษณะความสัมพันธ์เชิงเส้นตรงกับตัวแปรตาม (Linear Risk)
                                2.4 ตัวแปรอิสระต่างๆ ไม่มีความสัมพันธ์กับตัวแปรอิสระด้วยกันเอง (ไม่มี Multi-Colinearity)
                3. ขนาดตัวอย่างมีการกระจายในเซลล์ต่างๆ มีจำนวนมากกว่า 1 (non zero cell) เมื่อตัวแปรอิสระเป็นข้อมูลเชิงคุณภาพ
การทดสอบ Effect Modifier หรือ Interaction ด้วย Logistic Regression
                การทดสอบอิทธพลของตัวแปรกวนที่มีปฏิกิริยาร่วมกับปัจจัยที่สนใจทดสอบ (Exposure) เรียกว่าการทดสอบ Effect Modification เช่น ต้องการวิเคราะห์ Effect Modification หรือ Interaction ระหว่าง BP กับ SMOKING เป็นต้น มีขั้นตอนโดยการใส่ตัวแปรปัจจัยต่างๆ ที่ต้องการทดสอบและ Interaction
เทคนิคการวิเคราะห์ Survival Analysis
        การวิเคราะห์ Survival Analysisเป็นการวิเคราะห์ทางสถิติโดยนำข้อมูลที่ได้จากการศึกษาทางวิทยาการระบาดแบบโคฮอร์ต หรือแบบเชิงทดลองที่มีการบันทึกข้อมูลมีทั้งผลลัพธ์และเวลาการเกิดผลลัพธ์ (Time and Status) มีการวิเคราะห์ได้ 3 ลักษณะคือ พรรณนา เปรียบเทียบ และการหาค่าความเสี่ยง สิ่งที่ควรเข้าใจและทำการตกลงเบื้องต้นให้ชัดเจนก่อนคือ Status ซึ่งมี 2 ลักษณะคือ
                1. Event หมายถึง การเปลี่ยนแปลงลักษณะของผู้ป่วยหรือผู้ที่ศึกษา (Subject) ไปจากเดิม เช่น ในการศึกษาระยะเวลาการตายของผู้ป่วยด้วยมะเร็งปอด ถ้าพบว่า ผู้ป่วยรายใดตายในช่วงที่ทำการศึกษา ถือว่า ผู้ป่วยนั้นเกิด Event ในลักษณะเช่นเดียวกับการศึกษาประสิทธิผลของยาในการรักษาโรควัณโรค ตัวอย่างคือ ผู้ป่วยด้วยโรควัณโรคทุกราย ได้รับการรักษาด้วยยา A หรือ ยา B ถ้าผู้ป่วยรายใดหายป่วยด้วยโรควัณโรค ถือว่า ผู้ป่วยรายนั้นเกิด Event
                2.      Censored หมายถึง ผู้ป่วยที่ศึกษาไม่มีการเปลี่ยนแปลงลักษณะภายในช่วงการศึกษา (Status คงเดิม) ซึ่งแบ่งออกเป็นคือ Complete Censored คือ ผู้ป่วยไม่มีการเปลี่ยนแปลงภายในช่วงการศึกษา ผู้ป่วยที่อยู่ในระยะการศึกษาตลอดช่วง หรือถูกศึกษาจนถึงระยะเวลาสุดท้ายของการศึกษา และ Lost คือ ผู้ป่วยที่ทำการศึกษาออกไปจากการศึกษาเนื่องจาก ไม่ให้ความร่วมมือเมื่อทำการศึกษาไปได้ช่วงหนึ่ง หรือเกิดเหตุจำเป็นจำต้องหยุดการศึกษา เช่น ตายเนื่องจากสาเหตุอื่น การย้ายถิ่น เกิดเหตุการณ์การเปลี่ยนแปลงจนไม่ตรงตาม Inclusion Criteria เป็นต้น
                การวิเคราะห์ Survival Analysis เพื่อการพรรณนาสถานการณ์การรอดชีพหรือการตาย แต่ละขณะตั้งแต่เริ่มการศึกษา ค่าที่ใช้พรรณนาคือ อัตราการรอดชีพจนถึงเวลาใดๆ (Survival Rate; St) หรืออาจจะมีค่ามัธยฐานของการรอดชีพเมื่อ Survival Rate ณ เวลาสุดท้ายมีค่าต่ำกว่าร้อยละ 50 (Median Survival Time) และมีการนำเสนอด้วยกราฟ
 การวิเคราะห์หาความเสี่ยงของปัจจัย
                วัตถุประสงค์เพื่อวิเคราะห์ข้อมูลชนิด Survival โดยมีตัวแปรอิสระหลายตัว ซึ่งใน Model อาจประยุกต์ใช้กับการประเมินประสิทธิผลของ Treatment เปรียบเทียบกับ Baseline หรือ Placebo โดยใช้สถิติคำนวณ Hazard Ratio (HR) เป็นเทคนิคการวิเคราะห์เพื่อหาความสัมพันธ์ระหว่างตัวแปรอิสระหลายตัวกับตัวแปรตาม 1 ตัว (Multivariate Analysis) ซึ่งลักษณะตัวแปรตามเป็น Dichotomous (0/1) และมีระยะเวลาบ่งบอกการเกิด Outcome ซึ่งต่างจาก Logrank Test หรือ Kaplan Meier เพราะสถิติ Kaplan Meier เพื่อต้องการเปรียบเทียบ Survival ตั้งแต่ 2 กลุ่มขึ้นไป โดยไม่มีการวิเคราะห์หรือควบคุมปัจจัยอื่น
 เทคนิคการวิเคราะห์จากการศึกษาแบบทดลอง
           รูปแบบการศึกษาเชิงทดลองมีการสุ่มเพื่อกำหนดสิ่งทดลองลงไปยังผู้เข้าร่วมการศึกษา (Random Allocation) ดังนั้นทั้งกลุ่มทดลองและกลุ่มเปรียบเทียบจะมีลักษณะคล้ายคลึงกันสามารถวิเคราะห์ด้วยสถิติทดสอบความสัมพันธ์อย่างหยาบ (Crude Association) ยกเว้น การศึกษารูปแบบกึ่งทดลองที่อาจมีลักษณะบางอย่างแตกต่างกัน จึงจำเป็นต้องมีการควบคุมอิทธิพลของปัจจัยกวนเหล่านั้น โดยใช้สถิติทดสอบตัวแปรเชิงซ้อน (Multivariate Analysis) แต่ผลลัพธ์ (Outcome) ที่ผู้วิจัยมี 2 แบบคือ ผลลัพธ์ที่เป็นเชิงคุณภาพ เช่น เกิด/ไม่เกิด หาย/ไม่หาย ตาย/ไม่ตาย เป็นต้น และผลลัพธ์ที่เป็นเชิงปริมาณ เช่น ปริมาณน้ำตาลในเลือด ความดันโลหิตแบบ Systolic Blood Pressure เป็นต้น  สถิติที่ใช้ในการวิเคราะห์มีดังนี้
            1. สถิติทดสอบค่าความเสี่ยงสัมพัทธ์ (Relative Risk)
                การวิเคราะห์เช่นเดียวกับโคฮอร์ต มีการวิเคราะห์อย่างหยาบ จะใช้ Crude RR และควบคุมตัวแปรกวนจะใช้ Adjusted OR จาก Multiple Logistic Regression เพราะถือว่า ค่า Adjusted OR มีค่าประมาณของ Relative Risk ที่น่าเชื่อถือที่สุด
            2. สถิติทดสอบ Survival Analysis
                การวิเคราะห์เปรียบเทียบใช้ Logrank ทดสอบและใช้ Cox’s Proportional Hazard Model ในการวิเคราะห์หาค่าความเสี่ยง (Hazard Ratio; HR)
             3. สถิติทดสอบตัวแปรผลลัพธ์ที่เป็นเชิงปริมาณ
                ถ้ามีการ Random Allocation ทำให้ทั้ง 2 กลุ่ม (ทดลองและกลุ่มเปรียบเทียบ) มีลักษณะคล้ายคลึงกันใช้สถิติ Student t-Test เพื่อทดสอบค่าเฉลี่ย 2 กลุ่ม สำหรับตัวแปรตาม (Y) มีการแจกแจงแบบปกติ (Normal Distribution) หรือสถิติ Mann Whitney U-test สำหรับการแจกแจงของตัวแปร (Y) ไม่เป็นแบบปกติ (Non-Normal Distribution)
                แต่ถ้ามีการแบ่งกลุ่มทดลองและกลุ่มเปรียบเทียบมีจำนวนกลุ่มตั้งแต่ 3 กลุ่มขึ้นไป สถิติที่ต้องการเปรียบเทียบค่าของผลลัพธ์จะใช้สถิติการวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA) เมื่อการแจกแจงของตัวแปรผลลัพธ์เป็นแบบปกติ และความแปรปรวนทุกกลุ่มเท่ากัน (Homogeneity of Variance) หรือใช้สถิติ Kruskal Walis Test สำหรับการแจกแจงของตัวแปรผลลัพธ์ไม่เป็นแบบปกติ
                กรณีที่มีการทดลองเพียงกลุ่มเดียวแต่เป็นการเปรียบเทียบค่าผลลัพธ์ระหว่างก่อนให้การทดลองและผลลัพธ์ที่เกิดขึ้นหลังจากการทดลอง (Pre-Test & Post-Test Design) กรณีที่ความแตกต่างระหว่างค่าของผลลัพธ์ทั้ง Pre-Test และ Post-Test มีการแจกแจงแบบปกติ ใช้สถิติทดสอบคือ Paired t-Test แต่ถ้าการแจกแจงของตัวแปรดังกล่าวไม่เป็นแบบปกติ ใช้สถิติทดสอบ Wilcoxon Sign Rank Test
                ถ้าไม่มีการ Random Allocation ทำให้ทั้ง 2 กลุ่มมีลักษณะ (ปัจจัย) บางอย่างแตกต่างกัน ปัจจัยนั้นอาจมีผลต่อผลลัพธ์ การวิเคราะห์ต้องควบคุมอิทธิพล โดยการใช้สถิติตัวแปรเชิงซ้อน เช่น Two-Way ANOVA, ANCOVA เป็นต้น แต่สถิติดังกล่าวเหล่านี้ต้องการแจกแจงข้อมูลแบบปกติ
                ถ้าการทดลองมีการติดตามและบันทึกค่าผลลัพธ์ตั้งแต่ 3 ครั้งขึ้นไป ทั้งกลุ่มทดลองและเปรียบเทียบ สถิติที่ใช้ในการทดสอบที่เหมาะสมในการทดสอบสมมติฐานว่าง (Ho) มีอย่างน้อย 2 วัตถุประสงค์คือ การเปรียบเทียบค่าผลลัพธ์แต่ละครั้ง และเปรียบเทียบผลลัพธ์ระหว่างกลุ่มทดลองและกลุ่มเปรียบเทียบ อาจมีการทดสอบสมมติฐานเกี่ยวกับปฏิกิริยาร่วมระหว่างกลุ่มและครั้งของการประเมิน (Interaction)

ไม่มีความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็น