สถิติในการวิเคราะห์ข้อมูล มีอะไรบ้าง

การวิเคราะห์ข้อมูล (Analysis) เป็นการจัดระเบียบแยกแยะส่วนต่าง ๆ ของหลักฐาน หรือข้อมูลที่ได้ออกเป็นหมวดหมู่ เพื่อหาคำตอบตามความมุ่งหมาย และตามสมมติฐานที่ได้กำหนดไว้ การวิเคราะห์ข้อมูลนี้เป็นขั้นการทำงานที่ต่อเนื่องมาจากการวัด การนับ และจัดเรียงลำดับข้อมูล ส่วนใหญ่เป็นเรื่องเกี่ยวกับการนำเอาวิธีการทางสถิติมาวิเคราะห์หาค่าตัวแปรหรือหาลักษณะของตัวแปร ผู้วิจัยจะต้องวางแผนและเตรียมการณ์ล่วงหน้าตั้งแต่เริ่มทำการวิจัยโดยมีข้อแนะนำในการวิเคราะห์ดังนี้

1. กลับไปอ่านจุดมุ่งหมายหรือข้อความที่เป็นปัญหาจนแจ่มแจ้งก่อน

2. ดูแต่ละหัวข้อปัญหาว่าต้องการข้อมูลประเภทใด และจะใช้วิธีการสถิติอะไร

3. สถิติเหล่านั้นหาได้หรือไม่จากข้อมูล เพื่อไปแก้ปัญหาจากจุดมุ่งหมายแต่ละข้อ

4. เลือกข้อมูลที่ได้มา นำมาจัดเป็นหมวดหมู่ แบ่งตามเนื้อหาของปัญหาแต่ละข้อ

5. คำนวณค่าสถิติให้ตรงตามหัวข้อปัญหาที่จะตอบ

6. พยายามแปลความหมายของข้อมูลเป็นระยะ ๆ ไป

7. พยายามนึกถึงรูปร่างของตารางที่จะเสนอ ลักษณะควรย่อ สั้น แต่บรรยายความได้มาก

8. ถ้าข้อมูลจัดเสนอเป็นกราฟชนิดต่าง ๆ ก็ต้องหาวิธีการทำให้เข้าใจได้ง่ายที่สุด อย่าให้ซับซ้อน    

          อย่างไรก็ตาม การวิเคราะห์ข้อมูลใด ๆ มักไม่พ้นการใช้วิธีการทางสถิติ  ดังนั้น ในการวิเคราะห์ข้อมูล ควรมีขั้นตอนในการดำเนินการ ดังนี้

ขั้นตอนในการวิเคราะห์ข้อมูล

            1. จัดหรือแยกประเภทข้อมูลที่จะศึกษาออกเป็นหมวดหมู่ เพื่อสะดวกและง่ายต่อการที่จะนำไปวิเคราะห์ต่อไป รวบรวมและจดบันทึกข้อมูลลงในกระดาษที่ได้เตรียมไว้

2. ทำการวิเคราะห์ข้อมูลโดยเลือกใช้เทคนิคต่าง ๆ ให้เหมาะสมกับลักษณะของข้อมูลและระดับของข้อมูลที่นำมาศึกษาและสามารถตอบคำถามตามจุดมุ่งหมายการวิจัยที่ตั้งไว้

3. เสนอผลการวิเคราะห์ที่ได้ โดยพยายามเสนอให้มีความแจ่มชัดและเข้าใจง่าย ซึ่งนิยมเสนอในรูปตารางหรือแผนภูมิ

4. สถิติที่ใช้ในการวิเคราะห์ข้อมูล เป้าหมายหลักในการดำเนินการวิจัย คือ การศึกษาหาข้อสรุปเกี่ยวกับคุณลักษณะของประชากร การที่จะบรรลุเป้าหมายนี้ได้ โดยหลักการควรศึกษาและวิเคราะห์ข้อมูลที่ได้จากประชากร แต่เป็นการยากมากหรือในบางครั้งอาจเป็นไปไม่ได้ตามหลักการดังกล่าว ในทางปฏิบัติงานวิจัย จึงใช้วิธีการศึกษาและวิเคราะห์ข้อมูลที่ได้จากกลุ่มตัวอย่าง ซึ่งทำหน้าที่เป็นตัวแทนของประชากรนั้น ๆ การวิเคราะห์ข้อมูลจากกลุ่มตัวอย่างจึงเป็นการหาค่าคุณลักษณะประจำกลุ่มตัวอย่างนั้น แล้วจึงใช้ค่าสถิติของกลุ่มตัวอย่างไปประมาณค่าคุณลักษณะของประชากร โดยการทดสอบสมมติฐานและการสรุปอ้างอิง 

    โดยปกติในการวิจัย ผู้วิจัยจะออกแบบการวิจัยโดยกำหนดตัวแปรไว้ตั้งแต่ก่อนการเก็บรวบรวมข้อมูลแต่ถ้าเป็นข้อมูลที่มีการรวบรวมเพื่อประมวลผลเพื่อวัตถุประสงค์ใดประสงค์หนึ่งอาจไม่ได้กำหนดตัวแปรไว้ล่วงหน้าก็ได้ ดังนั้นเมื่อมีการเก็บรวบรวมข้อมูลแล้ว จะต้องกำหนดตัวแปรหรือค่ารหัสของตัวแปร การกำหนดชื่อตัวแปรนั้นจะต้องกำหนดทั้งข้อมูลที่เป็นเชิงคุณภาพและเชิงปริมาณ ส่วนการให้ค่ารหัสนั้นมักจะใช้กับตัวแปรเชิงคุณภาพ เช่น เพศ อาชีพ ศาสนา วุฒิการศึกษา เป็นต้น ส่วนตัวแปรเชิงปริมาณก็ใช้ค่าที่ได้จากการเก็บรวบข้อมูลจริง เช่น อายุ ก็จะใส่ค่ารหัส ตามอายุจริงที่ได้จากการเก็บรวบรวมข้อมูลมา ยกเว้น แต่มีการกำหนดช่วงอายุหรือจัดกลุ่มอายุไว้ตั้งแต่ก่อนการเก็บข้อมูล ในลักษณะอย่างนี้จำเป็นต้องกำหนดค่ารหัสเช่นกัน

1. สถิติพรรณนา (Descriptive statistics) เป็นสถิติที่ใช้ในการสรุปข้อมูลที่ได้มาจากกลุ่มตัวอย่าง โดยไม่มีการอ้างอิงไปยังประชากร แต่เป็นการบรรยายลักษณะข้อมูลเท่านั้น เช่น การแจกแจงความถี่ (frequency distribution) การวัดแนวโน้มเข้าสู้ส่วนกลาง การวัดการกระจายของข้อมูล ฯลฯ การนำเสนอผลการวิเคราะห์ข้อมูลพรรณนาจะอยู่ในรูปตาราง (table) และแผนภูมิ (Chart) ชนิดต่างๆ

2. สถิติอ้างอิง (Inferential statistics) หรือสถิติอนุมาน เป็นสถิติที่ใช้เพื่อนำผลสรุปที่คำนวณได้จากการสุ่มตัวอย่าง ไปอธิบายหรือสรุปลักษณะของประชากรทั้งหมด วิธีที่ใช้ในการสรุปอ้างอิงไปยังกลุ่มประชากรนั้น คือ การประมาณค่า (Estimation) และการทดสอบสมมติฐาน (Hypothesis testing) การวิเคราะห์ความแปรปรวน (analysis of variance) การวิเคราะห์ความถดถอยและสหสัมพันธ์ (regression and correlation analysis)

สถิติอ้างอิงจำแนกเป็น 2 ชนิดคือ

แบบอ้างอิงพารามิเตอร์ (Parametric statistics) (ทดสอบสมมุติฐานโดยใช้สถิติ t-test, z-test, ANOVA, regression analysis ตัวแปรที่ต้องการวัดเป็น interval scale กลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ กลุ่มประชากรจะต้องมีความแปรปรวนเท่ากัน)

และแบบไม่อ้างอิงพารามิเตอร์ (Nonparametric statistics) (ใช้สถิติ chi-square, medium test, sign test กลุ่มตัวอย่างเป็น free distribution เป็นกลุ่มตัวอย่างขนาดเล็ก ไม่ทราบลักษณะการแจกแจงของประชากรที่สนใจจะศึกษา)

พารามิเตอร์ หมายถึง ค่าที่ใช้อธิบายคุณลักษณะประชากร (Population) เช่น ค่าเฉลี่ยของประชากร (population mean)

ค่าสถิติ หมายถึง ค่าที่ได้จากตัวอย่าง (sample) เช่น ค่าเฉลี่ยของตัวอย่าง (sample mean)

ลักษณะข้อมูลที่ใช้ในงานวิจัย

– ข้อมูลเชิงปริมาณ แบ่งเป็นข้อมูลต่อเนื่อง (continuous data) คือค่าที่มีจุดทศนิยมได้ และข้อมูลไม่ต่อเนื่อง (discrete data) คือค่าที่เป็นจำนวนเต็มหรือจำนวนนับ

– ข้อมูลเชิงคุณภาพ เป็นข้อมูลที่แสดงถึงสถานภาพ คุณลักษณะ หรือคุณสมบัติ เช่น เพศ ตำแหน่งหรือจำแนกตัวแปรตามระดับการวัด ได้แก่

– นามบัญญัติ (nominal scale) จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม เช่น 1=ชาย 2=หญิง ตัวเลขไม่สามารถนำมาบวก ลบ คูณ หาร ได้

– เรียงอันดับ (ordinal scale) ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด เช่น ระดับการศึกษา ผลการเรียน ความเก่ง ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้ เช่น ไม่สามารถบอกได้ว่าเก่งกว่ากันเท่าไหร่ ตัวเลขสามารถนำมาบวกหรือลบกันได้

– อันตรภาค หรือระดับช่วง (interval scale) กำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่าๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะไม่มีศูนย์ที่แท้จริง เช่น คะแนนสอบ อุณหภูมิ (อุณหภูมิ 0 องศา มิได้หมายความว่าจะไม่มีความร้อน) ตัวเลขสามารถนำมาบวก ลบ คูณ หรือหารกันได้

– อัตราส่วน (ratio scale) สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มีศูนย์แท้ เช่น น้ำหนัก ความสูง อายุ สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ (เช่น ถนน 50 กิโลเมตร ยาวเป็น 2 เท่าของถนน 25 กิโลเมตร)

หรือจำแนกตามหน้าที่ ได้แก่ ตัวแปรอิสระ (ตัวแปรต้น) และตัวแปรตาม ซึ่งเป็นตัวแปรที่ต้องการศึกษา นอกจากนั้นอาจมีตัวแปรที่ไม่ได้ต้องการศึกษาแต่ต้องควบคุม เช่น ตัวแปรภายนอก (ตัวแปรเกิน หรือตัวแปรแทรกซ้อน) และตัวแปรเชื่อมโยง (ตัวแปรสอดแทรก)

สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงปริมาณ

– การแจกแจงข้อมูล ความถี่ (Frequency distribution) ร้อยละ (percentage)

– วัดแนวโน้มเข้าสู่ส่วนกลาง ได้แก่ ค่าเฉลี่ย (mean) นำข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจำนวนข้อมูล / มัธยฐาน (median) เป็นสถิติในการจัดอันดับข้อมูล เป็นค่าที่อยู่ตรงกลาง เมื่อนำค่าที่ได้จากการวัดที่นำมาเรียงลำดับจากมากไปน้อย หรือน้อยไปมาก / ฐานนิยม (mode) หรือคะแนนที่มีความถี่สูงที่สุด

– บอกตำแหน่งของข้อมูล ได้แก่ เปอร์เซ็นต์ไทล์ (percentile) เดไซล์ (decide) ควอไทล์ (quartile)

– วัดการกระจายของข้อมูล ได้แก่ พิสัย (range) หรือค่าสูงสุด-ค่าต่ำสุด ส่วนเบี่ยงเบนควอไทล์ (quartile deviation) ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ความแปรปรวนของข้อมูล (variance)

สถิติพื้นฐานที่ใช้ในการวิเคราะห์ข้อมูลทางสถิติมีอะไรบ้าง

สถิติพื้นฐานที่ใช้ในการวิจัยสามารถแบ่งออกได้เป็น 2 ประเภทใหญ่ คือสถิติส าหรับใช้บรรยาย (descriptive statistics) ซึ่งใช้สาหรับบรรยายลักษณะของตัวอย่างหรือประชากร และสถิติส าหรับใช้อนุมาน (inferential statistics) ซึ่ง ใช้ส าหรับประเมินโอกาสที่กลุ่มตัวอย่างจะแตกต่างหรือไม่แตกต่างจากประชากร การใช้สถิติถูกประเภท และใช้อย่าง ...

สถิติที่ใช้ในการวิเคราะห์ข้อมูลวิจัย มีอะไรบ้าง

ได้แก่ ร้อยละ (percentage) สัดส่วน (proportion) อัตราส่วน (ratio) ฐานนิยม (mode) สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณ – สัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน (Pearson's Correlation Coefficient) – สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน (Spearman's correlation coefficient)

การวิเคราะห์ข้อมูลทางสถิติมีกี่ขั้นตอน

ระเบียบวิธีทางสถิติแบ่งออกเป็น 4 ขั้นตอน คือ การเก็บและรวบรวมข้อมูล (collection of data) การนำเสนอข้อมูล (presentation of data) การวิเคราะห์ข้อมูล (analysis of data) และการตีความหมาย หรือหาข้อสรุปของข้อมูล (interpretation of data) ซึ่งมีรายละเอียดดังต่อไปนี้

การวิเคราะห์ข้อมูลใช้สถิติใด

สถิติเชิงวิเคราะห์เป็นวิธีการตรวจสอบสมมุติฐานของการวิจัย โดยมากแล้วจะเป็นการทดสอบว่า ตัว แปรตั้งแต่สองตัวขึ้นไป มีความแตกต่าง สัมพันธ์กัน หรือเกี่ยวข้องกันหรือไม่กรณีที่มีตัวแปรตัวเดียวก็มักจะ เป็นการทดสอบว่า ค่าตัวแปรที่ได้จากการวิจัยแตกต่างจากตัวเลขที่กาหนดไว้ก่อนหรือไม่เช่น บริษัทยาอาจจะ อ้างว่า วัคซีนของบริษัท ...