ตอนที่ 3
ตัวอย่างการใช้กระบวนการวิทยาการข้อมูล
บทที่ 1
ตอนที่ 2
กระบวนการวิทยาการข้อมูล
บทที่ 1
ตอนที่ 1
ความหมายของวิทยาการข้อมูล
บทที่ 1
เกมเป่ายิงฉุบ
บทที่ 1
บทที่ 1
ตอนที่ 4 การตั้งคำถาม
บทที่ 1
สรุปกระบวนการทางวิทยาการข้อมูล
ผู้เขียนกำลังสนใจในเรื่องของการวิเคราะห์ข้อมูล แล้วเจอคอร์สสอนออนไลน์ ของมหาวิทยาลัยแห่งหนึ่ง เลยสนใจจะนำมาสรุปหัวข้อและคำค้นหาต่างๆที่จะสามารถนำไปค้นคว้าหาข้อมูลต่อไปได้
ซึ่งหัวข้อที่สำคัญๆ จะได้แก่
Cloud System
Image Detection
Pattern Recognition
Data Collection
Data Munging
Data Visualization
Exploratory Data Analysis
ซึ่ง เป็น Keywork ที่เกี่ยวข้องกับกระบวนการทาง Data Science ทั้งสิ้น ทั้งนี้ผู้เขียนจะขอสรุปเนื้อหาทั้ง 5 ขั้นตอนของกระบวนวิทยาการข้อมูล ไว้ในด้านล่างนี้ด้วย
กระบวนการทางวิทยาการข้อมูล
ในกระบวนการทางวิทยาการข้อมูลจะประกอบไปด้วย 5 ส่วนหลักๆ ได้แก่
1. การมองภาพใหญ่และการตั้งคำถาม
2. มองหาข้อมูลที่เกี่ยวข้องในการนำเข้าข้อมูล
3. เตรียมข้อมูลและทำการวิเคราะห์ข้อมูล
4. สร้างแบบจำลอง ปรับปรุงและประเมินผล
5. นำไปใช้งาน และการสื่อสารผลลัพท์
ขั้นตอนที่ 1 มองภาพใหญ่และตั้งคำถาม
- ศึกษาเป้าประสงค์ ของธุรกิจที่ทำ
- องค์กรต้องการตอบโจทย์ด้านใดหรือแก้ปัญหาใด
- กำหนดปัญหาที่น่าสนใจที่ต้องการใช้วิทยาการข้อมูลประยุกต์
- Solution ปัจจุบันเป็นอย่างไร
- ตั้งขอบเขตของปัญหา
- ความสำเร็จของโครงการวัดจากตัวชี้วัดใด
- วิเคราะห์ความเป็นไปได้และความคุ้มทุนของโครงการ
ขั้นตอนที่ 2 มองหาข้อมูลที่เกี่ยวข้องในการนำเข้าข้อมูล
- ระบุข้อมูลที่เหมาะสมกับโครงการ
- ศึกษาโครงการใกล้เคียงและ Solution เพื่อแนะแนวข้อมูลที่เหมาะสม
- ค่าใช้จ่ายในการได้ข้อมูลมา
- ออกแบบแนวทางการเก็บข้อมูล
- ดึงคุณลักษณะที่ต้องการจากข้อมูล
- การได้มาซึ่งข้อมูลมีประเด็นด้านจริยธรรมใดๆหรือไม่
- นำเข้าข้อมูลจากแหล่งข้อมูลต่างๆ
ขั้นตอนที่ 3 เตรียมข้อมูลและทำการวิเคราะห์ข้อมูล
- เตรียมข้อมูลให้เหมาะสมกับการนำมาใช้
- วิเคราะห์ข้อมูลเชิงสำรวจ
- - สร้างมโนภาพ
- - หาคำตอบทางสถิติ
- - หาความสัมพันธ์
- ทำความสะอาดข้อมูล
- แปลงข้อมูลให้อ่านง่าย
- จัดการ outlier
ขั้นตอนที่ 4 สร้างแบบจำลอง ปรับปรุงประเมินผล
- เลือกเทคนิคหรืออัลกอริทึมที่เหมาะสม
- สร้าง Baseline เพื่อเปรียบเทียบ
- สร้างแบบจำลอง หลายๆแบบจำลอง
- จูนพารามิเตอร์ที่เหมาะสมและเลือกแบบจำลองที่ดีที่สุด
- ปรับปรุงแบบจำลอง
- ประเมินผล
ขั้นตอนที่ 5 นำไปใช้งาน และการสื่อสารผลลัพท์
- รายงานและสื่อสารผลลัพท์
- ทดสอบและนำไปใช้งาน
- คอยติดตามเพื่อหาข้อมูลผิดพลาดและแนวทางปรับปรุง
สามารถอ่านเนื้อหาเพิ่มได้ที่
สรุปหน้าที่ของนักวิทยาศาสตร์ข้อมูลและกระบวนการทางวิทยาการข้อมูล
สรุปการคิดเชิงวิพากษ์ หรือ critical thinking
8 ทักษะที่จำเป็นงานด้าน AI Engineer
ฝากกดโฆษณา Google Ads สัก click เพื่อเป็นกำลังใจแก่ผู้เขียนด้วยนะครับ
วิดีโอ YouTube
กระบวนการวิทยาการข้อมูล (data science process)
การเพิ่มข้อมูลค่าให้กับผลิตภัณฑ์หรือให้บริการด้วยข้อมูลนั้น บริการแล้วมูลนั้น นอกจากจะต้องมีความเข้าใจเกี่ยวกัผลิตภัณฑ์หรือบริการแล้ว ยังต้องเข้าใจกิจกรรมต่างๆ ที่เกี่ยวกับการจัดหาและประมวลผลข้อมูลอีกด้วย เนื่องจากกิจกรรมที่ต้องทำค่อนข้างหลากหลาย เพื่อไม่ให้สับสนหรือพลาดประเด็นใดไป สามารถดำเนินตามกระบวนการของ วิทยาการข้อมูลขั้นตอนสำคัญต่างๆที่ประกอบด้วย การตั้งคำถาม การเก็บข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพสู่ผู้ใช้กลุ่มเป้าหมาย
ขั้นตอนกระบวนการวิทยาการข้อมูล
ขั้นที่ 1 การตั้งคำถาม (ask an interesting question)
ตั้งคำถามที่ตนเองสนใจ
ขั้นที่ 2 การรวบรวมข้อมูล (get the data)
ต้องคำนึงถึงจะเก็บข้อมูลเรื่ออะไร จากที่ไหน จำนวนเท่าใดเพื่อให้ได้ข้อมูลนำเข้าที่ดี ไปสู่ผลลัพธ์ที่ดี
ขั้นที่ 3 การสำรวจข้อมูล (explore the data)
ขั้นตอนนี้เราต้องรวบรวมข้อมูลแล้วนำข้อมูลไปplotทำให้เป็นภาพหรือแผนภูมิเพื่อให้เข้าใจความหมายที่ซ่อนอยู่ในข้อมูล
ขั้นที่ 4 การวิเคราะห์ข้อมูล (annalyze the data)
เพื่ออธิบายความหมาย ความสัมพันธ์ของข้อมูลและทำนายเหตุการณ์ที่จะเกิดในอนาคต
ขั้นที่ 5 การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ (communicate and visualize the results)
เป็นการสื่อสารผลลัพธ์ของข้อมูล โดยการถ่ายทอดเป็นเรื่องราวหรือเป็นภาพให้ผู้อื่นเข้าใจว่าเราได้เรียนรู้อะไรจากข้อมูล
วิดีโอสรุป กระบวนการวิทยาการข้อมูล