Show ขั้นตอนวิทยาการข้อมูล มีกี่ขั้นตอน อะไรบ้างองค์กรต้องการตอบโจทย์ด้านใดหรือแก้ปัญหาใด กำหนดปัญหาที่น่าสนใจที่ต้องการใช้วิทยาการข้อมูลประยุกต์ Solution ปัจจุบันเป็นอย่างไร ตั้งขอบเขตของปัญหา. เตรียมข้อมูลให้เหมาะสมกับการนำมาใช้. วิเคราะห์ข้อมูลเชิงสำรวจ. - สร้างมโนภาพ. - หาคำตอบทางสถิติ. - หาความสัมพันธ์. ทำความสะอาดข้อมูล. แปลงข้อมูลให้อ่านง่าย. จัดการ outlier.. กระบวนการ Data Science ขั้นตอนใดสำคัญที่สุดบางครั้ง (จริง ๆ คือแทบทุกครั้ง) เราต้องนำข้อมูลมาผ่านการแปรรูปให้นำมาใช้ต่อได้ง่าย หรือเราเรียกขั้นตอนนี้ว่า “การทำความสะอาดข้อมูล” หรือ Data Wrangling / Data Cleaning นั่นเอง ซึ่งขั้นตอนนี้กินเวลาเยอะที่สุดในการทำ Data Science เลยก็ว่าได้ครับ
Garbage in garbage out อยู่ในขั้นตอนใดข้อมูลเป็นสิ่งที่มีมูลค่ามหาศาลในปัจจุบัน จึงมีการนำข้อมูลมาวิเคราะห์หรือประมวลผลให้เกิดประโยชน์กับบุคคล หรือองค์กร แต่การได้มาซึ่งข้อมูลที่เป็นประโยชน์นั้น กระบวนการในการเก็บรวบรวมข้อมูล นับว่าเป็นสิ่งสำคัญ ดังประโยคที่ว่า garbage in garbage out ซึ่งได้กล่าวไว้ในขั้นตอนของกระบวนการวิทยาการข้อมูล สำหรับขั้นตอนของการ ...
ข้อใดเป็นกระบวนการทำงานของนักวิทยาศาสตร์ข้อมูลกระบวนการทำงานของอาชีพ Data Scientist คือ ตั้งสมมติฐาน → ค้นคว้าหาข้อมูล → วิเคราะห์ข้อมูล → สร้างแบบจำลอง → สื่อสารผลลัพธ์ ทักษะที่จำเป็น Data Scientist คืออาชีพที่บูรณาการองค์ความรู้หลายด้าน ทั้งทักษะทางตรง (Hard skill) และ ทักษะทางอ้อม (Soft skill) ประกอบไปด้วย
|