Big Data คือข้อมูลที่มีปริมาณมาก มีความหลากหลาย และมีขนาดเพิ่มขึ้นอย่างรวดเร็ว ส่วน Data science คือกระบวนการหาองค์ความรู้ใหม่จากข้อมูลมหาศาล เพื่อใช้ข้อมูลให้เกิดประโยชน์และสร้างมูลค่าต่อธุรกิจหรือองค์กร โดยต้องมีผู้เชี่ยวชาญที่สามารถจัดการนำข้อมูลที่มีมาวิเคราะห์อย่างมีประสิทธิภาพ เช่น นักวิทยาศาสตร์ข้อมูล(Data Scientist) คือคนที่นำข้อมูลมาวิเคราะห์เพื่อหาความรู้ใหม่จากข้อมูล และนอกจากตำแหน่งนี้ยังจำเป็นต้องมีคนในตำแหน่งอื่นร่วมด้วย จึงจะสามารถนำข้อมูลมาใช้งานได้อย่างมีประสิทธิภาพและเกิดประโยชน์สูงที่สุด Show
Big Data คืออะไร
ระดับของข้อมูลและการนำมาใช้ประโยชน์https://en.wikipedia.org/wiki/DIKW_pyramid
Machine Learning vs Deep Learning vs AIสามสิ่งนี้คือข้อมูลที่อยู่ในระดับของ Wisdom คือการนำข้อมูลที่มีในอดีตมาช่วยในการคิดและทำนายสิ่งที่ยังไม่ได้เกิดขึ้นจริง โดยแบ่งเป็นดังนี้
AI มีการแบ่งเป็น 4 ระดับ
การยกระดับข้อมูลให้มีประโยชน์มากขึ้นหลายองค์กรเมื่อได้ยินคำว่า Big Data, Data Science, Machine Learning, Deep Learning, AI ก็อยากจะให้องค์กรมีสิ่งเหล่านี้มาใช้งานทันที โดยไม่เข้าใจว่าการจะสร้างสิ่งเหล่านี้ต้องนำข้อมูลมาวิเคราะห์ในระดับพื้นฐานให้ได้ก่อน จากนั้นจึงนำมาต่อยอดเพิ่มขึ้น เป็นการค่อยๆยกระดับข้อมูลให้สูงขึ้นจนสุดท้ายปลายทางถึงจะกลายเป็น Machine Learning หรือ AI ในที่สุด https://slideplayer.com/slide/2419930/
ที่ผ่านมาการนำข้อมูลมาใช้งาน สามารถทำได้แค่การวิเคราะห์และคำนวณทางสถิติเพื่อเข้าใจสิ่งที่เกิดขึ้นในอดีตและเหตุผลที่สิ่งต่างๆเกิดขึ้น แต่ในปัจจุบันด้วยปริมาณข้อมูลที่มากขึ้น เทคโนโลยีที่ใหม่ขึ้น ความรู้และกระบวนการแบบใหม่ ทำให้สามารถนำข้อมูลมาใช้ทำนายสิ่งที่ยังไม่เกิดขึ้นได้อย่างแม่นยำ ในระดับที่สามารถนำผลการทำนายไปใช้งานต่อได้อย่างมีประสิทธิภาพ การดึงประสิทธิภาพของข้อมูลออกมา จำเป็นต้องมีกลุ่มคนที่มีความรู้เฉพาะทางในด้านต่างๆ เพื่อช่วยกันจัดการและดึงประสิทธิภาพของข้อมูลที่มีออกมาใช้ประโยชน์ให้ได้มากที่สุด ตำแหน่งที่สำคัญในทีมจัดการข้อมูลhttps://www.digitalsource.io/news/job-opportunities-data-engineer-vs-data-scientist/39813/
การสร้างระบบเพื่อใช้ในการจัดการข้อมูลFull Stack Big Data Processing
การนำข้อมูลมาใช้แม้ยังไม่มีระบบจัดการข้อมูลจากขั้นตอนการสร้างระบบเพื่อใช้ในการจัดการข้อมูลข้างบน สังเกตได้ว่าต้องสร้างสิ่งต่างๆขึ้นมาใหม่เยอะมาก กว่าจะได้นำข้อมูลมาวิเคราะห์ก็ต้องรอให้สร้างระบบเสร็จ ซึ่งในความเป็นจริงไม่มีองค์กรใดสามารถรอได้ เพราะจะสูญเสียโอกาสทางธุรกิจไปมาก ในช่วงที่กำลังสร้างระบบจึงมีการทำงานแบบคู่ขนาน คือ Data scientist จะทำการวิเคราะห์ข้อมูล ไปพร้อมๆกับที่ Data engineer กำลังการสร้างระบบจัดการข้อมูล
ตำแหน่งหน้าที่ในทีมจัดการข้อมูลStakeholder
Project Manager
อ่านเพิ่มเติมเกี่ยวกับแนวคิดการทำงานแบบอไจล์(Agile) ได้ที่ Data Engineer
อ่านเพิ่มเติมเกี่ยวกับ Data Engineer ได้ที่ Data Analyst / BI
Data Scientist
อ่านเพิ่มเติมเกี่ยวกับ Data Scientist ได้ที่ Machine Learning Engineer
Software Developer / AI Engineer
ตัวอย่างประโยชน์จากการนำข้อมูลมาใช้งาน
สกรัม (Scrum)การดำเนินงานของโปรเจ็กต์เกี่ยวกับข้อมูลจะมีระยะเวลาค่อนข้างยาว หากรอจนเสร็จแล้วค่อยนำไปใช้จะต้องรอนานและเสียโอกาสทางธุรกิจได้ สามารถนำวิธีการทำงานแบบสกรัมเข้ามาช่วยเพื่อให้ได้ของออกไปใช้งานได้เร็ว คือในเวอร์ชันแรกๆของนั้นอาจจะยังไม่ได้ดีมาก แต่ในเวอร์ชันถัดๆไปจะพัฒนาขึ้นเรื่อยๆ สามารถเข้าไปอ่านเพิ่มเติมเกี่ยวกับสกรัมได้ที่ |