13 ใบความรู้ท่ี 2.1 เรอื่ ง ขอ้ มูล หน่วยการเรียนรูท้ ี่ 2 เทคโนโลยกี ารจดั การข้อมูล วิชา วทิ ยาการคำนวณ 2 รหัสวชิ า ว32183 ชนั้ มัธยมศกึ ษาปที ่ี 5 ครผู สู้ อน นายวรรณชนะ ปรากฏผล โรงเรียนเทพศิรินทร์คลองสบิ สาม ปทมุ ธานี มาตรฐาน ว.4.2 ตัวชว้ี ัด ม.5/1 รวบรวม วิเคราะหข์ อ้ มูล และใช้ความรู้ ด้านวิทยาการคอมพิวเตอร์ ขอ้ มูล มนุษย์กับมนษุ ย์ มนษุ ย์กับคอมพวิ เตอร์ หรอื มนุษยอ์ ับอินเทอรเ์ น็ต โดยการสอื่ สารเหลา่ น้นี ำมาซ่งึ การเกิด ข้อมูล (Data/Raw Data) หมายถึง ข้อเทจ็ จริงหรอื เหตกุ ารณ์ท่ีเก่ียวข้องกับส่งิ ต่าง ๆ ท่ี มีการจัดเก็บ ตวั อยา่ งขอ้ มูลแตล่ ะประเภท ขอ้ มลู ตวั อกั ษร เปน็ ข้อมลู ท่ปี ระกอบไปด้วยตวั อักษรภาษาไทย ภาษาดา่ งประเทศ หรอื ตัวเลขทไ่ี ม่สามารถนำมาคำนวณทาง คณิตศาสตรไ์ ด้ เช่น • ช่อื -นามสกลุ ของนักเรยี น • รหสั นักเรยี น • ที่อยขู่ องนกั เรยี น • ขอ้ ความการสนทนาออนไลน์ • ข้อมูลสถานทท่ี ่องเทย่ี วในอำเภอของนักเรยี น ข้อมลู ตวั เลข เป็นขอ้ มลู ทป่ี ระกอบดว้ ยตวั เลข 0-9 สามารถนำ มาใช้ในกาคำนวณ ข้อมลู ภาพ เปน็ ขอ้ มลู ทมี่ ีลักษณะเป็นภาพตา่ ง ๆ ท่ีมองเหน็ เชน่ 14 ข้อมลู ภาพเคลอื่ นไหว ข้อมูลเสึยง หรอื วีดทิ ศั น์ เปน็ ขอ้ มลู ที่ มลี ักษณะเปน็ ภาพเคล่อื นไหว หรือข้อมลู ท่เี กดิ จากการไดย้ นิ ไมว่ า่ จะเปน็ เสยี งทเี่ กดิ ข้ึนตาม • เสยี งรอ้ งของสตั ว์ ลักษณะของข้อมลู ที่ชัดเจน สามารถบริหารจัดการและเข้าถงึ ได้ง่าย เช่น ข้อมูลที่ถูกจัดเก็บอยู่ใน ฐานข้อมูลเชิงสัมพันธใ์ น ตัวอย่างข้อมูลทม่ี โี ครงสรา้ ง ข้อมลู ชนิดข้อมลู รปู แบบขอ้ มูล ขนาดขอ้ มลู รหัสลกู ค้า ตัวอักษร ตัวอกั ษร C ตามด้วยตวั เลข 8 หลกั เรยี งติดกนั 9 ตัวอกั ษร นามสกุล ตวั อักษร ตัวอักษร สามารถมีอกั ขระว่าง แทรกอยู่ใน ไมเ่ กนิ 70 ตัวอักษร หมายเลขบตั ร ตวั เลข ตวั เลขเรยี งติดกนั ไม่สามารถมีอักขระวา่ ง 13 ตวั วนั เดือน ปเี กิด วนั ท่ี วัน/เดือน/ปี ไม่เกนิ 12 ตัว ที่อยู่ ตวั อักษร ตัวอกั ษรหรอื ตวั เลข สามารถมีอักขระว่าง ไม่เกิน 50 ตัวอักษร บญั ชอี ีเมล ตัวอักษร ตวั อักษรหรือ ตัว เสขในรปู แบบอเี มล ไม่เกิน 50 ตัวอักษร 15 2. ข้อมูลทไี่ ม่มีโครงสรา้ ง (Unstructured Data) เปน็ ขอ้ มูลทมี่ รี ูปแบบโครงสร้างของขอ้ มลู ไมแ่ น่นอน ตวั อยา่ งขอ้ มลู ท่ีไม่มีโครงสร้าง บทสนทนาในสอื่ ออนไลน์ 3. ข้อมูลกึ่งมีโครงสร้าง (Semi-structured Data) เป็นข้อมูลที่มีรูปแบบโครงสร้างของ ข้อมูลระดบั • ข้อมูล CSV (Comma-Separated Value) คือ แฟ้มข้อมูลตัวอักษร (Text File) ที่ เก็บข้อมูล ชือ่ ข้อมูลชดุ ท่ี 1, ชื่อขอ้ มลู ชดุ ท่ี 2, ช่ือขอ้ มูลชุดที่ 3, ..., ช่อื ขอ้ มลู ชุดที่ N ข้อมูลท่ี M, ข้อมูลที่ M+1, ข้อมูลที่ M+2, …, ข้อมูลท่ี M+N ตัวอย่างข้อมูลลกู ค้าในลกั ษณะ CSV รหสั ลกู คา้ , ช่ือ, นามสกุล, วัน/เดอื น/ปีเกิด, หมายเลขโทรศพั ท์มือถอื จากตัวอย่างข้อมลู CSV ข้างดน้ จะเหน็ วา่ ข้อมลู ลูกค้ามที ั้งสนิ้ 3 แถว โดยแต่ละแถว แบ่งเป็น 16 • ข้อมูล JSON (JavaScript Object Notation) คือ รปู แบบข้อมลู สายอักขระ (String) ทีเ่ หมาะ { ตวั อย่างขอ้ มูลลูกคา้ ในลกั ษณะ JSON { }, "CustomerID": "C00000002", จากตัวอยา่ งขอ้ มลู JSON ข้างตน้ จะเหน็ วา่ ขอ้ มูลลกู ค้ามีทั้งสิน้ 4 รายการ 17 การวิเคราะห์ข้อมูลด้วยกระบวนการต่าง ๆ จะทำให้ข้อมูล ( Data) พัฒนาเป็นสารสนเทศ พีระมิดแหง่ ความรขู้ อง Yamazaki แบ่ง พรี ะมิดแหง่ ความรู้ของ Yamazaki • ข้อมูล (Data) คือ ข้อเท็จจริงหรือเหตุการณ์ที่เกี่ยวขอ้ งกบั สิ่งตา่ งๆ ที่มีการจัดเก็บหลากหลาย • สารสนเทศ (Information) คือ ผลลัพธ์จากการนำข้อมูลมาผ่านการประมวลผลต่าง ๆ เพ่ือ • ความรู้ (Knowledge) คือ ผลลัพธ์ทไี่ ด้จากการวิเคราะห์ข้อมูลและสารสนเทศ ผนวกกับการใช้ • ปญั ญา (Wisdom) คือ ผลลัพธ์ทไ่ี ด้จากการวเิ คราะห์ คัดเลือกความรูต้ ่าง ๆ จนเกดิ ความเข้าใจ 18 บนั ทึกข้อมลู 19 ใบความรู้ที่ 2.2 เร่ือง ฐานข้อมลู หนว่ ยการเรยี นรูท้ ่ี 2 เทคโนโลยีการจัดการข้อมูล วชิ า วทิ ยาการคำนวณ 2 รหสั วชิ า ว32183 ช้นั มธั ยมศกึ ษาปที ี่ 5 ครูผู้สอน นายวรรณชนะ ปรากฏผล โรงเรยี นเทพศริ ินทรค์ ลองสบิ สาม ปทุมธานี มาตรฐาน ว.4.2 ตัวชี้วัด ม.5/1 รวบรวม วเิ คราะหข์ ้อมลู และใช้ความรู้ ด้านวิทยาการคอมพวิ เตอร์ ฐานข้อมลู เข้าถึงข้อมูลได้ง่าย สะดวกในการสืบค้นและการปรับปรุงแก้ไขข้อมูล ลดความซํ้าซ้อน และมีความ ระบบฐานข้อมลู (Database System) คือ ระบบหรือซอฟตแ์ วร์ทใ่ี ชส้ ำหรบั จดั เก็บและบรหิ าร จัดการ 1. ฐานข้อมูล หรือแหล่งทเ่ี ก็บรวบรวมข้อมลู 1) Application Programmer นกั พฒั นา โปรแกรมสำหรับใชง้ านฐานข้อมลู 20 ตวั อย่างระบบจัดการฐานขอ้ มูล ผงั แสดงตัวอยา่ งระบบจดั การฐานขอ้ มูล 21 2. ข้อมูลมีความถูกต้อง เนื่องจากการจัดเก็บข้อมูลในฐานข้อมูลน้ัน หากมีข้อมูล ชุดเดียวกัน 3. ป้องกันและรักษาความปลอดภยั ของข้อมูล เนื่องจากฐานข้อมูลนั้นสามารถกำหนด การเข้าถงึ 4. หลีกเลี่ยงความชัดแย้งของข้อมูล เนื่องจากการเก็บข้อมูลเดียวกันไว้หลาย ๆ ที่ เมื่อมี การ 5. รักษาความถูกต้องเชื่อถือได้ของข้อมูล เนื่องจาก ในระบบจัดการฐานข้อมูลผู้ดูแลระบบ 6. การกำหนดความเป็นมาตรฐานเดียวกนั ของข้อมูล การเกบ็ ข้อมลู รว่ มกนั ในฐานข้อมูล จะทำให้ 7. เกิดความเป็นอิสระของข้อมลู ในระบบฐานข้อมูลจะ มีตัวจัดการฐานข้อมูลที่ทำหน้าที่เป็นตัว ระบบจดั การฐานขอ้ มูลเชงิ สมั พันธ์ ระบบจัดการฐานข้อมูลที่มีการจัดเก็บข้อมูลในลักษณะตาราง (Table) โดยตารางจะประกอบด้วย แถว Students ID Name Phone DOB 500 Matt 0-2555-4141 06/03/70 จากตารางจะเห็นได้ว่า รายการข้อมูลแต่ละแถวจะมีความสัมพันธ์ซึ่งกันและกัน เช่น นักเรียนรหัส 22 Students DOB 500 Matt 0-2555-4141 06/03/70 501 Jenny 0-2867-5309 03/15/81 502 Sean 0-2876-9123 10/31/82 ID ClassID Sem ClassID Title ClassNum 501 1002 spr03 Internet and Society 1400 502 1003 S203 Courses Take_Course ตัวอยา่ งความสมั พันธ์ระหวา่ งตารางในฐานข้อมูลเชิงสมั พันธ์ จากตารางจะเหน็ วา่ ตาราง Students มีความลมั พนั ธ์กับตาราง TakesCourse ดว้ ยคอลัมน์ ID และ ตวั อย่างการลดความซาํ้ ซ้อนในการเก็บข้อมลู โดยใช้ระบบจดั การขอ้ มูลเชิงสมั พันธ์ Students DOB 501 Jenny 0-2867-5309 10/31/82 502 Sean 0-2876-9123 Take_Course ID Name Phone DOB ClassID Title ClassNum Sem ClassID Title ClassNum 1003 Internet and 1400 Society ตารางเกบ็ ข้อมลู นกั เรยี นที่มีความซ้ำซอ้ นกนั ของข้อมูล 23 จากตารางจะเหน็ วา่ มีการเกบ็ ข้อมูลในดาราง TakeCourse ซ้าํ กับขอ้ มลู ใน ตาราง Students และ Students Phone DOB ID ClassID Sem ClassID Title ClassNum 502 1003 S203 Take_Course การลดความซำ้ ซ้อนของขอ้ มลู โดยใชร้ ะบบจดั การฐานขอ้ มูลเชิงสมั พันธ์ จากตารางให้คอลมั น์ ID ของตาราง Take_Course มีความสมั พันธก์ บั ตาราง Students และคอลัมน์ 24 บันทึกขอ้ มูล 25 ใบความรู้ท่ี 2.3 เรอ่ื ง คลังข้อมลู หนว่ ยการเรียนร้ทู ี่ 2 เทคโนโลยีการจัดการข้อมูล วิชา วทิ ยาการคำนวณ 2 รหสั วชิ า ว32183 ชั้นมธั ยมศกึ ษาปีที่ 5 ครผู สู้ อน นายวรรณชนะ ปรากฏผล โรงเรยี นเทพศริ ินทร์คลองสิบสาม ปทุมธานี มาตรฐาน ว.4.2 ตัวชีว้ ัด ม.5/1 รวบรวม วิเคราะหข์ ้อมลู และใช้ความรู้ ดา้ นวทิ ยาการคอมพวิ เตอร์ คลังข้อมลู วิเคราะห์เพื่อให้ เกิดประโยชน์สูงสุด ดังนั้น คลังข้อมูลจึงไม่ใช่การนำซอฟต์แวร์ มาใช้ในการจัดการกับ คลงั ข้อมูล (Data Warehouse) คอื ฐานขอ้ มลู ขนาดใหญ่ขององค์กรหรอื หนว่ ยงานใด หน่วยงานหน่ึง การสร้างคลงั ขอ้ มูล มีเป้าหมาย ดงั น้ี เชื่อมตอ่ เขา้ ไปยงั คลังขอ้ มูล จากเครือ่ งคอมพวิ เตอร์ของตนเองได้ ซึ่งการเชื่อมต่อสามารถทำได้ทันทีตาม 2. เพื่อให้ข้อมูลในคลังข้อมูลมีความ ถูกต้องตรงกันหมด คำถามเดียวกันต้องได้ รับคำตอบ 3. เพอ่ื ใหข้ ้อมลู ในคลงั ขอ้ มูลสามารถ ถูกวเิ คราะห์ โดยแบง่ ข้อมลู หรอื รวมข้อมูลมา วเิ คราะห์ตาม 4. เพื่อรวบรวมข้อมูลอย่างระมัดระวัง จากแหล่งข้อมูลหลาย ๆ แห่งจากภายนอกองค์กร คลงั ขอ้ มูล มคี ุณลักษณะทสี่ ำคัญ 4 ประการ ดังนี้ 26 2. Integrated ข้อมูลในคลังข้อมูลจะถูกจัดเก็บในรูป แบบเดียวกัน และมีความสอดคล้องกัน 3. Time-Variant ข้อมูลในฐานข้อมูลทั่วไป มุ่งเน้นความ เป็นปัจจุบัน และจะต้องปรับปรุงให้ทัน 4. Non-Volatile เน้นประสิทธภิ าพดา้ นการเรียกใช้ข้อมลู ที่ มีความรวดเร็วเปน็ สำคัญ มากกว่าการ ฐานขอ้ มลู ถกู ใช้งานอยา่ งกว้างขวางในระบบงานทว่ั ไป จงึ ตอ้ งมีการพฒั นาวธิ ีเก็บข้อมลู ให้สามารถเก็บ ในการทำงานของคลงั ข้อมูล เพือ่ ใหไ้ ด้มาซึ่งข้อมลู และการจดั เก็บขอ้ มลู จำเป็นต้องใช้ กระบวนการการ 1. การสกดั ขอ้ มูล (Extract) คือ การสกดั ขอ้ มูลทีจ่ ำเปน็ และเหมาะสมจากแหล่งข้อมลู ท่ี แตกตา่ งกนั 1) Data Mapping การทำให้ขอ้ มลู ท่มี ีความหมายเดยี วกนั แต่อยู่ในรปู แบบทีแ่ ตกต่าง กนั ใหอ้ ยู่ใน 27 2) Data Cleansing การตรวจสอบและแก้ไขข้อมูลให้ถูกตอ้ ง การทำงานของคลังข้อมลู ประกอบดว้ ยองคป์ ระกอบ 3 ประการ ดังนี้ ผังแสดงหลกั การทำงานของคลังขอ้ มลู จากฐานข้อมูลระบบงานประจำวัน หรือฐานข้อมูลอื่นภายนอกองค์กรจำเป็นต้องผ่านกระบวนการ 28 บันทกึ ขอ้ มูล 29 ใบความรทู้ ี่ 2.4 เรื่อง การทำเหมืองข้อมลู หน่วยการเรยี นรทู้ ี่ 2 เทคโนโลยกี ารจัดการขอ้ มูล วิชา วิทยาการคำนวณ 2 รหสั วิชา ว32183 ช้นั มธั ยมศกึ ษาปีที่ 5 ครูผสู้ อน นายวรรณชนะ ปรากฏผล โรงเรียนเทพศริ นิ ทรค์ ลองสิบสาม ปทมุ ธานี มาตรฐาน ว.4.2 ตัวชว้ี ัด ม.5/1 รวบรวม วเิ คราะหข์ อ้ มูล และใช้ความรู้ ดา้ นวทิ ยาการคอมพิวเตอร์ การทำเหมอื งข้อมูล ความสัมพันธ์ต่าง ๆ ของข้อมูลที่ซ่อนอยู่ โดยทำการเชื่อมโยงข้อมูลที่มีความสัมพันธก์ ัน (Association) กระบวนการทำเหมืองข้อมลู ใช้หลายหลักการ เชน่ เทคนิคการเรยี นรขู้ องเคร่อื ง (Machine Learning) การทำเหมืองข้อมูลสามารถนำไปประยุกดใชใ้ นองค์กรธรุ กจิ ตา่ ง ๆ ได้ เช่น ธนาคารใช้ เหมืองขอ้ มลู ใน การกระทำกบั ข้อมูล เพ่อื หาความสมั พันธ์ของขอ้ มูล 30 วตั ถปุ ระสงคใ์ นการทำเหมืองข้อมลู มาสร้างการพยากรณข์ ้อมูลที่จะเกิดในอนาคต โดยใชว้ ธิ กี ารวิเคราะห์เชงิ สถิติเปน็ พ้ืนฐาน และเสริมด้วย 2. การวเิ คราะหค์ วามเช่ือมโยงหรือความสัมพนั ธ์ เป็นการปฏิบัตกิ ารเพ่ือสร้างความสัมพันธ์ ระหว่าง ผังแสดงข้ันตอนการหาความรู้ใหม่จากการทำเหมืองข้อมูล ขนั้ ตอนในการทำเหมืองขอ้ มูล การนำขอ้ มูลท่ี ตอ้ งการออกจากฐานข้อมลู เพ่อื สรา้ งกลุม่ ข้อมลู สำหรับพจิ ารณาเบอ้ื งตน้ จำนวนมากจะถกู นำมากรองเพอ่ื เลอื กขอ้ มูลทตี่ รงประเด็นเพื่อ นำไปวเิ คราะห์ไดอ้ ย่างเหมาะสม อยู่ในรูปแบบเดียวกันที่ได้มาตรฐาน และเหมาะสม ที่จะนำไปใช้กับอัลกอริทึมและแบบจำลองที่ใช้ทำ 4. การทำเหมอื งข้อมูล (Data Mining) เปน็ ขน้ั ตอนทนี่ ำเอาวธิ ีการหรือเทคนิคการทำเหมืองข้อมูลมา 5. การแปลผลและการประเมนิ ผล (Interpretation/Evaluation) เป็นข้ันตอนการประเมินรูปแบบที่ 6. การแทนความรู้ (Knowledge Representation) เป็นขั้นตอนการนำเสนอความรู้ทีค่ ้นพบ โดยใช้ 31 ตวั อย่างการนำเหมืองข้อมูลมาใช้งาน สรปุ หนว่ ยการเรียนรู้ท่ี 2 เทคโนโลยกี ารจัดการข้อมูล รูปแบบ เช่น ข้อความ ตัวเลข ภาพนึ่ง ภาพเคลื่อนไหว เสียง โดยข้อมูลเหล่านี้สามารถเกิดขึ้นได้ จาก ฐานข้อมลู คอื การจดั เก็บและการบรหิ ารขอ้ มูล เพ่ือใหข้ อ้ มลู มีความเป็นระบบ สามารถเข้าถึงข้อมูล คลังข้อมูล คือ การจัดทำแนวทางการจดั เก็บข้อมูลขนาดใหญ่ขององคก์ รหรือหน่วยงานใดหน่วยงาน การทำเหมอื งข้อมูล คือ กระบวนการท่กี ระทำกบั ข้อมูลจำนวนมาก เพื่อหาความสมั พนั ธ์ต่าง ๆ ของ 32 บนั ทึกขอ้ มูล |