เทคโนโลยีการจัดการข้อมูล สรุป

13

ใบความรู้ท่ี 2.1 เรอื่ ง ขอ้ มูล

หน่วยการเรียนรูท้ ี่ 2 เทคโนโลยกี ารจดั การข้อมูล

วิชา วทิ ยาการคำนวณ 2 รหัสวชิ า ว32183 ชนั้ มัธยมศกึ ษาปที ่ี 5

ครผู สู้ อน นายวรรณชนะ ปรากฏผล โรงเรียนเทพศิรินทร์คลองสบิ สาม ปทมุ ธานี

มาตรฐาน ว.4.2 ตัวชว้ี ัด ม.5/1 รวบรวม วิเคราะหข์ อ้ มูล และใช้ความรู้ ด้านวิทยาการคอมพิวเตอร์
สื่อดจิ ิทัลเทคโนโลยีสารสนเทศในการแก้ปัญหาหรือเพ่ิมมูลคา่ ให้กบั บรกิ ารหรอื ผลิตภัณฑท์ ่ีใช้ในชวี ิตจรงิ
อยา่ งสร้างสรรค์

ขอ้ มูล
ในชีวิตประจำวัน การติดต่อสื่อสารเกิดขึ้นได้ตลอดเวลา ไม่ว่าจะเป็นการติดต่อสื่อสารระหว่าง

มนุษย์กับมนษุ ย์ มนษุ ย์กับคอมพวิ เตอร์ หรอื มนุษยอ์ ับอินเทอรเ์ น็ต โดยการสอื่ สารเหลา่ น้นี ำมาซ่งึ การเกิด
ขอ้ มูลตา่ ง ๆ อกี ท้งั ขอ้ มลู นน้ั มีรูปแบบท่ีหลากหลาย และมีปรมิ าณเพิม่ ขน้ึ อย่าง รวดเร็ว ทำให้จำเป็นต้อง
มีการจัดเก็บและบริหารจัดการข้อมูลอยา่ งเหมาะสม เพื่อให้สามารถนำ ข้อมูลเหล่านี้มาใช้ประโยชน์ได้
อย่างมีประสทิ ธภิ าพ
ความหมายของขอ้ มลู

ข้อมูล (Data/Raw Data) หมายถึง ข้อเทจ็ จริงหรอื เหตกุ ารณ์ท่ีเก่ียวข้องกับส่งิ ต่าง ๆ ท่ี มีการจัดเก็บ
ในหลากหลายรูปแบบ เช่น ข้อความ ตัวเลข เสียง ภาพนิ่ง ภาพเคลื่อนไหว โดยข้อมูลเหล่านสามารถ
เกดิ ขนึ้ ไดจ้ ากแหล่งขอ้ มลู หลายแหล่ง เช่นบุคคลบริษัทหนว่ ยงานราชการ องค์กร อินเทอร์เน็ต

ตวั อยา่ งขอ้ มูลแตล่ ะประเภท

ขอ้ มลู ตวั อกั ษร เปน็ ข้อมลู ท่ปี ระกอบไปด้วยตวั อักษรภาษาไทย ภาษาดา่ งประเทศ

หรอื ตัวเลขทไ่ี ม่สามารถนำมาคำนวณทาง คณิตศาสตรไ์ ด้ เช่น

• ช่อื -นามสกลุ ของนักเรยี น • รหสั นักเรยี น

• ที่อยขู่ องนกั เรยี น • ขอ้ ความการสนทนาออนไลน์

• ข้อมูลสถานทท่ี ่องเทย่ี วในอำเภอของนักเรยี น

ข้อมลู ตวั เลข เป็นขอ้ มลู ทป่ี ระกอบดว้ ยตวั เลข 0-9 สามารถนำ มาใช้ในกาคำนวณ
หรือประมวลผลได้ เชน่
• จำนวนคร้ังในการออกกำลงั กายของนักเรยี นในเดอื นทผี่ า่ นมา
• ราคาสนิ ค้าในหา้ งสรรพสนิ คา้
• ระยะทางระหวา่ งบา้ นอับโรงเรยี น
• คะแนนสอบ

ข้อมลู ภาพ เปน็ ขอ้ มลู ทมี่ ีลักษณะเป็นภาพตา่ ง ๆ ท่ีมองเหน็ เชน่
• ภาพถา่ ยทนี่ ักเรยี นนำเขา้ สเู่ ครือข่ายสงั คมออนไลน้
• ภาพถา่ ยฟลิ ม์ เอกซเรยข์ องผู้ปว่ ย
• ภาพวาดสึนา้ํ มนั ทจี่ ดั แสดงในงานนิทรรศการ
• ภาพวาดทนี่ กั เรยี นวาดขนึ้

14

ข้อมลู ภาพเคลอื่ นไหว ข้อมูลเสึยง หรอื วีดทิ ศั น์ เปน็ ขอ้ มลู ที่ มลี ักษณะเปน็

ภาพเคล่อื นไหว หรือข้อมลู ท่เี กดิ จากการไดย้ นิ ไมว่ า่ จะเปน็ เสยี งทเี่ กดิ ข้ึนตาม
ธรรมชาติ หรือเสยี งที่เกดิ จาก อุปกรณเ์ ทคโนโลยีต่าง ๆ เชน่
• เสยี งวีดิทศั น์ทนี่ กั เรยี นนำเข้าสู่สงั คมออนไลน์
• วดี ิทศั นก์ ารบนั ทกึ สภาพการจราจร

• เสยี งรอ้ งของสตั ว์
• เสยี งทเ่ี กิดจากการเปดิ เพลงผา่ นวิทยุ

ลักษณะของข้อมลู
ข้อมูล สามารถแบง่ ออกเปน็ 3 ลกั ษณะ ตามโครงสรา้ งของขอ้ มูลได้ ดังนี้
1. ขอ้ มูลทีม่ ีโครงสร้าง (Structured Data) เป็นข้อมลู ทีม่ กี ารจัดระเบียบมีรปู แบบ และประเภทข้อมูล

ที่ชัดเจน สามารถบริหารจัดการและเข้าถงึ ได้ง่าย เช่น ข้อมูลที่ถูกจัดเก็บอยู่ใน ฐานข้อมูลเชิงสัมพันธใ์ น
รปู แบบของตาราง

ตัวอย่างข้อมูลทม่ี โี ครงสรา้ ง
การจดั เกบ็ ขอ้ มูลตามรูปแบบโครงสร้างในลักษณะตาราง โดยหัวตารางแสดงข้อมูลท่ีดอ้ ง จัดเก็บ แต่
ละแถวแสดงรายละเอยี ดของข้อมลู และแตล่ ะคอลมั น์แสดงรายละเอียดของหัวตาราง

ข้อมลู ชนิดข้อมลู รปู แบบขอ้ มูล ขนาดขอ้ มลู

รหัสลกู ค้า ตัวอักษร ตัวอกั ษร C ตามด้วยตวั เลข 8 หลกั เรยี งติดกนั 9 ตัวอกั ษร
ชอ่ื
ตวั อักษร ตัวอกั ษร สามารถมีอักขระว่าง (Space) ไม่เกนิ 50 ตัวอักษร
แทรกอยใู่ นขอ้ มลู ได้

นามสกุล ตวั อักษร ตัวอักษร สามารถมีอกั ขระว่าง แทรกอยู่ใน ไมเ่ กนิ 70 ตัวอักษร
ขอ้ มลู ได้

หมายเลขบตั ร ตวั เลข ตวั เลขเรยี งติดกนั ไม่สามารถมีอักขระวา่ ง 13 ตวั
ประจำตัวประชาชน แทรกอยู่ในขอ้ มลู ได้

วนั เดือน ปเี กิด วนั ท่ี วัน/เดือน/ปี ไม่เกนิ 12 ตัว

ที่อยู่ ตวั อักษร ตัวอกั ษรหรอื ตวั เลข สามารถมีอักขระว่าง ไม่เกิน 50 ตัวอักษร
แทรกอย่ใู นขอ้ มูลได้

บญั ชอี ีเมล ตัวอักษร ตวั อักษรหรือ ตัว เสขในรปู แบบอเี มล ไม่เกิน 50 ตัวอักษร

15

2. ข้อมูลทไี่ ม่มีโครงสรา้ ง (Unstructured Data) เปน็ ขอ้ มูลทมี่ รี ูปแบบโครงสร้างของขอ้ มลู ไมแ่ น่นอน
มีการจัดเก็บข้อมูลที่หลากหลายตามความต้องการของผู้เก็บข้อมูล เช่น ภาพกราฟิก เสียง วิดีโอ ข่าว
ขอ้ ความสนทนาในสอ่ื สังคมออนไลน์

ตวั อยา่ งขอ้ มลู ท่ีไม่มีโครงสร้าง

บทสนทนาในสอื่ ออนไลน์

3. ข้อมูลกึ่งมีโครงสร้าง (Semi-structured Data) เป็นข้อมูลที่มีรูปแบบโครงสร้างของ ข้อมูลระดบั
หนงึ่ ซงึ่ จะยงั ไม่จดั ระเบยี บรูปแบบในการจดั เก็บลงแหล่งจัดเก็บขอ้ มูล เชน่ ฐานข้อมูล ตัวอย่างข้อมูลก่ึง
โครงสร้าง เช่น ไฟล์ในรูปแบบ CSV (Comma-Separated Value) ไฟล์ในรูปแบบ JSON (JavaScript
Object Notation)

• ข้อมูล CSV (Comma-Separated Value) คือ แฟ้มข้อมูลตัวอักษร (Text File) ที่ เก็บข้อมูล
ตา่ ง ๆ ในลกั ษณะแถว (Row) และคอลัมน์ (Column) โดยขอ้ มูลเหลา่ นี้ใชเ้ ครื่องหมาย จุลภาค (,) ในการ
แบ่งข้อมลู แต่ละคอลัมน์ และใชก้ ารข้นึ บรรทัดใหม่เพอ่ื แบง่ แถวของข้อมูล โดย รปู แบบของข้อมลู CSV มี
ดงั นี้

ชือ่ ข้อมูลชดุ ท่ี 1, ชื่อขอ้ มลู ชดุ ท่ี 2, ช่ือขอ้ มูลชุดที่ 3, ..., ช่อื ขอ้ มลู ชุดที่ N
ขอ้ มลู ท่ี 1, ข้อมูลที่ 2, ข้อมลู ที่ 3, ..., ข้อมูลท่ี N
ขอ้ มลู ที่ N+1, ขอ้ มลู ที่ N+2, ขอ้ มูลที่ N+3, …, ข้อมลู ที่ 2N
ขอ้ มูลที่ 2N+1, ข้อมูลท่ี 2N+2, ขอ้ มูลท่ี 2N+3, …, ขอ้ มูลที่ 3N

ข้อมูลท่ี M, ข้อมูลที่ M+1, ข้อมูลที่ M+2, …, ข้อมูลท่ี M+N

ตัวอย่างข้อมูลลกู ค้าในลกั ษณะ CSV

รหสั ลกู คา้ , ช่ือ, นามสกุล, วัน/เดอื น/ปีเกิด, หมายเลขโทรศพั ท์มือถอื
C00000001, นายสมชาย, ใจดี, 19/08/2539, 055-555-5555
C00000002, นางสาวสมหญิง, ดใี จ, 03/04/2535, 077-777-7777
C00000003, นางสมศรี, รว่ มใจ, 09/12/2531, 033-333-3333

จากตัวอย่างข้อมลู CSV ข้างดน้ จะเหน็ วา่ ข้อมลู ลูกค้ามที ั้งสนิ้ 3 แถว โดยแต่ละแถว แบ่งเป็น
5 คอลมั น์

16

• ข้อมูล JSON (JavaScript Object Notation) คือ รปู แบบข้อมลู สายอักขระ (String) ทีเ่ หมาะ
สำหรบั การแลกเปลีย่ น หรอื รบั -สง่ ข้อมลู เชน่ เดียวกบั XML โดยจดุ เดน่ ของ JSON จะเปน็ รูปแบบข้อมูลท่ี
เข้าใจได้ง่าย โดยรปู แบบของข้อมูล JSON มดี ังน้ี

{
ชื่อข้อมูลท่ี 1 : ข้อมูลท่ี 1,
ช่อื ข้อมูลที่ 2 : ข้อมูลท่ี 2,
ช่ือขอ้ มูลที่ 3 : ขอ้ มูลที่ 3,
.
.
ชอ่ื ขอ้ มูลท่ี N : ขอ้ มูลท่ี N
}, { รายการขอ้ มูลกัดไป }

ตวั อย่างขอ้ มูลลูกคา้ ในลกั ษณะ JSON

{
"CustomerID": "C00000001",
"FirstName": "สมชาย",
"LastName": "ใจดี",
"DateOfBirth": "19/08/2539",
"MobilePhone": "055-555-5555"

},
{

"CustomerID": "C00000002",
"FirstName": "สมหญิง",
"LastName": "ดใี จ",
"DateOfBirth": "03/04/2535",
"MobilePhone": "077-777-7777"
}

จากตัวอยา่ งขอ้ มลู JSON ข้างตน้ จะเหน็ วา่ ขอ้ มูลลกู ค้ามีทั้งสิน้ 4 รายการ

17

การวิเคราะห์ข้อมูลด้วยกระบวนการต่าง ๆ จะทำให้ข้อมูล ( Data) พัฒนาเป็นสารสนเทศ
(Information) ความรู้ (Knowledge) และปัญญา (Wisdom) ตามลำดับ ดังพีระมิดแห่งความรู้ของ
Yamazaki

พีระมิดแหง่ ความรขู้ อง Yamazaki แบ่ง
ออกเป็น 4 ข้นั ตามลำดับการพัฒนาการ
จากตาํ่ ไปสูง ไดแ้ ก่ ข้อมูล (Data) สารสนเทศ

พรี ะมิดแหง่ ความรู้ของ Yamazaki

• ข้อมูล (Data) คือ ข้อเท็จจริงหรือเหตุการณ์ที่เกี่ยวขอ้ งกบั สิ่งตา่ งๆ ที่มีการจัดเก็บหลากหลาย
รูปแบบ เช่น ข้อความ ตัวเลข เสียง ภาพนิ่ง ภาพเคลื่อนไหว โดยข้อมูลเหล่านี้สามารถ เกิดขึ้นได้จาก
แหล่งขอ้ มูลหลายแหล่ง เชน่ บุคคล บริษทั องคก์ ร หนว่ ยงานราชการ อนิ เทอร์เน็ต

• สารสนเทศ (Information) คือ ผลลัพธ์จากการนำข้อมูลมาผ่านการประมวลผลต่าง ๆ เพ่ือ
ก่อให้เกิดประโยชนใ์ นการนำไปใช้ หรือนำมาประกอบการตดั สนิ ใจต่าง ๆ

• ความรู้ (Knowledge) คือ ผลลัพธ์ทไี่ ด้จากการวิเคราะห์ข้อมูลและสารสนเทศ ผนวกกับการใช้
ประสบการณ์ ของผู้วิเคราะห์ ทำให้เกิดการรับรู้และความเข้าใจในการนำสารสนเทศไปใช้ในการแก้
ปัญหา ตา่ ง ๆ ได้อยา่ งมปี ระสิทธิภาพ โดยความรอู้ าจแฝงอยใู่ นข้อมลู หรอื สารสนเทศท่ีมรี ูปแบบ

• ปญั ญา (Wisdom) คือ ผลลัพธ์ทไ่ี ด้จากการวเิ คราะห์ คัดเลือกความรูต้ ่าง ๆ จนเกดิ ความเข้าใจ
สามารถประพฤติปฏิบัติได้ และสามารถใช้ในแขนงวิชา หรอื การทำงานตา่ ง ๆ ได้ ซึ่งปัญญา ทไี่ ดจ้ ากการ
วิเคราะห์ความรู้นั้นจะถูกต้องดามความเป็นจริง ปราศจากอคติใด ๆ มีความ เที่ยงตรง และไม่
เปลยี่ นแปลงไปตามกาลเวลา

18

บนั ทึกข้อมลู
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
..................................................................................................................................................... .......
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
..................................................................................................................................................... .......
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................

19

ใบความรู้ที่ 2.2 เร่ือง ฐานข้อมลู

หนว่ ยการเรยี นรูท้ ่ี 2 เทคโนโลยีการจัดการข้อมูล

วชิ า วทิ ยาการคำนวณ 2 รหสั วชิ า ว32183 ช้นั มธั ยมศกึ ษาปที ี่ 5

ครูผู้สอน นายวรรณชนะ ปรากฏผล โรงเรยี นเทพศริ ินทรค์ ลองสบิ สาม ปทุมธานี

มาตรฐาน ว.4.2 ตัวชี้วัด ม.5/1 รวบรวม วเิ คราะหข์ ้อมลู และใช้ความรู้ ด้านวิทยาการคอมพวิ เตอร์
สื่อดิจทิ ัลเทคโนโลยีสารสนเทศในการแกป้ ัญหาหรือเพ่ิมมูลคา่ ใหก้ บั บริการหรือผลติ ภัณฑท์ ี่ใชใ้ นชีวิตจรงิ
อยา่ งสร้างสรรค์

ฐานข้อมลู
ฐานขอ้ มลู (Database) คือ การจดั เกบ็ และการบริหาร ข้อมูลเพ่อื ใหข้ ้อมูลมีความเปน็ ระบบ สามารถ

เข้าถึงข้อมูลได้ง่าย สะดวกในการสืบค้นและการปรับปรุงแก้ไขข้อมูล ลดความซํ้าซ้อน และมีความ
ปลอดภัย โดยขอ้ มลู ทถ่ี กู จัดเกบ็ ไวใ้ นฐานขอ้ มูลจะต้องมคี วามสัมพนั ธซ์ ง่ึ กันและกัน
ระบบฐานข้อมูล

ระบบฐานข้อมลู (Database System) คือ ระบบหรือซอฟตแ์ วร์ทใ่ี ชส้ ำหรบั จดั เก็บและบรหิ าร จัดการ
ข้อมูล โดยข้อมูลที่จัดเก็บในฐานขอ้ มูลจะต้องมคี วามสัมพันธก์ ันระหว่างข้อมูลที่ชัดเจน ซึ่งจะมีรูปแบบ
การจัดเก็บข้อมูลที่แตกต่างกันขึ้นอยู่กับเทคโนโลยีของฐานข้อมูล ระบบฐานข้อมูล จะมีซอฟต์แวร์เป็น
สื่อกลางระหวา่ งผ้ใู ชง้ านและโปรแกรมต่าง ๆ ทีเ่ กย่ี วข้องกับการใชง้ านฐานขอ้ มูล ทีเ่ รยี กว่า ระบบจัดการ
ฐานข้อมลู (Database Management System : DBMS) ซ่งึ มหี น้าทีใ่ นการ บรหิ ารจัดการฐานข้อมลู ให้มี
ความสะดวกและปลอดภัย โดยระบบฐานขอ้ มลู มีองค์ประกอบ ดงั น้ี

1. ฐานข้อมูล หรือแหล่งทเ่ี ก็บรวบรวมข้อมลู
2. ซอฟต์แวร์ หรือระบบทใี่ ชจ้ ดั การฐาน ขอ้ มูล เปรียบเสมือนสือ่ กลางระหว่างผูใ้ ชง้ านหรือ โปรแกรม
ตา่ ง ๆ และฐานขอ้ มูล
3. ฮาร์ดแวร์ หรอื อปุ กรณท์ ี่ใช้ในการจดั เกบ็ ฐานข้อมูล
4. ผ้ใู ชง้ าน สามารถแบ่งเป็น 3 กลมุ่ ดังน้ี

1) Application Programmer นกั พฒั นา โปรแกรมสำหรับใชง้ านฐานข้อมลู
2) Database Administrator ผทู้ ที ำหนา้ ที บริหารจดั การฐานข้อมูล
3) End Users ผู้ใช้ฐานข้อมูลทวั่ ไป ซึ่ง เข้าถึงขอ้ มูลผา่ นโปรแกรมที่ใชง้ านฐานข้อมูล

20

ตวั อย่างระบบจัดการฐานขอ้ มูล
บริษัทแห่งหนึ่งมีการจัดการฐานข้อมูลของบริษัทที่ต้องใช้ในการจัดเก็บข้อมูลของแผนกต่าง ๆ
ในบริษทั ไดแ้ ก่ แผนกบคุ คล แผนกการตลาด และแผนกจดั ซื้อ ดังแผนผงั

ผงั แสดงตัวอยา่ งระบบจดั การฐานขอ้ มูล
จากแผนผังสามารถอธิบายได้ว่า ผู้ใช้งานข้อมูลของแผนกต่าง ๆ จะใช้งานโปรแกรมต่าง ๆ ท่ี
เกี่ยวข้องกับงานของแผนกตนเอง คือ แผนกบุคคลจะใช้งานโปรแกรมจัดการพนกั งาน แผนก การตลาด
จะใช้งานโปรแกรมวิเคราะห์การขาย การตลาด และแผนกจัดซื้อจะใช้งานโปรแกรม จัดซื้อสินค้า โดยมี
นักพัฒนาระบบ (Programmer) คอยควบคุมการทำงานของโปรแกรมต่าง ๆ อยู่ เมื่อผู้ใช้งานจัดการ
ข้อมูลด้วยโปรแกรมต่างๆ เรียบร้อยแล้วข้อมูลจะถูกส่งต่อไปยัง DBMS เพื่อ จัดการและควบคุมความ
ถูกต้อง ความซํ้าซ้อน และความสัมพันธ์ระหวา่ งขอ้ มูลต่าง ๆ ภายใน ฐานข้อมูล ซึ่งดูแลโดยผู้ดูแลระบบ
ฐานข้อมลู (Database Administrator) และสุดท้ายขอ้ มลู จะสง่ ไป เก็บไว้ในฐานขอ้ มลู ของบรษิ ัท
การจัดเก็บข้อมลู ตา่ ง ๆ ในระบบฐานขอ้ มลู มปี ระโยชน์ ดงั นี้
1. ลดความซํ้าซ้อนในการเก็บข้อมูลในการเก็บข้อมูลในลักษณะแฟ้มข้อมูล (File) สามารถ เกิด
ความซํ้าซ้อนของข้อมลู ได้ง่าย เนื่องจากข้อมูลชุดเดียวกันอาจถูกเก็บอยูใ่ นหลาย ๆ แฟ้มข้อมลู ซึ่งทำให้
สนิ้ เปลืองเนือ้ ทใี่ นการจัดเก็บข้อมลู และเมื่อมีการแกไ้ ขหรือปรับปรงุ ขอ้ มูลแต่ดำเนินการ ไม่ครบทุกท่ีที่มี
ข้อมูลเก็บอยู่ ก็จะทำให้เกิดความขัดแย้งของข้อมูลตามมา แต่ระบบฐานข้อมูล จะออกแบบให้ข้อมูลมี
ความซํ้าซอ้ นน้อยที่สุดจึงทำให้ความซํ้าซ้อนของข้อมลู เหล่านื้ลดน้อยลง และ ช่วยประหยัดเนื้อที่ในการ
เกบ็ ข้อมูล

21

2. ข้อมูลมีความถูกต้อง เนื่องจากการจัดเก็บข้อมูลในฐานข้อมูลน้ัน หากมีข้อมูล ชุดเดียวกัน
ปรากฏอยูห่ ลายแหง่ ในฐานขอ้ มูล ขอ้ มลู เหล่านี้จะตอ้ งตรงกนั หากมีการแกไ้ ขข้อมลู เหลา่ นี้ จะต้องได้รับ
การแก้ไขใหถ้ ูกต้องตรงกนั ในทกุ ๆ แหง่ ท่ขี ้อมลู ปรากฏอยโู่ ดยอตั โนมตั ิ ดว้ ยระบบจัดการฐานขอ้ มลู

3. ป้องกันและรักษาความปลอดภยั ของข้อมูล เนื่องจากฐานข้อมูลนั้นสามารถกำหนด การเข้าถงึ
ขอ้ มลู ของผ้ใู ช้งานต่าง ๆ ไดอ้ ย่างชดั เจน อีกทั้งสามารถกำหนดการเข้าถึงข้อมูลให้แก่ ผทู้ ี่เกีย่ วขอ้ งเท่านั้น
หรอื มกี ารกำหนดรหัสผา่ นทำใหข้ ้อมูลมีความปลอดภยั สูง

4. หลีกเลี่ยงความชัดแย้งของข้อมูล เนื่องจากการเก็บข้อมูลเดียวกันไว้หลาย ๆ ที่ เมื่อมี การ
ปรับปรุงข้อมูลแต่ปรบั ปรุงไมค่ รบทุกที่ จะทำให้เกิดปัญหาข้อมูลชนิดเดียวอันมีค่าไม่เหมอื นกัน แต่การ
จดั เก็บข้อมูลในระบบฐานขอ้ มูลจะช่วยหลีกเล่ียงการเกิดปัญหานน้ั ข้นึ ได้ เช่น เม่อื มกี าร เปล่ียนชอื่ ตอ้ งทำ
การแก้ไขทกุ ทที่ ่เี กบ็ ข้อมูลไว้ ถา้ แกไ้ ขไมห่ มดขอ้ มูลก็จะเกิดความขดั แยง้ กัน

5. รักษาความถูกต้องเชื่อถือได้ของข้อมูล เนื่องจาก ในระบบจัดการฐานข้อมูลผู้ดูแลระบบ
ฐานข้อมูลจะสามารถใส่ กฎเกณฑ์ต่างๆ ในระบบ เพื่อควบคุมความผิดพลาดที่อาจเกิดขึ้น เช่น การ
กำหนดให้ไมส่ ามารถป้อนอายเุ ปน็ เลขตดิ ลบได้

6. การกำหนดความเป็นมาตรฐานเดียวกนั ของข้อมูล การเกบ็ ข้อมลู รว่ มกนั ในฐานข้อมูล จะทำให้
สามารถกำหนด มาตรฐานของข้อมูลได้ และจัดเก็บข้อมูลให้เป็นไปในลักษณะ เดียวกัน เช่น กำหนด
ความยาวเปน็ หน่วยเซนติเมตร กำหนด ทศนยิ มในการเก็บข้อมูลเปน็ ทศนยิ ม 2 ตำแหนง่

7. เกิดความเป็นอิสระของข้อมลู ในระบบฐานข้อมูลจะ มีตัวจัดการฐานข้อมูลที่ทำหน้าที่เป็นตัว
เชื่อมโยงกับฐานข้อมูล ดังนั้น การแก้ไขข้อมูลบางครั้งจึงอาจกระทำเฉพาะกับข้อมูลที่ เปลี่ยนแปลง
เทา่ นน้ั ส่วนขอ้ มูลทไี่ มไ่ ดเ้ รยี กใช้กจ็ ะเปน็ อิสระจาก การเปล่ยี นแปลง

ระบบจดั การฐานขอ้ มูลเชงิ สมั พันธ์
ระบบจัดการฐานข้อมูลเชิงสัมพันธ์ (Relational Database Management System : RDBMS) คือ

ระบบจัดการฐานข้อมูลที่มีการจัดเก็บข้อมูลในลักษณะตาราง (Table) โดยตารางจะประกอบด้วย แถว
(Row) และคอลมั น์ (Column) ซงึ่ ขอ้ มลู ที่จดั เก็บในตารางจะมคี วามสมั พันธซ์ ่งึ กนั และกัน เชน่

Students

ID Name Phone DOB

500 Matt 0-2555-4141 06/03/70
501 Jenny 0-2867-5309 03/15/81
502 Sean 0-2876-9123 10/31/82
ตารางขอ้ มลู นกั เรียน

จากตารางจะเห็นได้ว่า รายการข้อมูลแต่ละแถวจะมีความสัมพันธ์ซึ่งกันและกัน เช่น นักเรียนรหัส
500 คือ นักเรียนที่มีชื่อว่า Matt หากทราบรหัสนักเรียน จะทำให้ทราบชื่อ และ รายละเอียดอื่นๆของ
นกั เรียนคนนีไ้ ด้เชน่ กันอีกท้งั ตารางต่างๆในฐานขอ้ มลู สามารถมีความสมั พันธ์ ระหว่างตารางอื่นๆ ได้ โดย
จะเช่อื มโยงด้วยการอา้ งอิงจากข้อมูลในคอลัมนท์ ก่ี ำหนดไว้ เชน่

22 Students DOB
ID Name Phone

500 Matt 0-2555-4141 06/03/70

501 Jenny 0-2867-5309 03/15/81

502 Sean 0-2876-9123 10/31/82

ID ClassID Sem ClassID Title ClassNum
1001
500 1001 fa!102 1002 Intro to Informatics 1101
1003
501 1002 fa!102 Data Mining 1400

501 1002 spr03 Internet and Society 1400

502 1003 S203 Courses

Take_Course

ตัวอยา่ งความสมั พันธ์ระหวา่ งตารางในฐานข้อมูลเชิงสมั พันธ์

จากตารางจะเหน็ วา่ ตาราง Students มีความลมั พนั ธ์กับตาราง TakesCourse ดว้ ยคอลัมน์ ID และ
ตาราง TakesCourse มคี วามสมั พนั ธ์กบั ตาราง Courses ด้วยคอลมั น์ ClassID

ตวั อย่างการลดความซาํ้ ซ้อนในการเก็บข้อมลู โดยใช้ระบบจดั การขอ้ มูลเชิงสมั พันธ์

Students DOB
06/03/70
ID Nam Phone
500 eMatt 0-2555-4141 03/15/81

501 Jenny 0-2867-5309 10/31/82

502 Sean 0-2876-9123

Take_Course

ID Name Phone DOB ClassID Title ClassNum Sem
500 Matt 0-2555-4141 06/03/7 1001 Intro to Informatics 1101 fa!102
501 Jenny 0-2867-5309 03/015/8 1002 Data Mining 1400 fa!102
0-2876-9123 10/131/8 Internet and
502 Sean 1003 1400 S203
2 Society
Courses

ClassID Title ClassNum
1001 Intro to Informatics 1101
1400
1002 Data Mining

1003 Internet and 1400

Society ตารางเกบ็ ข้อมลู นกั เรยี นที่มีความซ้ำซอ้ นกนั ของข้อมูล

23

จากตารางจะเหน็ วา่ มีการเกบ็ ข้อมูลในดาราง TakeCourse ซ้าํ กับขอ้ มลู ใน ตาราง Students และ
Courses ทำใหต้ อ้ งใช้เน้อื ทใี่ นการเก็บข้อมลู มากขึน้ และเม่ือทำการแก้ไข ข้อมูลใดๆ ในตาราง
Students หรอื Courses ก็ตอ้ งแก้ไขข้อมูลในตาราง Take_Course ด้วย เพอ่ื ไมใ่ หเ้ กดิ ความขดั แยง้ กนั
ของขอ้ มูล

Students Phone DOB
ID Name 0-2555-4141 06/03/70
500 Matt 0-2867-5309 03/15/81
501 Jenny 0-2876-9123 10/31/82
502 Sean

ID ClassID Sem ClassID Title ClassNum
1001 Intro to Informatics 1101
500 1001 fa!102 1002 Data Mining 1400
1003 Internet and Society 1400
501 1002 fa!102
Courses
501 1002 spr03

502 1003 S203

Take_Course

การลดความซำ้ ซ้อนของขอ้ มลู โดยใชร้ ะบบจดั การฐานขอ้ มูลเชิงสมั พันธ์

จากตารางให้คอลมั น์ ID ของตาราง Take_Course มีความสมั พันธก์ บั ตาราง Students และคอลัมน์
ClassID มีความสัมพันธ์กับตาราง Courses เพื่อลดความซํ้าซ้อนกัน ของข้อมูล โดยตัดข้อมูลในตาราง
Take_Course ที่ซาํ้ กบั ขอ้ มลู ในตาราง Students และ Courses ออก ทำให้ใช้พ้นื ที่ในการจัดเก็บข้อมูล
ลดลง และเมื่อมีแก้ไขหรือปรับปรุงข้อมูลในคอลัมน์ Name, Phone, DOB ในตาราง Students หรือ
คอลมั น์ Title, ClassNum ในตาราง Courses กไ็ ม่ตอ้ งแก้ไขข้อมูลใด ๆ ในตาราง Take_Course

24

บันทึกขอ้ มูล
............................................................................................................................................................
............................................................................................................................................ ................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
..................................................................................................................................................... .......
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................

25

ใบความรู้ท่ี 2.3 เรอ่ื ง คลังข้อมลู

หนว่ ยการเรียนร้ทู ี่ 2 เทคโนโลยีการจัดการข้อมูล

วิชา วทิ ยาการคำนวณ 2 รหสั วชิ า ว32183 ชั้นมธั ยมศกึ ษาปีที่ 5

ครผู สู้ อน นายวรรณชนะ ปรากฏผล โรงเรยี นเทพศริ ินทร์คลองสิบสาม ปทุมธานี

มาตรฐาน ว.4.2 ตัวชีว้ ัด ม.5/1 รวบรวม วิเคราะหข์ ้อมลู และใช้ความรู้ ดา้ นวทิ ยาการคอมพวิ เตอร์
สื่อดิจทิ ัลเทคโนโลยีสารสนเทศในการแก้ปัญหาหรือเพิ่มมูลคา่ ให้กับบริการหรือผลติ ภัณฑ์ท่ีใช้ในชวี ิตจริง
อย่างสร้างสรรค์

คลังข้อมลู
คลังข้อมูล เป็นหลักการ วิธีการ และแนวทางในการ จัดเก็บข้อมูลขนาดใหญ่เพ่ือนำข้อมูลเหล่านี้ไป

วิเคราะห์เพื่อให้ เกิดประโยชน์สูงสุด ดังนั้น คลังข้อมูลจึงไม่ใช่การนำซอฟต์แวร์ มาใช้ในการจัดการกับ
ข้อมูล
ลกั ษณะของคลังข้อมลู

คลงั ข้อมูล (Data Warehouse) คอื ฐานขอ้ มลู ขนาดใหญ่ขององค์กรหรอื หนว่ ยงานใด หน่วยงานหน่ึง
ซงึ่ เกบ็ รวบรวมขอ้ มูลจากฐานข้อมูลท่วั ไปภายในองคก์ ร ซง่ึ อาจจะมกี ารเชื่อมโยงกนั หรือไม่เชื่อมโยงกัน
นำมาจดั เก็บรวมกนั เป็นคลังข้อมูลที่สามารถนำขอ้ มูลในคลงั ข้อมลู เหลา่ น้มี าประมวลผลดว้ ยวธิ ีการตา่ ง ๆ
สำหรับการวเิ คราะห์ หรือพยากรณ์แนวโนม้ ของขอ้ มลู ในอนาคต เพอ่ื ใช้สนับสนนุ การตดั สนิ ใจต่าง ๆ เช่น
การเกบ็ ข้อมูลในคลังขอ้ มลู การซอื้ สนิ ค้า ของลูกคา้ เพ่ือนำมาวิเคราะห์แนวโนม้ การซ้อื สนิ ค้าในอนาคต

การสร้างคลงั ขอ้ มูล มีเป้าหมาย ดงั น้ี
1. เพือ่ ให้สามารถเขา้ ถึงขอ้ มูลต่าง ๆ ขององค์กรได้ ผ้จู ดั การและนกั วเิ คราะหข์ อง องค์กรสามารถ

เชื่อมตอ่ เขา้ ไปยงั คลังขอ้ มูล จากเครือ่ งคอมพวิ เตอร์ของตนเองได้ ซึ่งการเชื่อมต่อสามารถทำได้ทันทีตาม
ความตอ้ งการ

2. เพื่อให้ข้อมูลในคลังข้อมูลมีความ ถูกต้องตรงกันหมด คำถามเดียวกันต้องได้ รับคำตอบ
ที่เหมอื นกัน

3. เพอ่ื ใหข้ ้อมลู ในคลงั ขอ้ มูลสามารถ ถูกวเิ คราะห์ โดยแบง่ ข้อมลู หรอื รวมข้อมูลมา วเิ คราะห์ตาม
ความตอ้ งการในการใชง้ าน

4. เพื่อรวบรวมข้อมูลอย่างระมัดระวัง จากแหล่งข้อมูลหลาย ๆ แห่งจากภายนอกองค์กร
แล้วนำมาปรับปรุงให้เหมาะสมกับการใช้งาน ล้าข้อมูลเชื่อถือไม่ได้หรือไม่สมบูรณ์จะ ไม่ถูกอนุญาต
ใหน้ ำไปใช้
คุณลกั ษณะของคลังข้อมลู

คลงั ขอ้ มูล มคี ุณลักษณะทสี่ ำคัญ 4 ประการ ดังนี้
1. Subject Oriented ข้อมลู ในคลังขอ้ มลู จะถูกจดั เก็บตาม ประเดน็ หลักขององคก์ รน้นั ๆ เชน่ บริษทั
ดำเนินธุรกิจขายสินค้าออนไลน์แห่งหนึ่ง ต้องการสร้างคลังข้อมูลโดยข้อมูลหลักของบริษัทแห่งน้ี ได้แก่
ข้อมลู ลกู ค้า ขอ้ มลู สนิ ค้า ข้อมลู การขายสินค้า ขอ้ มูล สนิ คา้ คงคลัง ซ่งึ สง่ิ เหล่านีล้ ้วนถูกจัดเก็บ เพื่อใช้โน
การสนับสนนุ การตัดสินใจ การ วิเคราะห์ หรอื นำไปส่กู ารทำเหมืองขอ้ มลู (Data Mining) ไดเ้ ชน่ กัน

26

2. Integrated ข้อมูลในคลังข้อมูลจะถูกจัดเก็บในรูป แบบเดียวกัน และมีความสอดคล้องกัน
ของข้อมูล เนื่องจากข้อมูลที่นำมาจัดเกบ็ ได้มาจากหลายแหล่ง ทั้งแหล่งข้อมลู ภายในและแหล่งข้อมูล
ภายนอกองค์กร อาจทำให้ข้อมูลเหล่านี้อยู่ในรูปแบบที่แตกด่างกัน ดังน้ั นคลังข้อมูลจะต้อง
มีความสามารถในการรวมข้อมูลเหลา่ นัน้ ใหส้ อดคลอ้ งหรือผสมผสานเพอื่ ใหเ้ ป็น รูปแบบเดียวกันได้

3. Time-Variant ข้อมูลในฐานข้อมูลทั่วไป มุ่งเน้นความ เป็นปัจจุบัน และจะต้องปรับปรุงให้ทัน
สมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังขอ้ มูล จะเป็นข้อมูลที่มีช่วงอายใุ นระยะเวลาใด เวลาหนึ่ง ซึ่งอาจจะ
เป็นตั้งแต่ 5 ถงึ 10 ปี แตท่ ้ังนี้ก็ข้ึนอยู่กบั ความเหมาะสมด้วย การนำขอ้ มลู ยอ้ นหลงั ทเี่ ก็บรวบรวมไว้ มา
ใช้ ก็เพอื่ นำมาวเิ คราะห์เปรยี บเทยี บ หา แนวโนม้ และใชพ้ ยากรณ์ดา้ นตา่ ง ๆ ได้

4. Non-Volatile เน้นประสิทธภิ าพดา้ นการเรียกใช้ข้อมลู ที่ มีความรวดเร็วเปน็ สำคัญ มากกว่าการ
พิจารณาความซํ้าซ้อนของข้อมูล เพื่อให้ ผู้ใช้เข้าถึงแล้วนำข้อมูลมาวิเคราะห์ได้ อย่างมีประสิทธิภาพ
ทำใหข้ ้อมลู ในคลัง ข้อมลู จะไมถ่ ูกแกไ้ ขหรือแทนท่ี แต่จะถูกเพิม่ รายการข้อมูลใหม่ต่อท้ายรายการข้อมูล
เดมิ ซึ่งแตกตา่ งจากฐานข้อมูลท่วั ไปทมี่ กั มกี ารเพิ่ม ลบ หรอื ปรบั ปรุง ขอ้ มลู เพื่อใหท้ ันสมยั อยู่ตลอดเวลา
ความสัมพันธ์ของระบบคลงั ขอ้ มูลกับระบบฐานข้อมลู

ฐานขอ้ มลู ถกู ใช้งานอยา่ งกว้างขวางในระบบงานทว่ั ไป จงึ ตอ้ งมีการพฒั นาวธิ ีเก็บข้อมลู ให้สามารถเก็บ
ข้อมูลได้จำนวนมาก รวมถึงการค้นหาและนำข้อมูลที่ต้องการออกมาจากระบบ ฐานข้อมูลด้วย
แต่เนื่องจากระบบฐานข้อมูลทั่วไปเป็นการบันทึกข้อมูลที่มีการเปลี่ยนแปลง ตลอดเวลา (Operational
Database) ซึ่งมีหลักในการเก็บข้อมูลทีเ่ นน้ ในเรือ่ ง การลดความซํ้าซ้อน รักษาความถูกต้อง ลดการสูญ
หายของขอ้ มูล และลดความผิดพลาดทีเ่ กิดข้ึนจากการแก้ไขขอ้ มูล ทำใหเ้ กดิ ข้อจำกัดในการจัดเก็บข้อมูล
คือ ไม่สามารถจะนำข้อมูลมาช่วยในการสนับสนุนการ ตัดสินใจได้ มีการรวมกันของตารางต่าง ๆ ที่
ซับซ้อน และไม่มีการเก็บข้อมูลย้อนหลัง เพื่อใช้ ช่วยในการคาดคะเนแนวโน้มที่คาดว่าจะเป็นไปได้ใน
อนาคต จากขอ้ จำกัดที่เกิดขน้ึ ระบบคลังข้อมูล จึงได้ถกู คดิ ขนึ้ เพ่อื ชว่ ยให้สามารถใช้งานข้อมูลที่มีอยู่ได้
อยา่ งมีประสทิ ธิภาพสูงสดุ ด้วยวิซที ี่ สรา้ งสรรค์ เพราะธรรมชาติที่แตกตา่ งกนั ระหวา่ งคลังข้อมลู และระบบ
ฐานขอ้ มลู ทวั่ ไป
หลกั การเบอ้ื งดน้ ของคลงั ขอ้ มลู

ในการทำงานของคลงั ข้อมูล เพือ่ ใหไ้ ด้มาซึ่งข้อมลู และการจดั เก็บขอ้ มลู จำเป็นต้องใช้ กระบวนการการ
สกัดขอ้ มลู การเปล่ยี นแปลงหรอื เปลยี่ นรปู ขอ้ มูล และการถ่ายโอนข้อมลู (Extraction, Transformation
and Loading : ETL) เพื่อให้ได้ขอ้ มลู ที่เหมาะสม และสามารถนำข้อมูลเขา้ สู่ คลังข้อมูลได้อย่างถูกต้อง
โดย ETL มีกระบวนการทำงาน 3 ขั้นตอน ดงั น้ี

1. การสกดั ขอ้ มูล (Extract) คือ การสกดั ขอ้ มูลทีจ่ ำเปน็ และเหมาะสมจากแหล่งข้อมลู ท่ี แตกตา่ งกนั
2. การเปลี่ยนแปลง หรือเปลยี่ นรูปข้อมูล (Transformation) คอื การนำขอ้ มลู ทีไ่ ด้จาก ข้ันตอนการ
สกดั ขอ้ มลู มาจดั รูปแบบให้ถกู ต้อง สอดคลอ้ งกัน โดยใชก้ ระบวนการ ดงั น้ี

1) Data Mapping การทำให้ขอ้ มลู ท่มี ีความหมายเดยี วกนั แต่อยู่ในรปู แบบทีแ่ ตกต่าง กนั ใหอ้ ยู่ใน
รูปแบบเดยี วกัน เชน่ ขอ้ มูลชุดที่ 1 เกบ็ ข้อมูลเพศเปน็ Male และ Female แด่ขอ้ มูล ชุดที่ 2 เก็บข้อมูล
เปน็ M และ F ซึง่ เปน็ ข้อมูลท่มี คี วามหมายเดียวกัน ดงั น้นั จงึ ตอ้ งแปลงข้อมูล ใหอ้ ยู่ในรูปแบบใดรูปแบบ
หนึ่ง

27

2) Data Cleansing การตรวจสอบและแก้ไขข้อมูลให้ถูกตอ้ ง
3. การถ่ายโอนข้อมูล (Loading) คือ การนำข้อมูลที่ได้จากขั้นตอนการเปล่ียนแปลง หรือเปลี่ยนรูป
ข้อมลู เขา้ สคู่ ลงั ข้อมลู

การทำงานของคลังข้อมลู ประกอบดว้ ยองคป์ ระกอบ 3 ประการ ดังนี้
1. การได้มาซงึ่ ขอ้ มูล (Data Acquisition) คือ กระบวนการซ่งึ จะทำใหไ้ ด้ข้อมูลจาก แหลง่ ต่าง ๆ ท้ัง
ฐานขอ้ มูลระบบงานประจำวัน (Operational Database) และฐานขอ้ มลู อน่ื ภายนอกองคก์ ร (External
Database) เพ่อื จะนำขอ้ มูลเหล่าน้ันเขา้ สู่คลังข้อมลู
2. การจัดเก็บข้อมลู ในคลงั ข้อมูล (Data Storage) เปน็ กระบวนการสำหรบั นำเข้า และ จดั เก็บข้อมูล
ท่ไี ดม้ าจากข้ันตอนแรกไวใ้ นคลังขอ้ มลู
3. การเข้าถึงข้อมูลหรือส่งผ่านข้อมูลไปยังผู้ใช้ (Information Delivery) เป็นกระบวนการ ในการ
เขา้ ถงึ และใชง้ านขอ้ มลู ท่ถี ูกจดั เก็บอยู่ในคลังข้อมูล และเปน็ สว่ นท่ใี ช้ตดิ ต่อสือ่ สารกับ ผู้ใช้งาน โดยข้อมูล
เหล่านีส้ ามารถนำไปเสนอด้วยรายงาน นำไปวิเคราะห์ หรอื นำไปทำเหมืองข้อมลู ได้เชน่ กัน

ผังแสดงหลกั การทำงานของคลังขอ้ มลู

จากฐานข้อมูลระบบงานประจำวัน หรือฐานข้อมูลอื่นภายนอกองค์กรจำเป็นต้องผ่านกระบวนการ
ETL (Extract-Transform-Load Process) เพ่ือดึงข้อมลู (Extract) จากแหล่งข้อมลู ตา่ ง ๆ มาจดั ระเบยี บ
และรปู แบบให้สอดคล้องกัน (Transform) เพอ่ื นำเข้าสู่ (Load) คลังขอ้ มลู (Data warehouse)

28

บันทกึ ขอ้ มูล
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
..................................................................................................................................................... .......
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
........................................................................................................................................... .................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................

29

ใบความรทู้ ี่ 2.4 เรื่อง การทำเหมืองข้อมลู

หน่วยการเรยี นรทู้ ี่ 2 เทคโนโลยกี ารจัดการขอ้ มูล

วิชา วิทยาการคำนวณ 2 รหสั วิชา ว32183 ช้นั มธั ยมศกึ ษาปีที่ 5

ครูผสู้ อน นายวรรณชนะ ปรากฏผล โรงเรียนเทพศริ นิ ทรค์ ลองสิบสาม ปทมุ ธานี

มาตรฐาน ว.4.2 ตัวชว้ี ัด ม.5/1 รวบรวม วเิ คราะหข์ อ้ มูล และใช้ความรู้ ดา้ นวทิ ยาการคอมพิวเตอร์
สื่อดจิ ทิ ัลเทคโนโลยีสารสนเทศในการแก้ปัญหาหรือเพิ่มมลู คา่ ให้กบั บริการหรอื ผลิตภัณฑ์ที่ใช้ในชีวิตจริง
อยา่ งสรา้ งสรรค์

การทำเหมอื งข้อมูล
การทำเหมืองข้อมูล (Data Mining) คือ กระบวนการที่กระทำกับข้อมูลจำนวนมากเพื่อหา

ความสัมพันธ์ต่าง ๆ ของข้อมูลที่ซ่อนอยู่ โดยทำการเชื่อมโยงข้อมูลที่มีความสัมพันธก์ ัน (Association)
การจัดลำดับข้อมูล (Sequence) การจำแนกประเภทข้อมูล (Classification) การแบ่งกลุ่มข้อมูล
(Clustering) การหารูปแบบของข้อมูล (Pattern) เพ่ือให้ได้องค์ความรู้ใหม่ที่สามารถนำไปใช้
ประกอบการตัดสินใจ และการพยากรณ์ (Prediction) ในด้านต่าง ๆ เช่น ด้าน การดลาด ด้านการ
สง่ เสริมการขาย ด้านธุรกิจ ด้านการแพทย์ ซึ่งกระบวนการเหล่านี้เปรียบเสมือน การหาความรู้จากภูเขา
ขอ้ มูลขนาดใหญ่ เชน่ เดียวกับการทำเหมืองแร่ แต่เปน็ เหมอื งของขอ้ มลู นัน่ เอง

กระบวนการทำเหมืองข้อมลู ใช้หลายหลักการ เชน่ เทคนิคการเรยี นรขู้ องเคร่อื ง (Machine Learning)
สถิติ เทคนิคการสร้างภาพ (Visualization Techniques) เพื่อค้นพบและนำเสนอความรู้ ในรูปแบบท่ี
เข้าใจได้ง่าย โดยอีกความหมายหนึง่ คอื กระบวนการท่ีกระทำกับข้อมูลจำนวนมาก เพ่อื สกัดสารสนเทศ
รวมถงึ รูปแบบและความสมั พันธท์ ซี่ ่อนอยูใ่ นชุดขอ้ มลู ขนาดใหญ่นั้น

การทำเหมืองข้อมูลสามารถนำไปประยุกดใชใ้ นองค์กรธรุ กจิ ตา่ ง ๆ ได้ เช่น ธนาคารใช้ เหมืองขอ้ มลู ใน
การคน้ หาลูกค้าชัน้ ดีเพือ่ เสนอการปล่อยคู้ หรอื ใชโ้ นการทำนายแนวโนม้ พฤติกรรม การใช้บัตรเครดิตของ
ลูกค้า บรษิ ัทหรอื องคก์ รตา่ ง ๆ ใชเ้ หมืองขอ้ มูลในการทำนายผลการตอบสนอง การเปิดตัวสินคา้ ใหม่

การกระทำกบั ข้อมูล เพ่อื หาความสมั พันธ์ของขอ้ มูล

30

วตั ถปุ ระสงคใ์ นการทำเหมืองข้อมลู
1. การสร้างการพยากรณ์ เป็นการปฏิบัตกิ ารท่ใี ชส้ าระท่ีมอี ยู่ในฐานข้อมูลซงึ่ เป็นข้อมูล ท่ีเกิดขึ้นแล้ว

มาสร้างการพยากรณข์ ้อมูลที่จะเกิดในอนาคต โดยใชว้ ธิ กี ารวิเคราะห์เชงิ สถิติเปน็ พ้ืนฐาน และเสริมด้วย
วิธีปฏิบัติของการทำเหมืองข้อมูล เพื่อให้สามารถสร้างการพยากรณ์ข้อมูล ที่ง่ายต่อการทำความเข้าใจ
มากขึ้น

2. การวเิ คราะหค์ วามเช่ือมโยงหรือความสัมพนั ธ์ เป็นการปฏิบัตกิ ารเพ่ือสร้างความสัมพันธ์ ระหว่าง
ข้อมลู ตา่ ง ๆ ในฐานขอ้ มูล เช่น ห้างสรรพสินค้าแหง่ หน่ึงต้องการทราบว่าควรจัดวาง สินค้าใดคู่กับสินค้า
ใดเพื่อช่วยส่งเสริมการขาย เป็นต้น

ผังแสดงข้ันตอนการหาความรู้ใหม่จากการทำเหมืองข้อมูล

ขนั้ ตอนในการทำเหมืองขอ้ มูล
1. คัดเลือกข้อมูล (Data Selection) เป็นการระบุถึงแหล่งข้อมูลที่จะนำมาทำเหมืองข้อมูล รวมถึง

การนำขอ้ มูลท่ี ตอ้ งการออกจากฐานข้อมลู เพ่อื สรา้ งกลุม่ ข้อมลู สำหรับพจิ ารณาเบอ้ื งตน้
2. การกรองข้อมูลและเตรียมการประมวลผล (Data Cleaning and Preprocessing) ข้อมูลที่เก็บไว้

จำนวนมากจะถกู นำมากรองเพอ่ื เลอื กขอ้ มูลทตี่ รงประเด็นเพื่อ นำไปวเิ คราะห์ไดอ้ ย่างเหมาะสม
3. การแปลงรปู แบบขอ้ มูล (Data Reduction and Transformation) เปน็ การลดรปู และจัดขอ้ มูลให้

อยู่ในรูปแบบเดียวกันที่ได้มาตรฐาน และเหมาะสม ที่จะนำไปใช้กับอัลกอริทึมและแบบจำลองที่ใช้ทำ
เหมืองขอ้ มูล

4. การทำเหมอื งข้อมูล (Data Mining) เปน็ ขน้ั ตอนทนี่ ำเอาวธิ ีการหรือเทคนิคการทำเหมืองข้อมูลมา
ใช้เพอ่ื หารูปแบบของความรู้

5. การแปลผลและการประเมนิ ผล (Interpretation/Evaluation) เป็นข้ันตอนการประเมินรูปแบบที่
ได้จากการทำเหมอื งขอ้ มูล ประเมินผล โดยเป็นการวิเคราะหผ์ ลลัพธท์ ีไ่ ด้และแปลความหมายว่าผลลพั ธ์
ความร้นู ั้นเหมาะสมหรือตรง วตั ถปุ ระสงค์หรือไม่

6. การแทนความรู้ (Knowledge Representation) เป็นขั้นตอนการนำเสนอความรู้ทีค่ ้นพบ โดยใช้
เทคนิคในการนำเสนอเพอื่ ใหเ้ ขา้ ใจ และการนำองค์ความรูน้ ้นั ไปประยุกต์ใช้งาน

31

ตวั อย่างการนำเหมืองข้อมูลมาใช้งาน
- ใชว้ ิเคราะห์รปู แบบพฤตกิ รรมการซือ้ สนิ คา้ ของลูกคา้ ในหา้ งสรรพสินค้า
- ใชว้ เิ คราะหพ์ ฤตกิ รรมการเปล่ียนคนื สนิ ค้าของลูกคา้
- ใชห้ ารปู แบบพฤติกรรมของลกู ค้าที่จดั อยใู่ นกลุม่ ผ้มู กี ำลังซ้อื สูง
- ใชว้ เิ คราะหห์ าพฤติกรรมของคนไขท้ ่ีน่าจะมโี อกาสมาหาหมอ หรอื มาโรงพยาบาล
- ใช้วเิ คราะหห์ าความสัมพนั ธ์ระหวา่ งอาการของผู้ป่วยกบั การทำนายโรคที่นา่ จะเกิดขนึ้

สรปุ หนว่ ยการเรียนรู้ท่ี 2 เทคโนโลยกี ารจัดการข้อมูล
ข้อมูล หมายถึง ข้อเท็จจริง หรือเหตุการณ์ที่เกี่ยวข้องกับสิ่งต่างๆ ที่มีการจัดเก็บในหลากหลาย

รูปแบบ เช่น ข้อความ ตัวเลข ภาพนึ่ง ภาพเคลื่อนไหว เสียง โดยข้อมูลเหล่านี้สามารถเกิดขึ้นได้ จาก
แหลง่ ข้อมูลหลายแหลง่

ฐานข้อมลู คอื การจดั เก็บและการบรหิ ารขอ้ มูล เพ่ือใหข้ อ้ มลู มีความเป็นระบบ สามารถเข้าถึงข้อมูล
ได้ง่าย สะดวกในการสืบคน้ และการปรบั ปรงุ แก้ไขขอ้ มลู ลดความซํา้ ซอ้ น และมคี วามปลอดภัย โดยขอ้ มูล
ท่ถี ูกจดั เกบ็ ไวใ้ นฐานข้อมลู จะต้องมีความสมั พนั ธซ์ ่ึงกนั และกนั

คลังข้อมูล คือ การจัดทำแนวทางการจดั เก็บข้อมูลขนาดใหญ่ขององคก์ รหรือหน่วยงานใดหน่วยงาน
หนึ่ง ซึ่งเก็บรวบรวมข้อมูลจากหลายแหล่ง และหลายช่วงเวลา โดยข้อมูลที่ถูกจัดเก็บในคลังข้อมูลนั้น
จะจัดเก็บในลักษณะขอ้ มูลปัจจุบันและข้อมูลยอ้ นหลังเป็นเวลาหลายปี

การทำเหมอื งข้อมูล คือ กระบวนการท่กี ระทำกบั ข้อมูลจำนวนมาก เพื่อหาความสมั พนั ธ์ต่าง ๆ ของ
ข้อมูล ท่ีซ่อนอยู่ โดยทำการเชื่อมโยงข้อมูลที่มีความสัมพันธ์กัน (Association) การจัดลำดับข้อมูล
(Sequence) การจำแนกประเภทข้อมูล (Classification) การแบ่งกลุ่มข้อมูล (Clustering) การหา
รูปแบบของข้อมูล (Pattern) เพ่อื ใหไ้ ด้องคค์ วามรู้ใหม่ ทีส่ ามารถนำไปใช้ประกอบการตัดสินใจ และการ
พยากรณ์ในด้านตา่ ง ๆ

32

บนั ทึกขอ้ มูล
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
..................................................................................................................................................... .......
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................
............................................................................................................................................................