ข้อมูลรายละเอียดโปรเจค
เพิ่มโดย นางสาวหทัยวรัทย์  จรูญดาวเรือง เมื่อ 2025-10-21 01:18:37
ชื่อโปรเจค (ภาษาไทย)
การประยุกต์ใช้เทคนิคการวิเคราะห์การจัดกลุ่มเพื่อทำความเข้าใจความหลากหลายของ data scientist
ชื่อโปรเจค (ภาษาอังกฤษ)
applying clustering analysis techniques to understand the diversity of data scientists
รหัสนักศึกษา
66541207028-6
ปีที่จบการศึกษา
2568
ที่ปรึกษา
อาจารย์ธีรภพ  แสงศรี
บทคัดย่อ
โครงงานเรื่อง “การประยุกต์ใช้เทคนิคการวิเคราะห์การจัดกลุ่มเพื่อทำความเข้าใจความหลากหลายของ data scientist” มีวัตถุประสงค์เพื่อวิเคราะห์และจำแนกเงินเดือนของ data scientist โดยพิจารณาจากปัจจัยด้านประสบการณ์การทำงาน ตำแหน่งงาน ทักษะ ความเชี่ยวชาญเฉพาะด้าน และคุณลักษณะอื่น ๆ ที่เกี่ยวข้อง เพื่ออธิบายลักษณะเฉพาะของแต่ละกลุ่มที่ได้จากการจำแนก เช่น ระดับเงินเดือน ความสัมพันธ์กับประสบการณ์ และปัจจัยสำคัญที่ส่งผลต่อความแตกต่างของตลาดแรงงานสาย data scientist
          โครงงานนี้ใช้กระบวนการ crisp-dm ในการวิเคราะห์ข้อมูลตั้งแต่การทำความเข้าใจธุรกิจ การเตรียมข้อมูล การสร้างโมเดล และการประเมินผล โดยทำการทำความสะอาดและแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสม เช่น การจัดกลุ่มเงินเดือน ตำแหน่งงาน และภูมิภาค จากนั้นสร้างโมเดลด้วย decision tree  ผ่านโปรแกรม rapidminer พบว่า decision tree 
เป็นโมเดลที่เหมาะสมที่สุด เนื่องจากมี accuracy 89.17% สูงและอธิบายกฎการตัดสินใจได้ง่าย ผลลัพธ์สามารถจำแนกเงินเดือนได้เป็น medium, large, small พร้อมวิเคราะห์ความสัมพันธ์กับประสบการณ์และตำแหน่งงาน และนำเสนอผ่าน เว็บไซต์ ในรูปแบบกราฟและตารางเพื่อให้ผู้ใช้งานเข้าใจข้อมูลได้ง่าย

ไฟล์เอกสาร
ป้ายกำกับ