ชื่อโปรเจค (ภาษาไทย)
                        
                            การวิเคราะห์ปัจจัยที่ส่งผลต่อความล่าช้าของสายการบิน                        
                        ชื่อโปรเจค (ภาษาอังกฤษ)
                        
                            analysis of factors affecting airline delays                        
                        รหัสนักศึกษา
                        
                            65541207047-7                        
                        ปีที่จบการศึกษา
                        
                            2568                        
                        ที่ปรึกษา
                        
                            อาจารย์วรรณพร  ทีเก่ง                        
                        บทคัดย่อ
                        
                                                        โครงงานเรื่อง “การวิเคราะห์ปัจจัยที่ส่งผลต่อความล่าช้าของสายการบิน” (analysis of factors affecting airline delays) มีวัตถุประสงค์เพื่อศึกษาปัจจัยที่มีอิทธิพลต่อการเกิดความล่าช้าในการเดินทางทางอากาศ และพัฒนาแบบจำลองเพื่อพยากรณ์แนวโน้มของความล่าช้า โดยใช้เทคนิคเหมืองข้อมูล (data mining) และอัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) เป็นเครื่องมือในการวิเคราะห์ข้อมูล ชุดข้อมูลที่ใช้คือ 2015 flight delays and cancellations dataset จากเว็บไซต์ kaggle ซึ่งประกอบด้วยข้อมูลเที่ยวบินภายในประเทศของสหรัฐอเมริกาจำนวนกว่า 5.8 ล้านระเบียน ข้อมูลถูกสุ่มด้วยวิธี stratified sampling 5% และผ่านกระบวนการเตรียมข้อมูลด้วยเทคนิค data cleaning เพื่อให้ได้ชุดข้อมูลที่เหมาะสมต่อการวิเคราะห์จำนวน 290,954 ระเบียน กระบวนการวิเคราะห์ใช้กรอบแนวทาง crisp–dm โดยแบ่งเป็นการทำความเข้าใจธุรกิจ การทำความเข้าใจข้อมูล การเตรียมข้อมูล การสร้างแบบจำลอง การประเมินผล และการนำเสนอผลลัพธ์ การสร้างแบบจำลองแบ่งออกเป็น 2 รูปแบบ ได้แก่ (1) การจำแนกประเภท (classification) โดยใช้เทคนิค decision tree และ random forest เพื่อจำแนกสถานะเที่ยวบินเป็น 3 กลุ่ม ได้แก่ on time, short delay และ delay และ (2) การถดถอยเชิงเส้นพหุคูณ (multiple linear regression: mlr) เพื่อพยากรณ์ค่าความล่าช้าเชิงตัวเลขในหน่วยนาที
          ผลการประเมินพบว่า โมเดล decision tree มีความแม่นยำ (accuracy) 90.01% และโมเดล random forest มีความแม่นยำ 89.30% ในขณะที่แบบจำลองถดถอยเชิงเส้นพหุคูณมีค่า r² = 0.873, rmse = 9.875 และ mae = 7.2 ซึ่งสะท้อนว่าโมเดลสามารถอธิบายความแปรปรวนของข้อมูลได้ถึงร้อยละ 87.3 ปัจจัยที่มีผลมากที่สุดต่อความล่าช้าคือ departure delay และ late aircraft delay จากนั้นได้พัฒนาเว็บไซต์ต้นแบบ airanalytica เพื่อแสดงผลการวิเคราะห์ในรูปแบบกราฟ แผนภูมิ และแดชบอร์ดแบบโต้ตอบ เพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้สะดวกและเข้าใจแนวโน้มของความล่าช้าได้ง่าย
          โดยสรุป การประยุกต์ใช้เทคนิคเหมืองข้อมูลและการเรียนรู้ของเครื่องร่วมกับการนำเสนอผ่านเว็บไซต์ ช่วยเพิ่มประสิทธิภาพในการวิเคราะห์และสื่อสารข้อมูลเชิงซับซ้อนให้เข้าใจง่าย สามารถต่อยอดสู่ระบบพยากรณ์ความล่าช้าแบบเรียลไทม์ สนับสนุนการตัดสินใจของสายการบิน และยกระดับประสิทธิภาพการบริหารจัดการในอุตสาหกรรมการบิน                        
                                                ไฟล์เอกสาร
                        
                        
                        ป้ายกำกับ