更新時間: 2019/10/13

長榮航空組-題目與資料問題

Q.

Q1. 長榮組初賽說明需以成本控管為目標提案,請問5頁的提案內容是否需要有明確的結論(ex.減少何者以達到成本控管)?

Q2. 
長榮組的成本控管是否限制在油料控制,還是可以從人員或管理成面下手?

Q3. 
長榮組成本控管要在合理的飛安及服務品質的條件下,不過服務品質要如何量化?

Q4. 
長榮組飛安也很難被量化,比如說飛機的燃油要比基準量高多少才在安全的範圍?

Q5:
長榮旅客資料是指所有登機的旅客資料,還是僅有定票但不一定有上飛機的旅客資料?

Q6: S_Fri_BR_3303_2002290C0003157C 這個意思是解讀為這個旅客是搭 S_Fri_BR3303_SJCTPE這個班機嗎?如是,那共有229筆資料是 S_Fri_BR3303開頭,是否可以解讀為同天共有229個乘客搭了同一班機?

Q7: 燃油成本量數是如何量化的?

Q8: 行李件數(Bag_Cnt)、行李重量(Bag_Wt_Msr) 這兩個變數是否有遺漏值?

Q9: 請問共掛行李的定義

Q10: 
旅行區域序號所代表的意義是甚麼?假設台灣到歐洲,旅行區域序號不一樣的話,可以拿來作比較嗎?如果轉機的話,旅行區域序號會不會一樣?

Q11: (1)想請問從A到B點,不同時段起飛,編號也不同,算同一個航線嗎?例如:桃園到休士頓有航班3328以及3330,這樣算同一個航線嗎?
(2)同航線的燃油成本量數是不是就可以比較?
(3)
想請問航班跟航線是一樣的嗎?

A.

A1. 請透過探索性資料分析報告找出影響成本的關鍵因素,提案中請給予合適的建議以有效控管該成本。請以比賽提供的資料為探索方向,也可以在open source data找其他資料(例如天氣、油耗),作為成本控管結論的依據。

A2. 主要以燃油成本為方向,請針對比賽資料裡找到的insight作提案。

A3. 
服務品質的確很難量化,也無法從比賽資料裡得知,如果可以從其他開源資料找到相關的數據是很好,不過成本控管基本上還是以飛機的載重及飛行時間為主要的成本考量。

A4. 
比賽資料有提供燃油指數的欄位,燃油指數越高,飛機的耗油量越大,此外也可以參考同航線同時段飛機的燃油量平均數,做為參考依據。

A5. 
有含登機和未登機的旅客 pax_detail.csv / Brdg_Stat_Desc (已登機:表示有登機 / 未登機:表示僅有訂位,未登機)

A6.  S_Fri_BR3303_SJCTPE 為夏令(S),星期五(Fri),航班編號 (BR3303),起迄機場為 (SJC-TPE)S_Fri_BR_3303_200…僅表示該名旅客有預訂BR3303的行程,但不代表該旅客有實真登機行為 (登機狀態請參考Brdg_Stat_Desc:已登機才表示登機,未登機即表示該旅客未如預定行程前來搭機)。 故229筆資料代表當日預訂旅客共229人,實際搭機人數需另外依前述欄位來計算。

A7.  該指數是提供一個相對性的概念(從0~100之間),數值代表該航班(次)的用油量,分數愈高代表用油量愈高。

A8.  此2個欄位已將資料進行處理,因此並不會有遺漏值。

A9.  如果是同伴或家庭出遊時,可能會將行李一同過磅並統計件數,其託運條碼會貼附在其中一位旅客的登機證上。例如:Pax_key中,S_Fri_BR_3303_2002290C0003157C,S_Fri_BR_3303_20050A1A0000B7BF,即為此例;2人結伴旅行,其即屬於共掛行李的案例,合計二人其行李為4件,83公斤。

A10.  請參閱od_segment補充說明,旅行區域序號很類似訂單的概念,訂單中,我們想像成產品的分類就是OD_Grp_Id,Seg_Id就像是單一產品。

如果,旅客在預訂行程時,去回程航班或轉機航班是一同預訂的話,Tvl_seq就會是相同的;如果是分開預訂的話,Tvl_seq就有可能會是不同的。Tvl_seq的編碼和旅客的預訂行為有關,和航段、航線、去回程或轉機無直接關係。原則上,如果旅客需要轉機的話,他的Tvl_seq大部份是相同的。

*od_segment 說明: 資料表存放了旅客的旅行區域資料 (階層:Tvl_seq=>OD_Grp_Id =>Seg_Id) 在相同的Tvl_seq下,請對OD_Grp_Id 進行遞增排序, 再對Seg_Id進行遞增排序

A11.  

(1)從A到B點,不同時段起飛,航班編號自然不同,但,還是屬於同一航線。

(2)同一航線的量數相互比較,至少是比較接近的,因為可能飛航的路線、距離、營運機型都可能比較接近。

(3)航線和航班是不一樣的;同一航線會有不同的出發時間帶或機型等調整。以同學的例子來說,桃園到休士頓屬於航線;BR3328 / 3330 屬於航班,承2. 同一航線或航班的量數可能會比較接近,故而可比較這些變數間可能存在的差異或變因;如果航線、航班都不同時,其可能影響的變因又更複雜了,不適合相互比較。