生活中離不開的資料科學

2024 年 08 月 02 日2024 年 07 月 31 日 CASE PRESS 外送服務, 大數據, 資料科學

分享至

你常常點食物、生鮮外送嗎？網路普及之後，越來越多便捷的服務充斥在我們生活當中。除了許多人的「衣食父母」外送服務外，像是出行時的招車服務、做生意的接單系統等，這些系統的運作全仰賴資料科學在背後進行運算，才能最即時地將你所需的服務送到你手上。以外送服務為例，其實從你下單、店家接單到商品送達你的手上，這中間的每一個步驟其實都有經過縝密的設計，像是店家準備食物的時間、外送員跑單的時間等等，皆是經由資料科學複雜的運算，才能達到最好的服務品質喔！

撰文｜王紹芳博士

資料科學有何用途？

在資料科學中，一個常見的框架將分析分為三種類型：描述性、診斷性和預測性。這些分析方法使我們能夠理解過去的事件，深入探討特定事件發生的根本原因，以及預測未來的結果。那麼，資料科學家如何利用這些分析方法來解決現實世界的問題呢？

想像一下，你正在設計一個類似Uber Eats或Foodpanda的食品送遞服務應用程式，目標是確保迅速且新鮮地將食物送遞給顧客。當使用者在應用程式中下訂單時，指定的餐廳開始準備訂單。完成後，一位送遞合作夥伴會收到通知，在餐廳取餐並將其送遞給顧客。

然而，一個關鍵問題出現了：食品送遞系統應該何時派遣送遞合作夥伴去餐廳取訂單？過早派遣可能會導致送遞合作夥伴在餐廳等待，而食物正在準備中，這是不必要的。派遣太晚可能會影響食物到達時的新鮮度，並使顧客失望。效率低下的系統不僅會浪費送遞合作夥伴的時間，減少潛在的送遞次數，影響其收入，還會影響餐廳可以接待的訂單數量，以及顧客對送遞食物的滿意度。

為了應對這些挑戰，我們運用三種資料科學方法論。通過結合描述性、診斷性和預測性分析，我們可以全面瞭解我們送遞系統的表現，並策略性地增強我們的應用程式，以滿足不斷變化的需求。

描述性分析：發生了什麼事？

描述性分析涉及總結歷史數據，以了解過去事件並形成對業務的全面理解。在食品送遞服務的背景下，分析歷史行程數據使食品送遞公司能夠在整個送遞過程中識別模式和趨勢。例如，收集不同時間可用送遞合作夥伴的數量、收到的訂單量以及任何每日或每週的趨勢信息，都可以提供寶貴的見解。

此外，了解食品送遞過程每個步驟所花費的時間很重要，以便創建反映訂單旅程的時間表。這包括分析行程各階段典型的持續時間，從派遣到交付，以及檢查這些持續時間的變異性。

通過具體的例子，讓我們深入探討訂單準備好取餐和實際取餐之間的時間間隔。理想情況下，我們希望這個間隔盡可能短：一旦食物準備好，我們希望送遞合作夥伴能立即到達取餐。但是，為了瞭解這個間隔的現實情況，我們需要分析來自真實訂單的數據。使用摘要統計量如均值和中位數幫助我們理解中心趨勢。此外，檢查第25和第75百分位數可幫助我們識別較短和較長的間隔，提供對訂單間變異性的見解。計算標準差進一步闡明這些持續時間的分布。

通過箱形圖或直方圖進一步視覺化這些指標的分佈有助於我們理解它們的變異性。例如，綠色的箱形圖和直方圖描述了訂單準備好取餐和實際取餐時間之間的時間間隔的分佈。經過視覺檢查，它呈現出較寬的分佈，右側有一個明顯的長尾（平均= 18.22分鐘；中位數= 13.93分鐘；標準差= 13.88分鐘；最小= 0.10分鐘；最大= 61.88分鐘）。我們還可以觀察到送遞時間分佈中的兩個明顯峰值：一個在10分鐘以下，另一個在20至40分鐘之間。

另一方面，橙色的箱形圖和直方圖顯示烹飪時間的分佈較窄，表明變異性較小（平均= 14.78分鐘；中位數= 14.64分鐘；標準差= 5.04分鐘；最小= 1.40分鐘；最大= 29.09分鐘）。平均值和中位數的接近表明分佈相對對稱。

根據這一分析，準備食物所需的時間看起來合理且相對穩定，持續時間和波動在可接受範圍內。然而，準備好食物和實際取餐之間的時間卻令人擔憂。它往往超過30分鐘，表明持續時間的變異性很大，從非常短到非常長不等。這種不確定性降低了我們食品送遞應用程式的質量。我們可能進一步詢問為什麼有些情況下時間少於10分鐘，而其他情況下超過30分鐘，假設這是由於來自相似位置的相似餐廳的送遞合作夥伴交付。

診斷性分析：為什麼會發生？

診斷性分析旨在了解導致觀察現象的潛在原因或因素。雖然進行實驗或操縱情境以收集數據以建立實際因果關係並非總是可行的，但各種統計方法，如回歸和相關性分析，提供了一種利用觀察數據來識別感興趣因素之間堅固關係或聯繫的手段。這產生了可行動的見解，有潛力增強業務運營。

在我們的食品送遞例子中，我們的數據顯示，送遞合作夥伴抵達餐廳和食品準備好取餐之間的等待時間並不理想。診斷性分析可能會揭示導致送遞合作夥伴抵達時間過早或過晚以及影響食品準備時間的因素。

也許我們觀察到這段時間間隔與週末或平日，以及餐廳是否位於市中心之間存在著密切相關性。此外，利用手機的動作感應器數據，我們可能發現送遞合作夥伴花費大量時間尋找停車位。綜合起來，這可能意味著大多數遲到的送遞合作夥伴往往是來自市中心餐廳的週末訂單，可能是因為他們花費更多時間尋找停車位。相反，我們可能會發現送遞合作夥伴通常不會遲到其他時間和地點的訂單。此外，食品準備時間在週末和平日之間似乎是一致的。最後，假設我們觀察到位於市中心、有指定取餐停車位的餐廳，在抵達和取餐之間的時間間隔非常短。

以下是我們可以使用描述性分析相同虛構數據進行的一個診斷性分析示例。在此分析中，我們按照平日和週末將食品準備好取餐和實際取餐之間的時間進行了細分。數據顯示，平日這段時間間隔非常短且合理，平均為7.03分鐘，中位數為6.53分鐘。然而，這段時間間隔的不確定性和不良的長時間似乎源於週末送遞。週末的平均時間為29.87分鐘，中位數為28.71分鐘，範圍從最短的4.14分鐘到最長的61.88分鐘。這提供了證據，表明導致這段時間間隔變異性的一個因素是平日和週末訂單之間的差異。

總體而言，我們的分析顯示，送遞合作夥伴等待時間延長與來自市中心餐廳的週末訂單之間存在顯著相關性，可能是由於停車尋找時間增加。

診斷性分析擴展了我們的描述性發現，為送遞合作夥伴抵達時間相對於食品準備情況的解釋提供了依據。根據這些發現，我們可以制定並實施潛在的解決方案。例如，我們可以鼓勵市中心的餐廳提供路邊取餐服務，以避免停車問題。此外，系統可以預先派遣送遞合作夥伴以應對預期停車延誤，或通知合作夥伴關於可能出現的停車時間延長。這些措施旨在縮短食品準備好取餐和取餐之間的時間，增強食品送遞過程的整體效率。

預測性分析：將會發生什麼？

預測性分析涉及使用統計模型基於歷史資料預測未來結果。其主要目標是根據我們對過去的瞭解，通過各種統計分析和機器學習技術來預測未來事件。

接下來的例子中，預測性分析可以動態預測何時提前派遞送遞合作夥伴。我們之前的研究發現，週末來自市中心餐廳的訂單送遞合作夥伴需要額外的時間來尋找停車位。因此，我們可以開發一個機器學習演算法，從歷史行程資料中學習，預測抵達和取餐時間超過某一閾值的情況，提示提前派遞的需要。我們還可以預測尋找停車位所需的時間，以確定我們需要提前派遞送遞合作夥伴多少時間。

模型的輸入可能包括各種因素，如訂單時間、餐廳位置、預測的交通和天氣條件，以及餐廳附近可能影響停車位可用性的重要事件，如音樂會、體育賽事和會議等。此外，我們可以通過確定在特定情境下提前派遞送遞合作夥伴的最佳提前時間來增強我們的預測。例如，如果模型預測由於附近的主要活動導致交通擁堵，它可能建議提前派遞送遞合作夥伴以應對潛在的延誤。此外，模型可以整合過去主要活動的歷史資料，準確估計延誤的持續時間，進而更準確地預測所需的提前時間。通過利用這些預測性分析，我們可以改善派遞流程，提高食品送遞營運的整體效率。

利用分析洞察力持續改進業務

我們的業務改進工作並不止步於此。在實施這些變化並完善我們的預測性分析模型後，我們可以對資料進行描述性分析，評估送遞合作夥伴抵達時間相對於食品準備情況是否有所改善。此評估將使我們能夠確定我們的努力是否確實改善了派遞流程，提高了食品送遞營運的整體效率。如果我們在這些變化後識別到其他弱點，我們可以進行診斷性分析，以瞭解原因並找到解決方案。這種疊代過程可以多次重複。最終，目標是通過減少等待時間並及時送遞新鮮熱食，為我們的客戶提供更好的體驗。

利用描述性、診斷性和預測性分析提供了強大的工具箱，供業務和研究人員使用。這些分析方法不僅揭示了過去事件和目前挑戰，還為制定積極策略以提高效率和效果打下基礎。通過利用從資料科學方法中獲得的見解，企業可以做出明智的決策，改善流程，並最終為客戶提供更好的結果！

✨延伸閱讀：若想閱讀英文版，請參見 "The secret behind Big Data-Data Science"、《大數據背後的祕密——資料科學》

(Visited 629 times, 1 visits today)

分享至