簡單常見的對比分析最經常出現的四大錯誤:
錯誤壹:對比對象不壹致
美國歷史上有壹個海軍的征兵宣傳:與西班牙交戰期間,美國海軍死亡率為千分之9,而同期紐約市的居民死亡率為千分之16。所以參軍更安全!
這個案例的問題在於對比的對象範圍不同:壹邊是身強力壯的參軍小夥,另壹邊的紐約居民包含了更多範圍如自然死亡、老弱病殘、交通事故、刑事犯罪等問題。
同樣的問題也頻繁出現在新聞裏,如《外賣小哥薪資遠超白領》:顯然將外賣小哥行業中薪資最高的那壹小撮人與普通白領“降維比較”自然就可以得出這樣的結論。
錯誤二:時間範圍不壹致
例如某應聘HR的簡歷上有這樣的自我宣傳,前公司以前銷售員的離職率是12%,而該HR到崗後,公司銷售員的離職率下降至4%。
這時,作為專業的數據分析師,必須要問多壹句:這兩個 指標的計算時間範圍是否壹致? 是否都是按月/季度/年計算?
錯誤三:定義、計算邏輯不同
業務指標背後的數學公式有很多變形,如果沒有統壹好,這樣的對比也是沒有意義的。
復雜的指標,例如重購金額,因為業務需求不同, 如何定義“重購行為” 就很容易產生誤差:
曾經註冊過的會員,回櫃消費,就算是重購
僅曾經消費過的人,回櫃消費,才算重購
再比如, 當月完成首次消費和二次消費的會員,在計算當月重購指標時, 也會有困難:如果按消費行為,將首次消費算入首購金額,二次消費訂單算入復購,但這個會員是否可算入重購會員中?
所以,每當看到 指標對比 時,要第壹反應想起 背後的計算公式是否在同壹語境下。
錯誤四:數據源不壹致
數據源錯誤的問題很隱蔽,壹個常見的場景就是在尚未建立數據中臺的企業裏,業務部門有不同的信息系統存儲數據,例如訂單數據就可以存在在ERP系統、POS系統、CRM系統中,數據在系統之間流轉,難免會產生誤差,所以即使是同樣的數據計算指標,在CRM系統裏計算出來,和在ERP系統裏計算出來可能會有誤差。
此外,隨著業務需要,系統維護升級是家常便飯,在升級過程中,數據同步往往會有波動,這時候再去計算指標,或許會得到不壹樣的結果。
所以 不同業務部門之間 進行指標對比時,要放在同壹語境下,才有意義。
實戰案例數據同比分析中常見的同比錯誤
案例壹:日銷售報表分析中,2021年1月4日的零售額同比2020年1月4日下降30%,所以2021年1月4日銷售存在問題?
實際上, 結合具體行業思考,如果是在季節/周期性較強的零售業,這樣的對比並沒有實際意義: 因為2021年1月4日是工作日,而2020年1月4日是周六,根據常識,周末的人流壹定會更多,進而各方面的銷售指標也更優。
也就是說對於零售企業來說,這兩個日期處在不同業務場景,所以不能這樣直接比較。
同樣的原則( 是否周末 )可以延展到 是否節日 ,如情人節與情人節同比、聖誕節與聖誕節同比。
此外,還有隱藏比較深的 放假周期 :今年十壹放七天假,上壹年是否也是同樣地放七天假; 活動周期 :尤其是在 天貓等電商行業 ,每年的雙十壹活動周期都不壹樣,例如2020年雙十壹與2019年相比,多了11月1日-3日的正式銷售高峰,所以在做同比時,數據指標期望上應該有所調整。
案例二:假設不考慮疫情影響,月報分析中,2021年2月的銷售同比2020年2月下降5%,所以2021年2月銷售存在問題?
此時我們不得不借助 日歷 來判斷這樣的分析是否合理。
1、 銷售日數 查看日歷就可以發現:
2020年是平年2月有28天
2021年是閏年2月有29天
所以相差1天的背景下,銷售有差距是否合理?
2、 是否節日 此外,再來看日歷也會發現:
2020年春節在1月25日
2021年春節在2月12日
對於零售企業,是否存在春節檔期的銷售更好的情況?如果是的話,有節假日的月份銷售是否應該比沒有節假日的同期2月更多才對呢?
3、 周末數量 再來重新觀察日歷:
2020年2月有9個周末
2021年2月只有8個周末
正如案例壹裏討論的,零售行業相差壹個周末,可能銷售數據就是百分之幾的差距。
所以綜合以上幾點,再來判斷2月銷售表現可能更合理壹些。