如今,似乎每壹筆新技術的投資都必須經過嚴格的財政支出篩選過程。?IT成本是IT和業務經理在提議啟動項目或部署新工具時需要考慮的首要問題之壹。
有些人認為數據分析本質上是壹項昂貴的工作,因此它僅限於預算較大或內部資源較多的企業。但事實並非如此。市場上有許多開源工具和其他工具可以幫助展示數據分析的價值。而基於雲系統的大數據架構會比傳統的數據倉庫便宜很多。妳只需要知道內部的數據存儲和要解決的問題,就可以很容易地在雲上使用分析來解決業務問題。
此外,數據分析通常用於實現三個結果:提高流程效率、實現收入增長和積極管理風險。總的來說,數據分析在任何公司的應用中都帶來了巨大的性價比。
2.妳需要嗎?大數據?為了進行分析
對於許多人來說,大數據和分析的概念是互補的。企業需要在執行分析之前收集大量數據,以便生成業務洞察和改進決策。
當然,大數據分析的優勢也很明顯。擁有這些資源的公司將大數據存儲作為促進分析的壹部分,並獲得顯著的競爭優勢。但是大數據並不是分析的必備搭配。
分析師需要具體的數據,而不是更多的數據。為了更好地支持決策和提高性能,企業必須更多地考慮業務用戶,並確定他們需要訪問哪些數據以及如何呈現這些數據,而不是關註更多的數據。超過95%的用戶會尋找與自己工作相關的信息來支持自己的決策,提高自己的經營業績,因此企業需要以最簡單的格式為他們提供這些信息,幫助他們快速定位重要信息。
3.分析消除了人類的偏見。
自動化系統的實現方式不應該有偏見,但技術是由人類構建的,所以幾乎不可能消除所有的偏見。
有人認為分析和機器學習消除了人類的偏見。不幸的是,這壹點沒有實現。算法和分析用途?訓練數據?進行調整並復制它們?訓練數據?在某些情況下,它會在分析過程中引入良性偏差,但也可能帶來更嚴重的偏差?因為?算法這麽說?並不意味著答案是公平的或有用的。
4.最好的算法意味著絕對的勝利。
事實證明,有了足夠的數據,有時候算法並不重要。谷歌的工程師認為這些數據是不合理有效的。壹個簡單的統計模型,加上海量的數據,比壹個包含大量特征和摘要的模型要好?智能優越模型?能輸出更好的結果。
因此,在某些情況下,只有處理大量數據才能獲得最佳結果。
5.算法是安全的。
人們固執地相信統計模型和算法,隨著分析程序的組織和構建,他們會越來越依賴復雜的模型來支持決策。也許是因為用戶認為自己沒有挑戰模型的能力,所以不得不信任構建模型的人?聰明人?。
比如,在過去的五六十年裏,我們反復聽到?20年後人工智能會接管人類的工作嗎?有些人反復強調這個觀點。在我們可以完全信任機器學習和它們輸出的結果之前,還有很多事情要做。在此之前,我們需要挑戰構建算法和模型的人,以解釋如何獲得答案。這並不意味著我們不能依賴結果,而是我們需要透明度,以便我們能夠信任和核實分析結果。