當前位置:法律諮詢服務網 - 企業資訊 - 關於大數據的五個神話

關於大數據的五個神話

關於大數據的五個神話

最近,關於大數據的新聞占據了各大媒體科技報道的主要版面。然而,許多文章似乎華而不實,壹些報告主張大數據是可以解決所有問題的解決方案,如入侵檢測、欺詐預防、癌癥治療,甚至制定最佳產品價格。

但業內定義的大數據是指快速收集的、多樣的、海量的數據集合,而不是可以處理所有問題的通用解決方案。在現實中,如果壹些企業偏信這些與大數據相關的神話,那麽這些企業很可能會偏離正確的軌道,走錯方向,浪費大量的時間和金錢,失去在市場中的有利競爭地位,還可能損害企業的聲譽。

本文講述了行業中經常出現的關於大數據的五大誤區。

1.只有數據科學家才能處理大數據。

事實上,在處理大數據時,僅僅依靠數據科學家是不夠的。

“如果妳不能首先確定妳需要什麽樣的信息,那麽數據科學家就不可能靠自己成功地從大數據中提取有用的信息,”賓夕法尼亞大學醫學數據分析部高級主管帕特·法雷爾(Pat Farrell)說。“妳還需要熟悉行業趨勢、擁有相關領域知識的人才。他們知道問題在哪裏,什麽樣的解決方案對妳的領域最有價值。”

比如賓夕法尼亞大學醫院有兩個系統,壹個是醫學系統,壹個是醫學院系統。長期以來,醫療系統通常從數據倉庫中收集臨床醫療數據。同時,在醫學院系統中,出現了壹種新的技術,可以實現人類基金群體的測序,產生大量的數據。

法雷爾說:“我們知道這些數據中肯定有壹些價值,我們終於擁有了獲取這些價值的計算能力。我們將專業的醫學知識與數據分析技術相結合,為預測醫療開辟了壹個新的更廣闊的領域。”

2.數據越大,價值越大。

在登記到書中之前,需要花費大量的時間和資源來收集數據和存儲數據。如果企業或機構不分青紅皂白地任意收集大量數據,很可能造成大量的資源浪費,而這些資源可以用於更有價值的項目。

法雷爾建議,企業在收集數據之前,壹定要有壹個具體的目標或關鍵的績效指標,明確自己需要什麽樣的數據,才能有目的地收集數據。

法雷爾說:“妳需要從妳收集的數據中提取有價值的信息,但這並不意味著妳收集的數據越多,妳獲得的價值就越大。”

3.大數據是給大企業用的。

大企業可能有更多的內部數據源,可以利用這些數據獲取對自己企業發展有價值的東西。但是,這並不意味著大數據只被大企業使用。小企業也可以從社交媒體平臺、政府機構和數據提供商那裏收集數據,並從這些數據中提取有益的信息。

戴爾軟件信息管理解決方案部門的產品管理高級主管達林·巴提克(Darin Bartik)表示:“對於企業來說,無論規模有多大,利用數據分析做出的決策都要比單純依靠直覺或第六感做出的決策好得多,也更可靠。”

雖然小企業不像大企業那樣經常使用數據分析進行決策,但是當他們這樣做的時候,就會使公司走向快速正確的發展軌道。

達林·巴提克(Darin Bartik)說:“小企業可以利用他們的最佳實踐,進壹步推動企業數據分析和決策的發展,從而趕上或超過那些強大的競爭對手。”

4.收集數據後,沒有及時整理分類。

舊金山雲計算商業智能提供商Birst的首席執行官布拉德·彼得斯(Brad Peters)表示,盡管數據存儲的成本越來越低,但它並不是免費的。然而,對於許多大公司來說,他們對數據需求的增長速度快於數據存儲成本的下降速度。

許多企業在收集數據後往往不能快速處理,導致數據存儲成本增加。布拉德·彼得斯(Brad Peters)說:“我發現許多大型企業或機構在收集了大量數據後沒有及時處理這些數據,導致他們在這些數據上的支出逐漸增加,他們沒有從這些數據中獲得任何價值。”

事實上,企業中的壹些數據集已經開始造成企業的收益遞減。這種現象就好比通過分析選民數據信息來預測選舉結果。在預測的過程中,妳需要壹定數量的投票者作為樣本,但是如果樣本數量超過壹個臨界點,無論增加多少投票者,都不會對預測結果有什麽大的影響。換句話說,如果樣本數量太大,成本會更多,但對目標沒有實質價值。

“如果數據是冗余的,企業不僅要為存儲成本買單,還會面臨許多其他問題,”Recommind的信息治理和大數據管理全球總監Dean Gonsowski說。比如數據泄露,公司也要承擔相應的損失。Recommind是壹家位於美國舊金山的公司,專註於非結構化數據分析。

最後,數據越多,整理數據的時間就越長。迪恩·貢索斯基(Dean Gonsowski)說:“當數據倉庫的規模達到數十億條記錄時,僅檢索這些數據就需要數小時甚至數周時間。這個時候,這些信息不會給企業帶來商業價值,反而會阻礙企業系統的運行,因為這些系統根本無法處理這麽大的信息量。”

5.所有數據都壹樣。

美國弗吉尼亞州在過去20年中收集了學生註冊信息、獎學金和學位授予的數據,但這並不意味著20年前收集的數據和存儲在同壹個數據域中的數據壹定是相同的數據。

弗吉尼亞州高等教育委員會政策研究和數據倉庫部主任托德·馬薩(Tod Massa)說:“由於數據存儲在壹個數據倉庫中,研究人員認為這些數據都是等價的,這是我需要處理的最大問題之壹。我們收集了ACT(美國大學考試)和SAT(學術評估考試)的學生成績。壹開始我們只收集了整個弗吉尼亞州的學生成績,但這導致我們的調查研究出現了空白,所以後來我們不僅收集了弗吉尼亞州的數據,還收集了其他州學生的數據。而且不同種族在K-12水平和高等教育的數據也不壹樣。”

事實上,任何特定的數據,如果由不同的機構、不同的時間、不同的人發布,都會有所不同。托德·馬薩(Tod Massa)說:“如果收集數據的公司或組織完全與世隔絕或與世隔絕,情況可能會有所不同。但我認為他們收集的數據會隨著時間而變化。”

因此,數據分析師不僅要有數據統計的技能,還要有壹定的數據知識,清楚了解相關行業的趨勢和整體發展趨勢。

這也適用於從外部數據源收集的數據。過去的數據收集和分析方式已經完全改變。能夠了解不同的數據文化背景和數據環境,對於充分利用這些數據是非常必要的。

  • 上一篇:如何深化簡政放權放管結合優化服務
  • 下一篇:就業問題
  • copyright 2024法律諮詢服務網