大數據(Big data),或稱巨量數據,是指涉及的數據量大到目前主流軟件工具無法捕捉、管理、處理和整理的信息,以幫助企業在合理的時間內做出更加積極的商業決策。(在維克多·邁耶-勛伯格和肯尼斯·庫克耶合著的《大數據時代》中,大數據是指在沒有隨機分析(抽樣調查)這種捷徑的情況下,使用所有數據的方法。)大數據的4V特征是:體量(海量)、速度(高速)、多樣性(多樣性)、真實性(真實性)。大數據需要特殊的技術,包括大規模並行處理(MPP)數據庫、數據挖掘電力網格、分布式文件系統、分布式數據庫、雲計算平臺、互聯網和可擴展存儲系統。
大數據的四個“V”,或者說特征,有四個層次:壹是數據量巨大。從TB級跳到PB級;第二,數據類型多。前面提到的博客、視頻、圖片、地理信息等等。第三,數據來源直接導致分析結果的準確性和真實性。如果數據來源完整真實,最終的分析結果和決策會更加準確。第四,處理速度快,1秒定律。這最後壹點也與傳統的數據挖掘技術有著本質的區別。業內將其歸為四個“V”
某種程度上,大數據是數據分析的前沿技術。簡而言之,從各類數據中快速獲取有價值信息的能力就是大數據技術。理解這壹點很重要,也正是這壹點讓這項技術有潛力走向很多企業。
搜各種百科,上面都有。說白了就是數據量巨大。這確實是近年來的熱點問題。
上一篇:中植系集團簡介下一篇:佛山國家高新技術產業開發區的產業基礎是什麽?