大數據有其歷史的壹面:個人需要查找整個企業的舊數據來確定相關的發展趨勢,或更充分的了解目前的業務問題。長期來看,這有助於相關不好的因素可以緩解。
在這樣的背景下,歷史數據也需要能夠立即訪問,而無需IT部門進行大規模的數據恢復。從戰略上講,這意味著網站應進行相應的規劃準備,方便用戶訪問有關的歷史數據信息(而無需IT部門的調解),並實時獲得新創建的數據信息。
IT部門從未以更加“關鍵任務”的態度來處理歷史數據。多年來,用於數據歸檔的方法壹直是采用的壹個面向數據的保存管理和以備份為目的。備份采用的是速度較慢(而且造價更便宜的)磁盤,或甚至是磁帶系統。有時這些數據需要壹定的監管,但如何監管呢。在數據恢復的過程中,IT部門也發現存儲這些數據的某些磁帶會降級到數據不可讀的地步。
正是以這種“備份”的心態進行的大數據歸檔,潛在的限制了企業現在所收集和挖掘的大數據的端到端的價值。
如下便是兩個很好的案例:
某金融服務公司的營銷團隊發現,壹個特定細分人群的購買模式正在發生變化,他們想知道為什麽。盡管他們能夠通過幾近實時的執行大數據和標準數據分析很清楚地看到新的變化,但該營銷團隊真正想明白的是驅動這些變化的原因,以及這些因素是從何時開始影響這壹特定細分人群的購買模式的。如果該營銷團隊可以找到這些因素,他們才能夠及時的順應消費者的變化趨勢,以便提供相關符合客戶新的購買模式的產品給專業買家。
某區域的壹家大型醫院發現,在某壹特定地理區域患大腸癌的病人的幾率水平高於其他地區。醫院要看看可能與環境有關的致病因素,或者該地區的其他特征。所以他們需要快速訪問該地區過去十年的歷史研究數據。
在解釋致病因素這樣的案例中,需要能夠方便和靈活的訪問大數據,而這些大數據可能基於歷史上每壹天所收集的數據信息。這是潛在的非常關鍵的任務,但如果是僅僅著眼於災難恢復和備份較大的數據,而不是多用途的歸檔,也可能失去這些歷史數據信息。
所以IT部門需要采取哪些相關步驟,以確保其龐大的數據存儲策略是足以滿足業務信息訪問的全方位的需求呢?
以更廣闊的視野來處理大數據相關的關鍵任務工作。大數據分析能夠在瞬間充分滿足“需要知道”的需求,但同時對於歷史數據的研究也是非常重要的,取決於對數據的即時訪問。
用企業的終端業務來審查數據歸檔策略。如果您的企業是從壹個存儲層自動存儲大數據,在經過30天或60天後再將不使用的數據信息存儲到更便宜的磁盤系統?或者妳的企業有別的不同方案。無論妳企業的大數據歸檔政策是怎樣的,這壹歸檔政策都應該讓企業的終端業務決策者每年進行審查。
確保舊的存儲介質的質量。尤其是磁帶可能會變壞監控歸檔區的濕度和溫度是非常重要的,同樣重要的是定期檢查磁帶降解的可能性,以便您可以在相關存儲的數據變得不可讀之前,及時的進行處理。