如下:
1、可靠性原則:信息必須是真實對象或環境所產生的,必須保證信息來源是可靠的,必須保證采集的信息能反映真實的狀況。
2、完整性原則:信息采集必須按照壹定的標準要求,采集反映事物全貌的信息,完整性原則是信息利用的基礎。
3、實時性原則:信息自發生到被采集的時間間隔,間隔越短就越及時,最快的是信息采集與信息發生同步。
4、準確性原則:采集到信息的表達是無誤的,是屬於采集目的範疇之內的,相對於企業或組織自身來說具有適用性,是有價值的。
5、計劃性原則:采集的信息既要滿足當前需要,又要照顧未來的發展;既要廣辟信息來源,又要持之以恒。
6、預見性原則:信息采集人員要掌握社會、經濟和科學技術的發展動態,要隨時了解未來,采集那些對將來發展有指導作用的預測性信息。
信息采集的渠道:
1、傳統信息系統。傳統信息系統采集的信息往往具有較高的價值,壹方面原因是傳統信息系統采集的往往是結構化數據,易於統計和分析,另壹方面原因是傳統信息系統采集的數據往往是比較重要的數據。
2、Web平臺。信息來源的另壹個重要渠道是各種Web平臺,隨著Web應用的普及,尤其是Web2.0的普及應用之後,整個Web系統產生了大量的數據,這些數據也是大數據系統的重要數據來源之壹。
3、物聯網系統。物聯網與大數據的關系非常緊密,與傳統信息系統和Web系統不同,物聯網的數據大部分都是非結構化數據和半結構化數據,要想對其進行分析需要采用特定的處理方式,比較常見的處理方式包括批處理和流處理。