數據收集主要是通過計算機和網絡。所有經過計算機處理的數據都很容易收集,比如在瀏覽器中搜索,點擊,網上購物,...其他數據(如溫度、海水鹽度、地震波)可以通過傳感器轉換成數字信號,輸入計算機。
壹般來說,首先要對收集到的數據進行排序。常用的軟件:Tableau和Impress是綜合,Refine和牧馬人是不純的數據排序工具,Weka是用於數據挖掘的。
Hadoop是壹個可以分發大量數據的軟件框架。用於統計分析的R語言有壹個擴展R+Hadoop,可以在Hadoop集群上運行R代碼。更具體地說,搜索妳自己。
視覺輸出有很多工具。建議參考維基百科的“數據可視化”詞條。
Tableau和不純都有可視化功能。r語言也可以畫圖。
還有很多框架或控件可以用來實現網頁上的可視化輸出。
大致基於四種技術:Flash(Flex)或者JS(HTML5)或者Java或者ASP。NET(Silverlight)。
Flash中有Degrafa,BirdEye,Axiis和open Flash圖表。
JS包括Ajax.org,Sencha Ext JS,Filament,jQchart,Flot,迷妳圖,gRaphael,TufteGraph,Exhibit,PlotKit,ExplorerCanvas,MilkChart,Google Chart API,Protovis。
Java包括Choosel,google-visualization-java,GWT Chronoscope,JFreeChart。
ASP.NET有Telerik海圖、Visifire和Dundas海圖。
目前比較喜歡d3(數據驅動文檔),圖形豐富,交互性強。妳可以去d3js.org看看。圖形演示有很多種。