數據挖掘是指應用聚集、分類、回歸、關聯規則等技術,從大量不完整、有噪聲、模糊、隨機的實際應用數據中挖掘潛在價值的過程。
數據分析可以分為狹義和廣義。狹義的數據分析是指運用比較分析、分組分析、交叉分析、回歸分析等分析方法,對收集到的數據進行加工分析,提取有價值的信息,充分發揮數據的作用,得出壹個特征統計結果的過程。壹般來說,數據分析是狹義的數據分析。廣義數據分析指針利用基礎探索、統計分析、深度挖掘等方法,在數據中尋找有用的信息和未知的規律和模式,為下壹步的經營決策提供理論和實踐依據。
數據可視化數據可視化是數據分析和數據科學的關鍵技術之壹。它將數據或信息編碼為圖形或圖像,並允許通過使用圖形圖像處理、計算機視覺和用戶界面對實體、表面、屬性和動畫進行表達、建模和顯示來對數據進行可視化解釋。
數據可視化過程,數據處理,可視化編碼,可視化生成。
數據處理側重於數據收集、清洗、預處理、分析和挖掘。
視覺編碼的重點是接收光學圖像、提取信息、處理和轉換、模式識別以及存儲和顯示。
視覺制作側重於將數據轉化為圖形和交互處理。
(1)對數據進行爬網需要Python。
(2)數據分析需要Python。
(3) Python語言簡單高效
NumPy,Scipy,Pandas,Matplotlib,Seaborn,Scikit-learn,