先分享壹些數據集和壹些科研機構、企業、政府開設的專業數據下載網站。這些數據集壹般都比較完善,質量也比較高,清理數據的工作也比較少,適合初學者做壹些簡單的基礎分析。
中國統計信息網:全國各級政府每年的國民經濟和社會發展統計信息,部分數據免費。
國家統計局:各種與民生相關的統計數據,而且所有的數據都是免費的,而且這個網站的友好鏈接裏有很多外地和外國的數據。
2.數據可視化項目數據集
最常見的數據可視化項目是制作某壹地區人均收入差異的信息圖。在尋找數據可視化項目相關的數據集時,我們希望數據集越大越好?幹凈?減少數據清理的工作,數據要足夠有趣,支持豐富的圖表。
3.用於數據建模和機器學習的數據集
UCI:UCI是加州大學歐文分校開放的經典數據集,也是機器學習領域最著名的數據倉庫。它包含各種數據集,如來自經典泰坦尼克號生存預測的最新數據(如空氣質量和GPS軌跡)。
阿裏天池:作為國內領先的互聯網公司阿裏巴巴旗下的大數據競賽網站,提供了大量的競賽數據集來練習,說不定還能拿個獎,賺點獎金。