當前位置:法律諮詢服務網 - 企業資訊 - 企業數據挖掘的實際應用模型

企業數據挖掘的實際應用模型

企業數據挖掘的實際應用模型

這是幾年前寫的壹篇文章,今天突然冒出來。我覺得對很多做數據挖掘的朋友有壹定的借鑒意義。

我聽公司的幾個同事和外面的專家介紹了壹些關於數據挖掘和數據模型的東西。總的來說很有收獲,當然收獲不在具體的技術細節上。更多的是觀點和想法。

之前做過很多模型,從最基礎的聚類,決策樹,logisitic,回歸分析,生存分析,神經網絡,還有市場調研中的壹些聯合分析,感知分析,因子分析/主成分分析,當然還有更高級的結構方程。在期貨公司壹年的時間裏,我也做過計量經濟模型:ARMA簇,ARCH簇,VaR等。當時我對自己的車型很沒有安全感。因為當時的模型識別率指標(比如R端,在學校或者平時都沒有達到傳說中模型的90%以上),感覺這個模型不算好,不算完美。

去年抱著學習的心態,去了壹家數據極其豐富的互聯網公司,想看看大公司對數據的玩法到底有多大。雖然之前和很多牛人聊過,但總覺得不應該這麽簡單。

到了新公司後,我和幾個做建模的同事松了口氣,聽了外部專家的發言。感覺以前做模型的時候學術研究比較多,可能和我是個完美主義者有關。

比如模型的假設和變量的選擇。

模型假設和數據分布要求;

模型的變量選擇和變量的各種預處理;

為了最終目標,嘗試所有理論上可以使用的模型。比如:成員流失的問題:決策樹,logistic回歸,生存分析,我會盡量用,然後選擇最終提升值最大的壹個。

但其實從幾個同事朋友的介紹來看,logistic回歸是很多公司都在用的模型。

為什麽不用更“高級”更高級的模式呢?有兩個原因:

第壹個:模型的穩健性。這些機型都是經過以往實踐證明是最好的,或者性能比較穩定。衡量標準無非是穩定性、可解釋性(這在商業中非常重要)和簡單性。

第二:商業應用,已經是壹個流程,不會輕易改變,就像妳的生產線壹樣。模型稍有變化就能影響到很多方面,這是壹個大工程。

從和他們的交流中,我似乎忘記了壹件事:這些都是為了業務,業務流程不要太復雜。最好的商業模式往往是最簡單的,不是嗎?

我的看法:可能和我自己的工作經歷有關,但是我覺得對於壹個數據分析師或者數據建模師來說,雖然妳用的很簡單。但是妳應該有很多復雜的東西,也正是因為有了這些基礎,妳才能選擇最好的模式。所以玩數據挖掘或者數學建模為商業服務的時候,經驗很重要。當然,這些專業知識的紮實也是最根本的之壹。

  • 上一篇:企業建網站能帶來什麽好處?
  • 下一篇:企業信用如何查詢判斷?
  • copyright 2024法律諮詢服務網