百度、阿裏巴巴、騰訊的數據應用場景
百度、阿裏巴巴、騰訊的數據應用場景都有相同的體系,分為七層,代表企業不同層級的數據價值應用場景,形成企業運營的數據價值金字塔:
(1)數據庫平臺層。金字塔的最底層,也是整個金字塔的基礎層。如果基礎層沒有建設好,上面的應用層很難在企業運營中發揮有效作用。這壹層的技術目標是實現有效的數據存儲、計算和質量管理。業務目標是用壹個唯壹的ID將企業的所有用戶(客戶)數據串起來,包括畫像(如性別、年齡等。)、用戶(客戶)的行為和愛好,從而達到全面了解用戶(客戶)的目的;
(2)業務運營監控層。這壹層首先要做的是構建業務運營的關鍵數據系統。在此基礎上,智能模型開發的數據產品可以監控關鍵數據的變化,通過各種分析模型快速定位數據變化的原因,輔助運營決策。
(3)用戶/客戶體驗優化層。這壹層主要是通過數據對用戶/客戶體驗進行監控和優化。結構化數據和非結構化數據(如文本)都用於監控體驗。前者更多的是利用用戶(客戶)體驗監測的各種模型或工具來實現,後者更多的是通過監測微博、論壇、企業內部客戶反饋系統的文字來發現負面口碑,從而及時優化產品或服務;
(4)精細化運營營銷層。這壹層主要是通過數據驅動業務的精細化運營和營銷。主要可以分為四個方面:壹是構建基於用戶的數據提取和運營工具,方便運營者和營銷人員通過人群定向提取客戶,從而對客戶進行營銷或運營活動;其次,通過數據挖掘提高客戶對活動的反應;第三,通過數據挖掘的手段進行客戶生命周期管理;第四,個性化推薦算法主要用於基於用戶不同的興趣和需求推薦不同的商品或產品,從而最大化推廣資源的效率和效果,比如淘寶商品的個性化推薦;
(5)數據對外服務和市場溝通。數據對外服務壹般服務於互聯網企業的客戶或用戶。比如百度通過提供百度輿情、百度代言人、百度指數來服務其廣告主客戶。淘寶通過數據魔方、淘寶智能、雲端的產品為客戶服務;騰訊通過騰訊分析和騰訊雲分析為其開放者服務。在市場傳播方面,主要通過有趣的數據信息地圖和數據可視化產品(如淘寶指數、百度指數、百度春運遷徙地圖)來實現。
(6)管理分析。主要通過分析師對大數據的統計,形成體驗分析的周報、月報、季報,分析用戶的運營和收入完成情況,發現問題,優化經營策略。
(7)戰略分析。這方面既要結合內部大數據,形成決策層的數據視圖,也要結合外部數據,尤其是各種競爭情報監測數據和國外趨勢研究數據,輔助決策層進行戰略分析。
雖然百度、阿裏巴巴和騰訊在企業運營的數據價值應用體系上有著相同的特點,但由於商業模式和數據資產的不同,他們的整體大數據發展戰略也有著顯著的不同。
百度的大數據戰略
百度大數據最重要的來源是通過爬蟲從超過100個國家收集的近萬億網頁數據,數據量在EB級別。百度的數據非常多元。它收集的數據既有非結構化或半結構化的數據,包括網頁數據、視頻和圖片,也有結構化的數據,如用戶的點擊行為數據和廣告主的付費行為數據。
百度大數據主要服務於三類人群:壹類是網民,通過大數據和自然語言處理技術,讓網民的搜索更加精準;第二類是廣告主。通過大數據,廣告主的廣告與搜索關鍵詞的匹配度較高,或者與網民正在觀看的網頁內容的匹配度較高;第三類是百度大數據引擎,也是重點推廣,重點服務於傳統行業有壹定數據規模的企業。
百度大數據引擎代表了互聯網企業數據服務能力開放與合作的趨勢。百度大數據引擎由以下三個方面組成:
開放雲:百度的大規模分布式計算和超大規模存儲雲。開放雲大數據對基礎設施和硬件能力開放。以前百度雲主要面向開發者,大數據引擎開放雲面向有大數據存儲和處理需求的“大開發者”。據百度相關人員介紹,百度開放雲還具有CPU利用率高、靈活性高、成本低的特點。百度是全球第壹家大規模商用ARM服務器公司,ARM架構的特點是低能耗、高存儲密度。同時,百度是第壹家將GPU(圖形處理器)應用於機器學習領域的公司,達到了節能的目的。
數據工廠:數據工廠是百度組織海量數據的軟件能力,類似於數據庫軟件的功能,只不過數據工廠是用來處理TB級甚至更大的數據。百度數據工廠支持超大規模異構數據查詢、類SQL和更復雜的查詢語句,支持多種查詢業務場景。同時,百度數據工廠還將承載TB級大表的並發查詢和掃描,大查詢低並發達到每秒100 GB。
百度大腦:百度大腦開放了百度之前在人工智能方面的能力,主要是大規模機器學習能力和深度學習能力。此前用於語音、圖像、文本識別、自然語言和語義理解,並通過百度內部等平臺開放給智能硬件。現在這些能力將用於大數據的智能分析、學習、處理和利用以及對外開放。
百度打包了基礎設施能力、軟件系統能力和智能算法技術。通過大數據引擎開放後,擁有大數據的行業可以將自己的數據接入這個引擎進行處理。從架構上來說,企業或者組織也可以只選擇三套中的壹套來使用,比如數據存儲在自己的雲端,但是要使用百度大腦的壹些智能算法或者把數據存儲在百度雲,自己寫算法。
百度大數據引擎的作用
我們可以具體從兩個方面來看百度大數據引擎的作用:
(1)對於政府機構,比如擁有車聯網、物聯網、路網監控、船聯網、終端站監控等場所大數據的交通部門,如果將這些數據與百度的搜索記錄、全網數據、LBS數據相結合,利用百度大數據引擎的大數據能力,可以實現智能路徑規劃和運力管理;衛生部門有全國流感法定報告、哨點監測和流感樣病例病原學監測的數據。如果結合百度的搜索記錄和全網的數據,可以做出流感預測和疫苗接種指導。
(2)對於企業:很多企業也有海量的大數據,但是大數據處理和挖掘能力相對較弱。如果應用百度大數據引擎,可以低成本可靠存儲海量數據,由淺入深進行智能價值挖掘。例如,在2014年4月的百度技術開放日上,中國平安介紹了如何利用百度的大數據能力,增強對消費者的理解和預測,細分客戶群體,制定個性化的產品和營銷方案。
阿裏巴巴的大數據戰略
阿裏巴巴大數據的整體發展方向是以激活生產力為目的的DT(data technology,數據技術驅動)數據時代的發展。阿裏巴巴未來的大數據將由“基於雲計算的數據開放+大數據工具化應用”構成:
(1)基於雲計算的開放數據。雲計算使中小企業可以在阿裏雲上獲得數據存儲和數據處理服務,也可以構建自己的數據應用。雲計算是數據開放的基礎。雲計算可以為全世界的數據開發者提供壹個數據工作平臺。阿裏的分布式存儲平臺,以及這個平臺上的算法工具,可以更好的被數據開發者使用。同時,阿裏巴巴也需要對數據進行脫敏,讓數據的業務定義和每壹個標簽都足夠清晰,讓全球的數據開發者都能在阿裏巴巴平臺上開始數據思維,讓數據為政府、消費者、行業所用。阿裏大數據開放後,線上線下數據可以串聯起來,每個人都是數據提供者,也是數據使用者。
(2)在大數據的應用上,馬雲在整個數據應用上確定了兩個政策:
第壹策:從IT到DT(數據技術),DT是點燃和激發整個數據的力量,被管理、社會、銷售、制造、消費信貸所用。前面已經分析過,阿裏巴巴的數據資產主要基於電子商務。其中,淘寶和天貓每天都會產生豐富多樣的數據,阿裏巴巴沈澱了包括交易、金融、生活服務在內的各類數據。這些數據可以幫助阿裏巴巴進行數字化運營(如下圖)。
它的另壹個最重要的應用是金融領域——小額信貸。在小微金融企業融資領域。由於銀行無法掌握小微企業真實的經營數據,不僅很多企業拿不到貸款,而且由於數據類型的缺乏,整個判斷過程太長。阿裏通過他的電商數據中的交易、信用、SNS等各種數據來決定是否可以發放貸款以及貸款的額度。
第二個政策:讓阿裏巴巴的數據和工具成為中國的商業基礎設施。阿裏巴巴已經開始轉型。阿裏將從直接面對消費者轉變為支持網商面對消費者。阿裏將根據現有的運營和數據經驗,開發更多幫助網商成長的工具,讓網商用最好的工具和服務更好地服務消費者。正如馬雲所說,“我相信沒有壹個網商不想擁有自己的客戶,也沒有壹個網商不想知道客戶的體驗是好是壞,如何長久擁有這些客戶。我們認為壹個國家的經濟應該留給企業家,我們認為淘寶網商的未來經濟應該留給網商來決定,而不是我們來做決定。"
騰訊的大數據戰略
騰訊的大數據目前更多的是針對騰訊企業內部運營。相比阿裏和百度,數據開放程度不高。所以對於騰訊來說,我們主要著眼於騰訊大數據在服務企業的應用場景和服務。
騰訊90%以上的數據都進行了集中管理,數據集中在數據平臺部門。超過100個產品的數據被集中管理並存儲在騰訊自主開發的數據倉庫(TDW)中。騰訊大數據從數據應用的不同方面可以分為四個層次,包括數據分析、數據挖掘、數據管理和數據可視化:
(1)數據分析層有自助分析、用戶畫像、實時多維分析、變化智能定位工具四個產品。自助分析可以幫助非技術人員通過簡單的條件配置實現數據的統計和展示;用戶畫像是針對某個用戶群體或某個業務的用戶實現自動化的人群畫像;實時多維分析工具可以實現對壹個指標的實時多維細分,方便分析師從不同角度分析壹個指標;數據變更智能定位工具實現了數據變更的智能定位。
(2)數據挖掘層面的產品應用包括:精準廣告系統、用戶個性化推薦引擎和客戶生命周期管理。精準廣告系統,如廣點通,基於騰訊社交平臺的海量數據,通過精準推薦算法,智能定向推廣,實現精準廣告投放;用戶個性化推薦引擎根據每個用戶的興趣和喜好,通過個性化推薦算法(協同過濾、基於內容的推薦、圖算法、貝葉斯等)實現產品的個性化推薦需求。);客戶生命周期管理系統以大數據為基礎,根據用戶/客戶的不同生命周期進行數據挖掘,建立預測、預警和用戶特征模型,根據用戶/客戶的不同生命周期特征進行精細化運營和營銷。
(3)數據管理層面,有TDW(騰訊數據倉庫)、TDBank(數據庫)、元數據管理平臺、任務調度系統、數據監控。這壹級主要是實現數據的高效集中存儲、數據業務指標定義管理、數據質量管理、計算任務的及時調度和計算、數據問題的監控和告警。
(4)數據可視化層面,有自助報表工具、騰訊指南針、騰訊分析、騰訊雲分析等工具。自助報表工具可以實現結構和邏輯相對簡單的自助報表。騰訊指南針分為內部版和外部版。內部版是騰訊內部用戶(產品經理、運營和技術人員等)的高效舉報工具。),而對外版本則是面向開發者等騰訊合作夥伴的舉報工具。騰訊分析(Tencent Analytics)是壹款網頁分析工具,幫助網站所有者全方位分析自己的網站。騰訊雲分析是壹款幫助應用開發者決策和優化運營的分析工具。
壹般來說,百度、阿裏巴巴、騰訊都有大數據,利用三大互聯網巨頭的數據來優化自身業務的運營效果。從這個角度來說,他們的數據價值應用場景是相似的。但由於業務和商業模式不同,他們的數據資產不同,他們未來的大數據戰略也不同。尤其是從大數據的開放與合作來看,百度和阿裏巴巴相對更開放。對於重視大數據開放與合作的互聯網公司來說,他們最期待的是通過大數據開放的策略,與更多的傳統行業交換更多的數據,從而更好地豐富自己的線上線下數據,形成線上線下數據的協同,拓展新的商業模式,比如智能硬件、大數據健康等。