數據存儲、數據分析、數據安全...現在圍繞“數據”的話題越來越多,離人們的生活越來越近。
從陌生到熟悉,數據不僅“出圈”,甚至已經站到了C位。去年,中央發布的《關於構建更加完善的要素市場配置體制機制的意見》明確提出,數據成為繼土地、勞動力、資本、技術之後的第五大生產要素。
進入信息時代後,數據庫、操作系統和中間件作為計算機最基礎的三大軟件,支撐著企業的正常運轉。
當數據成為生產要素後,必然會迎來爆發式增長,企業的數據存儲和處理需求將進壹步釋放。更重要的是,疫情加快了數字化轉型的步伐,加快了企業上雲的速度。
從信息化到數字化,時代的變化總會帶來商業世界的變化。如何使用雲原生架構下的數據庫,成為企業的痛點,也是雲廠商的機會。亞馬遜AWS CTO沃納·威格爾曾多次強調:“數據庫是雲計算的終極之戰。”
數字智能時代,雲的原生意味著什麽?雲原生數據庫相對於傳統數據庫的核心優勢是什麽?把數據庫搬到雲端是雲原生的嗎?基於這些問題,雷鋒網與阿裏巴巴集團副總裁、阿裏雲數據庫產品事業部負責人李菲菲展開了對話。
國產雲原生數據庫,擺脫“切膚之痛”
如今,數據庫的商業世界因為雲的出現和發展而分為兩派。
壹個是以Oracle為代表的傳統商業數據庫,壹個是以國外的AWS和國內的阿裏雲為代表的雲原生數據庫,都是“IOE革命”的產物。
其實早期比較熱的數據庫有三種:層次數據庫、網絡數據庫、關系數據庫。
在《浪潮之巔》壹書中,作者吳軍寫下了這樣的觀點:“甲骨文的崛起很大程度上取決於其對關系型數據庫市場前景的第壹眼,在商業模式上優於IBM。”
所以在雲原生數據庫入世之前,數據庫的世界壹直是Oracle的天下,國內大部分互聯網公司不得不采用Oracle+IBM小型機+EMC的模式來維持正常運營。
高昂的成本讓對數據庫需求巨大的互聯網巨頭“吃不消”。
2009年,阿裏巴巴的Oracle RAC集群節點數量達到創紀錄的20個。但由於Oracle不具備靈活擴展的功能,只能根據峰值流量購買小型機和數據庫,導致阿裏將業務增加帶來的大部分利潤支付給Oracle。
第二年,阿裏開始走上“IOE”之路,基於開源的MySQL構建AliSQL,並成功通過淘寶雙11的測試。國產雲原生數據庫正式擺脫“皮膚之痛”,逐漸被市場認可。
另壹方面,國外AWS在2015公布了基於雲計算的自研數據庫Amazon Aurora。Aurora是壹個關系數據庫,可以跨三個可用區域復制六份數據,最大的特點是高性能和高可用性。
隨著雲計算巨頭的進入,雲原生數據庫壹步步成為國內外主流。根據Gartner的預測,到2021,雲數據庫在整個數據庫市場的占比將首次達到50%,到2023年,75%的數據庫將運行在雲平臺上。
至於雲原生數據庫,隨著逐漸出圈,也讓人們關註的焦點從“是什麽?”改成“還有什麽問題可以解決?”
但是,雲原生數據庫存在數據孤島的問題。如果無法訪問多個數據系統,企業在數據處理和數據管理方面將“壓力巨大”,甚至存在數據安全隱患。
傳統數據倉庫壹般基於T+1數據集成構建離線數據倉庫,以支持企業的各種分析和服務。傳統的解決方案不僅會影響在線業務的穩定性,而且難以支持企業的實時需求。
因此,在李菲菲看來,雲原生數據庫已經到了2.0階段。現階段要解決的問題就是上面提到的痛點。
9月26日,在阿裏雲數據庫創新雲峰大會上,阿裏雲發布了首個壹站式敏捷數據倉庫解決方案。該方案結合壹站式數據管理平臺DMS和雲原生數據倉庫AnalyticDB(簡稱ADB)實現倉庫集成的技術架構,提供在線數據實時入庫、T+1定期快照、按需開倉等。數據延遲低至秒,持續使業務在線,讓企業在線數據釋放更大價值。
與傳統解決方案相比,阿裏雲壹站式敏捷數據倉庫解決方案具有四大核心優勢:
1,對業務端影響不大,不會因為數據聚合和實時處理而影響業務端的正常運行,CPU和內存占用小於5%;
2.保證了交易順序和數據準確性,處理環節短,支持在線數據實時處理和卸載,效率更高。數據傳輸效率100m/s,數據延遲在10秒以內;
3.支持復雜的實時數據處理和計算邏輯;
4.低代碼操作可以大大降低實時倉庫的建設難度,提高建設效率,支持企業數字化轉型過程中的各種實時場景。
除了實時的統計分析場景,企業還需要構建周期性的全快照,以滿足周期性數據分析的需求。
傳統的幾個倉庫定期總集成方案會對生產業務產生穩定的影響,總集成的時效性差,不能滿足客戶隨時進行數據回溯的業務需求。
針對T+1的周期集成場景,壹站式敏捷數據倉庫解決方案支持基於拉鏈表的T+1全口徑數據快照,用戶可以通過簡單的幾步操作,根據需要生成各時期的全口徑或增量快照。
此外,業務還可以根據需要進行任意時間點的數據回溯,快速解決數據異常問題。
在談到數據庫的未來發展趨勢時,李菲菲提到了以下五點:
1,雲原生+分布式壹定是數據庫的標準,分布式已經是必須了。分布式數據庫由幾個相互連接的數據庫組成,而面向用戶的數據庫顯示為單個數據庫。雲原生分布式數據庫具有易用性、高可擴展性、快速叠代、節約成本等特點。,從資源池化到彈性擴展,再到智能運維,再到離線整合,解決企業用戶的核心訴求。
2.AI for DB(數據庫)和DB for AI將是主流趨勢。更重要的是利用AI讓數據庫運維智能化,尤其是在雲原生、分布式的前提下,因為數據庫不僅靈活、可用、可擴展,部署後應用和運維的復雜度也大大降低。在數據庫中,面對越來越多的非結構化數據,分析能力非常重要。
3.在當今環境下,數據的安全性和可靠性變得越來越重要。如何保證整個數據庫系統在處理數據鏈接的過程中能夠提供加密能力、多方安全計算能力和隱私保護能力,也是壹個非常重要的趨勢。
4.多模式數據處理能力將變得越來越重要。例如,新數據庫的多模態處理能力將在新能源汽車企業的標簽、智能電池預測等應用場景中發揮越來越重要的作用。
5.壹個數據,多個數據處理引擎:實現倉庫集成、倉庫聯動、倉庫開放、數據無縫流轉。
上述判斷也從側面反映了阿裏雲數據庫的趨勢,這壹點毋庸置疑。但除此之外,業界最關心的還是開源。
這半年來,國內眾多廠商紛紛提出開源策略,背後的原因顯而易見。為了創造壹個生態。在今年的阿裏雲峰會上,阿裏雲智能總裁、達摩院院長張建鋒將阿裏雲2021年發展的關鍵詞概括為:服務好、基礎深、中國厚、生態強。
做好服務和生態已經成為當今廠商的目標,開源是最好的選擇。
當雷Feng.com問到“阿裏雲數據庫未來會開放所有能力嗎?”當被問到這個問題時,李菲菲給出的答案是:“不會。”
之所以這樣回答,是因為他對開源有壹些判斷和看法。
李菲菲說,這些部分是阿裏雲數據庫的商業版本。
事實上,業內大多數數據庫廠商都不會對自己的核心能力進行開源,比如TiDB和TiFlash的核心控制組件。
不像MongoDB、Cassandra、CouchDB這樣的數據庫廠商是靠開源起家的,開源只是阿裏雲數據庫的策略,並不是阿裏雲數據庫的命脈。
幾年前有業內人士表示,國內數據庫在面對開源時,首先需要解決信任、開源知識產權等問題。“開源將使供應商更認真地考慮版權和專利。事實上,選擇開源後,他們對數據庫廠商提出了更高的要求。”
李菲菲認為,開源只是壹種選擇,數據庫開源成功不代表商業化就能成功,也不代表廠商不先進。
更準確的說,開源只是壹種有效的手段。
最後,阿裏雲數據庫希望客戶能通過開源版本快速使用阿裏雲數據庫產品的技術,並能參與技術產品的叠代過程。在壹些高層次的能力上,他們可以借鑒團隊的專業能力和阿裏雲的服務能力,成為很好的商業夥伴。這是李菲菲和阿裏雲數據庫關於開源的壹些基本思路。雷鋒網雷鋒網雷鋒網