任何壹個環節都可能發生數據造假。其中,在數據存儲過程中往往更容易造假:因為在現有的數據存儲技術下,數據所有者、管理者或委托存儲方有能力單方面隨意篡改或刪除數據。
既然數據不能被信任的壹個重要原因是數據可以被單方面篡改和刪除,那麽如何避免這個問題自然引起了業內的高度關註。區塊鏈和分散存儲技術的誕生對遏制數據篡改起到了壹定的作用,在市場上也得到了初步驗證。
許多企業已經開始嘗試使用區塊鏈來存儲數據,例如,在貨物可追溯性和其他場景中。其做法往往是將重要數據直接寫入塊中。這種簡單粗暴的做法,確實解決了數據防刪除的需求,進而滿足了部分數據的可信共享,但也存在很多問題:
首先,不能存儲海量數據:不適合在塊中存儲包括多媒體數據在內的大數據,否則塊大小難以控制,使得區塊鏈的可擴展性變差。這就導致了業務中需要對原始數據進行取舍,只選擇少量必要的數據存儲在塊中,但這樣會降低可信數據的豐富性。
其次,數據訪問效率低:首先,由於打包過程的存在,區塊鏈數據存儲壹般不用於高速數據寫入。其次,由於遍歷數據讀取方法,區塊鏈不能支持快速索引,更不用說SQL了。
再次,數據維護效率低:區塊鏈因其順序引用特性,不支持對單個歷史數據的刪除和修改(除非全鏈再生,但這是區塊鏈不應該鼓勵的行為)。這裏需要註意的是,“停止單方非授權篡改”和“完全無法刪除修改”是完全不同的兩回事。前者是保證相互信任的技術手段,後者可能屬於必要功能點的喪失。
最後,還有數據丟失的風險:這個風險列表指的是采用中本聰最長鏈原則的戰俘區塊鏈系統。在這種區塊鏈中,當出現鏈叉時,最長(或最重)的鏈分支將被保留,其他分支將被丟棄,這使得區塊鏈中的數據實際上被“顛覆”並永遠丟棄。自私挖掘等攻擊的存在會加劇這種風險。這在數據存儲應用中是不可接受的。
正是由於上述原因,直接使用傳統區塊鏈進行數據存儲顯然無法滿足大量實際場景下對可信數據存儲的需求。這個問題引起了很多討論,比如“什麽數據應該存儲在鏈中,什麽數據應該存儲在鏈下”。這些問題的出現,根本上是由於區塊鏈本身的存儲效率和容量有限。畢竟在數據庫時代,我們從來不談“什麽數據應該存儲在數據庫之外”這個問題。
近年來也出現了壹些產品,為解決上述區塊鏈數據存儲效率低的問題提供了有益的實踐,如:
IPFS,R3的Corda,騰訊TrustSQL等。但是,這些產品在數據可信存儲方面仍然存在或多或少的問題,具體來說:
IPFS生成數據內容的哈希摘要,在多個節點之間分發。單個持有者沒有完整的數據,這在壹定程度上保護了數據隱私。而IPFS只能被修改和獲知(因為哈希值會隨著內容的變化而變化),沒有訪問控制等數據安全措施,整體上還是很難滿足企業級的服務需求。
Corda是為金融交易的隱私需求量身定制的存儲產品,專註於數據存儲的隱私。因此,Corda沒有全球分類賬,需要證人在場。這是壹種私有但不安全可靠的數據存儲方案。
TrustSQL等國內同類產品采用了簡單直觀的設計思路,這也是目前國內最常見的做法,即先將數據存儲在數據庫(或IPFS)中,再將操作記錄和數據哈希存儲在鏈表中。與TrustSQL相比,壹些類似的產品,如帶共享位的ChainSQL,進壹步增強了對SQL的支持。這類產品滿足了數據“可審計”和“透明監管”的要求,但缺點是仍然無法消除數據本身的刪除,只能“以刪除而知”;另外,關鍵數據的安全性依賴於參與節點的全副本存儲,存儲成本略高。而且數據隱私的設計還是不足的。
針對上述產品的不足,五元科技通過原始技術創新探索出了壹條不同的道路,推出了自主知識產權產品“ImSQL”,旨在提供壹種真正能夠保證數據不會被篡改或私自刪除的可信存儲產品。
ImSQL(不可變SQL數據庫)是基於區塊鏈和分布式存儲技術的新型可信數據存儲解決方案,完美解決了“防止非授權刪除”、“保護數據隱私”、“降低存儲成本”等核心問題,為大數據時代的可信存儲和數據共享提供了可靠的技術路徑。
與現有產品相比,ImSQL具有以下突出優勢:
1.徹底杜絕單方擅自篡改、刪除數據的行為。通過存儲和檢索兩方面的多方驗證,消除存儲過程中的篡改和刪除,充分保證了數據的真實性和可信性,使應用中的參與者能夠相互信任,放心采用其他數據,數據能夠支持準確的可追溯性和可追究性。
2.杜絕單點故障。多方* * *同時使用數據和維護數據,數據不僅僅存儲在壹方,從根本上實現了分布式數據的可信* * *共享池,既避免了單點失效的風險,又提高了數據共享的效率。
3.碎片化存儲滿足數據隱私要求,任何壹方都無法掌握完整的數據,從而解決了傳統雲計算集中存儲或區塊鏈全副本存儲存在的數據隱私問題。除了數據所有者之外,沒有其他存儲保管人可以獲得完整的數據。
4.出色的數據訪問性能:ImSQL單節點寫入速度可達3000 TPS,讀取速度10000 QPS。此外,ImSQL還具有支持SQL語言、橫向擴展、優秀的訪問性能和體驗等優勢,可以充分利用set qun的擴展將上述指標進壹步提升數倍。
5.滿足多媒體等大數據的高效訪問需求,支持高效訪問、高效索引和高效擴展,真正勝任大數據業務場景,實現視頻等數據的可靠高效存儲,從而為視頻監控等場景提供前所未有的可信安全體驗。
6.瓦片設計的使用大大降低了每個存儲參與者的存儲壓力和成本,讓更多的參與者有機會加入和參與到數據可信的生態中來。
7.分布式架構兼容輕節點,鼓勵更多節點參與。沒有超級節點,參與存儲的節點地位相同,更好地保證了系統的可靠性和抗毀性。此外,如果節點選擇運行在輕拷貝模式下,可以只存儲壹部分數據,這樣其存儲壓力大大降低,義務減輕,但功率可以不受影響。
ImSQL考慮了海量存儲、快速索引、橫向擴展等數據庫屬性,也考慮了數據可以立即存儲和固化的區塊鏈特性。在很多關註數據可信存儲和共享的領域,有望帶來前所未有的使用體驗和便利,比如實現供應鏈中數據的互通互信,實現政府或大型企業各部門之間的數據互通,支持可信追溯相關的海量數據存儲。
以政府大數據建設為例。在許多不同的政府部門和實體之間實現高效的數據互聯壹直是壹個難題。目前的做法往往需要建立獨立的大數據部門,構建獨立的數據存儲系統,從不同實體中拉取相關數據,進行分析重構,然後實現可視化。這往往會導致大量的前期費用,包括人、錢、物等顯性費用,也包括人員配備、權責、時間成本、部門圍墻等隱性費用。同時,獨立大數據部門的存在,也隱含著需要壹個可信的第三方來背書,甚至承擔責任。如果在這種情況下使用ImSQL作為數據交換的底層平臺,就可以更有效地完成這項任務,具體體現在:
不需要依賴第三方實體的背書:不同實體之間的數據可以直接寫入ImSQL,寫入後會立即保存,任何壹方都不能再私自篡改和刪除數據,從而保證了其他實體在隨時訪問數據時的可用性、壹致性和可信性;
無需建立和維護額外的數據存儲系統:數據由所有參與實體存儲和維護,自然共享和訪問,不降低使用效率,降低系統實施和維護成本。同時,ImSQL的數據分片存儲技術可以同時實現數據共享和隱私保護,即所有實體存儲的數據都可以是不完整的碎片,只有那些有訪問權限的實體才能掌握密鑰對碎片數據進行搜索、組合和解釋。
綜上所述,作為壹種可信、防篡改的數據存儲技術,ImSQL完全繼承了區塊鏈數據安全的優勢,並突破了區塊鏈在效率上的弱點,為用戶提供了與數據庫壹樣高效的數據訪問體驗。ImSQL是區塊鏈和數據庫技術相結合產生的新類別,是實現可信數據存儲的最佳選擇。