一直以來,在信息技術(shù)最核心的三大件“芯片、操作系統(tǒng)、數(shù)據(jù)庫”上,市場格局穩(wěn)定,由英特爾、微軟、甲骨文等科技巨頭推動行業(yè)和技術(shù)發(fā)展。
老牌巨頭優(yōu)勢巨大,但在中國這個爆發(fā)式增長需求的市場,技術(shù)亟待更新突破。于是,以阿里為代表的科技公司,開始從零研發(fā),走上這條極其艱辛的自研技術(shù)創(chuàng)新之路。這其中,數(shù)據(jù)庫領(lǐng)域尤為艱難,技術(shù)挑戰(zhàn)大,研發(fā)成本和不確定性風險高,面臨太多的困難挑戰(zhàn)。
專注分布式關(guān)系數(shù)據(jù)庫的OceanBase團隊,甚至一度瀕臨解散。
而在2020年5月20日這天,作為支付寶完全自主研發(fā)的金融級分布式關(guān)系數(shù)據(jù)庫,OceanBase把名字赫然刻在了TPC組織的官網(wǎng)上,而緊隨其后的記錄還是自己(2019年10月創(chuàng)造過新紀錄)。
這一次,OceanBase再破世界記錄,性能分數(shù)首次突破億級大關(guān)達到7.07億tpmC,相比去年提升近11倍。注:tpmC值在國內(nèi)外被廣泛用于衡量計算機系統(tǒng)的事務處理能力,為“每分鐘內(nèi)系統(tǒng)處理的新訂單個數(shù)”的英文縮寫)
這標志著OceanBase成為全球最快數(shù)據(jù)庫,實現(xiàn)了數(shù)據(jù)庫這一基礎(chǔ)技術(shù)的革命性突破,也是自研技術(shù)對世界IT技術(shù)作出的重要貢獻。
OceanBase突破背后,一路艱辛,沒有捷徑。
一年二刷TPC-C榜單,OceanBase顛覆了什么?
首先認識TPC。TPC 是由數(shù)十家會員公司創(chuàng)建的非盈利組織,成立于1988年,總部設(shè)在美國,圖靈獎得主 Jim Gray 是奠基人。
TPC-C是全球最具公信力的聯(lián)機交易處理數(shù)據(jù)庫的功能與性能結(jié)合的測試標準,金融、電信、政府等關(guān)鍵領(lǐng)域的客戶一般參照 TPC-C 結(jié)果來衡量各個數(shù)據(jù)庫廠商的事務處理能力。通俗來講,TPC-C測試是對于商業(yè)數(shù)據(jù)庫想要證明自身實力的一個硬性門檻,被譽為“數(shù)據(jù)庫領(lǐng)域的世界杯”。
但是一直以來,TPC-C榜單都是老牌巨頭在競爭,尤其是Oracle、微軟和IBM為首的數(shù)據(jù)庫廠商和硬件廠商長期霸榜。
因為通過測試,確實太難了。無論是數(shù)據(jù)庫從業(yè)者還是高校教師,都夢想著排進這個榜單。
誕生于2010年的OceanBase最初是用在支付寶上,它又被稱為“超級會計師”,可以在一秒內(nèi)同時記數(shù)萬筆帳,并且不出一點錯。經(jīng)過長時間積累,2019年10月,OceanBase一舉打破Oracle“壟斷”9年之久的TPC-C評測的世界紀錄,tpmC高達6088萬之后,自研數(shù)據(jù)庫首次在世界舞臺上有了自己的聲量。
支付寶OceanBase再次登頂TPC-C榜單
而此次通過最新測試,OceanBase成為唯一超千個節(jié)點并通過TPC-C測試的分布式數(shù)據(jù)庫,成績較去年更勝一籌。更重磅的是,其性能分數(shù)首次突破億級大關(guān)達到7.07億tpmC,相比去年提升近11倍。
從關(guān)系數(shù)據(jù)庫的角度看,在這么大體量下,通過測試已經(jīng)非常困難,保持系統(tǒng)性能更加困難。1500多個數(shù)據(jù)庫節(jié)點,5000多萬個倉庫以及對應數(shù)量的客戶端,并進行8個多小時的持續(xù)壓測,對整個系統(tǒng)是極大的考驗。
而我們之所以說OceanBase實現(xiàn)了突破和顛覆,關(guān)鍵就在于其采用了新一代分布式設(shè)計技術(shù),顛覆了傳統(tǒng)數(shù)據(jù)庫集中式處理技術(shù)架構(gòu)。
如何理解?
一般而言,傳統(tǒng)數(shù)據(jù)庫只能通過提升單機性能來提升整體性能,難以滿足市場持續(xù)擴張的數(shù)據(jù)處理需求。OceanBase通過分布式擴展集群實現(xiàn)擴展能力的大幅提升,并通過分布式選舉技術(shù)、事務技術(shù)充分保證業(yè)務場景的一致性,實現(xiàn)整體性能的數(shù)量級提升。
在本次測試時,數(shù)據(jù)庫機器規(guī)模擴大到1557臺且單機倉庫數(shù)增長到3.6萬,總數(shù)據(jù)規(guī)模達到了近6PB,最大單表掃描數(shù)據(jù)總行數(shù)超過20萬億行(TPC-H最大的測試是100TB)。
除了性能優(yōu)勢,在兼容性上,OceanBase較傳統(tǒng)數(shù)據(jù)庫也有創(chuàng)新,其可高度兼容Oracle和Mysql,支持一鍵快速遷移,并提供云上的完整生態(tài)服務,解決了授權(quán)費用貴、硬件成本高、架構(gòu)與運維復雜、遷移難度大等傳統(tǒng)數(shù)據(jù)庫難題。
用10年,OceanBase做到別人做不到的事
螞蟻金服高級研究員、OceanBase 創(chuàng)始人陽振坤始終認為:
“直到今天,生產(chǎn)系統(tǒng)中沒有一個商業(yè)數(shù)據(jù)庫有分布式,除了OceanBase,這是我們做到了別人做不到的事?!?/p>
縱觀當今全球數(shù)據(jù)庫應用情況,關(guān)系數(shù)據(jù)庫依然是主流,而集中式系統(tǒng)依然大行其道,甲骨文、IBM、微軟源源不斷從中獲得收入。
此前,分布式數(shù)據(jù)庫長期存在于理論中并沒有在生產(chǎn)中實現(xiàn),雖然成本可以降低,但缺點亦十分突出:普通PC機單個來看都達不到金融級別的穩(wěn)定性,如果其中一臺機器罷工,容易產(chǎn)生多米諾骨牌效應般的坍塌效應(這個短板被視為世界級難題)。
而OceanBase解決分布式數(shù)據(jù)庫穩(wěn)定性的方式之一,是將每一份數(shù)據(jù)同時備份三份,存放在三臺不同的機器上。其原理是,一臺PC機出故障的概率如果是千分之一,兩臺同時壞的概率可能就是百萬分之一,三臺同時壞的概率則是十億分之一。
早年,在阿里的眾多業(yè)務中,無論是淘寶還是支付寶,集中式的關(guān)系數(shù)據(jù)庫都扮演著十分關(guān)鍵的角色,不可能擺脫它。但是,市面上的商業(yè)數(shù)據(jù)庫在高擴展、高并發(fā)和低成本上遠遠無法滿足淘寶和支付寶的高成長速度,且遇到業(yè)務激增時IOE投資要放大幾百倍甚至幾千倍。
“誰都買不起了”。阿里勢必需要考慮切換軌道——在2009年啟動“去IOE”。“去IOE”工程的戰(zhàn)略價值何在?一般被認為有三點:架構(gòu)靈活支撐業(yè)務飛速發(fā)展;基礎(chǔ)工程技術(shù)和人才的積累;大幅降低成本。
在數(shù)據(jù)庫領(lǐng)域,盡管彼時市面上非關(guān)系數(shù)據(jù)庫競相涌入,開源數(shù)據(jù)庫局限性比較大,兩者對巨頭的關(guān)系數(shù)據(jù)庫的沖擊可以用蚍蜉撼樹來形容——阿里決定走自研關(guān)系數(shù)據(jù)庫的道路。
盡管“自研”策略備受爭議,遇到各種反對,但一旦江河解凍,就會勢如劈竹,無法阻擋。OceanBase沖在了最前面,做起了先鋒。2010年5月,阿里邀請陽振坤加盟淘寶,由此拉開了 OceanBase的自主研發(fā)之路。
2010 年:創(chuàng)始人陽振坤加入阿里巴巴,OceanBase 正式立項;
2014 年:OceanBase 0.5 版本發(fā)布,替代 Oracle 在支付寶交易系統(tǒng)上線,負擔“雙十一”10% 流量;
2015 年:網(wǎng)商銀行成立,OceanBase 成為全球首個應用于金融核心業(yè)務系統(tǒng)的分布式關(guān)系數(shù)據(jù)庫;
2016 年:OceanBase 1.0 版本在支付寶賬務系統(tǒng)上線,支撐 12 萬筆 / 秒支付峰值;
2017 年:支付寶首次把所有核心數(shù)據(jù)鏈路搬到 OceanBase 上。同年,OceanBase在多家商業(yè)銀行上線;
2019 年:OceanBase 獲得 TPC-C 基準測試排名榜首;
2020 年:OceanBase以7.07億tpmC的成績打破去年TPC-C基準測試紀錄。
據(jù)了解,OceanBase早年第一個客戶是淘寶收藏夾。
當時的淘寶收藏夾業(yè)務高速發(fā)展,數(shù)據(jù)庫訪問量飛快增長,服務器數(shù)量需要翻一倍甚至幾倍才能應對業(yè)務需求。陽振坤主動提出可以用OceanBase,把服務器的數(shù)量降低一個數(shù)量級。
在淘寶收藏夾吃完OceanBase這只螃蟹后,確實取得了不錯的效果,也由此,OceanBase在內(nèi)部獲得了更多信任。但由于找不到更多愿意使用的業(yè)務,陽振坤和他的伙伴們經(jīng)歷了一段低谷期,用高德總裁劉振飛(2009年組建淘寶技術(shù)保障部)的話來說,回想起來當時都是折磨、痛苦和眼淚,今天說起來可以算是傳奇和笑話了。
OceanBase團隊在2012年走到了最困難的時候,數(shù)度瀕臨解散。
2012 年底,集團把 OceanBase 整個團隊調(diào)到了支付寶。支付寶屬于金融領(lǐng)域,面臨的數(shù)據(jù)庫挑戰(zhàn)會比其他業(yè)務更大,這相當于給了 OceanBase 團隊一次從頭開始的機會。
2013年夏天,支付寶開始“去IOE”,希望能夠把Oracle數(shù)據(jù)庫換掉。陽振坤主動向當時的螞蟻金服CTO程立推薦了OceanBase,并得到了認可。此后OceanBase在阿里內(nèi)部得到更多場景試煉,并逐步做到核心系統(tǒng)。
從“小我”到融入“海洋”
從瀕臨解散到浴火重生,OceanBase 走了快十年,它用了漫長的旅途進入了“無主之地”(自研分布式關(guān)系數(shù)據(jù)庫),沒有前人走過;它解決了自研信息技術(shù)三大軟肋(芯片、操作系統(tǒng)、數(shù)據(jù)庫)之一的數(shù)據(jù)庫難題,完全自主研發(fā)、安全可控。
它已經(jīng)向所有人證明了通用的分布式關(guān)系數(shù)據(jù)庫是能夠做成的,而且能真正應用在生產(chǎn)系統(tǒng)中。
當我們從頭來看陽振坤跟OceanBase團隊定下的策略,不得不感嘆想法的“超前”:走標準化!做一個通用的關(guān)系數(shù)據(jù)庫產(chǎn)品!他們不僅僅要在公司內(nèi)部使用它,還要實現(xiàn)外部商用——這帶來的挑戰(zhàn)就是投入更多人力和時間,以滿足市面上所有功能需求。
這就像“OceanBase”這個名字的寓意一樣:從一開始就立志做一個像海洋一樣的海量數(shù)據(jù)庫,征途就是星辰大海。
大音希聲大象無形,走向通用走向標準化,這件酷酷的事,支付寶做到了,而且把整個TPC-C測試變成了一種普惠的測試,為今后更廣泛應用打下基礎(chǔ)。
當然,OceanBase早已經(jīng)走出淘寶和支付寶的處女地,更多企業(yè)愿意擁抱它。
目前OceanBase已服務大量金融、電信等行業(yè)企業(yè),如建設(shè)銀行、南京銀行、西安銀行、人保健康險、蘇州銀行、廣東農(nóng)信、網(wǎng)商銀行等多家商業(yè)銀行和保險機構(gòu)。全球前四名的支付平臺,兩家的核心系統(tǒng)都在使用OceanBase數(shù)據(jù)庫。
回首過往,之所以O(shè)ceanBase能做成,能從當年的淘寶收藏夾走到支付寶,走進今天金融場景甚至更多領(lǐng)域,不僅是阿里,也是時代給了它一個好的發(fā)展機會。可以說,其高光有著行業(yè)和時代的必然性。
今天,阿里巴巴/支付寶內(nèi)部有數(shù)以萬計的數(shù)據(jù)庫,總有一些業(yè)務由于數(shù)據(jù)量和自身業(yè)務需求等因素,可以先試用自研技術(shù),再一步步地將數(shù)據(jù)庫做到關(guān)鍵系統(tǒng)。就是遵循這樣的邏輯,加之敢冒風險的勇氣,OceanBase乃至阿里的云計算業(yè)務都能在阿里自然而然“長出來”,造就一段經(jīng)典商業(yè)案例。
踩在過去的肩膀上,迎接未來的數(shù)據(jù)爆發(fā),OceanBase會摘到更豐盛的果實。讓中國數(shù)據(jù)庫技術(shù)服務全球,是OceanBase的初心,相信OceanBase未來會在更大海洋中發(fā)揮價值,與人類共享科技成果。
責任編輯:pj
-
微軟
+關(guān)注
關(guān)注
4文章
6618瀏覽量
104216 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7102瀏覽量
89271 -
PC機
+關(guān)注
關(guān)注
2文章
201瀏覽量
28611
發(fā)布評論請先 登錄
相關(guān)推薦
評論