牛繼賓 云管理平臺CMP架構(gòu)與功能設(shè)計(jì)
2016年12月2-3日,業(yè)界最大的技術(shù)盛宴——ArchSummit全球架構(gòu)師峰會[北京站]盛大開幕!在大會20多個熱門專題中,云計(jì)算仍然備受矚目。不少云企業(yè)與云大咖亮相本次大會,這其中當(dāng)然少不了致力于云計(jì)算管理平臺系統(tǒng)軟件研發(fā)、云系統(tǒng)構(gòu)建、云計(jì)算行業(yè)解決方案提供及云運(yùn)營服務(wù)的創(chuàng)新型科技公司北京天云融創(chuàng)軟件技術(shù)有限公司(以下簡稱:天云軟件)。
在大會上,天云軟件技術(shù)總監(jiān)牛繼賓不僅為大家重點(diǎn)介紹了天云軟件核心產(chǎn)品——云管理平臺的架構(gòu)與功能設(shè)計(jì),也對云管理平臺未來的定位表達(dá)了自己的觀點(diǎn)。
牛繼賓,天云軟件技術(shù)總監(jiān),于2013年加入天云軟件。曾任職于IBM和VMware,分別負(fù)責(zé)小型機(jī)虛擬化相關(guān)工作與X86相關(guān)的虛擬化工作。長期研究云計(jì)算相關(guān)技術(shù),具有豐富的行業(yè)經(jīng)驗(yàn)。
首先,牛繼賓告訴我們何為云管理平臺(CMP)。
牛繼賓將其總結(jié)為兩點(diǎn):第一是管理公有云、私有云形成混合云;第二就是自服務(wù)、鏡像的劃分、計(jì)量計(jì)費(fèi)、負(fù)載的優(yōu)化等??偟膩碚f云管理平臺是幫助企業(yè)在建設(shè)云的過程中讓資源好管、好用、好控的重要載體,是云計(jì)算服務(wù)與技術(shù)交付的關(guān)鍵一環(huán)。
Gartner對云管理平臺的具體定義
那么云管理平臺與開源技術(shù)OpenStack有何區(qū)別呢?牛繼賓表示,根據(jù)目前天云軟件自己的定義以及市場上的反饋來看,云管理平臺是更廣的范圍。比如可以把OpenStack看作是云管理平臺下屬的資源模塊,云管理平臺可以管理多個不同版本的OpenStack。
牛繼賓強(qiáng)調(diào),云管理平臺在云計(jì)算體系中的地位是承上啟下的。云計(jì)算最終交付給用戶的是一個一個服務(wù)。而怎么交付給用戶?正是云管理平臺將資源管理起來,通過運(yùn)營和服務(wù)界面把服務(wù)提供給用戶。這是整體的定位,是承上啟下的。
云管理平臺的功能架構(gòu)設(shè)計(jì)
首先,牛繼賓為我們展示了設(shè)計(jì)CMP1.0時第一版的架構(gòu),并為我們重點(diǎn)介紹了資源管理系統(tǒng)的設(shè)計(jì)思路。
天云軟件CMP1.0時第一版的架構(gòu)
資源管理系統(tǒng)
資源管理系統(tǒng)包括物理機(jī)管理、存儲管理、網(wǎng)絡(luò)管理、混合云管理及多數(shù)據(jù)中心管理。
一、物理機(jī)管理。目前是基于IPMI的實(shí)現(xiàn),可以做物理機(jī)的分配、自動安裝、自動服務(wù)提供。跟虛擬化的區(qū)別就是物理機(jī)的分配單位是一臺一臺的物理機(jī),虛擬化的分配單位可以在物理機(jī)上做更小的切分。
二、存儲管理。牛繼賓說,天云軟件在推薦解決方案時也是逐漸擴(kuò)大分布式存儲使用范圍,但是它的核心交易系統(tǒng)里面還是有問題,尤其是IOE延遲可靠性不能解決的話,很難做大量推廣。
三、網(wǎng)絡(luò)管理。我們經(jīng)常介紹SDN的管理,除此之外還有路由、交換機(jī)、防火墻,這塊的管理需要在上面自動劃分網(wǎng)絡(luò)服務(wù),劃分一個VPC或者劃分一個子網(wǎng),需要通過網(wǎng)絡(luò)管理模塊IPI做對接和呈現(xiàn)。
四、混合云管理。由于公有云的CDN、接入等優(yōu)勢,大部分用戶往往在用了一部分私有云資源承擔(dān)它的核心業(yè)務(wù)系統(tǒng)和數(shù)據(jù)運(yùn)營后,還會將部分互聯(lián)網(wǎng)業(yè)務(wù),放在公有云上。這部分資產(chǎn)需要通過云管理平臺統(tǒng)一做對接。對接完成之后還有一個很重要的功能就是,上層的應(yīng)用需要同時使用公有云跟私有云的資源,需要云管理平臺去做集群的統(tǒng)一調(diào)度,這是混合云管理的一個目標(biāo)。
五、多數(shù)據(jù)中心管理。公有云往往會在全國部署多個數(shù)據(jù)中心,這就涉及到一個云管理平臺對多個數(shù)據(jù)中心的管理。比如說數(shù)據(jù)中心里把OpenStack作為一個資源池模塊,最終是一個云管理平臺去做整體平臺的運(yùn)營和服務(wù)。
運(yùn)營管理系統(tǒng)
運(yùn)營管理系統(tǒng)最終目標(biāo)就是將資源管理系統(tǒng)、虛擬管理系統(tǒng)管理出來的資源運(yùn)營成為一種服務(wù)。比如說服務(wù)目錄就是將資源發(fā)布成云計(jì)算產(chǎn)品,用戶申請一個虛擬機(jī)、一塊存儲空間,而怎么做計(jì)量計(jì)費(fèi)?怎么給用戶發(fā)布出去?這是運(yùn)營管理系統(tǒng)的目標(biāo)。
虛擬化管理系統(tǒng)
虛擬化管理系統(tǒng)也可以看作資源管理的一個模塊,之所以把它拆分出來,因?yàn)樗潜容^核心的模塊,需要對它做更精細(xì)的設(shè)計(jì)。牛繼賓表示,天云軟件曾統(tǒng)計(jì)過電信運(yùn)營商、銀行等領(lǐng)域,發(fā)現(xiàn)市場上80%以上的用戶通過VMware實(shí)現(xiàn)虛擬化。
傳統(tǒng)應(yīng)用云化改造對云管理平臺功能設(shè)計(jì)的新需求
第一、 Web接入無狀態(tài)化。
第二、 App層微服務(wù)化。
第三、 數(shù)據(jù)分布式部署,數(shù)據(jù)種類越來越多,需要在SQL、NoSQL方面引入開源解決方案。
第四、 數(shù)據(jù)平臺化,應(yīng)用與數(shù)據(jù)分離,應(yīng)用微服務(wù)化、數(shù)據(jù)分布式平臺化。
第五、 聯(lián)機(jī)處理分析開源化,包括數(shù)據(jù)計(jì)算引擎開源化、數(shù)據(jù)集市開源化、ETL開源化。
應(yīng)用云化與應(yīng)用支撐對CMP帶來的需求與功能升級
一、 CMP需支持彈性伸縮。
二、 CMP需引入微服務(wù)的管理與支撐框架,來解決微服務(wù)管理的問題。
三、 應(yīng)用上云以后,需要對產(chǎn)生的監(jiān)控數(shù)據(jù)做更多的存儲與分析。
四、需支持大數(shù)據(jù)類、開源數(shù)據(jù)庫類等開源組件對接與管理。
根據(jù)以上需求,牛繼賓表示,天云軟件做了以下相應(yīng)措施:第一是CMP支持彈性伸縮;第二是資源管理系統(tǒng)引入了微服務(wù)的管理;第三是對開源組件的支持,引入了Docker+Kubernetes。
具體每一塊的設(shè)計(jì)過程如下:
第一、 虛擬機(jī)的編排過程。這需要引擎,要可以做應(yīng)用設(shè)計(jì),設(shè)計(jì)完之后要映射到實(shí)體,實(shí)體就是運(yùn)行環(huán)境,最后是任務(wù)管理。所以平臺已經(jīng)設(shè)計(jì)完成之后它會把應(yīng)用逐步的映射到機(jī)器上做編排之后的運(yùn)行。
第二、 虛擬機(jī)彈性伸縮。監(jiān)控流量狀態(tài),如果發(fā)現(xiàn)從一千到一萬的用戶增量,系統(tǒng)會自動擴(kuò)展服務(wù)器。如果是分布式檢索,系統(tǒng)會檢索,交易量變多會逐步擴(kuò)展處理數(shù)據(jù)的能力。
第三、 微服務(wù)治理模塊。包括服務(wù)注冊、服務(wù)發(fā)現(xiàn)、服務(wù)降級、服務(wù)調(diào)度、服務(wù)配置。
第四、 開源組件管理與彈性計(jì)算。牛繼賓透露,這塊是用Kubernetes實(shí)現(xiàn)的,是支撐應(yīng)用逐漸云化引入對開源的需求。
第五、用戶數(shù)據(jù)中心里積累了足夠的數(shù)據(jù)之后,需要去做數(shù)據(jù)歷史趨勢的分析。這塊對用戶很有價值。牛繼賓表示,天云軟件一開始用Hadoop實(shí)現(xiàn),現(xiàn)在逐步轉(zhuǎn)到Spark上實(shí)現(xiàn)。也實(shí)現(xiàn)了預(yù)測、回歸人工智能算法的學(xué)習(xí)。
容器與微服務(wù)化對云管理平臺新的架構(gòu)設(shè)計(jì)的支撐
左側(cè)是原先1.0架構(gòu),右側(cè)為微服務(wù)的系統(tǒng)架構(gòu)
牛繼賓告訴大家,原先1.0的部署架構(gòu),實(shí)際就是用戶服務(wù)、運(yùn)營服務(wù)。運(yùn)營服務(wù)里面有訂單管理、計(jì)費(fèi)管理、AZ配置。所有業(yè)務(wù)都是耦合的,如果要升級一個功能,整個服務(wù)都要升級。這是一個不利的點(diǎn)。
而微服務(wù)的系統(tǒng)架構(gòu),主要是兩個分離:第一個是客戶交互與業(yè)務(wù)邏輯分離,即前臺js跟后臺java分離;第二個是應(yīng)用與服務(wù)分離,在服務(wù)管理基礎(chǔ)上,把這些服務(wù)都管理起來,前臺對服務(wù)的使用通過微服務(wù)管理平臺發(fā)現(xiàn)相應(yīng)的服務(wù),導(dǎo)流到各個微服務(wù)節(jié)點(diǎn)上。
總體來說,微服務(wù)化之后不僅增強(qiáng)了對服務(wù)的能力,更是大大提高了效率,加快了產(chǎn)品迭代速度與業(yè)務(wù)可靠性。
云管理平臺未來的定位展望
在演講的最后,牛繼賓還給大家分享了他對云管理平臺未來的展望:
第一是精細(xì)化管理,管理能力更強(qiáng)。SDS、SDN等的管理,打通編排的所有環(huán)節(jié)。
第二是計(jì)費(fèi)的細(xì)化。我們需要去做基礎(chǔ)設(shè)施更細(xì)的計(jì)費(fèi),以前按天按月,現(xiàn)在按時按分。
第三是服務(wù)+應(yīng)用的一體化管控。從用戶系統(tǒng)的接入到對云服務(wù)組件的調(diào)用,全流程的管控分析體系,包括對于微服務(wù)的云上管控。
第四是混合云管理。公有云是不可阻擋的趨勢,私有云和公有云的混合管理也是一個方向。
第五是行業(yè)云和社區(qū)云的建設(shè)與支撐。如果你抓住一種特定的行業(yè)或者特定的應(yīng)用場景,比如說渲染云、高性能計(jì)算云等,它的盈利點(diǎn)還是比較多的。
第六是大規(guī)模節(jié)點(diǎn)管理時,考慮結(jié)合AI。針對資源池的運(yùn)行數(shù)據(jù)進(jìn)行分析與運(yùn)營,形成運(yùn)維知識的深度學(xué)習(xí)。
關(guān)注我們
