寶存科技姜海:用匠心精神打造企業(yè)級SSD
近期,寶存科技產(chǎn)品研發(fā)副總姜海先生接受了國內(nèi)媒體專訪,不僅介紹了寶存科技新一代企業(yè)級固態(tài)硬盤,而且還解答了不少關于企業(yè)級SSD的相關知識以及行業(yè)發(fā)展現(xiàn)狀,干貨頗多,對企業(yè)級SSD感興趣的朋友們不容錯過。
寶存科技產(chǎn)品研發(fā)副總——姜海先生
寶存科技著力打造國產(chǎn)企業(yè)級SSD品牌
寶存科技是一家中國本土公司,注冊在上海,著力打造國產(chǎn)企業(yè)級SSD品牌,立足并服務中國的數(shù)據(jù)中心及存儲市場。2011年創(chuàng)立,2015年由SMI收購成為全資子公司。 最開始做的是已經(jīng)規(guī)模部署的PCIe SSD,它是Open Channel的前身。
寶存科技新一代PCIe4.0企業(yè)級SSD將于今年12月份全面推出
談到寶存科技的產(chǎn)品,Gen3在大的數(shù)據(jù)中心都有比較規(guī)模的商用,Gen4的產(chǎn)品SP4E和SP4X包括NVMe標品、ZNS(Zoned Namespace)、Open Channel都會在12月全面的推出, SP4E容量包括1.92T/3.84T/7.68T, SP4X包括 1.6T、3.2T和6.4T.Gen5的產(chǎn)品也在規(guī)劃和部署,規(guī)劃在2022年底推出PCle5.0產(chǎn)品,預期會有更加亮眼的表現(xiàn)。
寶存科技的企業(yè)級SSD目前全部采用SMI主控
寶存自從被收購之后開始使用SMI主控,從PCle3.0到現(xiàn)在的PCIE4.0以及即將推出的PCle5.0的主控。近兩年,Gen3的產(chǎn)品有比較規(guī)模的部署,Gen4的產(chǎn)品今年會全面推出,Gen5產(chǎn)品也在開發(fā)中。
整體來講,寶存科技作為國產(chǎn)自有品牌及對企業(yè)級SSD的長期堅定的投入,依托自己的穩(wěn)定供應的企業(yè)級主控(包括即將出來全新企業(yè)級Gen5主控),一線大廠的批量部署經(jīng)驗,在NAND掌控、管理、糾錯方面的豐富經(jīng)驗, 有對企業(yè)級應用深入的理解,在定制優(yōu)化領域軟件、固件的垂直整合的扎實理解和共同開發(fā)經(jīng)驗,經(jīng)過打磨的SSD驗證及生產(chǎn)、質(zhì)量把控體系,穩(wěn)定供應保障,堅持為本土企業(yè)級存儲及數(shù)據(jù)中心提供快速、優(yōu)質(zhì)的本地化、定制化技術服務。
寶存科技在行業(yè)內(nèi)擁有6大優(yōu)勢
(1)穩(wěn)定的長期的主控供應是寶存的一個優(yōu)勢。SMI在消費類市場上已經(jīng)有非常好的成績和市場的影響力,同時SMI在企業(yè)級主控和投入上也非常堅定,尤其是在Gen5這一塊是完全采用全新的架構,有母公司的全力支持,尤其是在近兩年業(yè)界缺芯片的情況下,寶存科技依然能夠保證主控穩(wěn)定的供應。
(2)寶存科技能提供全套的SSD解決方案。具備從主控到固件一直到驅(qū)動、產(chǎn)品驗證及和生產(chǎn)質(zhì)量把控,在完整方案的垂直整合上經(jīng)驗充足。
(3)第三個優(yōu)勢是,NAND Flash的使能和管理上屬于寶存科技很大的強項,寶存科技對于NAND的迭代及管理的各方面技術,都有非常扎實的成功經(jīng)驗和案例。
(4)第四個優(yōu)勢是超過十年的一線大廠規(guī)模部署經(jīng)驗。做企業(yè)級SSD需要5至10年以上經(jīng)驗,不管是穩(wěn)定性、可靠性,各方面都需要點點滴滴的積累,才能達到企業(yè)級標準。這意味著,在打磨企業(yè)級SSD從一開始就需要在軟硬件架構設計、功耗、穩(wěn)定度以及白盒、黑盒的驗證,整套質(zhì)量體系要做的非常的完整,才能達到高品質(zhì)的要求。十年企業(yè)級產(chǎn)品部署中,寶存科技積累到了非常寶貴的經(jīng)驗和教訓,使寶存科技的性能品質(zhì)逐漸沉淀成為企業(yè)級高規(guī)格,應對整個數(shù)據(jù)中心對企業(yè)級SSD的可靠性、穩(wěn)定性和性能要求。數(shù)據(jù)中心對年化故障率要求為千分之二點五,這是非常高的要求,寶存科技一直不懈的以匠心精神致力于打磨我們的企業(yè)級SSD水準。
(5)第五點是和一線大廠在應用定制化領域(Open Channel)有非常成功的案例,并且近兩年已經(jīng)得到非常規(guī)模的量產(chǎn)。定制化領域中有蠻特殊的要求,需要在軟件層級、固件層級、主控層級、硬件方面都需要和客戶做協(xié)作,垂直整合上需要非常扎實的理解和客戶共同的開發(fā)經(jīng)驗以及對上層應用和對底層的實現(xiàn)的充分理解,包括對各種NAND Flash掌控能力,各方面的要求是非常高的。這些經(jīng)驗都充分在寶存科技正在開發(fā)Gen4 Zoned Namespace 產(chǎn)品有充分的體現(xiàn)。
(6)第六點,對于寶存科技來講整個商業(yè)模式會根據(jù)客戶和合作伙伴的訴求提供彈性化的本土服務,可以提供整盤,也可以根據(jù)客戶的需求做一些定制化Turnkey方案,甚至可以支持客戶做一些半定制化方案的部分(有一些部分寶存科技提供,有一些部分由客戶自己開發(fā))。
寶存科技企業(yè)級SSD的發(fā)展趨勢
在未來,包括5G、AI、自動駕駛、萬物互聯(lián)、元宇宙的概念是在國家大基建推動浪潮之下,整個數(shù)據(jù)中心會持續(xù)的擴張,也會帶來更多的企業(yè)級訴求。PCIeSSD會漸漸取代SATA SSD,容量會持續(xù)的增大。另外是SSD在溫熱數(shù)據(jù)層會漸漸取代HDD,即使在冷數(shù)據(jù)層的話,基于QLC的 SSD也會取得一些份額。寶存科技看到企業(yè)級的SSD封裝形態(tài)是以U.2作為主流,后續(xù)PCle5.0整個封裝形態(tài)會進入到E3.S,因為新的封裝形態(tài)在散熱方面、功耗方面、性能方面會優(yōu)于U.2。
另外NVMe標準演化在命令集、命名空間類型、傳輸方式漸漸成熟,基于數(shù)據(jù)中心和企業(yè)存儲的spec有融合的趨勢,進一步推動標準化及第三方的認證,新的spec像Facebook,Microsoft,HP及DellEMC定義的ClouldSSD Spec囊括了數(shù)據(jù)中心和企業(yè)存儲必備的各個維度的要求。在標準化的框架下,也吸納了Zoned Namespace, KV namespace允許針對應用的優(yōu)化及定制化。企業(yè)級SSD除了需要保證7x24高效穩(wěn)定的工作,保證高可用性及數(shù)據(jù)完整性外,穩(wěn)定優(yōu)異的QoS延遲之外,需要能支持云原生分布式存儲,性能要能隨容量及功耗線性增長。寶存后續(xù)企業(yè)級SSD會跟進CPU在Gen4/Gen5的迭代節(jié)奏,除了在NVMe標品持續(xù)發(fā)力之外,延續(xù)在針對應用優(yōu)化的定制化領域包括Zoned Namespace及Open Channel持續(xù)支援一線數(shù)據(jù)中心的軟硬一體化優(yōu)化進程。最近寶存科技發(fā)布了Gen4 SP4E/SP4X NVMe 標盤,OCS/ZNS Gen4的盤也會在近期全面進入可量產(chǎn)階段。
隨著QLC的在性能、層數(shù)逐步改進,QLC SSD的成本的漸漸降低,大容量QLC SSD會漸漸在一些層面上和一定程度上在冷數(shù)據(jù)上獲取HDD的份額。QLC SSD在retention上尤其是offline retention過長上存在數(shù)據(jù)恢復的問題,這種取代必需要求系統(tǒng)不掉電或掉電時間可控。寶存科技與各家數(shù)據(jù)中心都在這些領域調(diào)研QLC SSD系統(tǒng)化落地的機會。
寶存科技看到PCle4.0部分數(shù)據(jù)中心從2021年下半年逐漸開始部署PCle4.0 SSD,整體上來講PCIe 4.0SSD本身采用在今年和明年會是大的趨勢,因為整體來講不管CPU頻率和本身各個計算資源的能力,以及網(wǎng)絡的速度都在同步的提升,所以我們看到大家導入PCle4.0的態(tài)度是比較積極的,只是有一些供應鏈導致PCle4.0導入速度受到影響,但整體的趨勢是不變的。寶存的Gen4 SSD SP4E/SP4X會在12月全面推出,寶存科技看到Gen4 SSD在各方面包括功能性能、QoS都比Gen3做了很多優(yōu)化。PCle5.0服務器的引入會在明年的Q1左右,整體上看到PCle5.0規(guī)模的部署會從2023年開始,寶存PCle5.0產(chǎn)品是2022年底提供CS,整個量產(chǎn)的節(jié)奏是適配服務器規(guī)模部署的節(jié)奏。
如何看待SSD的順序讀寫性能在不斷提升,而隨機讀寫性能卻提升不明顯?
首先第一個點順序讀寫性能是明顯提升的,順序讀寫性能應該是最容易做的關卡,隨機性能要是能夠提升,主要是主控,包括算法上需要革新的設計,這個設計本身來講首先你的CPU數(shù)量及處理能力要夠。第二個部分包括對NAND的plane數(shù)也是有要求的,隨著NAND的密度增大之后,需要AIPR保證同一個DIE能夠接受多個數(shù)據(jù)并發(fā)。對NAND的選擇,通道數(shù)和主主控各個控制層面、數(shù)據(jù)層面都必須不是瓶頸,才能夠在隨機性能上進步。之所以看到SSD隨機性能沒有進步的話,是因為主控的架構沒有發(fā)生太大的變化。
寶存科技看好PCle5.0的發(fā)展前景
寶存科技近期把PCle4.0的產(chǎn)品性能比Gen3有非常大的提升,大家可以關注具體的spec在PCle5.0時整個來講,包括最近的OCP也在展示新的PCle5.0平臺,PCle5.0可以看到在明年Q1就會陸續(xù)推出作為樣品,整個PCle5.0可以看到不僅是存儲、網(wǎng)速、加速卡、內(nèi)存的擴展各方面東西,都會往PCle5.0量級上靠,寶存科技對PCle5.0的前景是非??春玫?。從技術領域來講,為什么寶存覺得PCle5.0好呢?首先是PCle5.0的主控也是全新打造的,完全真正意義上主控的架構,寶存科技在功能的豐富性上面或者性能的競爭力上面,以及包括QoS服務質(zhì)量上,還是能耗比各個維度,包括對最新功能支持程度上,寶存科技認為都是處于領先的主控,所以我們預期在PCle5.0產(chǎn)品大家一定會看到比較亮眼的表現(xiàn)。
整個PCle5.0中可以看到CPU存儲的結(jié)構體系,包括高速緩存、加速卡、GPU、DPU、SSD速率進一步提升,性能各方面的優(yōu)化。包括這些性能增加了之后,整個功耗也增加了以后,里面意味著U.2會向E3.S演化,也是為了在功耗散熱方面有更多的優(yōu)化,甚至會看到后面會用液冷的方式實施。所以后面看到PCle5.0伴隨的不僅僅是硬件架構的變化,甚至會促使到軟硬件協(xié)同一體,包括云計算的存儲、基礎架構上都會發(fā)生比較大的變化。這個變化在2023年以后才能真正把PCle5.0變化的實質(zhì)動能呈現(xiàn)出來。
寶存科技在未來不會推出M.2和SATA接口的企業(yè)級SSD
這兩個領域不會是未來的趨勢,寶存科技會比較集中在PCIe,SP4E和SP4X的Gen4 SSD的尺寸形態(tài)是U.2,PCle5.0是SP5E、SP5X這個部分產(chǎn)品會有U.2漸漸向EWXE3.S過度。(英)E1.S Gen4在北美現(xiàn)在用的比較多,國內(nèi)Gen4 SSD主流是U.2,在Gen5會向E3.S演化,SATA接口盤會漸漸被PCIE SSD取代,因為它的介質(zhì)是一樣的,成本是類似的,SATA的接口本身卻限制了盤的性能,所以它被PCIE SSD取代是大勢所趨。
關于IFPS
IFPS是隨著元宇宙一起提出來的,整個協(xié)議可以允許你的文件和數(shù)據(jù)是一種去中心化的方式進行存儲,可以通過特定的CID確定文件的內(nèi)容本身對于安全性和多副本訪問的可靠性上面,這是蠻好的提升。但是這個概念,到目前為止更多停留在概念和初始發(fā)動的階段,沒有形成很成熟的生態(tài)。對于企業(yè)級的SSD來講并不影響SSD部署的部分,因為這個部分整體概念是上層,文件系統(tǒng)和數(shù)據(jù)進行切分和存儲的概念。對于SSD本身來講老老實實的把數(shù)據(jù)能夠支持存儲,它的性能可靠性能夠把持得住,另外里面也設置到分層存儲的概念能夠支持得到,整體上來講這個部分不涉及到底層存儲的硬盤實際的創(chuàng)新和操作。
關于元宇宙
說實話這是一個新的概念,元宇宙、星際文件系統(tǒng)和區(qū)塊鏈有一些相關的概念,在大基建基礎上看到元宇宙是萬物互聯(lián)和數(shù)據(jù)隨時能夠訪問,可能對傳統(tǒng)數(shù)據(jù)中心的架構會產(chǎn)生一些沖擊和演化。但是對存儲本身會產(chǎn)生哪些挑戰(zhàn),會有演化的訴求。但這個時間點不敢評論有哪些機遇和挑戰(zhàn),相信這個概念的產(chǎn)生是先對上層基礎架構的定義會產(chǎn)生很大的沖擊,之后才會到底層硬件布局、存儲布局、軟件協(xié)同部分。至于會產(chǎn)生什么樣的變化,需要一些時間才能慢慢的沉淀出來。
關于PLC閃存
寶存科技現(xiàn)在還沒有做過任何PLC的樣品,當然也談不上相關測試數(shù)據(jù)和壽命的評點。整體來講,企業(yè)級存儲的整個探索和布局當前是集中在TLC/QLC上的,甚至QLC只是集中在溫冷數(shù)據(jù)上的布局,QLC在企業(yè)級使用中是最開始的階段。PLC的企業(yè)級探索為時尚早。整體看下來PLC它比QLC只多了25%的容量,但它的壽命、誤碼率(擦寫次數(shù)及數(shù)據(jù)保持上都會遠遠弱于QLC)和性能的表現(xiàn)會遠遠弱于PLC以及,即使現(xiàn)在,所以PLC估計到2025年才會真正進入到企業(yè)級視野,同時PLC要用到企業(yè)級也需要非常強勁的主控來適配,包括誤碼的糾錯能力及性能保障。在PLC無法承載企業(yè)級的性能訴求的情況下,上面一定要有其他層級比較高性能的部分作為緩存。所以現(xiàn)在PLC應該是初期概念的階段,包括樣品的部分還沒有看到,所以估計要到2024年底、2025年初才可能看到PLC企業(yè)級的東西出來。
再稍微補充一下,QLC相當于一個存儲門含四個點,它的電壓總共是16級。PLC相當于一個門電路中放的是5個比特(bit),意味著它的電壓要分成32個層級,才能區(qū)別出5個比特,一個單元要存儲32個不同等級的電壓,意味著精確的控制,里面的電子數(shù)量工藝要求非常高,也很容易出現(xiàn)問題。PLC在企業(yè)級中有幾個部分需要做,一個是主控上需要非常強勁,第二個部分上面因為有一些更強勁的存儲介質(zhì)來做PLC的緩存。
關于寶存科技企業(yè)級SSD的散熱技術
Gen4 SSD包括軟硬件在設計架構的初期是考慮到封裝形態(tài)和U2功耗的限制,所以整體上來講這個部分的功耗及發(fā)熱量會滿足數(shù)據(jù)中心及企業(yè)存儲的要求。通常在企業(yè)級應用,有比較完備的功耗散熱系統(tǒng)比如U.2盤會有一個金屬外殼,盤片包括在內(nèi)部選擇和設計上都會根據(jù)熱學原理進行仿真和優(yōu)化,包括導熱貼能夠把熱傳導到外殼上面,外殼通過液冷或者環(huán)境里面的風把它給帶走。整體上來講,寶存科技看到在Gen4的狀況之下,其實對于散熱來講并沒有產(chǎn)生質(zhì)的增加和變化,最新的散熱技術沒有太大的要求。將來看到PCle5.0會看到散熱技術一些新的要求,包含新的封裝形態(tài)E3.S/E3.L可以超過U.2的25瓦,可以到40瓦到70瓦性能、功耗及散熱上(比如從風冷變成液冷)需要較多的考量。
關于企業(yè)級SSD數(shù)據(jù)安全方面的策略
整體上來講,現(xiàn)在SSD通常支持加密的部分。加密通常來講有兩方面加密的概念,第一方面是數(shù)據(jù)加密,數(shù)據(jù)本身通過密鑰的方式加密,必須要拿到鑰匙才能解出來。另外涉及到芯片加密的概念,即使數(shù)據(jù)加密了,但是別人把中間的固件篡改了,它是完全有機會把你的數(shù)據(jù)讀走的,所以里面涉及到芯片加密,一開始運作時必須要檢測硬件/固件是不是原生廠商的,如果有破壞的話完全沒有辦法啟動。整體上來講數(shù)據(jù)安全方面,如果在終端層級上存在這兩個問題,數(shù)據(jù)加密和芯片加密,現(xiàn)在大家更多做的東西是數(shù)據(jù)加密,但是芯片加密上還需進一步完善。
關于寶存科技在存儲產(chǎn)品壽命和可靠性方面的舉措
企業(yè)級SSD對壽命本身有明確的定義。整體來講存儲產(chǎn)品的壽命,最多的東西來決定于所有硬件部件壽命最短板地方,現(xiàn)在看起來整體講要看壽命的話,更重要的因素是在于NAND的壽命上。除了對硬件本身的壽命要有一定的要求外,其他靠主控和固件怎么盡量延展它的壽命,大家已經(jīng)比較熟悉了延展壽命有一些磨損均衡、NAND管理算法和超強的糾錯能力,還配合了保證壽命的同時怎么樣保證性能和QoS,為了數(shù)據(jù)不丟就會去重試,這些重試會對性能進行影響??煽啃院w的東西比較多,設計軟硬件做架構設計的時候的綜合考量,另外主控內(nèi)部的設計在各個數(shù)據(jù)路徑和控制路徑上都要有一些各方面的保護,甚至需要有一些端到端的保護防止靜默數(shù)據(jù)丟失的狀況,掉電保護,過溫保護,主控、固件件設計,BOM(包括NAND)選擇,測試質(zhì)量把控、生產(chǎn)把關,能夠把軟、硬和偶然出現(xiàn)的問題都給清除掉,主控的檢錯能力及固件錯誤處理算法和,這是統(tǒng)一考慮的東西。
關注我們



