當(dāng)前位置:首頁 > 外匯資訊 > 正文內(nèi)容

用AI重新定義通信——超算互聯(lián)網(wǎng)時代

激石外匯2023-11-08 12:01:01外匯資訊312

激石Pepperstone(http://wargoo.com/)報道:

  傳統(tǒng)的通信方式正在被AI重新定義。

  隨著人工智能技術(shù)和應(yīng)用的快速發(fā)展,算力已成為一個高度擁擠的賽道,從GPU、光模塊到算力租賃,算力的核心環(huán)節(jié)吸引了投資者絕大多數(shù)注意力。然而,GPU逐步到貨只是整個算力鏈條的第一步,后續(xù)如何發(fā)揮出這些昂貴設(shè)備的最大潛力也是較為困難的過程。

  國盛證券指出,算力到貨后如何將其上云并保證穩(wěn)定性,如何從通信層面和模型層面壓榨出顯卡的每一絲性能,如何將不同算力中心的算力,調(diào)度并實(shí)時輸送到終端用戶手中,這些都是服務(wù)器的“紙面算力”到最后“實(shí)際算力”的困難與挑戰(zhàn)。

  由此,引出下一個朝陽賽道——超算互聯(lián)網(wǎng)。

  根據(jù)國盛證券通信團(tuán)隊在最新報告中的定義,超算互聯(lián)網(wǎng)是指,服務(wù)器到貨后,從形成穩(wěn)定算力到輸出穩(wěn)定的商業(yè)推理結(jié)果的全過程,其中主要包括了云化、調(diào)優(yōu)、調(diào)度、部署、落地、數(shù)據(jù)管理等等軟硬結(jié)合的數(shù)個環(huán)節(jié)。

  國盛證券指出,云化/調(diào)優(yōu)/調(diào)度是將紙面算力變?yōu)榭捎盟懔Φ南绕诓襟E,云化使算力變成用戶可以便捷調(diào)用的“數(shù)字能源”,調(diào)優(yōu)則是從通信和模型層面,壓榨GPU的利用率,實(shí)現(xiàn)算力降本增效的必經(jīng)之路。調(diào)度是將全國乃至全球的算力資源統(tǒng)籌分配,實(shí)現(xiàn)成本優(yōu)化,入網(wǎng)即有算力的核心環(huán)節(jié)。

  值得注意的是,由于算力資源,先發(fā)優(yōu)勢等等因素,海外AI發(fā)展擁有了較大的領(lǐng)先,國內(nèi)AI發(fā)展進(jìn)一步承壓。但國盛證券認(rèn)為,隨著國內(nèi)自主算力和交換體系逐漸起量,中國算力有望加速追趕。

  中國軟件公司有望走出一條從加速庫等核心環(huán)節(jié)延伸至下游落地場景的全新體系,同時,憑借全球領(lǐng)先的DCI網(wǎng)絡(luò)與基建,運(yùn)營商也有望走出一條算力網(wǎng)建設(shè)的全新道路。

  此外,北美如OctoML,DECI,Databrick等優(yōu)秀的AI后周期服務(wù)公司也給中國創(chuàng)業(yè)者們提供了方向和思路,軟硬件加速追趕,中國AI前景光明。

  AI超算互聯(lián)網(wǎng)——算力的后周期市場

  國盛證券表示,相較于傳統(tǒng)行業(yè),算力后周期市場的 “后”指的更多的是后服務(wù)市場,包括了顯卡服務(wù)器到貨IDC后,從形成穩(wěn)定算力到輸出穩(wěn)定的商業(yè)推理結(jié)果的全過程,主要環(huán)節(jié)包括云化、調(diào)優(yōu)、調(diào)度、部署、落地、數(shù)據(jù)管理等等軟硬結(jié)合的數(shù)個環(huán)節(jié)。

  縱觀全球算力后周期的發(fā)展態(tài)勢,國盛證券認(rèn)為正在形成兩個迥然不同的生態(tài):

  在涉及算力使用和大模型訓(xùn)練的等上層建筑時,整個行業(yè)對于資本支出、模型經(jīng)驗(yàn)積累等等方面的壁壘正在逐漸加深,行業(yè)格局加速走向巨頭通吃。

  但在涉及到商業(yè)落地,數(shù)據(jù)安全,平臺可視化等等模型偏下游環(huán)節(jié)時,北美的創(chuàng)業(yè)公司呈現(xiàn)了百花齊放的生態(tài),同時傳統(tǒng)軟件巨頭也在積極開發(fā)方案,對接AI需求。

  至于國內(nèi)市場的現(xiàn)狀,國盛證券認(rèn)為:

  隨著國內(nèi)算力資源起量與模型訓(xùn)練深入,對于算力和模型層面的投資將會再度聚焦,聚焦大廠,聚焦通信能力。同時國內(nèi)相關(guān)軟件市場仍處于萌芽階段,對標(biāo)海外優(yōu)秀創(chuàng)業(yè)產(chǎn)品,提早滿足客戶需求,將給國內(nèi)軟件和創(chuàng)業(yè)公司帶來新一輪機(jī)會。

  算力云化:算力租賃勢起,被AI重定義的云計算

  國盛證券指出,云計算是科技行業(yè)過去十年發(fā)展最為迅速的領(lǐng)域之一,伴隨的是全球數(shù)字化程度的持續(xù)提升。隨著ChatGPT引爆生成式AI賽道,許多企業(yè)正在轉(zhuǎn)向云計算,算力需求從CPU向GPU躍遷。

  對于大模型訓(xùn)練而言,多GPU互聯(lián)基礎(chǔ)設(shè)施是門檻,不僅僅是GPU,更重要的是GPU之間的高速互聯(lián),是GPU與交換機(jī)、光模塊等基礎(chǔ)設(shè)施共同互聯(lián)后的集群,其資本開支和技術(shù)難度相較于以CPU和存儲服務(wù)器為主的傳統(tǒng)基礎(chǔ)設(shè)施,有明顯的提升,這也進(jìn)一步抬高了大模型的門檻。

  大模型訓(xùn)練需要數(shù)千片甚至上萬片GPU集群連續(xù)訓(xùn)練數(shù)月時間,海量計算的同時還有海量數(shù)據(jù)交換需求,與傳統(tǒng)cpu和存儲集群比較,內(nèi)部通信互聯(lián)要求提高十分明顯。在超算集群中,以H100集群為例,其中第一層便使用400G光模塊,向上則使用800G光模塊和對應(yīng)交換機(jī),網(wǎng)絡(luò)互聯(lián)要求提升十分明顯。

  近年來,全球云計算提供商都在積極布局AI,英偉達(dá)憑借GPU技術(shù)領(lǐng)先地位在AI云計算領(lǐng)域占有優(yōu)勢,國內(nèi)算力租賃行業(yè)也蓬勃發(fā)展。

  英偉達(dá)DGX Cloud發(fā)布后,標(biāo)志著英偉達(dá)正式入局AI云計算,考慮到英偉達(dá)GPU在AI領(lǐng)域的一家獨(dú)大,云計算行業(yè)正在進(jìn)入新的時代。

  與此同時,甲骨文通過與英偉達(dá)深度綁定,正在越來越多的拿下AI領(lǐng)域的客戶,而亞馬遜aws、微軟azure、谷歌云為代表的頭部公有云也正在加速布局AI領(lǐng)域,英偉達(dá)憑借自身優(yōu)勢在AI云計算領(lǐng)域領(lǐng)先眾對手,云計算格局正在發(fā)生變化。

  而國內(nèi),算力租賃也在高速發(fā)展,擁有算力資源的公司和具備算力運(yùn)營能力的企業(yè)正在逐漸體現(xiàn)出相應(yīng)優(yōu)勢,伴隨國內(nèi)AI產(chǎn)業(yè)的高速發(fā)展,算力租賃行業(yè)也進(jìn)入高速發(fā)展階段。

  實(shí)際上,在大規(guī)模訓(xùn)練上,和傳統(tǒng)云計算比較,需要考慮的問題更加復(fù)雜,包括如何利用多卡來突破內(nèi)存限制的瓶頸,大量計算資源間如何通信、協(xié)作,如何平衡各類層出不窮的大規(guī)模訓(xùn)練技術(shù)。國盛證券將大規(guī)模訓(xùn)練技術(shù)面臨的挑戰(zhàn)分為四個部分:內(nèi)存、通訊、計算和調(diào)優(yōu)。

  總結(jié)來看,現(xiàn)階段大模型訓(xùn)練上,最核心的兩個要素分別是數(shù)據(jù)和算力,國盛證券表示,在很長一段時間,不斷地提高參數(shù)量和提升算力集群規(guī)模,是大模型發(fā)展的主要思路,通過“大力出奇跡”的形式反而更容易訓(xùn)練出高質(zhì)量大模型。

  AI如何重新定義通信,看一看算力全球龍頭英偉達(dá)的通信之路。

  英偉達(dá)作為全球GPU領(lǐng)軍企業(yè),早在十年前就開始布局AI領(lǐng)域,對AI發(fā)展有著深刻思考和理解。我們回顧英偉達(dá)超算方案,從DGX A100到DGX H100,再到最新的DGX GH200,我們可以清楚的看到,除了GPU芯片計算能力的提升以外,通信能力的大幅度持續(xù)增長,是另一個最明顯的變化。

  在AI領(lǐng)域,通信的作用不亞于計算,通信能力的不足或確實(shí)將直接限制GPU芯片計算能力的發(fā)揮,英偉達(dá)早在2019年收購網(wǎng)絡(luò)交換公司Mellanox,加碼布局?jǐn)?shù)據(jù)中心網(wǎng)絡(luò)交換領(lǐng)域,充分體現(xiàn)英偉達(dá)的超前眼光和對于通信的重視。

  我們以GH200為例,NVlink雙向?qū)拵?00GB/s,單向?qū)拵?50GB/s,8張卡即3.6Tbps,總帶寬28.8Tbps,分?jǐn)偟饺齻€NVlink Switch,單個NVlink Switch的上下行帶寬為9.6Tbps,對應(yīng)800G光模塊為9.6T/800g*2=24只,一臺服務(wù)器共有72只800G光模塊,GPU與800G光模塊比例為1:9。

  而此前DGX H100架構(gòu)GPU與800G光模塊比例約為1:3,DGX A100則主要以400G光模塊為主。從英偉達(dá)產(chǎn)品的迭代來看,我們也清晰的看到算力龍頭在通信上的持續(xù)發(fā)力,通信匹配計算能力的提升將會一直演繹。

  實(shí)際上,打破通信墻,是目前高效發(fā)揮算力集群能力的無二之選。國盛證券指出,通信能力的提高,是當(dāng)前最高效的“調(diào)優(yōu)”方式,再出色的調(diào)度和調(diào)優(yōu),也比不上廣泛使用高性能交換機(jī)和高端高速率光模塊修建的集群內(nèi)部“高速公路”。

  此外,目前跨架構(gòu)、跨集群的算力調(diào)度也是現(xiàn)實(shí)問題,英偉達(dá)不同代際產(chǎn)品之間并不能混合組網(wǎng),而不同數(shù)據(jù)中心之間的算力調(diào)度難度也不小。東數(shù)西算等跨區(qū)域算力調(diào)度需求也正在增長。具體到模型訓(xùn)練層面,調(diào)優(yōu)也是一個重要方面。

  算力調(diào)優(yōu):大模型時代,通信即調(diào)優(yōu)

  根據(jù)國盛證券研報,算力發(fā)展產(chǎn)生三大邊際變化,推動算力調(diào)優(yōu)成為核心議題。算力調(diào)優(yōu)概念的誕生與興起,主要伴隨了算力及網(wǎng)絡(luò)的三大變化,算力需求總量、擴(kuò)散趨勢和需求特征均在5G、AI等產(chǎn)業(yè)加速發(fā)展的背景下發(fā)生邊際變化。

  國盛證券認(rèn)為,未來伴隨AI、5G、數(shù)字經(jīng)濟(jì)的持續(xù)發(fā)展,算力資源持續(xù)緊缺,算力調(diào)優(yōu)將成為算力使用者的終身課題。

  算力調(diào)優(yōu)概念范疇龐大,囊括軟硬件技術(shù),涵蓋宏微觀場景。宏觀層面包含模型調(diào)優(yōu)、網(wǎng)絡(luò)調(diào)優(yōu)、算力調(diào)度三大層級,具有針對性的解決不同的算力問題,其中,網(wǎng)絡(luò)調(diào)優(yōu)是算力調(diào)優(yōu)的核心手段。

  網(wǎng)絡(luò)調(diào)優(yōu):算力調(diào)優(yōu)的核心手段

  國盛證券指出,GPU采用并行計算方式,擅長處理大量、簡單的運(yùn)算,因此多適用于圖像圖形處理和AI推理。但是大模型復(fù)雜度日益提升,單卡GPU顯存有限,無法滿足訓(xùn)練需求,此外,后續(xù)大模型訓(xùn)練需要更多參數(shù)和更多計算,由此產(chǎn)生的GPU需求更為龐大。為適應(yīng)算力需求,需要聯(lián)合多張GPU甚至多臺服務(wù)器協(xié)同工作,分布式訓(xùn)練成為核心訓(xùn)練方式。

  網(wǎng)絡(luò)連接在分布式系統(tǒng)中擔(dān)任重要角色。網(wǎng)絡(luò)在分布式系統(tǒng)中提供了連接作用,可以根據(jù)連接層級區(qū)分為單卡、多卡、多機(jī)互聯(lián),單卡內(nèi)的網(wǎng)絡(luò)為計算用的神經(jīng)網(wǎng),多卡之間的連接(即GPU互聯(lián))通常采用PCIe或各種高帶寬通信網(wǎng)絡(luò),多機(jī)之間的連接(即服務(wù)器互聯(lián))通常采用RDMA網(wǎng)絡(luò)。

  國盛證券表示,分布式訓(xùn)練下RDMA網(wǎng)絡(luò)成為最佳選擇,包含IB網(wǎng)絡(luò)和以太網(wǎng)絡(luò)。傳統(tǒng)的TCP/IP網(wǎng)絡(luò)通信是通過內(nèi)核發(fā)送消息,涉及較多數(shù)據(jù)移動和數(shù)據(jù)復(fù)制,不適用高性能計算、大數(shù)據(jù)分析等需要IO高并發(fā)、低時延的場景。

  RDMA是一種計算機(jī)網(wǎng)絡(luò)技術(shù),可以直接遠(yuǎn)程訪問內(nèi)存數(shù)據(jù),無需操作系統(tǒng)內(nèi)核介入,不占用CPU資源,可以顯著提高數(shù)據(jù)傳輸?shù)男阅懿⑶医档脱舆t,因此更適配于大規(guī)模并行計算機(jī)集群的網(wǎng)絡(luò)需求。目前有三種RDMA:Infiniband、RoCE 、iWARP,后兩者是基于以太網(wǎng)的技術(shù)。

  值得一提的是,AI大模型的訓(xùn)練和推理對網(wǎng)絡(luò)提出了有三大新的需求:超大規(guī)模、超高帶寬以及超長穩(wěn)定。

  1)超大規(guī)模-訓(xùn)練快慢:規(guī)模的大小直接決定模型訓(xùn)練的快慢。一個 1750 億的模型,如果采用2千張 GPU,需要訓(xùn)練100天以上。采用8千卡則可以把時間壓縮到30 天左右。

  2)超高帶寬-效率:Allreduce帶寬直接決定大規(guī)模分布式下的整體效率。平均單GPU的Allreduce帶寬有5GB/s的時候,大規(guī)模分布式的整體加速比只有約70%;平均單GPU的Allreduce帶寬20GB/s才能獲得約90%的加速比,相當(dāng)于單GPU跑滿400G網(wǎng)卡。

  3)超長穩(wěn)定-訓(xùn)練不中斷:大模型訓(xùn)練時長至少是幾個星期,長時間下的穩(wěn)定性尤為重要。

  穩(wěn)定性又可以細(xì)分為GPU 可用性+網(wǎng)絡(luò)可用性:

  GPU 可用性:根據(jù)百度智能云技術(shù)站測算,假定單 GPU 的月可用性是 99.9%,那么在千卡規(guī)模下模型訓(xùn)練一月內(nèi)遇到故障發(fā)生中斷的概率是60%,而如果采用 8 千卡中斷概率就有99%。即使 GPU 的可用性提升到 99.99%,8 千卡下的中斷概率仍然在 50% 左右。

  網(wǎng)絡(luò)可用性:存儲的讀寫性能也對大模型的訓(xùn)練非常重要,這里面就包括了數(shù)據(jù)集的讀取以及訓(xùn)練過程中checkpoint的讀寫。網(wǎng)絡(luò)必須保證更高的可用性,才能盡可能減少模型的訓(xùn)練中斷,降低模型做 checkpoint的頻率以及開銷。

  國盛證券認(rèn)為,超長穩(wěn)定性能在三大基礎(chǔ)性能中,屬于必不可少的剛需地位,直接影響模型訓(xùn)練和后續(xù)推理的延續(xù)性以及成功率。

  大模型訓(xùn)練中,網(wǎng)絡(luò)極其復(fù)雜,一些硬件故障無法被顯式直接感知,為保障模型訓(xùn)練的長期穩(wěn)定性,各大平臺均在不同程度上應(yīng)用智算可視化工具,對數(shù)據(jù)進(jìn)行實(shí)時監(jiān)控采集。

  在目前的技術(shù)中,百度百舸平臺大模型配備兩大核心工具,任務(wù)可視化工具+故障診斷工具,openAI在訓(xùn)練過程中加checkpoint保證連續(xù)性。

  國盛證券表示,面對AI大模型對算力網(wǎng)絡(luò)通信功能提出的新需求,核心在于網(wǎng)絡(luò)通信能力的提升,輔助以智算可視化等必備硬件。

  模型調(diào)優(yōu):大模型時代逐漸式微

  國盛證券表示,模型層面的調(diào)優(yōu),當(dāng)前可理解為,如何通過模型架構(gòu)的設(shè)計,進(jìn)一步壓榨GPU的性能,而并非壓縮模型的非必要環(huán)節(jié),從而節(jié)省模型的訓(xùn)練所需的算力。

  模型架構(gòu)層面優(yōu)化GPU使用能力的方法主要是并行,即對流水線的工人的任務(wù)分配或者流水線的優(yōu)化。并行的方式主要有兩種:數(shù)據(jù)并行和模型并行。

  “數(shù)據(jù)并行,是指將一層模型運(yùn)算中所需要的數(shù)據(jù)切分至N張顯卡進(jìn)行運(yùn)算,N張顯卡運(yùn)算出結(jié)果后,即可匯總進(jìn)行下一層。模型并行指的是將一次模型訓(xùn)練需要的N層運(yùn)算,分別放入N張顯卡進(jìn)行運(yùn)算,但隨著模型體積愈發(fā)龐大,單個顯卡難以容納一整層的計算,所以模型并行在當(dāng)下正在加速被數(shù)據(jù)并行所替代,數(shù)據(jù)并行的瓶頸則在于數(shù)據(jù)實(shí)時的切分與溝通,并行方式的變化,也在一定程度上,進(jìn)一步提高了通信能力的重要性。

  不過,當(dāng)下大模型時代,模型的算法層面調(diào)優(yōu),或者是去優(yōu)化模型訓(xùn)練中所需要的算力與金錢性價比這種路線已經(jīng)逐漸式微。國盛證券認(rèn)為,模型層面的進(jìn)化,可能更多的會發(fā)生于訓(xùn)練系統(tǒng)和工具庫層面如何去更好的調(diào)用GPU算力。

  算力調(diào)度:全局最強(qiáng)輔助

  算力調(diào)度本質(zhì)上是將算力作為資源,進(jìn)行資源分配和優(yōu)化的過程,核心解決算力資源供需不匹配的問題。

  算力調(diào)度的場景較為廣泛,既可以按照產(chǎn)業(yè)鏈分為云與云之間、云和數(shù)據(jù)中心之間、云網(wǎng)端之間,也可以按照行業(yè)、地區(qū)、層級進(jìn)行劃分,目前較為典型的兩個調(diào)度場景存在于跨區(qū)域和跨層級。

  算力調(diào)度目前尚處于逐步落地階段,具體實(shí)施步驟有待在執(zhí)行中逐漸完善,但是根據(jù)算力分布分散、需求具備多樣性和靈活性等特質(zhì),通常情況下算力調(diào)度至少需要包含三大步驟:整合多元異構(gòu)資源、搭建算力調(diào)度平臺、建立標(biāo)準(zhǔn)規(guī)范體系。

  目前國內(nèi)已經(jīng)涌現(xiàn)多個算力調(diào)度平臺,按照主導(dǎo)方的不同可以分為四大類:電信運(yùn)營商主導(dǎo)平臺、地方政府主導(dǎo)平臺、地方政府主導(dǎo)平臺、行業(yè)機(jī)構(gòu)主導(dǎo)型平臺。

  其中運(yùn)營商算力調(diào)度平臺的基礎(chǔ)能力優(yōu)勢較為顯著:中國移動推出移動云智能算力調(diào)度平臺,中國電信天翼云下的“息壤”平臺即具備智能高效算力調(diào)度能力,中國聯(lián)通推出算網(wǎng)一體化編排調(diào)度體系進(jìn)行算網(wǎng)資源的智能調(diào)配。

  軟件服務(wù)的三個方向

  國盛證券指出,軟件服務(wù)主要存在三個發(fā)展方向:數(shù)據(jù)管理、模型落地、訓(xùn)練可視化。其中,模型微調(diào)的基礎(chǔ)是數(shù)據(jù)管理。

  優(yōu)質(zhì)的、結(jié)構(gòu)化的數(shù)據(jù)要素,推動大模型訓(xùn)練向著高精確度、高安全性和垂直化專業(yè)化的方向前進(jìn)。現(xiàn)有的開源LLM稱為“預(yù)訓(xùn)練模型”,也就是說其他人已經(jīng)收集了大量的訓(xùn)練數(shù)據(jù)并提前訓(xùn)練了模型,例如NVIDIA NeMo和MetaLlama都是“多面手”,它們能流利地使用英各種語言,并且對各種話題都有不同程度的了解,但是礙于訓(xùn)練時的數(shù)據(jù),這些LLM往往對某個專業(yè)領(lǐng)域不夠深入。

  在模型落地方面,國盛證券介紹了幾種不同的工具,比如,Modular Mojo、octoML、Deci。其中,octoML,一種模型部署工具,快速實(shí)現(xiàn)成品模型在各種算力設(shè)備上的優(yōu)化和部署。

  以O(shè)ctoML部署的StableDiffusion為例,OctoML利用機(jī)器學(xué)習(xí)優(yōu)化技術(shù)能夠?qū)崿F(xiàn)三倍的推理速度,同時還支持快速模型微調(diào)。

  OctoML優(yōu)化了多GPU部署和連續(xù)批處理,Llama 2實(shí)現(xiàn)3倍性能提升。大模型的參數(shù)數(shù)量給GPU帶來的負(fù)載并非線性增長而是指數(shù)增長,因?yàn)閰?shù)數(shù)量的提升帶來了多GPU并行計算問題和大模型最為經(jīng)典的KV緩存問題。OctoAI針對以上問題進(jìn)行了優(yōu)化。

  訓(xùn)練可視化方面,Databricks:GPU資源管理工具,模型和訓(xùn)練進(jìn)度可視化,Databricks核心業(yè)務(wù)是將數(shù)據(jù)湖和數(shù)據(jù)倉庫統(tǒng)一到一個平臺中,也就是湖倉一體,和snowflake相似,Databricks在數(shù)據(jù)庫功能實(shí)現(xiàn)方式上與snowflake存在區(qū)別。

  國內(nèi)市場展望

  在模型與AI進(jìn)展更加領(lǐng)先的海外,已經(jīng)能夠看到客戶需求與行業(yè)創(chuàng)造的共振。但國內(nèi)目前的AI生態(tài),仍然處于先追趕算力,再追趕模型的階段,對于商業(yè)部署,全流程可視化等等的后續(xù)需求,市場尚未顯現(xiàn)。但國盛證券認(rèn)為,AI大勢在國內(nèi)不可阻擋,并且隨著算力資源,模型資源向著互聯(lián)網(wǎng)大廠、運(yùn)營商等加速集中,國內(nèi)現(xiàn)有的中小型AI參與者可以未雨綢繆地參考海外模式進(jìn)行轉(zhuǎn)型或者擴(kuò)張。

  算力租賃/調(diào)優(yōu)廠商參考databrick模式。上節(jié)提到,databrick軟件擁有幾大特色,訓(xùn)練資源,訓(xùn)練流程的可視化,訓(xùn)練算力。訓(xùn)練用存儲的實(shí)時擴(kuò)容等,并通過把這些能力形成一套完整的SaaS平臺,獲得了客戶的認(rèn)可。相比Databrick,國內(nèi)算力租賃廠商,算力調(diào)優(yōu)廠商擁有更加自主可控的算力資源與算力可視化硬件基礎(chǔ),如果能夠在此之上配合SaaS整合能力和存儲相關(guān)服務(wù),有望成為軟硬件一體的綜合訓(xùn)練服務(wù)SaaS平臺。

  數(shù)據(jù)庫廠商參考snowflake、cloudflare模式。近年來,海外以Snowflake為代表的全新數(shù)據(jù)庫巨頭將云端數(shù)據(jù)存儲帶入了新的高度。如今隨著AI對于訓(xùn)練數(shù)據(jù)的需求,如何將數(shù)據(jù)庫安全,合理的輸送到訓(xùn)練集群,如何將現(xiàn)有數(shù)據(jù)庫自動轉(zhuǎn)換成適用于AI訓(xùn)練的數(shù)據(jù),已經(jīng)成為這些頭部數(shù)據(jù)庫公司的下一代進(jìn)化方向。國內(nèi)數(shù)據(jù)庫公司目前多服務(wù)于信創(chuàng)等場景,對于云存儲,AI數(shù)據(jù)轉(zhuǎn)化,支持AI訓(xùn)練等方向仍然有很大的發(fā)展空間。

  中小模型,垂直場景創(chuàng)業(yè)者參考DECI、octoML模式。隨著海外大模型廠商漸漸往垂直領(lǐng)域滲透,垂類應(yīng)用廠商逐漸從獨(dú)立開發(fā)小模型轉(zhuǎn)向接入成熟大模型,同時醫(yī)藥,圖像識別等需要特殊處理或者獨(dú)立數(shù)據(jù)庫支持的行業(yè)依然依賴于獨(dú)立模型。隨著國內(nèi)模型格局逐漸向大廠集中,中小模型創(chuàng)業(yè)者或是垂類場景創(chuàng)業(yè)者轉(zhuǎn)向幫助已有垂類應(yīng)用快速AI化,將打開新的末端生態(tài)。

  國盛證券認(rèn)為,隨著英偉達(dá),AMD等海外算力在國內(nèi)受限,國內(nèi)算力及其配套生態(tài)則有望變得更加開放。

  影響算力發(fā)揮的核心環(huán)節(jié)主要集中在GPU配套的編譯器以及覆蓋海量垂直應(yīng)用場景的加速庫,編譯器環(huán)節(jié)需要對于GPU架構(gòu)的強(qiáng)耦合,因此產(chǎn)業(yè)鏈外溢機(jī)會可能較少。但加速庫需要各類場景下的客戶與GPU廠商共同進(jìn)步。

  當(dāng)前以昇騰為代表的國產(chǎn)GPU加速生態(tài)仍然處于建設(shè)初期,因此給予了國內(nèi)第三方相關(guān)廠商與GPU互相合作建設(shè)加速庫的機(jī)會,因此,可能在加速庫共建的基礎(chǔ)上,國內(nèi)軟件創(chuàng)業(yè)公司將對于后續(xù)的落地部署環(huán)節(jié)能有更強(qiáng)的垂直擴(kuò)張能力。

掃描二維碼推送至手機(jī)訪問。

版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請注明出處。

本文鏈接:http://wargoo.com/news/2261.html

“用AI重新定義通信——超算互聯(lián)網(wǎng)時代” 的相關(guān)文章

地產(chǎn)會不會成為宏觀交易的預(yù)期差?

激石Pepperstone(http://wargoo.com/)報道: 從自上而下的視角看,未來2個月有五條宏觀交易線索值得關(guān)注。第一,部分城市放松地產(chǎn)政策,疊加房貸利率快速下行,地產(chǎn)銷售可能出現(xiàn)超預(yù)期反彈。第二,半年報季高景氣板塊的業(yè)績與預(yù)期賽跑。第三,美國衰退預(yù)...

丹麥?zhǔn)锥及l(fā)生槍擊事件,警方稱多人傷亡,市長:情況非常嚴(yán)重!22歲男子被捕,不排除恐襲可能

丹麥?zhǔn)锥及l(fā)生槍擊事件,警方稱多人傷亡,市長:情況非常嚴(yán)重!22歲男子被捕,不排除恐襲可能

激石Pepperstone(http://wargoo.com/)報道:人口只有500多萬的北歐國家丹麥,不僅是童話的故鄉(xiāng),還曾多次被評為幸福指數(shù)最高的國度。然而當(dāng)?shù)貢r間7月3日晚,一起槍擊案打破了該國的寧靜。當(dāng)日,丹麥?zhǔn)锥几绫竟⑦~厄購物中心發(fā)生一起槍擊事件,當(dāng)?shù)鼐奖硎荆延卸嗳藗?..

大摩“美股大空頭”:衰退比預(yù)期更嚴(yán)重,每個人都在想業(yè)績會多慘,估值該如何下調(diào)

大摩“美股大空頭”:衰退比預(yù)期更嚴(yán)重,每個人都在想業(yè)績會多慘,估值該如何下調(diào)

激石Pepperstone(http://wargoo.com/)報道:周二,美股低開高走,但市場對美國經(jīng)濟(jì)衰退的擔(dān)憂情緒揮之不去。 摩根士丹利首席股票策略師、華爾街大空頭邁克·威爾遜(Mike Wilson)在最新的報告中警告稱: 美國經(jīng)濟(jì)增長正在大幅放緩,甚至將比我們預(yù)期的更為嚴(yán)重。...

住房市場降溫!美國房租高增長戛然而止

激石Pepperstone(http://wargoo.com/)報道:夏季往往是美國租金高峰,但隨著飆升的通脹和經(jīng)濟(jì)衰退前景不斷“侵蝕”美國人的支出能力,美國租賃市場出現(xiàn)顯著降溫。 美國長租平臺Zumper提供的數(shù)據(jù)顯示,美國6月份全國一居室公寓的租金中值同比飆升11.4%,但環(huán)比增幅僅...

免稅巨頭Dufry大動作:收購跨國餐飲集團(tuán)Autogrill,打造一個60億美元旅游零售集團(tuán)

激石Pepperstone(http://wargoo.com/)報道:瑞士旅游免稅零售巨頭杜福瑞(Dufry)同意從意大利貝納通(Benetton)家族手中收購跨國餐飲公司Autogrill SpA,從而在旅游零售市場打造一個價值60億美元的新公司。 周一公布的一份聲明稱,貝納通家族將把...

A股一周策略前瞻:指數(shù)震蕩期,中報季行情或轉(zhuǎn)為盈利驅(qū)動

A股一周策略前瞻:指數(shù)震蕩期,中報季行情或轉(zhuǎn)為盈利驅(qū)動

激石Pepperstone(http://wargoo.com/)報道:1、分析師態(tài)度 本周策略分析師都認(rèn)為市場或?qū)⒏呶怀掷m(xù)震蕩,結(jié)構(gòu)性行情為主,指數(shù)再上臺階仍需等待。 2、市場行情步入關(guān)鍵時間窗口 中信策略指出,市場行情步入關(guān)鍵時間窗口,今年中報季是近年來宏觀經(jīng)濟(jì)數(shù)據(jù)最弱并且上市公司業(yè)績...