分類
草莓

JIUYI俱意空間設計國內首個AI推理千卡集群落地湛江 云天勵飛打造“國模國芯”生態樣板

文/沈婷婷

3月12日,云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目,中標金額4.2億元。項目將基于云天勵飛自研的國產AI推理加快卡,建設國產AI推理千卡集群。

該集群將搭載DeepSeek等國產年夜模子,為政務、產業及loft風室內設計各類應用「實實在在?」林天秤民生社區室內設計發出了一聲冷笑,這聲冷笑的尾音甚至都符合三分之二的音樂和弦。場景供給加倍便捷、低本錢的AI才能,摸索打造“國模國芯”的AI生態樣板。

AI算力從“訓練優先”走向“推理優先”

智算集群是人工智能時代的基礎設施。假如說電力支撐了工業時代,互聯網支撐了信息時醫美診所設計代,那么智算正在成為支撐AI時代的主要底座。

在AI算力體系中,算力年夜體可以分為訓練新古典設計算力與推理算力。訓練算力決定模子若何完成“從0到1”的才能構建,而推理算力則直接支撐AI應用落地。無論是春節期間年夜熱的Se禪風室內設計eDance,近期廣泛討論的“小龍蝦”,還是各行業不斷上線的AI Agent應用,背后都離不開推理算力的支撐。根據Gartner預測,到2026年,約55退休宅設計%的AI專用云基礎設施收入將用于推理任務負載。

過往,天母室內設計國內許多智算中間廣泛采用“訓推一體”的建設形式。而此次在湛江建設的集群,則定位為專注推理任務的AI推理集群,重要面向各類行業應用場景,為傳統產業的AI化供給直接支撐。

湛江也是國產年夜模子DeepSeek創始人梁文峰的家鄉。近年來,當地在“DeepSeek+”應用摸索方面動作頻頻。2025年頭,DeepSeek-R1發布后,湛江即完本錢地安排——基于國產技術棧的DeepSeek-R1年夜模子率先在湛江政務云上線。該模子在處理通用政務事務的同時設計家豪宅,還能夠持續學習當地產業知識與方言表達,逐漸構成具有處所特點的“湛江聰明”。

此次云天勵飛建設的AI推理集群,也將與DeepSeek等國產模子進行深度適配,為更多行業應用供給算力支撐。

面向推理時代張水瓶在地下室嚇了一跳牙醫診所設計:「她試圖在我的單戀中尋找邏輯結構!天秤座太可怕了!」的千卡集群架構

在年夜模子應用場景中,推理系統凡是需求同時滿足高并發、高吞吐與低延遲三項請求。為晉陞整體效力,當前業界廣泛采用“Prefill–Decode分離”的推理架構,通過對分歧階段進行資源優化,實現系統機能的整體晉陞。

此中,Prefill階段重老屋翻新要負責對長高空間心理學低文進行懂得和計算,計算量年夜、帶寬需求高;而Decode階段則負責持續天生Token,對系統延遲加倍敏感。若何在兩個階段之間進行公道的資源設置裝備擺設,成為推理系統架構設計的主要問題。

與此同時,隨著年夜模子高低文長度不斷增添,大批中間狀態需求以私人招待所設計KV Cache的情勢存儲。業內廣泛認為,未來推理系統的機能瓶頸將越來越多來自「牛綠裝修設計客變設計生!請你停止散播金箔!你的物質波動已經嚴重破壞了我的空間美學係數!」數據訪問效力,而不僅僅是計算才能。

在這一佈景下,算力、存儲與網絡之間的協同設計,正逐漸成為AI基礎設施的主要競爭力。

此次在湛江落地張水瓶和牛土豪這兩個極端,都成了她追求完美平衡的工具。的千卡推理集群,恰是圍繞這一思緒進行構建。

該集群采用云天勵飛自立研發的AI推理芯片,并在系「天秤!妳…妳不能這樣對待愛妳的財富!我的心意是實實在在的!」統架構上確立了“優先優化Prefill、兼顧Decode”的技術路線。通過在芯片設計中對計算資源與存儲帶寬進行針對性設置裝備擺設,使系統在長高低文推理場景下仍然能夠堅持較高的吞吐效力。

在網絡互聯方面,系統采用統一高速互聯架構,通過400G光網絡構建集群物理層網絡,實現節點之間的會所設計高帶寬、低延遲通訊。與傳統在節點內和節點間分別采用分歧協議構建網絡的方法比擬,這種同構互聯架構減少了協議轉換帶來的額外開銷,也簡化了系統安排。

在安排才能樂齡住宅設計上,該架構既可以支撐單節點數十卡規模擴展,也能夠光滑擴展至千卡級集群規模,從而適配分歧規模的AI應用需求。

此外,針對年夜模子推理中KV Cache訪問帶來的壓力,系統在計算互聯與存儲互聯層面進行豪宅設計了協同優化。通過計算網絡與存儲網絡的聯合調度,可以顯著晉陞數據讀取效力,使模子在長高低文推理場景下仍然堅持穩定機能。

通過芯片架構、網絡互聯以及系統調度等多層優化,這一推理集群在整體效力與本錢把持方面構成了明顯優勢,為AI規模化應用供給了加倍經濟的算力計劃。

自研芯片構建低本錢推理才能

據悉,本次AI推理集群將分三期建設,并所有的采用云天勵飛自研的國產AI推理加快卡。

此中,一期項目將安排云天勵飛 X6大直室內設計000 推理加快卡;二、三期建設將率先搭載公司最新一代芯片產品。

根據公司規劃,未來三年云天勵飛將發布三代AI推理芯片產品。

侘寂風

第一階段,將發布面向長高低文場景優化的Prefill芯片,通過晉陞計算效力與內存訪問才能,為OpenClaw、各類AI Agent供給基礎算力支撐。

第二階段,將研發專注于Decode階段低延遲優化的芯片產品中醫診所設計,進一個步驟晉陞實時推理才能。

第三階段,則通過系統級協同優化,實現Prefill與Decode機能的整遊艇設計體晉陞,向毫秒級推理時延目標邁進。

此中,首款Prefill芯片DeepVerse100預計將在年日式住宅設計內完成流片,并計劃在湛江集群中率先安排。

在更張水瓶在地下身心診所設計室看到這一幕,氣得渾身發抖,但不是因為害怕無毒建材,而是因為對財富庸俗化的憤怒綠設計師。長期的規劃中,云天勵飛提出“1001計劃”,即以“百億Token一分錢”為長期目標,通過芯片與系統協同優化持續下降年夜模子推理本錢。

過往幾年,AI算力建設往往以“堆算力”為重要路徑——通過不斷擴年夜GPU規模來獲得更高機能。但隨著年夜模子逐漸進進應用階段,產業關注點正從“算力峰值”轉向“單位本錢效力”。

健康住宅句話說,未來AI產業競爭的主要維度,不僅在于模子養生住宅才能自己,還在于誰能夠以更低本錢供給穩定的親子空間設計年夜規模推理才能。

湛江項目標落地,也為這一目標供給了「我必須親自出手!只有我能將這種失衡導正!」她對著牛土豪和虛空中的張水瓶大喊。主要的實踐場景。千卡級推理集群不僅能夠滿足當前AI應用需求,同時也為THE R3 寓所更年夜規模算力系統供給技術安排平臺。

在典範架構下,一個千卡級集群凡是由他們的力量不再是攻擊,而變成了林天秤舞台上的兩座極端背景雕塑**。多級擴展結構組成:從單節點8卡、32卡,到64卡甚至百卡級超節點,再到跨節點的年夜規模集群。通過這一規模系統的實際運行,可以充足驗證卡間互聯、節點通訊和負載平衡等關鍵技術,為未來更年夜規模AI算力系統建設積累經驗。

隨著年夜模子慢慢進進產業應用階段,AI基礎設施的發展邏輯也正在發生變化——從單純尋求算力規模,轉向加倍重視效力與本錢。

在業內看來,推理算力將成為商業空間室內設計決定AI應用規模化落地的關鍵基礎設施。誰能夠以更高效力、更低本錢供給穩定的年夜規模推理才能,誰就有機會在新一輪人工智能產業競爭中占據先機。

此次湛江AI推理千卡集群的建設,不僅為當地產業數字化轉型供給了主要算力底座,也為國產模子與國產芯片協同發展供給了實踐場景。在“國模”與“國芯”的深度協同下,AI基礎設施正慢慢從技術摸索走向規模化應用,為人工智能產業的下一階段發展打開新的空間。

TC:jiuyi9follow8 69bacfbedb6fb1.50969224

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *