kaiyun sports 独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资

开云体育官方网站 - KAIYUN
开云滚球
开云体育官方网站 - KAIYUN
kaiyun sports 独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资
发布日期:2026-03-11 11:08    点击次数:100

kaiyun sports 独家丨直指2000 Tokens/s,北大系「流式推理芯片」公司完成数千万元融资

{jz:field.toptypename/}

“不作念 GPU,只作念速率。”

客服QQ:88888888

作家丨姚单

剪辑丨余快

雷峰网独家获悉,国内一家专注超快流式推理芯片的创业公司——「寒序科技」晓谕完成数千万元融资,投资方为启高老本、赛意产业基金,源合老本担任本轮独家财务参谋人。

此前,寒序科技一直较为低调,其AI推理系列(SpinPU-E Series)产物的有关发扬在昔时两年间并未对外系统知道。

知情东说念主士浮现,寒序科技首颗芯片样片回片测试着力“相称理念念”,要道看法中,其「单元面积带宽」与Groq LPU(Language Process Unit,讲话经管单元)知道一致,kpl外围投注达到惊东说念主的100 GB/s/mm^(2),这是算计AI芯片推感性能的最病笃看法,亦然直指2000Tokens/s的底气。

在业内看来,这类智商决定了大模子(LLMs)推理时能否果然把“流式输出”、“高Tokens/s”作念出来。要道的是,这家公司下一代芯片一经在流片中,kaiyun sports以“片上MRAM+SRAM”和“服气性流式乘加单元”,看法性能指向夸张的2000Tokens/s+,反不雅现在主流对话模子推理速率仅约30-50Tokens/s。

在面前推理芯片竞争中,这险些是最具辨识度的硬看法之一。也因此,接近状貌的东说念主士将其评价为:国内少有的、果然沿着Groq处所往下打的团队。

值得珍爱的是,业内近期巨额传说,NVIDIA已以约200亿好意思元估值级别锁定Groq的推理期间相助,并筹备在NVIDIA GTC 2026行将发布的新一代AI推理系统中收受Groq芯片联想。寒序有经营被业界觉得是最面对该有经营的超大带宽流式经管芯片。

与GPU阶梯不同,这家公司选拔的是更聚焦、更极致的产物界说:不卷大而全,不卷通用考研,而把资源压到推理速率上,中枢绪念四个字——唯「快」不破。

{jz:field.toptypename/}

寒序科技建造于2023年8月,源于国内磁学究诘病笃高地「北京大学磁学中心」。中枢团队是国内首个有智商跑通从物理、材料、器件到异质集成、芯片联想、算法的交叉团队。

有接近本轮融资的东说念主士告诉雷峰网,这家公司之是以近期启动对外开释信息,一个病笃布景是:其要道期间与样片考据一经走过最危急阶段。现在,该公司新一轮融资也已在激动中。

更多创业状貌,添加微信ydinitialheart了解。