当前位置:首页 > 创业 > 正文

“算力门槛下降近20倍”!DeepSeek爆火有望带动RISC-V发展

  • 创业
  • 2025-03-01 00:51:04
  • 19

来源:@财联社APP微博

《科创板日报》2月28日讯(记者 黄心怡)由达摩院举办的2025玄铁RISC-V生态大会上,《科创板日报》记者获悉,玄铁首款服务器级RISC-V CPU C930将在3月开启交付。目前,RISC-V的落地正从嵌入式系统挺进高性能、AI算力等领域。在RISC-V国际基金会2024年批准的25项标准中,超过一半与高性能或AI相关。玄铁团队也在推动超过30%的RISC-V高性能处理器落地应用。

活动现场,国电南瑞、经纬恒润等上市公司加入“RISC-V无剑联盟”。此前的首批联盟伙伴还包括:Arteris(AIP)、Imagination、新思、达摩院玄铁、中国电信、海尔科技、芯昇科技等。

多名业内人士在采访中表示,DeepSeek的出现,为算力市场带来了更多的可能性。DeepSeek通过MOE架构让激活参数比大幅下降,降低的算力需求可以达到近20倍,这给国产芯片带来的机会,未来所有芯片都有希望具备适配大模型能力。

▌RISC-V迈向高性能、AI算力领域

《科创板日报》记者现场了解到,即将在3月交付的玄铁最高性能处理器C930,其通用算力性能达到SPECint2006基准测试15/GHz,面向服务器级高性能应用场景。此外,C930搭载512 bits RVV1.0和8 TOPS Matrix双引擎,将通用高性能算力与AI算力结合,并开放DSA扩展接口以支持更多特性要求。

达摩院还披露了C908X、R908A、XL200等玄铁处理器的新品研发计划,重点面向AI加速、车载、高速互联等方向。具体而言,C908X定位为玄铁首款AI专用处理器,支持4096 bits超长数据位宽RVV1.0矢量扩展;R908A面向车规级芯片的高可靠需求;XL200则将提供更大规模、更高性能的多簇一致性互联。

在产业上下游合作生态方面,围绕玄铁高性能RISC-V处理器,劳特巴赫提升问题诊断和性能优化效率,兆松科技支持编译优化,Arteris的NoC互联IP提供高性能互联,纽创信安提供eHSM模块和完整的安全启动流程,服务复杂RISC-V芯片的设计开发。此外,爱芯元智提供爱芯通元NPU集成IP模块,openKylin打造适配RISC-V的AI PC操作系统。

在高性能和AI场景的落地应用方面,中科院软件所正在开展“如意BOOK乙巳版”、智能机器人、AI PC等RISC-V高性能应用。其中,基于玄铁C920处理器的AI PC概念机已经跑通Llama、Qwen、DeepSeek等开源模型。

中科院软件所RISC-V行业生态负责人郭松柳在采访中介绍,“我们基于RISC-V架构做的AI PC的概念机,可以跑一个7B的DeepSeek大模型,用来做编程助手,同时还具备多模态的能力,比如文生图,做图像的修改和修复等。未来,生态伙伴将其作为参考设计来面向领域内做定制,这是未来RISC-V面向高性能落地的机遇。”

RISC-V无剑联盟在会上官宣了一批新成员,Cadence、西门子EDA、经纬恒润、普华基础软件、网易有道、国电南瑞加入。其中,经纬恒润将基于RISC-V提供芯片定义、AUTOSAR基础软件和自研工具链开发,构建从芯片到软件的完整车规级解决方案。普华基础软件发布的首个规模化、量产级开源安全车控操作系统小满(EasyXMen)已完成与RISC-V架构适配,并将持续跟踪支持最新RISC-V架构相关规范,共建软硬协同的技术生态,推动RISC-V“上车”;网易有道和国电南瑞则将各自在教育硬件和电网领域探索RISC-V架构。

江原科技、物奇微电子、忆芯科技、速显微等多家芯片企业进行了RISC-V芯片新品发布仪式,涉及AI推理、高性能网络、SSD主控、GPU SoC等方向。中科重德、泰芯、矽昌、匠芯创、聪链等企业则展示了RISC-V芯片在机器人、工控、智能终端等行业的落地应用。

▌推理算力暴增!DeepSeek为国产芯片带来新机遇

北京开源芯片研究院首席科学家包云岗认为,随着DeepSeek等大模型的兴起,AI推理产生的算力需求将会数量级增长,近期各行各业都在本地化部署DeepSeek,在全国产生了巨大的算力需求。今年1月后国内很多智算中心算力供不应求。

包云岗表示,AI推理的算力需求呈现两个特征,一是与CPU紧密协作,AI推理将会成为未来各种业务中不可或缺的环节,但业务主程序仍运行在CPU上,通过 API调用将AI推理请求卸载到Al加速器,得到推理结果后,再由CPU返回给用户。

二是呈现多样化需求,不同场景产生不同的算力需求,相应的资源约束也不同,比如云端推理算力要考虑满血版大模型的高效部署,端侧应用场景则往往会部署不同容量的裁剪版。

知合计算CEO孟建熠认为,DeepSeek的出现,为整个市场带来了更多的可能性,使得算力、内存、互联原有平衡发生剧变,新算力架构机会再次进入同一起跑线。由于MOE架构以更低的激活比达成更低的计算成本,使模型的单机部署成为可能。

阿里巴巴达摩院资深技术专家李春强也表示,DeepSeek通过MOE架构让激活参数比大幅下降,使得在同等效果的大模型所需的算力明显下降,这意味着在芯片设计方面,计算能力、存储容量、芯片之间的互联通信都会有新的平衡点。“比如由于所需的算力明显下降,很多算力可以不需要在算力卡上跑了,可以在CPU里面做,这个对于RISC-V而言,或者做CPU来说是一个很好的机会。”

阿里云无影事业部总裁张献涛在采访中认为,DeepSeek降低的算力需求可达到近20倍。

“过去,大模型在算力方面的需求量是极其大的,全世界真正能够运行比如671b这种参数模型的处理器,可能只有英伟达这些少数芯片。但是DeepSeek大模型出来后,可以看到,对于算力的要求其实没有以前那么高了,也给了更多芯片的一些机会。比如671B的模型,在每一个问题里面调用专家模块,其激活的模型参数大概只有37B,这个算力起码降低了近20倍。“

DeepSeek带来的算力成本降低,有机会让所有芯片都具有适配大模型能力。孟建熠表示,在scaling law规则下,国产芯片在工艺上、算力上是较为难以追赶的。“现在大模型算力下降20倍,一方面很多芯片都有机会够得着,另一方面,大模型也将从云端部署走向端侧,RISC-V无论是Vector还是Matrix形成的这一套算力体系及其生态,是有机会让所有的芯片都具备大模型的能力。”

谈及会否推出基于玄铁C930芯片的DeepSeek一体机,张献涛称“今年还有点悬,可能要明年才会出来。”

对于RISC-V的未来发展,包云岗强调,不要老盯着替代Arm,要发挥RISC-V可定制优势,形成产业竞争力。如果RISC-V的高可定制性优势若能充分发挥,则有望成为AI推理算力的最佳搭档,期待RISC-V与AI未来能形成类似 Windows 与 Intel、Arm 与安卓的组合。

包云岗也指出,RISC-V在AI领域还面临着三座大山:第一是工具箱,第二是人才,第三是标杆案例。他表示,RISC-V在工具方面与其他成熟体系相比存在较大差距,亟需完善;人才紧缺,从芯片设计、验证解决方案到基础设施各个层次,都需要更多人才投身 Respect 领域;同时,还需要标杆案例来树立行业信心,就像人工智能领域,如果能够出现像2016年AlphaGo战胜李世石那样的事件出现,让行业对人工智能充满信心,在当前领域也需要类似的标杆案例来推动发展。

有话要说...