智谱发布Infra新成果:不加一块GPU 算力多出15%

澎湃新闻 05-21 11:05
权威精选

5月21日,澎湃新闻记者获悉,智谱联合驭驯网络与清华大学,在GLM-5.1线上生产集群中完成了新一代网络架构ZCube的规模化落地。

在线上GLM-5.1 coding场景中,在保持GPU算力、软件栈与应用不变的前提下,ZCube节省了33%交换机与光模块成本,同时将GPU平均推理吞吐提升了15%,并将TTFT P99降低了40.6%。

这意味着,同样的硬件投入,智谱的 GLM 大模型现在每秒能多响应 15% 的 API 请求。对于大模型 API 平台而言,这直接对应更高的并发上限以及在流量峰值下更稳定的用户体验。

(文章来源:澎湃新闻)

文章来源:澎湃新闻
原标题:智谱发布Infra新成果:不加一块GPU,算力多出15%
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
热点阅读
特朗普称与伊朗谈判进展“非常顺利”
特朗普称与伊朗谈判进展“非常顺利”
央视新闻 517评论
定了!6月12日SpaceX上市交易 发行价135美元 估值达到1.77万亿美元
定了!6月12日SpaceX上市交易 发行价135美元 估值达到1.77万亿美元
财联社 118评论
全球市场:美股三大指数集体收跌 道指跌超1% 存储股闪迪涨超6%创新高
全球市场:美股三大指数集体收跌 道指跌超1% 存储股闪迪涨超6%创新高
东方财富Choice数据 348评论
A股再登新闻联播:长线外资看好中国 持续加码硬科技
A股再登新闻联播:长线外资看好中国 持续加码硬科技
澎湃新闻 139评论
打开东方财富APP查看更多内容
24小时点击排行
站在光里比个芯,芯片再度爆发,拥抱大科技!
操作:CPO、半导体芯片狂飙吃大肉!抓住主线不放手,速速发车
深夜利空!18股减持,23股提示风险,1股收到问询函,别踩雷
【300万实盘41期】5月份赚23万,部分科技赛道进入高估区域!
美股大跌 A股上新闻 今天怎么走
点击查看更多内容
写评论 ...