商汤科技董事长徐立:端侧应用是大模型“铺开”最核心的关键 ...

2024-4-24 13:59| 发布者: 仟茂传媒| 查看: 1155| 评论: 0|原作者: 仟茂传媒|来自: 每日经济新闻

摘要: 每经记者 朱成祥每经编辑 董兴生 4月24日上午,商汤-W(HK00020,股价0.8港元,市值268亿港元)港股开盘大涨。随后,商汤公告称,于11点15分起短暂停止买卖。暂停交易前,商汤股价上涨31.15%,报0.80港元/股。 4 ...

每经记者 朱成祥    每经编辑 董兴生    

4月24日上午,商汤-W(HK00020,股价0.8港元,市值268亿港元)港股开盘大涨。随后,商汤公告称,于11点15分起短暂停止买卖。暂停交易前,商汤股价上涨31.15%,报0.80港元/股。

4月23日,商汤科技在上海临港AIDC(人工智能计算中心)举办技术交流日活动。在技术交流日上,商汤发布日日新5.0大模型,全面对标GPT-4 Turbo。据悉,该大模型超过10TB tokens训练、覆盖大量合成数据,全新的日日新5.0采用混合专家架构,推理时上下文窗口可以有效到200K左右。

此外,商汤也推出日日新·端侧大模型。商汤科技董事长兼CEO徐立表示:“我们认为,今年是大模型在端侧应用的元年。试想,如果几十亿端侧的设备都在不停地调用大模型,没有任何一个服务器能够‘服务得起’。所以说,端侧应用,其实是大模型铺开最核心的关键。”

据了解,商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台达到78.3字/s。

图片来源:每日经济新闻 靳水平 摄


鲜花

握手

雷人

路过

鸡蛋

相关分类