首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

商汤股价飙涨超30%暂停交易,大模型迎端侧爆发元年

第一财经 2024-04-24 14:47:11 听新闻

作者:钱童心    责编:刘佳

今年是大模型在端侧应用爆发的元年。“去年我们主要聚焦在模型本身的参数发布,而今年则更多关注行业场景的落地,以行业来驱动人工智能的爆发。”徐立表示。

4月24日上午开盘,商汤科技股价大涨超过30%后紧急暂停交易。

当天下午,商汤发布公告称,4月23日,公司于上海临港AIDC举办技术交流日活动,其中本公司推出6000亿参数大模型(日日新5.0),在知识、数学、推理和代码能力方面大幅提升,综合性能全面对标GPT-4Turbo。同时,公司推出行业大模型一体机版本以及移动端侧大模型SDK版本。董事会注意到最近B类股份的交易价格及交易量发生不寻常波动,B类股份于4月24日上午11时15分起暂停买卖。本公司已向联交所申请B类股份于4月25日上午9时正起恢复买卖。 

4月23日,商汤科技举办技术交流日活动,发布行业首个"云、端、边"全栈大模型产品矩阵,以满足不同规模场景的应用需求,并升级"日日新5.0"大模型体系。

商汤科技董事长兼CEO徐立在发布会上表示,日日新5.0大部分核心测试集指标上全面对标甚至已经超过OpenAI目前最先进的AI大模型GPT-4 Turbo。本次更新主要聚集增强了知识、数学、推理及代码能力。

徐立还称,今年是大模型在端侧应用爆发的元年。"去年我们主要聚焦在模型本身的参数发布,而今年则更多关注行业场景的落地,以行业来驱动人工智能的爆发。"

他说道,如果几十亿个端侧设备都在不停地调用大模型,将需要消耗巨大算力,而且没有任何一个服务器能够支撑得起,因此具有不同场景下端侧应用能力的"小模型"将是AI模型普及最关键的核心。

"在不同的适用场景下,小模型的决策速度可以更快。"徐立说道,"云端联动可以得到最佳推理效果。我们的数据显示,端侧在处理部分场景的占比超过70%时,推理的成本更低。"

事实上,大模型向"轻量化"方向发展已经成为业内的一个趋势。4月23日,微软也推出轻量级人工智能模型Phi-3-mini,希望通过提供具有成本效益的选项来吸引更广泛的客户群。

微软表示,Phi-3-mini是该公司发布的三种小语言模型(SLM)中的首个。SLM旨在执行更简单的任务,使资源有限的公司更容易使用。微软生成式AI研究副总裁Sébastien Bubeck表示:"Phi-3的价格与具有类似功能的其他模型版本相比,仅为十分之一。"

Phi-3-mini也在微软云服务平台Azure、机器学习模型平台Hugging Face以及英伟达的软件工具NIM上可用。

在商汤的发布会上,该公司还首次推出面向金融、代码、医疗、政务等多个领域的边缘产品"商汤企业级大模型一体机",可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,降低企业应用大模型的门槛。

商汤在发布会上公布了这台大模型一体机的售价,每台售价35万元人民币起,单台机器可支持100人规模研发团队使用,使用成本最低为每人每天4.5元。该公司称,相比行业同类产品,使用该设备推理成本可节约80%。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭