本文作者:admin

“大装置+大模型”再下一城,商汤日日新大模型体系引领“智慧飞轮”

admin 04-14 1
“大装置+大模型”再下一城,商汤日日新大模型体系引领“智慧飞轮”摘要:   近日,商汤科技SenseTime在上海举办技术交流日活动,以“大模型+大算力”为核心推进AGI的发展再下一城。活动上,商汤“日日新SenseNova”大模型体系正式问世,可提供...

  近日,商汤科技SenseTime在上海举办技术交流日活动,以“大模型+大算力”为核心推进AGI的发展再下一城。活动上,商汤“日日新SenseNova”大模型体系正式问世,可提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等强大而易用的内容生成平台产品。

  实际上,近年来不论外界论调如何,商汤科技始终专攻技术突破,积累商业化落地的实践经验,引领了人工智能行业的前沿技术发展。“苟日新、日日新、又日新”,是商汤科技“日日新SenseNova”大模型的核心寓意,蕴含了商汤科技对于未来不断解锁AGI更多可能、在模型的迭代速度及处理问题的能力上做到日日更新的强烈信心。以通用人工智能(AGI)为核心发展战略,以“大模型+大装置”的技术发展根基,商汤科技未来将通过全栈的大模型研发体系,进一步赋能千行百业,让AI技术惠及每一个人。

  “大装置+大模型”赋能千行百业,引领“智慧飞轮”

  作为全球人工智能软件行业领军者,商汤科技始终具备前瞻性的眼光,积极投资建设人工智能高性能计算基础设施,专注于超大模型的研发。在2022年,商汤科技不但取得了令人瞩目的研发成果,还进一步实现了科技成就的商业化落地,再推动了通用人工智能(AGI)的历史进程。

  在算力时代,业界训练模型对基础设施、基础算力的需求非常旺盛,基础算力中对并行效率的要求也越来越高,但真正符合要求的基础设施却依然是稀缺标的。

  2022年,商汤科技的SenseCore AI大装置持续扩建,取得了核心突破。基于2.7万块GPU的并行计算系统实现了5.0 exaFLOPS的算力输出能力,成为亚洲最大的智能计算平台之一。

  业界领先的AI大装置能够为训练越来越好的大模型提供强大的支撑。目前,商汤AI大装置上的算力可以同步支持20个千亿规模参数量的超大模型,并且以千卡规模来同时训练,构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。目前,SenseCore已支持了超过10个大模型训练项目,面向8家大型客户支持了7000多张GPU的计算资源。

  在以AI大装置SenseCore打造AGI时代基础设施算力支持之下,商汤科技将其全栈的大模型研发体系命名为“日日新SenseNova”,覆盖公司4大板块的核心业务,在20余个场景中实现商业落地。

  从部分领域来管中窥豹。对于商汤科技极为重要的政企客户,“日日新SenseNova”为其提供了多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新SenseNova”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。

  在自身业务方面,以近年来技术屡有突破的智能驾驶为例,基于视觉大模型,商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产,也构建了感知决策一体化的自动驾驶多模态模型,带来更强的环境、行为、动机解码能力。

  在模型体系中,最为值得关注的是商汤最新研发的语言大模型“商量SenseChat”。

  近期,ChatGPT的爆火有目共睹,访问量高达8.89亿次。在AIGC的浪潮下,国内一众科技公司应声而起,文心一言、360“红孩儿”等产品相继问世。但究竟谁才是下一个GPT,能够引领新一代浪潮,目前还难以定论。

  而商汤科技在这一场竞赛中,实际上已经跑在了前排。早在2019年,商汤科技便开始了在AI大模型领域的探索,技术沉淀与商业经验积累已近5年。“商量SenseChat”作为千亿级参数的自然语言处理模型,使用大量数据进行训练,充分考虑中文语境,能够更好地理解和处理中文文本。

  活动上,“商量SenseChat”向市场展示了出色的多轮对话、超长文本的理解能力以及多项创新应用。例如,“商量SenseChat”能够帮助开发者高效地编写和调试代码,测试用例生成得非常完整,支持多语言的中英文编程;能够为用户提供健康咨询、辅助诊疗,目前已在清华医院落地便民服务,未来会推动在瑞金医院和华西医院陆续上线;能够作为PDF文件阅读助手,轻松从复杂文档中提取和概括信息。

  以通用人工智能(AGI)为核心发展战略,通过AI大装置SenseCore与大模型体系“日日新SenseNova”,将科技成就实现商业化落地,助力千行百业跨越智能化鸿沟,是商汤科技作为AI领航者的责任与理想。

  专注原创技术初心不改,AI大模型有望创造新的生产范式

  模型体系“日日新SenseNova”问世的背后,是商汤科技多年来持续研发投入的直接成果体现。

  2022年,商汤科技的研发支出为40.14亿元,相比去年的36.14亿元增长11%,增加主要用于内部大型AI模型培训工作的AIDC基础设施投资,以及包括AI芯片相关研发工作在内的技术创新。多年来对于研发投入始终如一的重视,铸就了商汤的科技内核。

  而在人员方面,截至2022年底,商汤科技的研发队伍达3466人,占员工总数的68%。人均研发效率也在持续提升,人均每年研发模型数相较于2021年进一步提高了90%,为9.35个,累计生产的商用模型提高了93%,为67000个。

  在研发方面的过硬实力,是商汤科技领跑行业,主动拥抱智能化时代机遇的信心与底气。目前,以大装置和大模型为发展根基,商汤科技已经在AGI发展中建立了极强的技术壁垒。

  截至目前,商汤科技在AI大装置上的历史投入规模已超百亿元,但AI大装置也正是“人工智能的粒子对撞机”,即便在前期研发阶段有着巨额投入,但却能够引领着AI技术实现跃迁,通过对海量数据(维权)的拆解和碰撞,不仅支持自身大模型的训练,也能够支持下游生态,真正实现赋能千行百业。

  商汤科技联合创始人、首席科学家王晓刚在活动上表示,人工智能的技术革命已经到来,它的影响是极其深远的,必将推动商汤持续加大在基础设施上的建设,重塑我们的研发体系。

  未来,商汤将持续推进“日日新SenseNova”大模型体系建设,也会有更多大模型源源不断产生,支持更多客户共同创造新的生产范式。

阅读
分享