作者 | 张淼 编辑 | 吾人
来源 | 融中财经(ID:thecapital)
近日,大数据巨头公司Databricks宣布亿13亿美元的价格(约合94亿人民币)收购生成式AI初创公司MosaicML。该笔发生在美国硅谷的收购案,为年内生成式AI领域内公布的最大一笔。引来业界高度关注。
MosaicML于2021年成立于美国旧金山,其刚成立不久便成功完成了第一轮融资,知名风投DCVC、Lux Capital、Future Ventures等投资机构参与,MosaicML共获得3700万美元的融资。
第一轮融资时,MosaicML公司估值为2.2亿美元,但在此次收购中,MosaicML的估值直接提高近6倍,令业界感到惊叹。
成立不到两年,估值便如此之高,这家生成式AI初创公司到底有何“看家本领”?
01
AI模型服务企业端
产品质优价廉
根据公开资料显示,MosaicML的产品组合包括开源的、商业授权的MPT Foundation系列模型和MosaicML 推理和训练服务。
其推出的MosaicML Composer开源的深度学习库,提供20种用于计算机视觉和自然语言处理的方法,包括模型、数据集和基准。推出的MosaicML Explorer可以帮助开发人员探索和理解不同的云服务和硬件选项之间的时间、性能和成本,以简化和评估实施选项。推出的MosaicML AI开发平台,提供了成本效益高的模型部署和定制训练,同时保证数据安全,使用户能够拥有模型的所有权等。
值得一体的是,MPT基础模型系列是MosaicML 提供的一系列开源、商业可用的大型语言模型,它们可以作为用户构建自己的生成式AI应用的基础。
MosaicML 的MPT基础模型系列包括MPT-7B 和MPT-30B 两个模型,分别有70亿和300亿个参数。
MPT-7B是MosaicML在今年5月5日发布的类ChatGPT开源大语言模型。MPT-7B 在MosaicML平台上进行了9.5天的训练,零人工干预,成本仅用了20万美元。该模型具备可商业化、高性能、资源消耗低、1T训练数据、可生成代码等技术优势。
AI2、Generally Intelligence、Hippocratic AI、Replit 和 Scatter Labs等知名厂商皆使用MPT-7B开发各种生成式AI产品。
截至目前,MPT-7B开源项目的下载量超过300万次。收购方Databricks表示,这也是其收购MosaicML的重要原因之一。
另一款模型MPT-30B推出之后,同样引来业界关注,十分受欢迎。其训练成本远低于其他竞争对手,有望推动AI模型在更广泛领域的应用并逐步降低训练成本。
MosaicML首席执行官兼联合创始人Naveen Rao表示,MPT-30B的训练成本仅为70万美元,远远低于类似产品如GPT-3所需的数千万美元训练成本。该模型由于成本低、体积小,可以更快速地进行训练,并且更适合在本地硬件上部署。
MosaicML还介绍称,公司用 2 个月的时间训练了 MPT-30B,通过数据混合进行预训练,从 10 个不同的开源文本语料库中收集了 1T 个预训练数据 token,并使用 EleutherAI GPT-NeoX-20B 分词器对文本进行分词,并根据上述比率进行采样。
需要注意的是,开发者可以从Hugging Face下载并使用开源的MPT-30B基础模型,还可以使用自己的数据在本地硬件上进行微调。
MosaicML同时表示,将模型参数扩展到300亿只是第一步,随后他们将以降低更低成本推出更大体积、更高质量的模型。
MosaicML另一个比较有亮点的产品是今年推出的面向企业的MosaicML推理。
MosaicML首席执行官兼联合创始人Naveen Rao表示:“一些初创公司已经在使用MosaicML的模型和工具来构建自然语言前端和搜索系统。MosaicML允许企业使用公司的模型架构根据自己的数据训练模型,然后通过其推理API部署模型。如果客户训练了一个模型,他们可以放心,他们拥有该模型的所有迭代,该模型就是他们的。我们对此不拥有所有权。使用 MosaicML 的新推理产品,企业客户可以部署用于文本完成和文本嵌入的 AI 模型,其成本比使用OpenAI的LLM低4倍,而图像生成的成本比使用OpenAI的DALL-E 2便宜 15倍。”
“我们希望让尽可能多的人了解和使用这项技术,这就是我们的目标。这并不是排他性的。这不是精英主义。”Naveen Rao同时表示。
02
由英特尔前高管创立
MosaicML起点不低
作为初创公司的MosaicML,为何会连续推出爆款产品,这当然很其创始人有很大关系。
MosaicML是由曾在英特尔担任AI产品负责人、Nervana Systems 的联合创始人 Naveen Rao ,以及英特尔AI实验室的高级主管Hanlin Tang创立。
MosaicML的创始人Naveen Rao ,1997年毕业于杜克大学的计算机科学专业,后取得布朗大学神经科学的博士学位。Naveen Rao长期致力于人工智能神经网络的学习和开发,曾在高通担任过神经形态机器的研究员,并在2014年创立了人工智能公司Nervana Systems。后来这家公司在2016年以4.08亿美元被英特尔收购。
Hanlin Tang毕业于哈佛大学,研究人类视觉中的递归神经网络。他在普林斯顿大学取得物理学学士学位,随后在哈佛大学取得生物物理学的博士学位,研究人类视觉中的递归神经网络,Hanlin Tang少年时代在台北度过。后来加入英特尔后,在英特尔AI实验室担任高级主管,在此期间Hanlin Tang负责算法工程和深度学习研究,并参与了MLPerf基准测试的开发。
Hanlin Tang在国际顶级期刊和会议上发表了多篇论文,涉及计算神经科学、计算机视觉、自然语言处理和强化学习等领域。
还有一位值得一提的团队成员是MosaicML的首席科学家Jonathan Frankle,他是MIT计算机科学与人工智能实验室的博士后研究员,也是哈佛Kempner研究所的附属教员。Jonathan Frankle的研究方向是神经网络的学习动力学和训练算法,旨在提高大型语言模型(LLM)的效率同时降低训练成本。这一研究方向也正是MosaicML的核心竞争力所在,可以说Jonathan Frankle是MosaicML能卖到94亿的关键人物。
Naveen Rao和Hanlin Tang之所以能在英特尔任职,是因为Nervana Systems开发了Neon 这一高性能的深度学习框架,以及后来推出的Nervana Cloud深度学习云平台、Nervana Engine专用硬件加速器,英特尔认为这些产品非常有价值,就把Nervana Systems收购了。Naveen Rao和Hanlin Tang也一起加入英特尔,一位成为了AI产品集团的负责人,一位成为了AI实验室高级主管。
不过,2020年英特尔宣布放弃原计划的Nervana服务器端AI加速芯片,去耗资20亿美元收购以色列公司Habana的产品。
在英特尔决定“抛弃” Nervana后,Naveen Rao和Nervana的前核心员工Hanlin Tang也一起离开了英特尔,两人另立门户创立了今天的MosaicML。根据LinkedIn的信息,目前Hanlin Tang担任MosaicML的CTO。
03
Databricks收购MosaicML
强强联合?
Databricks收购MosaicML不仅仅是因为商业价值,更是为了两个公司可以强强联合,实现技术上的突破,加码AI大模型。
先来看看收购方Databricks,这是一家数据存储和分析领域的巨头公司,由美国加州大学伯克利 AMP 实验室的 Spark 大数据处理系统多位创始人联合创立。Databricks 的客户遍及大中小企业,以及各个行业。截至 2023 年 03 月,其全球已有超过 9000 家企业用户。包括 AT&T、壳牌、巴宝莉、丰田、Walgreens、Adobe、康泰纳仕和再生元制药等。
2021 年,Databricks拿下了摩根士丹利旗下Counterpoint Global领投的16亿美元H轮融资。2023年4月18日,Databricks以298亿美元亿的估值入选《2023·胡润全球独角兽榜》,名列第七。
业内专家表示,收购完成之后,MosaicML 将成为 Databricks Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入 Databricks 旗下,为公司提供统一的平台来管理数据资产,助力 Databricks更好的开发生成式AI技术。同时能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。
DataBricks 的 CEO Ali Ghodsi 也表示,收购 MosaicML 将进一步增强 DataBricks 的数据分析平台。
DataBricks收购MosaicML是为加码AI大模型是主流观点,原因是MosaicML因其尖端的MPT大语言模型而受到认可,MPT-7B和MPT-30B都是今年开发的爆款产品,下载量均突破百万。
值得一提的是,MosaicML的模型训练自动优化使得训练速度比标准方法快2-7倍,而资源的近线性扩展允许在几小时内训练多十亿参数的模型。
借助于双方的联合产品,Databricks和MosaicML的目标是将训练和使用LLMs的成本从数百万美元降低到数千美元。
由此可见,Databricks正试图加码AI大模型,去挑战OpenAI、微软、谷歌等大公司的市场地位,为行业带来新的选择。
但也有反对观点认为Databricks 整合 LLM 的价值主张是不太明确,因为Databricks主营Lakehouse,主要是用Spark来处理大规模集群数据,因此其整合大语言的价值并不明确。还有业内人士认为,Databricks 是在借当前大模型热度进行炒作,收购对技术方面不会有明显的突破,MosaicML 迟早会被Databricks放弃。
这起收购案能否能获得良好的效果,在实现商业价值的同时,也能有技术突破,可能仍需要等待时间去验证。
财经方面专家认为,收购MosaicML的交易可能是这家AI独角兽公司为IPO之路打下基础。
04
AI大模型并购潮拉开大幕
去年末ChatGPT的横空出世,拉开了AI竞赛的大幕,半年之后,又出现了AI并购潮。
原因无外乎是生成式AI经过一段时间的野蛮生长,然后大型企业取得一定的进展,同时也发现了现有技术和人才的不足,而那些AI初创公司,相对来说要专业一些,既有人才也有技术,但存在资金不足、资源稀缺等问题。所以AI并购潮现在出现是必然的,对于整个行业来讲也是正向的、有利的。
除了本文介绍的Databricks收购MosaicML之外,今年5月,云计算巨头Snowflake宣布收购了由两位前Google员工创立的生成式AI搜索初创公司Neeva。业内专家认为,此次收购将使Snowflake能够利用尖端的搜索技术,并将其注入到数据云中,充分客户、合作伙伴和开发者的需求。
值得一提的是,Neeva的领导团队成员在创建YouTube货币化和Google的搜索广告等产品时,起到了非常重要的作用。不出意外的话,此次收购将把Snowflake中的搜索和对话提升到一个新水平。不过此次收购的金额并没有对外公布。
6月26日,全球最大的专业信息服务提供商汤森路透宣布,以6.5亿美元现金收购AI初创公司Casetext,该公司主营业务是为法律人士提供AI助理服务。
公开资料显示,Casetext员工数为104名,客户包括1万多家律师事务所和企业法务部门。其主要产品CoCounsel是一款于今年推出的人工智能法律助理,由GPT-4提供支持。该笔收购将有效补充汤森路透现有的AI路线图。
6月29日,AI初创公司Inflection宣布完成13亿美元融资,该轮融资由微软、英伟达等牵头投资,其融资总额达到15.25亿美元。
再看中国的AI市场,6月29日,美团发布公告,宣布已完成光年之外境内外主体100% 的股权收购,耗资20.65亿人民币。
对于此次并购,美团在公告表示,光年之外是中国领先的AGI创新者,其目前的管理与技术团队具有开发深度学习框架的高水平经验。公司通过收购事项可以获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。
美团方面表示,并购完成后,将支持光年团队继续在AI大模型领域进行研究和探索。
无独有偶,今年6月16日,昆仑万维发布公告称,旗下控股子公司Star Group拟发股收购Singularity AI全部股权。
Singularity AI致力于实现通用人工智能,目前聚焦于自然语言大型预训练模型及开发者API的研发工作,主要产品及服务包括通用开发者API、聊天机器人和知识抽取。
国外出现AI并购潮,释放出了一个强烈的行业信号,意味着国外AIGC的发展已经开始升级,无论是技术、业务、场景还是商业化,都随时可能出现颠覆性的创新。
对于国内AI市场,投资人持谨慎乐观态度。总的来说是B端应用面临企业端数字化缓慢,软件付费意愿不强,商业化缓慢等问题,对比国外AI市场依然差距不小。
不过我们也要看到,中国是美国市场之外唯一一个拥有完整的AIGC产业链的国家,在这场第四次工业革命之中,大家都没有退路。