2025年3月3日,野村东方国际证券发布了一篇电子行业的研究报告,报告指出,DeepSeek公布利润率高达545%。

  报告具体内容如下:

  事件:3月1日,DeepSeek官方账号发表《DeepSeek-V3/R1推理系统概览》,提到DeepSeek按照R1定价成本利润率达到545%。文章中提到DeepSeek使用大规模跨节点专家并行(ExpertParallelism/EP),一方面使得batchsize(训练过程中单次输入模型的样本数量)大大增加,从而提高GPU矩阵乘法的效率,提高吞吐;其次EP使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。同时,DeepSeek官方披露V3和R1模型24小时内包括网页、APP和API的所有负载,如果按照R1模型定价(0.14美元/百万输入tokens(缓存命中),0.55美元/百万输入tokens(缓存未命中),2.19美元/百万输出tokens)测算,假设GPU租赁成本2美元/小时,24小时成本8.7万美元,收入为56.2万美元,成本利润率高达545%。 开源“全家桶”瞄准高性能低成本,大模型竞争增加算力效率因子。DeepSeek本次披露的成本利润率是租赁云服务的毛利率,我们认为若综合考虑其他成本(如折旧与维护等成本),实际的利润率应低于官方披露的数据,且收入端以R1定价为计算前提,V3模型定价低于R1。然而,本次DeepSeek展示的重心在于通过算力集群的工程优化实现模型推理能力的高效化。上周(2月24-28日)DeepSeek连续5天开源了多项技术,包括FlashMLA/DeepEP/DeepGEMM/DaulPipe/EPLB/3FS,均为提高计算资源利用效率,实现高性能低成本打造。我们认为,前期AI大模型发展围绕三个关键要素算力、算法、数据展开,DeepSeek在此基础上增加了新的要素,也就是算力效率,通过算法层面的工程优化,释放GPU和算力集群性能,从而降低AI的使用成本。 投资建议:(1)DeepSeek低成本、低定价将带来大模型API价格竞争,不断降低应用开发者的使用成本和进入门槛,利好推理侧商业化落地的进度,包括基于大模型的AIAgent应用和部署本地小模型的端侧硬件。(2)针对算力产业链整体,短期来看,DeepSeek仍对北美头部云厂高资本开支、超大规模集群的发展模式产生冲击。长期视角下,针对算力总需求是否会下降的疑问,我们认为“杰文斯悖论”仍然成立,但是算力需求的释放将从训练向推理转移,推理需求对ROI提升的目标表现出敏感度,因此DeepSeek极致利用算力集群的路径或被更广泛接受。(3)针对国内AI产业的资本开支,我们认为国内云厂商在过去2年内AI基建投入滞后于北美头部云厂商,2025年将是国内实现追赶的重要时期,阿里近期宣布将投入超过3800亿元人民币,用于建设云和AI硬件基础设施,宣告国内的建设周期开启,国内产业链包括算力卡、服务器、交换机、算力租赁等环节均有望受益。(4)此外,我们认为DeepSeek展示集群的利用效率提升带来边际效益大幅增加,具备规模算力和高用户规模的云厂商有更多的潜在利润空间。

风险提示:AI应用端落地不及预期;云厂CapEx趋缓;供给端瓶颈。

  声明:本文引用第三方机构发布报告信息源,并不保证数据的实时性、准确性和完整性,数据仅供参考,据此交易,风险自担。