DeepSeek:巨浪潮涌下的AI新格局
DeepSeek公司于1月20日发布的推理模型DeepSeek-R1,以其低廉的训练成本和媲美OpenAI的o1模型的性能,迅速席卷了AI领域。更重要的是,DeepSeek-R1的开源属性,为国内AI产业带来了前所未有的机遇与挑战。
百家争鸣,接入DeepSeek
截至目前,超过百家国内上市公司已接入DeepSeek-R1模型,其中不乏阿里、腾讯、百度等巨头。这一现象引发了业界广泛关注。企业接入DeepSeek,本质上是通过硬件设备连接DeepSeek的访问地址,从而获取其模型服务。
DeepSeek的吸引力主要体现在两方面:其开源性使其部署便捷,且在特定场景下展现出强大的处理和推理能力;其次,DeepSeek的声量持续走高,为接入方带来了巨大的潜在流量红利。QuestMobile数据显示,DeepSeek的日活跃用户数在2月1日突破3000万。
然而,大厂接入DeepSeek也并非稳赚不赔。AI Infra企业潞晨科技CEO尤洋指出,DeepSeek-R1的高效运行需要大量的算力支持,这将给接入方带来巨大的成本压力。他估算,每日输出1000亿token,每月机器成本就高达4.5亿元,而收入仅为4800万元,意味着巨额亏损。
目前,AI Infra厂商还在积极应对DeepSeek带来的机遇与挑战,软硬件适配、测试、上架等工作正紧锣密鼓地进行中,具体的成本数据还有待进一步观察。
接入并非“量”的竞争
企业接入DeepSeek的方式和程度各有不同。腾讯几乎全面拥抱DeepSeek,将其整合进微信、腾讯文档、QQ浏览器以及自研AI助手“腾讯元宝”等多个产品线中。而阿里则主要将其应用于1688、钉钉、阿里云等主营业务侧产品,为自研大模型保留了一定的发展空间。
值得买科技CTO王云峰表示,接入模型的关键在于模型与业务场景的适配性,而非简单的“量”的比拼。他们自研的130亿参数消费大模型在垂直领域能力出色,但仍需借助DeepSeek等通用模型来完善其在通用场景下的应用。DeepSeek-R1在内容生成方面的逻辑清晰度和文学性方面,得到了王云峰的肯定。
知道创宇是DeepSeek更早期的受益者之一。通过接入DeepSeek,其网络空间测绘引擎ZoomEye国际版的平台注册量增长了28.5%,平台活跃度增长了121.6%,AI搜索功能使用率更是达到了35.8%。DeepSeek在漏洞挖掘、数据情报分析等多个安全领域都展现了其价值。
适配商的春天?
DeepSeek的火爆也带动了AI Infra适配厂商的繁荣。厂商们正忙碌地应对激增的咨询和合作需求,工作节奏显著加快。
企业接入DeepSeek的成本主要包括硬件成本和部署成本。硬件成本与芯片规格、规模等密切相关,而部署成本则取决于企业的需求,例如高并发、知识库接入等。潞晨科技CEO尤洋指出,对于满血版DeepSeek-R1,本地化部署的硬件成本通常在百万级别,远高于部署成本。
尽管业界对成本存在担忧,但AI Infra厂商普遍认为,大部分企业都具备承担接入成本的能力。
结语
DeepSeek的出现,无疑给国内AI产业带来了新的活力。但如何有效地利用DeepSeek,并平衡成本与收益,仍需要企业进行更深入的探索和实践。 这场AI浪潮下的博弈,才刚刚开始。