标签导航:

deepseek有望激发 新一波人工智能创新浪潮

中国人工智能企业深度求索(DeepSeek)近期发布的开源模型DeepSeek-R1,以更低的成本实现了与OpenAI的GPT-o1接近的性能。这一突破颠覆了人工智能产业长期依赖“堆算力”的模式,并引发了资本市场的关注。业内专家认为,DeepSeek-R1有望掀起新一轮创新浪潮,推动全球人工智能技术持续发展。

DeepSeek公司官网显示,DeepSeek-R1在后期训练中广泛应用强化学习技术,即使在标注数据有限的情况下,也显著提升了模型的推理能力。在数学、代码和自然语言推理等任务上的测试结果表明,其性能与GPT-o1正式版不相上下。

摩根士丹利指出,“更大并不等于更聪明”。DeepSeek通过提升数据质量和优化模型架构,开辟了一条高效训练大模型的新路径。该机构认为,DeepSeek-R1的低成本优势显著,成本约为国际知名大模型的十分之一。

高盛集团也表示,DeepSeek-R1的成本远低于现有模型,这将降低大模型的开发门槛,互联网巨头将面临来自初创企业的潜在竞争。

《金融时报》评论文章指出,DeepSeek-R1挑战了业界长期以来对人工智能发展的核心认知,即更强大的硬件是推动人工智能进步的关键。

摩根士丹利认为,DeepSeek-R1证明,尖端AI能力并非必须依赖巨量计算资源。巧妙的工程设计和高效的训练方法,可能比单纯的算力更重要。这将激发创新,推动企业探索更具成本效益的AI开发和部署方案。

DeepSeek-R1采用开源共享模式。抱抱脸公司等多个团队已成功复现了其训练过程。Facebook首席AI科学家Yann LeCun在社交媒体上表示,DeepSeek-R1的出现意味着开源模型正在超越闭源模型。

《金融时报》评论称,DeepSeek-R1对全球用户极具吸引力,将促进人工智能技术发展和应用。文章指出,对于大多数商业用户而言,一款可靠易用的模型比绝对领先的模型更重要。“并非人人都需要法拉利”。R1的推理能力提升,将为“智能体”在客户互动和任务处理方面带来突破性进展。更低的成本将进一步提升企业盈利能力。

瑞银集团认为,如果AI训练和推理成本大幅降低,更多终端用户将利用AI改进业务或开发新应用。