火爆DeepSeek现象:

DeepSeek是一款由中国深度求索人工智能公司研发的大型语言模型。

2024年12月26日,DeepSeek发布第三代大模型DeepSeek-V3,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元,但性能接近GPT-4等先进闭源模型。

2025年1月20日,DeepSeek再度推出新一代推理模型DeepSeek-R1,采用强化学习替代大量监督微调,再次突破性能上限,并成功开源。

根据点点数据,DeepSeek在美国下载排名从1月22日的第201名,迅速在 1月 27日登顶第一名;根据七麦数据,截至1月30日,DeepSeek在168个国家位居下载榜第一名。

受此影响,A股相关概念板块表现得十分活跃,多只概念股大涨。春节期间“DeepSeek”也成为影响海外市场的关键词。

DeepSeek是通过算法的系统性创新实现算力高效利用的典范,市场对DeepSeek系列开源模型加速AI端侧应用有较高期待。

DeepSeek火爆不仅将推动AI硬件加速发展,也会为具备生产和设计能力的国产芯片产业带来新的成长机遇。

一、DeepSeek有什么?

DeepSeek 的核心技术包括以下几个方面:

深度学习模型:DeepSeek利用深度神经网络(DNN)对数据进行建模,能够自动提取数据的特征,并理解数据之间的复杂关系。这种模型特别适用于处理非结构化数据,如文本、图像和音频。

自然语言处理(NLP):DeepSeek集成了先进的自然语言处理技术,能够理解用户的查询意图,并根据上下文提供相关的搜索结果。例如,当用户输入一个模糊的问题时,DeepSeek 能够通过语义分析,给出相关的答案。

数据挖掘与知识图谱:DeepSeek通过数据挖掘技术,从海量数据中提取出有价值的信息,并将其构建成知识图谱。知识图谱是一种结构化的知识表示方式,能够帮助系统更好地理解数据之间的关系,从而提高搜索的准确性和效率。

二、DeepSeek为什么这么火?

1、绝对的成本优势

DeepSeek的模型训练成本约为500万美元;运营成本为每百万tokens输入成本0.55美元,OpenAI则需15美元;输出成本为每百万tokens仅需2.19美元,OpenAI则需60美元。绝对的成本优势让DeepSeek正在从根本上影响AI行业的竞争态势。摩根士丹利在研报中预测,基于DeepSeek技术的AI应用成本有望进一步下降30%-40%。

2、完全开源的策略引领产业的变革

DeepSeek选择完全开源的战略决策,在全球科技界引发连锁反应。科学家Jim Fan评价称:"DeepSeek正在创造一个前所未有的开放AI生态系统,这种模式可能成为未来AI发展的新范式。"

DeepSeek的研发团队仅用8周时间就完成了V3模型的开发,这一速度令硅谷震惊。著名AI专家Andrej Karpathy指出,相比传统AI巨头动辄数亿美元的研发投入,DeepSeek展现出的极致效率优化堪称革命性突破。

DeepSeek的开源特性、免费使用、支持联网搜索以及技术创新与共享等特点使其在AI领域具有重要影响。

3、深度思考能力和推理能力

DeepSeek-R1是具备先进推理能力的开放模型,比起直接提供响应,像DeepSeek-R1这样的推理模型,会对查询进行多次推理处理,使用连锁思维、共识和搜寻方法来生成答案。

广发证券计算机行业分析师深度挖掘 DeepSeek功能,用覆盖逻辑、数学、代码、文本等多领域问题测试,并与豆包、Kimi等其他同类产品进行大模型对比。结果显示,DeepSeek-V3 总体能力与其他大模型相当,但在逻辑推理和代码生成方面独具特色。像密文解码任务,它是唯一给出正确答案的大模型;代码生成任务中,它给出的代码注释、算法原理解释以及开发流程指引更为全面。

4、知识蒸馏技术

DeepSeek R1系列模型通过知识蒸馏技术,成功实现了大模型推理能力向小模型的传递,不仅带来小模型推理能力的显著提升,而且证明经过知识蒸馏得到的小模型优于直接强化学习。基于此技术突破,使小模型在保持较低计算资源消耗的同时,实现接近大型模型的推理性能。从而不仅解决小模型在资源受限情况下的性能瓶颈问题,更为实时应用和边缘计算等场景中的模型部署提供了可能,进一步推动了AI 模型端到端的商业化落地。

三、基金经理对于DeepSeek的评价

申万菱信数字产业基金经理梁国柱表示,Deepseek为应用端的降本增效强势赋能,看好AI应用的未来发展。

1、卓越性能领航,重塑用户感知。

Deepseek 的实力可与国际顶尖大模型制造商一较高下,尤其在中文任务之类的特定场景中,优势尽显,切实优化应用端产品的用户感受,成为应用厂商产品快速拓展市场、提升占有率的有力助推器。

2、成本削减卓有成效,token 开销大幅缩水。

凭借一系列精妙的工程优化策略,Deepseek 成功让 token 的使用成本显著下滑,相较于 OpenAI,其成本降幅超过 90%,这无疑为应用厂商以低成本开启 AI 赋能之路提供了可能。

梁国柱表示,Deepseek 无疑是国产大模型领域的关键里程碑,它促使 AI 在多元场景中加速释放潜能、施展身手。关注各场景细分领域内的优质企业。

四、DeepSeek可能带来哪些影响?

1、对计算力需求的影响

DeepSeek在算力方面的影响主要体现在以下几个方面:
降低训练端算力需求:DeepSeek通过混合MoE架构和MLA技术,大幅降低了模型训练所需的算力。
推动算力市场结构变化:DeepSeek的低训练成本和高性能使得算力市场从依赖高端GPU的“资本密集型”模式向更注重算法创新和效率的“创新密集型”模式转变。这可能导致高端GPU需求增速放缓,同时促进分布式算力网络的发展。
提升推理端算力需求:DeepSeek的开源和低API价格有望推动AI应用的普及,从而增加推理端的算力需求。其模型的高效推理能力也使得更多企业能够以较低成本部署AI应用。
促进数据中心升级:DeepSeek的技术优化推动数据中心向绿色高效转型,提升数据中心的运营效率。同时,其分布式训练和推理需求也促进了数据中心互联(DCI)设备的发展。

2、应用层面看,模型部署成本降低,加速 AI 应用商业化落地

Deepseek自成立之初始终坚持开源路线,R1发布意味着高性价比模型能力的平民化。

增强应用落地及商业化的可行性,为 AIROI带来更多空间。进一步看,R1解除中国 AI 应用发展在模型能力和算力方面的压制因素,中国AI应用企业或将更加受益;且R1 作为推理系列模型,符合 Agent产品逻辑,有望推动产品形态加速升级。

3、推动国产半导体产业链发展:

DeepSeek的算法优化适配国产芯片架构,为其提供技术验证场景,加速国产芯片的替代进程。此外,DeepSeek的技术路径可能使市场从“追求单卡峰值性能”转向“优化能效比与集群效率”,为国产芯片厂商提供了新的发展机遇。

#DeepSeek火爆全球,受益板块有哪些?#$申万菱信数字产业股票型发起式A(OTCFUND|018048)$$申万菱信数字产业股票型发起式C(OTCFUND|018049)$$申万菱信多策略灵活配置混合A(OTCFUND|001148)$$申万菱信多策略灵活配置混合C(OTCFUND|001724)$$申万菱信中证沪港深数字经济主题指数型发起式A(OTCFUND|018207)$$申万菱信中证沪港深数字经济主题指数型发起式C(OTCFUND|018208)$

风险提示:

基金有风险,投资需谨慎。上述内容不作为任何投资建议,不代表对未来市场表现和相关板块基金产品未来投资收益的保证,不代表本公司对基金业绩的任何承诺或预测。观点仅代表当时看法,今后可能发生改变。基金管理人不保证基金一定盈利,也不保证最低收益。投资人应当认真阅读《基金合同》、《招募说明书》等基金法律文件,了解基金的风险收益特征,并根据自身的投资目的、投资期限、投资经验、资产状况等判断基金是否和投资人的风险承受能力相适应。

追加内容

本文作者可以追加内容哦 !