近期,中国AI公司DeepSeek发布的开源模型R1引起全球AI领域广泛关注。该模型以其高性价比和出色的性能表现,与OpenAI的o1模型相媲美。在超高的热度下,DeepSeek 成为了全球增速最快的 AI 应用,仅上线18天日活就达到了1500万,而 ChatGPT过1500 万花了244天,增速是ChatGPT的13倍;1月26日同时登顶苹果App Store和谷歌Play Store全球下载榜首,目前仍然在100多个多家/地区维持领先。
什么是DeepSeek?
DeepSeek是一家中国人工智能公司,成立于2023年7月17日,总部位于浙江杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(LLM)及相关AI技术的研发。自2024年初发布第一款深度求索的大模型,不断丰富产品体系,优化模型性能,同时也在推动着人工 智能技术的发展和应用.
近期爆火的DeepSeek R1有什么特别之处?为何引起巨大反响?
DeepSeek R1是一款由中国AI公司DeepSeek开发的开源模型,它在算法、框架和硬件协同优化方面有显著突破,性能媲美OpenAI的o1模型,但成本更低。DeepSeek R1通过较少算力实现高性能模型表现,主要原因是DeepSeek R1实现算法、框架和硬件的优化协同。 DeepSeek R1在诸多维度上进行了大量优化,算法层面引入专家混合模型、多头隐式注意力、多token预测,框架层面实现FP8混合精度训练,硬件层面采用优化的流水线并行策略,同时高效配置专家分发与跨节点通信,实现最优效率配置。与海外大模型厂商相比,DeepSeek采用了不同的降本路径,依靠极致的工程化创新,使得训练模型的成本得到较大优化,这一策略使其在国内外科技巨头和云厂商中获得了广泛应用。
DeepSeek发布的开源模型有什么重要意义?
DeepSeek的开源选择带来三重变革:技术平权、应用爆发和生态重构。DeepSeek发布的开源模型及其指引的技术创新方向,为AI技术浪潮的进一步发展注入新的动力。首先,开源模型能力比肩闭源模型巨头,有望助推实现AI平权,未来对AI模型的开发有望从强者恒强的马太效应进入到“百家争鸣”的阶段,有利于构筑各环节广泛参与的繁荣生态;其次,AI推理侧成本下降,有利于催生下游对AI技术的广泛应用,从而使AI技术更广发地融入到各行各业,提升原有生产力,或是创设新的应用场景及终端产品,下游应用多个方向有望受益;开源生态催生新商业模式,模型微调、垂直领域适配等服务成为投资热点,开发者社区与商业平台协同价值凸显。另外,随着中国在 AI 层面的技术从跟随到局部突破,部分重塑了竞争格局,从全球资本流动的角度而言,有望提升中国资产估值。
DeepSeek R1的发布,不仅是技术突破,更是中国参与全球AI规则制定的关键一步。随着开源生态的完善与下游应用的拓展,中国有望从“AI应用大国”升级为“AI技术策源地”。对权益市场而言,这意味着一轮长周期的结构性机会——从底层算力、中间层模型开发,到上层行业应用,各环节均将涌现新的领军者。
$长安先进制造混合C(OTCFUND|013514)$ $长安裕隆混合C(OTCFUND|005744)$ $长安宏观策略混合C(OTCFUND|016579)$ #DeepSeek火爆全球,对A股影响几何?#
由长安基金权益团队供稿。
风险提示:上述观点仅代表长安基金观点,不构成针对个人的投资建议,也不表明本公司对投资做出任何判断或倾向意见。投资人应谨慎投资,并根据风险自担的原则,自行承担投资风险。基金有风险,投资需谨慎。