DeepSeek压力下 奥特曼承认:OpenAI闭源策略站在了历史的错误一边
东方财富资讯君
2025-02-01 22:38:19
  • 20
  • 24
  •   ♥  收藏
  • A
    分享到:
来源:21世纪经济报道

  OpenAI最新推理模型o3-mini紧急上线。

  这是OpenAI目前成本效益最高的推理模型。与以往不同的是,OpenAI向所有用户开放了o3-mini在ChatGPT和API中的使用权限。

  很难否认OpenAI此举没有受到DeepSeek的压力。

  无论是编程能力还是知识水平,o3-mini都全面超越了前代推理模型。比如,在2024年美国数学邀请赛(AIME 2024)的测试中,在低努力下,o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力水平下,o3-mini准确率能够提升到79.6%,与o1模型相当;在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。

  它不仅公开了推理过程(思考过程),还大幅下降了价格。o3-mini输入每百万tokens定价1.10美元(使用缓存输入,费用减半),输出每百万tokens定价4.40美元。这比o1-mini低63%,比完整版o1低93%。

  OpenAI可谓下了血本,不得不加入DeepSeek发动的价格战,但即便如此,与DeepSeek R1相比,价格还是太高了。后者的定价是:输入每百万tokens/0.14美元,输出每百万tokens/0.55美元。

  也难怪DeepSeek继续占据各大应用商店下载榜头名位置。最近,连一些国际顶尖大学的研究员都首选DeepSeek了。

  当天o3-mini发布会后,OpenAI首席执行官萨姆·奥特曼(Sam Altman)携众高管,在社交平台Reddit回答了网友们的提问。

  奥特曼在回答是否会公开一些大模型权重的问题时说,“我个人认为在(开闭源)这个问题上我们站在了历史的错误一方,需要找出一个不同的开源策略。不过不是所有OpenAI的人都同意这个观点,而且目前这也不是我们最高优先级。”

  OpenAI刚创立时,如其公司名称所示,它的研究应该是开放的。但随着商业化进程逐渐深入,这家公司却选择了闭源。这也是马斯克与奥特曼分道扬镳并一直诟病OpenAI的重要原因。

  “正确的解读是:‘开源模型正在超越专有模型’。”Meta首席AI科学家杨立昆(Yann LeCun)最近表示,“他们(DeepSeek)提出了新想法,并在其他人的工作基础上进行了构建。由于他们的工作是公开且开源的,因此每个人都可以从中受益,这就是开放研究和开源的力量。”

  2024年,关于大模型是开源好还是闭源好,国内外科技界曾经有过激烈的争论。如今,开源的DeepSeek,引领了全球AI的重要研究方向,几乎宣告终结了这个话题。

  而在创新、安全与商业化之间谨慎行走的OpenAI,也不得不重新考虑它的闭源策略。

  在回答网民有关DeepSeek对OpenAI未来模型发展计划有何影响时,奥特曼坦陈,DeepSeek R1是“非常好的模型”。虽然OpenAI未来仍将开发出更好的模型,但其领先优势将比往年有所减少。

  接着,奥特曼透露了几项产品的进展:完整版o3最快将于几周内发布,最晚则是几个月内发布。语音模式更新即将到来,但大家关注的大模型GPT-5目前还没有时间表。首席产品官Kevin Weil称,将推出基于4o的图像生成器。工程副总裁Srinivas Narayanan称,公司推理模型未来将能够使用包括检索在内的不同工具。

  OpenAI大幅降低新模型价格,反思闭源策略并可能选择部分开源,这些都是DeepSeek压力之下的动作。而DeepSeek在人工智能领域引发的振动效应还在扩散。

  微软、英伟达、亚马逊等巨头此前已宣布上线搭载了DeepSeek-R1的软件服务。2月1日晚间,华为云宣布,与硅基流动联合首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务。

  但振奋之余,有业内专家告诉本报记者,要澄清一个误读,就是认为DeepSeek绕开了英伟达的CUDA,从而降低了对后者芯片的依赖。他表示,DeepSeek通过架构革新、工程优化和训练创新,低成本高质量地实现了模型性能的高效跃升,但它的框架本质上还是基于英伟达的CUDA。“DeepSeek现象”引领了大模型训练和推理的一种技术方向,大幅降低了C端应用成本,促进了AIAgent应用的爆发,某种程度上还重构了全球AI叙事,但生态的繁荣不是减少而是增加了算力需求。资本市场的情绪波动是暂时的,可见的将来算力方面仍无法摆脱对GPU芯片的依赖。所以,英伟达的声明才会说,DeepSeek所取得的进展,显示出其芯片在中国市场的实用价值,且未来为满足DeepSeek的服务需求,将需要更多英伟达芯片。

  任何具有重大革新意义的新事物的出现,不可能没有争议。但正如知名播客主持人莱克斯·弗里德曼(Lex Fridman)所说,尽管更好的模型还会继续出现,但“DeepSeek 时刻”是真实存在的,“我认为 5年后它仍将作为科技史上的关键事件被人们铭记。”

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:https://1458esb.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500