美股暴跌之际 DeepSeek发布了新的人工智能模型
英伟达资讯
2025-01-28 06:20:30
  • 1325
  • 1915
  •   ♥  收藏
  • A
    分享到:
来源:中国基金报

  1月28日凌晨,国内火爆的AI大模型公司DeepSeek称遭受大规模恶意攻击!

  DeepSeek称遭受大规模恶意攻击

  DeepSeek官网的服务状态页面显示:“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。”

  1月20日,DeepSeek推出了AI模型R1,这是一款为解决复杂问题而设计的专用模型。在海外出圈之后,DeepSeek的服务需求激增。DeepSeek表示,最新的AI模型可以与OpenAI的ChatGPT媲美,且开发成本远低于竞争产品。

  这次更新引发了美国和欧洲科技股市值蒸发超过1万亿美元的暴跌,投资者质疑美国一些大公司虚高的估值。

  全球科技股纷纷下跌,英伟达暴跌15%!纳斯达克指数暴跌超3%,该指数以科技股为主。除英伟达外,其他芯片股也在暴跌,博通公司暴跌近17%,台积电暴跌14%,阿斯麦暴跌超6%。

  分析称,DeepSeek推出的低成本人工智能模型可能会使推动牛市的科技估值难以为继。

K图 NDX_0

  Murphy & Sylvest财富管理公司的保罗·诺尔特(Paul Nolte)表示,“我们不知道这是不是股票市场的‘斯普特尼克时刻’,但这肯定是一个警钟,提醒我们并不是市场上唯一的玩家,将极高的估值赋予这些股票,认为它们垄断了市场,这是一个巨大的错误,现在正在被重新评估。”

  对于Miller Tabak的马特·马利(Matt Maley)来说,DeepSeek最新的人工智能模型更具成本效益,并且运行在技术要求较低的芯片上,这引发了对人工智能热潮能带来多大收益的严重质疑。

  DeepSeek火上浇油,发布了新款人工智能模型

  当地时间1月27日,DeepSeek团队正式发布两款多模态框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。

  JanusFlow是一款通过生成流(Rectified Flow)与自回归语言模型融合实现统一的框架。它不仅在理解任务中表现优异,还能生成高质量图像,展现了框架设计的极简与强大。

  北京时间1月28日凌晨,就在美国科技股暴跌之际,人工智能社区Hugging Face显示,DeepSeek发布了开源多模态人工智能模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。

  页面显示,Janus-Pro是一种新颖的自回归框架,统一了多模态的理解与生成。它通过将视觉编码分离为独立的路径,解决了以往方法的局限性,同时仍然采用单一的统一Transformer架构进行处理。视觉编码的分离不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还提升了框架的灵活性。Janus-Pro不仅超越了之前的统一模型,还能匹配或超越任务专用模型的性能。其简单性、高灵活性以及高效性使Janus-Pro成为下一代统一多模态模型的有力候选者。

  Janus-Pro是一款统一理解与生成的多模态大语言模型(MLLM),通过对多模态理解与生成的视觉编码进行解耦来实现功能。Janus-Pro构建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。

  在多模态理解方面,它使用SigLIP-L作为视觉编码器,支持384x384的图像输入。在图像生成方面,Janus-Pro使用了来源于此的分词器(tokenizer),其下采样率为16。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:https://1458esb.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500