主持人:今天我们非常荣幸地邀请到了 DeepSeek 的创始人梁文峰先生,来和我们聊聊 AI 大模型的求索之路。梁总,首先想问问您,幻方量化作为一家量化基金,为什么会决定下场做大模型呢?
梁文峰:我们做大模型其实跟量化和金融都没有直接关系。我们独建了一个名为深度求索的新公司来做这件事。幻方的主要班底里很多人是做人工智能的,当时我们尝试了很多场景,最终切入了足够复杂的金融领域,而通用人工智能可能是下一个最难的事之一,所以对我们来说这是一个怎么做的问题,而不是为什么做的问题。
主持人:现在很多人认为创业公司在大厂形成共识后下场已经不是一个好的时间点,您怎么看呢?
梁文峰:现在看起来,无论大厂还是创业公司都很难在短时间内建立起碾压对手的技术优势。因为有 Open AI 指路,又都基于公开论文和代码,最晚明年大厂和创业公司都会把自己的大语言模型做出来,大厂和创业公司都会有机会。虽然现有垂类场景不掌握在初创公司手上,这个阶段对初创公司不太友好,但因为这种场景说到底也是分散的、碎片化的小需求,所以它又是更适合灵活的创业型组织的。从长期看,大模型应用门槛会越来越低,初创公司在未来二十年任何时候下场也都有机会。
主持人:那您能详细说说深度求索的目标是什么吗?
梁文峰:我们的目标很明确,就是不做垂类和应用,而是做研究做探索。一方面是好奇心驱动,从远处说,我们想去验证一些猜想,比如我们理解人类智能本质可能就是语言,人的思维可能就是一个语言的过程,你以为你在思考,其实可能是你在脑子里编制语言,这意味着在语言大模型上可能诞生出类人的人工智能。从近处说,GPT - 4 还有很多待解之谜,我们去复现的同时也会做研究揭秘。
主持人:研究肯定需要不少投入,那研究经费从哪里来呢?
梁文峰:换方作为我们的出资人之一有充足的研发预算。另外,每年有几个亿的捐款预算,之前都是给公益机构,如果需要也可以做些调整。无论如何,一个商业公司去做一种无限投入的研究性探索都有些疯狂,如果一定要找一个商业上的理由他可能是找不到的,因为划不来,从商业角度来讲基础研究就是投入回报比很低的。Open AI 早期投资人投钱时想的一定不是我要拿回多少回报,而是真的想做这个事。我们现在比较确定的是既然我们想做这个事又有这个能力,这个时间点上我们就是最合适人选。
以上对话出处不详,仅供参考
幻方量化目前从1000亿规模缩减到100亿,而且目前是限购。深度求所采取的是非盈利性质的开源模式,因此无论是从开发到运营都是在持续烧钱,将原先用于慈善的资金划出一部分用于开发经营ds ,ds效果好,人工智能的逻辑也就是人组织语言表达意思的能力,所以ds的编辑逻辑就是模仿这种语言组织能力,表达能力,逻辑推广运算,其核心是汉语也就是中国文化几千年的悠久历史,所以文字具有多样性,而英语的历史文化底蕴不足,所以在算法上汉语有着先天优势。
梁文峰将人工智能领域圈起来了,工具也准备好了,就等更多的开发者,ds的使用者,在人工智能的领域盖起座座高楼,文中他也表示人工智能是一个新兴领域,虽然小公司无法和大公司比,但是在单独赛道上小公司有自己船小好调头的优势,能在自己专业的领域上开发出成果,未来20多年都有机会。
企业家最大的特点就是不以盈利为目的,为社会做贡献,为社会谋福利。