奥特曼首次公开回应:GPT-5、AGI、马斯克、内斗
2024-03-21 15:18 奥特曼 GPT-5 AGI

2奥特曼首次公开回应:GPT-5、AGI、马斯克、内斗

近期,美国知名播客莱克斯·弗里德曼(Lex Friedman)邀请人OpenAI首席执行官山姆·奥特曼(Sam Altman)做了个专访。

对话中,奥特曼聊及外界最感兴趣的新一代大语言模型GPT-5、通用人工智能(AGI)的远景规划、文字转视频工具Sora、豪掷7万亿美元的芯片计划,并回应了OpenAI董事会近期的变动,与埃隆·马斯克(Elon Musk)之间的法律纷争等。

这些内容迅速引爆了全球AI创业者的热烈讨论。如Altman首次公开曝料:GPT-5将会有史诗级提升,小看它的公司都会被碾压。而未来,AI将成为推动文明发展的核心动力。

整个专访内容将近3万字,全文阅读费时费力。为了让大家快速get到重点,我们整理了50条重点笔记。如下,Enjoy:

GPT-5发布时间

(1)我不知道GPT-5什么时候发布,这是实话。但我们今年会发布一个令人惊叹的新模型,只是我不知道我们会叫它什么。

(2)在接下来的几个月里,我们会发布许多不同的东西。我觉得这会很酷。 在我们谈论一个类似 GPT-5的模型之前,无论是否这样命名,或者比你期望的GPT-5好一点或差一点,我认为我们还有很多其他重要的事情要先发布。

(3)OpenAI真正做得好的事情是,这其实是伊利亚的一个原创观点,我可能会说得不太准确,但大致意思是,“我们将200个中等规模的东西相乘,形成一个巨大的东西。”

(4)我有一个秘诀,那就是对科技行业所有或大多数前沿领域都有很好的了解。有时,我可以看到这些联系或新的可能性,如果我只深入探索一个领域,我就不会有这个想法,因为我缺少全局数据。但我现在真的没有那样的视角了,我现在深入某一个特定领域。但我知道,拥有全局视角是一件有价值的事情。

GPT-5会变得更聪明

(5)令我兴奋的是,GPT-5会变得更聪明。我知道这样的回答听起来可能不够严肃,但我认为真正激动人心的事情是,它并不是在某个方面变得更好,而在各个方面变得更好。

(6)如果我们有了通用人工智能,但唯一能在现实世界中完成事情的方式是让人类去完成,那将是很令人沮丧的。因此,我真的希望在这个过渡阶段,我们也能得到人形机器人或某种能在现实世界操作的机器人。

(7)我们是一家规模不大的公司。我们必须真正集中精力。此外,当时研发机器人之所以艰难,并非因为有正确的理由。不过,我们将在某个时候以某种方式重新投入机器人研究。当然,我们不会像《终结者》那样把自己变成机器人。

对GPT-4有点失望

(8)我觉得GPT-4有点令人失望。在GPT-3的时代,人们会说,“哦,这太棒了。这简直是技术的奇迹。”但现在我们有了GPT-4,再回头看GPT-3,你会觉得它简直糟糕透顶。我认为,我们正处于一个指数曲线上,不久之后,我们会像现在回望 GPT-3 一样去回顾 GPT-4。

(9)我们必须同时做好这两件事:发明底层技术,并弄清楚如何将其变成人们会喜欢的产品。这不仅仅是关于实际产品的工作,还涉及到一个完全不同的阶段——怎样让产品与用户的需求保持一致,并真正发挥出它的用途。

(10)关于GPT产出虚假内容的问题。我认为随着后续版本的推出,这方面会得到很大的改善,但我们必须继续努力,今年我们不可能完全解决所有问题。

关于GPT的记忆与隐私

(11)我不仅希望GPT记住那些事情,我还希望它能从中吸取教训。并在未来提醒我该怎么做或者要注意什么。我们在生活中都会从经历中获得不同程度的成长,我也希望我的人工智能助手能从这些经历中学习和成长。

(12)关于隐私问题。我认为正确的答案是让用户轻松做出选择。任何我不想让我的人工智能助手记住的事情,我都希望能把它删除。如果我不想记住任何事情,我也希望可以忘记。

神秘的Q*会震惊世界吗?

(13)我们的目标绝不是让世界感到震惊。相反,我们想要的是平稳过渡。这就是我们努力的方向,也是我们的既定策略,但我感觉我们似乎没有实现目标。也许我们应该考虑以不同的方式发布GPT-5或类似产品。

模型越大,Sora将变得更好

(14)Sora背后的所有这些模型对世界模型的理解,实际上都比我们大多数人给予它们的赞誉要多。而且,因为它们也清楚地知道自己不理解或没有正确理解的东西,所以很容易看到它们的弱点,透过面纱看到真相,然后说,“啊,这都是假的。”但这并不是全部假的。只是其中一些部分有效,而另一些部分则无效。

(15)我也相信随着规模的扩大,模型将会变得更好。在不提及Sora具体培训方法的情况下,我们的工作中确实使用了大量的人类数据。

(16)模式会改变,但人们必须得到报酬。那些创造有价值数据的人是否应该得到某种形式的补偿,因为他们的数据被利用了。我认为答案是肯定的。

(17)当摄影技术出现时,艺术家们也非常担心,但后来摄影成为了一种新的艺术形式,人们通过拍照赚了很多钱。我们仍然举行赛跑比赛,尽管汽车的速度要快得多。

(18)人们总是在谈论人工智能将在五年内取代多少工作岗位。他们通常的出发点是,有多少现有工作会被人工智能完全取代?但我的思考方式不是人工智能将完成多少工作,而是在未来一个时间范围内,人工智能将能完成多少种任务。因为人工智能只是一种工具,它将在越来越多的任务中以越来越高的复杂度和越来越长的时间范围内工作,让人们能够在更高的抽象层次上进行思考。

关于OpenAI内斗风波

(19)在OpenAI成立和通用人工智能(AGI)诞生的过程中,注定会有一系列疯狂且具有爆炸性的事件发生,其中可能会涉及多方面的权力斗争。这些事件虽然令人不安,但也为我们提供了宝贵的经验和教训,为未来应对更多挑战做好了准备。

(20)我认为OpenAI面临的挑战之一将是,我们需要有一个擅长在压力下运作的董事会和团队。现在还不是最终的董事会。我们增加了一些人,还会增加更多。

(21)在OpenAI的架构方面,董事会的一项职责就是要审视并找出我们可以使其更加稳健的地方。这次经历让我预见到了未来的挑战:随着赌注的提高,我们将需要更加稳健的治理结构和流程,以及更加合适的人选。我很高兴这件事发生在我还年轻的时候,但经历它确实非常痛苦。

(22)我认为你我可能会犯的一个错误是,认为只有理解技术才是挑选董事会成员的重要标准,这当然是董事会应该讨论的一部分,但关于这项技术将如何影响社会和人们的生活,你也也同样希望能够在董事会中得到体现。

(23)在那个周末最痛苦的时候,我一直在反思,也被告知,不仅仅是我,整个团队都在想,我们试图努力维持OpenAI的稳定,而那时整个世界都在试图让它分崩离析,人们试图招募我们的人。

(24)我真正欣赏这类领导者的一点是,他们在平凡的周二早上9点46分和日常繁琐工作中是如何表现的。他们如何出席会议,他们做决策的质量如何。这就是我所指的“静默时刻”。

关于马斯克的起诉

(25)马斯克曾认为OpenAI将会失败,他希望能够完全掌控并扭转局势。而我们则希望继续朝着现在OpenAI的方向前进。他还希望特斯拉能够开展AGI项目。在不同时期,他都想把OpenAI变成一家盈利公司,由他掌控,或者与特斯拉合并。但我们不想这么做,于是他决定离开,这其实挺好的。

(26)埃隆以关心人类的命运著称,而人类是从合作中受益是,所以激励和动机之间总是存在紧张关系。最后,我确实希望人类能够胜出。

(27)我认为整件事都不像一个建设者应该做的。我尊重埃隆。他是我们这个时代最伟大建设者之一。我知道他了解被仇恨者攻击的滋味,这让我感到格外难过,他居然也这样做。

(28)我认为OpenAI正在做的最重要的事情之一,就是将强大的技术免费地交到人们手中,作为一种公共福利。

(29)至于是否“开源”,我认为我们应该对一些东西开源,而对另一些则不开源。这往往会变成一场宗教般的信仰之争,很难保持中立,但我认为找到平衡点才是正确的答案。

(30)我认为开源模型确实有其存在的必要,特别是那些人们可以在本地运行的小型模型,我认为这方面的需求非常大。我想将来会有一些开源模型,也会有一些闭源模型。在这方面,它与其他生态系统并无不同 。

(31)我会强烈反对任何打算以非营利组织起步,后来再增加盈利部门的初创公司。我会强烈反对他们这样做。我不认为我们会在这里树立先例。

沉默的伊利亚

(32)我依然喜欢伊利亚·苏茨凯弗(Ilya Sutskever)。我非常尊重他。关于他现在的计划,我无可奉告。那是他的问题,该由他来回答。但我真的很希望在我职业生涯的剩余时间里,我们能继续一起工作。他比我年轻一些,也许他还会再工作久一些。

(33)伊利亚身上有很多让我敬佩的品质,其中之一是他非常重视通用人工智能及其广泛的安全问题,包括这项技术将对社会产生的影响。随着我们继续取得重大进展,伊利亚是过去几年里我花最多时间讨论这将意味着什么的人之一,讨论我们需要做什么来确保我们做得正确,确保我们成功地完成使命。

(34)我的人生哲学一直是不要过于担忧所有的偏执狂想,不要担心那些边缘情况。即便你稍微吃点亏,换来的是可以放下防备地生活。然而,这次经历完全措手不及,它确实改变了我。我不担心自己会变得过于愤世嫉俗。相反,我担心自己会变得不那么容易信任他人。

关于7万亿芯片计划

(35)我确实认为算力将称为未来的货币。我认为它可能会成为世界上最珍贵的商品,而且我认为我们应该大力投资以制造更多的算力。

(36)世界将需要大量的算力。而在这个过程中,有许多难点。能源供应是最棘手的部分,建造数据中心和供应链也同样充满挑战。当然,制造足够的芯片也很难。但看起来,这正是事情发展的方向。我们将需要大量的算力,目前来说,这种规模是难以想象的。

(37)我相信核能的潜力。但我认为,何时实现核聚变依然很难预测。我对当前的核聚变竞赛感到挺兴奋。我认为核裂变也非常惊人,我希望全世界都能重新接受它。核裂变的历史发展让我感到非常遗憾,我希望我们能以有意义的方式重新利用它。

(38)我认为人工智能的某些事情上会犯下大错。虽然我不确定自己最终被人工智能杀死的概率有多大,但肯定不是零。

(39)人工智能确实会陷入左右派系之争。我不知道这具体会是什么样子,但不幸的是,任何具有影响力的事物似乎都会如此。我们人类的天性就是,尽管我们需要面对许多不同种类的风险,但那些能够构成电影高潮情节的风险在我们心中的分量却远大于那些长期、缓慢累积但同样严重的风险。

(40)我们花了很多时间讨论需要优先考虑安全性。我一直以来都在说,你可以把AGI的开始时间想象成一个四象限图,包括慢启动和快启动,以及长期和短期的时间线。我认为短期、慢启动是最安全的象限,也是我最希望我们所处的象限。但我确实想确保我们实现的是慢启动。

世界不需要另一个谷歌

(41)如果问题是我们能否构建一个比谷歌更好的搜索引擎,那么当然可以,人们应该使用更好的产品,但我认为这低估了这项技术的潜力。令我兴奋的事情不是我们可以去构建一个更好的谷歌搜索复制品,而是也许有一种更好的方式来帮助人们查找、采取行动并整合信息。

(42)很多人只是尝试制造一个比谷歌更好的搜索引擎,但这是一个困难的技术问题,也是一个困难的品牌和 生态系统问题。我认为世界不需要谷歌的另一个复制品。

(43)从美学角度上说,我有点讨厌广告。我理解互联网之初为了发展不得不依赖广告,但这不过是一个暂时的行业现象。现在世界已经变得更富裕。我喜欢看到人们为ChatGPT付费,并知道他们得到的答案不受广告商的影响。

(44)我不知道到底会是什么样,我们有一个非常简单的商业模式,我挺喜欢的,我知道自己不是被买卖的产品。我知道自己是付费用户,这就是商业模式的工作原理。

(45)我们必须弄清楚OpenAI如何实现增长,但看起来我们会找到办法的。如果问题是我是否认为我们可以拥有一个伟大的商业模式,能够支付我们的算力需求而不依赖广告,那么我认为答案是肯定的。

任何人都不该完全控制AGI

(46)关于我们何时会有通用人工智能(AGI)。我以前很喜欢猜测这个问题。但我后来意识到,这个问题问得不够准确,因为人们对AGI的定义差异极大。因此,我认为谈论我们将何时建立能够执行X、Y或Z能力的系统更有意义,而不是模糊地谈论何时会跨越某个里程碑。

(47)AGI也不是终点,它更接近一个起点,但它其实更多是一个里程碑。为了不逃避这个问题,我预计在2030年之前,或者可能比那更早,我们将拥有非常强大的系统,我们看着它们会说:“哇,那真是太了不起了。”前提是如果我们现在能看到的话。也许我们到了那个时候已经适应了。

(48)我现在仍然相信,无论是我还是其他任何一个人,都不应该完全控制OpenAI或AGI。我认为我们需要一个健全的治理体系。我仍然认为不应该由任何一家公司做出这些决定,我们真的需要政府来制定规则。

(49)我承认,我在OpenAI的决策过程中也犯了很多错误,当然也有很多好的决策,我对此感到自豪。但我不认为应该,也不会有任何一个人来控制整个局面。现在的局势已经变得过于庞大,它正以一种积极健康的方式在整个社会中发展。我不认为任何个人应该控制 AGI 或者这个朝 AGI 迈进的整个进程。

(50)你拥有的是我们所有人共同构建的知识和技能的框架。没有任何一个人会单独去制造iPhone。没有任何一个人会独自去发现所有科学知识,但你能够利用这些知识。这赋予了你难以置信的能力。在某种程度上,这是我们所有人共同创造的成果,这让我对未来充满了希望。那是一项集体努力的成果。

(文首图来源:访谈视频截图)


任何企业在发展过程中都不是一帆风顺的,越是迷茫的时候,越是困难的时候,创始人越要习得看清变化的能力,越要苦练基本功,努力存活和发展下去。

3月23日-25日深圳,来【第71期黑马大课】,看经济走势、消费趋势、出海机会,通过品牌定位、数字化提效、供应链构建核心壁垒,看看依旧活跃的投资人愿意投什么,看看仍然活得好、持续增长的企业是怎么做大做强的。

扫码购买,跟上前行的步伐。