简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » Sora引爆用户创造力热潮?奥特曼详谈AI的未来

Sora引爆用户创造力热潮?奥特曼详谈AI的未来

文章来源: 腾讯科技 于 2025-10-08 19:31:08 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数
Sora引爆用户创造力热潮?奥特曼详谈AI的未来

10月9日消息,OpenAI首席执行官山姆.奥特曼(Sam Altman)在10月6日旧金山举行的DevDay开发者大会闭幕后,再度做客知名科技媒体Stratechery的访谈节目,接受该媒体创始人兼主持人本.汤普森(Ben Thompson)的独家专访。

此次访谈以DevDay开发者大会推出的创新举措为直接切入点。在此次大会中,OpenAI宣布ChatGPT可嵌入第三方应用、发布AgentKit开发工具包等重磅内容,标志着公司从技术突破向生态构建的战略进阶。

双方围绕八大核心议题展开深度探讨:OpenAI构建与部署强AI系统的统一战略愿景;与AMD、三星电子等企业的芯片及内存合作协议对全球AI基础设施市场的影响;结合早期投资经验的资本分配与公司运营决策逻辑;ChatGPT应用集成机制的设计思路及即时结账功能的商业潜力;Sora视频应用的爆款逻辑及其对创造力的激发价值;AI发展中版权问题的应对与政策挑战;用户反馈的处理机制,以及OpenAI技术架构成为未来数字生活基础框架的长远展望等。

这是双方的第三次对话。此前两次分别为2023年与微软高管凯文.斯科特(Kevin Scott)的联合访谈,以及2025年初的单独对话。此次对话距双方上一次对话仅时隔七个月。

在这短短七个月间,OpenAI创下了令人瞩目的发展速度:8月正式发布GPT-5模型,其幻觉率低至1.3%,被视为该公司“迄今最智能、最实用”的模型;推出AI视频生成应用Sora后迅速引爆市场,后续更开放Sora 2 API预览版供开发者接入;同时相继与英伟达、AMD、三星电子、甲骨文等重量级企业达成协议,启动大规模人工智能基础设施建设项目。

以下为访谈精华版内容:

01.OpenAI构建与部署强AI系统的统一战略愿景

汤普森:从DevDay活动上的最新公告,到那些大规模基础设施合作交易,这些举措背后是否存在一个宏大而统一的战略理论?能否用一句话或一段简要论述来概括其核心要义?

奥特曼:OpenAI的核心使命是构建功能强大的人工智能系统,包括通用人工智能(AGI)乃至超级智能,无论当下对其采用何种称谓,同时以真正惠及人类的模式实现部署,让用户能将其灵活应用于日常生活、工作及各类创新场景之中。要达成这一目标,我们需在基础设施建设、产品开发及基础研究等领域投入海量资源并持续付出努力,而这也是全公司上下唯一专注且全力推进的事业。

汤普森:OpenAI正逐步定位为人工智能领域的“Windows”操作系统。作为长期深耕科技领域的分析观察者,我认为这是一种极具积极性的战略定位。

从一方面来看,该公司为消费级与企业级用户提供统一的交互界面或API接口,以此保障用户获得无缝体验;从另一方面来看,OpenAI已成为大规模人工智能基础设施建设的首要目标客户,这种关系类似于计算机产业发展早期原始设备制造商(OEM)与处理器供应商之间的生态关联。你认为这一类比是否贴切?

奥特曼:我对借助历史案例进行类比始终保持谨慎态度,因为在这一过程中,人们往往会不自觉地聚焦于那些关键差异点,而这些差异点对我而言具有重要意义。通常情况下,大多数用户都希望拥有一款单一且高效的AI服务,能够贯穿其整个生活轨迹并持续提供价值。因此,用户会选择ChatGPT作为主要使用入口,但同时也需要ChatGPT与其他服务实现深度集成,这就意味着必须在ChatGPT内部嵌入更多应用。

此外,我们还需大力发展API业务,让用户能够通过OpenAI身份安全登录第三方服务,进而实现体验的连续性与个性化。例如,AI助手需清晰掌握用户偏好与数据隐私边界,并智能判断哪些信息可共享、哪些信息需予以保护。我们的目标正是构建这样一款无所不在的AI助手,而这需要多项要素实现精密匹配与协同配合。

在基础设施层面,这是我目前投入时间与精力最多的领域。当前人工智能需求呈爆炸式增长,构建规模足够的基础设施体系无疑是一项严酷考验,但这也为我带来了全新的挑战与乐趣。至于研究工作,我对 OpenAI 团队未来的发展方向从未有过如此乐观的预期,而这也正是我们敢于进行巨额战略投入、提前布局产品与基础设施的核心原因。

汤普森:你的阐述为我们后续将要探讨的三大核心主题,即基础设施、投资者思维与产品创新,提供了极为优质的讨论框架。

02.OpenAI的AI基础设施“豪赌”与市场生态

汤普森:我们首先将焦点放在基础设施领域。每当OpenAI宣布一项合作交易,合作伙伴的企业市值便会瞬间上涨20%甚至更多,这种现象给你带来了怎样的感受?从实际效果来看,几乎所有与OpenAI相关的新闻稿,都能瞬间转化为具有黄金般价值的催化剂。

奥特曼:这确实是一种前所未有的特别体验。三年前,OpenAI还只是一家专注于基础研究的实验室,当时ChatGPT尚未推出,我们无需过多考虑自身公告对资本市场产生的影响。过去几个月,市场对我们的这种敏感度已成为必须快速适应的现实,但坦白来说,这种情况至今仍让我感到陌生且不真实。我认为,这类现象不会长期持续,它本身带有一定的非理性属性。

汤普森:对于那些希望在AI基础设施建设浪潮中获取发展机遇的企业,是否基本上需要与OpenAI建立直接合作关系?这似乎是上述现象的另一面:在你所描绘的统一战略框架下,OpenAI将成为伴随用户、渗透并影响从底层基础设施到上层应用整个生态链条的核心节点,从这个角度来说,你是否就是该领域的“核心驱动力”?我使用“驱动力”一词时带有积极含义,但这个定位本身也隐含着双刃剑的特性。

奥特曼:OpenAI面临着众多规模庞大、资金充足且技术实力强劲的竞争对手。该领域绝不会发展成赢者通吃的垄断市场,目前甚至远未达到这样的程度。即便在消费领域,我也认为不会出现某一方绝对主导的局面。当然,我们非常希望OpenAI能占据较大的市场份额,并且已为此制定了雄心勃勃的增长计划,但AI技术的本质决定了它会像晶体管一样,渗透到每一款消费产品和每一个企业解决方案中。这是我个人非常认可的一个历史类比,我们之前也曾经讨论过类似的观点。

汤普森:基于当前这些市场动态,OpenAI最不明智的决策,是否就是不尽可能加大资金投入,或者拒绝投资者提供的各类资源?

奥特曼:我不确定这是否属于最糟糕的选择,但我们早已向外界反复阐述过这一战略意图。直到近期,市场才真正开始认真对待我们的表态。我们计划在基础设施领域进行巨额投资,这是OpenAI层面的一次战略豪赌,我们坚信当前正是推进这一计划的成熟时机。至于这一决策是否正确,最终将通过实践来检验,而判断依据包括研究领域的突破性进展、业务的稳健增长、产品的市场表现,以及我们观察到的整体行业趋势。但无论如何,这都是我们将坚定推进的方向。

汤普森:伯恩.霍巴特(Byron Hobart)近期出版了《繁荣》(Boom)一书,书中对卡洛塔.佩雷兹(Carlota Perez)的泡沫投资理论进行了有益拓展。该理论的核心观点是,技术革命需要多项投资与多个发展项目并行推进,而泡沫机制恰好能加速这一同步进程。你是否感受到一种历史责任,需要推动这种多线并进的生态形成?毕竟这些要素无法按照时间顺序逐一推进,必须同时发力才能实现目标。

奥特曼:你的判断完全正确。从电子元器件的制造,到物理基础设施的搭建,再到电力设备与数据中心外部系统的完善,以及芯片制造产能的扩张,所有这些环节都需要同步启动。与此同时,我们还必须培育消费者对相关产品的需求,并确保现有商业模式能够支撑这些巨额投入。这无疑是一场涉及多线程、多维度的复杂协调战役。

汤普森:关于芯片供应,你有怎样的看法?OpenAI刚刚宣布与AMD达成战略合作,英伟达首席执行官黄仁勋(Jensen Huang)是否提前预料到,英伟达会通过这一合作间接成为AMD的投资方?

奥特曼:我并不清楚其中的内情。但需要注意的是,英伟达与AMD均依赖相同的上游供应链,因此价值链中还存在另一个关键的垄断环节,也就是台积电。我强烈希望台积电能够进一步加大产能投资,以缓解全球芯片短缺的压力。

03.OpenAI的融资智慧与硬件生态布局

汤普森:这些合作交易的总价值规模相当惊人,据《金融时报》估算,金额约达1万亿美元。最终需由谁来承担这些巨额成本?这些协议的核心是否在于,OpenAI通过承诺购买的方式,激励合作伙伴提前进行产能扩张?

奥特曼:我预计,这些投资成本将由OpenAI未来的收入来覆盖和偿还。在过渡期内,合作伙伴或许需要通过举债等方式筹集资金,我们会积极提供融资支持,并制定针对性计划,帮助他们在产生收入前解决大规模的资金需求问题。目前,我们已有一些创新性方案正在酝酿当中。

汤普森:长期以来,你被视为硅谷历史上最杰出的募资者之一。你是否曾预料到,这项技能会在人工智能领域的复杂环境中,发挥如此关键且广泛的作用?

奥特曼:在职业生涯早期,我通过实践积累了这些募资与融资技巧。虽然我不会自称精通,但至少达到了可圈可点的水平。当时我并未想到,这些经验会如此契合OpenAI的运营需求,不过事实证明,它们已成为我履行首席执行官职责时的无价资产。

汤普森:这项技能是否能排在你技能清单的首位?

奥特曼:它绝对是其中之一。如果能完全遵循自身天赋选择,我更倾向于从事投资工作,而非运营角色。在运营大型科技公司的诸多方面,我清楚自己能力有限,但投资领域的训练让我形成了独特的思维框架:如何在具有指数级增长潜力的环境中精准分配资本?如何识别高潜力的项目与人才?如何在不确定性中优化资源配置?

从某种角度来说,OpenAI的运作模式类似于对一系列内部初创项目进行集体押注——有时这些项目会发展为独立产品,比如Sora应用。这种模式并非传统的公司运营训练路径,我曾担心它可能成为短板,但实践表明,它反而为我们带来了显著优势。关于这一点,我本可以展开更深入的讨论,但这只是众多例证中的一个。

汤普森:你的观点很有启发意义。其中一个关键在于把握“无限上行潜力”与“有限下行风险”之间的动态平衡,这在AI投资场景中尤为重要。但在“尽可能加大投入”的战略前提下,你会明确拒绝哪些机会,或者哪些方向会被认定为不适宜推进?

奥特曼:我们拒绝的机会比外界想象的要多得多。这与早期初创投资有很大不同:在初创投资中,你可以分散押注数十个项目;但在OpenAI,面对数十个诱人的产品创意与新兴方向,我们必须严格克制,只选择极少数我们坚信具有核心战略意义的路径。有时这会让人感到遗憾,但只有保持专注,才能将这些核心举措执行到极致,进而最大化整体影响力。

汤普森:我对OpenAI在硬件领域的布局格外关注。你与乔尼.艾维(Jony Ive)进行了深度交流,这位苹果设计领域的传奇人物若有机会加入,让外界对OpenAI可能成为新硬件制造商充满期待。我的问题是:如果ChatGPT或OpenAI的核心产品要成为用户“无处不在的数字伙伴”,就必须实现跨设备无缝协作,而非局限于自家硬件生态。你在做决策时,是否考虑过相关风险?比如自家硬件可能导致的战略锚定,或是潜在地疏远其他合作伙伴?

奥特曼:我们绝对考虑过这一点。核心产品必须能在浏览器、各类移动设备及所有主流平台上自由运行,这不仅是我们的要求,也是其他生态参与者的期望。作为一名资深设备爱好者,我一直对硬件创新抱有浓厚热情,也渴望亲身参与设计。但正如你所说,这确实像是一种 “塞壬的诱惑”(The Siren's Call,比喻看似极具吸引力、却可能让人偏离核心目标的事物)。许多科技领袖都曾因痴迷设备而分心,忽略了 “无所不在”的本质。

我们有机会打造真正具有革命性的产品,它不会取代现有设备,而是与它们共存。不过当前硬件领域的创新质量已趋于停滞,几乎所有公司都局限于几类相同的概念。尽管iPhone堪称史上最出色的消费级硬件,我完全理解它的强大吸引力,但人工智能的兴起,正为全新的硬件范式开辟无限可能。

汤普森:另一项令人意外的合作是与三星及SK海力士的联手。显然,未来芯片大规模部署时,内存供应将成为瓶颈。这项协议是否与AMD的交易形成互补?业界曾质疑AMD将从何处获取匹配的内存,此外,OpenAI是否仍在推进自研芯片计划?

奥特曼:请给我们几个月时间,相关情况会逐一明朗。我们并非外界所认为的“疯狂散乱”,而是拥有全面且周密的计划框架。

汤普森:坦率地说,我已经从中看到了整体战略的连贯性,这让我对本次访谈产生了一丝“确认偏差” 的担忧。与你交流后,我对OpenAI的战略有了更清晰的认知。此前我曾对API业务的容量限制颇有微词,认为若将资源集中在特定领域,效率会更高。但现在我更能理解“为何要全力追求无所不在、包罗万象” 的逻辑。当一生难遇的机遇来临时,必须全力以赴。

奥特曼:首先,我坚信这对整个行业乃至全人类而言,都是百年难遇的机遇,我们定会全力把握。这就是“珍惜当下、大胆行动,不因犹豫错过机会”(YOLO,字面意思为人生只有一次)的AI版本,或许这能成为一篇专栏文章的标题。但更重要的是,我们拥有坚实的愿景框架。如果从这一视角审视我们的所有举措,当我们完成新一轮交易并详细阐释目标与逻辑时,整个战略拼图会完美契合。外界可能会质疑这一战略过于雄心勃勃或风险过高,但至少,我们构建这套技术栈的战略逻辑是经得起推敲的。

04.ChatGPT的嵌入式生态与共赢设计

汤普森:你过去曾多次提到ChatGPT的推出实属意外之喜。回顾过往,我此前虽也问过类似问题,但近期对此有了更深的思考:ChatGPT从“意外之喜”发展为“行业重大事件”,再到成为“具备高杠杆价值的平台”,这一认知转变是在何时发生的?

如今我们已拥有海量用户需求,API与身份验证机制也已成熟,用户可通过ChatGPT登录并同步使用数据。但本周的公告更进一步:为何不允许应用开发者直接将产品嵌入 ChatGPT内部?这样既能避免复杂集成常出现的故障问题,又能将所有交互集中在一处。你是在何时明确意识到,OpenAI已具备足够影响力推动这一变革的?

奥特曼:这里有两个关键的“惊喜”时刻。其一,我原本预计ChatGPT会有不错的市场表现,但它实际的增长速度与用户黏性,都远超我的预期。其二,一些我原本认为综合能力强劲的大型科技公司,在ChatGPT 刚推出的关键窗口期里,因种种原因出现了战略决策偏差,这为我们赢得了宝贵时间。在竞争对手重新调整战略前,我们得以建立起显著的竞争优势。

不过,自这两个“惊喜”发生后的两年半时间里,我们始终严格依照预先制定的战略蓝图稳步推进:从长期布局基础设施,到设计ChatGPT内应用嵌入的机制,再到实现API与消费者业务的深度融合。这些环节的推进,几乎都与我们最初的规划高度一致。当然,这需要足够的耐心和脚踏实地的执行,但目前已能看到明显的成果。

汤普森:当你提到其他科技公司的战略偏差时,许多人很可能会首先想到谷歌。尽管谷歌目前已在部分领域恢复竞争力,但你实际所指的公司是否是Meta?

奥特曼:我不便在此点名具体企业。谷歌当前在多个前沿领域都开展着令人印象深刻的工作,但显而易见的是,在ChatGPT刚推出的那个关键阶段,他们的响应速度确实稍显迟缓。

汤普森:从长远角度看,ChatGPT自身所面向的消费市场与企业市场,哪一个规模会更大?ChatGPT在企业领域的渗透深度,是否超出了你的预期?

奥特曼:二者之间存在一些细微差异,但就像谷歌搜索的经典案例一样:你不会在家使用一家搜索引擎,到了工作场合又切换到另一家。企业用户对安全协议与数据访问权限有更高要求;在消费场景中,用户可能更关注医疗咨询的准确性,而在企业环境里,更看重代码生成或法律文档处理的效率。不过我预测,二者会比外界预期的更快走向融合,最终用户将拥有一款能覆盖所有场景的通用AI工具。

汤普森:若将视角扩展到OpenAI的整体生态,在你的规划中,API业务是作为新初创企业搭建平台的基础,还是更侧重于为企业级解决方案提供支持?此外,像微软Azure这样的云服务巨头,是否仍会在这一生态中扮演不可或缺的角色?

奥特曼:同样地,我将其视作构建“无所不在的AI服务” 的整体组成部分,而非简单将其划分为“ChatGPT企业版”与“API”的二元对立关系。用户会逐渐与这一AI实体建立起情感与功能层面的联结:有时,你在 ChatGPT界面内与它互动,让它处理复杂任务;有时,你在开发终端中用Codex辅助编写代码;有时,你通过API在第三方服务中调用它的能力。但展望几年后的生态形态,用户的感知会是:“我拥有这样一个智能实体,它能跨平台为我提供高效支持。”我很庆幸我们有API的灵活性、ChatGPT亲和的交互界面,以及即将推出的新设备等多种选择,但用户最终感受到的,会是一种单一且连贯的使用联结。

汤普森:在DevDay的演讲中,你列出的合作伙伴名单令人印象深刻。此前你也多次尝试过类似的集成模式,比如早期的插件机制,以及后来的GPTs工具。

奥特曼:ChatGPT早期插件机制的尝试未达预期,但GPTs工具的表现十分亮眼。尤其在企业内部协作或个人工作流程优化场景中,获得了极高的使用量。当然,我们希望本次推出的应用集成机制能实现更大突破,若后续发现不足,也会持续迭代优化。

汤普森:引入这些内置应用后,OpenAI内部是否达成了共识:凭借ChatGPT的庞大流量,用户直接在平台内使用Zillow这类服务,会获得明显更优的体验?这是否也让你们拥有了某种“话语权”,比如“对用户而言,这是更优的使用路径;若某类服务不愿嵌入,其他服务会迅速填补空白,最终实现整个生态的共赢”?

奥特曼:情况并非如此。这又一次体现了我早期职业经历带来的经验价值。我们本可以设计出用户体验更流畅,却对合作伙伴极为不利的方案。以Zillow为例,若用户查询“帮我查找符合条件的房产”,我们完全可以接管整个用户界面,只向用户展示结果摘要,而不引导至Zillow的原生应用。

汤普森:确实如此,那样做会剥离Zillow的应用展示层,用户只能获取结果,却无法进行完整的交互操作。

奥特曼:正是这样。但我始终认为,这类集成必须以生态共赢为前提,尤其要为新兴初创企业提供发展机遇。因此我们选择了另一种路径:用户明确指定要使用某类服务时,我们会主动推荐合作方;合作方接管交互界面并关联用户账户,确保用户能与原服务保持直接、透明的连接。这种方式或许在用户体验的流畅度上略有妥协,但从长远来看,更有利于整个行业的健康发展。

05.即时结账机制:设计巧思、信任护城河与借鉴Meta经验

汤普森:即时结账功能的设计颇具匠心。回顾其推出之时,曾有观点指出,部分社交平台已放弃应用内结账模式,原因是该模式转化率未达预期,电商卖家更倾向于将流量引导至自家网站。这是否反映出既有行业巨头存在“路径依赖”问题?OpenAI通过为长尾市场注入显著价值,印证了这一机制的潜力;与此同时,若在结果排序中优先推荐提供即时结账服务的商家且保持无偏见,合作伙伴或许将别无选择,只能积极参与其中?

奥特曼:这里有两点值得深入分析。首先,我并非完全清楚其他平台放弃即时结账的具体原因,但在我看来,只要能确保商家与消费者之间维持直接关联,这一机制本质上优于传统路径。它既提升了用户体验的便捷性,也为商家带来更高的转化效率。我们或许会从过往案例中吸取经验,也可能在实践中发现自身判断存在偏差,但从当前数据来看,即时结账功能的表现极为出色。

其次,若我们在任何环节偏离“全力为用户提供最优答案”的核心原则,ChatGPT当前已处于极高水平的信任度将面临大幅下滑风险。这一担忧构成了我们最强烈的内在约束,促使我们避免任何形式的操纵行为。用户对ChatGPT的独特认可,源于一种深层共鸣:即便出现信息偏差或错误,用户仍能感受到它的“善意努力”,并确信双方的目标导向高度一致。这种体验与许多其他大型科技产品形成了鲜明对比。

汤普森:我对这一面向长尾市场的设计感到十分振奋。作为依赖长尾市场发展的从业者,我一直坚定支持Meta的价值主张,它为中小商家提供了触达潜在客户的渠道,让用户有机会接触到那些原本未知却真正需要的商品。Instagram广告的精准度与实际效果令我惊叹,它让我在居家与生活用品采购中发现了诸多惊喜之选。而ChatGPT扮演了镜像角色,它帮助需求模糊的消费者,精准定位到那些“未知的理想选择”。

考虑到你对100%用户信任的追求,我认为OpenAI不会从中过度抽取收益;若用户更倾向于跳转至商家官网完成交易,你们也会欣然接受。科技巨头本身会产生大量消费者盈余,这一现象无可厚非。真正的商业化机遇或许在于:当某一产品在多家零售商均有销售时,提供即时结账服务的商家不仅能获得优先曝光,还可与ChatGPT共享部分收益。这便是我对你们战略的理解。

奥特曼:谈及Instagram广告,它确实让我重新审视了广告模式的潜在价值。这类广告为我带来了实际益处,帮助我发现并购买了原本难以接触到的商品,我甚至开始主动认可这种体验的价值。Meta在诸多领域都值得我们学习与尊重,其广告机制的精准落地更是我此前未曾预料到的亮点。除此之外,我一直将多数互联网广告视为一种隐性“负担”,这类广告往往干扰用户体验而非提供实际服务。

汤普森:这正是核心问题所在。搜索引擎在很大程度上也属于类似“负担”的存在,自然搜索结果通常已能满足用户需求,广告更多是通过付费获得优先展示位置。我始终为Meta辩护,认为其模式更接近“价值交换”,而非强制性的成本转嫁。

奥特曼:我完全认同这一观点。

汤普森:在这样的商业背景下,你如何规划OpenAI的变现路径?

奥特曼:同样地,我相信我们有机会开发出对用户具有显著净价值、且能强化用户关系的产品形态,例如探索创新性广告机制。但目前,我尚未形成最终确定的“广告方案框架”。

汤普森:联盟营销似乎是一个明确的低风险切入点,它无需担心与自有广告业务产生冲突。

奥特曼:没错,这绝对是一个在战略层面清晰可行的优势方向。

06.Sora视频应用:爆款密码拆解、独立定位抉择与创造力觉醒

汤普森:我们再回到ChatGPT“意外成功”的话题上。在OpenAI的官方文章中,你对Sora取得成功的信心远超以往产品。我起初对此持怀疑态度,如今不得不承认自己判断失误,完全低估了它的病毒式传播能力。但OpenAI是否已建立起一套可复制的“爆款打造”机制?

奥特曼:首先必须强调,OpenAI团队的卓越才华是关键。拥有一支顶尖人才队伍,是实现可复制成功的最佳保障。团队成员不仅能在研究前沿攻克技术难题,还能围绕技术成果打造用户友好的产品。其次,菲吉·西莫(Fidji Simo,OpenAI应用首席执行官)正式加入公司,其在产品设计与市场化落地领域表现尤为突出,是一位综合能力出众的领导者。尽管将产品相关事务移交他人让我略感不舍,但考虑到我需专注于其他战略领域,这无疑是明智之举。想到她未来可能推动一系列爆款产品的诞生,我对此充满期待。

汤普森:你曾提及ChatGPT的“品牌光环”效应,即用户对其天然抱有信任,这无疑构成了强大的竞争壁垒。若ChatGPT出现失误,用户会宽容地认为“它在努力尝试,像个可靠的伙伴”。这种心理机制在“爆款打造” 过程中扮演着怎样的角色?Sora一经推出,用户便预设其“富有吸引力”,愿意尝试使用,并对初期存在的不足保持包容。你的竞争对手在这方面,或许处于完全不同的起点。

奥特曼:我认为品牌光环并非唯一决定因素。归根结底,Sora本身是一款真正优秀的产品,我们精准把握了推动其传播的核心要素。OpenAI作为公司品牌,知名度相对有限,但ChatGPT已成为广为人知的标识。更细微的一点是,Sora的标志设计与ChatGPT高度相似,这一细节或许在潜移默化中强化了用户认知,只是科技领域之外的用户鲜少留意这一细节。

汤普森:我确实未曾留意到这一设计细节。

奥特曼:即便在科技行业内部,或许也只有少数人关注到这一点。但从本质来看,Sora的病毒式传播源于其内在吸引力:用户觉得它“有趣且新颖”,从而主动分享。我们不会依赖品牌光环推出大量产品;未来涉足硬件领域时,用户购买决策仍将基于产品本身的吸引力,而非品牌溢价,当然,品牌光环可能会提供一定助力。

汤普森:你们是否考虑过将Sora整合进ChatGPT生态,还是从项目初期就明确将其定位为独立应用?

奥特曼:我们确实认真评估过整合的可能性,但最终决定放弃,核心原因是两者的用户使用逻辑存在显著差异。对用户而言,ChatGPT是高度个性化且私密的“对话伙伴”;若为其添加社交或分享属性,将破坏这种核心信任关系,用户可能会产生顾虑,担心自己是否仍能放心分享内心深处的困扰。

汤普森:这一考量很有道理。Sora的算力成本想必极高,这是否大幅增加了OpenAI推进商业化的紧迫感?或许,这也为其商业化提供了新思路,例如开发更丰富的广告模式?

奥特曼:这是一个在实践中不断深化的重要课题。我不排除为Sora开发高效广告模式的可能性,脑海中已构思诸多创意方向。但现实情况是,Sora的许多使用场景属于娱乐性质:用户仅为制作有趣的表情包分享给几位好友。这类低价值、高频率的交互,无法通过广告完全覆盖成本。因此,在部分场景中,用户将不可避免地需要为内容生成付费,这将成为保障商业模式可持续性的必然选择。

汤普森:我们或许一直系统性地低估了AI在激发人类创造力方面的潜力。你与其他AI从业者常提及“AI将助力创造”,这听似标准宣传表述,但Sora的出现让我真正理解了这一观点的内涵。早在DALL-E推出时,我就曾撰文探讨“想法生成与具象化”的分离,并将其置于更宏大的历史视角下分析,例如印刷术从口头传播向书面阅读的转型。即便如此,我仍觉得自己低估了这一趋势的深度。你是否从一开始就深刻认识到人类对创造力表达的本能需求?

奥特曼:这一认知再次得益于我早期在初创企业投资领域积累的经验。全球范围内,存在大量未被满足的创造力表达需求:通过传统方式制作一段优质TikTok视频或一件艺术作品,往往需要耗费大量时间与精力。但若能提供便捷工具,帮助用户将抽象想法快速转化为高质量成果,将精准契合人类深层的心理需求。我在众多投资案例中,多次见证过这一需求带来的价值。

汤普森:这种创造力需求是否可独立于社交分享存在?有时,单纯“为创造而创造”就足以满足用户需求。

奥特曼:确实存在这种情况。但人类天性中,既包含欣赏他人创作的意愿,也包含创作者渴望展示作品并获得认可的诉求。这形成了一种集体欣赏的循环:你不仅为自我表达而创造,也为获得他人的认可而创作。

这也是我对AI长期影响就业持乐观态度的原因之一:人类天生渴望为他人创造价值、获得认可与赞赏,因此,我们会不断开拓新领域来实现这一本能。而从Sora的用户反馈中,我们观察到的几项独特趋势,更让我们对未来充满信心。

07.AI发展中的版权议题:争议焦点、政策协作与初创企业保障

汤普森:既然谈到创造力表达,就不得不提及版权议题。这很可能成为未来数年OpenAI乃至整个AI行业面临的核心法律与伦理挑战。从数据输入端来看,AI将加速非原创内容的“去商品化”,唯有人类原始创造力仍将保留独特价值。基于这一趋势,若创作者希望OpenAI使用其最新作品,需主动授权,而OpenAI则支付相应报酬。这种市场模式是否具备合理性与可行性?

奥特曼:从表面来看,这是一个公平且合理的合作框架。

汤普森:而在内容输出端,争议则更为突出。新兴媒介的出现,往往会重新定义版权的边界与内涵。在我看来,最终的解决方案或许是:将版权保护赋予AI模型本身,而非模型生成的内容。因为所有用户本质上共享同一模型;若我使用模型生成米老鼠形象而面临起诉,你使用同一模型生成猫王形象也被牵连,这将引发无尽混乱。相反,仅为模型赋予版权保护,生成内容则进入公有领域或采用知识共享许可,这种模式是否更为清晰可行?

奥特曼:我不确定这是否是唯一解决方案,但它确实提供了一种比当前现状更简洁、争议更少的机制,而当前版权治理现状已陷入极度混乱。AI与版权的交叉领域,是亟需全球达成共识的重大政策议题,OpenAI正积极与各国政府开展合作,投入资源推动建设性对话。

汤普森:我并不担心版权立法会扼杀AI创新,但担忧立法过程过度复杂,导致高昂的法律合规成本仅能由少数行业巨头承担,进而固化行业壁垒。

奥特曼:这一风险确实客观存在,且必须高度重视。

汤普森:你更倾向于通过何种政策路径,确保AI领域对初创企业保持开放与包容?

奥特曼:我们主张与创作者社区紧密协作,共同设计真正有效的收益补偿与权益保护方案,再由立法者据此制定普遍适用的规则。尤其重要的是,必须充分考虑初创企业的成本承受能力;若仅有OpenAI与少数行业巨头可承担合规成本,整个AI生态将遭受不可逆转的损害,这对创新领域而言将是巨大损失。

08.用户反馈与AI未来:多方需求平衡与技术愿景的确定性

汤普森:作为企业领导者,你处于一个独特的交汇点:既要应对亿万级用户的需求,又要维系强劲的API业务生态,同时还要支持不断突破技术极限的研究实验室。你如何平衡这些相互影响的反馈信号?毕竟,用户的即时需求,有时与研究团队对“下一代技术突破”的追求并不一致。

奥特曼:这无疑是首席执行官职责中,持续面临的最棘手挑战之一。在我看来,最有效的平衡方式可分为以下几层:首先,在研究方向上,我们始终以长期战略愿景为导向,坚信这一方向的最终价值。这意味着,我们愿意投资那些短期内看似“无实际用途”,但长期将重塑行业格局的项目。

其次,在产品迭代过程中,倾听用户声音至关重要。若回顾我们过去几年的产品更新记录,会发现许多关键改进都直接源于对用户行为的观察、用户反馈的痛点,以及用户明确表达的期望。

第三,对于API业务,我们格外重视开发者社区的意见,他们的洞察往往能预示生态系统的未来发展方向。

最后,作为领导者,必须坚守独立的战略判断,在充满不确定性的环境中敢于违背短期反馈、坚持长期目标。这一过程难度极高,失误概率也不低,但若是一味迎合短期反馈信号,将永远无法打造出真正具有颠覆性的创新产品。

汤普森:对于你所构建的AI未来图景,你抱有多大程度的信心?

奥特曼:对于我们正在推进的技术愿景,以及其蕴含的变革潜力,我持有100%的坚定信念。但具体执行落地效果是否能达至完美,仍需时间检验。

汤普森:非常感谢你再次抽空参与Stratechery 的访谈。

奥特曼:感谢你的精彩主持。

  • 海外省钱快报,掌柜推荐,实现买买买自由!
查看评论(1)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

默克尔万没想到,如今她会被自己人骂到这个地步
诺奖化学:难民男孩成阿拉伯之光 沉醉实验不爱上课
知名演员肺腺癌去世:曾从天才坠地狱 险被判死刑
失业的中国内娱明星,正批量“下海”…
最新的“后悔药” 微信“撤回”消息有大变化!




24小时讨论排行

德女市长遭狠刺13刀 凶嫌疑是15岁难民养子
伊利诺伊州长真急了:川普就是疯子,有种来抓我!
哈马斯谈判团长:我们带着人民的伤痛而来 结束战争
纽约亲共侨领王一冰被ICE逮捕 恐面临遣返
“高市早苗否认南京大屠杀”热搜 曾质疑“慰安妇”入教科书
川普宣布:以色列和哈马斯签署第一阶段和平协议
网球热三年后,一个北京中产妈妈决定放弃
纵火毁城!加州世纪山火幕后元凶竟是Uber司机
十一收假 36车道车潮挤爆!官媒赞“最美星河”挨骂惨
日本为什么会是亚洲获得诺奖最多的国家?
“烟草局退休一万九”是因为利润多贡献大吗?
黄仁勋:美国必须赢得AI竞赛 未来要像美元一样....
通俄门后续 前FBI局长柯米出庭 对川普指控拒不认罪
台湾前官员:赖清德“下指导棋” 恐被美国“拒绝往来”
美外交官恋上中共党员女儿!违反"禁爱令"被美政府开除
加州华女名医投毒案反转!杀蚂蚁非丈夫?检撤告
文学城新闻
切换到网页版

Sora引爆用户创造力热潮?奥特曼详谈AI的未来

腾讯科技 2025-10-08 19:31:08
Sora引爆用户创造力热潮?奥特曼详谈AI的未来

10月9日消息,OpenAI首席执行官山姆.奥特曼(Sam Altman)在10月6日旧金山举行的DevDay开发者大会闭幕后,再度做客知名科技媒体Stratechery的访谈节目,接受该媒体创始人兼主持人本.汤普森(Ben Thompson)的独家专访。

此次访谈以DevDay开发者大会推出的创新举措为直接切入点。在此次大会中,OpenAI宣布ChatGPT可嵌入第三方应用、发布AgentKit开发工具包等重磅内容,标志着公司从技术突破向生态构建的战略进阶。

双方围绕八大核心议题展开深度探讨:OpenAI构建与部署强AI系统的统一战略愿景;与AMD、三星电子等企业的芯片及内存合作协议对全球AI基础设施市场的影响;结合早期投资经验的资本分配与公司运营决策逻辑;ChatGPT应用集成机制的设计思路及即时结账功能的商业潜力;Sora视频应用的爆款逻辑及其对创造力的激发价值;AI发展中版权问题的应对与政策挑战;用户反馈的处理机制,以及OpenAI技术架构成为未来数字生活基础框架的长远展望等。

这是双方的第三次对话。此前两次分别为2023年与微软高管凯文.斯科特(Kevin Scott)的联合访谈,以及2025年初的单独对话。此次对话距双方上一次对话仅时隔七个月。

在这短短七个月间,OpenAI创下了令人瞩目的发展速度:8月正式发布GPT-5模型,其幻觉率低至1.3%,被视为该公司“迄今最智能、最实用”的模型;推出AI视频生成应用Sora后迅速引爆市场,后续更开放Sora 2 API预览版供开发者接入;同时相继与英伟达、AMD、三星电子、甲骨文等重量级企业达成协议,启动大规模人工智能基础设施建设项目。

以下为访谈精华版内容:

01.OpenAI构建与部署强AI系统的统一战略愿景

汤普森:从DevDay活动上的最新公告,到那些大规模基础设施合作交易,这些举措背后是否存在一个宏大而统一的战略理论?能否用一句话或一段简要论述来概括其核心要义?

奥特曼:OpenAI的核心使命是构建功能强大的人工智能系统,包括通用人工智能(AGI)乃至超级智能,无论当下对其采用何种称谓,同时以真正惠及人类的模式实现部署,让用户能将其灵活应用于日常生活、工作及各类创新场景之中。要达成这一目标,我们需在基础设施建设、产品开发及基础研究等领域投入海量资源并持续付出努力,而这也是全公司上下唯一专注且全力推进的事业。

汤普森:OpenAI正逐步定位为人工智能领域的“Windows”操作系统。作为长期深耕科技领域的分析观察者,我认为这是一种极具积极性的战略定位。

从一方面来看,该公司为消费级与企业级用户提供统一的交互界面或API接口,以此保障用户获得无缝体验;从另一方面来看,OpenAI已成为大规模人工智能基础设施建设的首要目标客户,这种关系类似于计算机产业发展早期原始设备制造商(OEM)与处理器供应商之间的生态关联。你认为这一类比是否贴切?

奥特曼:我对借助历史案例进行类比始终保持谨慎态度,因为在这一过程中,人们往往会不自觉地聚焦于那些关键差异点,而这些差异点对我而言具有重要意义。通常情况下,大多数用户都希望拥有一款单一且高效的AI服务,能够贯穿其整个生活轨迹并持续提供价值。因此,用户会选择ChatGPT作为主要使用入口,但同时也需要ChatGPT与其他服务实现深度集成,这就意味着必须在ChatGPT内部嵌入更多应用。

此外,我们还需大力发展API业务,让用户能够通过OpenAI身份安全登录第三方服务,进而实现体验的连续性与个性化。例如,AI助手需清晰掌握用户偏好与数据隐私边界,并智能判断哪些信息可共享、哪些信息需予以保护。我们的目标正是构建这样一款无所不在的AI助手,而这需要多项要素实现精密匹配与协同配合。

在基础设施层面,这是我目前投入时间与精力最多的领域。当前人工智能需求呈爆炸式增长,构建规模足够的基础设施体系无疑是一项严酷考验,但这也为我带来了全新的挑战与乐趣。至于研究工作,我对 OpenAI 团队未来的发展方向从未有过如此乐观的预期,而这也正是我们敢于进行巨额战略投入、提前布局产品与基础设施的核心原因。

汤普森:你的阐述为我们后续将要探讨的三大核心主题,即基础设施、投资者思维与产品创新,提供了极为优质的讨论框架。

02.OpenAI的AI基础设施“豪赌”与市场生态

汤普森:我们首先将焦点放在基础设施领域。每当OpenAI宣布一项合作交易,合作伙伴的企业市值便会瞬间上涨20%甚至更多,这种现象给你带来了怎样的感受?从实际效果来看,几乎所有与OpenAI相关的新闻稿,都能瞬间转化为具有黄金般价值的催化剂。

奥特曼:这确实是一种前所未有的特别体验。三年前,OpenAI还只是一家专注于基础研究的实验室,当时ChatGPT尚未推出,我们无需过多考虑自身公告对资本市场产生的影响。过去几个月,市场对我们的这种敏感度已成为必须快速适应的现实,但坦白来说,这种情况至今仍让我感到陌生且不真实。我认为,这类现象不会长期持续,它本身带有一定的非理性属性。

汤普森:对于那些希望在AI基础设施建设浪潮中获取发展机遇的企业,是否基本上需要与OpenAI建立直接合作关系?这似乎是上述现象的另一面:在你所描绘的统一战略框架下,OpenAI将成为伴随用户、渗透并影响从底层基础设施到上层应用整个生态链条的核心节点,从这个角度来说,你是否就是该领域的“核心驱动力”?我使用“驱动力”一词时带有积极含义,但这个定位本身也隐含着双刃剑的特性。

奥特曼:OpenAI面临着众多规模庞大、资金充足且技术实力强劲的竞争对手。该领域绝不会发展成赢者通吃的垄断市场,目前甚至远未达到这样的程度。即便在消费领域,我也认为不会出现某一方绝对主导的局面。当然,我们非常希望OpenAI能占据较大的市场份额,并且已为此制定了雄心勃勃的增长计划,但AI技术的本质决定了它会像晶体管一样,渗透到每一款消费产品和每一个企业解决方案中。这是我个人非常认可的一个历史类比,我们之前也曾经讨论过类似的观点。

汤普森:基于当前这些市场动态,OpenAI最不明智的决策,是否就是不尽可能加大资金投入,或者拒绝投资者提供的各类资源?

奥特曼:我不确定这是否属于最糟糕的选择,但我们早已向外界反复阐述过这一战略意图。直到近期,市场才真正开始认真对待我们的表态。我们计划在基础设施领域进行巨额投资,这是OpenAI层面的一次战略豪赌,我们坚信当前正是推进这一计划的成熟时机。至于这一决策是否正确,最终将通过实践来检验,而判断依据包括研究领域的突破性进展、业务的稳健增长、产品的市场表现,以及我们观察到的整体行业趋势。但无论如何,这都是我们将坚定推进的方向。

汤普森:伯恩.霍巴特(Byron Hobart)近期出版了《繁荣》(Boom)一书,书中对卡洛塔.佩雷兹(Carlota Perez)的泡沫投资理论进行了有益拓展。该理论的核心观点是,技术革命需要多项投资与多个发展项目并行推进,而泡沫机制恰好能加速这一同步进程。你是否感受到一种历史责任,需要推动这种多线并进的生态形成?毕竟这些要素无法按照时间顺序逐一推进,必须同时发力才能实现目标。

奥特曼:你的判断完全正确。从电子元器件的制造,到物理基础设施的搭建,再到电力设备与数据中心外部系统的完善,以及芯片制造产能的扩张,所有这些环节都需要同步启动。与此同时,我们还必须培育消费者对相关产品的需求,并确保现有商业模式能够支撑这些巨额投入。这无疑是一场涉及多线程、多维度的复杂协调战役。

汤普森:关于芯片供应,你有怎样的看法?OpenAI刚刚宣布与AMD达成战略合作,英伟达首席执行官黄仁勋(Jensen Huang)是否提前预料到,英伟达会通过这一合作间接成为AMD的投资方?

奥特曼:我并不清楚其中的内情。但需要注意的是,英伟达与AMD均依赖相同的上游供应链,因此价值链中还存在另一个关键的垄断环节,也就是台积电。我强烈希望台积电能够进一步加大产能投资,以缓解全球芯片短缺的压力。

03.OpenAI的融资智慧与硬件生态布局

汤普森:这些合作交易的总价值规模相当惊人,据《金融时报》估算,金额约达1万亿美元。最终需由谁来承担这些巨额成本?这些协议的核心是否在于,OpenAI通过承诺购买的方式,激励合作伙伴提前进行产能扩张?

奥特曼:我预计,这些投资成本将由OpenAI未来的收入来覆盖和偿还。在过渡期内,合作伙伴或许需要通过举债等方式筹集资金,我们会积极提供融资支持,并制定针对性计划,帮助他们在产生收入前解决大规模的资金需求问题。目前,我们已有一些创新性方案正在酝酿当中。

汤普森:长期以来,你被视为硅谷历史上最杰出的募资者之一。你是否曾预料到,这项技能会在人工智能领域的复杂环境中,发挥如此关键且广泛的作用?

奥特曼:在职业生涯早期,我通过实践积累了这些募资与融资技巧。虽然我不会自称精通,但至少达到了可圈可点的水平。当时我并未想到,这些经验会如此契合OpenAI的运营需求,不过事实证明,它们已成为我履行首席执行官职责时的无价资产。

汤普森:这项技能是否能排在你技能清单的首位?

奥特曼:它绝对是其中之一。如果能完全遵循自身天赋选择,我更倾向于从事投资工作,而非运营角色。在运营大型科技公司的诸多方面,我清楚自己能力有限,但投资领域的训练让我形成了独特的思维框架:如何在具有指数级增长潜力的环境中精准分配资本?如何识别高潜力的项目与人才?如何在不确定性中优化资源配置?

从某种角度来说,OpenAI的运作模式类似于对一系列内部初创项目进行集体押注——有时这些项目会发展为独立产品,比如Sora应用。这种模式并非传统的公司运营训练路径,我曾担心它可能成为短板,但实践表明,它反而为我们带来了显著优势。关于这一点,我本可以展开更深入的讨论,但这只是众多例证中的一个。

汤普森:你的观点很有启发意义。其中一个关键在于把握“无限上行潜力”与“有限下行风险”之间的动态平衡,这在AI投资场景中尤为重要。但在“尽可能加大投入”的战略前提下,你会明确拒绝哪些机会,或者哪些方向会被认定为不适宜推进?

奥特曼:我们拒绝的机会比外界想象的要多得多。这与早期初创投资有很大不同:在初创投资中,你可以分散押注数十个项目;但在OpenAI,面对数十个诱人的产品创意与新兴方向,我们必须严格克制,只选择极少数我们坚信具有核心战略意义的路径。有时这会让人感到遗憾,但只有保持专注,才能将这些核心举措执行到极致,进而最大化整体影响力。

汤普森:我对OpenAI在硬件领域的布局格外关注。你与乔尼.艾维(Jony Ive)进行了深度交流,这位苹果设计领域的传奇人物若有机会加入,让外界对OpenAI可能成为新硬件制造商充满期待。我的问题是:如果ChatGPT或OpenAI的核心产品要成为用户“无处不在的数字伙伴”,就必须实现跨设备无缝协作,而非局限于自家硬件生态。你在做决策时,是否考虑过相关风险?比如自家硬件可能导致的战略锚定,或是潜在地疏远其他合作伙伴?

奥特曼:我们绝对考虑过这一点。核心产品必须能在浏览器、各类移动设备及所有主流平台上自由运行,这不仅是我们的要求,也是其他生态参与者的期望。作为一名资深设备爱好者,我一直对硬件创新抱有浓厚热情,也渴望亲身参与设计。但正如你所说,这确实像是一种 “塞壬的诱惑”(The Siren's Call,比喻看似极具吸引力、却可能让人偏离核心目标的事物)。许多科技领袖都曾因痴迷设备而分心,忽略了 “无所不在”的本质。

我们有机会打造真正具有革命性的产品,它不会取代现有设备,而是与它们共存。不过当前硬件领域的创新质量已趋于停滞,几乎所有公司都局限于几类相同的概念。尽管iPhone堪称史上最出色的消费级硬件,我完全理解它的强大吸引力,但人工智能的兴起,正为全新的硬件范式开辟无限可能。

汤普森:另一项令人意外的合作是与三星及SK海力士的联手。显然,未来芯片大规模部署时,内存供应将成为瓶颈。这项协议是否与AMD的交易形成互补?业界曾质疑AMD将从何处获取匹配的内存,此外,OpenAI是否仍在推进自研芯片计划?

奥特曼:请给我们几个月时间,相关情况会逐一明朗。我们并非外界所认为的“疯狂散乱”,而是拥有全面且周密的计划框架。

汤普森:坦率地说,我已经从中看到了整体战略的连贯性,这让我对本次访谈产生了一丝“确认偏差” 的担忧。与你交流后,我对OpenAI的战略有了更清晰的认知。此前我曾对API业务的容量限制颇有微词,认为若将资源集中在特定领域,效率会更高。但现在我更能理解“为何要全力追求无所不在、包罗万象” 的逻辑。当一生难遇的机遇来临时,必须全力以赴。

奥特曼:首先,我坚信这对整个行业乃至全人类而言,都是百年难遇的机遇,我们定会全力把握。这就是“珍惜当下、大胆行动,不因犹豫错过机会”(YOLO,字面意思为人生只有一次)的AI版本,或许这能成为一篇专栏文章的标题。但更重要的是,我们拥有坚实的愿景框架。如果从这一视角审视我们的所有举措,当我们完成新一轮交易并详细阐释目标与逻辑时,整个战略拼图会完美契合。外界可能会质疑这一战略过于雄心勃勃或风险过高,但至少,我们构建这套技术栈的战略逻辑是经得起推敲的。

04.ChatGPT的嵌入式生态与共赢设计

汤普森:你过去曾多次提到ChatGPT的推出实属意外之喜。回顾过往,我此前虽也问过类似问题,但近期对此有了更深的思考:ChatGPT从“意外之喜”发展为“行业重大事件”,再到成为“具备高杠杆价值的平台”,这一认知转变是在何时发生的?

如今我们已拥有海量用户需求,API与身份验证机制也已成熟,用户可通过ChatGPT登录并同步使用数据。但本周的公告更进一步:为何不允许应用开发者直接将产品嵌入 ChatGPT内部?这样既能避免复杂集成常出现的故障问题,又能将所有交互集中在一处。你是在何时明确意识到,OpenAI已具备足够影响力推动这一变革的?

奥特曼:这里有两个关键的“惊喜”时刻。其一,我原本预计ChatGPT会有不错的市场表现,但它实际的增长速度与用户黏性,都远超我的预期。其二,一些我原本认为综合能力强劲的大型科技公司,在ChatGPT 刚推出的关键窗口期里,因种种原因出现了战略决策偏差,这为我们赢得了宝贵时间。在竞争对手重新调整战略前,我们得以建立起显著的竞争优势。

不过,自这两个“惊喜”发生后的两年半时间里,我们始终严格依照预先制定的战略蓝图稳步推进:从长期布局基础设施,到设计ChatGPT内应用嵌入的机制,再到实现API与消费者业务的深度融合。这些环节的推进,几乎都与我们最初的规划高度一致。当然,这需要足够的耐心和脚踏实地的执行,但目前已能看到明显的成果。

汤普森:当你提到其他科技公司的战略偏差时,许多人很可能会首先想到谷歌。尽管谷歌目前已在部分领域恢复竞争力,但你实际所指的公司是否是Meta?

奥特曼:我不便在此点名具体企业。谷歌当前在多个前沿领域都开展着令人印象深刻的工作,但显而易见的是,在ChatGPT刚推出的那个关键阶段,他们的响应速度确实稍显迟缓。

汤普森:从长远角度看,ChatGPT自身所面向的消费市场与企业市场,哪一个规模会更大?ChatGPT在企业领域的渗透深度,是否超出了你的预期?

奥特曼:二者之间存在一些细微差异,但就像谷歌搜索的经典案例一样:你不会在家使用一家搜索引擎,到了工作场合又切换到另一家。企业用户对安全协议与数据访问权限有更高要求;在消费场景中,用户可能更关注医疗咨询的准确性,而在企业环境里,更看重代码生成或法律文档处理的效率。不过我预测,二者会比外界预期的更快走向融合,最终用户将拥有一款能覆盖所有场景的通用AI工具。

汤普森:若将视角扩展到OpenAI的整体生态,在你的规划中,API业务是作为新初创企业搭建平台的基础,还是更侧重于为企业级解决方案提供支持?此外,像微软Azure这样的云服务巨头,是否仍会在这一生态中扮演不可或缺的角色?

奥特曼:同样地,我将其视作构建“无所不在的AI服务” 的整体组成部分,而非简单将其划分为“ChatGPT企业版”与“API”的二元对立关系。用户会逐渐与这一AI实体建立起情感与功能层面的联结:有时,你在 ChatGPT界面内与它互动,让它处理复杂任务;有时,你在开发终端中用Codex辅助编写代码;有时,你通过API在第三方服务中调用它的能力。但展望几年后的生态形态,用户的感知会是:“我拥有这样一个智能实体,它能跨平台为我提供高效支持。”我很庆幸我们有API的灵活性、ChatGPT亲和的交互界面,以及即将推出的新设备等多种选择,但用户最终感受到的,会是一种单一且连贯的使用联结。

汤普森:在DevDay的演讲中,你列出的合作伙伴名单令人印象深刻。此前你也多次尝试过类似的集成模式,比如早期的插件机制,以及后来的GPTs工具。

奥特曼:ChatGPT早期插件机制的尝试未达预期,但GPTs工具的表现十分亮眼。尤其在企业内部协作或个人工作流程优化场景中,获得了极高的使用量。当然,我们希望本次推出的应用集成机制能实现更大突破,若后续发现不足,也会持续迭代优化。

汤普森:引入这些内置应用后,OpenAI内部是否达成了共识:凭借ChatGPT的庞大流量,用户直接在平台内使用Zillow这类服务,会获得明显更优的体验?这是否也让你们拥有了某种“话语权”,比如“对用户而言,这是更优的使用路径;若某类服务不愿嵌入,其他服务会迅速填补空白,最终实现整个生态的共赢”?

奥特曼:情况并非如此。这又一次体现了我早期职业经历带来的经验价值。我们本可以设计出用户体验更流畅,却对合作伙伴极为不利的方案。以Zillow为例,若用户查询“帮我查找符合条件的房产”,我们完全可以接管整个用户界面,只向用户展示结果摘要,而不引导至Zillow的原生应用。

汤普森:确实如此,那样做会剥离Zillow的应用展示层,用户只能获取结果,却无法进行完整的交互操作。

奥特曼:正是这样。但我始终认为,这类集成必须以生态共赢为前提,尤其要为新兴初创企业提供发展机遇。因此我们选择了另一种路径:用户明确指定要使用某类服务时,我们会主动推荐合作方;合作方接管交互界面并关联用户账户,确保用户能与原服务保持直接、透明的连接。这种方式或许在用户体验的流畅度上略有妥协,但从长远来看,更有利于整个行业的健康发展。

05.即时结账机制:设计巧思、信任护城河与借鉴Meta经验

汤普森:即时结账功能的设计颇具匠心。回顾其推出之时,曾有观点指出,部分社交平台已放弃应用内结账模式,原因是该模式转化率未达预期,电商卖家更倾向于将流量引导至自家网站。这是否反映出既有行业巨头存在“路径依赖”问题?OpenAI通过为长尾市场注入显著价值,印证了这一机制的潜力;与此同时,若在结果排序中优先推荐提供即时结账服务的商家且保持无偏见,合作伙伴或许将别无选择,只能积极参与其中?

奥特曼:这里有两点值得深入分析。首先,我并非完全清楚其他平台放弃即时结账的具体原因,但在我看来,只要能确保商家与消费者之间维持直接关联,这一机制本质上优于传统路径。它既提升了用户体验的便捷性,也为商家带来更高的转化效率。我们或许会从过往案例中吸取经验,也可能在实践中发现自身判断存在偏差,但从当前数据来看,即时结账功能的表现极为出色。

其次,若我们在任何环节偏离“全力为用户提供最优答案”的核心原则,ChatGPT当前已处于极高水平的信任度将面临大幅下滑风险。这一担忧构成了我们最强烈的内在约束,促使我们避免任何形式的操纵行为。用户对ChatGPT的独特认可,源于一种深层共鸣:即便出现信息偏差或错误,用户仍能感受到它的“善意努力”,并确信双方的目标导向高度一致。这种体验与许多其他大型科技产品形成了鲜明对比。

汤普森:我对这一面向长尾市场的设计感到十分振奋。作为依赖长尾市场发展的从业者,我一直坚定支持Meta的价值主张,它为中小商家提供了触达潜在客户的渠道,让用户有机会接触到那些原本未知却真正需要的商品。Instagram广告的精准度与实际效果令我惊叹,它让我在居家与生活用品采购中发现了诸多惊喜之选。而ChatGPT扮演了镜像角色,它帮助需求模糊的消费者,精准定位到那些“未知的理想选择”。

考虑到你对100%用户信任的追求,我认为OpenAI不会从中过度抽取收益;若用户更倾向于跳转至商家官网完成交易,你们也会欣然接受。科技巨头本身会产生大量消费者盈余,这一现象无可厚非。真正的商业化机遇或许在于:当某一产品在多家零售商均有销售时,提供即时结账服务的商家不仅能获得优先曝光,还可与ChatGPT共享部分收益。这便是我对你们战略的理解。

奥特曼:谈及Instagram广告,它确实让我重新审视了广告模式的潜在价值。这类广告为我带来了实际益处,帮助我发现并购买了原本难以接触到的商品,我甚至开始主动认可这种体验的价值。Meta在诸多领域都值得我们学习与尊重,其广告机制的精准落地更是我此前未曾预料到的亮点。除此之外,我一直将多数互联网广告视为一种隐性“负担”,这类广告往往干扰用户体验而非提供实际服务。

汤普森:这正是核心问题所在。搜索引擎在很大程度上也属于类似“负担”的存在,自然搜索结果通常已能满足用户需求,广告更多是通过付费获得优先展示位置。我始终为Meta辩护,认为其模式更接近“价值交换”,而非强制性的成本转嫁。

奥特曼:我完全认同这一观点。

汤普森:在这样的商业背景下,你如何规划OpenAI的变现路径?

奥特曼:同样地,我相信我们有机会开发出对用户具有显著净价值、且能强化用户关系的产品形态,例如探索创新性广告机制。但目前,我尚未形成最终确定的“广告方案框架”。

汤普森:联盟营销似乎是一个明确的低风险切入点,它无需担心与自有广告业务产生冲突。

奥特曼:没错,这绝对是一个在战略层面清晰可行的优势方向。

06.Sora视频应用:爆款密码拆解、独立定位抉择与创造力觉醒

汤普森:我们再回到ChatGPT“意外成功”的话题上。在OpenAI的官方文章中,你对Sora取得成功的信心远超以往产品。我起初对此持怀疑态度,如今不得不承认自己判断失误,完全低估了它的病毒式传播能力。但OpenAI是否已建立起一套可复制的“爆款打造”机制?

奥特曼:首先必须强调,OpenAI团队的卓越才华是关键。拥有一支顶尖人才队伍,是实现可复制成功的最佳保障。团队成员不仅能在研究前沿攻克技术难题,还能围绕技术成果打造用户友好的产品。其次,菲吉·西莫(Fidji Simo,OpenAI应用首席执行官)正式加入公司,其在产品设计与市场化落地领域表现尤为突出,是一位综合能力出众的领导者。尽管将产品相关事务移交他人让我略感不舍,但考虑到我需专注于其他战略领域,这无疑是明智之举。想到她未来可能推动一系列爆款产品的诞生,我对此充满期待。

汤普森:你曾提及ChatGPT的“品牌光环”效应,即用户对其天然抱有信任,这无疑构成了强大的竞争壁垒。若ChatGPT出现失误,用户会宽容地认为“它在努力尝试,像个可靠的伙伴”。这种心理机制在“爆款打造” 过程中扮演着怎样的角色?Sora一经推出,用户便预设其“富有吸引力”,愿意尝试使用,并对初期存在的不足保持包容。你的竞争对手在这方面,或许处于完全不同的起点。

奥特曼:我认为品牌光环并非唯一决定因素。归根结底,Sora本身是一款真正优秀的产品,我们精准把握了推动其传播的核心要素。OpenAI作为公司品牌,知名度相对有限,但ChatGPT已成为广为人知的标识。更细微的一点是,Sora的标志设计与ChatGPT高度相似,这一细节或许在潜移默化中强化了用户认知,只是科技领域之外的用户鲜少留意这一细节。

汤普森:我确实未曾留意到这一设计细节。

奥特曼:即便在科技行业内部,或许也只有少数人关注到这一点。但从本质来看,Sora的病毒式传播源于其内在吸引力:用户觉得它“有趣且新颖”,从而主动分享。我们不会依赖品牌光环推出大量产品;未来涉足硬件领域时,用户购买决策仍将基于产品本身的吸引力,而非品牌溢价,当然,品牌光环可能会提供一定助力。

汤普森:你们是否考虑过将Sora整合进ChatGPT生态,还是从项目初期就明确将其定位为独立应用?

奥特曼:我们确实认真评估过整合的可能性,但最终决定放弃,核心原因是两者的用户使用逻辑存在显著差异。对用户而言,ChatGPT是高度个性化且私密的“对话伙伴”;若为其添加社交或分享属性,将破坏这种核心信任关系,用户可能会产生顾虑,担心自己是否仍能放心分享内心深处的困扰。

汤普森:这一考量很有道理。Sora的算力成本想必极高,这是否大幅增加了OpenAI推进商业化的紧迫感?或许,这也为其商业化提供了新思路,例如开发更丰富的广告模式?

奥特曼:这是一个在实践中不断深化的重要课题。我不排除为Sora开发高效广告模式的可能性,脑海中已构思诸多创意方向。但现实情况是,Sora的许多使用场景属于娱乐性质:用户仅为制作有趣的表情包分享给几位好友。这类低价值、高频率的交互,无法通过广告完全覆盖成本。因此,在部分场景中,用户将不可避免地需要为内容生成付费,这将成为保障商业模式可持续性的必然选择。

汤普森:我们或许一直系统性地低估了AI在激发人类创造力方面的潜力。你与其他AI从业者常提及“AI将助力创造”,这听似标准宣传表述,但Sora的出现让我真正理解了这一观点的内涵。早在DALL-E推出时,我就曾撰文探讨“想法生成与具象化”的分离,并将其置于更宏大的历史视角下分析,例如印刷术从口头传播向书面阅读的转型。即便如此,我仍觉得自己低估了这一趋势的深度。你是否从一开始就深刻认识到人类对创造力表达的本能需求?

奥特曼:这一认知再次得益于我早期在初创企业投资领域积累的经验。全球范围内,存在大量未被满足的创造力表达需求:通过传统方式制作一段优质TikTok视频或一件艺术作品,往往需要耗费大量时间与精力。但若能提供便捷工具,帮助用户将抽象想法快速转化为高质量成果,将精准契合人类深层的心理需求。我在众多投资案例中,多次见证过这一需求带来的价值。

汤普森:这种创造力需求是否可独立于社交分享存在?有时,单纯“为创造而创造”就足以满足用户需求。

奥特曼:确实存在这种情况。但人类天性中,既包含欣赏他人创作的意愿,也包含创作者渴望展示作品并获得认可的诉求。这形成了一种集体欣赏的循环:你不仅为自我表达而创造,也为获得他人的认可而创作。

这也是我对AI长期影响就业持乐观态度的原因之一:人类天生渴望为他人创造价值、获得认可与赞赏,因此,我们会不断开拓新领域来实现这一本能。而从Sora的用户反馈中,我们观察到的几项独特趋势,更让我们对未来充满信心。

07.AI发展中的版权议题:争议焦点、政策协作与初创企业保障

汤普森:既然谈到创造力表达,就不得不提及版权议题。这很可能成为未来数年OpenAI乃至整个AI行业面临的核心法律与伦理挑战。从数据输入端来看,AI将加速非原创内容的“去商品化”,唯有人类原始创造力仍将保留独特价值。基于这一趋势,若创作者希望OpenAI使用其最新作品,需主动授权,而OpenAI则支付相应报酬。这种市场模式是否具备合理性与可行性?

奥特曼:从表面来看,这是一个公平且合理的合作框架。

汤普森:而在内容输出端,争议则更为突出。新兴媒介的出现,往往会重新定义版权的边界与内涵。在我看来,最终的解决方案或许是:将版权保护赋予AI模型本身,而非模型生成的内容。因为所有用户本质上共享同一模型;若我使用模型生成米老鼠形象而面临起诉,你使用同一模型生成猫王形象也被牵连,这将引发无尽混乱。相反,仅为模型赋予版权保护,生成内容则进入公有领域或采用知识共享许可,这种模式是否更为清晰可行?

奥特曼:我不确定这是否是唯一解决方案,但它确实提供了一种比当前现状更简洁、争议更少的机制,而当前版权治理现状已陷入极度混乱。AI与版权的交叉领域,是亟需全球达成共识的重大政策议题,OpenAI正积极与各国政府开展合作,投入资源推动建设性对话。

汤普森:我并不担心版权立法会扼杀AI创新,但担忧立法过程过度复杂,导致高昂的法律合规成本仅能由少数行业巨头承担,进而固化行业壁垒。

奥特曼:这一风险确实客观存在,且必须高度重视。

汤普森:你更倾向于通过何种政策路径,确保AI领域对初创企业保持开放与包容?

奥特曼:我们主张与创作者社区紧密协作,共同设计真正有效的收益补偿与权益保护方案,再由立法者据此制定普遍适用的规则。尤其重要的是,必须充分考虑初创企业的成本承受能力;若仅有OpenAI与少数行业巨头可承担合规成本,整个AI生态将遭受不可逆转的损害,这对创新领域而言将是巨大损失。

08.用户反馈与AI未来:多方需求平衡与技术愿景的确定性

汤普森:作为企业领导者,你处于一个独特的交汇点:既要应对亿万级用户的需求,又要维系强劲的API业务生态,同时还要支持不断突破技术极限的研究实验室。你如何平衡这些相互影响的反馈信号?毕竟,用户的即时需求,有时与研究团队对“下一代技术突破”的追求并不一致。

奥特曼:这无疑是首席执行官职责中,持续面临的最棘手挑战之一。在我看来,最有效的平衡方式可分为以下几层:首先,在研究方向上,我们始终以长期战略愿景为导向,坚信这一方向的最终价值。这意味着,我们愿意投资那些短期内看似“无实际用途”,但长期将重塑行业格局的项目。

其次,在产品迭代过程中,倾听用户声音至关重要。若回顾我们过去几年的产品更新记录,会发现许多关键改进都直接源于对用户行为的观察、用户反馈的痛点,以及用户明确表达的期望。

第三,对于API业务,我们格外重视开发者社区的意见,他们的洞察往往能预示生态系统的未来发展方向。

最后,作为领导者,必须坚守独立的战略判断,在充满不确定性的环境中敢于违背短期反馈、坚持长期目标。这一过程难度极高,失误概率也不低,但若是一味迎合短期反馈信号,将永远无法打造出真正具有颠覆性的创新产品。

汤普森:对于你所构建的AI未来图景,你抱有多大程度的信心?

奥特曼:对于我们正在推进的技术愿景,以及其蕴含的变革潜力,我持有100%的坚定信念。但具体执行落地效果是否能达至完美,仍需时间检验。

汤普森:非常感谢你再次抽空参与Stratechery 的访谈。

奥特曼:感谢你的精彩主持。