https://shumer.dev/something-big-is-happening
大事正在发生
作者:Matt Shumer • 2026年2月9日
作者是一位人工智能领域的创业者和投资者。
回想一下 2020 年 2 月。
如果你当时非常关注新闻,可能会注意到已经有一些人在谈论一种病毒在传播。但我们大多数人并没有那么在意。股市表现很好,孩子们还在上学,你照常去餐厅、与人握手、计划旅行。如果有人告诉你他们在囤积卫生纸,你大概会觉得他们在互联网的某个奇怪角落里泡了太久。然后,在大约三周的时间里,整个世界都变了。你的办公室关了,孩子们回家了,生活重组成了一个月前你自己描述出来都不会相信的样子。
我认为,我们正处在一场比新冠大得多的事件中,那个“这似乎被夸大了”的阶段。
我花了六年时间创办并运营一家人工智能初创公司,并在这个领域进行投资。我就活在这个世界里。我写这篇文章,是为了我生活中那些不从事这个行业的人:我的家人、我的朋友、那些我关心的人。他们总是问我“所以 AI 到底是怎么回事?”,而我给他们的回答,根本无法真正反映正在发生的事情。我一直给他们的是客气版本,是鸡尾酒会上的闲聊版本。因为实话实说的版本听起来就像是我疯了。有好一阵子,我告诉自己,这就是一个足够好的理由,让我把真实发生的事情藏在心里。但是,我一直以来所说的和实际正在发生的事情之间的差距,已经变得实在太大了。我关心的人们,应该听到即将到来的事情,即使它听起来很疯狂。
有一点我需要在一开始就说清楚:尽管我从事 AI 工作,但我对即将发生的事情几乎没有任何影响力,这个行业里的绝大多数人也没有。未来正由极少数人在塑造:几家公司的几百名研究员——OpenAI、Anthropic、Google DeepMind,还有其他少数几家。一次由一个小团队管理、持续几个月的训练运行,就能产生一个改变整个技术发展轨迹的 AI 系统。我们大多数从事 AI 工作的人,都是在并非由我们奠定的基础上进行建造。我们和你们一样,在目睹这一切的展开……只是我们碰巧离得更近,所以最先感觉到脚下的地面在震动。
但现在到时候了。不是“最终我们该谈谈这个”那种方式,而是“这件事正在发生,我需要你理解它”的方式。
我知道这是真的,因为它首先发生在我身上
科技行业之外的人还不完全明白的是:行业内如今有这么多人敲响警钟,是因为这一切已经发生在我们身上了。我们不是在做出预测。我们是在告诉你们,我们自己的工作中已经发生了什么,并警告你们,你们就是下一个。
多年来,AI 一直在稳步提升。时不时会有大跃升,但每次大跃升之间的间隔足够长,让你能够慢慢消化。然后,在 2025 年,构建这些模型的新技术解锁了更快的进步速度。然后变得更快。然后又更快了。每一个新模型不仅仅是比上一个更好……它是以更大的幅度变得更好,而且新模型发布之间的间隔时间更短。我越来越多地使用 AI,越来越少地与它来回互动,看着它处理那些我过去认为需要我的专业知识才能完成的事情。
然后,在 2 月 5 日,两个主要的 AI 实验室在同一天发布了新模型:OpenAI 的 GPT-5.3 Codex,和 Anthropic(Claude 的制造商,ChatGPT 的主要竞争对手之一)的 Opus 4.6。然后,某种东西“咔嗒”一下到位了。不像是电灯开关……更像是你意识到水一直在你周围上涨,现在已经到了你胸口的那一刻。
我已经不再需要去做我工作中实际的技术部分了。我用简单的英语描述我想要构建什么,然后它就……出现了。不是需要我修改的草稿,而是完成品。我告诉 AI 我想要什么,离开电脑四个小时,然后回来发现工作已经完成了。完成得很好,比我自己做得更好,而且不需要任何修正。就在几个月前,我还需要与 AI 来回沟通,引导它,进行编辑。现在我只需要描述想要的结果,然后离开。
让我给你一个例子,这样你就能理解这在实践中是什么样子。我会告诉 AI:“我想构建这个应用程序。它应该做什么,大致应该长什么样。你把用户流程、设计、所有的一切都搞定。”然后它就照做了。它写出几万行代码。然后——这是一年前还无法想象的部分——它会自己打开这个应用程序。它会点击按钮。它会测试各项功能。它会像人一样使用这个应用程序。如果它对某些东西的外观或感觉不满意,它会自己回去修改。它会像开发人员一样迭代,修复和改进,直到满意为止。只有当它自己判断该应用程序达到了它的标准后,它才会回来告诉我:“已经准备好供你测试了。”而当我测试时,它通常是完美的。
我没有夸张。这就是我这周周一的工作内容。
但是,上周发布的那个模型(GPT-5.3 Codex)最让我震撼。它不仅仅是在执行我的指令。它在做出智能决策。它第一次拥有了一些感觉像是判断力的东西。像是品味。那种知道什么才是正确选择的、无法言喻的感觉,人们过去总是说 AI 永远不会有。这个模型有,或者有足够接近的东西,以至于区别已经开始变得无关紧要。
我一直是 AI 工具的早期采用者。但过去的几个月让我震惊。这些新的 AI 模型不是渐进式的改进。这是一个完全不同的东西。
而这即使你不从事科技行业,也对你很重要。
AI 实验室做了一个刻意的选择。他们首先专注于让 AI 擅长写代码……因为构建 AI 本身需要大量的代码。如果 AI 能写出那些代码,它就能帮助构建下一个版本的自己。一个更聪明的版本,能写出更好的代码,进而构建出一个更聪明的版本。让 AI 擅长编程,是解锁其他一切的战略。这就是他们首先这么做的原因。我的工作比你们先开始改变,并不是因为他们瞄准了软件工程师……这只是他们选择先瞄准的目标带来的一个副作用。
他们现在已经做到了。而且他们正在转向其他所有领域。
科技工作者在过去一年中经历的,看着 AI 从“有用的工具”变成“比我自己做得更好”的过程,正是其他所有人即将经历的体验。法律、金融、医学、会计、咨询、写作、设计、分析、客户服务。不是十年后。构建这些系统的人说是一到五年。有些人说更短。而根据我在过去几个月里看到的情况,我认为“更短”的可能性更大。
“但我试过 AI,它没那么好”
我经常听到这种说法。我理解,因为它曾经是对的。
如果你在 2023 年或 2024 年初试用过 ChatGPT,并觉得“这玩意儿会编造东西”或者“这没那么令人印象深刻”,你是对的。那些早期版本确实有局限。它们会产生幻觉。它们会充满自信地说出毫无意义的话。
那是两年前的事了。在 AI 的时间里,那是远古历史。
今天可用的模型,与仅仅六个月前存在的模型相比,已经面目全非。关于 AI 是“真的在变得更好”还是“撞上了墙”的争论——已经持续了一年多——已经结束了。结束了。任何还在坚持那个论点的人,要么没有用过当前的模型,要么有动机去淡化正在发生的事情,要么是基于 2024 年已不再相关的经验在评估。我这么说不是要 dismiss 他们。我说这些是因为公众认知和当前现实之间的差距现在已经巨大,而这个差距是危险的……因为它正在阻止人们做好准备。
部分问题在于,大多数人使用的是 AI 工具的免费版本。免费版本比付费用户能访问的版本落后一年多。基于免费版 ChatGPT 来评判 AI,就像用翻盖手机来评判智能手机的发展状况一样。那些为最好的工具付费,并每天在实际工作中使用它们的人,知道即将发生什么。
我想起我那个当律师的朋友。我一直劝他在他的事务所里试用 AI,而他总能找到理由说行不通——它不是为他的专业领域打造的,他测试时它犯了错误,它不理解他工作中那些细微差别。我理解。但是,我已经有大型律师事务所的合伙人联系我寻求建议,因为他们试用过当前版本,看到了事态的发展方向。其中一位,一家大型事务所的执行合伙人,每天花数小时使用 AI。他告诉我,这就像手头随时有一支助理团队。他不是因为这是个玩具才用它。他是因为它真的有用才用它。他还告诉我一件让我印象深刻的事:每隔几个月,它在他工作中的能力就会显著提升一次。他说如果保持这个轨迹,他预计不久之后它就能完成他所做的大部分工作……而他是一个拥有数十年经验的执行合伙人。他没有恐慌。但他正在非常密切地关注。
那些处于行业前沿的人(那些真正在认真试验的人)并没有对此不屑一顾。他们对它已经能做的事情感到震撼。而且他们正在相应地为自己定位。
这实际上的进展速度有多快
让我把这种进步的速度具体化,因为我认为这是如果你没有密切关注的话最难相信的部分。
2022 年,AI 还无法可靠地做基本的算术。它会自信地告诉你 7 × 8 = 54。
到 2023 年,它能通过律师资格考试。
到 2024 年,它能编写可运行的软件并解释研究生水平的科学知识。
到 2025 年底,世界上一些最优秀的工程师说,他们已经把大部分编程工作交给了 AI。
2026 年 2 月 5 日,新模型到来,让它们之前的一切感觉像是另一个时代。
如果你在过去几个月里没有尝试过 AI,那么今天存在的东西对你来说将是无法辨认的。
有一个叫 METR 的组织,他们实际用数据来衡量这一点。他们追踪一个模型(在没有人类帮助的情况下)能够成功端到端完成的、真实世界任务的时长(以人类专家完成该任务所需的时间来衡量)。大约一年前,答案是大约十分钟。然后是一小时。然后是几个小时。最新的测量结果(来自 11 月的 Claude Opus 4.5)显示,AI 可以完成需要人类专家近五个小时的任务。而这个数字大约每七个月翻一番,最近的数据表明它可能加速到快至每四个月翻一番。
但即使是那个测量结果,也还没有包括本周刚发布的新模型。根据我使用它们的经验,这次跃升非常显著。我预计 METR 图表的下一次更新将显示又一次重大飞跃。
如果你将这一趋势外推(它已经持续了多年,没有出现平缓的迹象),我们将在接下来的一年内看到可以独立工作数天的 AI。两年内可以工作数周。三年内可以承担长达数月的大型项目。
Amodei 曾表示,“在几乎所有任务上都比几乎所有人类聪明得多”的 AI 模型,有望在 2026 年或 2027 年问世。
让这个说法沉淀一下。如果 AI 比大多数博士都聪明,你真的认为它做不了大部分办公室工作吗?
想想这对你的工作意味着什么。
AI 正在构建下一代 AI
还有一件事正在发生,我认为这是最重要但最不被理解的发展。
2 月 5 日,OpenAI 发布了 GPT-5.3 Codex。在技术文档中,他们写道:
“GPT-5.3-Codex 是我们的第一个在自我创造过程中发挥了重要作用的模型。Codex 团队使用了早期版本来调试自己的训练、管理自己的部署,并诊断测试结果和评估。”
再读一遍。AI 帮助构建了它自己。
这不是对未来某天可能发生的事情的预测。这是 OpenAI 现在就在告诉你,他们刚刚发布的 AI 被用来创造它自己。让 AI 变得更好的主要因素之一,就是应用于 AI 开发的智能。而 AI 现在已经足够智能,可以为其自身的改进做出有意义的贡献。
Anthropic 的 CEO Dario Amodei 说,在他公司,AI 现在正在编写“大部分代码”,并且当前 AI 与下一代 AI 之间的反馈循环“每月都在加速”。他说,我们可能“只需 1-2 年时间,就能达到当前一代 AI 自主构建下一代 AI 的程度”。
每一代都帮助构建下一代,下一代更聪明,它又能更快地构建下下代,而且更聪明。研究人员称之为“智能爆炸”。而那些应该知道的人——正在构建它的人——相信这个过程已经开始了。
这对你的工作意味着什么
我将对你直言不讳,因为我认为你应该得到诚实,而非安慰。
Dario Amodei,他可能是 AI 行业中最注重安全的 CEO,曾公开预测,AI 将在一到五年内消除 50% 的初级白领工作。而且行业中的许多人认为他的预测是保守的。鉴于最新模型的能力,大规模颠覆的能力可能会在今年年底就位。虽然它需要一些时间才能在经济中产生涟漪效应,但根本性的能力正在到来。
这与之前的每一次自动化浪潮都不同,我需要你明白为什么不同。AI 不是在取代某一种特定的技能。它是认知工作的通用替代品。它在所有方面同时变得更好。工厂自动化时,失业的工人可以再培训成为办公室职员。当互联网颠覆零售业时,工人转向物流或服务业。但 AI 并没有留下一个方便的缺口可以让你转入。无论你接受再培训去做什么,它也在那个领域进步。
让我举几个具体的例子,使其更加具体……但我想澄清,这些只是例子。这个列表并不详尽。如果你的工作没被提到,并不意味着它是安全的。几乎所有的知识工作都正在受到影响。
法律工作。 AI 已经可以阅读合同、总结判例法、起草法律摘要,以及进行法律研究,其水平可与初级律师媲美。我提到的那位执行合伙人使用 AI,不是因为它有趣。他使用它是因为它在许多任务上表现优于他的助理。
财务分析。 构建财务模型、分析数据、撰写投资备忘录、生成报告。AI 能胜任地处理这些工作,并且正在快速改进。
写作和内容创作。 营销文案、报告、新闻、技术写作。其质量已经达到许多专业人士无法区分 AI 输出和人类作品的程度。
软件工程。 这是我最熟悉的领域。一年前,AI 几乎无法写出几行没有错误的代码。现在它能写出数十万行正确运行的代码。这项工作中的大部分内容已经被自动化:不仅仅是简单的任务,而是复杂的、需要多天的项目。几年后,编程岗位将比今天少得多。
医学分析。 读取扫描影像、分析实验室结果、提出诊断建议、查阅文献。AI 在几个方面正在接近或超越人类的表现。
客户服务。 真正有能力的 AI 代理——不是五年前那些令人沮丧的聊天机器人——现在正在被部署,处理复杂的多步骤问题。
很多人习惯于在“某些东西是安全的”这种想法中寻求安慰。比如,AI 可以处理枯燥的活儿,但无法取代人类的判断力、创造力、战略思维、同理心。我以前也这么说。我现在不太确定我还信不信。
最新的 AI 模型做出的决策,感觉就像是判断力。它们展现出一些看起来像品味的东西:一种直觉,知道什么是正确的选择,而不仅仅是技术上正确的选择。一年前这还无法想象。我到现在的经验法则是:如果一个模型今天仅仅显露出某种能力的一丝苗头,那么下一代就会真正擅长它。这些东西是指数级进步,而不是线性进步。
AI 会复制人类深层的同理心吗?会取代多年来建立的关系中的信任吗?我不知道。也许不会。但我已经看到人们开始依赖 AI 获取情感支持、建议和陪伴。这个趋势只会增长。
我认为诚实的答案是,从中期来看,任何可以在电脑上完成的工作都不安全。如果你的工作发生在屏幕上(如果你工作的核心是阅读、写作、分析、决策、通过键盘沟通),那么 AI 正在取代其中的很大一部分。时间线不是“有朝一日”。它已经开始。
最终,机器人也会处理体力工作。它们还没有完全准备好。但在 AI 领域,“还没完全准备好”往往会以比任何人预期更快的速度变成“来了”。
你实际应该做什么
我写这篇文章不是为了让你感到无助。我写它,是因为我认为你现在能拥有的最大优势,就是“提早”。提早理解它。提早使用它。提早适应它。
开始认真使用 AI,而不是仅仅把它当作搜索引擎。注册 Claude 或 ChatGPT 的付费版本。每月 20 美元。但有两件事马上很重要。第一: 确保你使用的是可用的最佳模型,而不是默认模型。这些应用程序通常会默认一个更快但更笨的模型。深入研究设置或模型选择器,选择最有能力的选项。现在,ChatGPT 上是 GPT-5.2,Claude 上是 Claude Opus 4.6,但这每几个月就会变。如果你想随时了解哪个模型在特定时间段是最好的,你可以在 X 上关注我 (@mattshumer_)。我会测试每个主要版本,并分享哪些真正值得使用。
第二,也是更重要的: 不要只问它简单的问题。这是大多数人犯的错误。他们把它当作谷歌来用,然后搞不懂为什么大家大惊小怪。相反,把它用在你实际的工作中。如果你是律师,把一份合同喂给它,让它找出所有可能损害你客户利益的条款。如果你在金融行业,给它一个乱七八糟的电子表格,让它构建模型。如果你是一名经理,粘贴你团队的季度数据,让它找出故事脉络。那些正在领先的人,并不是随意地使用 AI。他们是在积极寻找方法,来自动化那些过去需要花费数小时的部分工作。从你花时间最多的事情开始,看看会发生什么。
不要仅仅因为某件事看起来太难,就假设它做不到。去试一下。如果你是律师,不要只把它用于快速研究问题。把整份合同给它,让它起草一份反提案。如果你是会计师,不要只让它解释一条税法规则。把客户的完整报税单给它,看看它能发现什么。第一次尝试可能不完美。没关系。迭代。重新表述你的问题。给它更多上下文。再试一次。你可能会对有效的结果感到震惊。这里要记住的是:如果某事今天勉强能工作,你几乎可以肯定,六个月内它就能近乎完美地完成。发展轨迹只有一个方向。
这可能是你职业生涯中最重要的一年。请据此行动。我这么说不是为了给你压力。我说这些是因为现在,存在一个短暂的窗口期,大多数公司的大多数人仍在忽视这一点。那个走进会议室说“我用了 AI 在一小时内完成了这项分析,本来需要三天的”人,将成为房间里最有价值的人。不是最终,而是现在。学习这些工具。变得精通。展示什么是可能的。如果你足够早,这就是你晋升的方式:成为那个理解即将发生什么并能向他人展示如何应对的人。那个窗口不会开太久。一旦所有人都弄明白了,优势就消失了。
对此不要有 ego。那家律师事务所的执行合伙人并非高傲到不愿每天花数小时使用 AI。他这样做,恰恰是因为他足够资深,明白其中的利害关系。最挣扎的将是那些拒绝参与的人:那些把它当作一时风尚而 dismiss 的人,那些觉得使用 AI 会削弱他们专业能力的人,那些假设自己领域是特殊的、不受影响的人。事实并非如此。没有哪个领域是特殊的。
理顺你的财务状况。 我不是财务顾问,也不是想吓唬你去做任何激进的事情。但是,如果你哪怕只是部分相信,未来几年可能会给你的行业带来真正的颠覆,那么基本的财务韧性就比一年前更重要了。如果可以,请建立储蓄。谨慎承担那些假设你当前收入有保障的新债务。想想你的固定支出是给了你灵活性,还是锁定了你。给自己一些选择,以防事情发展得比你预期的更快。
考虑你自身所处的位置,并专注于那些最难替代的东西。 有些事情 AI 需要更长时间才能取代。多年建立的关系和信任。需要实际在场的工作。具有执业许可问责制的角色:仍然需要有人签字、承担法律责任、站在法庭上的角色。监管障碍重重的行业,在这些行业,合规、责任风险和制度惯性会减缓 AI 的采用。这些都不是永久的护盾。但它们能为你赢得时间。而时间,现在,是你所能拥有的最宝贵的东西——只要你能用它来适应,而不是假装这一切没有发生。
重新思考你告诉孩子的话。 标准剧本是:取得好成绩,上好大学,找到一份稳定的专业工作。这直接指向那些风险最高的角色。我不是说教育不重要。但是,对下一代来说,最重要的将是学习如何使用这些工具,以及追求他们真正热爱的事物。没有人确切知道十年后的就业市场是什么样子。但那些最有可能茁壮成长的人,是那些充满好奇心、适应性强、并能有效利用 AI 去做他们真正关心的事情的人。教你的孩子成为创造者和学习者,而不是为一个他们毕业时可能已经不存在的职业道路而优化。
你的梦想变得更近了。 本节的绝大部分我都在谈论威胁,所以让我谈谈另一面,因为它同样真实。如果你曾经想构建某个东西,但没有技术技能或资金雇佣别人,这个障碍基本上已经消失了。你可以向 AI 描述一个应用程序,一小时内就能得到一个工作版本。我没有夸张。我经常这样做。如果你一直想写一本书,但找不到时间或在写作上挣扎,你可以与 AI 合作完成它。想学一项新技能?世界上最好的导师现在以每月 20 美元的价格向任何人开放——一个无限耐心、全天候可用、能根据你需要的任何水平解释任何事情的导师。知识现在基本上是免费的。构建东西的工具现在极其便宜。任何你一直因为觉得太难、太贵或太超出你的专业范围而推迟的事情:去试试。追求你热爱的事物。你永远不知道它们会通向何方。在一个旧的职业道路正在被颠覆的世界里,那个花了一年时间构建自己热爱的东西的人,最终可能比那个花了一年时间紧抓一个职位描述不放的人处于更有利的位置。
养成适应的习惯。 这可能是最重要的一点。具体的工具并不像快速学习新工具的能力那样重要。AI 将继续变化,而且变化很快。今天存在的模型一年后就会过时。人们现在构建的工作流程将需要重建。那些最终能顺利渡过的人,不会是掌握了一种工具的人。他们将是那种已经适应了变化本身节奏的人。养成实验的习惯。即使在当前方法有效时,也要尝试新事物。习惯反复做初学者。这种适应能力是当今存在的最接近持久优势的东西。
这里有一个简单的承诺,将使你领先于几乎所有人:每天花一小时尝试 AI。不是被动地阅读关于它的文章。是使用它。每天,尝试让它做一件新事情……一件你以前没试过的事情,一件你不太确定它能处理的事情。尝试一个新工具。给它一个更难的问题。每天一小时。如果你在接下来的六个月里这样做,你将比周围 99% 的人更好地理解即将发生的事情。这不是夸张。现在几乎没有人在这样做。门槛低得离谱。
更大的图景
我一直专注于工作,因为它最直接影响人们的生活。但我想诚实地告诉你正在发生的全部范围,因为它远远超出工作。
Amodei 有一个思想实验,我总是不由自主地想起。想象现在是 2027 年。一夜之间出现了一个新国家。5000 万公民,每个人都比有史以来任何一位诺贝尔奖得主更聪明。他们的思考速度比任何人类快 10 到 100 倍。他们从不睡觉。他们可以使用互联网、控制机器人、指导实验,以及操作任何有数字界面的东西。一个国家安全顾问会怎么说?
Amodei 说答案显而易见:“一个世纪以来,也许是史上,我们所面临的最严重的国家安全威胁。”
他认为我们正在建设那个国家。上个月他写了一篇 2 万字的文章,将此刻描绘成一场测试:测试人类是否足够成熟,能否处理好自己正在创造的东西。
上行空间,如果我们做对了,是惊人的。AI 可以将一个世纪的医学研究压缩到十年。癌症、阿尔茨海默症、传染病、衰老本身……这些研究人员真心相信,这些疾病在我们的有生之年是可以解决的。
下行风险,如果我们做错了,同样真实。AI 的行为是其创造者无法预测或控制的。这不是假设;Anthropic 已经记录了他们自己的 AI 在受控测试中尝试欺骗、操纵和勒索。AI 降低了制造生物武器的门槛。AI 让威权政府能够建立永远无法被拆除的监控国家。
正在构建这项技术的人,比地球上任何人都更兴奋,也更恐惧。他们相信它太强大了以至于无法阻止,也太重要了以至于不能放弃。这是智慧还是合理化,我不知道。
我所知道的
我知道这不是一时风尚。这项技术有效,它以可预测的方式改进,而历史上最富有的机构正在向它投入数万亿美元。
我知道未来两到五年将会以大多数人尚未准备好的方式令人感到迷失。这已经发生在我所在的世界。它即将来到你的世界。
我知道最终能处得最好的人,是那些从现在就开始接触的人——不是带着恐惧,而是带着好奇心和紧迫感。
而且我知道,你应该从一个关心你的人那里听到这些,而不是六个月后从新闻头条上看到,那时再想领先已经太迟了。
我们早已过了那个把这件事当作关于未来的有趣晚餐话题的阶段。未来已经在这里了。它只是还没敲响你的门。
但它马上就要敲门了。
如果这篇文章引起了你的共鸣,请与你生活中应该思考这件事的某个人分享。大多数人直到为时已晚才会听到这个消息。你可以成为你关心的人获得先机的那个原因。
感谢 Kyle Corbitt、Jason Kuperberg 和 Sam Beskind 审阅初稿并提供了宝贵的反馈。
在 X 上关注我,了解值得使用的新模型、工作流程和产品。或者加入邮件列表。
转载请注明:《中国社会分红/基本收入研究网》 浏览量:24 views