Skip to content
OpenWalk
Go back

系统的编排与链接能力

Edit page

想象一个画面:交响乐团的舞台上,一百位乐手各自拿着世上最精良的乐器。小提琴手握着价值三百万的斯特拉迪瓦里,大提琴手扛着十八世纪的瓜奈利,双簧管乐手的乐器镀了纯金。乐手们技艺精湛,每个人都能独奏出令人落泪的旋律。

但他们没有指挥。

音乐响起来了。你听到的是一百种旋律在同时流淌,彼此交叠、碰撞、淹没。没有统一的节奏,没有渐强渐弱的呼吸,没有情绪的起承转合。那不是音乐,是噪音。

这个荒诞的画面,精确地描述了当前AI工具时代的处境。


ChatGPT、Claude、Midjourney、Copilot、Cursor——每一个拿出来都是各自领域的”斯特拉迪迪瓦里”。我们手里的工具越来越精良,我们学到的技能越来越专业。但当我们试图用这些工具完成一件真正复杂的工作时,发现效率并没有出现质的飞跃。

问题不在于工具不够好。问题在于我们还在用”乐手”的思维使用AI。

什么思维?就是问”我该用哪个工具”的思维。小张学 Python,大李学 Prompt,周总学设计,等所有人都学了一圈之后,发现各自的工具箱都塞满了,但团队的整体产出并没有出现”一加一大于二”的效果。原因很简单:工具越来越多,但没有人负责让它们配合。

这就是AI时代第一个被低估的问题:编排的缺失。


编排不是”用什么工具好”的工具选择问题。工具选择是战术问题——你知道哪个乐器音色更温暖、哪个鼓点更精准,你选一个用就是了。编排是战略问题——你需要回答的是:这些工具怎么串联才能自我运转?它们之间的对话规则是什么?谁先出场,谁收尾,数据怎么传递,出了错怎么修正?

这个问题太少人被认真思考过。

大多数人对待AI工具的方式,是买一套高档音响然后把音量拧到最大。不是不好,是根本没有调过音。Zapier和Make这类自动化平台为什么价值几十亿美元?因为它们解决的不是”你用什么工具”,而是”工具和工具之间怎么说话”。越来越多的开发者开始研究Agent工作流而不是继续优化提示词,原因也是一样的:当单个工具的能力已经触顶,价值的下一个增长点就转移到了连接层。

真正的问题不是”这个工具强不强”,而是”这个工具能不能和其他工具对话”。

真正的瓶颈,从来都不在工具本身。


回到交响乐团的比喻。

指挥家不演奏任何一个乐器,但指挥家做的决策比任何乐手都更关键。他决定这首曲子要什么声音,决定哪个乐段该由哪组乐器呈现,决定力度是渐强还是突然减弱,是用延长音制造沉默还是干脆利落地截断。没有指挥的一百个乐手,是一群各自为政的天才。有了指挥的一百个乐手,才是一支真正的乐团。

乐手问的问题是”我会什么”——我会拉这个音符,我会吹这个音阶,我技术够硬,我能把这段旋律演奏得完美。指挥问的问题是”这个系统要什么”——这段音乐要表达什么,为了实现这个表达,我需要哪些声音,它们以什么顺序、什么关系出场。

两种完全不同的能力。前者是执行能力,后者是设计能力。执行能力决定你的手能不能准确做出动作。设计能力决定这些动作是否值得被做出,以及如何让多个动作协同起来产生更大的效果。

AI正在以惊人的速度超越人类的执行能力。你画不过Midjourney,你写不过GPT-4,你编码的速度比不过Copilot。执行能力的竞技场,人类已经输定了。但设计能力——决定什么值得被执行、用什么工具组合去执行、执行的结果如何让系统运转得更好——这个领域AI至今连门槛都没摸到。


这就是驾驭工程的核心。

不是学习更多的工具,不是成为某个AI工具的高级用户,甚至不是掌握编程能力。驾驭工程的核心是模块化思维:不再死磕单一技能的极致,而是思考如何将不同的模型、工具、数据流有机地组装成一个自动化系统。

模块化思维的关键,不是理解每个积木的内部结构——那是工程师做的事。驾驭工程思维的关键,是理解积木之间的卡口设计。

乐高积木为什么强大?不是因为每块积木的塑料质量独步天下。是因为接口统一。同一套卡口,可以拼出汽车,可以拼出城堡,可以拼出城市,可以拼出你脑子里能想象出的任何东西。买了一套乐高,你不需要问”这块积木能拼什么”——你可以问”我想做什么,积木会告诉你怎么拼”。

iPhone的成功不是因为某个单一技术的突破。是因为苹果设计了一套接口规范,让数十万开发者可以在这个平台上构建应用。真正的价值不在于屏幕有多好、芯片有多快,而在于这个接口设计让整个生态活了起来。API经济的崛起印证了同样的逻辑:赚钱的从来不是API本身,而是围绕API的编排工作。在LLM生态里,最有价值的不是模型能力排名,而是那些知道如何设计工作流、如何让多个模型彼此配合的人。

接口比实现重要。连接方式比单个节点重要。这两句话,是模块化思维的核心,也是理解AI时代能力升级的关键所在。在乐高的世界里,最重要的不是每块积木有多精密,而是它们之间的卡口设计是否足够通用、是否能够无限组合——当你掌握了这套接口逻辑,你就拥有了在任何领域搭建系统的能力,而不仅仅是在一个领域内深耕的能力。


但光有编排能力还不够。还有一种能力,是AI在可预见的未来都难以触及的。这就是跨学科的”缝合”力。

AI能在一个领域内做到极致优化。AlphaFold能预测蛋白质结构,GPT-4能写论文,Midjourney能生成图像。它们在各自的专业领域里已经超越或正在超越最优秀的人类专家。但AI有一个结构性限制:它无法自创不同领域之间的连接。

生物学的自组织逻辑和管理学之间有什么关系?工程思维和教育学之间能产生什么?物理学的对称性原理能不能启发一种新的建筑设计语言?这些问题,AI能回答,但它不能”发现”这些问题。

人类能做到。达芬奇是画家,但他把解剖学的知识缝合进了绘画,这让他的作品有了其他画家从未达到过的精准。Jeff Bezos把物流、零售、数据的逻辑缝合在一起,产生了”万物商店”这个概念——这个洞察不是来自任何一个单一领域的深耕,而是来自跨领域连接本身的创造力。乔布斯把技术、人文、设计的视角缝合成了苹果的产品哲学,他的竞争对手可以模仿每一项技术参数,但无法复制这种缝合。

意义的合成是AI的黑盒。这个黑盒的本质是什么?是你能同时站在两个以上领域的内部,看到它们的逻辑,然后找到它们的交叉地带产生的新价值。这个能力需要你对多个领域都有足够深的理解,才能感知到它们的边界在哪里、它们的语言能不能互译、它们的逻辑能不能嫁接。AI没有身体,没有实践,它能处理信息,但无法真正”生活”在一个领域里——而真正的洞察往往来自身体性的、与环境互动的、对”做这件事到底意味着什么”的体感。

这就是为什么智能时代不再奖励深度垂直的”螺丝钉”。螺丝钉的价值在于它在特定位置上的不可替代性。但当这个位置被机器接管,螺丝钉就彻底出局了。真正有价值的是那些能把生物学逻辑引入管理学、把工程思维引入教育、把物理学的对称性引入建筑设计的跨界者——不是因为他们什么都懂一点,而是因为他们能看见不同领域之间的连接所产生的价值。

这种缝合产生的价值,不是”一加一等于二”,是”一加一大于十”。


组合还是自建,这是编排思维里的第一个判断框架。

面对一个需要多种能力的任务,大多数人的第一反应是”我要学更多技能”,或者”我要找到一个能做所有事情的超级工具”。这是自建思维。真正懂得编排的人会问:已有的工具里,有哪些能组合来完成这件事?

专业工具在各自领域的最优表现远超通用工具。一个专门做数据清洗的工具,比GPT-4做数据清洗的效率不知道高到哪里去了。一个专门做信息提取的模型,比用通用大模型做精确信息抽取靠谱得多。组合的成本通常远低于训练或构建一个全能工具的成本。而且组合的灵活性远高于单一工具——当需求变化时,调整工具之间的连接比重新训练一个系统容易得多。

什么时候该用组合?当任务能被清晰拆分为相对独立的子任务,子任务之间有明确的信息流,而且每个子任务已经有足够好的专门工具。什么时候该自建?当任务极其简单,用一个工具就能完美完成;当子任务之间的信息流无法标准化,组合的损耗大于价值;当对延迟和成本极度敏感,工具间的通信开销不可接受。

人还是AI,这是第二个判断框架。面对一个任务,你需要问自己的核心问题是:这个任务的核心价值在于”发现新连接”还是”高效执行已知的流程”。

如果你的目标是缝合不同领域的逻辑,产生新想法,找到”为什么做”而非”怎么做”——这种任务必须人主导、AI辅助。AI能帮你生成,但它不能判断什么值得被生成。如果你需要的是执行一个已经被清晰定义的流程,目标是高效、稳定、可重复——这种任务直接交给AI,让它以最高效率完成。

最后一个框架:接口还是实现。面对一个反复出现的环节,你需要问自己:这个环节是高变动区还是稳定区?

高变动区优先定义接口,保持实现的灵活。一个环节在系统中有多个调用方,或者它的实现可能会被替换或升级,或者有不同的人在维护这个系统的不同部分——这些情况下,接口标准化带来的灵活性远比提前优化某个具体实现重要。稳定区可以深耕实现。当一个环节已经高度优化,任何抽象都会带来不可接受的成本,而且需求极度稳定不需要考虑替换——这时候再花时间打磨它的实现。

这三个框架的共同逻辑是:在正确的地方使用正确层次的抽象。不要在需要灵活性的地方过度优化,也不要在需要判断力的地方假手于人。


历史上每一次技术革命,都重复同一个模式。

工业革命把手工劳动机械化。最早被替代的是体力劳动的执行端——纺纱机代替纺织工,蒸汽机代替铁匠。但随后出现的新贵不是操作机器的人,而是设计机器的人。机械工程师成为了那个时代最稀缺的角色。

信息革命把脑力劳动软件化。最早被替代的是重复性的信息处理工作——打字员、数据录入员。但随后出现的新贵不是会用软件的人,而是能把软件和商业需求对接的人,产品经理、架构师、系统设计师成为了每个科技公司的核心资产。

现在,智能革命正在把执行性思考自动化。最早被替代的是那些有明确流程、可被分解为步骤的执行性任务——写代码、做设计、分析数据。但真正存活下来的,是那些能定义”这个系统要解决什么问题、为什么这个问题值得解决”的人。

不是AI淘汰了人。是会用AI的人淘汰了不会用的人。更准确地说:是懂得设计AI协作系统的人,淘汰了只懂得自己操作AI的人。

人类的不可替代性,不在于比AI更能执行。执行是机器的战场,这块领地迟早会完全失守。人类的不可替代性,在于能够设计出让AI去执行的系统。这个系统包括:目标定义、能力分配、流程编排、质量控制、反馈修正。这是一套完整的设计能力,AI可以辅助,但无法替代。

从执行者到设计者,这不是一次职业转型,这是一次认知升级。

你不再是那个在流水线上操作机器的工人。你是那个设计流水线的人。你定义流水线的目的,选择每个工位的工具,决定零件怎么流动,处理异常情况,持续优化整个系统的效率。这才是未来人类在智能时代的位置。


回到交响乐团。

一百个乐手拿着最好的乐器,但没有指挥。那不是音乐,是噪音。

一百个AI工具拥有强大的能力,但没有编排。那不是效率,是混乱。

真正的问题不是”我该用哪个AI工具”。真正的问题是:如何让这些工具组成一个能自我运转的系统?

这个问题的答案,就是编排能力加链接能力的总和。

编排,让多个AI工具各司其职、协同工作。它解决的是”怎么做”的问题——数据怎么流动,任务怎么分配,流程怎么串起来,一个环节出错怎么修正,整个系统怎么持续运转。

链接,把不同领域的洞察缝合在一起。它解决的是”做什么”和”为什么做”的问题——这个系统要达成什么目的,这个目的是否真正有价值,达成这个目的需要整合哪些领域的视角。

两者相加,就是总建筑师。

总建筑师不需要比任何一个乐手演奏得更好。总建筑师也不需要知道双簧管的发音原理或者小提琴的弓法技巧。总建筑师需要知道的是:这首曲子要表达什么,为了表达这个意图,我需要哪些声音,这些声音以什么方式、在什么时机呈现,才能让听众感受到我想要他们感受的东西。

这不是天赋。这是可以被学习的。

学会问”我要什么系统”,而不只是问”我会什么工具”。学会画信息流图,定义模块接口,设计反馈机制。学会站在多个领域的交叉口,看见连接产生的价值。学会在正确的地方使用正确层次的抽象,不在需要灵活性的地方过度优化,也不在需要判断力的地方假手于人。

AI时代的人类价值,不在于比AI更能执行。

在于能设计让AI去执行的系统。

这是交响乐舞台上的最后一课:一百个天才各行其是,那是噪音。一百个天才加一个指挥,那才是音乐。


Edit page
Share this post on:

Previous Post
提问与界定问题的能力
Next Post
身体觉知