2026年世界杯官网 探索智能体工程的 5 个教养


昨年12月,我在玩 Ollama 和 Gemini API,试图创建一个能运行肖似 DND(龙与地下城)笔墨冒险游戏的 Agent。我最终烧毁了,因为状态经管对 Ollama 来说太难了,甚而对 Gemini 2.0-flash 来说也太周折。我最终烧毁了创建一个可用的 DND 模拟器,转而作念了一个通俗的计数器,附带一个旁白来解释用户的更新操作。
在那次尝试搁置时,我得出的论断是:
"让 LLM 更新状态,就好比让詹姆斯·乔伊斯帮你报税同样离谱。"
关联词,在那之后的几个月里,我收回了我方说的话。Claude Code、OpenClaw 以及最近几个月裸露的一系列 Agentic 设施,集体震荡了通盘科技行业。我第一次使用 Claude Code 是在二月中旬,用来完成 BetaZero UI 的构建。其速率、体量和编码能力远远特出了我之前从 Agentic 编码器具中体验到的任何东西。
是以,带着这个布景……
式样 1:James Joyce,税务助手
https://github.com/EvanMcCormick37/mvp-james-joyce
这是我要谈到的式样中的第一个。我用了 2 天时候完成了它,作为丹佛一家公司第三轮口试的作品(我走罢了一起四轮口试,但缺憾地未能获取实习契机)。

我花了约莫一个小时细则了当先的办法。一个能携带你了解税务情状、帮你列出可能有履历获取的扣除项的 Agent,同期还会构建一个行径贪图,匡助你获取最大可能的税务扣除。
教养 1:快速迭代,手动测试
当我当先有这个念念法时,使命流看起来与上头的图表十足不同。我当先设念念模子是一个 Agentic Graph-RAG 问答系统,使用基于当年官方 IRS 出书物构建的学问图谱和向量数据库。我念念象用户建议一个问题,模子提供一个班班可考、带开端的谜底,同期附带 1-2 个关系问题,匡助细则用户的扣除履历。
我谈判了架构,草拟了一份 ARCHITECTURE.md,然后用 Claude Code 在不到一小时的时候内完成了一次 one-shot 构建。
但当我推行使用这个利用时,嗅觉有些分别劲……
问题出在问答使命流上。用户的每条论说和问题皆会收到一大段笔墨回话,末尾附带一个究诘财务历史中某个随即方面的问题。这既不是优雅的对话,也不是检朴时候的利用。事实讲解,模范的 RAG 文档问答使命流在这个用例中根底行欠亨。
于是我尝试了别的花样。我平直和 Gemini 聊了聊我可能获取的扣除项,然后念念象怎样改良这个体验。

在原始基础模子上测试使命流。
Gemini 的刚毅在于其对话性。它表示地回答了每个问题,给了我探索的标的,况且从不让东谈主认为它在强行倾销某个话题。这便是对话式 Agentic 利用的上风场地。
我再行诊治了联想,亚搏体育官方网站 - YABO优化对话经由而非数据组织。我大幅简化了高下文工程:我用一个 YAML 文献替代了通盘 Graph-RAG 系统,将 IRS 个东谈主扣除指南和洽后作为系统请示的高下文。模子使用 tool-calling 来更新三个输出文献:user-profile.yaml、deductions-tree.yaml 和 action-plan.yaml。我莫得让模子试图用无穷的援用来往答用户问题,而是告诉它专注于建议正确的问题:我让它把对话看成一场"20个问题"的游戏,尽量用最少的对话轮次细则用户的通盘扣除履历。
教养 2:能用一个 Agent 惩办的,就不要用两个
这少量应该不言自明。在联想利用架构时,我当先谈判使用一个 Agent 与用户对话,另一个来更新状态。同期,细则用户的税务扣除履历要么使用 Agentic Graph-RAG + 推理模子,要么使用一个"税务引擎"(一个 DAG,每个节点包含一个野心或决策。念念念念杂志上那些"你的男性名东谈主偶像是谁?"的特性测试题,只不外问题酿成了"你有履历获取哪些税务扣除?")。但要害在于:多个 Agent 意味着多个"高下文"。"状态更新"Agent 需要了解些许对话内容才能正确更新状态?它的高下文每次皆同样吗,如故随每次函数调用而修改?Agent 之间怎样"通讯"?它们是开启对话,如故使用"音信"函数互重叠信?
你的设施中运行的 Agent 越多,出现误疏通、零星乃至失败的空间就越大。酷爱的是,这亦然联想细则性系统时的一个好准则:一个单体就业容器浩荡比 10 个通过易拉罐和绳索互重叠信的微就业更优雅、更容易终了。
教养 3:尊重 KV Cache
在当先构建利用时,我一直在纠结怎样向模子提供利用确面前状态(回来一下:user-profile.yaml、deductions-tree.yaml、action-plan.yaml)。咱们的税务助手必应知谈利用确面前状态才能建议"最优"问题(即能惩办最多未细则扣除项的问题)。但咱们应该怎样向它提供这些状态呢?若是咱们只是在每次用户回答时不断提供新状态,2026年世界杯官网就会在高下文窗口中塞满旧状态的"幽魂"。咱们照实需要一种花样让模子识别利用确面前状态,况且只是是面前状态。我当先的念念法既通俗又纯真:把状态平直响应到系统请示中!
这是一个要紧子虚。
LLM 有一个叫作念 KV Cache 的特质。它保存了与之前生成文本关联的已野心推理值。因此,在每个生成门径中,模子只野心最近生成 token 的关联。这意味着:1) 模子的运行资本权贵裁减,2) 它的扩展是线性的而非二次的(尤其适用于长高下文窗口),3) 你始终不应该修改高下文窗口发轫的 token。
若是你照实裁剪了模子高下文窗口发轫的高下文,就会迫使它再行野心你裁剪之后每个 token 的 KV 对。这止境容许。我第一次运行 James Joyce 的"高下文注入"终了时,一次 20 轮的对话就在 Anthropic API 上花了 1.50 好意思元。
我最终罗致的惩办决策是将面前状态作为用户面前问题的前缀注入,并在每次新的对话门径中,从用户之前的问题中剥离过期的状态。若是让我回头改良这个式样,我会尝试在每个用户查询中保留通盘状态视图。
式样 2:Scathach Agentic 导师
https://github.com/EvanMcCormick37/scathach-tutor

我在 Scathach 上确面前"统计"页面
乐鱼体育中国2026世界杯官网这个式样与我的个东谈主经历更近一些。往日一年我读了许多东西:接洽答谢、零丁著述、接洽论文、博客著述等等。关联词,我浩荡驰念我方并莫得的确从所读的内容中学到东西,粗略这些学问在几个月莫得深化战役后仍是渐忘了。
LLM 匡助我发展和测试对所读论文的交融。它们让我能立即与一个了解关系话题的实体进行对话。它们还不错创建测试题,让我能在惊东谈主的深度上测试我方对某个话题的交融。但我但愿这些对话能在我脑海中留住执久的印象。
为了惩办这个问题,我构建了 Scathach。它本体上便是"阅读著述 -> 回答对于该著述的小覆按"的使命流,封装成了一个 Python 包。除了基本的覆按功能外,它还将通盘已回答的问题存储在配备了 FSRS 算法的数据库中,这么跟着越来越多的文档被导入系统,用户不错遴荐性地温习他们最不擅长的文档。它当今不错作为 Python 包装配在你的土产货 Python 环境中。
教养 4:警惕范畴延迟

在迭代 Scathach 和 James Joyce 时,我当先用 React 前端 + REST API + FastAPI 后端构建了 MVP。为什么不呢?归正编码通盘东西也只花了 15 分钟。
事实讲解,即使有 Agentic 编码器具,范畴延迟也短长常真实的。重构不时比启动构建更辣手,况且当你 vibe coding——对不起,"Agentic 工程化"——时,你一起先并不会对架构有深化的交融。
我很快发现我方更心爱在莫得"全栈"架构的情况下建树这两个利用。当我起先联想和构建这些利用时,我对念念要什么和用例是什么有一个顽劣的念念法,但对使命流会是什么模样并莫得表示的愿景。我发现这个通俗的联想周期在快速迭代和改良居品联想方面止境宏大:
联想 -> 终了 -> 手动测试
一朝我对 Scathach 的使命流感到酣畅,我可能会把它构建成可扩张文献或云利用。不外当今,我得志于赓续用我阿谁小巧的 Python 模块进行迭代。
教养 5:规模学问始终要紧
是以……我照实尝试过把 Scathach 构建成可扩张文献。更准确地说,我让 Claude Code 把 Scathach 构建成可扩张文献。我念念把它移植成一种我爸爸(他不太懂本事)能使用的步地。它构建了完竣的前端和 API,将后端编译成二进制文献,并使用一个 Rust 库将通盘内容打包成一个不错装配到用户电脑上的 .exe 文献。
那么,我对 Rust、Tauri 粗略将利用编译成二进制 .exe 文献了解些许?一窍欠亨。但 Claude 了解,是以应该没问题。嗯,若是我有这些方面的经验,可能照实没问题。
推行发生的是,我花了一个小时搞明晰为什么 npm 构建剧本不使命,然后又为 Tauri 二进制文献查找和步地化图标,终末凯旋装配了 .exe……后果装配后的设施打不开。
虽然,我深信只是犯了某个入门者邪恶。在 Tauri+Rust 二进制编译方面更有经验的东谈主会坐窝修好它。况且我信赖若是给阿谁东谈主 Claude Code 的使用权,他们会构建一个好 10 倍的利用版块,况且会衔恨说"这不是我我方写的"。但从某种酷爱上说,他们照实写了。即使在依赖"行家 Agent"的时候……
……东谈主类专科学问仍然很要紧。
这亦然我暂时把这个利用保留为 Python 剧本的另一个原因。独一我交融它,我就能智能地赓续更新它。
看到东谈主们为了"Agentic 智能"而烧毁东谈主类专科学问,这让东谈主感到缺憾。我认为社会正在走向《蠢蛋进化论》和《瓦力》那样的漫画式反乌托邦。但即使在智能 AI 系统的时期,那句老话依然适用:垃圾进,垃圾出(Garbage In, Garbage Out)。
就这些了,诸君!若是你念念试试 Scathach2026年世界杯官网,只需按照 README 上的装配评释操作即可。