提要:通过 /prototype 进行原型实验,再利用 /rewind 结合 summarize 功能将实验过程压缩为结构化知识,从而在保持上下文精简的同时,实现从“试错”到“认知”的跨越。
很多人用 AI 就像在沙堆上盖房子,一边堆一边塌。
有个很有意思的工作流:先用文档去“拷问”AI,遇到答不上来的问题,直接进入 /prototype 模式,不计成本地消耗 Token 去做一个原型。等原型跑通了,关键动作来了:使用 /rewind 回到问题点,并执行 summarize。
这本质上是在做一种上下文的“垃圾回收”与“知识提取”。
有网友提到,这个组合拳最厉害的地方在于,它把昂贵的 Token 消耗从单纯的“氛围感试错”转化成了可复用的“产品记忆”。如果你只是盲目地在对话框里堆砌指令,你是在浪费算力;但如果你学会了“自由探索→压缩学习成果→带着更优上下文继续”,AI 才真正开始像一个工程协作伙伴。
这让人想起操作系统的内存管理。直接把所有运行日志塞进上下文,迟早会触发 OOM(内存溢出)或者让推理变得极其迟钝。通过 summarize 进行压缩,就像是把频繁访问的热数据提取成索引,把冗长的执行路径变成了一行简洁的函数调用。
有观点认为,这种流程一旦跑通,就可以将其封装成 SKILL.md,让整个团队直接共享这种思维模型,而不是每个人都去重新发明轮子。
不过也有人觉得,这种频繁的“倒带”操作可能会打断心流。这大概取决于你是在做简单的 Prompt,还是在进行深度架构设计。
如果实验本身就是为了寻找答案,那么在看到答案的那一刻,把过程“压缩”掉,只留下结论,或许是目前最高效的交互方式。
下一步该怎么做?或许是把这种经过验证的流程,直接变成 Agent 的内置技能。
“这是一个多篇系列博客的第一篇,分享了我们如何通过机器学习模型服务基础设施在多个领域(例如,标题推荐、商务)大规模提供个性化体验的技术见解。
在这篇介绍性博客中,我们将深入探讨我们的领域无关 API 抽象及其流量路由能力,该能力由中央 ML 模型服务平台向多个特定领域的微服务暴露,用于模型推理。这个单一的 API,即进入 ML 模型服务平台的入口,显著提升了在现有 ML 体验上迭代新版本的创新速度,同时也支持使用 ML 构建全新的产品体验。”
在大规模在线推理系统里,路由不只是把请求分发到任意实例,而是要在延迟、吞吐、成本、可用性、模型/硬件异构性和实时负载变化之间做权衡;文章梳理了从简单静态/轮询式负载均衡,到更智能的、感知服务状态与性能指标的自适应路由思路,强调好的 routing layer 应该把模型副本、容量、队列、SLO、降级策略和观测数据结合起来,动态决定请求去哪里,从而提升资源利用率并稳定用户体验。
现在市面上AI工具很多,skills也遍地都是。似乎构建一个AI自动化工作流已经非常简单了。但是,真正动手才知道,这里面的坑非常多:
*很多skills看似很厉害,但不能完成我的个性化的需求。AI时代,真正属于自己的、个性化的工作流才是重点。
* 下载了skills,好容易配置起来了,但运行就是不稳定,有时候好使,有时候又不好使。修起来也不知道从何下手。
* 使用OpenClaw极费token。
* 有些skills要求注册api key,或者调用频率有限制。本来只是想完成自己的一个小需求,没想到还得付个订阅费。
这个视频演示如何使用Claude Code + AmphiLoop免费制作一个真正属于自己的AI工作流:自动浏览+汇总YouTube上指定的视频频道,并把汇总信息定时发送到手机。
*很多skills看似很厉害,但不能完成我的个性化的需求。AI时代,真正属于自己的、个性化的工作流才是重点。
* 下载了skills,好容易配置起来了,但运行就是不稳定,有时候好使,有时候又不好使。修起来也不知道从何下手。
* 使用OpenClaw极费token。
* 有些skills要求注册api key,或者调用频率有限制。本来只是想完成自己的一个小需求,没想到还得付个订阅费。
这个视频演示如何使用Claude Code + AmphiLoop免费制作一个真正属于自己的AI工作流:自动浏览+汇总YouTube上指定的视频频道,并把汇总信息定时发送到手机。
文章配套有开源项目 addyosmani/agent-skills ,把里面这些高级工程实践封装成了 skills 。