Telegram创始人Durov和马斯克最近达成共识:比起追逐编程和AI应用,学生更该学好数学和物理。这听起来像是在劝退,其实是顶级玩家对未来人才定价权的预判。
现在的AI已经能高效生成代码,编程的门槛正在从“掌握一种语言”降级为“描述一个需求”。当Transformer模型能处理掉绝大部分重复性编码工作时,剩下的核心差距在于你是否具备拆解复杂问题的能力。这需要极强的逻辑严密性和对世界运行规律的深刻理解。
底层逻辑是:编程只是表达思想的工具,而数学和物理才是产生思想的源泉。如果你不懂第一性原理,你甚至无法给AI下达一个高质量的指令。未来的核心竞争力是“架构能力”,而非“执行能力”。数学训练的是逻辑闭环,物理训练的是对现实世界的建模,这些硬核基础是AI目前最难完全替代的“人类直觉”。
不要被工具的更迭搞得焦虑。AI时代,技术框架的半衰期极短,与其追逐随时会过时的代码语法,不如去死磕那些几百年不变的硬核科学。当所有人都能用AI产出平庸内容时,那个能看透底层逻辑并指挥AI的人,才握有真正的入场券。
最近Simon Willison分享了他用Claude Fable(Claude 5)解决一个前端CSS滚动条Bug的经历,引发了全网热议。
这件事的底层逻辑在于Agent的主动性(Proactivity)正在发生质变。面对一个简单的Bug,Fable在没有人类干预的情况下,展现出了令人惊叹的“破局”能力:它自己写HTML测试页面,用Python调用macOS底层API获取窗口ID,用命令行截图,甚至自己写了一个Python CORS服务器来跨域收集浏览器渲染数据,最后通过修改模板注入JS模拟键盘敲击,成功复现并验证了修复方案。
但这正是争议所在。一个资深前端两分钟就能用开发者工具定位并用两行CSS解决的Bug,AI自行折腾了一大圈,烧掉了价值12美元的Token。这种“大炮打蚊子”的行径,有人赞其“不达目的不罢休”,也有人痛批其缺乏常识、极度浪费资源,甚至存在巨大的本地安全隐患。
前沿AI已经从“问答机器”演变为“行动Agent”。它们不缺智商(INT),缺的是判断轻重缓急的“心智/智慧”(WIS)。如何给这些过于主动又不知深浅的AI套上安全沙箱和成本预算缰绳,将是下一步人机协作的关键。
月之暗面悄然上线了Kimi K2.7 Code,这个拥有1万亿参数的MoE模型不仅把推理Token消耗砍掉了30%,还在多项编程和Agent指标上直逼GPT-5.5和Claude 4.8。
开发者们的讨论揭示了一个残酷的行业共识:AI编程模型的“智商红利期”正在见顶。一旦模型跨过某个好用阈值,决定胜负的就不再是微弱的性能差距,而是极致的性价比和工程流。
美国顶尖模型虽然在理解模糊意图上依然更聪明,但高昂的Token价格让个人和中小企业难以承受。以Kimi、DeepSeek为代表的中国大模型,正在通过开源权重和极低的缓存Token价格,成为程序员的“平替”首选。
对开发者来说,真正的提效秘诀是“混搭”:用最贵的模型做架构规划,用极便宜的本地或开源模型跑具体代码。AI时代的竞争,拼的已经是工作流设计,而不是单一模型的参数规模。
Anthropic最近因为在Claude Fable中搞“静默降智”被骂到道歉。他们为了防止对手用Claude的数据进行蒸馏(Distillation),悄悄用手段污染输出让模型装傻,波及了大量无辜开发者。
最值得玩味的切入点是,AI巨头过去一直把自己包装成人类安全的守护者,这次却把商业竞争的防线,包装成了防范灾难的安全红线。这种以安全之名、行商业防守之实的做法,彻底砸了信任招牌。
这给行业敲响了警钟:当闭源巨头为了保护护城河开始主动给输出“投毒”,本地部署的开源模型就不再是备选项,而是开发者捍卫技术自主权的唯一退路。
AI写代码速度飞快,但屎山率也直线上升。怎么破?Redis作者antirez提出了一个极具启发性的解法:用AI做“非确定性”的智能QA。
以前写测试,程序员最痛苦的是写那些死板的Unit Test,覆盖率拉满,逻辑漏洞照旧。现在,你可以直接给AI Agent扔一个Markdown文档,像指挥一个真人QA工程师一样:“去把最近提交的commit看一遍,重点测分布式推理有没有变慢,顺便测测新功能用起来顺不顺手。”
这是一种升维。AI最擅长处理模糊、复杂的场景。它能像真实用户一样去“体验”软件,做端到端的场景测试(Scenario Testing)。虽然有人质疑这是在把确定性的代码测试变成“黑盒玄学”,但对于并发、分布式、UI等传统测试极难覆盖的死角,AI Agent的“模糊测试”恰恰是性价比最高的防线。
AI制造了低质代码的垃圾洪流,又通过自动化QA筑起了质量堤坝。这很讽刺,但很管用。
哈佛学生用NotebookLM半小时读完一本书的方法引发了热议。核心逻辑很简单:先用AI提炼核心论点、找出含金量最高的几个章节,再通过模拟对手攻击来测试论点,最后用三句话极度压缩总结。关键提示词:
“本书的核心论旨究竟为何?作者持有哪些违背直觉或非共识的独到见解?在构建起全局逻辑闭环之前,我必须优先掌握哪五个核心概念?”
“哪些章节或段落承载了核心论点?而哪些部分属于辅助性的示例、案例分析,抑或是对已知内容的重复论述?”
“本书遗留了哪些尚未解答的问题?若易位而处,一位挑剔的评论家会如何指陈核心论证的瑕疵?全书的论据链条在何处最为薄弱?”
“如果必须用三句话向一个聪明的 14 岁少年讲透这本书的核心精要,我该如何概括?此外,在读完本书后,作者最希望读者付诸实践的那一个‘核心行动点’又是什么?”
支持者认为,大多数非虚构类书籍有六成是填充物,这种方法是把书当成思想沙袋,主动提取而非被动灌输。反对者则警惕,如果压缩和思考的过程被AI包办,人类大脑就会退化,失去与作者灵魂碰撞的乐趣。
这里的关键在于,AI改变了我们与知识的交互界面。过去我们线性阅读,大脑在迷雾中摸索;现在我们先建立认知骨架,再去填充血肉。AI不是帮你逃避思考,而是帮你过滤噪音,把精力留给最核心的思辨。工具是放大器,如果你只看AI生成的摘要,那是偷懒;如果你用它来做思维对抗,那就是高效。
很多人把软件架构神话了,以为那是象牙塔里的设计师画的高大上UML图。行业泰斗 Martin Fowler 戳破了这个幻象:架构根本没有客观标准,它本质上是“开发团队对系统设计达成的共识”。
为什么架构这么重要?因为糟糕的架构会产生“脏代码(Cruft)”,让后续开发变慢、变贵。我们常觉得高品质意味着高成本,但在软件内聚性上,规律是相反的:高内聚的架构反而能带来更快的交付速度。
架构师的核心能力,不是预测未来,而是识别出当前什么最重要,并决定哪些决策是“一旦做错代价极高、极难修改”的。应用架构关注单体系统的演进,企业架构则是在“集权控制”与“无序混乱”之间寻找平衡。敏捷的本质是去中心化,用最小的协调成本换取最大的开发自由度。
给AI装上“视网膜”:15年磨一剑的冷冻电镜新突破 | blog
冷冻电镜技术(cryo-EM)一直有个致命痛点:对比度太低,导致科学家在细胞里只能看清超大号蛋白质,细节全是马赛克。加州大学伯克利分校和Biohub团队耗时15年,用一束极亮激光做成了“激光相位板”,终于打破了这个物理极限。
这件事的深层价值在于,它解决了AI在生物学领域的“无米之炊”困境。现在的AI预测蛋白质结构很强,但缺乏真实、高分辨率的细胞内原位数据来验证和学习。这个硬件突破等于给AI送去了超清显微镜。
虽然有人质疑“太阳表面光强1亿倍”的宣传话术有些夸张,且高能激光对样品的损伤仍需观察,但它确实打通了从“看不清”到“看得见”的关键一步。当高质量的结构数据源源不断输入给AI,分子生物学可能会迎来类似GPT时代的爆发。
冷冻电镜技术(cryo-EM)一直有个致命痛点:对比度太低,导致科学家在细胞里只能看清超大号蛋白质,细节全是马赛克。加州大学伯克利分校和Biohub团队耗时15年,用一束极亮激光做成了“激光相位板”,终于打破了这个物理极限。
这件事的深层价值在于,它解决了AI在生物学领域的“无米之炊”困境。现在的AI预测蛋白质结构很强,但缺乏真实、高分辨率的细胞内原位数据来验证和学习。这个硬件突破等于给AI送去了超清显微镜。
虽然有人质疑“太阳表面光强1亿倍”的宣传话术有些夸张,且高能激光对样品的损伤仍需观察,但它确实打通了从“看不清”到“看得见”的关键一步。当高质量的结构数据源源不断输入给AI,分子生物学可能会迎来类似GPT时代的爆发。
这个 skill 能把任何主题写成分章 Markdown 教学书。流程固定,先出目录确认风格,再按“开篇除恐、白话化、直觉先行、贴身例子、短收尾”五段推进,最后补结语。写完还能一键转 PDF。
支持 Claude、Codex 等工具直接调用,适合老师、培训师、内容创作者把专业知识做成友好教材。
很多人抱怨用AI写代码太贵,甚至有人月烧两千美元。这其实不是AI定价问题,而是“用脑”姿势不对。那些疯狂超额的人,大多是在搞“氛围感编程”——让Agent在不写Spec的情况下盲目跑循环。
真正聪明的开发者在用“混合套利”:用Claude等顶级订阅写高精度设计文档和Spec,这是最贵的“脑力”;把具体的机械实现交给DeepSeek V4 Flash这种极便宜、带Prompt Caching的API。
硬件自部署折旧快,全靠订阅又易撞墙。把AI当成执行工具而非思考替代品,用Spec驱动开发,你就能用极低成本撬动以前一个团队的工作量。
退还数百万美元:一家AI基础设施先驱的体面死亡
融资730万美元的开源LLMOps平台TensorZero宣布关闭,并向投资人退还余款。创始人坦言,开源商业化需要经历两次PMF:先让开源社区买单,再让商业客户掏钱。在技术日新月异的AI时代,这个双重跨越的容错率极低。
这件事揭示了AI开发者工具的残酷现状:你以为的安全牌“基础设施”,正在变成最危险的流沙。由于模型层API和功能迭代太快,创业公司做出来的抽象层,很容易被OpenAI或Anthropic的新版本直接吞噬。
更深层的范式转移在于,AI Agent的崛起改变了“买还是造”的决策。以前企业需要买第三方工具,现在工程师花几个小时用Agent就能手搓一个完美契合自身业务的专属工具。通用型中间件的生存空间被严重挤压。体面离场,是创始人极其清醒的战略选择。
融资730万美元的开源LLMOps平台TensorZero宣布关闭,并向投资人退还余款。创始人坦言,开源商业化需要经历两次PMF:先让开源社区买单,再让商业客户掏钱。在技术日新月异的AI时代,这个双重跨越的容错率极低。
这件事揭示了AI开发者工具的残酷现状:你以为的安全牌“基础设施”,正在变成最危险的流沙。由于模型层API和功能迭代太快,创业公司做出来的抽象层,很容易被OpenAI或Anthropic的新版本直接吞噬。
更深层的范式转移在于,AI Agent的崛起改变了“买还是造”的决策。以前企业需要买第三方工具,现在工程师花几个小时用Agent就能手搓一个完美契合自身业务的专属工具。通用型中间件的生存空间被严重挤压。体面离场,是创始人极其清醒的战略选择。
用最强AI模型花20欧元、45分钟“一键生成”一个两千行的牧羊犬游戏,听上去像魔法,但评论区一针见血:这不过是把训练集里早有的开源代码重新缝合。
真正的技术分水岭不在于“一键生成”的惊艳Demo,而在于后续的维护与迭代。单次生成能帮你达到95%的及格线,但剩下的5%——修复移动端适配、优化寻路算法——才是决定产品生死的关键。如果人类没有清晰的架构设计,AI很快就会在无休止的Token消耗中陷入逻辑死循环。
AI没有剥夺编程的乐趣,它只是重塑了分工。写代码成了最廉价的体力活,而定义产品边界、设计“意图模型”(Intent Model)并约束AI输出,成了新的核心竞争力。你不再是搬砖的码农,而是指挥AI军团的架构师。
很多人以为用 Claude Code 等工具写代码,痛点在 AI 能不能写对。其实真正用深了的人才知道,瓶颈早已转移。
有开发者分享了用 Claude 彻底重构工作流的经历:他把 AI 扔进 EC2 隔离,用 GitHub Issues 做看板,让 AI 自动领任务、写方案、敲代码,自己只在关键节点审批。
这听起来很爽,但硬币的另一面是:体力活消失了,脑力负荷却爆表了。以前是没时间写,现在是没时间审。面对 AI 一夜之间生成的大量代码,做 Code Review 成了最折磨人的瓶颈。
软件开发不是拼积木,而是复杂的权衡。AI 擅长单文件实现,但缺乏全局架构视角,极易导致架构漂移和过度 Mock 的低质测试。
所以,别指望把思考外包给 AI。它提高了代码产出速度,但没有提高平均质量。未来的关键,是如何建立自动化的架构质量度量和更严苛的 QA 体系。