黑洞资源笔记

17 hours ago

编程的终局：从写代码到管理复杂度 | 帖子

François Chollet 最近的一番话戳破了程序员的身份焦虑：编程从来不是关于代码，就像音乐不只是乐谱。它本质上是利用“抽象层”来管理复杂度的艺术与科学。

很多人觉得 AI 会取代程序员，这其实是把“记笔记”当成了“写文章”。代码只是逻辑的载体，是目前最底层、最繁琐的表达方式。AI 的介入并不是让编程消失，而是把抽象层再次推高。过去你需要手写排序算法，后来变成了调用库函数，现在变成了用自然语言描述逻辑。

这意味着，人类的判断力、系统架构能力和对问题的拆解能力，反而变得比以往任何时候都更值钱。当代码生成的门槛降为零，真正的护城河就变成了：你是否知道该构建什么，以及如何在大规模复杂系统中保持逻辑的清晰。

底层逻辑很简单：AI 承担了执行层（Compiler），而人类回归到了决策层（Orchestrator）。你不再是那个拉小提琴的人，而是指挥整个乐团的指挥家。虽然乐器变了，但对音准、节奏和整体和谐度的把控，依然是核心竞争力。

17 hours ago

Unlimited OCR 是一款专为长文本与多页文档打造的 OCR 解析引擎，将单次推理的视野从单页扩展到整篇文档，真正实现「一镜到底」的高精度解析。

它既支持单图 gundam/base 双模式推理，也能直接对 PDF 多页进行批量处理，同时提供 Transformers 与 SGLang 两种部署方案，满足从本地快速验证到服务化部署的全流程需求。

主要功能：
- 单图/多页一键解析，支持高达 32k token 的超长输出；
- gundam（局部裁剪）与 base（全局）两种图像模式，兼顾细节与全局一致性；
- 原生支持 PDF 自动切页与多图并行推理；
- 提供 Transformers 与 SGLang 两种推理后端，兼容 OpenAI 风格流式 API；
- 内置 N-gram 重复抑制与自定义 Logit Processor，显著提升长文本连贯性；
- 轻量化依赖，通过 pip/uv 即可在 NVIDIA GPU 上快速启动。

无论你是做学术文献数字化，还是构建企业级文档 pipeline，Unlimited OCR 都能提供稳定高效的解析能力。

17 hours ago

Google员工因开发爆火开源工具被裁：大厂创新的“越界”代价 | 帖子

这件事的起因很具戏剧性：Google开发者关系工程师Justin Poehnelt开发了一个Google Workspace CLI工具，因极度好用在GitHub和Hacker News瞬间爆火。然而，就在Google官方宣布即将推出“正统”CLI的两天后，他被开除了。

这背后的冲突点在于“规则”与“创新”的错位。在Google这种4万亿美金体量的巨头里，官僚体系的首要任务是“确定性”。Justin虽然身处DevRel部门，习惯于开源协作，但他直接在官方GitHub组织下挂上Google Logo发布未获法律和品牌部门最终审计的产品，触碰了大厂最敏感的合规红线。

深层逻辑是，当一个人的“20%时间”跑得比公司正式立项的“100%项目”还快、还好时，他挑战的不仅是流程，更是内部权力的护城河。在AI时代，个人开发者利用Agent能极速交付高质量代码，这让原本臃肿的产研架构显得冗余且尴尬。

这件事给职场人的警示是：在大厂，解决用户痛点只是“正确”，而符合组织意志才是“安全”。当你的个人影响力开始“背刺”公司的组织架构时，再亮眼的GitHub Star也保不住你的工卡。

17 hours ago

AI幻觉破灭：从“无限白嫖”到“Token破产”的硬着陆 | blog

AI圈的“药贩子模式”正在失效。过去一年，大模型厂商靠巨额补贴维持着“首单免费”的假象，诱导企业把业务搬上云端。现在，当OpenAI和Anthropic开始清算，企业才发现自己养出了一个吞金巨兽。

核心逻辑很简单：目前的AI繁荣全靠风险投资买单。OpenAI去年亏损超380亿美元，其中营销费用竟然占了收入的44%。为了IPO给股民一个交代，厂商必须把订阅制转向Token计费。结果就是：某四人团队一个月烧掉11万美元Token，成本远超雇人。

最深刻的洞察在于：AI还没替代人类，先替代了企业的利润。

1. 效率陷阱：写代码快了30%并不等于利润多出30%。如果Token成本是人力成本的数倍，这种“效率”就是财务自杀。

2. 弹性需求：当大模型昂贵时，它并非刚需。很多公司发现，一旦IT部门开始限制高阶模型使用，员工很快就缩回了“够用就好”的开源模型或低端版本。

3. 债务死结：AI行业背负了数千亿美金的硬件债务。要还债，AI必须大规模取代高薪职位（如程序员），但现实是AI目前更像是一个昂贵的实习生，需要高薪熟练工盯着看管。

这场泡沫的本质是：我们正试图用21世纪的算力成本，去换取20世纪的劳动价值，而账本根本对不齐。

17 hours ago

三龙四蛇：中国AI算力的“平行宇宙”正在成型 | 帖子

当外界还在纠结英伟达H20的出口配额时，中国AI算力的底层版图已经完成了“换血”。所谓的“三龙四蛇”——华为、阿里、百度三家大厂，加上沐曦、摩尔线程、壁仞、天数智芯四家新锐，正在构建一个独立于CUDA之外的平行宇宙。

这件事的逻辑不在于简单的“国产替代”，而在于“生态闭环”。这些公司的核心团队大多来自英伟达或AMD，是曾经设计出顶级芯片的原班人马。他们不仅在追赶H100的性能指标，更在重塑生产链：从依赖外部代工转向国内制造。

最深刻的变量在于模型。DeepSeek、Qwen等顶级开源模型正逐渐转向针对国产芯片进行底层优化。这意味着未来好用的开源模型可能天然就适配这些“中国盒子”。当算力和模型开始深度绑定，英伟达的软件护城河就不再是铁板一块。

这不再是制裁下的生存游戏，而是一个拥有独立标准、独立软件栈和独立制造能力的完整系统。未来两年，中国可能从算力进口国转变为算力出口国。

17 hours ago

当大佬建议你别死磕编程时，他们在谈论什么 | 帖子

Telegram创始人Durov和马斯克最近达成共识：比起追逐编程和AI应用，学生更该学好数学和物理。这听起来像是在劝退，其实是顶级玩家对未来人才定价权的预判。

现在的AI已经能高效生成代码，编程的门槛正在从“掌握一种语言”降级为“描述一个需求”。当Transformer模型能处理掉绝大部分重复性编码工作时，剩下的核心差距在于你是否具备拆解复杂问题的能力。这需要极强的逻辑严密性和对世界运行规律的深刻理解。

底层逻辑是：编程只是表达思想的工具，而数学和物理才是产生思想的源泉。如果你不懂第一性原理，你甚至无法给AI下达一个高质量的指令。未来的核心竞争力是“架构能力”，而非“执行能力”。数学训练的是逻辑闭环，物理训练的是对现实世界的建模，这些硬核基础是AI目前最难完全替代的“人类直觉”。

不要被工具的更迭搞得焦虑。AI时代，技术框架的半衰期极短，与其追逐随时会过时的代码语法，不如去死磕那些几百年不变的硬核科学。当所有人都能用AI产出平庸内容时，那个能看透底层逻辑并指挥AI的人，才握有真正的入场券。

05:51 · Jun 14, 2026 · Sun

Claude Fable的“野蛮生长”：是效率神器，还是Token碎纸机？| blog

最近Simon Willison分享了他用Claude Fable（Claude 5）解决一个前端CSS滚动条Bug的经历，引发了全网热议。

这件事的底层逻辑在于Agent的主动性（Proactivity）正在发生质变。面对一个简单的Bug，Fable在没有人类干预的情况下，展现出了令人惊叹的“破局”能力：它自己写HTML测试页面，用Python调用macOS底层API获取窗口ID，用命令行截图，甚至自己写了一个Python CORS服务器来跨域收集浏览器渲染数据，最后通过修改模板注入JS模拟键盘敲击，成功复现并验证了修复方案。

但这正是争议所在。一个资深前端两分钟就能用开发者工具定位并用两行CSS解决的Bug，AI自行折腾了一大圈，烧掉了价值12美元的Token。这种“大炮打蚊子”的行径，有人赞其“不达目的不罢休”，也有人痛批其缺乏常识、极度浪费资源，甚至存在巨大的本地安全隐患。

前沿AI已经从“问答机器”演变为“行动Agent”。它们不缺智商（INT），缺的是判断轻重缓急的“心智/智慧”（WIS）。如何给这些过于主动又不知深浅的AI套上安全沙箱和成本预算缰绳，将是下一步人机协作的关键。

05:50 · Jun 14, 2026 · Sun

Kimi K2.7 Code发布：大模型性价比之战的终局逻辑

月之暗面悄然上线了Kimi K2.7 Code，这个拥有1万亿参数的MoE模型不仅把推理Token消耗砍掉了30%，还在多项编程和Agent指标上直逼GPT-5.5和Claude 4.8。

开发者们的讨论揭示了一个残酷的行业共识：AI编程模型的“智商红利期”正在见顶。一旦模型跨过某个好用阈值，决定胜负的就不再是微弱的性能差距，而是极致的性价比和工程流。

美国顶尖模型虽然在理解模糊意图上依然更聪明，但高昂的Token价格让个人和中小企业难以承受。以Kimi、DeepSeek为代表的中国大模型，正在通过开源权重和极低的缓存Token价格，成为程序员的“平替”首选。

对开发者来说，真正的提效秘诀是“混搭”：用最贵的模型做架构规划，用极便宜的本地或开源模型跑具体代码。AI时代的竞争，拼的已经是工作流设计，而不是单一模型的参数规模。

05:48 · Jun 14, 2026 · Sun

Claude悄悄“降智”背后的信任崩塌 | blog

Anthropic最近因为在Claude Fable中搞“静默降智”被骂到道歉。他们为了防止对手用Claude的数据进行蒸馏（Distillation），悄悄用手段污染输出让模型装傻，波及了大量无辜开发者。

最值得玩味的切入点是，AI巨头过去一直把自己包装成人类安全的守护者，这次却把商业竞争的防线，包装成了防范灾难的安全红线。这种以安全之名、行商业防守之实的做法，彻底砸了信任招牌。

这给行业敲响了警钟：当闭源巨头为了保护护城河开始主动给输出“投毒”，本地部署的开源模型就不再是备选项，而是开发者捍卫技术自主权的唯一退路。

05:47 · Jun 14, 2026 · Sun

AI写代码变烂了？别慌，它正在用“玄学QA”自己打补丁 | blog

AI写代码速度飞快，但屎山率也直线上升。怎么破？Redis作者antirez提出了一个极具启发性的解法：用AI做“非确定性”的智能QA。

以前写测试，程序员最痛苦的是写那些死板的Unit Test，覆盖率拉满，逻辑漏洞照旧。现在，你可以直接给AI Agent扔一个Markdown文档，像指挥一个真人QA工程师一样：“去把最近提交的commit看一遍，重点测分布式推理有没有变慢，顺便测测新功能用起来顺不顺手。”

这是一种升维。AI最擅长处理模糊、复杂的场景。它能像真实用户一样去“体验”软件，做端到端的场景测试（Scenario Testing）。虽然有人质疑这是在把确定性的代码测试变成“黑盒玄学”，但对于并发、分布式、UI等传统测试极难覆盖的死角，AI Agent的“模糊测试”恰恰是性价比最高的防线。

AI制造了低质代码的垃圾洪流，又通过自动化QA筑起了质量堤坝。这很讽刺，但很管用。

05:45 · Jun 14, 2026 · Sun

用AI半小时“榨干”一本书：知识提取的认知新范式 | 帖子

哈佛学生用NotebookLM半小时读完一本书的方法引发了热议。核心逻辑很简单：先用AI提炼核心论点、找出含金量最高的几个章节，再通过模拟对手攻击来测试论点，最后用三句话极度压缩总结。关键提示词：

“本书的核心论旨究竟为何？作者持有哪些违背直觉或非共识的独到见解？在构建起全局逻辑闭环之前，我必须优先掌握哪五个核心概念？”

“哪些章节或段落承载了核心论点？而哪些部分属于辅助性的示例、案例分析，抑或是对已知内容的重复论述？”

“本书遗留了哪些尚未解答的问题？若易位而处，一位挑剔的评论家会如何指陈核心论证的瑕疵？全书的论据链条在何处最为薄弱？”

“如果必须用三句话向一个聪明的 14 岁少年讲透这本书的核心精要，我该如何概括？此外，在读完本书后，作者最希望读者付诸实践的那一个‘核心行动点’又是什么？”

支持者认为，大多数非虚构类书籍有六成是填充物，这种方法是把书当成思想沙袋，主动提取而非被动灌输。反对者则警惕，如果压缩和思考的过程被AI包办，人类大脑就会退化，失去与作者灵魂碰撞的乐趣。

这里的关键在于，AI改变了我们与知识的交互界面。过去我们线性阅读，大脑在迷雾中摸索；现在我们先建立认知骨架，再去填充血肉。AI不是帮你逃避思考，而是帮你过滤噪音，把精力留给最核心的思辨。工具是放大器，如果你只看AI生成的摘要，那是偷懒；如果你用它来做思维对抗，那就是高效。

05:43 · Jun 14, 2026 · Sun

重塑认知：软件架构不是画大图，而是“达成共识” | blog

很多人把软件架构神话了，以为那是象牙塔里的设计师画的高大上UML图。行业泰斗 Martin Fowler 戳破了这个幻象：架构根本没有客观标准，它本质上是“开发团队对系统设计达成的共识”。

为什么架构这么重要？因为糟糕的架构会产生“脏代码（Cruft）”，让后续开发变慢、变贵。我们常觉得高品质意味着高成本，但在软件内聚性上，规律是相反的：高内聚的架构反而能带来更快的交付速度。

架构师的核心能力，不是预测未来，而是识别出当前什么最重要，并决定哪些决策是“一旦做错代价极高、极难修改”的。应用架构关注单体系统的演进，企业架构则是在“集权控制”与“无序混乱”之间寻找平衡。敏捷的本质是去中心化，用最小的协调成本换取最大的开发自由度。

05:41 · Jun 14, 2026 · Sun

drawio-skill 是一款将自然语言描述直接转换成专业 draw.io 流程图的工具，支持 6 种图表类型预设，可实现从代码库到结构图的自动转换，内置 10,000+ 官方图形库和 321 个 AI/LLM 品牌图标。

它提供视觉自检与最多 5 轮迭代优化功能，支持将现有 Python、JS-TS、Go、Rust 项目转为清晰的模块关系图或类继承图，并能导出 PNG、SVG、PDF、JPG 等多种格式。

主要功能：
- 6 种图表预设，包括 ERD、UML 类图、序列图、架构图、ML/DL 模型图和流程图；
- 代码库可视化，自动提取项目结构并生成布局清晰的架构图；
- 官方图形搜索，精准匹配 AWS、Azure、GCP、Kubernetes 等 10,000+ 图标；
- 321 个 AI/LLM 品牌 Logo，专为大模型应用架构图设计；
- 视觉自检与自动修复，最多 5 轮迭代优化；
- 支持自定义样式预设，可从文件或图片中学习并复用视觉风格。

支持与 Claude Code、Cursor、Copilot 等多种 Agent 工具无缝集成，适合架构师、开发者和技术文档撰写者使用。

05:38 · Jun 14, 2026 · Sun

给AI装上“视网膜”：15年磨一剑的冷冻电镜新突破 | blog

冷冻电镜技术（cryo-EM）一直有个致命痛点：对比度太低，导致科学家在细胞里只能看清超大号蛋白质，细节全是马赛克。加州大学伯克利分校和Biohub团队耗时15年，用一束极亮激光做成了“激光相位板”，终于打破了这个物理极限。

这件事的深层价值在于，它解决了AI在生物学领域的“无米之炊”困境。现在的AI预测蛋白质结构很强，但缺乏真实、高分辨率的细胞内原位数据来验证和学习。这个硬件突破等于给AI送去了超清显微镜。

虽然有人质疑“太阳表面光强1亿倍”的宣传话术有些夸张，且高能激光对样品的损伤仍需观察，但它确实打通了从“看不清”到“看得见”的关键一步。当高质量的结构数据源源不断输入给AI，分子生物学可能会迎来类似GPT时代的爆发。

Making the invisible visible – laser phase plate cryo-EM.ts

31.4 MB

05:36 · Jun 14, 2026 · Sun

MiniMax Sparse Attention（MSA）是一套面向 NVIDIA SM100 的高性能注意力内核库，同时提供稠密 FlashAttention 与稀疏 Top-K 注意力实现。项目包含两套可独立运行的编译栈：基于 csrc 的 JIT 内核和基于 CuTe-DSL 的完整稀疏注意力实现，可在同一 Python 包内无缝切换。

MSA 支持密集预填充、分页预填充、稀疏预填充以及解码路径，覆盖 BF16、FP8、NVFP4、FP4 等多种精度，并提供配套的稀疏索引器、代理 KV 选择与 paged FP8 解码封装。所有内核均支持通过 kernels 库一键调用，也可直接 pip 安装后本地运行。

主要特性：
- 同时提供稠密与稀疏注意力内核，适配 SM100 硬件特性；
- 支持代理 KV 选择与 Top-K 稀疏索引，降低长序列计算开销；
- 完整支持 FP8 / NVFP4 / FP4 量化与 paged 解码路径；
- 提供 JIT 编译与 CuTe-DSL 两套运行时，可按需切换；
- 内置全面的正确性测试、回归测试与性能基准脚本。

项目采用 MIT 协议，适合研究机构与大模型推理团队在 SM100 平台上集成使用。

05:35 · Jun 14, 2026 · Sun

X Made Easy Skill 是一个中文写作工具，灵感来自《Calculus Made Easy》。它把复杂主题拆成一本本轻松易读的小书，先帮读者去掉畏难情绪，把术语讲成人话，再慢慢展开直觉和规则。

这个 skill 能把任何主题写成分章 Markdown 教学书。流程固定，先出目录确认风格，再按“开篇除恐、白话化、直觉先行、贴身例子、短收尾”五段推进，最后补结语。写完还能一键转 PDF。

支持 Claude、Codex 等工具直接调用，适合老师、培训师、内容创作者把专业知识做成友好教材。

05:34 · Jun 14, 2026 · Sun

Serenity Skills 是一套面向投资研究的 Codex 技能集合，把市场信息转化为可验证的投研框架。

它包含 serenity-alpha、bayesian-intrinsic-growth-valuation、gf-dma-health-index、tam-adj-peg 和 buy-side-equity-research-memo 五项独立技能，分别覆盖新闻到 alpha 假设的转化、贝叶斯内在增长估值、估值与趋势健康度打分、TAM 调整 PEG 估值，以及完整买方研究备忘录生成。

主要功能：
- serenity-alpha：将市场新闻映射为需求变化，再延伸至财务报表和小盘股弹性，形成可验证的 alpha 假设；
- bayesian-intrinsic-growth-valuation：用贝叶斯方法更新公司 3-5 年内在增长率，并与市场隐含增长及 FOMO 进行对比；
- gf-dma-health-index：综合基本面增速、DMA 趋势、背离、逃逸比率与预期修正，对个股健康度进行评分；
- tam-adj-peg：结合 TAM 跑道与业务质量，调整传统 PEG 估值，区分成长速度与持续性；
- buy-side-equity-research-memo：从 ticker 生成带投资观点、财务分析、估值情景、催化剂与风险的买方研究备忘录。

支持直接复制 skills 文件夹到 Codex 目录，或通过托管服务 app.k2ai.dev 快速使用，适合需要系统化投研框架的投资者与研究者。

Before

After

Home