黑洞资源笔记

15 hours ago

逃离大厂去修柴油机：程序员的尊严保卫战 | blog

一位拥有10年经验、曾效力于暴雪的资深工程师在失业一年后发出的哀鸣，揭开了技术圈最残酷的真相：软件工程正在从“高门槛手艺”加速退化为“廉价大宗商品”。

现在的求职市场已陷入某种病态：HR用AI筛选简历，候选人用LLM作弊应对算法题，公司试图用Token替代初级开发。这种“技术互害”让真正热爱代码的开发者感到幻灭。核心矛盾在于，当生成式AI让逻辑产出的边际成本趋近于零时，程序员传统的“护城河”彻底塌了。

最辛辣的视角来自评论区：一位折腾5年没入行的准程序员，果断转行做了柴油机修理工。结果薪水比入门级SDE高，工作稳定且不内耗，回家反而能纯粹为了兴趣写代码。这撕碎了长久以来的中产幻觉——即“坐办公室写代码”一定优于“蓝领体力活”。

底层逻辑很简单：宏观上，高利率时代终结了互联网的疯狂扩张，开发者从“利润中心”变成了管理层眼中待优化的“成本中心”；微观上，Transformer模糊了平庸代码与优质代码的界限。

如果你还在纠结AI是否会替代自己，可能已经看错了方向。真正的生存之道，要么是成为能利用AI撬动巨大业务价值的超级个体，要么是寻找那些具有物理确定性、AI暂时无法触达的真实领域。当代码不再稀缺，稀缺的就是对复杂现实问题的解决能力，或者那把能拧紧螺丝的扳手。

15 hours ago

“人民的显卡”：中国工程师暴力破解 NVIDIA 的底层逻辑 | 视频

最近大火的“Tesla V100 v4”并非官方新品，而是中国工程师耗时一年，暴力逆向工程 NVIDIA V100 芯片 2963 个引脚信号后的产物。他们将原本只能用于服务器的 SXM 架构芯片，强行“移植”到了半高 PCIe 板卡上，并实现了 8 路 NVLink 互连。

这件事的核心价值不在于算力翻新，而在于对 VRAM 贫困的精准打击。在 LLM 时代，显存就是入场券。32GB HBM2 显存版本仅售 3999 元，这意味着个人开发者能以极低成本搭建起 128GB 甚至 256GB 显存的本地集群。虽然 V100 架构较老，不支持 BF16 和最新的 CUDA 特性，但在运行大参数模型时，NVLink 提供的 300GB/s 带宽远超 PCIe 限制，解决了多卡通信的瓶颈。

这背后的底层逻辑是：当顶层算力被封锁或溢价过高时，民间技术力量会通过压榨旧有硅片的剩余价值，强行抹平商业分级带来的技术鸿沟。这不仅是硬件改造，更是对 AI 生产力工具的一次“平权”。对于预算有限但需要跑大模型的极客来说，这种“缝合怪”是性价比极高的工程奇迹。

16 hours ago

本地大模型调优指南：从跑通到跑爽的进阶地图 | blog

很多人玩本地大模型（Local LLM）还停留在“能跑就行”的阶段，其实通过合理的参数调优，性能翻倍甚至画质/逻辑提升并非难事。这篇指南把繁杂的 llama.cpp 调优逻辑拆解成了普通人也能听懂的硬核干货。

核心逻辑：本地推理的瓶颈不在算力，而在显存（VRAM）和内存带宽。
- 显存是第一生产力：模型能全塞进 VRAM 就绝不留给内存。
- 内存带宽决定生死：对于 MoE 架构（如 DeepSeek），内存频率（XMP/EXPO）直接决定了生成速度，开启 BIOS 里的内存超频可能比换显卡更有用。

深度避坑与实操：
1. 显存分配：使用 --fit on 让系统自动探测并最大化利用显存，但记得留出 512MB 以上的缓冲空间，防止长文本推理时 OOM 崩溃。
2. 缓存量化：通过 -ctk q8_0 压缩 KV Cache，能省下大量显存给模型层，这是低显存跑大模型的“白嫖”神技。
3. CPU 调度：Intel 用户记得用 taskset 屏蔽 E 核（小核），只用 P 核（大核）跑，速度能稳升 20%。
4. 投机采样：MTP 技术是当下的提速王牌，通过一个小模型“预判”大模型的输出，能实现 2 倍以上的生成速度。

调优不是玄学，是在有限的显存池里，平衡模型权重、上下文长度和推理速度的资源博弈。

16 hours ago

别再卷参数了：Sakana Fugu 开启了“模型调度”的新主权时代

Transformer 架构的奠基人之一在东京搞了个大动作：Sakana AI 发布了 Fugu。这玩意儿最聪明的地方在于，它不追求成为那个最强的“单体大脑”，而是要做一个顶级的“指挥官”。

简单来说，Fugu 本身是一个 LLM，但它的工作是根据你的需求，动态调度全球最强的模型池。它把复杂的任务拆解，分发给不同的专家模型，最后汇总输出。在 SWE-Bench 等硬核测试中，这种“群狼战术”跑赢了 GPT-5.5 和 Opus 4.8。

这件事的底层逻辑是：AI 的未来不再是单体巨兽的肉搏，而是协作生态的胜利。更深层的意义在于“AI 主权”——当某个模型因为出口管制或技术封锁无法使用时，Fugu 可以瞬间切换底层模型，让业务不中断。这是一种极具韧性的系统架构。

虽然目前社区对它的计费逻辑（按最高档模型收费）和延迟仍有争议，但它证明了一个趋势：智能的上限不再仅仅取决于单个模型的参数量，而取决于调度、分发和验证的逻辑深度。这标志着 AI 竞争正在从“炼大模型”转向“构建智能系统”。