逃离大厂去修柴油机:程序员的尊严保卫战 | blog

一位拥有10年经验、曾效力于暴雪的资深工程师在失业一年后发出的哀鸣,揭开了技术圈最残酷的真相:软件工程正在从“高门槛手艺”加速退化为“廉价大宗商品”。

现在的求职市场已陷入某种病态:HR用AI筛选简历,候选人用LLM作弊应对算法题,公司试图用Token替代初级开发。这种“技术互害”让真正热爱代码的开发者感到幻灭。核心矛盾在于,当生成式AI让逻辑产出的边际成本趋近于零时,程序员传统的“护城河”彻底塌了。

最辛辣的视角来自评论区:一位折腾5年没入行的准程序员,果断转行做了柴油机修理工。结果薪水比入门级SDE高,工作稳定且不内耗,回家反而能纯粹为了兴趣写代码。这撕碎了长久以来的中产幻觉——即“坐办公室写代码”一定优于“蓝领体力活”。

底层逻辑很简单:宏观上,高利率时代终结了互联网的疯狂扩张,开发者从“利润中心”变成了管理层眼中待优化的“成本中心”;微观上,Transformer模糊了平庸代码与优质代码的界限。

如果你还在纠结AI是否会替代自己,可能已经看错了方向。真正的生存之道,要么是成为能利用AI撬动巨大业务价值的超级个体,要么是寻找那些具有物理确定性、AI暂时无法触达的真实领域。当代码不再稀缺,稀缺的就是对复杂现实问题的解决能力,或者那把能拧紧螺丝的扳手。
“人民的显卡”:中国工程师暴力破解 NVIDIA 的底层逻辑 | 视频

最近大火的“Tesla V100 v4”并非官方新品,而是中国工程师耗时一年,暴力逆向工程 NVIDIA V100 芯片 2963 个引脚信号后的产物。他们将原本只能用于服务器的 SXM 架构芯片,强行“移植”到了半高 PCIe 板卡上,并实现了 8 路 NVLink 互连。

这件事的核心价值不在于算力翻新,而在于对 VRAM 贫困的精准打击。在 LLM 时代,显存就是入场券。32GB HBM2 显存版本仅售 3999 元,这意味着个人开发者能以极低成本搭建起 128GB 甚至 256GB 显存的本地集群。虽然 V100 架构较老,不支持 BF16 和最新的 CUDA 特性,但在运行大参数模型时,NVLink 提供的 300GB/s 带宽远超 PCIe 限制,解决了多卡通信的瓶颈。

这背后的底层逻辑是:当顶层算力被封锁或溢价过高时,民间技术力量会通过压榨旧有硅片的剩余价值,强行抹平商业分级带来的技术鸿沟。这不仅是硬件改造,更是对 AI 生产力工具的一次“平权”。对于预算有限但需要跑大模型的极客来说,这种“缝合怪”是性价比极高的工程奇迹。
本地大模型调优指南:从跑通到跑爽的进阶地图 | blog

很多人玩本地大模型(Local LLM)还停留在“能跑就行”的阶段,其实通过合理的参数调优,性能翻倍甚至画质/逻辑提升并非难事。这篇指南把繁杂的 llama.cpp 调优逻辑拆解成了普通人也能听懂的硬核干货。

核心逻辑:本地推理的瓶颈不在算力,而在显存(VRAM)和内存带宽。
- 显存是第一生产力:模型能全塞进 VRAM 就绝不留给内存。
- 内存带宽决定生死:对于 MoE 架构(如 DeepSeek),内存频率(XMP/EXPO)直接决定了生成速度,开启 BIOS 里的内存超频可能比换显卡更有用。

深度避坑与实操:
1. 显存分配:使用 --fit on 让系统自动探测并最大化利用显存,但记得留出 512MB 以上的缓冲空间,防止长文本推理时 OOM 崩溃。
2. 缓存量化:通过 -ctk q8_0 压缩 KV Cache,能省下大量显存给模型层,这是低显存跑大模型的“白嫖”神技。
3. CPU 调度:Intel 用户记得用 taskset 屏蔽 E 核(小核),只用 P 核(大核)跑,速度能稳升 20%。
4. 投机采样:MTP 技术是当下的提速王牌,通过一个小模型“预判”大模型的输出,能实现 2 倍以上的生成速度。

调优不是玄学,是在有限的显存池里,平衡模型权重、上下文长度和推理速度的资源博弈。
别再卷参数了:Sakana Fugu 开启了“模型调度”的新主权时代

Transformer 架构的奠基人之一在东京搞了个大动作:Sakana AI 发布了 Fugu。这玩意儿最聪明的地方在于,它不追求成为那个最强的“单体大脑”,而是要做一个顶级的“指挥官”。

简单来说,Fugu 本身是一个 LLM,但它的工作是根据你的需求,动态调度全球最强的模型池。它把复杂的任务拆解,分发给不同的专家模型,最后汇总输出。在 SWE-Bench 等硬核测试中,这种“群狼战术”跑赢了 GPT-5.5 和 Opus 4.8。

这件事的底层逻辑是:AI 的未来不再是单体巨兽的肉搏,而是协作生态的胜利。更深层的意义在于“AI 主权”——当某个模型因为出口管制或技术封锁无法使用时,Fugu 可以瞬间切换底层模型,让业务不中断。这是一种极具韧性的系统架构。

虽然目前社区对它的计费逻辑(按最高档模型收费)和延迟仍有争议,但它证明了一个趋势:智能的上限不再仅仅取决于单个模型的参数量,而取决于调度、分发和验证的逻辑深度。这标志着 AI 竞争正在从“炼大模型”转向“构建智能系统”。
Back to Top