黑洞资源笔记

06:52 · Dec 9, 2025 · Tue

Google发布了一份关于多智能体系统上下文工程的权威指南，提出了高效管理上下文的全新思路。核心在于用“工作上下文”、“会话”、“记忆”和“工件”四层结构替代传统庞大的提示语，有效降低了信息冗余和模型幻觉。| #指南

每次调用时，系统通过有序流程和处理器，从指令、精选会话事件、记忆结果和工件引用重建工作上下文。会话日志经过噪声过滤和格式化，变为清晰的聊天历史输入模型请求。

通过上下文压缩、过滤和缓存，旧信息被总结，没用事件被丢弃，稳定的前缀得以复用。大体量信息转为工件存储，长期知识保存在记忆中，记忆服务仅提取相关片段注入窗口，极大节省了Token消耗。

多智能体系统中，代理作为工具协同工作，子代理只访问所需上下文，防止幻觉和错误行为，保证效率和准确性。Google强调，将上下文工程视为与存储和计算同等重要的基础设施，而非简单的提示堆砌，是构建大规模多智能体系统的关键。

这套方法不仅能减少60%-80%的Token使用，还能显著提升多代理系统的稳定性和响应速度，真正推动生产级AI系统的落地。

指南

06:48 · Dec 9, 2025 · Tue

在OpenAI的研究科学家面试中，遇到“如何将大语言模型（LLM）的上下文长度从2K扩展到128K？”这个问题时，直接说“我会用128K上下文的长文档微调模型”是远远不够的。真正的挑战远超简单微调。| 帖子

扩展上下文长度意味着面对注意力机制的平方级计算复杂度：上下文长度扩大8倍，内存需求飙升64倍。这是硬件和算法上的巨大难题。

解决方案主要有三条路：

1. 稀疏注意力（Sparse Attention）
限制模型只关注部分重要token，比如局部邻近或由模型自动学习关键token。就像读书时理解当前章节比时时关注全书更高效，但偶尔回顾全局脉络依然必要。稀疏注意力在性能和计算成本间权衡，既提高效率又保留关键信息。

2. Flash Attention
这是一种硬件优化技术，利用GPU内部快速缓存减少数据在高速缓存（SRAM）和慢速主存（HBM）间的冗余传输，保持全局注意力的精确度，同时加速计算，速度提升可达7倍以上。

3. DeepSeek Sparse Attention（DSA）
DeepSeek V3.2模型引入的DSA，通过轻量级索引器筛选重要token，把计算复杂度从O(L²)降到O(Lk)，k为固定小值。比如128K上下文中，每次只计算约2048个关键token，大幅降低计算和成本，同时保持甚至提升性能。

实际效果是，128K上下文的预填充成本降低近一半，解码成本下降三分之二，且在长上下文评测中表现更优。

这背后折射出一个核心真理：扩展上下文不仅是“加长输入”，而是对模型架构、硬件资源、内存管理和算法设计的综合考量。简单的微调无法解决根本问题，必须结合稀疏机制、硬件优化与智能索引等多维创新。

正如一位专家所说，“128K上下文是几何问题也是计算问题”，需要局部高分辨率注意力结合稀疏全局结构，利用多尺度位置编码，构建层次化的上下文理解，而非简单平铺展开。

总结：想做出128K上下文的LLM，靠蛮力不行，必须用“少而精”的策略，善用硬件优势，设计高效稀疏机制，才能在保持性能的同时控制资源和成本。

06:45 · Dec 9, 2025 · Tue

构建和探索知识图谱从未如此直观。| #知识图谱

GraphRAG Workbench 是一个基于微软 GraphRAG 框架的现代化交互式 Web 应用，支持将文档转化为沉浸式的3D知识图谱。

你可以在三维空间中实时浏览实体、关系和社区结构，利用智能节点大小、颜色分区和动态过滤，轻松发现数据背后的隐藏联系。

功能亮点包括：
- 支持PDF批量上传与自动文本提取，文档管理高效便捷；
- 3D可视化界面支持平滑动画和多层社区检测，结构一目了然；
- AI驱动的实体提取与关系映射，结合自然语言聊天接口，实现智能查询和分析；
- 支持多种搜索模式和社区聚焦，帮助深入挖掘复杂图谱信息；
- 课堂级别的进度跟踪与日志记录，方便管理知识图谱版本和历史。

项目基于 Next.js 和 React Three Fiber，界面响应式设计，适合桌面和平板设备。只需配置 OpenAI API，即可快速启动本地服务，适合科研、教育及企业数据分析使用。

知识图谱

06:40 · Dec 9, 2025 · Tue

NeurIPS 2025汇聚了机器学习与神经计算领域的前沿突破，这里为你精炼总结15篇优秀论文，涵盖获奖佳作与热门话题，助你快速抓住核心洞见。| 帖子 | #机器学习

1. 【Faster R-CNN：实时目标检测新里程碑】
引入区域提议网络（RPN），共享卷积特征实现近乎无额外计算的候选框生成，助力Fast R-CNN以5fps速度高效检测，荣获Test of Time奖。

2. 【人工蜂群效应：语言模型的同质化困境】
发布大规模开放式提示集Infinity-Chat，揭示LLM生成答案高度趋同的“人工蜂群”现象，深入分析输出多样性崩塌及人类偏好差异。

3. 【转导在线学习的最优错误界限】
解决30年悬案，精确量化未标记数据在在线学习中的价值，建立转导学习对比传统方法的平方级优势，理论与实践紧密匹配。

4. 【大语言模型的门控注意力机制】
首次系统探究门控对软max注意力的影响，简单的头部Sigmoid门控显著提升性能与训练稳定性，缓解注意力汇聚问题，增强长上下文能力。

5. 【叠加效应驱动稳健神经网络扩展】
通过控制叠加现象，揭示“模型越大损失越低”的神经扩展律根源，验证开源LLM及Chinchilla规模律的广泛适用性，揭示规模律何时失效。

6. 【扩散模型为何不陷入记忆过拟合】
发现训练中存在早期泛化与后期记忆两个时间尺度，数据集越大泛化窗口越宽，隐含动态正则化机制帮助避免过拟合。

7. 【强化学习是否真正激发LLM推理能力？】
批判性分析RLVR训练，指出其提升的是采样效率而非根本推理能力，模型推理边界受限于基础模型，强调需创新RL范式以释放潜力。

8. 【千层网络助力自监督强化学习】
将RL网络深度扩展至1024层，在无奖励无示范的目标驱动任务中，实现性能翻倍至50倍的飞跃，行为学习质的改变带来巨大进步。

9. 【Titans + MIRAS：赋予AI长期记忆】
提出Titans架构和MIRAS理论框架，结合深度MLP记忆和“惊讶度”机制，实现运行时动态更新核心记忆，突破百万级上下文规模限制。

10. 【基于扩散蒸馏与对抗校准的生成式数据增强】
DAR-GDA三阶段流水线：蒸馏高效单步生成器，对抗训练校准合成与真实分布差异，重要性重加权消除偏差，提升下游任务表现。

11. 【重尾RNN中的低维混沌渐进转变】
揭示具有脑部特征的重尾权重RNN在混沌边缘的动态不同于高斯权重，延展转变期同时降低系统有效维度，丰富神经动力学理解。

12. 【半监督多模型性能评估】
提出SSME方法，结合标记与未标记数据，通过预测与真实标签关系建模，显著提升数据匮乏时分类器性能估计的准确度。

13. 【黎曼一致性生成模型】
扩展一致性模型至曲率空间，利用指数映射与协变导数实现流形上少步生成，适用于球面、环面与3D旋转等复杂几何结构。

14. 【BioReason：DNA-LLM中的多模态生物推理】
将基因组模型与LLM结合，实现对基因数据的生物学推理，提升路径和变异预测准确率，推动生物信息学与语言模型融合。

15. 【NFL-BA：动态光照下的近场光束调整SLAM】
引入近场光照建模SLAM损失，大幅提升内窥镜及暗室环境下相机定位与地图构建精度，突破动态光照挑战。

机器学习

06:30 · Dec 9, 2025 · Tue

All Agentic Architectures：构建智能AI代理的最佳实践。

这个开源项目实现了17+种先进的代理架构，涵盖从单智能体反思、自我纠错，到多智能体协作和复杂任务分解，助你全面掌握现代AI系统设计。每种架构都配有完整的Jupyter笔记本，带来理论结合实战的学习体验，适合开发者和研究者深入理解并快速上手。

项目基于LangChain和LangGraph，支持多阶段、状态化、循环执行的智能代理开发，涵盖代码生成、实时工具调用、任务规划、记忆管理等丰富功能。配套有严格的性能评估机制，确保AI代理的实用性和可靠性。

主要特点：

- 17+架构实现，涵盖反思、工具调用、规划、多智能体系统等前沿设计
- 每个架构均有完整运行示例，方便学习与复现
- 结合LLM评判机制，量化智能体表现，提升系统质量
- 支持从基础到复杂系统的循序渐进学习路径
- 适用金融分析、医疗分诊、软件开发等多领域实际场景
- 基于Python 3.10+，结合最新AI框架LangChain、LangGraph开发

适合AI开发者、研究人员和对智能代理感兴趣的技术爱好者，开启你构建下一代智能系统的旅程。

06:25 · Dec 9, 2025 · Tue

开发AI代码助手时，技能管理总是个难题：市场资源分散，版本控制繁琐，跨代理共享不方便。

OpenSkills 是一个开源的通用技能加载器，完美兼容 Anthropic Claude Code 的skills系统，支持从任何 GitHub 仓库安装技能，统一管理多代理环境下的技能资源。

它提供与 Claude Code 完全一致的技能格式和调用方式，但用命令行界面（CLI）操作，支持渐进式加载，避免一次性占用上下文，且能同步更新 AGENTS.md 文件，实现技能版本管理和共享。

主要特点：

- 100% 兼容 Claude Code 的 <available_skills> XML 格式和 SKILL.md 文件规范
- 支持从 Anthropic 公开仓库及自定义 GitHub 仓库安装技能
- 跨多代理（Claude Code、Cursor、Windsurf、Aider）共用技能库
- 通过 CLI 命令安装、加载、同步和管理技能，操作直观
- 支持全局安装和项目本地安装，满足不同使用场景
- 提供交互式界面，方便选择和管理技能

适合开发者和AI工具构建者统一管理AI代理的技能扩展，提升开发效率和复用能力。

安装示例：

npm i -g openskills
openskills install anthropics/skills
openskills sync

让你的AI助手技能管理更规范、更灵活、更强大。

06:23 · Dec 9, 2025 · Tue

开发者在使用 Claude Code 编写代码时，想要自动保存每次操作的上下文和工具使用情况，方便后续继续工作。

Claude-Mem 是一款为 Claude Code 打造的持久化记忆压缩插件，能抓取工具执行的观察数据，通过 AI 进行语义压缩，并将相关上下文注入到未来的编码会话中。| #插件

它支持跨会话保持上下文连贯，内置智能搜索功能，能用自然语言查询历史操作，极大提升项目管理和代码回溯的效率。插件提供 Web UI 实时查看记忆流，并可配置隐私标签过滤敏感信息。更有实验性的“无限模式”，通过压缩和分层存储实现更长的会话记忆，适合复杂项目的持续开发。

主要功能：
- 自动捕获并压缩会话数据，实现跨会话记忆延续
- 语义搜索工具，快速定位历史决策和代码修改
- Web 界面实时展示记忆流和搜索结果
- 灵活配置隐私控制和上下文注入策略
- 支持实验性无限扩展会话长度的“Endless Mode”
- 基于 SQLite 和向量数据库结合实现高效存储和检索

适用于需要在多次编码会话中保持项目上下文连续的开发者，尤其是使用 Claude Code 进行 AI 辅助编程的用户。

插件

06:20 · Dec 9, 2025 · Tue

在处理文档提取和结构化数据时，常面对接口复杂、异步处理难题以及错误重试等挑战。

LandingAI：Agentic Document Extraction（ADE）Python 库提供了一个高效、灵活的解决方案，封装了 LandingAI 的文档提取 REST API，支持同步与异步调用，具备自动重试、超时管理和安全的 API 密钥处理。

主要功能包括：

- 全类型化 SDK，基于 Pydantic 模型实现响应数据结构化；
- 支持大文档异步作业处理，提升处理效率；
- 内置指数退避重试机制，增强网络请求稳定性；
- 多文件上传支持，灵活处理本地文件及远程链接；
- 可切换 HTTP 后端（httpx 或 aiohttp），满足不同并发需求；
- 简单易用的同步和异步接口，方便集成到各种 Python 项目中。

支持 Python 3.9+，适用于需要高性能文档解析和数据抽取的开发者与企业应用。

安装方式：

pip install landingai-ade

无论是批量处理复杂文档，还是构建智能数据抽取流程，LandingAI ADE Python 库都是非常值得尝试的工具。

06:08 · Dec 9, 2025 · Tue

X平台蓝标认证花8美元毫无意义，维基百科页面却价值300美元且永久存在。但你不能随便“写”维基百科页面，内容会被秒删。| 帖子

这里有个“后门”攻略：

第一步，花300美元请记者在权威媒体（TechCrunch、Forbes等）报道你，利用HARO或冷邮件，媒体需要内容，你需要曝光。

第二步，找到你行业内带有“死链（dead links）”或“需要引用（citation needed）”的维基百科页面，这类页面无处不在。

第三步，修正页面错误，引用你的那篇报道，立刻变成维基百科认可的“可靠来源”。

第四步，凭借已有引用，创建属于你的维基百科页面，系统自然接受你并认定你有可信度。

结果：
- Google知识面板自动生成
- 永久登上谷歌首页
- 任何场合瞬间获得权威背书

成本300美元，价值无可估量。已经帮3个客户做过，成交率翻倍。

“维基百科收录”远比“Instagram曝光”更有说服力。信任是硬通货，维基百科就是信任的象征。

17岁有维基页面，40岁行业大咖却没有。要么你驾驭规则，要么规则驾驭你。

这是一场信息套利，花小钱买大信任，赢得数字时代的无形资产。真名气靠努力，聪明的玩家懂得借力打力。