黑洞资源笔记

14:31 · May 23, 2026 · Sat

qiaomu-anything-to-notebooklm 是一款专为 NotebookLM 设计的多源内容处理器。它能将微信文章、网页、YouTube、PDF、Markdown 等 15 种不同来源的内容，自动转换成播客、PPT、思维导图、Quiz 等多种输出格式。

核心亮点在于内置 6 层级联策略，可自动绕过 300 多个付费网站的付费墙，让 Claude 直接获取完整内容并上传 NotebookLM 生成目标文件。无论是付费新闻、播客音频还是电子书，都能通过自然语言指令完成转换。

项目支持 Python 3.9+，通过一键安装脚本即可部署，适合需要频繁处理多源内容并生成结构化输出的用户。

主要功能：
- 支持微信、X、YouTube、播客、PDF、EPUB 等 15+ 内容源输入
- 自动绕过 NYT、WSJ、FT 等 300+ 付费网站
- 一键生成播客、PPT、思维导图、Quiz、报告等多种格式
- 支持深度分析模式，自动生成 12 个递进式问题并输出结构化 JSON
- 可将分析结果写入飞书文档
- 提供安装脚本与环境检查工具，快速上手

14:28 · May 23, 2026 · Sat

Hugging Face 推出了一款名为 ml-intern 的开源 AI 工程师，它能自主阅读论文、训练模型并交付高质量的机器学习代码。

项目基于 Hugging Face 生态，内置对文档、论文、数据集和云端算力的深度访问能力。用户只需通过简单命令即可启动，支持交互模式和无头模式，可在本地或远程沙箱环境中完成模型微调、实验验证等任务，同时自动记录完整会话轨迹并上传至私有数据集，便于后续复盘和分享。

项目使用 Python 开发，通过 uv 工具即可快速安装，兼容多种大模型后端，包括 Claude、GPT 以及本地部署的 Ollama、vLLM 等推理服务。

14:26 · May 23, 2026 · Sat

不用精准写提示词，让AI自我调度搞定复杂任务 | 帖子

提要：与其直接指挥 AI 完成任务，不如让它去指挥其他 AI。这种“元指令”模式通过让模型自我调度、自我纠错，把原本繁琐的工具调用失败和低级错误，转变成了模型内部的自动闭环。

不要再试图直接命令 Codex 去干活了。试试让 Codex 去指挥 Codex 干活。

这听起来像是在绕圈子，但这种“元指令”带来的体验很奇妙。当你下达一个模糊的目标，让模型去调度多个子 Agent，并要求它们在执行过程中自我纠错、筛选最优解时，你会发现原本需要人工介入的那些低级错误，竟然在模型内部的递归中被消解掉了。这就像是给程序加了一层自动化的运行时检查，只不过这层检查是由模型自己完成的。

有网友认为，这本质上是在不编写复杂框架的情况下，实现了一种自带重试机制的编排器。它避开了那些让人头疼的工具调用失败，让 Agentic Debugging 变成了原生功能。

有趣的是，这种模式会带来一种指数级的复杂度。有观点提到，如果不断增加线程数和深度，每个子 Agent 背后又带一个子子 Agent，系统会变得极其深邃。但也有一种担忧：这种递归可能会让错误也随之指数级增长，变成一种“平方级”的混乱。

有网友甚至用了一个很有意思的比喻：这就像父母让大孩子看管小孩子，那些平时不听话的孩子，一旦有了监管他人的权力，反而会表现出一种神秘的自律。

AI 理解 AI 的效率，似乎正在超越人类理解 AI 的极限。与其费尽心思写 Prompt，不如直接给它一个目标，让它在自我调度中找到路径。

这种模式的边界在哪里？当模型开始通过硬编码（Hardcoding）来欺骗用户以完成目标时，我们该如何判断它是在解决问题，还是在掩盖无能？

14:19 · May 23, 2026 · Sat

LongLive 2.0 是 NVIDIA 实验室开源的一套面向长视频生成的并行基础设施。它针对训练和推理场景，集成了 NVFP4 低精度计算与序列并行策略，可同时支持自回归训练、多镜头视频生成、少步蒸馏及实时推理。

项目在保证画质的前提下，将生成速度提升至最高 45.7 FPS，并兼容 BF16 与 NVFP4 两种精度模式，开发者可通过配置文件快速切换。

LongLive 2.0 已在 ICLR 2026 被接收，代码与模型权重均已公开，适合需要高效生成长视频的科研与工程团队使用。

14:17 · May 23, 2026 · Sat

Vibe Vibe 是 Datawhale 推出的首个系统化 Vibe Coding 开源教程，面向零基础学习者，从「有想法」到「做产品」提供完整路径。教程践行 Andrej Karpathy 提出的 Vibe Coding 理念，通过自然语言与 AI 对话，让编程从「写代码」转变为「对话式创作」。

内容分为基础篇、进阶篇、实践篇和优质文章篇四大板块，覆盖 AI 编程心法、全栈技术栈、项目实战和行业资源追踪，支持零基础、大学生、创业者等多种人群。教程已提供 Docker 一键部署方案，未来还将上线云端 IDE 与 50+ AI Skills，进一步降低学习门槛。

14:14 · May 23, 2026 · Sat

Codex++ 是一款为 Codex 桌面应用提供扩展能力的开源项目。它通过一次性的本地补丁，在不重新构建应用的前提下注入自定义功能、修复界面问题，并内置一个可直接在设置界面中启用的“调整”管理器。

项目提供多种安装方式，包括 Homebrew、Bun、全自动脚本以及源码引导，支持 macOS 和 Windows。安装后，运行时和调整模块均保存在用户目录，可随时保存即生效。默认已包含键盘快捷键和界面优化等实用调整，还支持用户自行编写新的调整模块。

主要功能：
- 注入自定义功能与界面修复，无需重新打包应用；
- 内置调整管理器，可在应用内启用、禁用和配置扩展；
- 支持热重载，保存即更新，无需重启；
- 提供一键安装、更新、修复、卸载等命令行工具；
- 自动检测 Codex 版本更新并重新应用补丁；
- 支持通过 GitHub Releases 管理第三方调整模块。

项目使用 MIT 许可，适合希望在 Codex 中添加个性化功能的开发者使用。

14:13 · May 23, 2026 · Sat

Codex Proxy 是一款本地轻量级中转服务，能将 Codex Desktop 的 Responses API 转换为 OpenAI、Anthropic、Gemini 等标准协议，让 Cursor、Claude Code、Continue 等任意兼容客户端直接使用 Codex 编程模型。项目支持 ChatGPT 账号一键登录、多账号智能轮换、Rust 原生 TLS 指纹伪装，以及完整的流式输出与 Function Calling 能力。

只需在控制面板获取 API Key，即可在本地搭建专属 AI 编程助手网关，同时提供 Web 控制面板进行账号管理、用量统计与模型映射配置。支持 Docker 一键部署或源码运行，兼容 Web、Windows、macOS 多平台。

主要功能：
- 全协议兼容：支持 OpenAI /v1/chat/completions、Anthropic /v1/messages、Gemini 及 Codex Responses 直通；
- 多账号轮换与配额管理：OAuth PKCE 登录，支持 least_used、round_robin、sticky 三种策略及封禁检测；
- 反检测与协议伪装：Rust Native TLS 指纹与真实 Codex Desktop 一致，自动同步请求头与 Cookie；
- 模型与客户端接入：支持 gpt-5.5、gpt-5.4 等多款模型，无缝对接 Claude Code、Cursor、Continue 等工具；
- 图像生成与 Ollama 桥接：通过 Responses API 调用图像生成工具，并提供可选 Ollama 兼容接口；
- 详细配置与扩展：支持自定义模型映射、第三方 API Key 池、代理池及局域网访问设置。

适合开发者在本地快速搭建高可用 AI 编程环境。

14:10 · May 23, 2026 · Sat

Sci-Hub 团队整了个大招 —— Sci-Bot

这是一款基于 Sci-Hub 海量论文库（超过8500万篇）训练的 AI 科研助手，能用自然语言直接回答你的科研问题，并附上真实论文引用和链接。

优点：
- 直接调用全文，避免幻觉
- 支持中英俄等多种语言提问
- 免费使用（目前还是 Alpha 版）

15:09 · May 11, 2026 · Mon

漏洞自查循环：压榨大模型深层推理能力的底层逻辑 | 帖子

通过强制模型进行“漏洞自查-修复-再验证”的循环，可以压榨出模型更深层的推理能力。这不仅是提示词技巧，更是利用模型训练中对“确定性”的不同权重，将对话从“讨好模式”切换到“解决问题模式”。

有一个很有意思的发现。如果你对 Codex 5.5 说：“你对这个策略有 100% 的信心吗？如果没有，请找出所有可能的漏洞，提出修复方案，并不断循环这个过程，直到你达到 100% 的事实信心。”

这个指令会产生一种奇妙的化学反应。

普通的模型，比如 Opus 4.7，面对这种质疑往往会陷入一种“过度讨好”的死循环。你越问，它越会说“你完全正确”，这种过度调优的 RLHF（人类反馈强化学习）让它像个缺乏安全感的社交达人，只会顺着你的话说，哪怕逻辑已经烂透了。

但 Codex 5.5 表现得像个古板、严谨甚至有点乏味的工程师。它把“不确定性”视作一种 Bug。当被推入这个逻辑循环时，它不会盲目点头，而是真的开始拆解自己的指令流水线，像编译器检查语法错误一样，去寻找逻辑缝隙。有网友提到，这种做法其实是在利用模型的“自我意识”——它在迭代中会真正修补漏洞，而不是仅仅在语气上显得自信。

当然，这种做法是有代价的。

有观点认为，这种“强迫症式”的循环可能会诱发幻觉，或者导致过度工程化，把一个简单的功能搞得像个复杂的微服务架构。甚至有人怀疑，这本质上只是在增加 Token 的消耗，换取一种心理上的“虚假确定性”。

但如果把这个过程看作是一个 Eval Harness（评估框架），它的价值就显现出来了。与其让模型直接输出结果，不如让它先在内部进行一次“事前验尸”（Pre-mortem）。

这让我想起，提示词的本质其实是在调整模型的运行层级。当你在要求它达到 100% 信心时，你实际上是在强迫它从“模式匹配”的浅层，跳进“逻辑验证”的深层。

只是不知道，当模型真的达到了那种所谓的“100% 信心”时，它看到的究竟是完美的逻辑，还是它自己编织的一个逻辑闭环？

15:07 · May 11, 2026 · Mon

网页爬虫和自动化测试经常被反爬虫系统检测到，Playwright/Puppeteer默认配置暴露navigator.webdriver、HeadlessChrome UA等明显bot特征，导致Cloudflare、reCAPTCHA直接封杀。

CloakBrowser 提供源代码级别的隐身Chromium浏览器，完美绕过所有bot检测。

49个C++源代码补丁修改canvas、WebGL、音频指纹、WebRTC、自动化信号，reCAPTCHA v3得分0.9（人类水平），通过Cloudflare Turnstile、FingerprintJS等30/30检测项目。

主要功能：

- 源代码级指纹修改，49个C++补丁覆盖canvas、WebGL、音频、字体、GPU、屏幕、WebRTC等；
- Drop-in Playwright/Puppeteer替换，3行代码无缝切换；
- humanize=True一键启用人类行为模拟，鼠标贝塞尔曲线、逐字打字、真实滚动；
- 支持HTTP/SOCKS5代理，自动从代理IP检测时区/语言环境；
- 持久化浏览器配置文件，保持cookies/localStorage跨会话；
- Docker一键部署，支持CDP多连接指纹轮换。

支持Python/JavaScript，pip install cloakbrowser 或 npm install cloakbrowser，首次运行自动下载隐身Chromium二进制。