新书《Build an AI Agent (From Scratch)》提供完整AI Agent从零构建的实战指南,帮助你一步步打造能推理、规划、执行复杂多步任务的智能代理。
不仅教你实现ReAct循环(Thought→Action→Observation)、MCP工具调用、Agentic RAG,还覆盖记忆模块、多代理系统、代码执行代理等核心功能。
主要内容:
- 实现ReAct推理循环,支持思考-行动-观察闭环;
- MCP协议集成工具调用,提升代理工作流效率;
- Agentic RAG实现相关知识检索和响应优化;
- 构建记忆模块,存储事实、上下文和动态目标;
- 代理规划、反思和自我修正机制;
- 开发专业代理如代码执行代理;
- 设计多代理协作系统。
全Python实现,标准笔记本电脑即可运行,适合AI开发者与从业者。MEAP已100%章节可用,附GitHub源码。
开发AI玩具和语音伴侣设备,常常需要集成多种模型、音频处理和网络通信,硬件兼容性差、部署复杂,调试起来异常麻烦。
ElatoAI 把实时语音AI的全栈功能整合到ESP32上,支持100+模型的端到端语音交互解决方案。
不仅兼容OpenAI Realtime API、Gemini Live、xAI Grok、ElevenLabs和Hume AI EVI,还提供安全WebSocket、边缘函数部署、全球低延迟对话,甚至支持本地LLM和OTA更新。
主要功能:
- 实时语音转语音,支持OpenAI、Gemini、xAI Grok、ElevenLabs、Hume AI等多模型;
- 安全WebSocket和Opus音频压缩,实现<2s全球低延迟对话;
- 自定义AI代理,支持个性化声音、音调调节和工具调用;
- ESP32固件,支持按钮/触摸控制、WiFi配置、OTA更新,无需PSRAM;
- Next.js前端+Supabase后端,提供设备管理和对话历史;
- 边缘部署,支持Deno Edge/Cloudflare Workers,全球20分钟不间断对话。
支持Arduino IDE/PlatformIO开发,Web/移动端控制,适合AI玩具、语音助手和IoT设备开发者。
ElatoAI 把实时语音AI的全栈功能整合到ESP32上,支持100+模型的端到端语音交互解决方案。
不仅兼容OpenAI Realtime API、Gemini Live、xAI Grok、ElevenLabs和Hume AI EVI,还提供安全WebSocket、边缘函数部署、全球低延迟对话,甚至支持本地LLM和OTA更新。
主要功能:
- 实时语音转语音,支持OpenAI、Gemini、xAI Grok、ElevenLabs、Hume AI等多模型;
- 安全WebSocket和Opus音频压缩,实现<2s全球低延迟对话;
- 自定义AI代理,支持个性化声音、音调调节和工具调用;
- ESP32固件,支持按钮/触摸控制、WiFi配置、OTA更新,无需PSRAM;
- Next.js前端+Supabase后端,提供设备管理和对话历史;
- 边缘部署,支持Deno Edge/Cloudflare Workers,全球20分钟不间断对话。
支持Arduino IDE/PlatformIO开发,Web/移动端控制,适合AI玩具、语音助手和IoT设备开发者。
Kami 把优质文档设计标准化,提供一套温暖羊皮纸风格的排版系统,专为精致内容而生。
支持一页纸、长文档、正式信件、作品集、简历和幻灯片,中英文双语,内置架构图、流程图等 SVG 图表,打印友好。
主要功能:
- 六种文档类型:一页纸、长文档、信件、作品集、简历、幻灯片;
- 温暖羊皮纸画布 + 墨蓝单色点缀,serif 正文字体权威感强;
- 中英文智能适配,内置三款 SVG 图表(架构、流程、四象限);
- 排版规则严谨:行高 1.4-1.55、编辑留白、纯暖色调无硬阴影;
- AI 技能集成,支持 Claude/Copilot 等,一句描述自动生成;
- 打印优化,轻量 ZIP 包,支持 Web 和桌面部署。
通过 npx skills add tw93/kami 快速集成,适合报告、简历、演讲等场景,内容值得好纸张。
PPT-Design-Prompt 把品牌设计规范直接转换成演示幻灯片图片提示,一键生成AI适用的DESIGN.md文件。| #工具
它能批量转换品牌设计文档,提供通用演示图片设计指南,支持PowerPoint、Keynote、PDF等幻灯片制作。
主要功能:
- 将网页/UI品牌指南转换为演示图片专用DESIGN.md提示;
- Python CLI工具,支持本地批量转换品牌设计文件;
- 生成适用于AI图像模型的幻灯片资产提示库;
- 包含通用演示设计规范和合成示例,便于上手测试;
- 输出结构化目录,支持PowerPoint/Keynote/PDF幻灯片制作;
- 转换清单管理,确保品牌来源可追溯。
支持 pip 安装本地运行,适合设计师、演讲者和内容创作者使用。
OpenAI Privacy Filter 将PII检测与脱敏完美整合,提供高效、本地运行的隐私保护解决方案。
不仅能双向识别8类隐私标签(姓名、邮箱、电话、地址、日期、URL、账号、密钥),还支持长上下文128k token、浏览器/本地运行、精确召回调节,甚至能针对自定义数据微调优化。
主要功能:
- 双向token分类,支持8类PII(private_person/email/phone等)实时检测与masking;
- 高吞吐量推理,一次前向pass处理整个序列,无需分块,支持128k长上下文;
- 本地CLI工具,一键redact文件/管道,支持GPU/CPU,浏览器直跑;
- 可微调训练,适配企业特定隐私策略和数据分布;
- 多种运行模式:redact、eval、train,输出结构化JSON,Apache 2.0许可商用;
- 约束Viterbi解码,确保span边界连贯,支持precision/recall调节。
支持Web浏览器、Python本地部署,pip install后即用,适合开发团队、数据工程师和隐私合规场景。
Blueprint.am 用 AI 彻底颠覆这一切,提供一站式硬件设计解决方案。
只需用日常英语描述你的项目想法(如“做一个智能无人机”),它就能瞬间生成完整接线图、全套物料清单和一步步组装指南。
主要功能:
- AI 驱动硬件设计,从自然语言描述自动生成专业规格;
- 完整接线图和布线方案,支持复杂项目如无人机原型;
- 详细物料清单(BOM),包含元件推荐、规格对比和采购链接;
- 一步步组装指令,清晰易懂,加速从idea到原型的转化;
- 支持多种硬件场景,从简单遥控器到高级设备原型;
- 即时生成,无需编程或专业知识,适合创客和工程师。
Web 平台即用即走,输入描述秒出结果,大幅缩短硬件开发周期,硬件工程师梦寐以求的神器。