PPT-Design-Prompt 把品牌设计规范直接转换成演示幻灯片图片提示,一键生成AI适用的DESIGN.md文件。| #工具
它能批量转换品牌设计文档,提供通用演示图片设计指南,支持PowerPoint、Keynote、PDF等幻灯片制作。
主要功能:
- 将网页/UI品牌指南转换为演示图片专用DESIGN.md提示;
- Python CLI工具,支持本地批量转换品牌设计文件;
- 生成适用于AI图像模型的幻灯片资产提示库;
- 包含通用演示设计规范和合成示例,便于上手测试;
- 输出结构化目录,支持PowerPoint/Keynote/PDF幻灯片制作;
- 转换清单管理,确保品牌来源可追溯。
支持 pip 安装本地运行,适合设计师、演讲者和内容创作者使用。
Feynman 把AI研究全流程整合到一起,提供开源AI研究代理解决方案。
不仅支持论文搜索、智能多代理深度研究,还能文献综述、实验复现、代码审计,甚至自动生成带引用的研究报告。| #工具 #论文
主要功能:
- 多代理研究系统,自动调度Researcher、Reviewer、Writer、Verifier代理;
- 论文搜索与分析(AlphaXiv),支持Q&A、代码阅读和批注;
- 深度研究/lit审阅,支持多源证据收集、共识分析和开放问题总结;
- 实验复现/replicate,可本地或云GPU(Modal/RunPod)运行;
- 代码审计/audit,对比论文声明与代码库一致性;
- Web搜索、会话记忆、输出预览与导出(浏览器/PDF)。
支持 macOS/Linux/Windows,通过一键安装脚本快速部署,也可 pnpm/bun 本地运行,适合AI研究者和开发者使用。
编程开发层面,他同时使用Claude Code、KIWI K2.5和Codex处理不同类型的编码任务,Cursor负责调试,Lovable专攻网页原型,Vibecode则用于移动端应用开发。他提到自己手上有二三十个实验性App在排队等着做,这种产出效率在过去是不可想象的。
视觉内容生产线同样丰富:Midjourney负责病毒式传播的图像风格,Grok和Nano Banana Pro作为图像生成的补充选项,Topaz Bloom处理图像放大。视频方面,Veo 3.1、Kling、Grok三管齐下,Topaz Astra负责视频增强。更有意思的是3D领域,Meshy AI可以把图片转成3D模型,DeepMind的Genie则用于构建3D世界。
内容运营工具也相当完整:HeyGen和Higgsfield用于AI虚拟人,Opus Clip做病毒式剪辑,Veed处理字幕,CapCut快速剪辑,ElevenLabs生成语音,Suno生成音乐。
有人问他每月在这些工具上花多少钱,他的回答很有意思:太多了,所以2026年的计划是用自己开发的App替换掉其中一部分。这其实揭示了一个趋势,当AI编程能力足够强,很多垂直SaaS的护城河会被个人开发者逐渐瓦解。
另一条评论也很犀利:这么大的工具栈不是竞争优势,而是订阅噩梦,真正的护城河是你独特的创意品味,不是你租用的工具。他的回应是:谁说我每个月都在为这些付费?
这句话点出了一个容易被忽视的事实。工具的价值不在于拥有多少,而在于你能用它们产出什么。当被问到日常最常用什么时,他的答案是自己用代码构建的内部工具和应用。
掌握AI的方式只有一种,就是把所有工具都用一遍。这话听起来偏执,但在技术剧变期,广泛尝试本身就是一种学习策略。
hyprwhspr:Arch Linux 上的原生语音转文字工具 | #工具
用语音输入文字这件事,在 Linux 桌面上一直不太顺手。要么依赖云端服务有延迟,要么本地方案配置繁琐,Wayland 环境下更是各种兼容问题。
hyprwhspr 是一个专为 Arch Linux 和 Hyprland 打造的语音转文字工具,按下快捷键说话,松开后文字直接出现在光标位置,整个过程在本地完成。
项目默认使用 Whisper 模型实现离线识别,也支持最新的 Parakeet-v3 模型,有 NVIDIA 或 AMD 显卡还能启用 GPU 加速。除了本地模型,同样支持 OpenAI、Groq 等云端 API,甚至可以接入任意自定义后端。
主要特性:
- 通过 AUR 一键安装,交互式配置向导自动完成设置;
- 支持切换、按住说话、自动检测三种录音模式;
- 可视化录音状态指示器,自动匹配 Omarchy 主题配色;
- 内置词语替换功能,可自定义专业术语和标点符号转换;
- Waybar 托盘集成,实时显示服务状态;
- 支持多语言识别,可指定语言或自动检测。
安装后运行 hyprwhspr setup 即可完成配置,默认快捷键 Super+Alt+D 触发录音,文字自动粘贴到当前活动窗口。
用语音输入文字这件事,在 Linux 桌面上一直不太顺手。要么依赖云端服务有延迟,要么本地方案配置繁琐,Wayland 环境下更是各种兼容问题。
hyprwhspr 是一个专为 Arch Linux 和 Hyprland 打造的语音转文字工具,按下快捷键说话,松开后文字直接出现在光标位置,整个过程在本地完成。
项目默认使用 Whisper 模型实现离线识别,也支持最新的 Parakeet-v3 模型,有 NVIDIA 或 AMD 显卡还能启用 GPU 加速。除了本地模型,同样支持 OpenAI、Groq 等云端 API,甚至可以接入任意自定义后端。
主要特性:
- 通过 AUR 一键安装,交互式配置向导自动完成设置;
- 支持切换、按住说话、自动检测三种录音模式;
- 可视化录音状态指示器,自动匹配 Omarchy 主题配色;
- 内置词语替换功能,可自定义专业术语和标点符号转换;
- Waybar 托盘集成,实时显示服务状态;
- 支持多语言识别,可指定语言或自动检测。
安装后运行 hyprwhspr setup 即可完成配置,默认快捷键 Super+Alt+D 触发录音,文字自动粘贴到当前活动窗口。