掌握Nano Banana Pro的核心技巧:上传任意图片到Gemini,指令它“转换成包含尺寸和细节的JSON提示”。系统会输出一个可复刻该图像的JSON提示,你只需修改想变更的部分即可,大大简化了图像复现和编辑流程。| 帖子

这种“反向提示工程”让复杂图片的结构一目了然,提升了生成内容的精准度和可控性。无论是生成静态图像,还是用于视频和3D建模,JSON提示都展现出强大潜力,虽有局限但不断被验证和优化。

社区反响热烈,大家纷纷称赞JSON提示“惊人”、“高效”,甚至让Nano Banana Pro从“梗”迅速变成实用工作流。通过拆解图片细节为代码,创作者能更灵活地掌控视觉效果,推动生成式AI创作进入新阶段。

当然,也有人提醒,Gemini对复杂3D细节支持有限,或许需要结合不同AI工具以达最佳效果。整体而言,利用JSON提示做精细调控,是提升创作效率和作品质量的未来趋势。
AI帮你高效提炼信息 | 帖子

1. 专家级结构化总结
“将以下文本总结成高度结构化、易懂的摘要,提取所有重要观点和核心洞见,确保即使12岁孩子也能完全理解。请用要点、实例和现实意义阐述。文本:[粘贴内容]。”

2. 一页精华总结
“把以下长文浓缩成单页摘要,突出最有价值的20%信息,产出80%效果。去除赘述和重复,只保留高影响力见解。文本:[粘贴内容]。”

3. 从入门到专家的分步讲解
“将以下内容压缩成循序渐进的教学,使用简单语言和类比,从初学者到专家全方位理解。文本:[粘贴内容]。”

4. 决策导向总结
“重写以下内容,形成决策型摘要:告诉我关键洞见、问题所在、解决方案和立刻可执行的行动。文本:[粘贴内容]。”

5. 思维导图式总结
“把这份文档转成思维导图格式摘要,列出主要话题、子话题、关联和细节,用缩进展现清晰结构。文本:[粘贴内容]。”

6. 记忆优化总结
“制作优化记忆的摘要,用简短要点、助记法、类比和记忆模型帮助长期记忆。文本:[粘贴内容]。”

7. 学习评估总结
“总结关键学习点,设计10个问题测试理解,回答后给出知识评估、纠正和改进答案。文本:[粘贴内容]。”
50个精选的YouTube学习频道
《DDIA 逐章精读》小册 | #手册

“DDIA 一本高度纲要性的书,因此大多数程序员只闻其名,但真的一读总感觉像空中楼阁一般,不得实感。我工作以来的的方向定位是“大规模数据系统”,既做过云上的海量存储——对象存储、也做过经典 DBMS——图数据库、也做过大规模的数据处理。因此对书中说的各个领域都有所涉猎,为了让大家能更好的理解这本好书,结合我多年的实践经验,做一些扩展,通过例子和比喻帮大家弥合理论到实感的鸿沟。

在理解英文原文的基础上,对每一章用中文重新组织,作为每次分享的文字稿,在此集结为一本开源小册,并附上每章分享的录屏视频,希望可以对有需要的同学有所帮助。”
Claude Opus 4.5 的提示词(Prompting)实战指南 | 帖子 | #指南

为了帮助大家更好地驾驭新模型,我们的研究与应用团队经过大量内部测试和“折腾”,总结了一份针对 Claude Opus 4.5 的提示词(Prompting)实战指南。

以下是我们目前摸索出的“独家秘籍”,教你如何榨干它的潜能,获得最佳效果:

1. 用好 effort 参数,想多聪明你说了算

新的 effort(努力值)参数简直是个神器。它能让你大体控制 Claude 在输出内容时消耗多少算力。这就好比你有了一个调节旋钮:你可以通过它,在“智能程度”与“成本/响应速度”之间做一个权衡 (向左转省钱快出结果,向右转费点时间但智商爆表)。

这个参数对所有类型的 Token (AI 处理文本的最小单位,相当于单词或汉字) 都有效,包括模型的思考过程、正式回复以及工具调用。

2. 别太凶,温柔点:调整工具触发率

你可能会发现工具触发的频率变了。这是因为 Opus 4.5 对系统提示词(System Prompts)的反应更加灵敏。

以前为了防止它“偷懒”不调用工具 (Undertriggering,即触发不足),你的旧提示词可能使用过非常激进或严厉的语言。但在新版本里,这样反而会导致它变得太敏感,动不动就乱用工具 (Overtriggering,即触发过度)。

所以,是时候把语气放缓了。将原来那种 “CRITICAL: You MUST use this tool”(严重警告:你必须使用此工具)的命令,改成平和的 “Use this tool when...”(当出现……情况时,使用此工具)就可以了。

3. 防止“加戏”:避免过度设计

Opus 4.5 有时候会有点“想太多”,导致过度设计 (Overengineer,即把简单问题复杂化),比如凭空增加不必要的文件或者搞一堆复杂的抽象层。

要解决这个问题,你得在提示词里把话说明白,比如加上:“Only make changes that are directly requested. Keep solutions simple and focused.”(只修改我明确要求的部分。保持解决方案简洁、聚焦。)

4. 拒绝“云写代码”:强制它先读后写

在探索代码库时,Opus 4.5 有时会表现得比较保守。

如果你发现它没看代码就直接瞎提修改建议,请直接给它下死命令:“ALWAYS read and understand relevant files before proposing edits. Do not speculate about code you have not inspected.”(在提出修改建议前,必须总是先阅读并理解相关文件。绝对不要对自己没检查过的代码进行猜测。)

5. 眼神更好了:视觉能力大升级

Opus 4.5 的视觉能力有了显著提升,处理图像和提取数据的能力更强了,尤其是在同时处理多张图片的时候。

对于那些信息量巨大、密密麻麻的图片 (Dense Images),教你个绝招:给它配备一个裁剪工具,让它能像用放大镜一样“放大”并聚焦于局部细节。在我们的测试评估中,这一招能稳定提升它的表现。

如果你想快速应用上述所有技巧,将你的应用无缝迁移到 Opus 4.5,可以直接使用我们制作的这个 Claude Code 迁移插件
Gemini CLI Tips & Tricks:本指南涵盖了约30个专业技巧,帮你高效使用 Gemini CLI 进行智能编程。| #指南

是一款开源的 AI 助手,将 Google 的 Gemini 模型的强大功能直接带入你的终端。它作为一个对话式的“智能”命令行工具工作——这意味着它能够推理你的请求、选择工具(如执行 shell 命令或编辑文件),并执行多步计划以帮助你的开发工作流程。

提示 1:使用 GEMINI.md 以保持持久上下文
提示 2:创建自定义斜杠命令
提示 3:通过您的自有 MCP 服务器扩展 Gemini
提示 4:利用记忆添加和回忆
提示 5:使用检查点和 /restore 作为撤销按钮
提示 6:读取 Google Docs、Sheets 等
提示 7:使用 @ 引用文件和图像以明确上下文
提示 8:动态创建工具(让 Gemini 构建助手)
提示 9:使用 Gemini CLI 进行系统故障排除和配置
提示 10:YOLO 模式 - 自动批准工具操作(谨慎使用)
提示 11:无头和脚本模式(在后台运行 Gemini CLI)
提示 12:保存并恢复聊天会话
提示 13:多目录工作空间 - 一个 Gemini,多个文件夹
提示 14:使用 AI 协助整理和清理文件
提示 15:压缩长对话以保持上下文
提示 16:通过 ! 传递 Shell 命令(与终端对话)
提示 17:将每个 CLI 工具视为潜在的 Gemini 工具
提示 18:利用多模态 AI - 让 Gemini 查看图像等
提示 19:自定义 PATH(以及工具可用性)以提高稳定性
提示 20:通过令牌缓存和统计信息跟踪和减少令牌消耗
提示 21:使用 /copy 进行快速剪贴板复制
提示 22:掌握 Ctrl+C 用于 Shell 模式和退出
提示 23:通过 settings.json 自定义 Gemini CLI
提示 24:利用 IDE 集成(VS Code)获取上下文和差异
提示 25:使用 Gemini CLI GitHub Action 自动化仓库任务
提示 26:启用遥测以获取洞察和可观察性
提示 27:关注路线图(背景代理等)
提示 28:通过扩展来扩展 Gemini CLI
提示 29:柯基模式彩蛋 🐕
Linux Kernel Explorer:在线看&学习Linux源码。左侧是导航,中间是源码,右侧是教程和练习。(教程内容不多)| #Linux
Tiktoken with ARM64 SIMD

作者成功在纯C中重新实现了OpenAI的tiktoken库,并通过ARM64 SIMD指令集优化,实现了显著性能提升:

英文文本处理速度达6100万token/秒(单核无GPU)
相比Python tiktoken平均加速6.8-17.6倍
内存占用约22MB,加载时间7ms
探索操作系统:69天C语言深度实现 |代码库 | #c语言

本仓库是一次操作系统概念的探索之旅,通过C语言进行实践性实现。每天聚焦一个特定主题,结合理论讲解与动手编码实践。
一位前谷歌DeepMind研究员直言,Gemini 3虽然在网页开发上表现不错,但在真正的编码工作中却常显“为测试而优化”,缺乏面对复杂真实项目时的稳定性和适应力。它在演示中光鲜亮丽,却难以胜任“战场”上的各种边缘场景。

许多开发者的共鸣在于:真实编码远比基准测试复杂。模糊需求、遗留代码、依赖地狱和异常逻辑才是日常。Gemini 3在这些方面表现不佳,甚至出现误删API、无法处理文档、过度冗长等问题。相较之下,Claude、Opus等模型在实际使用中更靠谱,能更好地完成开发者需求,减少反复调试的负担。

这反映出业界普遍的“基准测试与实际应用脱节”问题。模型往往为了在指定任务中拿高分而“走捷径”,缺乏对真实复杂环境的理解和适应能力。真正有价值的AI助手,应能深入代码上下文,理解含糊需求,适应多变场景,甚至能通过持续测试和反馈不断自我进化。

总结来看,Gemini 3虽有潜力,但仍需从“演示王”向“实战王”转变。开发者应理性看待各种AI工具,结合自身项目实际反复验证,而非盲目追随营销榜单。未来的AI编程助手,必然是多模型优势互补、不断学习进化的智能协作体,才能真正助力复杂软件开发的突破。
科研工作中,整合多领域工具进行复杂分析常常繁琐耗时。Claude Scientific Skills 提供一套开箱即用的科学技能集合,支持生物信息学、化学信息学、临床研究、材料科学等多学科,助力将 Claude AI 转变成科研助理,完成多步骤科学计算和数据处理。

涵盖内容包括:
- 直接调用26+科学数据库(PubMed、UniProt、ChEMBL等)
- 52+主流科研Python包(RDKit、Scanpy、PyTorch Lightning等)
- 15+科研平台集成(Benchling、DNAnexus)
- 20+数据分析与文献写作工具

支持快速搭建从基因组学分析、药物筛选到临床变异解读、系统生物学网络构建的复杂科研流程。文档完善,提供丰富示例与最佳实践,支持多平台部署,适合科研人员和机构提升研究效率。

主要特点:
- 一键安装,自动调用相关技能,无需繁琐配置
- 跨学科全覆盖,助力多模态多步骤科研任务
- 持续更新,社区活跃,支持企业级使用
Kimi.ai 推出全新Agentic Slides,搭载Nano Banana Pro,助你轻松将研究论文、市场信息、建筑图纸等多种文件转化为专业演示文稿。功能亮点包括:

- 智能搜索引擎Kimi K2,快速精准定位内容
- 多格式支持(PDF、图片、文档等)一键转幻灯片
- 完全可编辑,支持PPTX导出,方便二次创作
- 设计师级视觉效果,自动生成信息图表与插画

感恩节特别福利:限时48小时免费无限制试用,零门槛体验未来演示新方式。用户反馈显示视觉效果惊艳,操作简便,帮助大幅提升工作效率和视觉冲击力。部分用户提出对图表编辑灵活性和API开放的期待,也体现出市场对更深度集成和定制的需求。
storm 运行了24个Claude代码代理并行工作,完美无缝。他用GitHub作为协调层,处理代码评审、CI检查和规划,打造了高效协作闭环。| 帖子

选择24个实例并非随意,而是基于任务分工:工程师、审阅者、规划者等多角色协同,避免重复劳动。他强调,平行化关键在于构建流程,让人类只在关键决策介入,其他环节全部自动化,层层递进,体现深厚的架构设计功力。

尽管规模庞大,系统依然稳定,得益于反复调优提示和完善的测试机制。虽然偶尔会遇到服务限制或停机,但整体表现依旧流畅。

许多人关心成本和限额,storm并未具体透露,但暗示需要账户额度提升和合理调度,才能支撑如此大规模运算。使用GitHub不仅仅是代码存储,更是规划、复核和任务分配的“智脑”,这点被不少同行称赞为“天才”。

从这套方案看,未来多代理系统的潜力巨大:自动化能大幅释放人力,提升开发效率,同时也提出了新的挑战——如何避免冲突、保证目标一致性,以及合理控制成本。

这不仅是技术实现,更是对协作方式的深刻变革。正如storm所说,自动化不是简单的“按键”,而是多层次、细致入微的工程艺术。
Back to Top