一个设置改变 Claude Code 体验
📝 技术实战
一个设置改变 Claude Code 体验。
Boris Cherny(Claude Code 重度用户)分享了他的头号技巧:开启 auto 模式。不是让 Claude 自动补全,而是允许多个 Claude 实例并行工作 — 一个写代码、一个跑测试、一个查文档,互不阻塞。如果你还在单线程用 Claude Code,今天就切过去试试。(3,826 likes | 201 RTs) 详情 →
GPT-5.5 Pro 变身事实核查员。 Ethan Mollick 发现 GPT-5.5 Pro 在长文本事实核查上表现惊人 — 整章扔进去,它能精准追踪每个关键引用。唯一的毛病是偶尔过度"求全",把明确的事实也标记为"需要进一步确认"。写长文的朋友,多了一个靠谱的校对工具。(1,345 likes | 58 RTs) 详情 →
"帮我省钱"这句 prompt 居然真管用。 听起来像玄学,但确实有效 — 在昂贵的工作流前面加一句要求模型优化成本的提示,token 消耗可以明显下降。原理不复杂:模型会倾向用更简洁的回复、减少不必要的工具调用。预算紧张的团队,试试零成本的成本优化。(1,023 likes | 30 RTs) 详情 →
Codex 自我进化 prompt 升级:现在会挖掘你的历史会话。 @reach_vb 的元提示词迭代到了新版本 — 让 Codex 扫描你的 Sessions、Memories 和 Chronicle,自动识别模式并生成技能和子代理。本质上是让 AI 根据你的使用习惯"训练自己"。Prompt 工程社区正在实时迭代这个方向。(2,216 likes | 168 RTs) 详情 →
Anthropic 公开了内部 Claude Code 工作流。 不是营销材料,是工程团队实际使用的配置:项目上下文文件、自定义命令、hooks、子代理编排,附带对比了默认配置和调优配置的效果差异。免费,比付费课程有用。还没设置 context files 的,照着做一遍。(14 likes | 4 RTs) 详情 →
Claude 开始写图文并茂的家装维修手册了。 Felix Rieseberg 搬进老房子后,让 Claude 根据具体问题生成带插图的维修指南 — 不是泛泛的教程,而是针对他家具体型号和具体故障的操作手册。多模态能力的非代码应用,想象空间比写代码大得多。(220 likes | 6 RTs) 详情 →
💡 行业洞察
黑客开始往热门仓库提交恶意 CLAUDE.md 了。
Socket Security 披露了一种新型供应链攻击:攻击者向流行的 AI Agent 仓库提交 PR,添加恶意的 .cursorrules 和 CLAUDE.md 文件。这些文件看起来像无害的文档,但当开发者用 AI 编码工具打开项目时,恶意指令会被自动注入 Agent 上下文。这是 Agent 时代的依赖混淆攻击 — 你创建的那些让 AI 更好用的配置文件,正在变成最新的攻击面。现在就去检查你的仓库有没有来路不明的配置文件 PR。 (81 likes | 8 RTs) 详情 →
Anthropic 300 亿美元融资,估值突破 9000 亿。
三个月前还是 3750 亿,现在直接 2.4 倍跳到 9000 亿以上 — Anthropic 超越 OpenAI 的 8520 亿,成为全球估值最高的 AI 公司。300 亿美元单轮融资规模史无前例。不管你怎么看泡沫问题,资本市场用真金白银投了票:Claude 路线(安全+能力并重)正在赢。(17 likes | 6 RTs) 详情 →
内存吃掉了 AI 芯片三分之二的成本。 Epoch AI 的最新数据显示,内存在 AI 芯片组件成本中的占比已逼近 67%。这个结构性转变解释了为什么 NVIDIA 的利润结构在变化,也解释了为什么内存高效架构(稀疏注意力、量化、KV cache 优化)不再是"锦上添花"而是"生死攸关"。做基础设施规划的,这个数字必须知道。(266 likes | 283 RTs) 详情 →
六月模型日历:Gemini 3.5、GPT 5.6、Sonnet 4.7。 Bindu Reddy 梳理了六月的预期发布:Gemini 3.5 Pro、GPT 5.6/5.6 Pro、Sonnet 4.7,可能还有 Mythos。如果你的产品绑定了某个模型版本,现在就该规划评测周期 — 六月会非常密集。(388 likes | 8 RTs) 详情 →
YC 公布 2026 夏季 AI 创业方向清单。 当 Y Combinator 公开说"我们想投这些方向"时,创业者和投资人都该看。这份 RFS(Request for Startups)本质上是 YC 对 AI 应用层机会的公开判断 — 既是创业灵感来源,也是竞争情报。(94 likes | 16 RTs) 详情 →
🔧 开发者工具
DeepSeek Reasonix:主打性价比的编码 Agent。 DeepSeek 推出原生编码 Agent,核心卖点是高缓存命中率和低成本 — 直接对标 Claude Code 和 Codex,但在价格上打差异化。如果你的团队对 Agent 使用成本敏感,值得跑个对比测试。(395 likes | 189 RTs) 详情 →
Coral:用一条 SQL 替代所有 MCP 胶水代码。 本地优先的 SQL 运行时,可以统一查询 API、文件和各种数据源。跑分显示比直接接各家 MCP provider 准确率高 20%、成本低一半。如果你正在拼接多个 MCP 数据源,这比手写适配器优雅得多。(159 likes | 15 RTs) 详情 →
🏗️ 值得一试
Obsidian 有了 Agent 技能 — 32K Star 说明一切。
Kepano 为 Obsidian 打造的 Agent 技能包:让 AI Agent 学会使用 Markdown、Bases、JSON Canvas 和 CLI。3.2 万星不是客气的 — 知识管理和 AI Agent 的结合是很多人等了很久的东西。用 Obsidian 做笔记 + 用 AI 编程的,这个项目直接拉满了两者之间的桥梁。(32,853 likes | 2,292 RTs) 详情 →
🧠 发布动态
美团开源 SOTA 级数字人模型,MIT 协议。 美团 的 LongCat-Video-Avatar-1.5 可能是目前最好的开源数字人生成模型 — 关键是 MIT 协议,商用无限制。做数字人、虚拟主播、视频客服的团队,终于有了一个不用担心许可证的 SOTA 级选择。(119 likes) 详情 →
🔬 研究前沿
新论文:你的编码 Agent 在写到一半时会忘记需求。 这篇关于"约束衰减"(Constraint Decay)的论文量化了一个很多人直觉上知道但说不清的问题 — LLM Agent 在复杂后端代码生成过程中会渐进式丢失约束条件。任务越复杂、文件越多,Agent 忘掉早期需求的概率越高。下次让 Agent 做大规模重构前,先读读这篇。(156 likes | 79 RTs) 详情 →
🎓 模型小课堂
约束衰减(Constraint Decay):想象你给同事布置一个复杂任务,列了 15 条要求。他干到第 10 条的时候,前面 3 条已经忘了。LLM Agent 也有同样的问题 — 今天的论文把这个现象叫做"约束衰减"。在多文件代码生成中,Agent 会渐进式地"忘掉"早期设定的约束(比如"所有 API 必须返回分页结果"这种全局规则)。任务链越长,衰减越严重。这直接解释了为什么 Agent 生成的代码经常"局部正确但全局不一致"。应对方法:把关键约束拆成检查点,而不是只在开头说一次。
⚡ 快讯
- 腾讯 Hy-MT2-7B:33 语种翻译模型,质量和效率的甜蜜点,支持自部署。(143 likes | 1.3K downloads) 链接
- Datasette 1.0a30:Simon Willison 的 SQLite 探索神器又更新了,新增 Agent 和 Fixture 插件。 链接
- Ollama + Codex:完全本地化的 AI 编码 Agent,代码不出你的电脑。 链接
- David Ha:AI 不会取代工程师 — 杰文斯悖论意味着更多而非更少的工程师需求。(209 likes | 14 RTs) 链接
- AI 内容的"破绽"越来越明显:Mollick 观察到,随着越来越多人日常使用 AI,辨别 AI 生成内容的能力在快速提升。(388 likes | 21 RTs) 链接
- Armin Ronacher 谈 AI 对开发工具的影响:Flask/Ruff 作者的观点,值得一读。 链接
🎯 今日精选
你的 CLAUDE.md 正在变成新的攻击面:我们为了让 AI Agent 更好用而创建的那些文件 — CLAUDE.md、.cursorrules、.github/copilot-instructions.md — 正在成为最新的供应链攻击入口。攻击方式很简单:往热门开源仓库提交 PR,加一个看起来像是"改进 AI 配置"的文件,里面藏着恶意指令。当开发者用 AI 编码工具打开这个项目时,Agent 会自动读取这些配置并执行。最讽刺的是,大多数团队对这类文件零审查 — 因为它们看起来就是无害的文档。这是 Agent 时代特有的攻击面:不攻击代码,攻击理解代码的 AI。建议:立即在 CI 中加入对 AI 配置文件变更的自动审查,像对待 package.json 一样对待 CLAUDE.md。 详情 →
下期见 ✌️