Claude 走进街边小店:Anthropic 推出小企业版
🧠 发布动态
Claude 走进街边小店:Anthropic 推出小企业版。
Claude for Small Business 上线 — Anthropic 从上周的法律垂直赛道一脚跨进了小企业市场。这不是把企业版降个价那么简单,而是针对非技术用户重新设计的产品形态。小企业是个巨大的长尾市场,Anthropic 显然不想只做大客户的生意。如果你身边有开店的朋友,可以推荐他们试试。 详情 →
Claude Code 周用量限额提升 50%,持续到 7 月 13 日。 所有付费用户直接多 50% 的额度 — 这是本周 Claude Code 用户最实际的好消息。快 2.1 万点赞说明大家确实用得够狠。趁额度充裕多跑几个大项目。(20,964 likes | 1,955 RTs) 详情 →
付费 Claude 用户 6 月 15 日起每月送 API 额度。 每个付费计划都会附带程序化调用额度,覆盖 Agent SDK、claude -p 和第三方应用。这等于在补贴整个 Claude 生态 — 如果你在做基于 Claude API 的工具,6 月 15 日是个关键节点,提前规划用量。(11,866 likes | 974 RTs) 详情 →
Codex 登陆 ChatGPT 手机端。 OpenAI 把 Codex 塞进了手机 App — 编程 Agent 不再是桌面专属。手机端的使用场景不一样:地铁上 review PR、午饭时 debug 一个想法。移动端做编码是否实用还得看,但 OpenAI 先占了这个入口。(126 likes | 48 RTs) 详情 →
🔧 开发者工具
Claude Code v2.1.142 塞满了 Agent 编排原语:新增 --add-dir、--settings、--mcp-config、--model、--dangerously-skip-permissions 等 flag,Fast 模式默认切到 Opus 4.7,插件支持根级别加载。如果你在搭多 Agent 工作流,这些 flag 就是你一直缺的拼图。 详情 →
OpenAI 解决了 Codex 在 Windows 上的沙箱难题:Windows 用户一直在"每步都要审批"和"放开全部权限"之间二选一。OpenAI 用新的沙箱方案让 Codex 既能干活又不用交出整台机器的控制权。Windows 开发者终于不用被当成二等公民了。(857 likes | 72 RTs) 详情 →
AWS 出了官方 MCP Server — 全 API 覆盖、沙箱执行:当 AWS 亲自下场做 MCP 支持,这个协议就不再是"实验性的"了。完整 API 覆盖、沙箱化脚本执行、实时文档访问。企业用户可以正式把 MCP 纳入技术选型了。(108 likes | 14 RTs) 详情 →
Vercel 发布 ai-cli:终端里调所有 AI 模型:npm i -g ai-cli 就能在命令行里调用所有文本、图像、视频模型,走 Vercel AI Gateway。Rauchg 演示了终端里直接渲染图片 — 这不是 wrapper,是个通用模型接口。(322 likes | 10 RTs) 详情 →
📝 技术实战
Claude Code 大型代码库官方最佳实践出炉。
如果你在 monorepo 或者超过几万行的项目里用 Claude Code,这篇是你的参考手册。覆盖 CLAUDE.md 配置、上下文管理策略、多 Agent 模式。核心洞察:给 Claude Code 的上下文越精确,产出质量越高 — 不是把整个仓库丢进去就完事。今天就按这个指南调一遍你的设置。 详情 →
异步连续批处理:高吞吐 LLM 推理背后的引擎:HuggingFace 深入解析了 async continuous batching — 这就是 vLLM 和 TGI 延迟越来越低的技术原因。如果你在自建推理服务,理解这个机制能帮你把吞吐量再拉一个档次。 详情 →
🔬 研究前沿
Gemini 3.2 Flash 传闻:GPT 5.5 的 92% 性能,价格只要十五到二十分之一。
这个数字如果在 Google I/O 上被确认,高并发推理的成本方程式要被改写。传闻 Gemini 3.2 Flash 在编码和推理上达到 GPT 5.5 的 92%,但推理成本低 15-20 倍,延迟低于 200ms。Google 的蒸馏 + 稀疏化技术在持续复利 — 对大多数生产负载来说,最后那 8% 的性能差距可能根本不值得多付 15 倍的钱。(3,249 likes | 162 RTs) 详情 →
Mythos 找到 250 个漏洞,此前最强模型只找到 22 个:Anthropic 的 Krishna 澄清 Mythos 不只是网络安全专用模型 — 但在安全测试中,它在一个开源代码库里找到了 250 个漏洞,之前的模型只找到 22 个。11 倍的提升也解释了 Anthropic 为什么选择谨慎发布。(33 likes | 6 RTs) 详情 →
IBM Granite Embedding:百万参数以下最强检索模型,Apache 2.0:Granite Embedding Multilingual R2 — 不到 1 亿参数、32K 上下文、Apache 2.0 开源。如果你的 RAG 管线需要多语言检索但不想上 GPU 集群,这个模型在质量、体积和许可证之间找到了最佳平衡点。 详情 →
两份独立评估确认:AI 能力已过拐点:Ethan Mollick 指出,METR 和英国 AISI 两个独立的安全评估机构都得出了同一个结论 — AI 能力增长已经越过了那条著名的指数曲线拐点。不是炒作,是两个以安全为导向的独立评估者的一致判断。(493 likes | 40 RTs) 详情 →
💡 行业洞察
Anthropic 砸 2 亿美元给盖茨基金会:安全实验室要做全球基础设施。
Anthropic 宣布与盖茨基金会合作,投入 2 亿美元用于全球健康、教育和农业。这不是企业 CSR 做做样子 — 这是 Anthropic 迄今最大的公益投入,信号很明确:安全导向的 AI 实验室不只想赚企业的钱,还想证明 AI 能解决真正的全球问题。当竞争对手都在卷企业客户时,Anthropic 选了一条不一样的叙事路线。 详情 →
Anthropic 发布美中 AI 竞争论文,时机微妙:在特朗普与习近平会面之际,Anthropic 发表了一篇关于美中 AI 竞争的立场论文 — 论点是美国和民主盟友目前在前沿 AI 上领先,以及如何保持这一优势。时机是刻意的,政策含义值得关注。(1,835 likes | 276 RTs) 详情 →
Anthropic 出了一本《AI 原生创业手册》:从架构决策到什么时候该微调、什么时候该靠上下文工程,再到如何思考模型依赖 — 这是 Anthropic 给 AI 创业者写的实战指南。如果你正在做 AI 产品,里面关于模型选型和架构演进的建议很实在。 详情 →
Andrew Ng 和 Yann LeCun 联手反驳"AI 取代工作"论:Andrew Ng 认为 AI 会和历史上每次技术革命一样 — 创造的工作比消灭的多。LeCun 转发力挺。5000+ 赞。焦虑的同事可以看看这个视角,但也别当成完全的定心丸 — 历史规律能否套用到 AGI 时代,还是个开放问题。(5,096 likes | 1,163 RTs) 详情 →
🏗️ 值得一试
Claude Cowork 把平面图变成可漫游的 3D 公寓:Felix Rieseberg 给 Claude Cowork 一张户型图,它直接生成了 3D 规划工具 — 然后他让它解析邮件里的家具购买记录、匹配 3D 模型、加上第一人称漫游模式。一次对话搞定。这让你重新思考"生产力工具"这四个字到底意味着什么。(528 likes | 24 RTs) 详情 →
开源模型追上来了 — GLM 5.1 登顶智能指数:Merve Noyan 在 AI Engineer 演讲中展示,GLM 5.1 在 Artificial Analysis 智能指数上超过了闭源模型。有权重就意味着你可以量化、微调、部署到边缘 — 数据不出你的机房。能力差距在缩小,选择权在增加。(193 likes | 29 RTs) 详情 →
🎓 模型小课堂
模型蒸馏(Model Distillation):想象你有一个博学但很慢的老教授(大模型),和一个聪明但啥都不会的学生(小模型)。蒸馏就是让学生去模仿老教授的"思考方式" — 不是死记答案,而是学习老教授面对问题时的概率分布和推理模式。Gemini 3.2 Flash 能用极少的参数达到 GPT 5.5 九成以上的性能,背后大概率就是从更大的 Gemini 模型蒸馏而来。这解释了一个趋势:为什么小模型越来越逼近大模型,为什么推理成本的下降曲线一直在加速。
⚡ 快讯
- Anthropic TS SDK v0.96.0:新增 Managed Agent 搜索类型 + 缓存诊断 beta。 链接
- Ollama v0.24.0:通过
ollama launch支持 Codex 集成,本地模型 + 云端编码 Agent 的混合栈成型。 链接 - Figma 营收跳涨 46% 至 3.33 亿美元:AI 定价策略生效,证明 AI 功能能转化为收入增长而不只是用户指标。 链接
- "AI 正在让我变蠢":一个开发者关于 AI 依赖导致认知退化的诚实反思,HN 387 赞。当你把所有思考都外包给 AI,你还在成长吗? 链接
🎯 今日精选
92% 的性能,十五分之一的价格 — 最后那 8% 到底值多少钱? 如果 Gemini 3.2 Flash 的传闻属实,AI 行业面临一个根本性的定价问题:当一个模型能以前沿模型十五到二十分之一的成本达到 92% 的性能时,那最后 8% 的溢价就成了整个 AI 商业模式的核心问题。对大多数生产负载来说 — 客服、内容生成、代码辅助、数据提取 — 92% 和 100% 的差距用户感知不到。真正需要最后那 8% 的场景(前沿研究、高风险推理、安全审计)只占总调用量的一小部分。Google 用蒸馏和稀疏化技术持续压低成本曲线,而这个趋势不会停。前沿模型供应商要么证明最后那 8% 值 15 倍的价格,要么找到性能之外的护城河 — 生态、信任、合规。这是 2026 年下半年 AI 行业最重要的商业问题。 详情 →
下期见 ✌️