NewsletterBlogLearnCompareTopicsGlossary
English
TECHNIQUETOOLLAUNCHINSIGHTRESEARCHBUILD

22 条资讯

Midjourney 第二幕:全身扫描仪,像称体重一样扫器官

🧠 发布动态

Midjourney 第二幕:全身扫描仪,像称体重一样扫器官。

这家靠图像生成证明"不融资也能把 AI 产品做到顶级"的公司,第二个产品不是视频,不是 3D — 是消费级全身医疗扫描仪。战略转型的胆量惊人,但逻辑自洽:Midjourney 的核心能力是图像理解和生成,医疗影像本质上也是图像问题。没有 VC 压力意味着他们可以押注长线赛道。值得持续关注这个没走寻常路的团队。 详情 →

Claude Code 支持 Artifacts 了。 你在 claude.ai 上用的交互式预览 — React 组件、HTML 页面、数据可视化 — 现在可以直接在终端里的 Claude Code 中使用。不用切浏览器,写完代码直接预览。对于前端开发者来说,这让 Claude Code 从"代码助手"进化成了"所见即所得的开发环境"。 详情 →

AWS 纽约峰会一口气发了两个新服务。 Continuum(AI 安全实时响应)和 Context(Agent 知识图谱),加上 Kiro、DevOps Agent、Bedrock AgentCore 等五项更新。(10 likes) AWS 在企业级 Agent 基础设施上的投入越来越重 — 如果你的 Agent 跑在 AWS 上,这批更新值得逐个评估。 详情 →


🔧 开发者工具

MCP 有企业级认证管理了 — 管理员可以集中控制连接器访问权限。

企业部署 MCP 最大的摩擦点一直是认证:每个用户都要自己走一遍 OAuth 流程。现在管理员可以预授权 MCP 连接器,用户直接用,零感知。这是 MCP 从"开发者玩具"走向"企业标配"的关键一步。如果你在推动组织内的 MCP 落地,这个功能直接解决了 IT 部门最大的顾虑。 详情 →

Claude 代码执行工具升级:单个 cell 90 秒时间预算。 新版 code_execution_20260521 让 Claude 可以主动管理长时间运算的执行预算 — 不再出现跑到一半被静默终止的问题。不需要 beta header,直接更新 tool version 就能用。 详情 →

Ollama v0.30.10:Command A 和 North 系列模型登陆 Apple Silicon。 通过 MLX 引擎,Mac 用户现在可以本地跑更多模型,不需要 GPU 服务器。本地推理的可选模型池又扩大了一圈。 详情 →


📝 技术实战

Claude Code 完整调教指南:CLAUDE.md、Skills、Hooks、Rules、Subagents 全讲透了。

Anthropic 官方出了一份从入门到精通的 Claude Code 定制指南 — 涵盖 CLAUDE.md 文件结构、技能定义、钩子系统、规则引擎和子 Agent 编排。如果你的团队在用 Claude Code,这篇是必读。不是泛泛的"提示词技巧",而是系统级的工程实践。建议对照你现有的 CLAUDE.md 逐项检查是否用到了所有能力。

延伸阅读:如果你还在犹豫 Claude Code 和 Codex 怎么选,可以看看我们的深度对比 → Claude Code vs Codex

详情 →

别只用 LoRA 了 — HuggingFace 把微调方法做了个大横评。 DoRA(权重分解适配)、PiSSA(主奇异值适配)、rsLoRA、LoRA+ 逐一对比。结论:vanilla LoRA 不再是无脑最优选择,不同任务上新变体可以显著跑赢。如果你还在用默认 LoRA 配置做微调,该花半天时间跑个对比了。 详情 →

企业 MCP 部署的 Zero-Touch OAuth 实现细节。 MCP 协议博客详解了零感知 OAuth 的技术实现 — 管理员预授权,用户无需看到任何 OAuth 弹窗。(47 likes | 14 RTs) 配合上面的 Claude 企业认证管理一起读,可以看到完整的企业 MCP 认证架构。 详情 →


🔬 研究前沿

DeepMind 发布 AI Agent 安全路线图。 不是又一篇"AI 安全很重要"的空谈 — 而是一份具体的 AI 控制路线图,结合传统安全防护和实时监控,针对 Agent 系统的实际攻击面给出了工程方案。在你往 Agent 里接更多工具和权限之前,先看看这份框架。 详情 →

别用通用跑分选模型了 — 用你自己的工具做 Agent 评测。 HuggingFace 提出了一套框架,让你针对自己实际使用的工具集来评估开源模型的 Agent 能力。通用 benchmark 测的是"模型能不能用工具",自定义 eval 测的是"模型能不能用好你的工具"。差距可能比你想的大。 详情 →

MosaicLeaks:你的研究 Agent 可能正在泄露隐私数据。 ServiceNow 做了一组实验,测试给 Agent 访问敏感文档后是否会泄露私有信息。结论不乐观 — 攻击面真实存在且被严重低估。在你给 Agent 开放文件系统访问权限之前,认真审计一下数据边界。 详情 →


💡 行业洞察

Noam Shazeer 加入 OpenAI — Transformer 的共同发明人换了阵营。

(260 likes | 236 RTs) 这可能是今年最重磅的人才变动。Shazeer 是 2017 年那篇"Attention Is All You Need"的核心作者之一,之后创办了 Character.AI(去年被谷歌实质收购),现在转投 OpenAI。一个发明了注意力机制的人加入当前最大的 AI 公司 — 这不只是招聘新闻,而是架构路线的信号。详见今日精选的深度分析。 详情 →

GLM-5.2 前端编码称霸,IndexShare 解码技巧值得关注。 Latent Space 深度分析了 GLM-5.2 在前端编码任务上的统治力,以及 IndexShare 推测解码(Speculative Decoding)技术的实际效果。不只是跑分新闻 — 技术细节值得做推理优化的团队研究。 详情 →

Mollick:AI 界面根本不直觉 — 你只是内化了那些技巧。 (576 likes | 30 RTs) 一针见血:AI 产品的重度用户已经无意识地掌握了几十个"显而易见"的使用技巧,但这些技巧对新用户来说是完全不可见的壁垒。做 AI 产品的,找三个不怎么用 AI 的人试试你的产品,你会发现问题比你想的多。 详情 →


🏗️ 值得一试

last30days-skill:跨平台研究 Agent,44K Star 不是白拿的。 (43,974 likes | 3,617 RTs) 一个即插即用的 Agent 技能 — 自动从 Reddit、X、YouTube、Hacker News、Polymarket 和网页抓取最近 30 天的讨论,综合成一份有据可查的摘要。适合做市场调研、竞品分析、或者在写深度文章前快速摸底。Star 数说明社区对跨平台研究自动化的需求是真实的。 详情 →

GLM-5.2 GGUF 量化版来了 — 本地跑新一代开源领头羊。 (120 likes | 305 downloads) Unsloth 第一时间放出了 GLM-5.2 的 GGUF 量化版本。想在本地评估这个前端编码能力最强的开源模型?现在就可以下载跑起来。 详情 →


🎓 模型小课堂

低秩适配变体(DoRA、PiSSA、rsLoRA):微调大模型时,LoRA(低秩适配)是最常用的方法 — 不改原模型权重,只训练两个小矩阵来"修正"模型行为,省显存省时间。但今天 HuggingFace 的横评告诉我们,vanilla LoRA 不再是唯一选择。DoRA 把权重拆成方向和大小两个分量分别适配,在某些任务上效果更好;PiSSA 用主奇异值来初始化适配矩阵,收敛更快;rsLoRA 则通过调整缩放因子让更高秩的适配器也能稳定训练。选择微调方法正在从"默认 LoRA"变成一个需要认真评估的工程决策。


⚡ 快讯

  • Anthropic Python SDK v0.111.0:新增拒绝回退中间件标记 + 代码执行工具支持。 链接
  • Anthropic TS SDK v0.105.0:工具调用 JSON 懒解析,流式场景下首 token 时间更短。 链接
  • OpenRouter 机器人格斗竞技场:Claude vs Grok 实时对战,模型差异一目了然。(142 likes | 116 RTs) 链接
  • LangGraph 1.2.6:修复嵌套子图 checkpoint 命名空间丢失 bug(1.2.3 起的回归),用嵌套子图的立即更新。 链接
  • "Done"是 AI Agent 对你说的最贵的一个字:同一个任务,接受 Agent 说"完成了"= 垃圾输出,加一层验证模型 = 质量输出。(6 likes | 1 RTs) 链接

🎯 今日精选

Noam Shazeer 加入 OpenAI — Transformer 架构之争远未结束:Shazeer 的这次转会揭示了一个被很多人忽略的事实 — Transformer 架构的进化远没有到头。这位注意力机制的共同发明人选择加入 OpenAI,而不是继续在谷歌体系内工作,信号很明确:下一个前沿不是替换 Transformer,而是从内部彻底重新想象它。更值得关注的是人才集中化的加速 — 顶级研究者正在以前所未有的速度向少数几家 frontier 实验室聚拢,开源社区消化和复现这些成果的速度已经跟不上了。当发明了核心架构的人都在调整站位时,说明这场游戏的规则正在被重写。 详情 →


下期见 ✌️