NewsletterBlogGlossary
INSIGHTBUILDTECHNIQUELAUNCHTOOLRESEARCH

18 条资讯

Karpathy: Train and inference GPT in 243 lines of pure Python

2026-03-06

今日 AI 圈最值得关注的动态。

今日看点: Meta 开源 SAM Audio — 用文字就能分离任意声音。, Karpathy:243 行纯 Python 实现 GPT 训练和推理。, GPT-5.2 在理论物理中推导出新结论。.

🧠 发布动态

Meta 开源 SAM Audio — 用文字就能分离任意声音。

Meta 发布了首个统一多模态音频分离模型,支持文本、视觉和片段提示来隔离复杂音频中的任意声音。开源了感知编码器、基准测试和论文。以前要专业音频工程师折腾半天的活,现在一句提示词搞定。做音视频产品的,这个必须关注。(6,450 likes | 933 RTs) 详情 →

Anthropic 重新定义 Claude:不是聊天机器人,是"思考空间"。 Anthropic 明确表态 — Claude 不是搜索引擎,不是 ChatGPT 的替代品,而是一个帮你深度思考的空间。这个定位直接影响开发者在 Claude 上构建产品的方式 — 别再做问答机器人了,想想怎么做思考工具。 详情 →

Perplexity 入局 Embedding 模型。 pplx-embed-v1-0.6b 只有 0.6B 参数,轻量到可以随便部署,但出自最懂检索的团队。做 RAG 管线的可以拿来和你现在用的 Embedding 模型跑个对比。(125 likes | 14.5K downloads) 详情 →


🔧 开发者工具

LocoOperator-4B — 专为 Agent 设计的轻量模型:4B 参数,专门为 GUI 交互和工具调用优化,小到可以本地部署。填补了"大模型太贵、小模型不会用工具"的空白。需要本地跑 Agent 工作流的,试试这个。(268 likes | 3.7K downloads) 详情 →

Claude Code Security 上线:不只是写代码,还能帮你找漏洞。扫描代码库、发现安全问题、生成修复补丁供人类审核。Anthropic 把 Claude 从编码助手升级成了安全工具。 详情 →


📝 技术实战

Karpathy:243 行纯 Python 实现 GPT 训练和推理。

没有 PyTorch,没有任何依赖,243 行代码跑通 GPT 的完整训练和推理流程。这不是教程项目 — 这是一堂关于"什么是本质、什么是脚手架"的大师课。想真正理解 Transformer 的,把这段代码逐行读一遍。(25,229 likes | 3,179 RTs) 详情 →

Karpathy:CLI 是 AI Agent 的最佳界面。 恰恰因为 CLI 是"老技术" — 确定性强、可组合、机器可读。GitHub CLI + Polymarket CLI + 编码 Agent,按需生成任意仪表盘。GUI 在 Agent 时代反而是累赘。(11,698 likes | 1,106 RTs) 详情 →

你的 LLM 写不出正确代码?问题在你的 Prompt。 这篇文章的核心论点:先定义验收标准、测试用例和约束条件,代码质量会显著提升。有量化交易的真实案例佐证。别怪模型笨,先看看你的需求写得清不清楚。(393 likes | 278 RTs) 详情 →

如何设计 AI 做不了的技术面试题:Anthropic 工程团队分享了他们的框架 — 当候选人可以随时调用 AI 时,面试该怎么出题。核心思路:测模糊场景下的判断力,而不是技术正确性。2026 年还在用 LeetCode 面试的,该醒醒了。 详情 →


🔬 研究前沿

GPT-5.2 在理论物理中推导出新结论。

OpenAI 联合普林斯顿高等研究院、范德堡、剑桥和哈佛发布预印本 — GPT-5.2 发现了一种许多物理学家认为不可能的胶子相互作用,在特定条件下确实可以发生。这是 AI 在基础物理学领域第一个可信的原创发现。不管你信不信"AI 理解物理",这个结果是可验证的。(9,618 likes | 1,507 RTs) 详情 →

LeCun 再锤"LLM 不理解语言"。 Yann LeCun 分享了 Valerio Capraro 的实验:GPT 对同一个道德问题,换个描述方式就给出矛盾的判断。比如同一行为,正面描述时说"可接受",负面描述时说"不可接受"。做安全关键应用的,这个实验值得细看。(22,774 likes | 2,586 RTs) 详情 →


💡 行业洞察

Cursor 的第三纪元:云端 Agent 吃掉 IDE。

Cursor 收购了 Graphite 和 Autotab,并表示云端 Agent 的使用量已经超过了 IDE 本体。一家估值 500 亿美元的公司说"未来不在 VS Code 里" — 整个开发工具生态都该紧张了。编辑器之争可能已经结束,接下来是 Agent 平台之争。 详情 →

"AI 工程师可能是最后一个技术岗位"。 Latent Space 的这个判断很尖锐:当 Agent 接管了实现层面的工作,AI 工程师 — 那个设计 Prompt、编排 Agent、定义验收标准的角色 — 可能是最后一个还需要人类的技术岗位。不管你同不同意,都该想想自己的技能树往哪长。 详情 →

"我们可能都已经是 AI 工程师了"。 一个开发者的真实感悟:不管你是前端、后端还是全栈,你的日常工作已经离不开 AI 工具了。传统的前后端分界正在消融,取而代之的是"会不会用 AI"这条新分界线。(110 likes | 158 RTs) 详情 →


🏗️ 值得一试

Qwen3-14B 蒸馏自 Claude Opus 4.5 — 本地可跑的高推理模型:14B 参数,GGUF 格式,用 llama.cpp 就能在消费级硬件上跑。讽刺的是 Anthropic 刚在打击蒸馏行为 — 但模型已经放出来了。需要本地推理能力的,值得测一测。(277 likes | 83.1K downloads) 详情 →


🎓 模型小课堂

云端 Agent(Cloud Agent):传统的 AI 编码助手跑在你的电脑上,看你打开的文件、补你正在写的代码。云端 Agent 不一样 — 它跑在云端服务器上,可以独立克隆仓库、浏览代码、跑测试、提交 PR,全程不需要你盯着。你给它一个任务描述,它在后台干活,做完了通知你。这就像从"身边的实习生"变成了"远程的合同工" — 你不用管过程,只看结果。Cursor 说这种模式的使用量已经超过了传统 IDE,说明开发者的工作方式正在从"写代码"转向"审代码"。


⚡ 快讯

  • OpenAI 进军五角大楼:将在美国国防部机密网络中部署模型,同时承诺不用于国内大规模监控和攻击性网络行动。(34,437 likes | 4,061 RTs) 链接
  • AI 时代的"真相"危机:Latent Space 探讨当 AI 生成内容与人类创作无法区分时的认知困境。 链接

🎯 今日精选

Cursor 的豪赌揭示了开发工具的终局:当 Cursor CEO 说云端 Agent 使用量已经超过 IDE 时,这不是在做产品宣传 — 这是在宣告一个时代的结束。过去两年,所有人都在卷"谁的代码补全更准",但 Cursor 用收购 Graphite(代码审查)和 Autotab(浏览器自动化)的方式告诉你:未来的竞争不在编辑器里,而在谁能提供端到端的 Agent 工作流。结合 Karpathy 说的"CLI 是 Agent 最佳界面"和"AI 工程师是最后的技术岗位"这两个观点,一幅清晰的图景浮现:开发者的核心技能正在从"写代码"转向"编排 Agent"。你现在用的 IDE 可能很快就会变成一个审核界面,而不是创作界面。 详情 →


下期见 ✌️