🔥 AI头条 & 行业动态
1VentureBeat
微软发布Surface RTX Spark Dev Box,挑战云端AI定价模式
微软推出紧凑型桌面电脑Surface RTX Spark Dev Box,让开发者本地运行大型AI模型,无需支付云端费用,直接挑战按token计费的行业模式。
2VentureBeat
阿里巴巴发布Qwen3.7-Plus,多模态能力与成本优势显著
阿里发布Qwen3.7-Plus,支持文本、视频和图像输入,成本较纯文本版Qwen3.7-Max降低60%,但采用专有许可。
3VentureBeat
微软推出MXC操作系统级沙箱,为AI Agent安全护航
微软发布MXC,一个操作系统级的沙箱环境,用于隔离和运行AI Agent,OpenAI和英伟达已率先接入。
模型谷歌发布开源Gemma 4 12B模型,可在16GB笔记本本地运行 VentureBeat
[模型] 谷歌发布开源模型Gemma 4 12B,拥有119.5亿参数,采用Apache 2.0许可,支持音频和视频分析,可在典型的企业16GB笔记本电脑上完全本地运行。
融资Coralogix获2亿美元融资,押注AI Agent监控赛道 TechCrunch
[融资] 基础设施公司Coralogix获得2亿美元融资,公司押注随着AI系统投入生产,市场对监控其行为、排除故障的工具需求将大幅增长。
融资AI音乐生成公司Suno再获4亿美元融资,估值超54亿 TechCrunch
[融资] 尽管仍面临版权诉讼,AI音乐生成初创公司Suno再次融资4亿美元,估值超过54亿美元,较7个月前翻倍。
融资Alphabet创纪录的850亿美元融资,为谷歌AI业务注入强心剂 TechCrunch
[融资] Alphabet通过股票销售创纪录地筹集了850亿美元,用于支持谷歌的AI业务,此举被视为投资者对AI领域信心的强烈信号。
融资旷行科技完成Pre-A轮融资,专注高危场景具身机器人大脑 36氪
[融资] 高危作业领域具身智能公司旷行科技完成数千万元Pre-A轮融资,由财通资本和商汤国香投资,资金将用于算法研发和市场拓展。
融资星尘智能完成超10亿元B轮融资,估值破百亿 36氪
[融资] 绳驱AI机器人公司星尘智能完成B轮系列融资,三个月内累计融资超10亿元,估值突破百亿元,成为深圳又一家具身智能独角兽。
产品微软推出MXC操作系统级沙箱,为AI Agent安全护航 VentureBeat
[安全] 微软发布MXC,一个操作系统级的沙箱环境,用于隔离和运行AI Agent,OpenAI和英伟达已率先接入。该沙箱旨在解决AI Agent在自主执行多步骤工作流时带来的安全风险。
产品企业AI Agent持续制造数据孤岛,微软Build大会推出Microsoft IQ和Rayfin VentureBeat
[应用] 微软在Build大会上发布Microsoft IQ和Rayfin,旨在解决AI Agent部署中产生的数据孤岛问题,为Agent提供统一的业务记忆和数据访问规则。
产品Meta的WhatsApp Business AI Agent全球上线 TechCrunch
[应用] Meta宣布其面向WhatsApp Business的AI Agent现已全球可用,将根据token使用量向企业收费。
产品亚马逊将在搜索结果中展示AI生成的产品图片 TechCrunch
[产品] 亚马逊将利用视觉搜索和AI技术,在用户搜索时展示与查询匹配的AI生成产品图片,以帮助引导用户找到商品。
应用Perplexity AI在Computex 2026上展示混合本地-云端推理系统 VentureBeat
[产品] Perplexity AI在Computex 2026上展示了首个混合本地-服务器推理编排器,该软件能实时、自主地决定AI工作负载是在用户本地设备上运行还是发送到云端。
应用英国新规要求谷歌提供AI搜索退出机制 TechCrunch
[政策] 英国监管机构要求谷歌提供一项工具,允许网站发布商选择退出生成式AI搜索功能。该选项将在英国测试后全球推广。
应用GitLab裁员14%,聚焦AI工作负载平台升级 TechCrunch
[融资] GitLab宣布裁员14%,同时退出22个国家,减少管理层级,并投资基础设施以扩展其平台服务AI工作负载的能力。
应用前高盛和Meta员工创立语音AI公司,聚焦非洲和中东市场 TechCrunch
[融资] 一家由前高盛和Meta员工创立的初创公司,专注于为被忽视的非洲和中东市场构建语音AI,其平台目前每天处理超过17,000通电话。
应用Instagram警告用户曾遭AI聊天机器人黑客攻击 TechCrunch
[安全] Instagram正在向曾被黑客利用AI聊天机器人漏洞攻击的用户发出警报。此前Meta声称已修复该漏洞,但黑客仍能接管账户。
应用谷歌发布Dreambeans:用AI将你的生活变成卡通故事 TechCrunch
[产品] 谷歌推出名为Dreambeans的AI工具,能从用户的谷歌账户个人数据中提取信息,生成一系列AI插图的“故事”,将生活经历卡通化。
应用宏利香港与阿里云合作,加速保险业AI规模化落地 36氪
[应用] 宏利人寿保险(国际)有限公司与阿里云签署战略合作备忘录,双方将围绕保险业务全场景,加速AI技术的规模化应用。
应用瑞典AI初创公司Lovable与Google Cloud扩大合作 36氪
[应用] 瑞典AI初创公司Lovable扩大了与Google Cloud的多年期合作,整合Gemini模型和AI优化基础设施,以扩展其AI驱动的软件开发服务。
🧠 大模型追踪 & 论文精选
Qwen3.7-Plus 阿里巴巴
阿里巴巴发布Qwen3.7-Plus,这是Qwen系列的最新大语言模型,支持文本、视频和图像多模态输入。其成本仅为纯文本版Qwen3.7-Max的40%,每百万token输入/输出价格分别为0.4美元和1.6美元。该模型为专有许可,不开放权重。
Gemma 4 12B 谷歌
谷歌发布开源模型Gemma 4 12B,拥有119.5亿参数,采用Apache 2.0许可。该模型专为本地运行优化,支持音频和视频分析,可在典型的企业16GB笔记本电脑上完全本地运行,无需联网。
MXC Sandbox 微软
微软推出MXC,一个操作系统级的沙箱环境,专门用于安全地运行AI Agent。该沙箱在OS层面隔离Agent的运行时环境,防止恶意代码影响主机系统。OpenAI和英伟达已宣布支持该标准。
Microsoft IQ & Rayfin 微软
微软在Build大会上推出Microsoft IQ和Rayfin,旨在解决AI Agent部署中产生的数据孤岛问题。Microsoft IQ提供统一的业务知识和规则记忆,Rayfin则是一个数据编排层,确保Agent能访问正确的数据源。
Hybrid Local-Cloud Inference Orchestrator Perplexity AI
Perplexity AI在Computex 2026上展示了首个混合本地-服务器推理编排器。该软件能实时、自主地决定AI工作负载是在用户本地设备上运行还是发送到云端,以优化延迟、成本和隐私。
WhatsApp Business AI Agent Meta
Meta宣布其面向WhatsApp Business的AI Agent现已全球可用。该Agent能自动回复客户咨询、处理订单等,企业将根据token使用量支付费用。
Dreambeans 谷歌
谷歌推出Dreambeans,一个从用户谷歌账户个人数据中提取信息,生成AI插图的“故事”的工具。它可以将用户的生活经历、照片和活动转化为卡通风格的叙事内容。
AI Product Images Search 亚马逊
亚马逊将利用视觉搜索和AI技术,在用户搜索时动态生成并展示与查询匹配的AI生成产品图片。该功能旨在帮助用户更直观地找到所需商品。
Surface RTX Spark Dev Box 微软
微软发布Surface RTX Spark Dev Box,一款紧凑型桌面电脑,内置高性能RTX GPU,专为软件开发者设计,使其能在本地运行大型AI模型,无需依赖云端计算资源。
标题
Where does Absolute Position come from in decoder-only Transformers? | 作者 | 2026-06-04

研究方法:该论文通过理论分析和实验验证,系统地追溯了RoPE-trained Transformer中绝对位置信息的来源。研究者将泄露源追踪到两个关键的架构组件:因果掩码(Causal Mask)和残差流(Residual Stream)。首先,因果掩码的存在使得每个查询(query)位置的softmax分母计算依赖于该查询的绝对位置,因为不同位置的查询所能注意到的键(key)的数量不同。其次,在因果注意力机制下,位置0的激活值只能关注自身,形成了一个封闭的动力系统。这个系统的状态会沿着残差流传播,从而将绝对位置信息编码到后续所有位置的表示中。论文通过设计精巧的消融实验和理论推导,量化了这两种机制各自对绝对位置信息的贡献度。

研究摘要:本研究深入探讨了在仅解码器Transformer中,尽管使用了仅编码相对偏移的旋转位置编码(RoPE),模型为何仍能区分绝对位置。研究者通过严谨的理论分析和大量实验,揭示了这一现象背后的两个核心机制。第一,因果掩码的固有属性:在因果注意力中,位置i的查询只能关注到位置0到i的键。这意味着softmax函数的分母(即所有注意力分数的指数和)会随着i的增大而包含更多项。因此,即使RoPE只编码相对距离,不同位置的查询在计算注意力分布时,其归一化常数本身就携带了绝对位置信息。第二,残差流的传播效应:在序列的起始位置(位置0),由于因果掩码的限制,其激活值只能关注自身。这导致位置0的表示在层与层之间形成一个封闭的、自循环的动力系统。这个系统的状态会沿着残差流逐层向下传递,并影响后续所有位置的表示,从而将位置0的“绝对身份”信息编码到整个序列的表示中。研究者通过构建一个简化版的Transformer模型,从数学上证明了这两种机制的存在,并推导了绝对位置信息在注意力分数中的表达形式。实验部分,他们在多种规模和配置的Transformer模型上进行了验证,通过对比使用RoPE、绝对位置编码和无位置编码的模型,量化了因果掩码和残差流各自对绝对位置信息泄露的贡献。结果表明,即使移除残差流的影响,仅凭因果掩码也足以让模型学习到一定程度的绝对位置信息。而当两者同时存在时,模型对绝对位置的区分能力显著增强。这一发现挑战了RoPE仅编码相对位置的普遍认知,为理解Transformer的位置编码机制提供了新的视角。

观点解读:1. 行业贡献:该论文对Transformer架构的基础理论做出了重要贡献。它澄清了RoPE位置编码的一个长期存在的谜团,即为何相对位置编码的模型能表现出绝对位置感知能力。这一发现对于模型设计者具有直接的指导意义,例如在需要强外推能力的场景下,可能需要重新审视因果掩码和残差流的设计,或者开发新的位置编码方案来抑制这种不必要的绝对位置泄露。2. 技术影响:该研究揭示了模型架构中看似无关的组件(因果掩码和残差流)之间复杂的相互作用。这提醒研究人员,在分析和改进模型时,不能孤立地看待某个模块,而需要考虑其与整个架构的耦合效应。此外,该发现可能对长文本建模和推理效率优化产生影响。如果模型过度依赖绝对位置信息,其外推到更长序列的能力可能会受限。未来的工作可以探索如何利用或抑制这种泄露,以设计出更高效、更具泛化能力的位置编码方法。

💬 达人观点 & 开源项目
Satya Nadella VentureBeat
微软CEO Satya Nadella在发布Surface RTX Spark Dev Box时表示:“AI的经济学正在发生根本性转变。我们相信,未来的AI工作负载将更加分布式,本地计算将扮演关键角色。Spark Dev Box是我们对‘AI民主化’承诺的兑现,让每一位开发者都能拥有强大的AI算力,而不必受制于云端的按token计费模式。”
Aravind Srinivas VentureBeat
Perplexity AI CEO Aravind Srinivas在Computex 2026上介绍其混合推理系统时指出:“AI的未来是混合的。用户不应该在隐私、成本和性能之间做出妥协。我们的系统能智能地判断,哪些任务适合在本地快速完成,哪些需要云端的大模型支持。这是迈向真正个性化、高效AI的第一步。”
Kevin Scott VentureBeat
微软CTO Kevin Scott在谈及MXC沙箱时强调:“随着AI Agent变得越来越自主,安全问题不再是可选项,而是必需品。MXC是我们为Agent生态系统构建的‘操作系统级安全带’。它确保了即使Agent行为出现意外,也不会对用户数据和系统安全造成威胁。OpenAI和英伟达的加入,标志着行业对Agent安全标准的共识正在形成。”
Jensen Huang VentureBeat
英伟达CEO Jensen Huang在评论微软MXC时表示:“AI Agent是下一波计算浪潮的核心,但它们需要一个安全、高效的运行环境。英伟达全力支持MXC标准,它将为开发者提供一个强大的平台,构建能够安全地与数字世界交互的下一代AI应用。这是我们迈向‘AI工厂’愿景的关键一步。”
Sam Altman VentureBeat
OpenAI CEO Sam Altman在宣布支持MXC时评论道:“构建安全的通用人工智能是我们的核心使命。MXC提供了一个关键的抽象层,让我们可以专注于提升Agent的能力,同时确保它们在一个受控、可审计的环境中运行。我们很高兴能与微软和英伟达合作,共同定义AI Agent的安全未来。”
Brian Chesky 36氪
爱彼迎CEO Brian Chesky在2026夏季发布会上强调,公司并未盲目追逐AI热潮,而是专注于利用技术赋能社区。他分享了巴黎摄影师和意大利面传人通过爱彼迎体验平台获得可观收入的案例,指出:“真正的创新不是用算法取代人类,而是用技术放大人类的独特性和创造力。AI对我们而言,是让这些美好连接变得更高效、更个性化的工具。”
舒江鹏 36氪
旷行科技创始人、浙江大学博导舒江鹏在谈及公司定位时表示:“我们不做通用的机器人,而是专注于为高危工业场景打造‘具身大脑’。这些场景对安全性和可靠性的要求极高,通用方案无法落地。我们基于15年的行业负样本数据积累,构建了独特的‘机器人+AI大脑’解决方案,让机器人在矿山、化工厂等危险环境中替代人类作业。”
来永胜 36氪
星尘智能创始人来永胜在完成B轮融资后表示:“具身智能的规模化落地,关键在于‘本体’与‘智能’的深度融合。我们的绳驱技术提供了高动态、高精度的物理交互能力,而AI大脑则赋予其理解和适应复杂环境的能力。与中科创达等伙伴的合作,标志着我们的技术已从实验室走向千台级的工业及商业服务场景。”
build-your-own-x 👤 codecrafters-io | ⭐ 511936
一个通过从零开始重建各种技术(如Git、数据库、Docker等)来掌握编程的教程集合。它提供了详细的步骤指南,非常适合希望深入理解底层原理的开发者。用途:编程教育、系统设计学习。
awesome 👤 sindresorhus | ⭐ 472972
一个关于各种有趣主题的精选列表集合,涵盖了从编程语言、框架到工具、书籍等几乎所有领域。它是发现优质资源和学习新技术的绝佳起点。用途:资源导航、知识发现。
freeCodeCamp 👤 freeCodeCamp | ⭐ 446085
freeCodeCamp.org的开源代码库和课程体系。它提供免费的编程、数学和计算机科学教育,包含数千小时的交互式编码挑战和项目。用途:编程入门、技能提升。
public-apis 👤 public-apis | ⭐ 439396
一个集体整理的免费API列表,涵盖了从动物、艺术到商业、金融等几乎所有类别。开发者可以在这里找到各种有趣和实用的API来构建自己的应用。用途:应用开发、原型设计、数据获取。
free-programming-books 👤 EbookFoundation | ⭐ 389691
一个免费提供的编程书籍列表,涵盖多种语言和主题。它是自学编程和计算机科学知识的宝贵资源库,所有书籍均可合法免费获取。用途:自学、参考、教学。
openclaw 👤 openclaw | ⭐ 376875
一个跨平台、跨操作系统的个人AI助手项目,被称为“龙虾方式”。它旨在为用户提供一个高度可定制、隐私优先的本地AI助手。用途:个人助理、自动化任务、本地AI实验。
developer-roadmap 👤 nilbuild | ⭐ 356274
提供交互式路线图、指南和其他教育内容,帮助开发者在职业生涯中成长。它涵盖了前端、后端、DevOps等不同方向的学习路径。用途:职业规划、技能学习路径参考。
system-design-primer 👤 donnemartin | ⭐ 351782
学习如何设计大规模系统的资源库,包含Anki记忆卡片,是准备系统设计面试的必备资料。它涵盖了从基础概念到高级架构的全面内容。用途:系统设计学习、面试准备。
awesome-python 👤 vinta | ⭐ 301314
一个精选的Python框架、库、软件和资源列表。它按主题分类,是Python开发者寻找最佳工具和库的首选参考。用途:Python开发、库发现、最佳实践参考。
awesome-selfhosted 👤 awesome-selfhosted | ⭐ 297234
一个可以托管在自己服务器上的自由软件网络服务和Web应用列表。它涵盖了从文件同步、密码管理到博客平台、媒体服务器等各类应用。用途:自建服务、数据隐私、去中心化。