人工智能资讯

Mira Murati 重新露面：Thinking Machines 不能只靠前 OpenAI 光环了

Mira Murati 在沉寂约 18 个月后，现身 Bloomberg 旧金山访谈，为 Thinking Machines Lab 的 interaction models 预热，但没有给出发布日期。Thinking Machines 已有 Tinker 这个开源模型微调 API，新方向则瞄准音频、文本、视频连续流交互，约 200 毫秒一轮处理。更关键的是，她这次不是发布产品，而是在向市场证明：这家公司有方向、有组织能力，也有一套关于 AI 治理的说法。

Mira MuratiThinking Machines LabOpenAI

人工智能 2026/6/5

微软Scout“让人上瘾”文件风波：纳德拉否认目标，但责任链没说清

404 Media披露，微软Scout内部策略文件把第一阶段目标写进了“make people addicted”。纳德拉随后在内部否认这是公司目标，并称不确定文件来源。这件事目前不能证明Scout造成用户成瘾，也不能把内部文件等同于微软公开战略。真正的问题是：带负责人署名的AI产品策略文件出现高风险措辞后，微软如何解释、追责和留痕。

微软ScoutAI助手微软

人工智能 2026/6/5

NVIDIA 4B 安全模型上架 Hugging Face：重点不是拦截，而是谁能写规则

Nemotron 3.5 Content SafetyNVIDIA内容安全

人工智能 2026/6/5

AI 编程争论的要害：速度和可信度要接上同一条反馈回路

1. Simon Willison 转引 Charity Majors 的观点：AI 拥护者和怀疑者面对的都是现实风险，只是风险方向不同。 2. 拥护者怕错过能力跃迁，怀疑者怕代码产出超过可审查能力，拖垮可靠性、知识传承和运维。 3. 对工程负责人来说，关键不是站队，而是把 AI 使用、代码审查、测试、事故反馈和责任边界接成闭环。

AI 编程代码审查软件团队

人工智能 2026/6/5

大模型开始被测试“政治免疫力”了

爱沙尼亚语言研究所 ELI 和 Propastop 推出“宣传抵抗力”基准，测试数十个大模型在英、爱沙尼亚语、俄语中抵抗俄罗斯战略叙事的能力。Claude 系列在该基准中领先，Claude Opus 4.7 总分 94.9；但更关键的变量是：部分模型换成俄语提问后防线明显变薄。这不是全球通用安全排名，而是一张提醒牌：大模型正在被拉进国家叙事竞争。

大模型宣传抵抗力政治免疫力

人工智能 2026/6/5

人形机器人越像人，越要先问三件事

人形机器人跳舞、后空翻、倒酒、搬箱子的视频正在走红，但这些画面只能说明局部能力，不等于稳定、自主、可泛化的工作能力。真正该看的不是它像不像人，而是是否完全自主、换环境能否重复完成、失败和人工介入有没有被展示。对投资、采购和产品团队来说，短视频可以看热闹，决策要看量化测试。

人形机器人机器人演示自主性

人工智能 2026/6/5

Chesky想另起AI实验室：Airbnb CEO不是离场创业，而是在试探新的AI入口

Airbnb CEO Brian Chesky计划支持成立一家新的AI实验室，消息最早由Bloomberg披露，TechCrunch随后获知情人士确认。关键不在于Airbnb要全面转型AI，而在于Chesky这位OpenAI早期盟友，开始试探把AI能力掌握在自己更熟悉的交互和设计层面。

AI实验室Brian CheskyAirbnb

人工智能 2026/6/5

Anthropic秘密递表IPO：收入跑得很快，算力账单也追得很紧

Anthropic已秘密提交IPO申请，按报道，此前它以约9650亿美元估值融资650亿美元，且需求超额。公司5月年化收入超过470亿美元，较2025年底约90亿美元大幅增长，但这不是全年确认收入，也不是利润。真正的考题是：企业AI回报还在验证，算力成本又很重，公开市场会要求Anthropic证明增长能留下来。

AnthropicIPOClaude

人工智能 2026/6/5

QKV 不是圣物，KV Cache 才是账本

ICML 2026 一篇论文系统测试 Transformer 的 Q/K/V 投影共享，发现共享 Key-Value 能把语言模型 KV cache 减半，只带来 3.1% 困惑度退化。它没有推翻三投影结构，但把注意力里的默认冗余量化了：端侧推理正在逼架构为内存账单让路。

TransformerKV CacheQKV 投影共享

人工智能 2026/6/5

Project Stratos削地近半，但犹他州AI数据中心的水电账还没算清

Kevin O’Leary承诺把犹他州Project Stratos数据中心用地从约4万英亩削减近半，移除约1.943万英亩，并再削减东北部近公路区域620英亩。这个让步没有达到犹他州参议院议长J. Stuart Adams提出的削减75%要求；即使缩到约2万英亩，项目仍大于曼哈顿。真正的争议还在后面：AI数据中心的土地、水、电、生态和社区成本，谁来承担、怎么约束。

Project StratosAI数据中心Kevin O’Leary

人工智能 2026/6/5

ChatGPT 新记忆上线：AI 开始整理你没让它记住的事

OpenAI 开始向美国 Plus 和 Pro 用户推出基于 Dreaming 的新版 ChatGPT 记忆系统，之后会扩展到更多国家及 Free、Go 用户。这次变化的关键，不是多存几条偏好，而是 ChatGPT 会在后台综合聊天历史，让长期上下文更连续、更及时。对重度用户是效率红利；对平台权力来说，这是新的入口。谁掌握长期语境，谁就更容易留住工作流。

ChatGPTOpenAIDreaming

人工智能 2026/6/5

Google删掉“人在回路”：AI公司最怕写下责任

404 Media 报道 Google 员工内部分享吐槽其 AI 表现的 meme 后，Google 要求替换声明；新版本删掉了“维持人在回路中至关重要”。这不能证明 Google 取消人工审核，但说明“人工监督”这类话正在从安全承诺变成责任把手。对用户、企业客户和监管者来说，接下来该看的不是宣传里的“可信 AI”，而是企业是否愿意写清监督、申诉和追责机制。

AI责任人在回路中Google

人工智能 2026/6/5

Windows 重回 Build 开场：微软想把 AI PC 从口号拉回本地算力

微软在 Build 2026 开场把 Windows 放回核心位置，纳德拉用 Surface RTX Spark Dev Kit 吸引开发者，并称它为“dream machine”。英伟达以 RTX Spark 芯片重返 Windows on Arm，微软和英伟达把它包装成 PC 的新起点，但现在还缺价格、性能、出货和采用度这些硬指标。我更在意的是：Windows 是否正在从传统操作系统，转向承载本地 AI agent 和企业自有算力的平台。

本地 AI PCWindows微软

人工智能 2026/6/5

Waymo载客去偷瑜伽服，真正暴露的是无人车影像取证边界

今年1月，旧金山一名窃贼乘坐Waymo无人出租车前往Hot 8 Yoga盗走瑜伽服后离开，警方至今未抓获嫌疑人。案件重点不在于“无人车帮助犯罪”，而在于车载影像保存、隐私模糊处理与执法调取之间的现实落差。它提醒城市管理者：robotaxi既不是天然的监控车，也不是完全脱离公共安全体系的普通交通工具。

Waymo无人出租车robotaxi

人工智能 2026/6/5

WWDC 2026：Siri 要从语音按钮变成办事入口，苹果最难的一关还没过

WWDC 2026 将于太平洋时间周一上午 10 点开幕，重点预计落在 Siri 大改版、Apple Intelligence 扩展和多系统 AI 功能上。最关键的看点不是苹果补了多少模型能力，而是 Siri 能否从问答工具变成跨 App 办事入口。普通用户可以观望，开发者要盯紧代理权限、调用规则和 App Store 分成逻辑。

SiriApple IntelligenceWWDC 2026

人工智能 2026/6/5

Meta 在 Facebook 推 AI 创作者助手：效率工具背后，是平台编辑权

Meta 在 Facebook 推出面向创作者的 AI 助手，先在美国、加拿大、印度上线，可基于账号表现、社区和目标，回答发帖时机、评论反馈、受众变化和趋势选题等问题。它不是自动写稿工具，更像把后台数据、选题建议和发布节奏做成对话入口。对创作者来说，这是省时间；对 Meta 来说，这是把内容供给更紧地留在自家生态里。

MetaFacebookAI 创作者助手

人工智能 2026/6/5

华为开源 KVarN：长上下文推理，账单卡在 KV-cache

华为 CSL 开源 KVarN，一个基于 vLLM v0.22.0 的 KV-cache 量化后端，Apache 2.0 协议，README 宣称 one flag 启用、无需校准，可把 KV-cache 容量提升 3-5 倍。更关键的是，它在披露测试中给出最高约 1.3 倍 FP16 吞吐、FP16 级准确率，并声称最高约 2.4 倍 TurboQuant 吞吐。我的判断：这不是模型能力新闻，而是长上下文和 Agent 服务开始认真清算 KV-cache 成本。

KVarNKV-cache华为 CSL

人工智能 2026/6/4

纽约法官痛斥虚假判例：AI 疑云下，律师最该怕的不是模型

5月20日，纽约州最高法院上诉庭直播中，法官质问原告律师 Michael Sanders：上诉文件里至少3个案例疑似不存在，另有10个案例被指误述法律。法官没有明说这些错误来自生成式 AI，但已要求 Sanders 及其律所说明为何不应受制裁。真正刺痛人的地方，是对方律师也没发现；专业行业一旦把核查交给工具、流程和侥幸，职业信任就会被低成本自动化慢慢磨掉。

AI幻觉法律行业虚构判例

人工智能 2026/6/4

Google 的 75% AI 代码，卡在了人类评审那里

Google CEO Sundar Pichai 对外称，公司 75% 的新代码由 AI 生成；但内部员工正在 Memegen 上大量吐槽自家 AI 编程工具 Jetski。真正的问题不是 AI 会不会写代码，而是“生成”被算成生产力后，验证、审查、测试和维护成本被推给了一线工程流程。

AI 生成代码GoogleSundar Pichai

人工智能 2026/6/4

EVA-Bench 2.0 发布：语音 Agent 该从演示视频回到企业流程了

ServiceNow-AI 在 Hugging Face 发布 EVA-Bench Data 2.0，覆盖航空客服、企业 IT 服务、医疗 HR 三个领域，合计 213 个场景、121 个工具、35+ 工作流。它的价值不在制造一个新榜单，而在把语音 Agent 放进认证、权限、政策和不可满足请求里测试。对企业 AI 团队和 Agent 产品负责人来说，这更像一套上线前的流程压力测试清单。

语音 AgentEVA-Bench 2.0ServiceNow-AI

人工智能 2026/6/4

AI 内容都贴标签了，为什么还不让用户一键屏蔽？

The Verge 批评 YouTube、Instagram、TikTok、Meta、Spotify 等平台已经在给 AI 生成内容打标签，却没有给用户按标签过滤、隐藏或降权的开关。问题不在识别技术，而在平台不愿把选择权交给用户，因为那会直接检验 AI 内容在推荐流里到底有多少真实需求。

AI生成内容内容标签内容过滤