人工智能资讯

聚合当前分类下的最新内容,按时间顺序查看第 1 页精选文章。

Mira Murati 重新露面:Thinking Machines 不能只靠前 OpenAI 光环了
人工智能 2026/6/5

Mira Murati 重新露面:Thinking Machines 不能只靠前 OpenAI 光环了

Mira Murati 在沉寂约 18 个月后,现身 Bloomberg 旧金山访谈,为 Thinking Machines Lab 的 interaction models 预热,但没有给出发布日期。Thinking Machines 已有 Tinker 这个开源模型微调 API,新方向则瞄准音频、文本、视频连续流交互,约 200 毫秒一轮处理。更关键的是,她这次不是发布产品,而是在向市场证明:这家公司有方向、有组织能力,也有一套关于 AI 治理的说法。

Mira MuratiThinking Machines LabOpenAI
微软Scout“让人上瘾”文件风波:纳德拉否认目标,但责任链没说清
人工智能 2026/6/5

微软Scout“让人上瘾”文件风波:纳德拉否认目标,但责任链没说清

404 Media披露,微软Scout内部策略文件把第一阶段目标写进了“make people addicted”。纳德拉随后在内部否认这是公司目标,并称不确定文件来源。 这件事目前不能证明Scout造成用户成瘾,也不能把内部文件等同于微软公开战略。真正的问题是:带负责人署名的AI产品策略文件出现高风险措辞后,微软如何解释、追责和留痕。

微软ScoutAI助手微软
NVIDIA 4B 安全模型上架 Hugging Face:重点不是拦截,而是谁能写规则
人工智能 2026/6/5

NVIDIA 4B 安全模型上架 Hugging Face:重点不是拦截,而是谁能写规则

NVIDIA 在 Hugging Face 发布 Nemotron 3.5 Content Safety:4B 参数,基于 Google Gemma 3 4B IT,支持多模态、多语言、自定义 policy 和可审计输出。它的重点不是再做一个内容审核分类器,而是把企业 AI 安全推进到“可定制、可解释、可留痕”的治理层。真正要看的不是模型口号,而是 policy 怎么写、延迟能不能扛住、审计责任最后由谁承担。

Nemotron 3.5 Content SafetyNVIDIA内容安全
AI 编程争论的要害:速度和可信度要接上同一条反馈回路
人工智能 2026/6/5

AI 编程争论的要害:速度和可信度要接上同一条反馈回路

1. Simon Willison 转引 Charity Majors 的观点:AI 拥护者和怀疑者面对的都是现实风险,只是风险方向不同。 2. 拥护者怕错过能力跃迁,怀疑者怕代码产出超过可审查能力,拖垮可靠性、知识传承和运维。 3. 对工程负责人来说,关键不是站队,而是把 AI 使用、代码审查、测试、事故反馈和责任边界接成闭环。

AI 编程代码审查软件团队
大模型开始被测试“政治免疫力”了
人工智能 2026/6/5

大模型开始被测试“政治免疫力”了

爱沙尼亚语言研究所 ELI 和 Propastop 推出“宣传抵抗力”基准,测试数十个大模型在英、爱沙尼亚语、俄语中抵抗俄罗斯战略叙事的能力。Claude 系列在该基准中领先,Claude Opus 4.7 总分 94.9;但更关键的变量是:部分模型换成俄语提问后防线明显变薄。这不是全球通用安全排名,而是一张提醒牌:大模型正在被拉进国家叙事竞争。

大模型宣传抵抗力政治免疫力
人形机器人越像人,越要先问三件事
人工智能 2026/6/5

人形机器人越像人,越要先问三件事

人形机器人跳舞、后空翻、倒酒、搬箱子的视频正在走红,但这些画面只能说明局部能力,不等于稳定、自主、可泛化的工作能力。真正该看的不是它像不像人,而是是否完全自主、换环境能否重复完成、失败和人工介入有没有被展示。对投资、采购和产品团队来说,短视频可以看热闹,决策要看量化测试。

人形机器人机器人演示自主性
Chesky想另起AI实验室:Airbnb CEO不是离场创业,而是在试探新的AI入口
人工智能 2026/6/5

Chesky想另起AI实验室:Airbnb CEO不是离场创业,而是在试探新的AI入口

Airbnb CEO Brian Chesky计划支持成立一家新的AI实验室,消息最早由Bloomberg披露,TechCrunch随后获知情人士确认。关键不在于Airbnb要全面转型AI,而在于Chesky这位OpenAI早期盟友,开始试探把AI能力掌握在自己更熟悉的交互和设计层面。

AI实验室Brian CheskyAirbnb
Anthropic秘密递表IPO:收入跑得很快,算力账单也追得很紧
人工智能 2026/6/5

Anthropic秘密递表IPO:收入跑得很快,算力账单也追得很紧

Anthropic已秘密提交IPO申请,按报道,此前它以约9650亿美元估值融资650亿美元,且需求超额。公司5月年化收入超过470亿美元,较2025年底约90亿美元大幅增长,但这不是全年确认收入,也不是利润。真正的考题是:企业AI回报还在验证,算力成本又很重,公开市场会要求Anthropic证明增长能留下来。

AnthropicIPOClaude
QKV 不是圣物,KV Cache 才是账本
人工智能 2026/6/5

QKV 不是圣物,KV Cache 才是账本

ICML 2026 一篇论文系统测试 Transformer 的 Q/K/V 投影共享,发现共享 Key-Value 能把语言模型 KV cache 减半,只带来 3.1% 困惑度退化。它没有推翻三投影结构,但把注意力里的默认冗余量化了:端侧推理正在逼架构为内存账单让路。

TransformerKV CacheQKV 投影共享
Project Stratos削地近半,但犹他州AI数据中心的水电账还没算清
人工智能 2026/6/5

Project Stratos削地近半,但犹他州AI数据中心的水电账还没算清

Kevin O’Leary承诺把犹他州Project Stratos数据中心用地从约4万英亩削减近半,移除约1.943万英亩,并再削减东北部近公路区域620英亩。这个让步没有达到犹他州参议院议长J. Stuart Adams提出的削减75%要求;即使缩到约2万英亩,项目仍大于曼哈顿。真正的争议还在后面:AI数据中心的土地、水、电、生态和社区成本,谁来承担、怎么约束。

Project StratosAI数据中心Kevin O’Leary
ChatGPT 新记忆上线:AI 开始整理你没让它记住的事
人工智能 2026/6/5

ChatGPT 新记忆上线:AI 开始整理你没让它记住的事

OpenAI 开始向美国 Plus 和 Pro 用户推出基于 Dreaming 的新版 ChatGPT 记忆系统,之后会扩展到更多国家及 Free、Go 用户。 这次变化的关键,不是多存几条偏好,而是 ChatGPT 会在后台综合聊天历史,让长期上下文更连续、更及时。 对重度用户是效率红利;对平台权力来说,这是新的入口。谁掌握长期语境,谁就更容易留住工作流。

ChatGPTOpenAIDreaming
Google删掉“人在回路”:AI公司最怕写下责任
人工智能 2026/6/5

Google删掉“人在回路”:AI公司最怕写下责任

404 Media 报道 Google 员工内部分享吐槽其 AI 表现的 meme 后,Google 要求替换声明;新版本删掉了“维持人在回路中至关重要”。这不能证明 Google 取消人工审核,但说明“人工监督”这类话正在从安全承诺变成责任把手。对用户、企业客户和监管者来说,接下来该看的不是宣传里的“可信 AI”,而是企业是否愿意写清监督、申诉和追责机制。

AI责任人在回路中Google
Windows 重回 Build 开场:微软想把 AI PC 从口号拉回本地算力
人工智能 2026/6/5

Windows 重回 Build 开场:微软想把 AI PC 从口号拉回本地算力

微软在 Build 2026 开场把 Windows 放回核心位置,纳德拉用 Surface RTX Spark Dev Kit 吸引开发者,并称它为“dream machine”。 英伟达以 RTX Spark 芯片重返 Windows on Arm,微软和英伟达把它包装成 PC 的新起点,但现在还缺价格、性能、出货和采用度这些硬指标。 我更在意的是:Windows 是否正在从传统操作系统,转向承载本地 AI agent 和企业自有算力的平台。

本地 AI PCWindows微软
Waymo载客去偷瑜伽服,真正暴露的是无人车影像取证边界
人工智能 2026/6/5

Waymo载客去偷瑜伽服,真正暴露的是无人车影像取证边界

今年1月,旧金山一名窃贼乘坐Waymo无人出租车前往Hot 8 Yoga盗走瑜伽服后离开,警方至今未抓获嫌疑人。案件重点不在于“无人车帮助犯罪”,而在于车载影像保存、隐私模糊处理与执法调取之间的现实落差。它提醒城市管理者:robotaxi既不是天然的监控车,也不是完全脱离公共安全体系的普通交通工具。

Waymo无人出租车robotaxi
WWDC 2026:Siri 要从语音按钮变成办事入口,苹果最难的一关还没过
人工智能 2026/6/5

WWDC 2026:Siri 要从语音按钮变成办事入口,苹果最难的一关还没过

WWDC 2026 将于太平洋时间周一上午 10 点开幕,重点预计落在 Siri 大改版、Apple Intelligence 扩展和多系统 AI 功能上。最关键的看点不是苹果补了多少模型能力,而是 Siri 能否从问答工具变成跨 App 办事入口。普通用户可以观望,开发者要盯紧代理权限、调用规则和 App Store 分成逻辑。

SiriApple IntelligenceWWDC 2026
Meta 在 Facebook 推 AI 创作者助手:效率工具背后,是平台编辑权
人工智能 2026/6/5

Meta 在 Facebook 推 AI 创作者助手:效率工具背后,是平台编辑权

Meta 在 Facebook 推出面向创作者的 AI 助手,先在美国、加拿大、印度上线,可基于账号表现、社区和目标,回答发帖时机、评论反馈、受众变化和趋势选题等问题。它不是自动写稿工具,更像把后台数据、选题建议和发布节奏做成对话入口。对创作者来说,这是省时间;对 Meta 来说,这是把内容供给更紧地留在自家生态里。

MetaFacebookAI 创作者助手
华为开源 KVarN:长上下文推理,账单卡在 KV-cache
人工智能 2026/6/5

华为开源 KVarN:长上下文推理,账单卡在 KV-cache

华为 CSL 开源 KVarN,一个基于 vLLM v0.22.0 的 KV-cache 量化后端,Apache 2.0 协议,README 宣称 one flag 启用、无需校准,可把 KV-cache 容量提升 3-5 倍。更关键的是,它在披露测试中给出最高约 1.3 倍 FP16 吞吐、FP16 级准确率,并声称最高约 2.4 倍 TurboQuant 吞吐。我的判断:这不是模型能力新闻,而是长上下文和 Agent 服务开始认真清算 KV-cache 成本。

KVarNKV-cache华为 CSL
纽约法官痛斥虚假判例:AI 疑云下,律师最该怕的不是模型
人工智能 2026/6/4

纽约法官痛斥虚假判例:AI 疑云下,律师最该怕的不是模型

5月20日,纽约州最高法院上诉庭直播中,法官质问原告律师 Michael Sanders:上诉文件里至少3个案例疑似不存在,另有10个案例被指误述法律。法官没有明说这些错误来自生成式 AI,但已要求 Sanders 及其律所说明为何不应受制裁。真正刺痛人的地方,是对方律师也没发现;专业行业一旦把核查交给工具、流程和侥幸,职业信任就会被低成本自动化慢慢磨掉。

AI幻觉法律行业虚构判例
Google 的 75% AI 代码,卡在了人类评审那里
人工智能 2026/6/4

Google 的 75% AI 代码,卡在了人类评审那里

Google CEO Sundar Pichai 对外称,公司 75% 的新代码由 AI 生成;但内部员工正在 Memegen 上大量吐槽自家 AI 编程工具 Jetski。真正的问题不是 AI 会不会写代码,而是“生成”被算成生产力后,验证、审查、测试和维护成本被推给了一线工程流程。

AI 生成代码GoogleSundar Pichai
EVA-Bench 2.0 发布:语音 Agent 该从演示视频回到企业流程了
人工智能 2026/6/4

EVA-Bench 2.0 发布:语音 Agent 该从演示视频回到企业流程了

ServiceNow-AI 在 Hugging Face 发布 EVA-Bench Data 2.0,覆盖航空客服、企业 IT 服务、医疗 HR 三个领域,合计 213 个场景、121 个工具、35+ 工作流。它的价值不在制造一个新榜单,而在把语音 Agent 放进认证、权限、政策和不可满足请求里测试。对企业 AI 团队和 Agent 产品负责人来说,这更像一套上线前的流程压力测试清单。

语音 AgentEVA-Bench 2.0ServiceNow-AI
AI 内容都贴标签了,为什么还不让用户一键屏蔽?
人工智能 2026/6/4

AI 内容都贴标签了,为什么还不让用户一键屏蔽?

The Verge 批评 YouTube、Instagram、TikTok、Meta、Spotify 等平台已经在给 AI 生成内容打标签,却没有给用户按标签过滤、隐藏或降权的开关。问题不在识别技术,而在平台不愿把选择权交给用户,因为那会直接检验 AI 内容在推荐流里到底有多少真实需求。

AI生成内容内容标签内容过滤