人工智能资讯第23页

人工智能 2026/5/7

Singular Bank 用 ChatGPT 做内部助手：私人银行先被挤压的是材料工

马德里私人银行 Singular Bank 用 ChatGPT 和 Codex 做了内部助手 Singularity，接入核心系统，服务内部银行家。会前准备从约 20 分钟压到 1 分钟内，call reports 从 15–20 分钟压到 30 秒内，案例称每名银行家每天节省 60–90 分钟。真正的变化不在“银行用了 AI”，而在私人银行的竞争点正从资料整理，转向实时判断、客户关系和可追溯合规。

ChatGPTSingularity私人银行

人工智能 2026/5/7

特朗普政府重启前沿 AI 测试：安全监督，还是新的准入门槛？

特朗普政府与 Google DeepMind、Microsoft、xAI 签署自愿协议，让 CAISI 对前沿 AI 模型做发布前后国家安全测试；这延续了拜登时期 AI 安全测试路线的一部分。关键不是特朗普“改口”，而是美国政府正在重新进入前沿模型评估环节。真正的风险在标准：如果测试方法和“安全”定义不清，评估可能变成政治审查、低效流程，或企业拿来背书的标签。

AI安全测试CAISI前沿AI模型

人工智能 2026/5/8

Claude 接上 Colossus 1：Anthropic 抢的不是算力，是生产环境门票

Anthropic 宣布 Claude 将接入 SpaceX/xAI 的 Colossus 1，并同步提高 Claude Code 与 Opus API 的部分限额。真正的信号不是马斯克阵营站队 Anthropic，而是 Claude 的瓶颈正在从模型能力转向推理供给：开发者要的不是一次惊艳回答，而是每天都能跑得稳。

AnthropicClaudeColossus 1

人工智能 2026/5/7

Snap 与 Perplexity 4 亿美元合作终止，AI 搜索叙事少了一块收入拼图

Snap 在一季度终止了与 Perplexity 的 4 亿美元 AI 搜索合作，并称双方“友好结束”，最新销售指引也不再包含 Perplexity 贡献。真正重要的不是双方是否闹翻，而是 Snap 原本可写进 2026 年收入预期的 AI 搜索商业化样本暂时落空。Snapchat 用户仍在增长，但 AI 叙事需要从合作公告回到产品上线和收入兑现。

SnapPerplexityAI 搜索

人工智能 2026/5/7

Google 关掉 Project Mariner：Agent 没死，入口被收回去了

Google 已在 2026 年 5 月 4 日关闭 Project Mariner，相关技术转入 Gemini Agent、AI Mode 等产品。更合理的判断不是 Google 放弃 Agent，而是砍掉实验品牌，把网页代办能力塞进搜索、浏览器和 Gemini 的主入口。接下来最该看的，不是演示有多顺，而是用户敢不敢授权、企业敢不敢接入、Google 敢不敢担责。

AI AgentGoogleProject Mariner

人工智能 2026/6/4

特朗普缩水版 AI 行政令：模型不用等许可，政府只拿到一张旁观席

特朗普签署的 AI 行政令没有变成外界担心的“上市前审批”，而是把部分前沿模型的发布前审查压成自愿提交、提前 30 天评估。真正重要的不是多了一个安全流程，而是美国政府明确放弃把它做成强制许可：安全旗还在，发布节奏不能被按住。

AI行政令人工智能监管特朗普

人工智能 2026/5/24

Brockman再谈OpenAI：马斯克出走是控制权之争，72小时危机暴露治理空壳

Brockman的庭审证词曾把马斯克离开OpenAI的核心矛盾指向营利化与控制权；他在Knowledge Project访谈中又补上了另一块拼图：OpenAI差点死在治理危机，而不是技术失败。Phoenix备份公司、Napa技术路线、Ilya推文反转这些细节说明，OpenAI真正的主线不是理想对商业的简单堕落，而是前沿AI在算力、资本、人才和治理之间被迫重组。

OpenAIGreg BrockmanSam Altman

人工智能 2026/5/7

Flow maps：扩散模型少跑几步，还是换掉采样接口？

Sander Dieleman 发布《Learning the integral of a diffusion model》，把 flow maps 放到扩散模型采样问题里系统讲了一遍。核心变化是：不再只预测路径上的局部切线，而是学习同一路径上任意两点之间的映射。我的判断是，它目前更像新接口的候选，不是成熟替代方案；真正要看的不是能少跑几步，而是能否改写训练、奖励学习和可控生成的操作方式。

flow maps扩散模型生成模型

人工智能 2026/5/7

ServiceNow-AI 迁移 vLLM V1 的教训：RL 校正之前，先校准后端

ServiceNow-AI 在 PipelineRL 从 vLLM V0 迁移到 V1 时，发现在线 RL 曲线偏离参考 run：clip rate、KL、entropy、reward 和 trainer-side logprobs 都不再贴近 V0。修正路径不是直接改 RL objective，而是先对齐 logprobs 语义、V1 默认执行路径、在线权重更新和 fp32 lm_head。对做 PPO、GRPO、GSPO 的团队来说，迁移 V1 前最该做的是 parity run，而不是把新后端和新校正一起上线。

vLLMServiceNow-AIPipelineRL

人工智能 2026/5/7

OpenAI用26名学生，给“AI原生大学生”打样

OpenAI推出首届ChatGPT Futures Class of 2026：26名学生来自20多所高校与机构，每人获得1万美元grant和前沿模型访问权限。更关键的不是表彰本身，而是OpenAI在用这些案例定义“AI原生大学生”：能更快把问题变成工具、研究和项目。它仍是公司叙事，不能直接证明AI教育效果；高校更该看课程边界、作品证据和持续成果。

OpenAIChatGPTAI原生大学生

人工智能 2026/5/7

Claude 的“做梦”不是玄学，Agent 的记忆权才是硬门槛

Anthropic 在 Code with Claude 开发者大会上，为 Claude Platform 的 Managed Agents 推出 research preview 版 dreaming：它不是意识或类人梦境，而是定期整理过去 session 和 memory store，把高价值模式写入未来任务上下文。对开发者和企业团队来说，重点不在名字，而在 Agent 正从临场聊天工具变成带组织记忆的工作系统。下一步最该看三件事：谁能审阅记忆、记忆能不能迁移、算力额度能不能跟上长任务需求。

Claude Managed AgentsAnthropicAI Agent

人工智能 2026/5/8

OpenAI 庭审越打越难看：安全流程背后，是 AGI 控制权之争

Murati 证词把 OpenAI 的安全流程重新推上审判席，Zilis 出庭和相关文件又把问题往前推了一步：这不只是 Altman 是否说真话，也不只是 OpenAI 是否背离初心，而是谁想控制 AGI。新材料削弱了马斯克一方“拯救使命”的干净叙事，也让 OpenAI 自己的治理黑箱更难被轻轻放过。

OpenAIAGIAI治理

人工智能 2026/5/7

DeepSeek估值传到450亿美元：低成本模型，正在被重新标价

FT和Bloomberg报道称，DeepSeek正洽谈首轮风险融资，潜在估值从数周前约200亿美元升至450亿美元，投资方传闻包括中国大基金、腾讯和阿里。重点不是450亿美元准不准，而是低成本、开放权重、国产算力适配这套故事，正在被人才战和产业资本重新定价。对开发者和产业观察者来说，接下来要看的不是单次模型跑分，而是股权激励、华为芯片适配效果和平台绑定程度。

DeepSeekAI融资450亿美元估值

人工智能 2026/5/7

Tilde.run 给 AI Agent 上事务沙箱：能回滚，不等于无风险

Tilde.run 现在处于 private preview，官网给出“Free to start”和一行安装命令，主打把每次 Agent 运行做成可提交、可回滚的事务。它的看点不是普通容器隔离，而是把 GitHub、S3、Google Drive 和本地输出挂成统一的版本化 POSIX 文件系统，再叠加网络审计和 Agent 级权限控制。我更在意的是：它能否真正降低 Agent 接生产数据的风险，而不是给已有沙箱、审计和 RBAC 换一层 AI 包装。

AI AgentTilde.run沙箱平台

人工智能 2026/5/7

Code w/ Claude 2026 开场前：现在还不能把它写成 Anthropic 发布会

Simon Willison 于 2026 年 5 月 6 日在 Anthropic 的 Code w/ Claude 2026 现场开启实时博客，计划记录 keynote 和当天观察。现有正文只显示他已在 8:56 入座，等待 9 点 keynote 开始，尚不足以判断 Anthropic 发布了新产品、模型或价格策略。

AnthropicClaudeCode w/ Claude 2026

人工智能 2026/5/7

Genesis AI 造了一只机器人手，真正的赌注是工人数据

Genesis AI 发布首个机器人基础模型 GENE-26.5，并展示自研仿人机械手完成做饭、弹琴、魔方和实验室操作。比 demo 更重要的是，它把仿人手、数据手套、第一视角视频和仿真评估绑成一套数据系统。我的判断是：全栈路线可能更接近机器人基础模型的真实难题，但工人补偿、数据归属和现场可靠性会先来讨债。

Genesis AI机器人基础模型GENE-26.5

人工智能 2026/5/12

AI 编程代理越快，维护债越该算清楚

Simon Willison 摘引 James Shore 的观点，把 AI 编码争议从“谁为代码负责”推进到更硬的一笔账：如果 AI 让代码产出翻倍，维护成本就必须按反方向下降，否则团队只是把今天的速度换成明天的债。真正受影响的不是喜欢尝鲜的个人开发者，而是已经把 coding agents 放进交付流程的软件团队和技术负责人。

AI 编程代理维护成本代码维护债

人工智能 2026/5/6

Aurora拿下McLane德州货运线：无人卡车从试点转进商业运营

Aurora与配送巨头McLane达成商业协议，将在达拉斯—休斯敦线路用无安全司机的自动驾驶卡车运货，车内仍有不操控车辆的human observer。关键变化是：双方从2023年试点，走到每周7天商业运行，Aurora负责高速干线，McLane司机接手本地配送。这说明Aurora已跨过试点门槛，但距离可持续规模化，还要看观察员退出、合同转化和责任成本。

自动驾驶卡车Aurora InnovationMcLane

人工智能 2026/5/6

a16z 投给 Ethos 2275 万美元：语音 AI 能把专家网络从头衔匹配拉到能力匹配吗？

Ethos 获得 2275 万美元 A 轮融资，a16z 领投，主打用语音 AI 访谈专家、生成更细的能力画像。它声称每周 onboarding 3.5 万名专家，这是增长亮点，也是质量疑点。真正要看的不是专家库变大，而是语音采集能否经得起验证、合规和客户复购。

Ethos语音 AI专家网络

人工智能 2026/5/23

Google 搜索正在把网页变成原料：AI 答案层比 Reddit 接入更狠

Google 在 I/O 2026 上继续把 Search 推向 AI 答案化和代理化：少给链接，多给总结，甚至替用户拆任务。比接入 Reddit 更关键的变化是，开放网页正在从搜索目的地退到后台原料库，独立网站、创作者和小型出版者会先感到流量和存在感被抽走。

Google 搜索AI OverviewsAI 答案化

人工智能 2026/5/6

微软重排 Office、Teams 与 Copilot：AI 办公的难点不在按钮，在汇报线

Rajesh Jha 将在 6 月 30 日退休，微软 Experiences and Devices 体系随之重组。Ryan Roslansky 已负责 LinkedIn 和 Office，现在新增 Teams，并领导新的 Work Experiences Group。更关键的变化是：Copilot、Agents、M365 基础能力被划给 Charles Lamanna，微软正在把 AI 办公从单点功能推进到跨应用工作流。

微软CopilotAI 办公

人工智能资讯 第23页

Singular Bank 用 ChatGPT 做内部助手：私人银行先被挤压的是材料工

特朗普政府重启前沿 AI 测试：安全监督，还是新的准入门槛？

Claude 接上 Colossus 1：Anthropic 抢的不是算力，是生产环境门票

Snap 与 Perplexity 4 亿美元合作终止，AI 搜索叙事少了一块收入拼图

Google 关掉 Project Mariner：Agent 没死，入口被收回去了

特朗普缩水版 AI 行政令：模型不用等许可，政府只拿到一张旁观席

Brockman再谈OpenAI：马斯克出走是控制权之争，72小时危机暴露治理空壳

Flow maps：扩散模型少跑几步，还是换掉采样接口？

ServiceNow-AI 迁移 vLLM V1 的教训：RL 校正之前，先校准后端

OpenAI用26名学生，给“AI原生大学生”打样

Claude 的“做梦”不是玄学，Agent 的记忆权才是硬门槛

OpenAI 庭审越打越难看：安全流程背后，是 AGI 控制权之争

DeepSeek估值传到450亿美元：低成本模型，正在被重新标价

Tilde.run 给 AI Agent 上事务沙箱：能回滚，不等于无风险

Code w/ Claude 2026 开场前：现在还不能把它写成 Anthropic 发布会

Genesis AI 造了一只机器人手，真正的赌注是工人数据

AI 编程代理越快，维护债越该算清楚

Aurora拿下McLane德州货运线：无人卡车从试点转进商业运营

a16z 投给 Ethos 2275 万美元：语音 AI 能把专家网络从头衔匹配拉到能力匹配吗？

Google 搜索正在把网页变成原料：AI 答案层比 Reddit 接入更狠

微软重排 Office、Teams 与 Copilot：AI 办公的难点不在按钮，在汇报线

人工智能资讯第23页