人工智能资讯 第23页
聚合当前分类下的最新内容,按时间顺序查看第 23 页精选文章。

Singular Bank 用 ChatGPT 做内部助手:私人银行先被挤压的是材料工
马德里私人银行 Singular Bank 用 ChatGPT 和 Codex 做了内部助手 Singularity,接入核心系统,服务内部银行家。会前准备从约 20 分钟压到 1 分钟内,call reports 从 15–20 分钟压到 30 秒内,案例称每名银行家每天节省 60–90 分钟。真正的变化不在“银行用了 AI”,而在私人银行的竞争点正从资料整理,转向实时判断、客户关系和可追溯合规。

特朗普政府重启前沿 AI 测试:安全监督,还是新的准入门槛?
特朗普政府与 Google DeepMind、Microsoft、xAI 签署自愿协议,让 CAISI 对前沿 AI 模型做发布前后国家安全测试;这延续了拜登时期 AI 安全测试路线的一部分。关键不是特朗普“改口”,而是美国政府正在重新进入前沿模型评估环节。真正的风险在标准:如果测试方法和“安全”定义不清,评估可能变成政治审查、低效流程,或企业拿来背书的标签。

Claude 接上 Colossus 1:Anthropic 抢的不是算力,是生产环境门票
Anthropic 宣布 Claude 将接入 SpaceX/xAI 的 Colossus 1,并同步提高 Claude Code 与 Opus API 的部分限额。真正的信号不是马斯克阵营站队 Anthropic,而是 Claude 的瓶颈正在从模型能力转向推理供给:开发者要的不是一次惊艳回答,而是每天都能跑得稳。

Snap 与 Perplexity 4 亿美元合作终止,AI 搜索叙事少了一块收入拼图
Snap 在一季度终止了与 Perplexity 的 4 亿美元 AI 搜索合作,并称双方“友好结束”,最新销售指引也不再包含 Perplexity 贡献。真正重要的不是双方是否闹翻,而是 Snap 原本可写进 2026 年收入预期的 AI 搜索商业化样本暂时落空。Snapchat 用户仍在增长,但 AI 叙事需要从合作公告回到产品上线和收入兑现。

Google 关掉 Project Mariner:Agent 没死,入口被收回去了
Google 已在 2026 年 5 月 4 日关闭 Project Mariner,相关技术转入 Gemini Agent、AI Mode 等产品。更合理的判断不是 Google 放弃 Agent,而是砍掉实验品牌,把网页代办能力塞进搜索、浏览器和 Gemini 的主入口。接下来最该看的,不是演示有多顺,而是用户敢不敢授权、企业敢不敢接入、Google 敢不敢担责。

特朗普缩水版 AI 行政令:模型不用等许可,政府只拿到一张旁观席
特朗普签署的 AI 行政令没有变成外界担心的“上市前审批”,而是把部分前沿模型的发布前审查压成自愿提交、提前 30 天评估。真正重要的不是多了一个安全流程,而是美国政府明确放弃把它做成强制许可:安全旗还在,发布节奏不能被按住。

Brockman再谈OpenAI:马斯克出走是控制权之争,72小时危机暴露治理空壳
Brockman的庭审证词曾把马斯克离开OpenAI的核心矛盾指向营利化与控制权;他在Knowledge Project访谈中又补上了另一块拼图:OpenAI差点死在治理危机,而不是技术失败。Phoenix备份公司、Napa技术路线、Ilya推文反转这些细节说明,OpenAI真正的主线不是理想对商业的简单堕落,而是前沿AI在算力、资本、人才和治理之间被迫重组。

Flow maps:扩散模型少跑几步,还是换掉采样接口?
Sander Dieleman 发布《Learning the integral of a diffusion model》,把 flow maps 放到扩散模型采样问题里系统讲了一遍。核心变化是:不再只预测路径上的局部切线,而是学习同一路径上任意两点之间的映射。我的判断是,它目前更像新接口的候选,不是成熟替代方案;真正要看的不是能少跑几步,而是能否改写训练、奖励学习和可控生成的操作方式。

ServiceNow-AI 迁移 vLLM V1 的教训:RL 校正之前,先校准后端
ServiceNow-AI 在 PipelineRL 从 vLLM V0 迁移到 V1 时,发现在线 RL 曲线偏离参考 run:clip rate、KL、entropy、reward 和 trainer-side logprobs 都不再贴近 V0。修正路径不是直接改 RL objective,而是先对齐 logprobs 语义、V1 默认执行路径、在线权重更新和 fp32 lm_head。对做 PPO、GRPO、GSPO 的团队来说,迁移 V1 前最该做的是 parity run,而不是把新后端和新校正一起上线。

OpenAI用26名学生,给“AI原生大学生”打样
OpenAI推出首届ChatGPT Futures Class of 2026:26名学生来自20多所高校与机构,每人获得1万美元grant和前沿模型访问权限。更关键的不是表彰本身,而是OpenAI在用这些案例定义“AI原生大学生”:能更快把问题变成工具、研究和项目。它仍是公司叙事,不能直接证明AI教育效果;高校更该看课程边界、作品证据和持续成果。

Claude 的“做梦”不是玄学,Agent 的记忆权才是硬门槛
Anthropic 在 Code with Claude 开发者大会上,为 Claude Platform 的 Managed Agents 推出 research preview 版 dreaming:它不是意识或类人梦境,而是定期整理过去 session 和 memory store,把高价值模式写入未来任务上下文。对开发者和企业团队来说,重点不在名字,而在 Agent 正从临场聊天工具变成带组织记忆的工作系统。下一步最该看三件事:谁能审阅记忆、记忆能不能迁移、算力额度能不能跟上长任务需求。

OpenAI 庭审越打越难看:安全流程背后,是 AGI 控制权之争
Murati 证词把 OpenAI 的安全流程重新推上审判席,Zilis 出庭和相关文件又把问题往前推了一步:这不只是 Altman 是否说真话,也不只是 OpenAI 是否背离初心,而是谁想控制 AGI。新材料削弱了马斯克一方“拯救使命”的干净叙事,也让 OpenAI 自己的治理黑箱更难被轻轻放过。

DeepSeek估值传到450亿美元:低成本模型,正在被重新标价
FT和Bloomberg报道称,DeepSeek正洽谈首轮风险融资,潜在估值从数周前约200亿美元升至450亿美元,投资方传闻包括中国大基金、腾讯和阿里。重点不是450亿美元准不准,而是低成本、开放权重、国产算力适配这套故事,正在被人才战和产业资本重新定价。对开发者和产业观察者来说,接下来要看的不是单次模型跑分,而是股权激励、华为芯片适配效果和平台绑定程度。

Tilde.run 给 AI Agent 上事务沙箱:能回滚,不等于无风险
Tilde.run 现在处于 private preview,官网给出“Free to start”和一行安装命令,主打把每次 Agent 运行做成可提交、可回滚的事务。 它的看点不是普通容器隔离,而是把 GitHub、S3、Google Drive 和本地输出挂成统一的版本化 POSIX 文件系统,再叠加网络审计和 Agent 级权限控制。 我更在意的是:它能否真正降低 Agent 接生产数据的风险,而不是给已有沙箱、审计和 RBAC 换一层 AI 包装。

Code w/ Claude 2026 开场前:现在还不能把它写成 Anthropic 发布会
Simon Willison 于 2026 年 5 月 6 日在 Anthropic 的 Code w/ Claude 2026 现场开启实时博客,计划记录 keynote 和当天观察。现有正文只显示他已在 8:56 入座,等待 9 点 keynote 开始,尚不足以判断 Anthropic 发布了新产品、模型或价格策略。

Genesis AI 造了一只机器人手,真正的赌注是工人数据
Genesis AI 发布首个机器人基础模型 GENE-26.5,并展示自研仿人机械手完成做饭、弹琴、魔方和实验室操作。比 demo 更重要的是,它把仿人手、数据手套、第一视角视频和仿真评估绑成一套数据系统。我的判断是:全栈路线可能更接近机器人基础模型的真实难题,但工人补偿、数据归属和现场可靠性会先来讨债。

AI 编程代理越快,维护债越该算清楚
Simon Willison 摘引 James Shore 的观点,把 AI 编码争议从“谁为代码负责”推进到更硬的一笔账:如果 AI 让代码产出翻倍,维护成本就必须按反方向下降,否则团队只是把今天的速度换成明天的债。真正受影响的不是喜欢尝鲜的个人开发者,而是已经把 coding agents 放进交付流程的软件团队和技术负责人。

Aurora拿下McLane德州货运线:无人卡车从试点转进商业运营
Aurora与配送巨头McLane达成商业协议,将在达拉斯—休斯敦线路用无安全司机的自动驾驶卡车运货,车内仍有不操控车辆的human observer。 关键变化是:双方从2023年试点,走到每周7天商业运行,Aurora负责高速干线,McLane司机接手本地配送。 这说明Aurora已跨过试点门槛,但距离可持续规模化,还要看观察员退出、合同转化和责任成本。

a16z 投给 Ethos 2275 万美元:语音 AI 能把专家网络从头衔匹配拉到能力匹配吗?
Ethos 获得 2275 万美元 A 轮融资,a16z 领投,主打用语音 AI 访谈专家、生成更细的能力画像。它声称每周 onboarding 3.5 万名专家,这是增长亮点,也是质量疑点。真正要看的不是专家库变大,而是语音采集能否经得起验证、合规和客户复购。

Google 搜索正在把网页变成原料:AI 答案层比 Reddit 接入更狠
Google 在 I/O 2026 上继续把 Search 推向 AI 答案化和代理化:少给链接,多给总结,甚至替用户拆任务。比接入 Reddit 更关键的变化是,开放网页正在从搜索目的地退到后台原料库,独立网站、创作者和小型出版者会先感到流量和存在感被抽走。

微软重排 Office、Teams 与 Copilot:AI 办公的难点不在按钮,在汇报线
Rajesh Jha 将在 6 月 30 日退休,微软 Experiences and Devices 体系随之重组。Ryan Roslansky 已负责 LinkedIn 和 Office,现在新增 Teams,并领导新的 Work Experiences Group。更关键的变化是:Copilot、Agents、M365 基础能力被划给 Charles Lamanna,微软正在把 AI 办公从单点功能推进到跨应用工作流。