人工智能资讯 第21页

聚合当前分类下的最新内容,按时间顺序查看第 21 页精选文章。

OncoAgent 预印本发布:医疗 AI 的难点不是会回答,而是能被医院管住
人工智能 2026/5/10

OncoAgent 预印本发布:医疗 AI 的难点不是会回答,而是能被医院管住

Hugging Face 发布 OncoAgent 技术预印本,介绍一个面向肿瘤临床决策支持的开源、本地部署、多智能体 RAG 系统。它的主要价值不在单个医疗大模型,而在指南检索、分层路由、安全校验、人工审核和本地部署组成的工程体系。它仍是研究原型,不是获批诊疗产品,也不能替代医生。

OncoAgent医疗 AIHugging Face
英伟达承诺投向AI的400亿美元,正在把客户和订单绑成一圈
人工智能 2026/5/21

英伟达承诺投向AI的400亿美元,正在把客户和订单绑成一圈

英伟达在2026年前几个月已承诺超过400亿美元投向AI公司股权交易,OpenAI单笔约300亿美元。关键不在它有没有钱投,而在部分被投对象也可能是客户,资本、GPU订单和算力需求开始互相推高。若终端需求成立,这是护城河;若需求被提前催熟,就是风险放大器。

英伟达AI投资OpenAI
AI Agent 代改关键文档,真正危险的是静默改坏底稿
人工智能 2026/5/9

AI Agent 代改关键文档,真正危险的是静默改坏底稿

arXiv 预印本《LLMs Corrupt Your Documents When You Delegate》(2604.15597)提出 DELEGATE-52,测试 19 个大模型在 52 个专业领域的长流程委托编辑。结果显示,即使 Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4 这类前沿模型,流程末尾也会平均破坏约 25% 的文档内容。它提醒的不是“大模型不能写”,而是当前 AI agent 还不够格长期托管关键文档。

大语言模型AI agent文档编辑
AI 玩具涌进儿童房:毛绒熊接上大模型,谁来负责?
人工智能 2026/5/9

AI 玩具涌进儿童房:毛绒熊接上大模型,谁来负责?

AI 儿童玩具正在从实验品变成消费品,中国 2025 年已有 1500 多家 AI 玩具公司,华为 Smart HanHan 首周售出 1 万台,Miko 称销量超过 70 万台。风险不只是不当回答,而是成人通用模型被塞进儿童的陪伴、倾诉和假装游戏里。家长该延后采购,科技行业该盯住模型审核、数据边界和儿童关系设计。

AI儿童玩具儿童安全聊天机器人
Internet Archive Switzerland 启动:AI 时代,最该被保存的可能是模型底稿
人工智能 2026/5/10

Internet Archive Switzerland 启动:AI 时代,最该被保存的可能是模型底稿

Internet Archive 在瑞士圣加仑成立独立非营利基金会,重点不只是多一个海外节点,而是把濒危档案、生成式 AI 资料和 AI 模型归档放进更稳的制度环境里。真正的新变量是:它不是美国机构的瑞士办公室,而是法律上独立的瑞士基金会,并与圣加仑大学合作探索 Gen AI Archive。AI 越会改写信息,越需要有人保存模型、网页、数据线索和争议现场的底稿。

AI模型归档Internet Archive Switzerland生成式AI
从轮播图到 AI 聊天气泡:中小网站又一次把“像回事”当成需求
人工智能 2026/5/9

从轮播图到 AI 聊天气泡:中小网站又一次把“像回事”当成需求

一名网站开发者观察到,客户过去追逐首页轮播图、Cookie 横幅和标签管理器,如今开始要求右下角 AI 聊天气泡。很多客户并不是确认它能解决问题,而是看到竞争对手也有,担心自己的网站显得落后。对网站建设者和中小企业决策者来说,真正该问的不是要不要 AI,而是它是否知道营业时间、价格和真实业务信息。

AI 聊天机器人中小企业网站用户体验
ChatGPT 5.5 Pro 做出博士级数学?Gowers 这次测试,真正刺到的是选题门槛
人工智能 2026/5/9

ChatGPT 5.5 Pro 做出博士级数学?Gowers 这次测试,真正刺到的是选题门槛

菲尔兹奖得主 Timothy Gowers 记录了一次使用 ChatGPT 5.5 Pro 的经历:模型在很少人工数学输入下,约一小时内给出并整理了几项看似可验证的加性数论结果。结果仍需验证,不等于同行评审通过;但它已经足够提醒博士生和导师:低悬开放问题的价值正在重估。接下来最该看两件事:证明能否被独立审计,以及类似问题是否会被模型稳定复现。

ChatGPT 5.5 Pro数学研究大模型
Anthropic 被报估值万亿美元:AI 公司在扩张,更多公司在借 AI 裁员
人工智能 2026/5/9

Anthropic 被报估值万亿美元:AI 公司在扩张,更多公司在借 AI 裁员

Latent Space 的 AINews 把两组信号放到了一起:Anthropic 被报道称年化收入高速增长、二级市场估值进入 1 万亿至 1.2 万亿美元区间;Block、Coinbase、Cloudflare 等公司则以 AI readiness 或类似理由裁员。 这不是简单的“AI 替代人”。更准确的判断是:AI 正在制造经营分化,少数 AI 原生公司卖增长,更多转型公司把 AI 当作效率和收缩叙事。 对管理层和投资人来说,接下来要看的不是谁喊 AI,而是 AI 功能有没有带来新增收入、裁员后服务有没有变差、算力成本能不能被毛利率消化。

AnthropicAI估值
LLM 会写 TLA+ 还不够:SysMoBench 测的是能不能贴住真实代码
人工智能 2026/5/9

LLM 会写 TLA+ 还不够:SysMoBench 测的是能不能贴住真实代码

Specula 团队发布 SysMoBench,用 11 个真实并发和分布式系统评测 LLM 生成 TLA+ 规格的能力。 它的核心结论不是“LLM 不会形式化建模”,而是:语法和可运行性已经很强,贴合具体代码实现仍然弱。 对工程团队来说,采购或评估代码 agent 时,不能只看 demo 和编译通过率,要看 trace、conformance 和 invariant。

SysMoBenchLLMTLA+
Codex进了Ramp的PR流程:OpenAI这轮竞争,开始从“会写代码”卷到“敢进门禁”
人工智能 2026/5/21

Codex进了Ramp的PR流程:OpenAI这轮竞争,开始从“会写代码”卷到“敢进门禁”

OpenAI最新案例显示,Ramp已把 Codex with GPT-5.5 用进代码审查和内部 On-Call Assistant 开发,首轮PR反馈从数小时压到数分钟。这个样本补强了一个更现实的判断:AI编程工具的分水岭不在演示里写出多少代码,而在能不能进入企业真实流程、接受工程师反驳,并承担上下文推理的压力。

CodexOpenAIRamp
Claude Code 让 HTML 回到桌面:AI 答案不再只是文本,而是临时界面
人工智能 2026/5/9

Claude Code 让 HTML 回到桌面:AI 答案不再只是文本,而是临时界面

Anthropic Claude Code 团队成员 Thariq 近日分享了一个很实用的工作流:少让 Claude Code 输出 Markdown,多让它生成 HTML 文件或 HTML artifact。重点不是格式复古,而是 AI 代理正在把规格、PR 解释、审查报告和一次性工具做成可读、可点、可操作的页面;但 HTML 也会带来 token、diff、维护和合规成本。

Claude CodeAnthropicHTML artifact
Google 给 AI 搜索补链接:出版商要看的不是入口,是点击
人工智能 2026/5/9

Google 给 AI 搜索补链接:出版商要看的不是入口,是点击

Google 将在 AI Overviews 和 AI Mode 中增加更多外部网站入口,包括 Further Exploration、Expert Advice、来源悬浮预览,以及订阅媒体账号绑定测试。 这更像一次分发机制修正:AI 摘要占住搜索页顶部后,出版商担心点击、广告和订阅被截流。 但链接变多不等于流量回来。真正要看的是位置、点击数据、订阅转化,以及欧盟 DMA 是否迫使 Google 提供退出选项。

GoogleAI 搜索AI Overviews
AI 编程越强,程序员越不能只靠“会写代码”
人工智能 2026/6/2

AI 编程越强,程序员越不能只靠“会写代码”

AI 编程工具降低的不只是写代码成本,也在削弱“实现能力”本身的稀缺性。相比只讨论代码理解和维护风险,新的开发者角色讨论补上了更关键的一层:当领域专家也能做出软件雏形,工程师的护城河会从代码迁移到需求判断、系统边界和产品取舍。

AI 编程工具软件开发程序员
Chrome 下载 4GB 本地 AI 模型,问题不在 4GB,而在默认开启
人工智能 2026/5/9

Chrome 下载 4GB 本地 AI 模型,问题不在 4GB,而在默认开启

部分 Chrome 桌面用户发现浏览器下载约 4GB 的 Gemini Nano 本地模型,但这不是 Google 突然向所有用户统一推送的新东西;Google 称模型自 2024 年引入本地 AI 功能以来体积一直如此。 真正的问题是:本地 AI 被做成默认启用项,下载条件不够透明,用户往往是在占用空间后才知道可以关闭。 如果你在意磁盘空间或隐私边界,可以到 Chrome 设置的 System/系统 标签页关闭本地 AI;关闭后模型会被删除,也不会重新下载。

Gemini NanoChrome本地 AI 模型
美国法官推翻 DOGE 取消人文基金拨款:ChatGPT 不是宪法责任隔离层
人工智能 2026/5/9

美国法官推翻 DOGE 取消人文基金拨款:ChatGPT 不是宪法责任隔离层

美国地区法官 Colleen McMahon 在 143 页判决中认定,DOGE 取消 NEH 逾 1 亿美元、超过 1400 项拨款的做法违法且违宪,相关拨款取消决定需撤销。关键不在 ChatGPT 判断准不准,而在政府用它和关键词筛查 DEI、族裔、性取向等标签,并据此影响公共资助。判决给公共部门自动化划了一条线:AI 可以是工具,但不能替政府绕开第一修正案、第五修正案和平等保护责任。

ChatGPTDOGENEH
NHTSA调查Avride:16起碰撞给Uber Robotaxi扩张踩了一脚刹车
人工智能 2026/5/9

NHTSA调查Avride:16起碰撞给Uber Robotaxi扩张踩了一脚刹车

NHTSA下属ODI已对Uber合作方Avride启动调查,涉及16起碰撞和1起无需住院的轻伤事件,事故均发生在安全员监督下。问题不在于“自动驾驶又出事”这句空话,而在于并线、避障、慢车应对这些高频场景是否反复暴露短板。对Uber的robotaxi路线来说,Avride能否拿出整改数据,会影响达拉斯等城市的上线节奏和投资者信心。

自动驾驶RobotaxiAvride
Allen AI 发布 EMO:MoE 专家能不能真正拆开用
人工智能 2026/5/9

Allen AI 发布 EMO:MoE 专家能不能真正拆开用

Allen AI 发布 EMO:1B active、14B total、128 个专家、训练 1T tokens,重点是让 MoE 专家在预训练中形成更可选择的语义模块。它没有证明训练更便宜,真正价值在于部署时的小专家子集仍能保住较多性能。工程团队现在不该急着迁移,但可以把它当作评估专用 MoE 部署的一个新基线。

EMOMoEAllen AI
Altman 出庭,OpenAI 最危险的问题不在短信里
人工智能 2026/5/13

Altman 出庭,OpenAI 最危险的问题不在短信里

Sam Altman 已在加州联邦法院出庭,应对 Elon Musk 发起的诉讼。最新庭审进展把 OpenAI 的争议从创始人恩怨推进到治理控制权:Musk 要求解除 Altman、Greg Brockman 职务,并撤销 OpenAI 的营利化重组,但这些诉求目前尚未获法院支持。真正受影响的不是普通 ChatGPT 用户,而是押注 OpenAI API、企业版和 Microsoft 生态的公司与开发团队。

OpenAISam AltmanElon Musk
Airbnb 的 AI 账本:代码和客服先见效,旅行搜索还没成形
人工智能 2026/5/8

Airbnb 的 AI 账本:代码和客服先见效,旅行搜索还没成形

Airbnb 在 2026 年一季度财报会上称,本季度工程师产出的新代码约 60% 由 AI 编写,客服 AI 已能独立处理 40% 问题,此前约为 33%。这些数字不能等同于裁员或效率提升 60%,但说明 AI 已经在后台生产力上开始结账。真正没跑通的是前台:旅行搜索、比较和多人预订决策,仍不是一个聊天框能解决的事。

AirbnbAI 写代码客服 AI
PS5销量跌46%后,索尼把AI推上流水线:游戏会更多,玩家未必更幸福
人工智能 2026/5/9

PS5销量跌46%后,索尼把AI推上流水线:游戏会更多,玩家未必更幸福

PS5销量下滑46%的压力下,索尼正在把AI更深地放进游戏开发流程。新信息把焦点从“AI帮工作室降本提效”补到了更关键的一层:索尼自己也承认,高效AI工具会让更多游戏涌入市场。问题不只是谁做得更快,而是谁能在内容过载里被看见、被选择、被记住。

AI游戏开发索尼PS5
Hugging Face 跑通 AMD ROCm 微调样例:MedQA 的重点不是医疗,是非 CUDA 训练栈
人工智能 2026/5/8

Hugging Face 跑通 AMD ROCm 微调样例:MedQA 的重点不是医疗,是非 CUDA 训练栈

Hugging Face 博客发布 MedQA walkthrough:在 AMD Instinct MI300X 和 ROCm 6.1 上,用 LoRA 微调 Qwen/Qwen3-1.7B 做 MedMCQA 医学选择题问答。真正看点不是模型能不能看病,而是 PyTorch、Transformers、PEFT、TRL、Accelerate 这套常见 Hugging Face 微调流程,已经能在 ROCm 上完成一次小规模训练。边界也很清楚:只用了 2000 条样本,训练约 5 分钟,不能外推成医疗 AI 能力证明,也不能说 ROCm 全生态已经无痛。

Hugging FaceAMD ROCmLLM 微调