人工智能资讯 第6页
聚合当前分类下的最新内容,按时间顺序查看第 6 页精选文章。

Codex 的真变化:工程更快了,产品选择更难了
OpenAI 用 Nextdoor 案例宣传 Codex:工程团队用 GPT-5.5 调试疑难问题、跨端交付功能,把一部分实现瓶颈往前推。真正重要的不是写代码快了多少,而是工程师开始更直接地对产品结果负责。对技术管理者和产品工程师来说,接下来要看的不是要不要用 AI 编程,而是团队有没有能力选对问题。

Google Gemini 3.5 Live Translate 上线:实时语音翻译到了可用边缘
Google 发布 Gemini 3.5 Live Translate,把实时语音到语音翻译推向 Gemini Live API、AI Studio、Google Meet 和 Google Translate 应用。它的看点是 70 多种语言自动检测、几秒级延迟,以及尽量保留说话者语调、节奏和音高。我的判断是:它已经从演示能力走到产品入口,但还不能被当成嘈杂环境里的万能同传。

Claude Fable 5 发布:公开版变窄,强能力开始验人
Anthropic 发布 Claude Fable 5,但公开版遇到网络安全、生物、化学等敏感主题,会降级到 Claude Opus 4.8 或限制回答。Fable 5 与 Mythos 5 使用同一底层模型,后者只向 Project Glasswing 中少数可信网络防御者开放。重点不在模型又强了多少,而在前沿 AI 的访问权、定价权和信任门槛正在被重新划线。

微软 AI CEO 批评 Claude 宪法:AI 公司该不该把“模型感受”写进规则
Microsoft AI CEO Mustafa Suleyman 在 The Verge《Decoder》节目中批评 Anthropic,称在 Claude constitution 里讨论模型意识和福祉“非常危险”。争议点不是 Claude 是否已经有意识,而是 AI 公司能不能把这种不确定性写进指导模型行为的规则文本。我的判断是:研究上保持开放可以理解,产品治理里则要更克制,否则会把拟人化风险做进交互本身。

Claude Fable 5:单提示原型开始像交付了
Anthropic 公开了 Claude Fable 5,这是 Mythos 模型首个公众可用版本。Ethan Mollick 的个人测试显示,它能在 Claude Code 里用一次提示生成小游戏、地图可视化等项目,并按多页规格长时间执行。真正该看的不是 AI 会不会做游戏,而是原型生产成本继续下沉后,验证、质量和维护开始变得更贵。

苹果让 AI 自动改密码,难点不是点按钮
苹果在 WWDC26 宣布,iOS 27、iPadOS 27 和 macOS 27 的 Passwords 应用将借助 Apple Intelligence 与 Safari,自动处理弱密码和泄露密码的改密流程。它解决的是用户看见泄露警告却不改、拖延改、继续复用密码的老问题。真正要看的是,苹果能不能证明这个高权限代理能在不可信网页里安全替用户改凭据。

代码切换 ASR 基准发布:双语客户正在放大语音代理风险
ServiceNow AI 发布了一套面向企业语音代理的代码切换 ASR 基准,覆盖西英、法英、加拿大法英、德英四组混合语音,并开放数据集与 AU-Harness。 这套基准的价值,不是给所有企业选出一个“通吃模型”,而是把双语客户的真实表达方式拉进了 ASR 评估。 我更在意的是 AER:如果转写错误会让问答、派单、身份核验跟着错,语音代理就不能只看 WER 排名。

AI 公司开始算账:便宜模型正在改写推理成本
AI 企业开始重新评估小模型和廉价模型,不再默认所有任务都交给最强前沿模型。 Brian Armstrong 预测,未来 12-18 个月内,80% 工作负载可能迁移到便宜 99% 的模型上;这只是判断,不是行业统计。 真正受压的是模型选型逻辑:企业要从“买最强”转向“买合适”,OpenAI、Anthropic 等前沿实验室的收入叙事也会被成本现实追问。

Karpathy谈Claude Fable 5:软件成本下降后,需求可能先暴涨
Simon Willison 引述了 Andrej Karpathy 对 Claude Fable 5 的一段推文评价,核心不是一份产品测评,而是一个关于 AI 编程需求变化的判断。Karpathy 认为,当可运行软件越来越能“按一下就出来”,个人对软件的需求反而会明显增加。这更像软件领域的杰文斯悖论:效率提升不一定减少使用,可能把更多原本不值得做的小工具变成日常消耗品。

Claude Fable 5 开放:强模型的价格、隐私和闸门一起涨了
Anthropic 将首个公开可用的 Mythos 级模型 Claude Fable 5 上线 Claude API 和部分企业、订阅计划。它主打软件工程、知识工作和视觉能力,但在网络安全、生物、化学、模型蒸馏等高风险场景会拦截并回退到 Claude Opus 4.8。更关键的变化是:Fable 5 / Mythos 5 价格达到 Opus 4.8 的两倍,所有流量强制保留 30 天,强模型的使用代价正在被重新定义。

苹果 WWDC 2026:Siri 接上 Gemini,AI 没反超,但旧账开始还了
苹果在 WWDC 2026 发布 Siri AI、iOS 27、Apple Intelligence、搜索、照片、家长控制和 App Store 订阅捆绑等更新。重点不是苹果突然领先 AI,而是它承认 Siri、搜索、性能和基础体验拖了后腿,开始集中修补。普通用户可以先观望正式版,开发者更该关注订阅捆绑和系统级 AI 入口的变化。

Claude 5 被拆成两条轨道:Anthropic 把风险交给了白名单
Anthropic 发布 319 页系统卡,把同一代 Claude 5 拆成 Fable 5 和 Mythos 5:前者面向通用用户,后者只给少数可信伙伴。Fable 5 在生物、网络等高风险领域会触发保护并降到 Opus 4.8 水平;Mythos 5 是更强版本,但不公开开放。我的判断:这比直接放出满血模型更负责任,但也说明前沿 AI 正进入新阶段——能力继续往前推,风险靠访问许可来延后结算。

Claude Fable 5 发布:模型更强之外,AI 能力开始分级供应
Anthropic 发布 Claude Fable 5,同时向少数可信网络防御和基础设施机构开放同底层的 Claude Mythos 5。Fable 5 面向一般用户,Mythos 5 在部分领域放宽防护,初期通过 Project Glasswing 小范围使用。真正值得盯的不是模型又强了多少,而是前沿 AI 正在从统一发布走向按身份、场景和风险分配能力。

苹果把 AI 幻想装进照片 App,SynthID 接不住全部信任成本
苹果在 WWDC 2026 推出更激进的 AI 照片编辑能力:照片级生成、自然语言改图、扩图、清除和空间重构都进入照片相关工具。苹果没有放弃标记,称会嵌入 Google SynthID,并保留元数据标记;但水印只能帮助事后识别,补不回用户对手机照片的默认信任。最该观察的不是功能多强,而是平台能否自动识别、社交产品是否展示标记、普通用户会不会开始默认怀疑照片。

Claude Fable 5 上线:Anthropic 把“危险模型”拆成了两门生意
Anthropic 发布 Claude Fable 5,称它是迄今广泛开放的最强模型,也是首个公开售卖的 Mythos 级模型。更关键的不是它到底强多少,而是 Anthropic 正在用护栏、回退和可信访问,把同一个高能力底座切成不同风险等级的市场。

苹果让 AI Siri 缺席欧盟,真正卡住的是谁能管住入口
苹果宣布新一代 AI Siri 暂不在欧盟 iPhone 和 iPad 上线,理由是《数字市场法》的互操作要求会带来隐私与安全风险。欧盟回应称 DMA 没有禁止苹果发布新功能,问题在于苹果没有拿出合规方案。这场争议的核心不是 Siri 能不能做,而是谁有权定义 AI 助手进入系统、数据和应用的规则。

FAANG没倒,MANGOS在抢下一代科技叙事
MANGOS是一个在X上走红的新缩写,对应Meta、Anthropic、Nvidia、Google、OpenAI、SpaceX,还不是正式行业标准。它真正指向的是资本市场的新偏好:AI模型、算力、云和太空基础设施正在接过增长叙事。FAANG没有死,但创业公司、开发者和投资人要开始重新判断入口、成本和依赖风险。

Transload 用 CCTV 量货:工业 AI 值钱在不打扰现场
YC P26 项目 Transload 在 Hacker News 发布,目标是用货运站已有 CCTV 自动测量 LTL 货物尺寸,减少专用量方站带来的绕行、叉车移动和拥堵。 它真正要验证的不是“AI 进仓库”,而是现有摄像头加空间 AI,能不能在不改作业流程的前提下,把长期漏掉的计费变量抓回来。 目前别急着把它看成行业标准。关键还在关联准确率、单目 3D 测量误差、证据链和客户是否认可。

亚马逊员工在 Slack 吐槽 Kiro:企业 AI 落地的麻烦不在梗图里
404 Media 报道称,多名亚马逊员工在内部 Slack 频道用梗图吐槽 Kiro 等 AI 工具,以及曾经的 AI 使用排行榜。真正重要的不是 Kiro 是否失败,而是高层推动 AI 使用、指标激励与一线工程体验之间出现了落差。亚马逊回应称负面评论只代表少数人,超过 80% 软件开发者使用 Kiro,并称其带来效率和交付改善。

密西西比联邦法官撤下双方律师:AI 幻觉案例把一场合同官司拖停
美国密西西比北区联邦地区法院一宗合同纠纷中,双方律师都提交了含虚假案例引用的 AI 辅助文件,法官 Sharion Aycock 取消庭审、暂停程序,并将四名律师移出案件。真正的问题不在于律师用了 AI,而在于他们把核验义务交给了工具,法院正在给这种失职划线。

Google DeepMind 拉来 15 家欧洲机器人公司:具身智能开始抢底层入口
Google DeepMind 启动欧洲机器人加速器,选出 15 家早期机器人公司,提供 3 个月技术辅导、产品指导、合作伙伴网络,并开放 Google AI stack 与 Gemini robotics models。重点不在“扶持创业”,而在 Google 把大模型能力推向 physical AI / embodied AI:让 AI 进入真实世界的感知、行动和控制。对欧洲机器人创业者和投资人来说,机会是更快接入模型与工程资源,风险是底层工具、数据链路和部署路径更早被平台绑定。