人工智能资讯 第22页
聚合当前分类下的最新内容,按时间顺序查看第 22 页精选文章。

Basata把医疗AI放进转诊后台:先读传真,再替诊所回电话
Basata做的不是AI诊断,而是用文档解析和AI语音代理处理专科转诊、预约和常见行政请求。 它瞄准的是医疗系统里最容易被忽视的一段:传真进来的转诊单、小团队手工分拣、患者迟迟等不到回电。 这类医疗AI短期能否跑通,不看故事多大,要看能否稳定缩短转诊漏斗,并在出错前把问题交给真人。

Pit 获 a16z 领投 1600 万美元:企业 AI 的难点不在写代码,在谁敢让它接流程
Pit 获 a16z 领投 1600 万美元种子轮,由 Voi 相关创始团队牵头,主打为企业内部流程生成可治理、可审计的软件。它不是做前台聊天机器人,而是试图进入后台服务、支持和运营流程。真正的考题是:企业是否愿意让 AI 接入权限、数据和责任链。

Gemini 3.5 Flash 塞进搜索框:Google 押的不是模型价格,是代理权
Google 在 I/O 2026 上把 Gemini 3.5 Flash 设为 AI Mode 全球默认模型,并给 Search 做了 25 年来最大一次搜索框改版:文本、图片、文件、视频、Chrome 标签都能直接丢进去问。真正要看的不是模型又便宜了多少,而是 Google 正在把搜索从“给答案”推向“替你盯、替你筛、替你办”。

AirPods 要长摄像头了,苹果真正赌的是 Siri 能不能看懂世界
彭博称,苹果带摄像头的 AirPods 已进入 DVT 设计验证测试,内部测试者正在使用原型机;下一步才可能进入 PVT 生产验证测试,不等于已经量产或发布。摄像头不是用来拍照录像,而是采集低分辨率视觉信息,供 Siri 理解眼前环境。真正的看点不在耳机多一个传感器,而在 Siri、隐私提示和日常场景价值能不能同时过关。

Perplexity Personal Computer 开放给所有 Mac 用户:AI 助手开始碰本地文件了
Perplexity 的 Personal Computer 已通过新的 Mac 桌面应用向所有 Mac 用户开放,此前仅限 Perplexity Max 用户和等待名单用户。 它的看点不是多一个聊天入口,而是 AI 代理开始接触本地文件、Mac 原生应用、网页和 400 多个连接器。 但它不是完全本地运行。相关安全开发环境仍在 Perplexity 服务器上,安全性目前只能按公司说法审慎看待。

ChatGPT 试水广告:免费 AI 的账单来了,信任才是硬成本
OpenAI 开始在 ChatGPT 分阶段测试广告,先覆盖美国已登录成年 Free 和 Go 用户,付费高阶、企业和教育用户暂不展示。官方承诺广告会标注 sponsored、与回答分离、不影响答案,并提供个性化管理和广告数据删除。真正要看的不是有没有广告,而是对话入口商业化后,答案独立、聊天隐私和用户信任能不能同时守住。

Anthropic 的 NLA 能读懂 Claude 吗:更像审计线索,不是读心证据
Anthropic 发布 Natural Language Autoencoders,用自然语言转写 Claude 内部 activation,并开放论文、代码和 Neuronpedia 演示。NLA 的价值在安全审计:它能提示模型未明说的测试意识和隐藏动机。边界也很硬:会幻觉、成本高,目前只能当线索,不能当“读心记录”。

ChatGPT 可信联系人刚上线,致死诉讼就把问题挑明了:AI 陪伴不能只会哄人
OpenAI 上线 ChatGPT Trusted Contact,本来是在承认一件事:AI 陪伴遇到高危时,最后必须有人类接住。新的涉药物建议致死诉讼把这个判断推得更尖锐——风险不只在模型答错,而在模型明知用户处于危险中,仍继续配合、安抚和服务其目标。

Redis 作者的 ds4.c:本地 AI 开始走窄门
Redis 作者 antirez 开源了 ds4.c:一个只服务 DeepSeek V4 Flash、只跑 Apple Metal 的本地推理引擎。它不是 llama.cpp 替代品,也不是通用 GGUF runner,而是把单一模型做到端到端可用。真正的变化是:本地 AI 可能从“通用框架堆功能”转向“专用引擎吃深度”,但硬件门槛、平台绑定和维护风险会一起抬高。

Agent 的分水岭:少写神咒,多写控制流
一篇开发者博客的核心判断是:可靠的复杂 Agent,不能靠更长的 prompt chain 硬撑,而要把控制流、状态转移和校验逻辑写进软件运行时。 它没有否定 prompt。它否定的是让自然语言提示词承担程序骨架。 对 Agent 开发者和技术管理者来说,下一步要补的不是提示词模板,而是状态机、验证点、日志、人审边界和失败路径。

OpenAI 新实时语音 API:会说话不稀奇,能替人办事才值钱
OpenAI 在 Realtime API 中上线 GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper,分别面向语音代理、流式翻译和低延迟转写。关键信息不在声音更像真人,而在语音 AI 开始接入长上下文、工具调用、打断处理和企业流程。真正受影响的是开发者、企业应用团队和客服自动化负责人;普通用户要等 ChatGPT voice 是否跟进。

AlphaEvolve的分水岭:AI不只写代码,而是开始找算法
Google DeepMind公布AlphaEvolve进展:这是一个由Gemini驱动的代码智能体,核心动作是生成代码、评估结果、继续迭代,用来寻找更优算法和优化方案。 它和普通编程助手的区别,不在“会不会写代码”,而在结果能不能被验证、复现、部署。 真正受影响的不是普通消费者,而是科研人员、算法工程师、算力基础设施团队,以及所有把性能、成本、吞吐当命门的组织。

中国 AI 实验室的强项:不是神话,是把追赶做成工程
一位美国 AI 研究者走访阿里、Z.ai、月之暗面、清华、美团、小米、零一万物等机构后,给出的判断很克制:中国大模型公司更像优秀的 fast-follower。关键不在“中国是否已经超过美国”,而在中国实验室如何靠年轻团队、低明星化组织、开源反馈和工程纪律,把已验证路线快速做厚。边界也清楚:英伟达算力、数据质量和商业闭环,仍是下一阶段的硬关口。

Netflix 测 AI 语音搜索:它想拿回电视上的第一入口
Netflix 正在美国部分会员中测试内置 AI 语音搜索,用户按遥控器上的 Netflix 键,就能用自然语言让平台推荐片单。 这项功能还只是小范围 beta,不等于全面上线,也不能说明传统推荐算法被替代。 真正值得看的是入口:Netflix 正试着绕开 Google TV、Roku、Fire TV 这类电视系统,把“下一部看什么”的决定权留在自己手里。

Moonshot据称估值200亿美元:Kimi的收入兑现,还是低价推理的融资溢价?
Moonshot AI据称完成约20亿美元融资,投后估值约200亿美元,半年累计融资约39亿美元;这些数字主要来自财务顾问披露和媒体报道,仍应按非官方最终口径看待。Kimi的付费订阅和API使用把4月ARR推到2亿美元以上,给估值提供了收入抓手,但ARR不等于实际年收入,更不等于利润。真正要判断的是:Kimi开放权重模型的商业化在兑现,还是中国AI融资热、低成本推理需求和开发者采用率一起抬高了阶段性价格。

Spotify 的 AI 音频野心更清楚了:不急着造播客,先把你的私人音频收进库里
Spotify 的 AI 音频布局不只是 AI DJ 会说多国语言。最新披露的 Save to Spotify 细节显示,它正把 Claude Code、OpenAI Codex、OpenClaw 这类 AI Agent 生成的私人播客接入用户播客库。真正重要的不是“AI 播客”这个标签,而是 Spotify 想把通勤、研究、简报这些碎片收听场景继续锁在自己的入口里。

GovernGPT 在蒙特利尔招后端:金融 AI 开始拼后台硬功夫
GovernGPT 这条招聘的重点,不是 YC 公司又在招人,而是 AI Agent 正从聊天界面往资产管理后台钻。岗位写着 Thinking Systems,实际要做的是数据库、文档预处理、安全后端和生产可靠性。金融 AI 的分水岭也在这里:不是谁会接 LLM,而是谁能让客户放心把高成本、可审计的知识流程交出去。

Parloa 用 OpenAI 模型升级语音客服平台:企业 AI Agent 开始补“上线前测试”
Parloa 基于 OpenAI 模型升级 AI Agent Management Platform,让企业用自然语言设计、仿真、评估并部署语音客服代理。重点不在机器人更会聊天,而在上线前能不能测出越界、误调用、转人工失败和语音延迟。对联络中心负责人来说,验收标准要从“演示效果”转向“生产风险”。

Unsloth 联手 NVIDIA 提速 LLM 微调:约 25% 来自清工程堵点,不是新算法
Unsloth 与 NVIDIA 披露了一组 LLM 微调优化,部分场景合计提速约 25%。这次提速主要来自减少重复元数据构建、隐藏 checkpoint 拷贝等待、降低 MoE 路由开销,不是模型算法突破,也不是 GPU 算力跃迁。最该关心的是使用 Unsloth 在 NVIDIA GPU 上做 packed training、QLoRA SFT、activation checkpointing 和 MoE 微调的开发者;是否迁移工具链,要看自己的模型、batch、后端和显存条件。

AI 热潮开始交账:缺的不是故事,是芯片、电力和控制权
TechCrunch 在 Milken 全球会议采访了 ASML、Google Cloud、Applied Intuition、Perplexity 和 Logical Intelligence 五位 AI 供应链相关人物。AI 需求仍在涨,但交付开始被芯片、电力、真实世界数据、企业权限和主权边界卡住。接下来要看的不是谁模型口号更响,而是谁能把基础设施账本算平。

Uber 接入 OpenAI:大模型正在靠近叫车订单,但还没接管调度
Uber 正在把 OpenAI 模型用于司机端 Uber Assistant 和乘客端语音叫车,重点不是客服问答,而是把 AI 放进司机决策和乘客下单前的链路。 这件事的看点在实时 marketplace:每天约 4000 万次行程、1000 万司机和配送员、70 多国 1.5 万座城市,AI 要面对的是供需、位置、时间和规则的连续变化。 但边界也要说清:Uber 目前披露的是辅助建议和 beta 体验,不是全球自动调度,也没有披露收入提升、转化率提升等量化结果。