人工智能资讯 第7页
聚合当前分类下的最新内容,按时间顺序查看第 7 页精选文章。

Google DeepMind 发布 Gemma 4 12B:本地多模态模型开始挤进 16GB 级设备
Google DeepMind 于 2026 年 6 月 3 日发布 Gemma 4 12B,这是面向本地运行的 120 亿参数多模态模型,目标设备是 16GB VRAM 或统一内存级硬件。 它的看点不在 12B 这个数字,而在 encoder-free 统一架构:视觉和音频输入不再依赖传统独立多模态编码器。 对本地 AI 开发者来说,下一步不是先换机器,而是用 Ollama、LM Studio、llama.cpp 或 vLLM 跑一轮自己的任务,看内存、延迟和多模态稳定性是否过线。

Gemini 3.5 Live Translate 发布:Google 把近实时语音翻译塞进 API、Translate 和 Meet
Google DeepMind 发布 Gemini 3.5 Live Translate,支持自动识别 70+ 语言,并做近实时语音到语音翻译。关键变化不是“翻译更自然”这一点,而是 Google 正把这项能力放进开发者 API、Google Translate 和 Google Meet。它还不能被理解成无延迟同传:系统会落后说话者数秒,准确率、噪声环境、水印识别和企业合规仍是采用门槛。

Siri AI 跑上 Google 云,苹果的隐私牌开始打硬仗
苹果在 WWDC 确认,Siri AI 的部分高级云端模型会运行在 Google Cloud 的英伟达硬件上,但只限 Cloud Pro 这一层,不是整个 Apple Intelligence 搬家。苹果的解释是:Google 拥有服务器,不等于能访问用户请求;设备端仍由 System Orchestrator 决定哪些任务上云、哪些数据能离开设备。真正要看的,是苹果能否把 Private Cloud Compute 的隐私承诺,从自有硬件延伸到第三方云,并在夏季预览期补齐尚未完成的保护。

苹果把 AI 放进 Shortcuts:真正要看的不是聊天,而是设备自动化
iPadOS 26 首个开发者测试版里,苹果开始让用户用自然语言生成 Shortcuts 自动化和 Safari 简单扩展。它现在还不稳:简单短信指令能跑通,复杂任务频繁失败。更值得看的变量,是苹果能不能把 AI 变成设备操作入口,而不是再做一个聊天框。

苹果 AI 终于快来了:Siri 变聪明,赌注不在模型
Apple 在 WWDC 2026 重新押注 AI,核心是全新的 Siri AI:跨邮件、短信、日历、网页和第三方工具执行多步骤任务。多数能力仍要到今年晚些时候 beta,上线地区也有不确定性,欧盟和中国暂无明确时间表。苹果这次不是在模型竞赛里反超,而是在赌系统入口、设备生态和隐私叙事能把迟到的 AI 变成日常工具。

Orbital 融资 500 万美元:太空 AI 数据中心真正赌的是 Starship 价格
Orbital 从 a16z Speedrun 出来,拿到 500 万美元种子轮,计划把 AI 推理数据中心送上太空。它还没完成演示飞行,2028 年才计划发射首个数据处理航天器。真正的风险不在概念酷不酷,而在 Starship 能否把发射成本和频率打到商业可用。

Lovable自称年化收入超5亿美元:AI自然语言编程开始挤压SaaS,但还没赢下维护战
欧洲AI编程初创公司Lovable称年化收入运行率已超过5亿美元,平台累计生成项目超过5000万个,每周新增约100万个。这个数字说明自然语言生成软件正在从玩具走向业务工具,但项目数不等于成功产品,真正的考验是长期维护、弃用率和可靠性。

Sandstone 融资 3000 万美元:法律 AI 的机会,卡在企业法务入口
Sandstone 完成 3000 万美元 A 轮融资,Lightspeed Venture Partners 领投,Sequoia、Mantis VC、SV Angel 等参投。它不是把自己做成另一个 Harvey,而是盯住中小企业内部法务的需求入口、分流和工作流自动化。更准确的看法是:法律 AI 仍在升温,但 Sandstone 押的是一个未被充分服务、也很难只靠通用模型吃下的窄场景。

LLM 写代码越快,团队越该防着“AI 摇滚明星开发者”
Jesse Skinner 把失控使用 LLM 写代码,比作往团队里塞进一批“AI 摇滚明星开发者”:产出很快,但接手成本可能更高。 这篇文章真正要谈的不是 AI 能不能写代码,而是团队有没有把架构判断和工程责任交给生成式工具。 对团队负责人和高频使用 LLM 的开发者来说,关键动作是小步使用、严格评审、拒绝看不懂的“大段聪明代码”。

Hugging Face 的巴黎 3D 展馆 demo:主角不是新模型,而是 agents.md
Hugging Face 展示了一个编码 agent 串联两个 Spaces:先生成巴黎地标图片,再用 TripoSplat 转成 3D Gaussian splat,最后部署成 Three.js 静态展馆。更重要的信号不是 demo 多炫,而是 Spaces 正在尝试把多媒体 AI 模型变成 agent 可读、可调用、可组合的构件。对 AI 应用开发者和多媒体产品团队来说,这件事影响的是原型开发方式,但还不能直接等同于生产级自动化。

苹果守住了 Siri,但 AI 入口之争才刚开始
微软在 Build 2026 用 Project Solara 讲了一个“云端智能体+多设备入口”的未来,但它目前更像愿景,不是成熟产品。苹果在 WWDC 展示重做后的 Siri,重点仍是 iPhone 里的个人上下文、屏幕感知和跨 App 操作。短期看,苹果路线对消费者更现实;长期风险是,如果智能体真成了新入口,iPhone 的中心地位会被削薄。

AI 不再只会列清单:这个 ADHD 小助手,真正抓住了“开始”
Hugging Face 博客介绍了 NeuroBait:一个用 Gemma 3 12B 做 LoRA 微调的轻量 AI 助手,面向 ADHD 用户常见的“知道该做什么,但无法开始”。它的价值不在于宣称能治疗 ADHD,而在于把 AI 产品从“替人规划”推向“帮人启动”。

AI 把 ThinkPad X61 跑上 coreboot:固件逆向变快了,审查更贵了
coreboot 贡献者借助 Claude Opus 4.6、Ghidra 和 radare2,把近 20 年前的 ThinkPad X61 移植到 coreboot,固件逆向从可能数月压到数周。关键变化不是 AI 独立会逆向,而是封闭固件的时间壁垒被打薄。对开源固件开发者和硬件安全研究者来说,工具链变强了;对维护者来说,审查压力也变重了。

苹果的 AI 慢半拍,但账算得更冷
苹果在 WWDC 2026 推出迄今最大规模的 Siri AI 更新,部分联网回答由 Google Gemini 支撑,年底前才会以 beta 形式面向消费者。它没有证明自己赢了 AI 竞赛,但给出了一条更苹果的路线:少烧钱,贴系统,守入口。真正受影响的,不只是 iPhone 用户,还有那些依赖 App Store 分发的 AI 应用。

xAI把算力租给Anthropic和Google:马斯克的AI故事开始偏向数据中心
xAI正把部分大型算力租给Anthropic和Google,两笔月租合计超过20亿美元,但这不能直接等同利润。更关键的变化是,SpaceX/xAI正在把“快速建成可用算力”变成比“Grok追上最强模型”更容易讲清的资本故事。对Claude用户、企业客户和AI基础设施投资人来说,真正要看的不是热闹,而是容量、取消条款和算力折旧。

苹果上线 Core AI Beta:端侧神经网络推理有了新框架,但不是 Core ML 改名
苹果开发者文档已上线 Core AI Beta,用于在 Apple silicon 设备上构建、运行和部署端侧 AI 模型,系统门槛为 iOS、iPadOS、macOS、tvOS、visionOS、watchOS 27.0+ 等 Beta 版本。 更准确的判断是:Core AI 是面向神经网络端侧推理的新框架,不是 Core ML 的简单改名,也不能据此断言苹果发布了新的消费级 AI 产品。 它真正影响的是苹果平台 AI/ML 开发者的模型部署链路,尤其是模型转换、调试、性能分析和硬件调度。

Siri AI 这次更像能做成,但苹果还没赢回信任
苹果在 WWDC 2026 重新发布 Siri AI 和 Apple Intelligence:定制 Gemini 衍生模型、Private Cloud Compute、视觉 LLM 读屏、Core AI / PyTorch 接入都摆上了台面。相比 2024 年,这次技术路线更完整,但还只能说“更可行”,不能说“已成功”。普通用户别急着为测试版和新设备买单,开发者也该先看 coreai-torch 的真实迁移成本。

苹果在 WWDC 2026 展示 AI,变得更像实机验证了
苹果在 WWDC 2026 展示新版 Siri 和 Apple Intelligence 时,明显增加了真人手持设备、按键或语音触发、镜头拍摄设备响应的预录演示。重点不是功能多了多少,而是苹果在 2024 年 AI 承诺落空、随后以 2.5 亿美元和解诉讼后,开始修补可信度。对 iPhone 15 Pro 和 iPhone 16 用户来说,最现实的问题是:新版 Siri 是否真会随 iOS 27 覆盖到手里的设备,而不是继续停在发布会里。

OpenAI冲向IPO,World的虹膜身份生意先遇冷
OpenAI已宣布保密提交IPO申请,同一时间,Sam Altman参与的Tools for Humanity被曝正在裁员,消息来自Business Insider,TechCrunch称已求证但尚未确认。 Tools for Humanity运营World项目,核心是用Orb扫描虹膜来区分真人与机器人,再叠加Worldcoin等加密激励。真正的问题不是Altman的两家公司命运反差,而是“用虹膜换身份、用代币换增长”正在撞上信任、监管和真实需求三堵墙。

OpenAI重提AGI普惠,真正的考题是权力能不能被监督
OpenAI发布面向AGI未来的计划,称公司进入第三阶段:从AGI研究、产品化,转向让先进AI变得丰富、便宜、安全、易用。三项目标分别是自动化AI研究员、加速经济、为每个人提供个人AGI,但这些仍是愿景,不是已经交付的产品。真正要看的,是OpenAI在用普惠叙事解释更大规模部署,也在为前沿能力集中和全球治理需求寻找公共合法性。

iOS 27 继续放过老 iPhone,苹果把门槛挪到了 AI 功能上
iOS 27 的 iPhone 支持范围与 iOS 26 相同,最老覆盖到 iPhone 11 和第二代 iPhone SE;iPadOS 27 只砍掉第三代 iPad Air、第八代 iPad、第五代 iPad mini 这几款 A12 设备。真正影响换机判断的,不是能不能装系统,而是 Apple Intelligence 和更强本地模型继续按硬件分层。老 iPhone 用户可以先观望,重度 AI 用户和采购方要重新看功能清单,而不是只看系统版本号。