纽约有人可以免费请人上门打扫房子。

代价很清楚:Shift 要拍下清洁过程。洗碗、擦台面、拖地、除尘,这些人类嫌烦、机器人学不会的琐碎动作,正在变成新的训练矿。

最值得注意的不是“免费”。互联网早就把这套戏演熟了。真正的新变量是,AI 公司这次要的不是你的点击、搜索和购买记录,而是你家客厅、厨房、水槽边那些没有被互联网充分记录过的动作。

更准确地说,机器人还没真正进家门,数据采集的人已经先进来了。

发生了什么:免费清洁,换家务视频

Shift 的模式很直接:

  • 在纽约提供免费上门清洁;
  • 交换条件是记录清洁人员工作的过程;
  • 视频内容包括洗碗、擦柜台、拖地、除尘等家务动作;
  • 公司还计划扩展到伦敦等城市;
  • 除了上门清洁,据报道,Shift 已经付费让 15 个国家的数万名用户通过 app 记录自己的活动。

这让事情从“一家公司做了个营销活动”,变成了更完整的信号:家务视频正在被系统性收集。

不是单点采样。是数据供应链。

这类数据为什么突然值钱?因为机器人公司缺的不是网页知识,而是物理世界里的“笨功夫”。

AI 类型主要数据最大难点训练目标
文本/图片 AI网页、图片库、公开视频版权、清洗、标注生成文字、图片、代码
家务机器人/物理 AI家庭、厨房、洗衣间、真实劳动现场空间、力度、摩擦、遮挡、材质把杯子拿稳,把地拖干净,把衣服叠好

人类觉得顺手的动作,机器人很容易翻车。

拿苹果,不能捏烂。倒水,不能洒。叠毛巾,要处理软材料形变。擦台面,还要理解边角、污渍、力度和物体避让。

这些不是多读几篇网页就能学会的。机器需要看人怎么做,最好是在真实房间、真实光线、真实杂乱里看。

所以 Shift 的价值,不在于一次清洁服务,而在于它找到了一个进入家庭场景的理由。

为什么重要:家庭是机器人最难爬的数据墙

过去十几年,互联网公司拿数据的地方主要在屏幕里。

搜索框、社交关系、购物车、地图轨迹、短视频停留时长。你以为自己在用服务,平台在读你。这个交易并不新鲜。

但家庭空间不同。

客厅、厨房、卧室、洗手间,不是公开视频库。里面有儿童照片、药盒、账单、门锁布局、生活习惯,也有没同意被拍的家人、访客、保姆和清洁工。

这就是家务视频比普通视频敏感的地方。

它记录的不是一个动作,而是一个家庭的运行方式。

机器人公司盯上这些数据,也不是 Shift 一家的冲动。新线索让这件事的行业轮廓更清楚了:

  • 印度家政平台 Pronto 被曝将客户家庭服务视频用于 AI 训练。Pronto 称录制需要用户明确 opt in,但市场反弹很快出现,竞争对手也急着声明不会在客户家里拍摄。
  • 硅谷的 Human Archive 想和服务平台合作,让零工戴摄像帽记录劳动过程。
  • 还有公司搭建“重复任务数据农场”,付钱让人一遍遍折毛巾、拿杯子、搬箱子。
  • 已经卖出去的机器人,也可能通过远程人工接管、失败回放和修正记录,把使用过程变成下一轮训练材料。

这几条线拼在一起,结论就很硬:物理 AI 的早期竞争,已经从模型论文和硬件演示,打到了真实世界数据入口。

谁能低成本、持续、合法地进入家庭,谁就更接近下一代家用机器人的平台位置。

谁受影响:用户和零工都在被重新定价

这条链路里,最直接受影响的是两类人:请服务的人,做服务的人。

对象得到什么交出什么
用户一次免费或低价清洁家庭空间、生活细节、视频数据控制权
清洁工/零工新任务、新收入劳动过程被拆成可训练、可替代的数据样本

用户最容易被“免费”打动。

这很好理解。谁不想少花一笔清洁费?尤其在纽约、伦敦这种城市,家政服务不便宜。看着家里乱成一团,有人愿意免费来打扫,吸引力很实在。

但问题卡在后半段:这段视频会保存多久?谁能访问?会不会被卖给第三方?是否用于训练通用模型?能不能要求删除?家里其他人的脸、声音、物品、空间布局怎么算?

如果这些没讲清,“同意”就只是一张很薄的纸。

零工的处境更微妙。

他们不是单纯在打扫房间,也是在给未来的自动化系统示范动作。今天的劳动被计件支付,明天的动作被模型吸收,后天可能反过来压低同类劳动的价格。

这不等于机器人马上替代清洁工。家务机器人离好用还远。

但平台经济最擅长的,不是立刻替代人,而是先把人的劳动流程标准化、数据化、可监控化。等标准足够细,议价权就开始移动。

清洁工拿到的是一次收入。平台拿到的是可复制的动作资产。

这笔账,不对称。

真问题不是拍不拍,而是边界谁来定

我不太买账“用户自愿交换,所以没问题”这个说法。

自愿当然重要。没有明确同意,直接拍摄家庭服务视频,那就是另一回事。但只有自愿,还不够。

真正要问三件事:

  • 同意是否充分.用户是否知道视频会被怎样使用,而不是只知道“会拍摄”?
  • 回报是否对等.一次免费清洁,是否足以交换长期训练价值?
  • 二次使用是否透明.数据能不能流向第三方、关联其他数据、训练更大的模型?

这三件事说不清,免费就会变成糖衣。

“天下熙熙,皆为利来。”这句话放在这里很合适。用户图免费清洁,公司图训练数据,平台图未来入口。问题不是谁道德更差,而是这场交易从一开始就不在同一张谈判桌上。

互联网时代的老剧本,是免费服务换行为数据。

搜索、社交、地图、短视频,都这么长大。今天只是场景换了:屏幕里的数据快被吃完了,家庭空间成了下一块难啃的骨头。

历史不完全一样。家务机器人确实需要真实世界数据,不能只靠模拟器和公开视频闭门造车。没有数据,机器人永远停在展台上,演示视频剪得再顺,也走不进厨房。

但这不能成为无边界采集的通行证。

铁路、电力、报业、电视、互联网,每一种基础设施扩张初期,都喜欢把“便利”摆在台前,把控制权藏在后台。等用户习惯了,规则也就固化了。

家庭机器人也可能走这条路。

先用免费清洁开门,再用数据优势训练模型,再把模型封进产品和平台,最后用户买回一个由自己生活训练出来、但自己无权审计的系统。

这听起来很荒诞。但平台商业史里,荒诞经常只是早期价格还没标出来。

接下来该盯什么:不是机器人多聪明,而是合同多清楚

这件事不能简单骂成违法,也不能天真夸成创新。

现实更麻烦:机器人公司确实需要家庭数据,家庭场景也确实是服务机器人绕不开的训练场。真正的分水岭,不在“要不要数据”,而在“数据权利怎么写”。

我会盯四个具体变量:

  1. 视频是否默认采集还是必须明确 opt in。
  2. 视频保存多久能否由用户要求删除。
  3. 是否用于训练通用模型是否卖给或分享给第三方。
  4. 家里非签约者、清洁工本人、访客的权利如何处理。

如果这些条款模糊,所谓免费清洁就不是用户福利,而是低价收购家庭数据。

机器人行业喜欢讲“具身智能”。这个词没错,但很容易遮住更粗粝的现实:所谓具身,最后要落到别人的厨房、地板、袜子、油渍和水槽里。

模型看着越来越强,产品反而越来越想进你的家。

我能理解这种技术需求,也承认它可能推动家务机器人变得更可用。但理解不等于放行。家庭不是公开视频库,家务也不是无主数据。

这条线如果现在不画,等机器人真的能干活时,平台主位早就坐稳了。