纽约有人可以免费请人上门打扫房子。
代价很清楚:Shift 要拍下清洁过程。洗碗、擦台面、拖地、除尘,这些人类嫌烦、机器人学不会的琐碎动作,正在变成新的训练矿。
最值得注意的不是“免费”。互联网早就把这套戏演熟了。真正的新变量是,AI 公司这次要的不是你的点击、搜索和购买记录,而是你家客厅、厨房、水槽边那些没有被互联网充分记录过的动作。
更准确地说,机器人还没真正进家门,数据采集的人已经先进来了。
发生了什么:免费清洁,换家务视频
Shift 的模式很直接:
- 在纽约提供免费上门清洁;
- 交换条件是记录清洁人员工作的过程;
- 视频内容包括洗碗、擦柜台、拖地、除尘等家务动作;
- 公司还计划扩展到伦敦等城市;
- 除了上门清洁,据报道,Shift 已经付费让 15 个国家的数万名用户通过 app 记录自己的活动。
这让事情从“一家公司做了个营销活动”,变成了更完整的信号:家务视频正在被系统性收集。
不是单点采样。是数据供应链。
这类数据为什么突然值钱?因为机器人公司缺的不是网页知识,而是物理世界里的“笨功夫”。
| AI 类型 | 主要数据 | 最大难点 | 训练目标 |
|---|---|---|---|
| 文本/图片 AI | 网页、图片库、公开视频 | 版权、清洗、标注 | 生成文字、图片、代码 |
| 家务机器人/物理 AI | 家庭、厨房、洗衣间、真实劳动现场 | 空间、力度、摩擦、遮挡、材质 | 把杯子拿稳,把地拖干净,把衣服叠好 |
人类觉得顺手的动作,机器人很容易翻车。
拿苹果,不能捏烂。倒水,不能洒。叠毛巾,要处理软材料形变。擦台面,还要理解边角、污渍、力度和物体避让。
这些不是多读几篇网页就能学会的。机器需要看人怎么做,最好是在真实房间、真实光线、真实杂乱里看。
所以 Shift 的价值,不在于一次清洁服务,而在于它找到了一个进入家庭场景的理由。
为什么重要:家庭是机器人最难爬的数据墙
过去十几年,互联网公司拿数据的地方主要在屏幕里。
搜索框、社交关系、购物车、地图轨迹、短视频停留时长。你以为自己在用服务,平台在读你。这个交易并不新鲜。
但家庭空间不同。
客厅、厨房、卧室、洗手间,不是公开视频库。里面有儿童照片、药盒、账单、门锁布局、生活习惯,也有没同意被拍的家人、访客、保姆和清洁工。
这就是家务视频比普通视频敏感的地方。
它记录的不是一个动作,而是一个家庭的运行方式。
机器人公司盯上这些数据,也不是 Shift 一家的冲动。新线索让这件事的行业轮廓更清楚了:
- 印度家政平台 Pronto 被曝将客户家庭服务视频用于 AI 训练。Pronto 称录制需要用户明确 opt in,但市场反弹很快出现,竞争对手也急着声明不会在客户家里拍摄。
- 硅谷的 Human Archive 想和服务平台合作,让零工戴摄像帽记录劳动过程。
- 还有公司搭建“重复任务数据农场”,付钱让人一遍遍折毛巾、拿杯子、搬箱子。
- 已经卖出去的机器人,也可能通过远程人工接管、失败回放和修正记录,把使用过程变成下一轮训练材料。
这几条线拼在一起,结论就很硬:物理 AI 的早期竞争,已经从模型论文和硬件演示,打到了真实世界数据入口。
谁能低成本、持续、合法地进入家庭,谁就更接近下一代家用机器人的平台位置。
谁受影响:用户和零工都在被重新定价
这条链路里,最直接受影响的是两类人:请服务的人,做服务的人。
| 对象 | 得到什么 | 交出什么 |
|---|---|---|
| 用户 | 一次免费或低价清洁 | 家庭空间、生活细节、视频数据控制权 |
| 清洁工/零工 | 新任务、新收入 | 劳动过程被拆成可训练、可替代的数据样本 |
用户最容易被“免费”打动。
这很好理解。谁不想少花一笔清洁费?尤其在纽约、伦敦这种城市,家政服务不便宜。看着家里乱成一团,有人愿意免费来打扫,吸引力很实在。
但问题卡在后半段:这段视频会保存多久?谁能访问?会不会被卖给第三方?是否用于训练通用模型?能不能要求删除?家里其他人的脸、声音、物品、空间布局怎么算?
如果这些没讲清,“同意”就只是一张很薄的纸。
零工的处境更微妙。
他们不是单纯在打扫房间,也是在给未来的自动化系统示范动作。今天的劳动被计件支付,明天的动作被模型吸收,后天可能反过来压低同类劳动的价格。
这不等于机器人马上替代清洁工。家务机器人离好用还远。
但平台经济最擅长的,不是立刻替代人,而是先把人的劳动流程标准化、数据化、可监控化。等标准足够细,议价权就开始移动。
清洁工拿到的是一次收入。平台拿到的是可复制的动作资产。
这笔账,不对称。
真问题不是拍不拍,而是边界谁来定
我不太买账“用户自愿交换,所以没问题”这个说法。
自愿当然重要。没有明确同意,直接拍摄家庭服务视频,那就是另一回事。但只有自愿,还不够。
真正要问三件事:
- 同意是否充分.用户是否知道视频会被怎样使用,而不是只知道“会拍摄”?
- 回报是否对等.一次免费清洁,是否足以交换长期训练价值?
- 二次使用是否透明.数据能不能流向第三方、关联其他数据、训练更大的模型?
这三件事说不清,免费就会变成糖衣。
“天下熙熙,皆为利来。”这句话放在这里很合适。用户图免费清洁,公司图训练数据,平台图未来入口。问题不是谁道德更差,而是这场交易从一开始就不在同一张谈判桌上。
互联网时代的老剧本,是免费服务换行为数据。
搜索、社交、地图、短视频,都这么长大。今天只是场景换了:屏幕里的数据快被吃完了,家庭空间成了下一块难啃的骨头。
历史不完全一样。家务机器人确实需要真实世界数据,不能只靠模拟器和公开视频闭门造车。没有数据,机器人永远停在展台上,演示视频剪得再顺,也走不进厨房。
但这不能成为无边界采集的通行证。
铁路、电力、报业、电视、互联网,每一种基础设施扩张初期,都喜欢把“便利”摆在台前,把控制权藏在后台。等用户习惯了,规则也就固化了。
家庭机器人也可能走这条路。
先用免费清洁开门,再用数据优势训练模型,再把模型封进产品和平台,最后用户买回一个由自己生活训练出来、但自己无权审计的系统。
这听起来很荒诞。但平台商业史里,荒诞经常只是早期价格还没标出来。
接下来该盯什么:不是机器人多聪明,而是合同多清楚
这件事不能简单骂成违法,也不能天真夸成创新。
现实更麻烦:机器人公司确实需要家庭数据,家庭场景也确实是服务机器人绕不开的训练场。真正的分水岭,不在“要不要数据”,而在“数据权利怎么写”。
我会盯四个具体变量:
- 视频是否默认采集还是必须明确 opt in。
- 视频保存多久能否由用户要求删除。
- 是否用于训练通用模型是否卖给或分享给第三方。
- 家里非签约者、清洁工本人、访客的权利如何处理。
如果这些条款模糊,所谓免费清洁就不是用户福利,而是低价收购家庭数据。
机器人行业喜欢讲“具身智能”。这个词没错,但很容易遮住更粗粝的现实:所谓具身,最后要落到别人的厨房、地板、袜子、油渍和水槽里。
模型看着越来越强,产品反而越来越想进你的家。
我能理解这种技术需求,也承认它可能推动家务机器人变得更可用。但理解不等于放行。家庭不是公开视频库,家务也不是无主数据。
这条线如果现在不画,等机器人真的能干活时,平台主位早就坐稳了。
