

整理编译|TesterHome社区
来源|TechCrunch
物理AI(Physical AI)竞速白热化,机器人训练数据已成行业最大瓶颈。
一家硅谷初创公司Human Archive走出全新路径,他们正将目光投向印度蓬勃发展的家政、外卖等零工经济,让一线工人佩戴专属设备采集第一视角工作数据,直接供给全球AI实验室训练机器人,以构建用于训练机器人和物理人工智能系统的大规模数据集。
近日,该公司官宣完成820万美元融资,投资方有Wing Venture Capital、NVP Capital 和 Y Combinator 在内的投资者以及与 OpenAI、Nvidia、Google 和 Meta 相关的天使投资者。
Human Archive由加州大学伯克利分校学生Samay Maini、Rushil Agarwal和Shloke Patel以及斯坦福大学学生Raj Patel共同创立,Raj Patel担任首席执行官。创始人团队在机器人、硬件系统和触觉数据研究领域拥有丰富的经验。该模式走红的同时,也陷入合作争议与隐私监管漩涡。

行业痛点:实体AI缺“真数据”
当下全球机器人与前沿AI公司,都在攻坚能做现实家务、服务、手工的实体AI,但普遍卡在一个核心问题:缺少海量、真实、第一视角的人类工作视频与动作数据。
而印度恰好拥有全球最活跃的零工市场:外卖平台Zomato、Swiggy上市,云厨房爆发;Urban Company、Pronto等家政平台渗透率飙升,海量蓝领工人每天重复标准化服务动作——这成了Human Archive眼中的天然数据矿。
商业模式:零工戴头显,采集换收益
Human Archive的玩法很直接:
合作场景:对接印度家政、酒店、餐饮企业,让工人佩戴带摄像头的定制头显,采集第一人称视角工作视频。
用户激励:用户APP二选一——同意数据采集就享服务折扣,拒绝则付全款(用户接受度高,视频还能解决服务纠纷)。
工人薪酬:参与采集的零工时薪**1美元**,依托本地运营控制成本。
数据变现:把处理后的多模态数据卖给AI实验室与机器人公司。
目前,该公司已在印度部署超1000台活跃采集设备,合作覆盖多场景。

技术壁垒:不止拍视频,多传感器同步采集
和普通视频采集公司不同,Human Archive靠多模态数据建立壁垒:
设备:触觉手套、全身动捕服、腕部相机、RGB-D深度摄像头
数据:同步采集视频、动作、力反馈、深度信息
自研:已推出7款硬件、50余种采集设备,完成多源数据同步
投资方直言,全球暂无第二家能规模化同步这类数据,顶尖实验室都在排队合作。
争议与监管:头部企业拒绝,印度方面介入
这套模式并非一帆风顺,首先是合作碰壁,遭Urban Company、Pronto等印度家政头部公开拒绝,双方还在社交平台隔空互怼。
隐私风险也是争议之一,反对者认为第一视角视频涉及家庭隐私,数据合规存疑。
公司虽声称符合印度《数字个人数据保护法》,做匿名化、人脸模糊处理,但监管风险仍悬顶。
扩张计划:从印度走向全球
据了解,目前该公司已经进军东南亚、美国市场,在东南亚的具体做法是搭建全民数据采集平台,普通人也能参与赚钱;而在美国,正试点用清洁/烹饪服务,直接置换数据采集。
业内专家认为,实体AI的竞争,本质是数据的竞争。Human Archive把印度零工经济变成AI数据供应链,既踩中了行业刚需,也直面隐私、劳工、合作三大难题。
这种「零工数据→实体AI训练」的模式,会成为下一代机器人研发的主流路径吗?有待市场继续验证。
国内对标Human Archive的赛道
在中国国内,目前已形成对标海外Human Archive的具身智能(实体AI)数据采集赛道,同样采用「穿戴设备+第一视角+真人实景采数」核心逻辑,但中外商业模式、落地形态存在明显差异。国内赛道分为巨头自用闭环和初创第三方服务两大阵营,整体产业化更成熟、场景更丰富。
核心玩家有:
1. 产业巨头:京东(规模化众包采数标杆)
京东是国内公开规模最大的具身数据采数玩家,2026年官宣打造全球头部具身智能数据采集中心,自研JoyEgoCam轻量化头戴采集设备,联动60万员工、零工、社区居民众包采数,覆盖物流、家庭、工业、餐饮等全场景,目标两年积累千万小时级真实场景数据。
需要注意的是,京东以自用研发闭环为主,服务自有机器人体系,仅少量合规对外交易,并非Human Archive纯对外售卖数据的第三方服务商,仅采数模式相似。
2. 垂直初创(真正对标海外第三方模式)
星忆科技、艾欧智能、超维动力为核心代表,完全对标Human Archive第三方数据服务模式。主打轻量化头环、穿戴式传感设备,同步采集第一视角视频、人体动作、空间深度、力反馈多模态数据,软硬件一体化,专门为国内机器人、具身AI企业提供商业化训练数据,无自有机器人业务,纯数据供给。
3. 传统AI数据龙头(赛道跨界落地)
海天瑞声、数据堂等上市数据企业,2026年重点加码具身智能多模态数据业务,落地家政、工业、仓储等实景采集方案,依托成熟的数据标注、合规体系服务头部科技企业,商业化链路完善。
4. 本土零工采数(高度相似海外,试点落地)
趣活等国内零工平台联合数据服务商,复刻海外「服务工人穿戴设备+有偿激励采数」模式,依托家政、外卖、物流零工资源采集实景作业数据。精准修正:该模式目前处于试点阶段,尚未大规模商业化普及,和印度规模化部署存在体量差距。
中国vs印度(Human Archive)核心差异
1. 模式不同:海外是纯第三方数据售卖、完全开放商业化;国内巨头自用为主、初创开放服务,双模式并行。
2. 场景更广:不止餐饮、家政,覆盖物流仓储、工业制造、城市运维等高价值商用场景,落地实用性更强。
3. 合规更稳:严格遵循《个人信息保护法》,执行标准化匿名化、用户知情同意流程,行业常态化合规审核;无印度式政府立案调查、头部企业公开对立拒合作的舆论与监管风波。
4. 落地形态不同:国内依托成熟的电商、物流、本地生活生态,采数场景稳定可持续;海外高度依赖零散零工合作,合作壁垒高、争议频发。
总的来说,Human Archive属于单点创新的海外试点模式,靠零工经济解决实体AI数据短缺问题;中国国内已形成“巨头自用+初创商业化”的双向成熟赛道,众包采数规模、场景丰富度、合规完善度均领先海外单一区域模式,是当前全球具身智能数据迭代的核心阵地。
最新议题看这里→
大会火热报名中
7折购票优惠5月30日即将截止
5人及以上购票享团体优惠,每张再减100元
时间越晚折扣越少噢~
扫描下方二维码,即可参会


AI编码|团队新基础设施?MCP协议在AI辅助编程中的质量保障作用
AI测试|如何构建一个工程师真正会听取意见的AI代码审查工具
AI时代下,软件测试岗位正在消失吗?——全球科技公司的QA转型、裁撤与重构
