通过头戴式手机支架捕捉真实的任务执行过程
示例视频的动作标注:
端到端的数据处理流程,确保高质量交付
相机内参校准
第一人称视频
多轮审核把关
Verb + Noun
标准化编码
加密传输
厨房、洗衣、清洁、收纳
点餐、烹饪、传菜、清洁
陈列、补货、收银、导购
入住、客房服务、退房
第一人称视角原始录像
统一编码格式处理后
Verb-Noun 动作标签
覆盖商业服务与家庭生活场景的标准化动作分类
{
"taxonomy_version": "v2.0",
"scenarios": [
"home", "retail", "restaurant", "hotel"
],
"verbs": [
"take", "put", "open", "close",
"wipe", "pour", "hand", "point"
],
"nouns": [
"plate", "cup", "menu", "receipt",
"shelf", "towel", "key"
]
}
数据来自多个国家和地区,确保模型在不同环境下都能良好运行