机器人手 DOF 能力解锁框架图
仓颉 / Faber · 用于 800 SKU 货架补货任务的末端执行器选型判断
①全控制:能力空间分母
一个"完整的抓取任务"包含哪些维度。下面四类是分母——任何指数配置都是对这个空间的部分覆盖。
全控制 Fully Control(拟人手的理论能力上限)
A. 接触与闭合
- 接近与建立接触
- 力闭合(摩擦锁定)
- 形闭合(几何锁定)
- 抓取面积包络
B. 掌内操作
- 掌内旋转
- 掌内平移
- 指间换握(gaiting)
- 物体翻面
C. 差速与独立
- 双指反向开合(剪刀手)
- 单指独立伸出(按键)
- 多点独立按压
- 抓握中工具激活
D. 力学锚定
- 尺侧弓稳定(ulnar arch)
- 扭矩下防脱(拧螺丝)
- 击打防脱手(握锤)
- 重物 power grasp
②动作演进:每加一指解锁了什么
每一档不是简单"多一根指"——而是拓扑能力 / 运动模型的跨档跃迁。注意三次"关键 unlock"。
能力:单点延伸(按按钮、戳屏幕)。不能:任何抓取——单点无 opposition,连摩擦力闭合都不成立。
▼ 关键 unlock 1:力闭合(friction force-closure) — 双指 opposition 建立
解锁:pad/side opposition、平行夹爪 pinch、规则盒袋抓取。
不能:圆形对称物体易滑、in-hand 操作拓扑不可能、剪刀类工具数学上做不出(1 个 DOF 无法生成反向差速)。
▼ 关键 unlock 2:形闭合(form-closure) — 3 接触点是 2D form-closure 数学下限
解锁:cylindrical power(瓶罐自定心)、sphere wrap、tripod pinch(笔/螺丝刀写字握法)、envelope grasp。
仍不能:剪刀类反向开合(centric closure 全部往内闭合,做不出差速)、连续 in-hand 换握、独立按键。
这是 Yale OpenHand 派的论点:80% ADL 时间 / 5 种 grasp 已覆盖
▼ 关键 unlock 3:差速运动(antagonistic motion) — 第四根指带来独立差速能力
4 指
(+食指独立)
Feix 28-30 / 33
解锁:剪刀手(拇指+食中独立反向)、finger gaiting 连续 in-hand 翻面、键盘多指按压、托盘+稳定五点接触。
典型:Allegro 16 DOF / LEAP 16 DOF — RL 训练的甜区。
仍不能:尺侧弓力学闭环(无小指 → 锤击防脱、扳手高扭矩退化 ~15-20%)。
▼ 边际 unlock 4:尺侧弓稳定(ulnar anchoring) — 小指 = power lock,不是 dexterity
解锁:握锤 pinky 锁、高扭矩握扳手、人类工具完备兼容(剪刀指环、键盘 home row、触屏多点)。
真实价值:工具几何是为 5 指设计的硬约束 + 商业 humanoid 的产品语言。
学术综述 (Falco 2025):尚无证据表明 5 指是最优解;DARPA Robotics Challenge 零队使用全驱 5 指
三次关键 unlock 的运动模型本质:
1→2 指:建立 opposition(对置)
2→3 指:建立 form closure(多接触点几何闭合)
3→4 指:建立 antagonistic differential(保持 grasp 同时指内反向运动)
4→5 指:建立 ulnar anchoring(尺侧弓力学锁定)
③运动模型抽象:把动作降维成基本类
"用剪刀" 这种任务抽象成运动模型 = "静态 grasp + 工具内反向激活"。下表把日常工具任务全部映射到几个基本运动类。
这是所有抓取算法的核心判断基准——只要任务能映射到已 unlock 的运动类,就可做。
| 运动模型抽象 |
DOF 门槛 |
含义 |
代表任务 |
| 单点接触延伸 |
1 指 |
单一刚性指尖按压、戳点 |
按按钮、戳触屏、拨开关 |
对置力闭合 Opposition Pinch |
2 指 |
两接触点 + 摩擦 → 静态夹持 |
抓盒子、抓卡片、平行 pinch 小袋 |
形闭合包络 Form Closure / Envelope |
3 指 |
三接触点几何锁定 + 自定心 |
抓瓶罐、抓球、抓圆柱物体 |
三指精捏 Tripod Pinch |
3 指 |
拇+食+中 形成稳定精度三角 |
握笔、握螺丝刀、握筷子(静态) |
工具内反向激活 In-Grasp Antagonistic |
4 指 |
静态 grasp 不变 + 两指做反向运动 |
剪刀、筷子夹取、镊子、订书机 |
指内连续差速 In-Hand Continuous |
4 指 |
掌内连续旋转/平移(finger gaiting) |
转笔、翻面、立方体重定向、魔方 |
独立多点按压 Independent Multi-Press |
4 指 |
多根指各自独立的按压动作 |
打字、弹琴、和弦多键 |
尺侧弓锚定 Ulnar Anchoring |
5 指 |
小指 + 无名 提供扭矩 / 冲击防脱 |
握锤击打、扳手高扭、提重物把手 |
双工具协调 Bimanual / Bi-tool |
5 指 × 2 手 |
同手分功能 or 双手协同 |
系扣、剥蒜、缠绕、针线 |
剪刀的运动模型本质:
剪刀 = "3 指静态 grasp" + "拇指与食中指做反向开合"。
3 指能完成抓住剪刀,但无法完成"抓住的同时让两组手指反向运动"——
这要求第四根指作为独立 actuator 维持 grasp。所以剪刀的 DOF 门槛是 4 指,
不是因为接触点不够,而是需要 in-grasp differential 这个运动类。
④800 SKU 实战判断:需要什么、可以放弃什么
把第 ③ 节的运动模型 × 我们 800 SKU 实际任务做交叉。
核心判断:那些"做不了"的动作,如果不在 800 SKU 任务中,就是可接受的。
✓ 必须能力(800 SKU 高频)
- 对置力闭合 — 盒装、卡装、薄袋
- 形闭合包络 — 瓶、罐、球形 SKU(占 ~35-40%)
- 大开度 — 适配 SKU 几何方差
- 软指尖 + 触觉 — 防滑、防压伤
- 5 cm 内薄物 pinch — 标签、薄盒
- 力调制 — 易碎品(鸡蛋、果冻杯)
△ 边缘能力(低频但有用)
- 三指精捏 — 取笔/小工具补货
- 掌内微调旋转 — 标签正面调整
- 单指延伸 — 按 POS、推开邻品
- 软包装包络 — 大袋装薯片(suction 更优)
- 柔性物体处理 — 散装产品(建议 suction 复合)
✗ 可放弃(不在 800 SKU 任务中)
- 剪刀手 / 工具内反向激活 — 货架补货不剪东西
- 连续 in-hand 换握 — 单手上货位姿可由 wrist + 重抓代偿
- 独立多点按压 — 不打字、不弹琴
- 尺侧弓锚定 / 锤击 — SKU 重量 < 3 kg,无冲击负载
- 高扭矩扳手类 — 不拧螺丝
- 双工具协调 — 单臂场景
- 针线 / 乐器类精细操作 — 远超场景
结论:800 SKU 的 DOF 配置判断
必须 unlock:力闭合(unlock 1)+ 形闭合(unlock 2)→ 3 指起步。
无需 unlock:差速运动(unlock 3)和尺侧弓锚定(unlock 4)所覆盖的任务(剪刀、锤击、键盘、扳手),
在 800 SKU 任务集中实质不存在。
选型推荐:3 指 underactuated + 大开度 + 软指尖 + 触觉反馈 + 可选 suction 复合。
BOM、可靠性、控制复杂度、数据采集成本全面优于 4-5 指。
战略风险:全球 VLA 数据生态偏向 2 指 / 5 指;3 指数据稀缺。
若依赖大模型迁移学习,需评估 hedge 路径(如模块化掌平台 + 可换指数)。