机器人手 DOF 能力解锁框架图

仓颉 / Faber · 用于 800 SKU 货架补货任务的末端执行器选型判断

全控制:能力空间分母

一个"完整的抓取任务"包含哪些维度。下面四类是分母——任何指数配置都是对这个空间的部分覆盖。
全控制 Fully Control(拟人手的理论能力上限)

A. 接触与闭合

  • 接近与建立接触
  • 力闭合(摩擦锁定)
  • 形闭合(几何锁定)
  • 抓取面积包络

B. 掌内操作

  • 掌内旋转
  • 掌内平移
  • 指间换握(gaiting)
  • 物体翻面

C. 差速与独立

  • 双指反向开合(剪刀手)
  • 单指独立伸出(按键)
  • 多点独立按压
  • 抓握中工具激活

D. 力学锚定

  • 尺侧弓稳定(ulnar arch)
  • 扭矩下防脱(拧螺丝)
  • 击打防脱手(握锤)
  • 重物 power grasp

动作演进:每加一指解锁了什么

每一档不是简单"多一根指"——而是拓扑能力 / 运动模型的跨档跃迁。注意三次"关键 unlock"。
1 指
~8%
按、戳、点
能力:单点延伸(按按钮、戳屏幕)。不能:任何抓取——单点无 opposition,连摩擦力闭合都不成立。
关键 unlock 1:力闭合(friction force-closure) — 双指 opposition 建立
2 指
~40-50%
Feix 6-10 / 33
解锁:pad/side opposition、平行夹爪 pinch、规则盒袋抓取。
不能:圆形对称物体易滑、in-hand 操作拓扑不可能、剪刀类工具数学上做不出(1 个 DOF 无法生成反向差速)。
关键 unlock 2:形闭合(form-closure) — 3 接触点是 2D form-closure 数学下限
3 指
~80%
Feix 20-25 / 33
解锁:cylindrical power(瓶罐自定心)、sphere wrap、tripod pinch(笔/螺丝刀写字握法)、envelope grasp。
仍不能:剪刀类反向开合(centric closure 全部往内闭合,做不出差速)、连续 in-hand 换握、独立按键。
这是 Yale OpenHand 派的论点:80% ADL 时间 / 5 种 grasp 已覆盖
关键 unlock 3:差速运动(antagonistic motion) — 第四根指带来独立差速能力
4 指
(+食指独立)
~90%
Feix 28-30 / 33
解锁:剪刀手(拇指+食中独立反向)、finger gaiting 连续 in-hand 翻面、键盘多指按压、托盘+稳定五点接触。
典型:Allegro 16 DOF / LEAP 16 DOF — RL 训练的甜区。
仍不能:尺侧弓力学闭环(无小指 → 锤击防脱、扳手高扭矩退化 ~15-20%)。
边际 unlock 4:尺侧弓稳定(ulnar anchoring) — 小指 = power lock,不是 dexterity
5 指
~95%
Feix 30-33 / 33
解锁:握锤 pinky 锁、高扭矩握扳手、人类工具完备兼容(剪刀指环、键盘 home row、触屏多点)。
真实价值:工具几何是为 5 指设计的硬约束 + 商业 humanoid 的产品语言。
学术综述 (Falco 2025):尚无证据表明 5 指是最优解;DARPA Robotics Challenge 零队使用全驱 5 指
三次关键 unlock 的运动模型本质:
1→2 指:建立 opposition(对置)
2→3 指:建立 form closure(多接触点几何闭合)
3→4 指:建立 antagonistic differential(保持 grasp 同时指内反向运动)
4→5 指:建立 ulnar anchoring(尺侧弓力学锁定)

运动模型抽象:把动作降维成基本类

"用剪刀" 这种任务抽象成运动模型 = "静态 grasp + 工具内反向激活"。下表把日常工具任务全部映射到几个基本运动类。 这是所有抓取算法的核心判断基准——只要任务能映射到已 unlock 的运动类,就可做。
运动模型抽象 DOF 门槛 含义 代表任务
单点接触延伸 1 指 单一刚性指尖按压、戳点 按按钮、戳触屏、拨开关
对置力闭合
Opposition Pinch
2 指 两接触点 + 摩擦 → 静态夹持 抓盒子、抓卡片、平行 pinch 小袋
形闭合包络
Form Closure / Envelope
3 指 三接触点几何锁定 + 自定心 抓瓶罐、抓球、抓圆柱物体
三指精捏
Tripod Pinch
3 指 拇+食+中 形成稳定精度三角 握笔、握螺丝刀、握筷子(静态)
工具内反向激活
In-Grasp Antagonistic
4 指 静态 grasp 不变 + 两指做反向运动 剪刀、筷子夹取、镊子、订书机
指内连续差速
In-Hand Continuous
4 指 掌内连续旋转/平移(finger gaiting) 转笔、翻面、立方体重定向、魔方
独立多点按压
Independent Multi-Press
4 指 多根指各自独立的按压动作 打字、弹琴、和弦多键
尺侧弓锚定
Ulnar Anchoring
5 指 小指 + 无名 提供扭矩 / 冲击防脱 握锤击打、扳手高扭、提重物把手
双工具协调
Bimanual / Bi-tool
5 指 × 2 手 同手分功能 or 双手协同 系扣、剥蒜、缠绕、针线
剪刀的运动模型本质: 剪刀 = "3 指静态 grasp" + "拇指与食中指做反向开合"。 3 指能完成抓住剪刀,但无法完成"抓住的同时让两组手指反向运动"—— 这要求第四根指作为独立 actuator 维持 grasp。所以剪刀的 DOF 门槛是 4 指, 不是因为接触点不够,而是需要 in-grasp differential 这个运动类

800 SKU 实战判断:需要什么、可以放弃什么

把第 ③ 节的运动模型 × 我们 800 SKU 实际任务做交叉。 核心判断:那些"做不了"的动作,如果不在 800 SKU 任务中,就是可接受的。

✓ 必须能力(800 SKU 高频)

△ 边缘能力(低频但有用)

结论:800 SKU 的 DOF 配置判断

必须 unlock:力闭合(unlock 1)+ 形闭合(unlock 2)→ 3 指起步

无需 unlock:差速运动(unlock 3)和尺侧弓锚定(unlock 4)所覆盖的任务(剪刀、锤击、键盘、扳手), 在 800 SKU 任务集中实质不存在

选型推荐:3 指 underactuated + 大开度 + 软指尖 + 触觉反馈 + 可选 suction 复合。 BOM、可靠性、控制复杂度、数据采集成本全面优于 4-5 指。

战略风险:全球 VLA 数据生态偏向 2 指 / 5 指;3 指数据稀缺。 若依赖大模型迁移学习,需评估 hedge 路径(如模块化掌平台 + 可换指数)。