智能网原创,转载请注明出处
2024年上半年,工业界最出圈的视频是什么?特斯拉的擎天柱(Optimus)人形机器人在自家汽车工厂打工的画面算是一个。Optimus从传送带上拿取锂电池,然后整齐地放入电池槽中。这项工作过去是由工人来完成,现在换成人形机器人上岗了。
人形机器人开始进厂“搬砖”了,打工人会不会瑟瑟发抖呢?
从科幻走入现实
说到人形机器人,最初的印象大多来源于科幻影视:《星球大战》里唠叨没完的C-3PO、《终结者》里来自未来时空的T-800、《太空堡垒卡拉狄加》里的“赛昂”机器人叛军……但是现实中的人形机器人定义是什么,它能做什么,它对人类生活会产生什么影响?
“人形机器人是人工智能在物理空间的重要体现和关键设备,是实现通用人工智能系统的典型代表。”这是中国科学院院士乔红对人形机器人的定义。
通用人工智能(AGI)具有高效强大的自主学习、自我进化等能力,能像人类一样思考和决策。英伟达CEO黄仁勋判断,通用人工智能下一个发展浪潮将是具身智能(Embodied AI)。具身智能是一种拥有实体并且能够进行实体互动的通用人工智能体。具身智能最理想的实体形式,应该就是人形机器人。
老牌机器人企业为何按兵不动?
就在特斯拉等新兴实力在人形机器人领域大踏步地前进的同时,老牌的工业机器人企业缺鲜有涉足人形机器人行业。
发那科、ABB、库卡、安川电机号称工业机器人四大家,四家公司的工业机器人产品在全球市场占据了大部分的市场份额。但是奇怪的是,这四家公司都没有推出任何人形机器人整机型号,也没有见过它们要涉足人形机器人领域的新闻。
是缺乏资金吗?这四家企业都“不差钱”。是没有技术实力吗?四家公司都有成熟的工程师团队,没理由搞不定人形机器人技术。
事出反常必有妖!
虽然人形机器人的技术进步很快,甚至达到可以进厂打工的程度,但是目前人形机器人还是很难完成诸如拿取鸡蛋这类精细的动作,在精确控制方面还无法与功能专一的工业机器人相媲美。
要实现人形机器人在复杂场景下的精确操作,高算力和AI大模型必不可少。
训练人形机器人AI大模型的原料,就是大量的数据集,而目前整个人形机器人行业缺乏大规模的标准化数据集,每家机器人企业只有规模有限的数据量,用来训练AI模型无论在效率还是功能上都有不足,数据集已经成为人形机器人行业的核心壁垒。
例如,为了实现精密操作,机器视觉模块在原来主要满足避障、目标识别、路径规划等功能的基础上,还要配合运动系统实现高精度位置估计和机械手的伺服控制。机器人要确认末端执行器相对于物体的三维位置,需要传感器测量每个关节的角度值反馈给控制器,这需要很精确的正向运动学模型,来根据传感器提供的角度计算出此时末端执行器的位置。人形机器人通过巨大的样本集进行深度学习,不仅短时间内无法实现,也很难从价格上让大量用户所接受。
除了数据集稀缺,工业生产容错度低、大模型的语言歧义等安全性问题给产业落地也带来不小的挑战。此外,人形机器人实时性低,推理时间长。目前基于AI大模型的人形机器人控制周期在线决策最快是50毫秒,有时延迟达1~5秒,而工业机器人的响应时间往往要求在10毫秒以下。
软件还不是人形机器人厂家唯一头疼的问题,硬件的性能限制也是制约人形机器人发展的绊脚石。举例来说,全尺寸人形机器人的伺服驱动器工作电流在300安培左右,但是现在行业主流驱动器电流只能做到120安培左右。目前大部分人形机器人的驱动器来自一家以色列的公司,售价在2万元左右。这不但造成人形机器人成本高昂,国内企业还随时面临着“卡脖子”的隐患。
也许正因为有以上各种软硬件方面的缺陷和不足,所以人形机器人企业多为初生不怕牛犊的初创公司,而老牌的工业机器人企业则是稳打稳扎,更可能在行业技术成熟后再下场。
人形机器人商业化,任重道远
人形机器人并非新鲜事物,距离第一台人形机器人诞生已过去半个世纪,但是人形机器人的高昂成本、智能化水平一直是行业跨不过去的门槛。
就以美国波士顿动力公司的人形机器人Atlas为例,该型机器人经过十年的迭代发展,能够完成跳跃、后空翻等动作,但是造价仍然超过200万美元。由于无法商业化,波士顿动力公司被迫三次卖身“易主”。
人形机器人是机器人行业下一个有望暴发的经济增长点,但是人形机器人大规模走进工厂和家庭,完成商业逻辑上的闭环经营,目前看起来还是“将来时”而远非“现在时”,无论是机器人行业人士还是普通大众还需要有耐心继续等待……
(转载)