一、人形机器人定义
目前对于人形机器人没有一个统一的标准定义,比较权威的说法是源自《Humanoid Robots》的归纳,人形机器人应当能“在人工作和居住的环境工作,操作为人设计的工具和设备,与人交流”。所以通俗的理解就是一类具有人类外形、模仿人类功能和智能的机器人,能够适应人类 环境的不连续性,像人类一样使用自己创造的工具,并具有一定的认知和决策能力。同时,人类外形也更容易被人们接受,在人机交互过程中起到重要的作用。
人形机器人概念最早可以追溯到15世纪,由达芬奇画出第一份人形机器人的手稿,而第一款人形机器人则诞生于上世纪70年代,由日本稻田大学加藤一郎教授领导的团队研发出了世界上第一个全尺寸人形机器人WABOT-1,然后就开启了漫长的技术积累和商业探索,但一直受限于性能和成本。近些年随着人工智能、高端制造和新材料等技术的突破,人形机器人进入爆发期。
对于人形机器人来说,从结构上主要分为四大模块,包括环境感知模块、运动控制模块、决策控制模块、机械本体模块。其中,环境感知模块主要包括各类传感器以及相应的处理系统,如通过摄像头和图像处理系统进行视觉感知,能够识别人脸、物体和环境,使用麦克风和语音识别技术进行听觉感知,进行语音信号的接收和处理,配备一些触觉传感器,可以感知物体硬度、温度等信息。
运动控制模块是人形机器人的“小脑”,包括动力和运动控制系统,负责上实现机器人的动态平衡、步态规划、关节协调等功能,具备高度的精确性和灵敏性、良好的稳定性和控制能力,能够模仿人类行走、奔跑和抓取等动作,通常由运动控制器、驱动器、执行器和运动控制算法组成。
决策控制模块是人形机器人的“大脑”,由控制器、信号处理器和芯片等构成,内置AI算法,能够增强环境感知、路径规划、行为控制和人机交互能力,尤其是当下通过与大模型技术的结合,可以让机器人具备更高的智能水平、更强大的感知和交互能力,以及更负杂的运动和操作能力。
机械本体模块是人形机器人的机械体,包含躯干、关节、手脚和皮肤等,提供机器人的基本形状和结构支撑。其中躯干是本体部位的主要支撑,容纳传感器、电池管理和冷却系统,关节包括旋转关节和线性关节,由传感器、减速器、轴承和丝杠等部件组成,手脚则有机械臂、灵巧手等,模拟人类四肢,实现行走和物理抓取等行为,皮肤则使用柔性电子皮肤,模仿人类皮肤的触觉感知能力。
目前人形机器人市场和研发正处于快速变化和发展的阶段,存在多种分类方式,以下是当前常见的几种分类方式,如按移动方式、外观形态、驱动类型、尺寸规模或应用场景进行分类。
二、人形机器人市场
2.1 政策:推动落地
在全球范围内,各国政府都在积极出台相关政策,以促进机器人产业的发展。一是鼓励各企业与高校和研究机构展开研究合作,推动机器人应用落地;二是在经济政策上出台了相关税收优惠、研发资金支持等措施,以促进相关企业发展。
在国内,从2015年开始,中央以及地方就陆续出台了相关政策,鼓励机器人行业发展,涉及算法、场景、产业等多个维度,推动机器人在医疗、物流、特种等行业的应用。同时,政策逐渐向“人形机器人”的范畴聚拢,在2023年10月更是发布了《人形机器人创新发展指导意见》,从国家顶层设计上明确阶段发展目标,2025年初步建立人形机器人创新体系,实现“大脑、小脑、脑体”等一批关键技术的突破,整机产品实现批量生产。2027年形成安全可靠的产业供应链体系,加速实现产业规模化发展,深度融入实体经济。
2.2 社会需求:老龄化或人口红利减弱推动需求发展
国内近些年人口出生率持续下降,这就意味着未来劳动力供给也将呈下降趋势,尤其是在2021年中国已经进入老年人口占比14%的深度老龄化社会,未来将会面对劳动供给不足和老龄化难题。与此同时,就业人员工资的快速上涨,也加速了机器人替代趋势,结合人工智能、机械工程、通讯技术的高智能化人形机器人将成为一种有效的辅助工具。
2.3 投融资表现:资本持续加注
根据公开信息不完全统计,2024年Q1-Q2全球已发生25起人形机器人融资事件,融资总额超过10亿美元,已超过23年全年27起的超7.5亿美元融资总额。对于国内而言,在2024上半年共获16笔融资,融资金额超过20亿元,其中宇树科技B+轮融资达10亿人民币,银河通用机器人获投7亿元,创2024年天使轮融资最高额。
从国内近些年的融资轮次情况来看,近6成融资发生早期阶段,其中A轮占比最高为34%,天使轮占比为19%,从2023年开始,B轮及以后的融资占比提升,并且随着AI大模型发展、传感器技术和控制系统的进步,又涌现一批早期融资事件,开启了新一轮的融资周期。
新的融资周期的开启与大额融资的频频出现,无不表明资本对该赛道未来发展前景的看好,为产业发展注入强劲动力。
2.4 市场表现:利好因素多,应用前景广阔
从宏观环境看,利好政策不断出台,巨大的需求市场,坚实的产业链基础和不断提升的技术研发实力,必然会带来成本下降和体验上升,从而拓展更多应用场景,推动市场规模的不断扩大。
根据GGII 预测,2024 年全球人形机器人市场规模为 10.17 亿美元,到 2030 年全球人形机器人市场规模将达到 150 亿美元,2024-2030 年CAGR 将超过 56%,全球人形机器人销量将从 1.19 万台增长至 60.57 万台。中国在人形机器人赛道的年均增速将高于全球平均水平,2024 年中国人形机器人市场规模为 21.58 亿元,到 2030 年将达到近 380 亿元,2024-2030 年 CAGR 将超过61%,中国人形机器人销量将从 0.40 万台左右增长至 27.12 万台。
三、代表性公司与产品
当前人形机器人市场的主要参与者大体分为跨界企业、专业机器人厂商和新兴初创企业等。其中跨界企业多为汽车企业、互联网或科技巨头,他们通常拥有强大的资金和技术背景,并且在一些领域已经积累大量资源,可以快速进入并推动人形机器人行业的发展,例如特斯拉和小米依靠自身已有的资源或优势,快速推出相应的人形机器人产品,推动行业发展。
专业机器人厂商拥有深厚的行业经验和技术积累,通常专注于机器人技术的研发和创新,能够提供高性能的产品,如近期波士顿动力公司推出的电动Atlas人形机器人产品,展示了其在人形机器人领域的领导地位。新兴初创公司具有较高的灵活性和创新能力,对市场由敏锐的洞察,能够抓住市场机会,如1X Technologies在AI系统与实体机器人结合方面的创新,这些企业往往更加注重技术创新和快速迭代,有时能够以小博大,实现技术突破,如智元机器人在短时间内完成多轮融资并推出人形机器人产品。
3.1 特斯拉与Optimus
特斯拉是人形机器人产业的一个重要推动者,在2021年,马斯克就在首届特斯拉人工智能日(AI Day)上首次发布新一代产品特斯拉人形机器人-TeslaBot。在最初的构想中,这款人形器人身高5英尺8英寸(对应1.72m),具备承重45磅(20kg)的能力,使用轻质材料作为主体,全身上下分布合计40个电机驱动,头部配置Autopilot摄像头,具有如人类一般灵活的双手,并使用FSD作为其智能系统,可以说TeslaBot的横空出世,推动人形机器人进入快速迭代期。
2022年在AI Day上展示了人形机器人Optimus的原型机版本,根据现场的静态展示,机器人全身共计40个执行关节,配备了高自由度的灵巧手,可以进行自适应抓取,并具备抓取20磅重量物体的能力,且可使用工具以及紧握细小的物件。马斯克认为Optimus有望在3-5年内降本至2万美金一台,可以说特斯拉的强势入局,带动了其他企业的加速入场。
2023年特斯拉发布Optimus-Gen2演示视频,可以看到机器人在感知、力矩和运动性能方面都有所提升,可以实现二指拿鸡蛋等动作,并在2023年第四季度业绩交流会上提出2025年实现人形机器人的部分交付。
2024年发布最新一段视频显示Optimus已经在工厂内实际参与工作,视频中展示了机器人在分拣电池、行走和执行工厂任务的能力,表明机器人在灵活性、精确操作以及自主性方面取得的显著进步。
特斯拉的核心竞争优势就在于其具备完善的供应链体系可直接复用在人形机器人上。同时,自身也有机器人的应用场景,可以直接进行功能测试和数据收集。具有独特的FDS神经网络学习技术以及其他算法能力,可以有效提升机器人的智能水平,并且通过造车锻炼出来的规模化降本能力,可以有效控制成本,可以说在人形机器人领域从技术创新到市场引领,再到产业链影响,特斯拉都显示出来重要的推动作用和潜力。
3.2 波士顿动力与Atlas
波士顿动力是人形机器人领域的代表性公司,成立于1992年,旨在研发制造各类机器人。在人形机器人领域的拳头产品就是Atlas,从液压Atlas的首秀到近期推出的电动Atlas都给大众不小的震撼。
公司的液压Atlas人形机器人,在2013年首秀就展示了比其他机器人更优秀的表现,可以在石头上大跨步,金鸡独立也很稳,有重物砸过来也不倒,唯一的槽点就是背后需要有一个长长的电线供电。紧接着16年,公司推出了新版的Atlas,不仅去掉了那根电线,还穿上了新衣服,可以实现自己开门以及搬运重物,甚至被推倒了也能自己站起来。
在2018年发布了Atlas人形机器人的宣传视频,一度让人型机器人成为家喻户晓的程度,在视频中展示了机器人超强的运动能力,其中有分腿跳跃、360都旋转跳跃、倒立动作,甚至是翻筋斗等,非常的震撼人心。但在商业化的道路上一直很艰难,采用液压系统,成本很贵,所有动作都预先编程,弊端一堆,因此对比一众AI加持下的人形机器人公司,Atlas就像上个时代的产物,极致落寞。
而在2024年4月,公司宣布液压Atlas退役,宣布了电动Atlas的归来。在视频中,Atlas先是以一种极其诡异的方式,跟观众展示了一波身体的柔韧程度,比如 180 度转头、双腿反蜷着站起来、倒着走路,还有旋转上半身等,这样的宣传视频既炫酷又让人感觉有些惊悚。新版 Atlas 拥有类人型的外形,但不局限于人类的运动模式,这让它能够以最有效的方式完成任务,充分传达了波士顿动力公司对人形机器人的理解:构建人形机器人并不一定需要尽可能地像人。
3.3 Figure AI与Figure系列
Figure AI成立于2022年,是美国通用人形机器人的独角兽企业,公司团队规模70人左右,核心团队来自波士顿动力、特斯拉等,2024年2月B轮融资后,估值达到26亿美元。
Figure AI的技术路线是采用端到端的学习模式,通过神经网络来处理和分析视频数据,并公开展示了人形机器人在无需预设程序的情况下的高度自主性和智能化交互。同时与多家公司保持合作,以提升机器人能力。其中,与OpenAI合作接入ChatGPT,提升机器人在语义理解、场景识别、任务规划等方面的能力,Figure的神经网络完成快速、低等、灵巧的机器人动作。与微软在云服务设施合作,为Figure提供访问云计算平台Azure的人工基础设施和存储服务。与宝马达成合作,将人形机器人用于汽车实际生产流程中,完成各种生产任务。
目前公司发布的产品有以下两款:
Figure 01: Figure AI 于2023年10月正式发布的第一代人形机器人,并能够平稳流畅地行走。2024年1月Figure 01 在观看人类的演示视频后,经过 10 小时端到端神经网络训练,学会了使用咖啡机冲咖啡,并且能够自主纠错,展示出极其领先的自主学习与任务执行能力。2月即可完成自主搬运箱子的行为。3月接入GPT后可以流畅地执行递苹果、将垃圾收拾进筐里、将杯盘归置在沥水架上等操作,更重要的是这些操作都是基于提问者的一些开放性问题和要求,这意味着Figure01能够对话、思考和学习,比一般的机器人更像“人”。
Figure 02:Figure AI于2024年8月发布号称“地表最强”人形机器人的 Figure 02。作为后继者,Figure 02在设计和功能上均有了显著提升。在外观上采用哑光黑的外壳,取代了 Figure 01 的镀铬金属外观。在功能上,能够通过连接到与OpenAI合作训练的定制AI 模型,和借助麦克风和扬声器实现与人类进行实时语音对话。搭载机载视觉语言模型,配合6个RGB高性能摄像头实现快速常识性视觉推理。第四代灵巧仿生手臂,具有 16 个自由度,可提供相当于人类水平的力量。与上一代产品相比,车载计算和 AI 推理能力提高了 3 倍。配备 2.25 KWh 自定义电池组,续航提升 50% 以上。
3.4 Agility Robotics与Digit
Agility Robotics成立于2015年,是由俄勒冈州立大学孵化出来的机器人公司。主要面向面向工业、物流、研究和开发等领域,旨在通过先进的机器人技术提高效率、降低成本并增强人类的能力。最早推出的机器人为 Cassie(仅有双足),2019 年在 Cassie 的基础上加上躯干和手臂,从而推出了人形机器人 Digit,主要用于在人类空间中执行任务,如货物搬运、管理货架、检查和数据收集。
Agility注重应用,以“功能第一”的思维打磨产品,仅保留最精简、最核心的结构部分,比如机器人末端执行器采用夹爪,而非五指手的形态,因为就完成工作来说,并不需要一个更加复杂的‘手’。与亚马逊、福特等多领域公司展开深入合作,与福特公司合作共同打造自动化物流,汽车实现物品的远距离运输,Digit 则手持货物完成送货上门的最后一公里。在亚马逊工厂的物流仓库中,负责从货架上取箱子并放到传送带上。2023年9月,Agility Robotics 在俄勒冈州塞勒姆开设第一家机器人制造厂 RoboFab,预计第一年生产数百台Digit,随后扩展到每年生产1万台左右,目前虽然还未达到但也标志了“商业人形机器人大规模量产的开始”。
3.5 优必选与Walker系列
优必选科技成立于2012年3月,是人形机器人的领导者和智能服务机器人的领航企业,涵盖了多个行业的企业级和消费级广泛应用场景。在创业之初即推出过一款人形机器人Alpha,产品因四登央视春晚舞台表演而被大众熟知,也是“中国人形机器人第一股”。
优必选是全球极少数布局人形机器人全栈式技术能力的公司,包括行业领先的机器人技术(机器人运动规划和控制技术、伺服驱动器)、人工智能技术(计算机视觉和语音交互)、机器人与人工智能融合技术(SLAM 及自主技术、视觉伺服操作和人机交互),以及机器人操作系统应用框架(ROSA)。
从2016年推出Walker原型机以来,经历了五次迭代:
2016年发布Walker原型机,身高1.2m,重量20kg,12个自由度,能够实现全向行走、静态上下斜坡晃动平面平衡;
2018年1月发布Walker第一代,身高1.35m,重量37kg,14个自由度,突破了波动地形上的自平衡,能够实现上下楼梯、跟球踢球以及在三维数字地图中进行导航;
2019 年优必选推出 Walker 第二代,身高 1.45m,重 77kg,增加了双臂和双手,全身达到了36个自由度以及力觉反馈系统。此外,Walker 第二代还拥有视觉、听觉、空间知觉等全方位的感知,并实现了平稳快速的行走和灵活精准的操作,能够实现弹琴、倒水、画画、误导、全身柔顺控制以及复杂路径规划等;
2021 年优必选推出 Walker X,身高 1.30m、体重 63kg,具备 41 个高性能伺服关节构成的灵巧四肢,以及多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统,拥有全面升级的视觉定位导航和手眼协调操作技术,自主运动及决策能力大幅提高,可以实现平稳快速的行走和精准安全的操作,已在科普教育、影视文娱、政企展厅等领域实现了示范应用;
2023 年优必选推出工业版人形机器人 Walker S,身高 1.7 米,体重60kg,模块化末端执行器,搭载了 41 个高性能伺服关节以及多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统,能够实现环境任务感知、手眼协调精细操作、高精3D语义定位导航等,机器人的自主运动及决策能力大幅提高,可在工业及商用场景精准安全地完成指定工作任务。
另外还以熊猫为原型设计了机器人优悠,用于迪拜世博会中国馆,为参观嘉宾提供迎宾、导览服务。
3.6 宇树科技与Unitree H1/G1
宇树科技成立于2016年,专注于消费级、行业级高性能通用足式/人形机器人及灵巧机械臂的自主研发、生产和销售。曾受邀参加 2021 牛年央视春晚,2023 杭州亚运会和亚残运会等,并多次受到央视新闻联播报道。宇树科技也是全球首家公开零售高性能四足机器人并最早实现行业落地的公司,全球销量历年领先。
宇树科技拥有十年机器人研发能力,技术优势在于机器人核心零部件、运动控制、机器人感知等领域的领先性,并且在核心硬件上,包括伺服电机、减速器、控制器均为宇树自研自产,软件层面,公司不依赖开源代码,对于电控系统、控制算法进行全栈自研。产品广泛应用于应急救援、巡逻、侦查、广场执勤、危险品排爆、人员搜救、生命探测、防爆处置、违章违法记录、电力线路巡检、有害气体检测等场景,积累了丰富的应用经验。
23年8月宇树发布首款人形机器人H1,切入人形机器人领域,H1整机重量47kg,身高180cm,4个单手臂自由度(可拓展),5个单脚自由度(髋关节 *3+膝关节 *1+踝关节 *1),行走速度3.3m/s,使用3D激光雷达+深度相机进行感知,售价六十万左右;24年5月宇树发布新型人形机器人G1,商用性能显著提升。G1整机重量35kg,身高127cm,7个单手臂自由度(肩关节*3+肘关节*2+腕关节*2),6个单腿自由度(髋关节 *3+膝关节 *1+踝关节 *2),行走速度2m/s,使用3D激光雷达+深度相机进行感知,续航时间约2小时,具有灵巧手,售价在9.9万。
3.7 智元机器人与远征/灵犀
智元机器人成立于2023 年 2 月,专注人形机器人领域,是一家致力于以AI+机器人的融合创新,打造世界级领先的具身智能机器人产品及应用生态的创新企业。在成立仅约半年后的 2023 年 8 月 18 日在上海召开新品发布会,正式发布远征 A1 智能机器人。
公司在算法研发、智能机器人领域有丰富经验,自研了关节电机 PowerFlow、灵巧手 SkillHand、反曲膝等关键零部件,其中关节电机PowerFlow 使用了准直驱关节方案,实现了低齿槽转矩设计,搭配 10 速比以内的高力矩透明度行星减速器、共扼同轴双编码器、一体液冷循环散热系统,以及自研的矢量控制驱动器,峰值扭矩超过 350NM,而重量仅为 1.6KG。灵巧手 SkillHand 拥有 12 个主动自由度和 5 个被动自由度,所有驱动内置,并集成了基于视觉的指尖传感器,专门面向精密操作,此外在软件层面,智元机器人还自研了AgiROS 等系统,在AI感知决策与视觉控制等大模型算法方面,实现自主任务编排、常识推理与规划执行等。
远征A1是智元第一代通用型具身智能机器人,整机重量55kg,身高175cm,行动速度7km/h,49个自由度,单臂最大负载5kg,使用云端超脑、大脑、小脑、脑干的具身智脑EI-Brain架构,采用上下肢分体式设计,便于场景配置和扩展,配备WorkGPT多模态大模型和AgiROs系统,赋予机器人理解用户意图、感知环境、任务编排等能力,可调用本体技能及海量工具完成多层级任务。
远征A2系列包括远征A2、远征A2-W、远征A2-Max。远征A2是一款交互服务机器人,整机重量69kg,身高169cm,40+全身自由度,700wh电池支持续航2h,整体设计参考人体工学设计,身高尺寸比例贴近人类,符合人因工程学原理,HRI设计更贴近人类自然交互体验,基于语音、语言、动作等大模型技术,实现多模交互,带来智能体验;远征A2-W是一款轮式双臂机器人,专为柔性智造场景打造,整机重量230kg,单臂负载5kg,7个单臂自由度,作业高度0-2m,2kWh电池支持续航5h,全身一体化设计,实现开箱即用,拥有仿生双臂设计、高精度力控、多个深度与视觉传感器以及四轮四驱系统,确保在复杂环境中稳定、灵活、高效、安全的作业,非常适用于B端制造业场景。
远征A2-Max是重载特种机器人,整机重量85kg,身高175cm,67个全身自由度,行走速度1m/s,续航2h且支持换电,双臂采用双速比减速关节模组,峰值扭矩可达450Nm,大腿采用直线推杆电机,腿部关节拥有8800N推理,实现全工作空间可搬运40kg重物。
灵犀X1系列:包括灵犀X1和灵犀X1-W。灵犀X1是一款高自由度、模块设计的人形机器人,适合人机交互与轻服务场景。灵犀X1-W是一款专业数采机器人,用于大规模数据采集。
3.8 北京银河通用机器人与GALBOT G1
北京银河通用机器人有限公司(GALBOT)成立于2023年5月,是一家专注于具身多模态大模型通用机器人研发的创新企业。致力于为全球用户提供智能机器人产品,服务于人类社会。公司在2024年6月完成天使轮融资,总规模7亿人民币,创24年天使轮融资之最。
公司核心团队成员均来自于国内外知名高校和头部企业,在人工智能、机器人、智能软硬件等领域拥有成功的科研、产品化和商业化经验。其中,王鹤博士为清华大学电子系学士,斯坦福大学计算机博士,现担任北京大学前沿计算研究中心助理教授、博士生导师,北大-银河通用具身智能联合实验室主任以及北京智源人工智能研究院具身大模型负责人。公司联合创始人姚腾洲毕业于北京航空航天大学机器人研究所,师从机器人行业泰斗、中关村智友研究院院长王田苗教授,曾任职ABB机器人研发中心,具有多年工业和服务机器人研发经验。
GALBOT G1是一款具身多模态大模型通用机器人,采用双臂+单腿+轮式底盘的躯体结构,可以实现360度移动,身高173cm,臂展190cm,躯干提升能力65cm,操作范围从0到240cm。具有“跪姿”+“站立”双模式,分别用以抓取地面物体或处理高度超两米的物品,覆盖更广的工作空间,使用合成仿真数据驱动具身智能,能够抓取随机放置的透明、高光物体,还掌握了开柜子、晾衣服等操作技能,可以应用于工业制造、零售消费、药房等场景,预计Q4正式预售,售价约30万元一台。
3.9 达闼科技与Cloud Ginger
达闼成立于2015年,是智能机器人领域的独角兽头部企业,全球领先的云端机器人创造者、制造商和运营商。公司围绕“机器人服务于人、达闼服务机器人”的战略使命和“云端智能,连接未来”的美好愿景,旨在通过持续引领云端机器人前沿技术研究与产业化应用,让云端机器人走进千家万户,帮助人类完成4D(如枯燥、肮脏、危险、甚至困难的)工作,让人类尽享更美好的生活。
达闼具有行业领先的云端机器人全栈技术解决方案,创新性地提出 “云端机器人”(“云脑+安全网+机器人”)架构并成功实现云端机器人的商业化。研发了全球首个云端机器人大脑操作系统海睿OS,提供了云端“大脑”模型,开发了基于多传感融合感知和运动控制的“小脑”模型,并基于该模型搭建了端云协同的机器脑融合智能平台。同时,各种类型的服务机器人可通过移动内联网(MCS)和标准化机器人控制器(RCU)安全连接到云端大脑,并被其赋能,获得智能语音,智能图像,智能行动等能力。此外,达闼开创性的研发了集通信、计算、传感于一体的机器人智能柔性关节SCA,解决了机器人硬件在标准化、集成化及产业化方面的局限,降低了机器人准入门槛、加速产业生态形成。截至目前,达闼集团专利申请量超2000项,已授权专利超过1000项,处于行业领先水平。
达阀的首代人形机器人产品 Ginger 1 于 2019 年世界移动通信大会推出,其迭代产品Ginger 2于 2022 年世界人工智能大会推出。Ginger 1整机体重65kg,身高158cm,具有优美人形,荣获2020中国设计红星奖,具有34个智能柔性关节遍布全身,通过多个2D/3D相机、激光雷达、超声传感、IMU、力传感、麦阵等建立多层立体感知,能歌善舞,可实现智能抓取、自主行走、自动避障、自动平衡。
Ginger 2整机重量89kg,身高158cm,搭载公司自研的智能柔性关节 SCA2.0,柔性控制全身,精确力反馈,具有千变脸,更有灵气,极大提升交互体验,采用7自由度灵巧手,更从容完成抓取、操作工具等精细动作,多个硬件接口,便于插接外设,满足更多场景需求,主要应用场景为迎宾导航、活动庆祝、养老陪护、教育科研和直播带货等。
3.10 小米机器人与CyberOne
小米机器人事业部成立于2021年9月10日,2022年8月小米在秋季新品发布会上推出旗下首款全尺寸人形仿生机器人CyberOne(铁大),具备重建真实世界、运动姿态平衡、感知人类情绪的能力。整机重量52kg,身高177cm,全是由5种关节驱动,共21个自由度,单手抓握物体重量1.5kg,行动速度3.6km/s,实现各自由度0.5ms级别的实时响应、双足运动姿态平衡和四肢强健动力,可充分模拟人的各项动作。
CyberOne搭载小米自研的Mi-Sense深度视觉模组,可对人脸、肢体动作等外景环境进行感知,三维重建真实世界,并通过自然语言处理算法可感知6类45种人类语义情绪,分辨85种环境语义,可从说话的语气判断人类心情,综合而言,CyberOne具有突出的行动速度、抓握力、交互以及环境语义识别能力。
四、产业链与核心部件
4.1 产业链分析
人形机器人产业链可以分为上中下游三个层次,上游主要是零部件和软件系统供应商,包括驱动电机、关节、传感器、控制器、减速器、操作系统等,这些零部件和软件系统的质量和技术水平直接影响到机器人的性能和稳定性。中游是人形机器人本体的制造商,负责将各个零部件组装成完整的机器人产品,并进行测试和质检。下游则是人形机器人的终端应用市场,包括工业制造、商用服务、医疗、教育、救灾救援、公共安全、家庭陪护等多个领域。
4.2 核心部件
以Optimus的主要结构和零部件为例,可以从躯干、灵巧手、感知系统、关节等关键模块使用的零部件可以看出电机、传感器、减速器、控制器和丝杠是构成机器人的关键核心零部件。当前核心零部件的市场基本被海外企业占据大部分市场份额,尤其是高端市场,基本处于垄断地位,零部件的国产化将为人形机器人在性能、成本、可靠性、安全性和技术创新等方面提供更多的可能性,助力人形机器人产业化进程。
电机是人形机器人中最常用的驱动器件之一,主要是伺服电机,一般装在关节处,为关节运动提供精准控制的动力输出。目前使用的伺服电机主要是无框力电机和空心杯电机,无框力电机只有转子和定子,有结构紧凑、单位扭矩大、易维护、静音等优势,用在旋转关节和线性关节,壁垒相对不高,伺服厂家有望切入;空心杯电机采用无铁芯转子,降低输出扭矩波动,具有低功耗、高稳定性的特点,尺寸小结构紧凑,常用于灵巧手部位,全球市场被海外企业垄断,国内企业主要面向国内中低端市场。
传感器是人形机器人中用于感知周围的环境、物体和进行状态检测。其能将输入信号转为电信号,是感知模块的核心,常用于头部、关节和躯干等模块。常用的传感器有视觉传感器、力传感器、惯性传感器、温度传感器等,视觉传感器实现对环境的深度感知,六维力矩传感器用来感知压力或输出扭矩,惯性传感器用来实现定位、测量、平衡和跌倒检测等功能。国内传感器行业起步较晚,市场主要有国际厂商主导,占据了超过60%的市场份额。国产企业较为分散,产品主要集中在中低端市场。
减速器是人形机器人中用于降低电机转速的装置,能够提高机器人关节的扭矩输出和运动精度,主要用于旋转关节和灵巧手。人形机器人主要使用谐波减速器和 RV 减速器,谐波减速器体积小、精度高,主要用于小臂、腕部等,RV减速器适合重负载精密减速领域,主要用于多关节机器人种的基座、大臂、肩部等重负载位置。谐波减速器和RV减速器分别长期被哈莫纳克(日本)和纳博特斯克垄断,在谐波减速器领域国内绿的谐波创新研发P型齿,率先开始国产替代,但RV工艺更复杂、壁垒更高,国产化率仍偏低。
控制器是人形机器人的大脑,负责机器人的运动控制和行为决策。一般包含硬件和软件两部分,硬件是工业控制板卡,包含微处理器、存储器、电路接口、传感器接口和通行接口等,软件则是实时操作系统、感知算法和控制算法等,通常由本体集成厂商自主研发,以保证品质的稳定性和产品维修体系。从国内市场竞争格局看,国外厂商占据主导地位,国内控制器企业分散,厂商竞争力较弱,国产率不足20%。
丝杠是一种将电机端旋转运动转化为直线运动的机械部件,要精准输出动力并运动一定距离,对精度、强度、耐磨性有较高要求,主要用于人形机器人的线性关节。丝杠分为梯形螺纹丝杆、滑动丝杠、滚动丝杠以及静压丝杠,其中滚动丝杠在人形机器人领域适配性更高,包含滚珠丝杠和行星滚柱丝杠,市场主要被欧美企业垄断,高端产品的国产化程度仍较低。
五、面临的挑战与未来发展
5.1 面临的主要挑战
从行业整体表现来看,人形机器人并未规模化生产,各大参与者目前都在以小批量交付、验证场景、技术迭代为主,部分参与者从特定功能需求出发进行开发,以寻求一定程度的落地,但就整体而言,人形机器人产业处于从0到1的萌芽阶段,还存在以下挑战:
1、技术层面:
第一,虽然目前人形机器人已经具备一定的智能水平,距离在非结构化环境下实现自主决策,执行复杂任务仍有一定的困难,这也是日后研究发展的主要方向之一;
第二,人形机器人要能够实现各种灵巧的运动作业,运动控制是非常重要的基础。但是目前机器人对作业对象的适应性、环境的适应性还是非常的有限的,这要求精密的关节设计、高效的步态规划算法以及强大的实时控制系统。此外,降低执行器的成本、重量和体积,提高其响应速度和精度也是关键研究方向;
第三,在实现类似人类的感知能力,如视觉、听觉、触觉、力觉等,并将这些信息整合用于决策,这需要高度集成且准确的传感器技术和先进的信号处理算法;
第四,人形机器人需要大量的能量来驱动各种电动关节和传感器,因此如何实现高效的能源管理是一个重要挑战,例如延长电池寿命或寻找新型的能源存储技术;
第五,人机交互仍有进步空间,需要研发出更加自然、直观的人机交互界面,让机器人能更好地理解人类语言、表情和肢体语言,实现更为人性化、无缝化的交流体验。
2、社会和伦理方面:
第一,人形机器人的大规模普及,必然会带来部分岗位被取代,如何平衡机器人带来的效率提升与就业问题是一个巨大的挑战;
第二,随着机器人融入到我们的生产生活中,涉及伦理和法律的问题也将变得越来越复杂,比如机器人是否应当拥有某种程度的权利和责任,在造成财产损失或人身伤害时由谁承担责任,以及如何保护人类与机器人互动过程中的伦理底线;
第三,人形机器人中的人工智能系统可能会收到训练数据的影响,导致对某些人群出现歧视或者不公平现象;
第四,人形机器人的数据采集、传输和存储面临诸多安全风险,如数据泄露、黑客攻击等,需要建立相应机制保障数据安全。
3、落地应用方面:
第一,训练先进的人工智能模型需要大量的高质量数据作为支撑,但目前在各个环境下机器人的真实数据比较稀缺,采集成本高昂且需要时间;
第二,运行复杂的感知、决策需要强大的计算能力,如何在小型化、轻量化的机器人中集成高算力系统是一大技术难题;
第三,面对产量少零部件采购成本高,研发投入高依赖资本输血,下游客户依赖性强,回款周期长等问题,制约了人形机器人的大规模商业化应用;
第四,人形机器人在实际普及过程需要面临市场接受度问题,只有取得用户的信任,才能得到广泛的应用。
5.2 未来发展
展望人形机器人未来发展,我认为主要有以下几个方面:
产研降本化:硬件生产上,产业供应链的逐步成熟会达到规模量产和成本可控的状态,降低零部件的生产成本;软件研发上,通过虚拟仿真环境测试或真实环境测试持续积累数据,以及多模态大模型能力的持续提升,都将提升研发效率,降低研发成本;
具身智能化:随着端到端大模型技术、大规模数据采集、多模态感知与环境建模等技术的发展,人形机器人将融合感知、决策、控制于一体,使得机器人能够与环境交互获得认知能力,能够理解问题、自主决策并实现行动,从而产生智能行为和环境自适应性,支撑全场景落地应用。
本体轻量化:通过对本体机械结构和材料的优化,实现机器人的轻量化,可大幅提高运动的机动性和工作效率,进而改善操作速度和动作准确度,同时减轻运动惯性,提高安全性,还有利于降低大规模量产的门槛;
交互情感化:随着多模态大模型、情感计算等技术的发展,未来人形机器人能够更好地理解人类情感,实现更为人性化的交互体验。
附:名词解释
1、自由度:在机器人学中,自由度(Degree of Freedom,简称DOF)是指机器人在运动过程中可以独立控制的参数数量。与人类关节的运动相似,这些参数通常是指机器人关节的旋转或移动,每一个可以独立控制的关节或运动轴都算作一个自由度。
2、本体:指的是机器人的机械部分,也就是机器人的身体结构和机械传动系统,它是机器人的支承基础和执行机构。
3、力矩:描述了力对物体绕某一轴心或某一点旋转效果的量度。力矩是力和距离(或力臂)的乘积,可以分为力对轴的矩和力对点的矩。
4、SLAM:Simultaneous Localization and Mapping的缩写,即同步定位与地图构建,可以使机器人在未知环境中同时进行自身定位和环境地图的构建。一般通过处理来自传感器(如激光雷达、摄像头等)的数据来实现。SLAM系统一般分为五个模块:传感器数据、视觉里程计、后端、建图及回环检测。