风君子博客11月13日消息,具身智能公司灵初智能宣布完成天使轮融资,本轮融资由高瓴创投(GL Ventures)和蓝驰创投(Lanchi Ventures)领投。
本轮融资完成后,灵初智能将继续推进基于强化学习算法的机器人技能集训练、场景化的数据生成及采集、端到端解决方案的研发及落地,打造业界领先的通用灵巧操作智能体。
据悉,灵初智能创始人王启斌博士在手机、智能音箱、机器人领域有近20年的成功操盘经验,多次实现产品从定义、开发、到上市、再到全球化0-1-N的产业闭环,是一名深谙机器人商业化落地的“老兵”。联合创始人柴晓杰博士,在机器人及无人驾驶领域从业15年,擅长算法、仿真、工程、全栈技术,有L4产品落地的数据闭环经验,是量产经验丰富的研发专家。
灵初与北京大学成立北大-灵初智能具身灵巧操作联合实验室,由人工智能研究院杨耀东博士担任联合实验室项目负责人开展横向课题合作。杨耀东博士是强化学习领域的知名青年学者,他博士毕业于UCL, 是现代深度强化学习的发源地。杨耀东课题组在强化学习领域有系列重要成果,其中包括带领华人团队研发多体强化学习算法首登Nature机器智能子刊,带领华人团队获得NeurIPS 2022具身灵巧操作冠军等。
同时,北大-灵初联合实验室将和梁一韬博士就具身智能体长程任务规划开展课题合作,梁博士长期致力于如何将知识注入机器学习中以提高其性能和泛化性,在开放环境MineCraft中取得系列重要成果。他利用LLM实现复杂任务的拆解和规划,让大模型“缸中之脑“长出手脚,在具身场景中自主行动。
在灵初北大联合实验室之外,公司联合创始人陈源培是一名痴迷机器人的00后天才少年,作为Stanford访问学者,他师从Karen Liu和李飞飞教授,曾在全球首次实现利用强化学习在真实世界同时控制双臂、双手多技能操作。此外,来自上海交大人工智能学院的温颖副教授也是技术团队关键成员,温教授课题组曾推出多模态决策大模型DB1,实现了对DeepMind通才决策Gato模型的超越,并引入了与现实世界相关的百余个场景任务,为实际业务需求提供了有力工具。
高泛化性、高灵巧性和高成功率是具身智能的 “不可达三角”。高泛化性指机器人在变化环境对不同物体执行复杂任务,高灵巧性体现在执行任务的精确灵活(如搭乐高、双手操作等),高成功率即机器人受干扰时稳定正确执行任务(产品验证阶段成功率 95%、规模化落地高于 99.9%)。
兼顾这三者极具挑战。高泛化性需通用模型和注重数据多样性的学习算法,高灵巧性需要精细模型和关注精度细节的学习算法及特定控制算法,鲁棒性也对控制算法有要求。强化学习是提升具身智能体这三方面性能的核心技术,能让智能体在仿真环境利用低成本合成数据训练,实现自主探索、试错学习最优解,提升灵巧性甚至超越人类上限,还能增强鲁棒性。
灵初智能早期一直深耕基于强化学习的全栈能力,从灵巧操作入手在具身智能领域积累技术壁垒,后将扩展至通用泛化操作。其开发的分层端到端模型领先业界,包含Psi-P0规划模型和Psi-C0控制模型。Psi-P0借助大模型交互推理理解行为对环境影响,拆解复杂任务以实现任务泛化;Psi-C0模型为陈源培提出的双层架构,结合人类运动数据和深度强化学习,上层用人类数据训练参考轨迹生成器,下层用其生成轨迹指导强化学习训练,解决泛化性和灵巧性难题,这也是世界首次利用强化学习在现实中控制双臂双手多技能操作。
Psi-C0控制模型支持多个技能串联作业的训练难题。陈源培与斯坦福大学共同提出的Sequential Dexterity通过串联多个灵巧操作策略来完成长程的任务。在真实世界的搭积木任务中,能将翻找、重定向、抓取和插入积木4个skill串联起来提高整体的成功率。这也是世界上第一个基于强化学习实现了灵巧操作的长程任务,显示了多技能组合的泛化性。
据介绍,梁一韬博士开发的Psi-P0实现开放环境中复杂任务的任务拆解和规划。其所支持的任务复杂度和准确度都超越同期OpenAI(VPT)和Nvidia的工作(Minedojo)。如下面视频所示,我们可以进一步通过构建memory使具身模型具有lifelong learning,即根据自身经历自我提升的能力。
在产品规划上,灵初智能将从2B服务业切入,以头部客户的高价值场景需求为指引,开发整合技能集,实现商业落地,并快速迭代硬件,算法,数据系统,不断提升具身智能整体解决方案的泛化性,灵巧性和成功率,给出具身领域“不可达三角”的最优解。
灵初智能创始人兼CEO王启斌表示:“非常感谢投资人的鼎力支持。我们这支集合工业界老兵和高密度科学家的战队,拥有完整的技术栈,将在具身智能的前沿打造软硬一体的综合解决方案,拓展在先进制造,商超物流及2B服务业等场景中的应用场景,快速实现数据闭环,商业化落地。在具身智能赛道的初纪元,期待和我们的合作伙伴灵性成长,共同开创智能未来。”