
2025年,对于拥有人形机器人和智能曲目的宝石的企业家来说,将是一个特殊的一年。在工业方面,新产品经常迭代。在主要市场上,这些初创公司已成为投资者青睐的目标公司。 On July 10, at the annual conference of the Beijing News Shell Shell meeting to form the Open Source Capital: Intelligent AI Future, Ecology and Co-People's Main Forum, Dr. Wang He, assistant professor of Peking University, founder and chief technology officer of Galaxy General Robots, and Zhiyuan Scholar, attended and delivered a keynote speech entitled "The embodied model of synthetic data empowerment laughs the big-scale-scale plaining工业和商业情况”。人形机器人不是新颖的。从Waseda University发布的第一个人形机器人Wabot-1到波士顿动力学的第一个Atlas机器人在Longg中,机器人始终存在,但并不聪明。对2022大型型号的渴望已经设定了全球尺寸,允许县S研究人员看到新的方向。他是其中之一。他认为,某些一般的大型模型不是针对机器人操作的,因此开发多模式模型的下一个方向是将机器人动作用作输出模式。这是整合体现智能和大型模型的新趋势,尤其是大型VLA(视觉语言行动)模型。用外行的话来说,它允许机器人团结起来理解说明并依靠手,眼睛,大脑和身体的协调来执行任务。从斯坦福大学的博士学位毕业通过返回Tochina在北京大学任教,Wang探索了机器人和操纵的一般视野。他说:“刺绣的情报是真正促进制造业,劳动服务并创造新的生产力的主要领域。”但是该领域与传统制造业并不完全相同。人形机器人必须在没有大脑思考的情况下“工作”。仅通过放任机器人的身体带来了具体的模型,机器人可以具有做出独立决策的能力。他承认:“与当前的行业发展状况相结合,缺乏数据是限制人形机器人机器人的大规模实施的主要原因。我们需要的是数千亿个数据,因此一般可以实现机器人,一般可以实现机器人,但公共数据集只有一百万,并且在他们之间的差异有很多差异。他说,与当前的新能量车产业相比,他说,仍然存在两个挑战:首先,即使是人类机器人的货运量,车辆的数量也高销售汽车,拥有的汽车可以自动传递数据。在此阶段,类人形机器人无法立即产生诸如购买汽车之类的价值。那是为了解决具体情报领域面临的挑战,来自两个方面。首先是人形机器人的库存不足。第二个是仅依靠实际数据提取的超额成本。 “ ngunit印地语ito ito nangahulugan na walang paraan upang malutas ang dremma。数据,ngunit gumamit ng higit pang mga sintetikong数据大型模型的Pangkalahatang Epekto。因此,Galaxy General开发了By自开发的数据合成管道已经积累了数十亿个实际应用程序方案的数据和数十亿个模拟数据。借助这些用于技能研究的合成数据,机器人Galbot可以直接概括现实世界的技能,现在正带领世界实施出色的VLA实施技能。编者注:以下是Wang He的主要演讲的全文,Peking University的助理教授,Galaxy General Robots的创始人兼首席技术官,以及2025年2025年Shell Finance年会的Zhiyuan Scholar代表(根据记录的部分删除)。 1。如果人形机器人可以产生新的生产率质量,取决于体现智能的发展。尊敬的领导者和客人,我很荣幸分享我们的一些业务技能和态度,学术界和研究界,今天在2025年的年度销售金融会议上。首先,我的主题更具技术性,但背后是尝试通过我们的新一代研究人员和中国新一代的一代来统治和“领导”。 Galaxy General Motors确实是一家新公司。我们于2023年5月在海学家注册并成立。这是一家基于大型模型的一般研发公司。我们想要的是使用通用机器人赋予数千个行业的能力并提供数千个家庭。正如黄市长和李部长所说,体现的情报是促进制造业,生产服务和新优质生产力的主要场所。在过去的两年中,中国,美国和世界都在体现的情报领域。包括在Kinatcloud的事件中,启动了多模式模型和人形机器人擎天柱的特斯拉释放。自2023年建立Galaxy General Motors以来,目前有大约200个人形机器人,并在中国置于智能公司。但是,人形机器人和具体智力是n传统意义上的制造业务。核心不仅是制造人形机器人,而且还要具有独立工作的智力,即,通过双手,眼睛和大脑的协调,该模型用于促进机器人独立工作,使用整个人体,并意识到所有人都可以完成工作。这是一个通用机器人。目前,中国的制造业正在不断发展,并且在程序程序中使用了许多自动和布利弗来实现未解决的车辆制造业的许多链接,形成了“黑人工厂工厂”。制造业正在加强,但尚未达到“智能制造”。人工智能,尤其是数据驱动的人工智能。这不是中国制造业的独特现状。人形机器人在全球范围内不广泛使用。实际上,人形机器人行业不是新的。 1960年,日本开始研究机器人,在世纪之交,波士顿动力学推出了机器人,该机器人正在开发近60年。现在,一些知名的类人机器人公司已从历史阶段撤回。因此,如果人形机器人能够使新合格的生产力取决于体现智能的发展。 2。VLA是整合体现智能和大型模型的新趋势。障碍是,缺乏大型模型的数据对驾驶体现智能有很大的影响。在大型语言模型吸收了大量的互联网语料库之后,例如Bean Bag型号,它现在可以毫不拖延地进行适当的对话。大型多模型模型可以理解图表并根据此语言回答。例如,GPT-4V,GPT-4O,国内DeepSeek和Thyi Qianwen推出了大型多模式模型。但是,这些普遍的犬儒主义仍然不足以让机器人完成工作。例如,如果您问机器人将麦克风固定在您面前的机器人可以说:“好吧,峡谷伸到右手拿起麦克风并捡起它。”这样的语言描述还不够,因为机器人的手臂上有6或7辆摩托车,而令人惊叹的手可以拥有超过两辆或二十辆摩托车。机器人需要有关每电动机输出多少扭矩的信息。多模式的大型模型应该是将视觉理解和与语言的互动用作机器人的输入和动作作为输出。该领域研究的最大障碍是缺乏数据。以自动驾驶为例,数据来自汽车拥有的驾驶。人形机器人行业面临两个主要挑战:以Galaxy General Motors为例,即使它计划今年批量MAKE 1,000单位,但它仍然远离数百万单位顶级汽车制造商的货运量。出售汽车后,数据可以自动驾驶时返回数据。如今,大多数类人类机器人的问题几乎是通过遥控器在家购买后完全由遥控器操作的,这与在家购买时可以推动的数量是巨大的不同。这就是为什么流行行业只达到1,000个单位的原因。当然,在供应链和制造成熟度中,有一个爱情是安全的,但是要获得10,000单位或100万单位,要弥补生产力差距,并在未来累积和低出生率引起的差距是很长的路要走。这里应该需要智能,需要数据。至于数据问题,美国解决方案是穿着移动捕获西装或使用遥控器来操纵机器人来收集数据。有两个主要缺点:库存不足,短期内不可能创建数百万个类人形机器人。其次,没有出售给客户的没有应用程序功能的机器人可能不会收集有效的WORK数据,这是最新的,并且遥控机器人的工作原理比人们所做的要慢。这两种缺勤都是hulist,因为缺乏体现智能的持续数据。我们的数据需求是做不同的事情,这可能需要10亿亿亿亿亿美元的数据,并且与令牌一致,可能需要数万亿代币,至少达到大型模型中当前的令牌数量以实现概括。目前,最大的数据集仅为100万,差4或5个数量级,这是体现智能形成中最大的瓶颈3。使用合成数据在体现的智能冷启动期间首先进步,但是中国公司有机会在人形机器人轨道上“统治”,即使用合成数据,而不是完全依靠现实世界中的数据,而在体现的智能冷启动过程中首先提前前进。也就是说,通过数字资产,创建了大量的运动轨迹和标签E强化研究是在模拟器上进行的,探索接触方法和对象的使用,并研究模拟器数据传输到现实世界,即Sim2Real(从模拟到现实),实现了整个培养轨迹到Sim2Real。自从我在斯坦福大学学习博士学位并加入北京大学以来,这条技术路线就一直在推广。该技术路线可以使用级别的图形卡呈现,可以大量复制一般管道,制造数据的成本比现实世界少。基于不需要现实世界中获取的十亿个合成大数据,我们训练了端到端的GraspVla端到端大型模型,GraspVla是大型模型的第一个浮雕基本爬网,其合成数据是唯一的预训练的动作数据。在现实世界中,这种预训练的大型模型非常棒。例如,我们只需要一个工人来收集200个轨道,而训练有素的模型可以分开正确的水箱。这种预训练的大型型号还可以应对新饮料,例如Nongfu弹簧和东方叶,从4瓶到3瓶,盖子从绿色变成红色和白色。高度的大小和变化。该模型不需要收集新数据或重新培训,并且通常可以是一般的。它表明,在体现智能后,有数十亿个数据,可以从中注意到。它可以在仅仅下午的下午就可以自动使用类似的项目来自动进行,从而大大降低了GEM应用程序的数据成本,并允许具有相关解决方案的企业。我们推出了第一个个人机器人智能零售解决方案,机器人可以在北京商店购买药品。在订单放入仓库后,每天24小时不需要工作人员。它是由人形机器人操作的,涉及从货架区域中最大的药物盒和厚厚的区域,打开一个橱柜抽屉以获取药物等,并提供每天24小时的药物在晚上满足患者的需求。目前,北京有10家商店,今年它计划在北京,上海和深圳等城市开设100家药房。我们的浮雕模型还使四足机器人能够伴随购物中心。该算法实时提供了后续轨迹,并使用内部自动驾驶技术使机器人狗徒劳无功。在面对各种动态遮挡的人群浓厚而没有箭头的购物中心,它是基于合成数据技术生成的端到端模型实施的。最后,在当前的人形机器人的轨道上,我们应该拥有自己的领先技术以及定义行业时代降低的能力。 Galaxy General Motor使用合成数据将不同的功能集成到一个功能中。它在短短两年内完成了一些融资周期,并筹集了24亿元人民币。我非常感谢为国家发行的PO提供 - Kattitude指导Licy以及行业支持和顶级风险投资。我相信,尽管中国具有智能的领先业务,但Galaxy General Motors将继续“统治”,并导致该行业比新能源车更好。辉煌的路线是在生产力人类机器人降落期间的真正引诱者。谢谢你的一切。北京新闻贝壳财务记者张汉编辑刘jiani校对陈在那里