8岁,在妈妈所在大学的物理实验室里,一场光学实验,让陈建宇第一次窥探了科学的美妙。
25岁,陈建宇提出的“非线性系统、非凸约束条件下的实时轨迹优化算法”成功应用在无人车实车上,被WebsEdge专题报道,在SAE世博会进行展示。年青的科研新星崭露头角。
29岁,陈建宇在“带约束的安全强化学习和感知—决策联合学习”两大方面取得重要突破。
2021年,陈建宇成为清华大学交叉信息研究院助理教授、博导。这位不到30岁的年青人,以新的身份,开启他的科研和从教之路。
做前瞻的科研
底特律一个实验用停车场内,一台无人车成功避过了行走的车辆和模拟的“行人”,倒车入库,停在准确的位置上。人群开始欢呼,陈建宇激动地和队友击掌、拥抱。那是搭载他自己设计的算法的无人车,实验的成功意味着他的“带约束非线性轨迹规划研究”从理论算法到仿真再到实车实验得到完整验证。
那是2017年初,25岁的陈建宇在美国加州大学伯克利分校攻读博士,研究领域包括自动驾驶和机器人技术。当时尚处于商业无人驾驶行业的早期,大多数无人车的决策规划系统使用的是基于人为规则的方法,而陈建宇研究的方法能够自动地对无人车这种非线性系统实时规划出安全的轨迹。
自动驾驶在今天已不是新鲜事。谷歌推出自动驾驶商用服务,特斯拉的高级辅助驾驶功能搭载在乘用车上,百度的无人驾驶巴士也已量产下线。作为科研工作者,陈建宇攻关的并不是当下正在落地的技术,而是着眼于更长远的、有前景的未来技术方向,探索其背后的基础科学问题,从而为行业未来的技术发展提供具有前瞻性的思路。
在2017年轨迹优化还未被很好地应用于无人车时,陈建宇所做的相关工作在当时就属于前沿的科研方向,后来这类技术被无人车行业大量采用。从2018年底起,陈建宇的研究重点转向了更为前瞻的方法——基于强化学习的自学习算法,打败世界围棋冠军的机器人AlphaGo运用的正是这种算法。在这一阶段陈建宇做出了领域内较早的几个基于自学习方法的复杂道路环境自动驾驶工作,后来各大无人车企业也陆续部署强化学习的相关研究。
目前,在这种方法的基础上,陈建宇关注另一重要但容易被忽视的前沿领域——强化学习的安全性和可解释性。
强化学习能让机器人通过自我学习的方法极大地提高其智能性,但是基于深度神经网络的自学习方法具有一定的“黑箱特性”,人类尚无法确定其内部的运作机制,也无法确定它会不会做出一些不安全的动作。在下围棋、打游戏的场景下偶尔出现这样的问题是可以被接受的,如果在高速行驶的无人车上或是与人协作的机械臂上发生错误,后果不堪想象。因此,若想将这一技术应用于实际,必须保障其算法安全可靠、可解释。
在清华大学交叉信息研究院和上海期智研究院,陈建宇牵头开展“安全可靠的自进化智能系统关键技术研究”,融合人工智能、机器人学和控制学理论,解决智能机器人从感知到决策的一系列难题,得到安全、可靠、高效的无人车、机械臂等机器人控制策略。
强化学习的安全性和可解释性目前全球都还没有很好的答案。当前有比较好的安全保障机制的机器人系统基本上采用的是传统机器人的工作方法,其智能性受到了一定的限制;而基于自我进化的新型控制方法,其安全性还没有很好的解决方法。陈建宇团队的研究,在“带约束的安全强化学习和感知—决策联合学习”两大方面取得突破,相关成果在人工智能、机器人、控制与智能交通领域顶级期刊和会议发表,得到了同行的认可。
立志做出世界级成果
陈建宇经历过很多次“至暗时刻”。一次做无人车实车实验时,车辆行驶不稳定,常常在障碍物周围突然开始左右摇晃。陈建宇抱着电脑坐在车上,一遍一遍地改代码、调试、重来。车晃得让他难受,内心更是焦急。试车场地很昂贵,需要在较短的时间内完成。那几天还正临近期中考试,他白天做实验,晚上熬夜复习,又累又焦虑。后来终于确定问题出在约束的引入方式上。
这样的经历还有很多。“经常设想好的点子以为不会有问题,但实际就出现了各种奇怪的问题,这个时候很考验耐心,再坚持一下,再多尝试一下,以为难以解决的问题往往就这样解开了。”陈建宇不害怕失败,因为“与失败相伴的,是每一次的进步”。
“社会生物学之父”爱德华·威尔逊在《给年轻科学家的信》中,第一条建议便是“希望你能竭尽所能地坚持下去”。在陈建宇看来,要想成为一名优秀的科学家,光尽力还不够,还需要有强大的内驱力,有兴趣引路。“对我来说,学到一些新的知识,创造一些有意义的东西,都让我快乐。”他说:“科研并不是苦的,工作也可以是一种娱乐。”
清华大学实行的是PI制,以PI为核心进行资源配置。作为独立PI,陈建宇自己组团队做项目,学校和院系给予资金、资源等各项支持。陈建宇说,学校和院系的支持足够让他“可以自由探索自己感兴趣的科学问题”。
清华大学对他也有极高的期待——做出全世界范围内顶尖的科研成果。实际上,这也是陈建宇自己的期待。
陈建宇在清华大学读完本科,申请到美国加州大学伯克利分校直博,师从国际著名的自动控制专家、机电控制和预见控制学科的创始人Masayoshi Tomizuka教授。陈建宇所做的是人工智能和机器人的交叉研究。他说,中国在某些人工智能领域的地位已接近甚至超过美国,但是在机器人的核心技术方面和欧美国家还存在一定的差距。他留学美国便是为了去学最先进的技术,向这个领域的世界级大咖学习,进行科研上的合作。
回国是出国前便确定的事。“我所学的是所在行业的关键技术点,投身科研的一个重要目的就是为了推动国家技术发展。”中国一些关键核心技术被“卡脖子”,陈建宇迫切希望能为此做点什么。毕业后,他拒绝了谷歌无人车的offer,回到中国。被“卡脖子”的高端机器人的软件系统的开发,是他团队未来的攻关方向。
做出世界级的成果,挑战是巨大的。怎样发现有意义的科学问题,考验眼光和视野;怎样去解决一个非常难的问题,考验能力和耐心。但陈建宇说,他对自己有信心。
青年的意气、锐气、豪气,来自能力,来自精神,来自一颗好胜心。
陈建宇从小好胜,确定目标后愿付出一切努力。从小学升到省重点初中后,他的成绩从第一名落到了班级中上游,因为“不喜欢、不甘心排在后面”,那一学期,他非常努力地学习,直到重回第一名并一直保持。高中时他开始探索课程学习之外的自身潜力,打乒乓球打成国家二级运动员,参加物理、化学、数学竞赛全获大奖。
“不喜欢、不甘心排在后面”,现在,一个青年科学家对世界宣告,想要赢。
不到30岁,成为博士生导师
陈建宇和学生们
过去一年是陈建宇身份转化的第一年。他从一名学生变成了带硕博研究生的导师、给本科生授课的老师。
背着双肩包、穿着运动鞋的陈建宇,走在清华校园里,看起来仍像一个学生。但是当他和他的博士生在一起,很容易看出谁是老师——他仅比学生大3-6岁,但自带老师的“威严”。陈建宇认为:“学生刚刚接触科研时还是很需要多多引导的,想让学生听你的话,需要建立一些威信。”
在学生的描述中,陈建宇“儒雅、和蔼,总是鼓励为主”,是一位“会在凌晨四点给学生改代码”的老师。面对这些在他看来“很聪明、有创造力”的学生,陈建宇也在探索怎样去做一个更好的导师,激发学生的潜力。他带着学生调研,找寻有价值的研究方向;对研究方向进行探索、验证;提供软件、硬件以及智力等各方面的支持。也有让他犯难的时候:要给每个学生设计好的课题,并对每一个人的课题都非常了解,出了问题还要能帮助他们解决。
教学上陈建宇也是新手。入职一年来他给本科生开了两门课——《机器人学导论》《智能系统与机器人》。每周两节课,他需要两到三个全天来备课:要反复推敲,保证内容的准确性、严谨性;要深入浅出,让学生易懂;既要有基础知识,也要有前沿研究,培养学生的兴趣……他自豪“课讲得还可以”。
从学生转为老师,身份、状态的改变给陈建宇带来了很大挑战。以前有老师“罩”着,有学长学姐带着,做好自己的科研就行。现在他需要承担起比之前大得多的责任。科研上,他面临着“世界级成果”的压力和终生教轨的考核。除了自己做好科研,还要确保学生也能做出科研成果;要花大量的时间去完成好教学工作;要做好育人工作,培养学生成为未来的优秀科学家……他也是重视家庭的人,“随着年龄增长,家庭的事情也会越来越多,怎么平衡科研、教学、家庭之间的关系也是比较大的一个挑战。”一个年轻人,正学着去应对身上的各种责任。
今年4月,陈建宇将满30岁。他称自己“勉强”做到三十而立,“无论事业还是家庭都刚刚起步,还有非常大的提升的空间”。
下一个十年,他希望在领域内做出一系列突出的贡献,成为国际上知名的学者,并推动技术产业的变革;希望培养出很多优秀的年轻科学家,在科学领域绽放光彩。