新浪汽车:今年自动驾驶有了很多舆情方面的事件,您应该也看到了,有一个典型场景是天黑的时候在高速上有一些需要避让的场景,比如锥桶或者修路的路段,面对这种情况,我们既然是L4,面对这种场景,是不是能做到游刃有余?
安向京:对,这其实是一个非常严肃的问题,所以我们一开始在定义行深智能能力的时候,我们就始终认为安全是第一位,这是一个责任,所以我们一开始公司就立了一个发展的路径,一定是从低速到高速,我一定是先覆盖低速的场景,比如说厂内物流,不超过20公里,我们刚才说的末端场景,毕竟速度要限制在40公里以下等等。另外一个是从运货到运人,就是我先只运货不运人,运人,两者就有一个类似于电车悖论的难题,当一旦万不得已出现危险的时候,你是保护车外的人,还是保护车内的人?只要是运货,货的价值永远是有限的,而生命是无限的,所以我一定是保护人,就是车外的人,所以这个问题很好解决,但一旦运人,这个事情就有一点悖论了,这个时候就会很麻烦,比如说像您刚刚举的这个例子,如果我以一个物理极限能达到的速度去减速,其实我是可以不撞这个锥桶的,但这就意味着里面的人,会被这么大的减速而受伤,我要是减速,里面的人受伤,我要是不减速,外面的人受伤,这就是一个悖论。另外一个,先是有限场景,然后再扩展到随机场景,像刚才您提到的都属于随机场景,而我们说的有限场景是指点对点,事先我就知道这条路的情况是怎样的,它不会出现随机选路的情况,这个我认为也是现在我们应该认真对待的一个点。
新浪汽车:所以我们现在所有产品基本上还是处于末端低速的?
安向京:末端低速的城配场景。
安向京:面对高速场景,现在还没有做?
安向京:高速场景,我们有实验,但是没有推出产品。
新浪汽车:预计未来大概是什么时候(会推出)?
安向京:我觉得随着技术的进步和数据的积累,我们会慢慢地推出这些产品,刚才说的低速到高速,载货到载人,限定到随机,会慢慢地解锁,一点一点地解锁。
新浪汽车:明白,尤其是今年,全网的网友对自动驾驶高速的辅助驾驶、城区辅助驾驶的关注度特别高,整个汽车行业乘用车这一块,基本上已经成了一个标配必选项了,在这么一个场景下,我们也看到,尤其是今年华为提出了世界模型的架构,相对于早期的端到端,它相当于换了一套底层的算法,然后他们又会说L2是基于L4而来的,我们做L4的话,当面临这种算法改变的话,我们是怎么应对的呢?
安向京:这个地方的观点,我要稍微纠正一下,L2不是L4而来的,其实大家都是人工智能无人驾驶的算法,只不过场景不同,L4的传统思路是基于高精地图,基于这种重地图、轻感知的这种模式发展起来的,它也是不得已而为之,因为在过去L4大部分的场景下是没有地图的,或者是无法获得,或者是无法测绘地图,但L2就是针对城区NOA等等,它本来就有地图,本来就有大量商用的导航服务,所以这是两个不同的场景,核心还是那句话,有多少数据就有多少智能,核心是你在这些场景上拓展的量以及在拓展的过程中有没有把这些数据有效地变成你自己的能力,这一点其实是核心的技术壁垒和护城河。
新浪汽车:所以您觉得进入L4时代的话,高精地图是必不可少的?
安向京:也不是,它一定是和L2的轻图是结合的,在有普通地图的地方就用普通地图,在没有普通地图的地方,我们可以用高精地图来做辅助。
新浪汽车:在园区场景里,我们会遇到的最极限的案例是什么?
安向京:比如进到一个分拣中心,需要到某一个指定的分位置上去,这个时候的场景变化很多,因为随时堆的货物会发生剧烈的变化,另外场景上又有建筑物,有天花板,然后会导致GPS定位信号丢失等等,这样的场景其实挑战是很大的。
新浪汽车:没有信号的话…
安向京:靠识别,靠感知,靠高精地图,靠这些辅助手段。
新浪汽车:不会说没有网了就完全不受控了?还是按照自己的理解做的。
安向京:对。
新浪汽车:商用车有没有我们做的这种产品,营销的话术,您可能会看到乘用车今年提到很多世界模型也好,VRM也好,VRA、一端式端到端、两段式端到端各式各样的词汇,大家听得也是云里雾里,但是在商用车领域,貌似大家没有说过这些东西。
安向京:道理上是一样的,只不过商用车更强调的是解决问题,你给我送货,而乘用车更强调的是感受,是人机交互。举一个很典型的例子,VRM和VRA其实是同源的,和A有一个界定的区别就在于你能不能和人类的语言对齐,和人类的感觉对齐,就是说L2的无人驾驶,它强调的是我做起来像老司机在开车,这种感受很重要,同时,我要理解我在干什么,你也要理解我在干什么,我怎么让你理解说话,你怎么让我理解语言,这就变得很重要了,但乘用车没有必要,乘用车只需要A点到B点,你替我解决问题就行了,所以说乘用车它不是太强调跟人类的感受对齐这一点,你只要安全地把货及时安全地送到就行了,它不强调开得像不像一个老司机,刹车多不多,加速度大不大晃不晃,这些不是太care(关心),也不太需要去跟人通过交互来理解你要去哪里,这个地方怎么会更好地到哪儿,它不需要这些东西,所以可能从术语上就会有一点不一样,但是这些事都是存在的,核心的核心是如何用通用人工智能的技术来逐步地提高我的无人驾驶的能力,来服务无人驾驶A点到B点的运力交付。
新浪汽车:关于强化学习,我们这边是怎么布局的呢?包括因果推理能力,商用车如果只是单纯地完成任务,不追求过程中的体感的话,那这部分的能力还需要吗?
安向京:需要,这个因果推理能力对于无人驾驶是非常重要的,因为人的学习和机器的学习有一个本质的区别,人的学习一定是基于过去的学习,但机器的学习可以基于未来,为什么?我这一次的数据可以改变我的算法,可以用我记录到的未来的数据来改变我的算法,所以这一点是人所不具备的优点,所以说,我们的因果推理以及数据闭环非常的重要,对于我们来说,一个corner case(音),我可能要记住前20秒后15秒所有的数据,来达到更优化的设计,人类很难采取这种学习的办法。另外一个就是强化学习,强化学习的本质其实是像一个最终的目标学习,就是用最终的目标来奖惩过去历史上的一些动作和决策,这个时候就有一个很重要的概念,就是价值观的对齐,强化学习奖惩的东西到底是什么?是安全?是流畅?是舒适?是效率?还是感受,就很重要,对于商用车来说,我们更强调的是安全,一定要安全是第一位,用安全作为奖惩。
新浪汽车:所以在保持安全的情况下,我们可以往后看几年,往未来看三到五年、五到十年,您觉得下一个能给商用车带来巨大变革的时间或者一个场景、一个技术的突破会是什么?
安向京:我认为随着算力的提升,VRM、VRA会大规模地应用到无人驾驶里,而且会实现周伯通练武左右互搏,这个世界模型在这一点上价值是巨大的,它可以实现左右互搏,就是我用真实的场景虚拟处或者仿真出各种各样的动态场景,来训练我的无人车的算力,让我的无人车的算法性能会快速地提升,而不是一定要走到这些场景,我才能够学习这种场景,这里面有几次技术上的跃迁,最早的一次就是我们把人开车的行为变成了规则,然后通过程序员的语言让车跑,那是几十年前的无人驾驶技术,到了2010年前后,深度学习的技术就是我可以让所有会开车的人都提升车的性能,怎么办?就是画框框,这是人,这是物,这是自行车,他是机动车,你的车需这么要绕,这个过程中需要的是画框框的能力,需要的是深度学习算法工程师的能力,而这就不仅是一个会开车的程序员了。再往后,那个时代,我们还是有多少人工就有多少智能,因为是画框框。再往后,到了Transformer时代,到了AGI时代,这个时候,我的标注是自动化的,我的能力是自动生成的,我已经不需要你画框框了,我就可以反复地训练和提升我的性能,这个时候你采多少数据就有多少能力。再往后,就是这个世界模型,通过世界模型,我可以模拟场景上发生了什么事,有什么车,不再需要实车去采数据,我觉得这是开发效率和生产效率一个巨大的提升,高效的提升,所以会带来无论是无人车的安全,还是效率,都会带来质的飞跃。
新浪汽车:我看到一些车会说自己是1000万Clips版本,在商用车领域里,也会有片段数量吗?
安向京:一样的,概念是一样的,它是训练模型,就是端到端的模型,无论是一段式的,还是两端式的,这个端到端的模型需要多大规模的数据来喂,这里面我们强调的是有效数据或者是多样化的数据,就是看这个数据的质量。
新浪汽车:还是要看质量。
安向京:对,它叫分布,看这个数据的分布是不是足够宽,足够广,不能光聚焦在高速公路,这就会产生孤僻动作。
新浪汽车:所以也会怎么数量极少质量高的,效果会比纯数量极高的这种效果要好?
安向京:这是肯定的,怎么来评价质量,学术界就有很多争议了。
新浪汽车:最后一个问题,我想问一下您,如果用一个技术名词来代表企业的能力,您觉得会用哪个关键词呢?
安向京:我觉得是“认知创新”,这一点是我们最大的一个特点,因为行深在无人驾驶赛道已经积累了30年,我们还想再做30年,我们是非常执着于技术的一群人,在这里面,我们始终认为无人驾驶不是一个简单的平替,不是把司机从车上裁掉,而是整个运力载具的信息化共享,这个才是它真正的核心价值。既然你实现的是运力载具的信息化共享,那你应该反过来去从业务逻辑上去想这个产品该怎么构建,而不是现有的产品是怎么样的,你考虑怎么替代它,所以行深智能一直是在这方面,认知上的革命,包括对技术认知的不同,对场景认知的不同,以及我们对业务本身逻辑认知的不同。比如我们就提出了未来无人物流车一定不是送一件一件的货,而是送标准化的单元容器,实现一个空间转移共享平台的理念,未来不再是送一个一个具体的东西,而是实现空间转移平台的管理,把物流变成空间转移,在这个过程中,你就可以搭载很多很多的东西,不仅能服务三通一达,不同的物流企业,甚至能服务快递、生鲜、烟草、预制菜等等广大的物流城配体系,甚至更进一步可以服务环卫、服务安防,甚至包括煤气泄露的巡检等等一系列的应用,所有的终端移动的应用或者是具身移动的应用,都可以被无人驾驶的能力所覆盖和赋能,这个就是非常有想象力的空间和有想象力的赛道了,这就是我们行深的愿景和使命,也是我们行深不同于其他无人驾驶企业的核心地方。
新浪汽车:感谢安总,我们今天的采访到这里结束!