人机博弈:谁是未来战争“大赢家”

来源:解放军报作者:胡晓峰编辑:杜海丰
2016-03-24 08:38

人机博弈:谁是未来战争“大赢家”

——兵棋专家从新的视角看人工智能发展及其对军事变革的影响

制图:胡亚军

备受瞩目的人工智能机器人“阿尔法狗”与韩国九段世界冠军李世石的五番棋对决,最终以4∶1获胜收官,宣告人类在又一个引以为傲的智能高地上败北。“阿尔法狗”的胜利对未来战争意味着什么?这需要我们在“大战”之后的平静中重新思考。

“阿尔法狗”都做了什么

在人机大战的对弈中,以下三点特别值得关注:

第一,“阿尔法狗”具有与“深蓝”完全不同的学习能力。“阿尔法狗”的核心技术是深度学习方法,也就是说,它的围棋知识不是像1997年战胜国际象棋大师的机器人“深蓝”那样编在程序里,而是通过大量棋谱和自我对弈学会掌握的。尽管这个能力目前还很初级,但却展现了极好的前景,使得以前困扰我们的人工智能自我学习问题,有了解决的可能。

第二,局部落子和整体棋局的平衡能力。“阿尔法狗”通过对棋局不间断的评估,判定每一步棋对全局胜负的影响,还可以通过快速走子算法和“蒙特卡洛树”搜索机制,加快走棋速度,实现对弈质量和速度保证的合理折中。这种全局平衡能力,正是人类所独有的。

第三,超出人类对围棋博弈规律的理解能力。在五番棋的对抗过程中,从观战的超一流棋手讨论中可以发现,人类真的可以向计算机学习围棋,加深对围棋规律的理解。这意味着,机器人甚至可以从大数据中发现人类千百年来还未发现的规律和知识,为人类扩展自己知识体系开辟了新的认识通道。

以上三点对人工智能的发展具有里程碑意义。“阿尔法狗”的出色表现,使人类在认知智能技术方面看到了曙光。

对军事变革有什么影响

历史上一些著名的发明,比如计算机、因特网、激光、核裂变、卫星等,都是由战争需求牵引产生出来的,即使最初并没有用于战争,但也会很快被纳入战争需求的轨道。那么,从战争需求的视角,我们从中可以看到什么趋势呢?

催生更多的“聪明”武器和自主化无人平台。现在已经投入作战运用的无人平台,比如无人机,一般都是遥控的,还没有基本的自主决策能力。智能技术的发展,可能使无人平台逐步实现战场上的自主决策。即使暂时还做不到完全自主,但可以变得更加“聪明”,更能提高武器装备的作战效果,或大大降低操作的复杂程度。

使指挥员对战场态势的认知速度大幅提高。由于战场态势的复杂性,态势认知一般都由人来完成。比如对侦察情报的判读,面对各类手段获得的海量多媒体数据,人工分析效率极低。如果能够利用智能技术上的进步,大量采用计算机辅助决策,无疑会大大提高指挥员对整个战场态势的认知速度,掌握战场上的主动权。

使指挥信息系统克服智能辅助上的瓶颈。指挥信息系统是作战能力的倍增器,但由于无法解决智能辅助问题一直无法升级换代。这是因为计算机在辅助决策时,无法预估对手会采取什么样的反应,而且由于战争的复杂性使得后续行动也无法事先确定。这就要求指挥信息系统必须有智能化的认知理解能力,能够看懂战场态势并根据实际作出判断和处置。

助推兵棋推演实现真正的人机对抗。兵棋不是“棋”,而是逼真的战争模拟系统,但它现在还很难完全自动地模拟出对手的复杂行为,还需要由专门训练的人扮演敌军。但是,这种被“红军”思维潜移默化影响多年的“蓝军”,很难避免“红军”的思维特点,推演效果大打折扣。认知智能的进步,使得计算机可以逼真地扮演“机器蓝军”,这样的推演结果才更加可信。

拓展认识信息化战争机理的新途径。“阿尔法狗”不仅在人类的知识体系里面“思考”,而且还展现了找到人类知识体系之外规律的迹象,不能不说是一个惊喜。这告诉我们,在很多现在还找不到相应科学知识加以解释的经验学科方面,通过深度学习方法和大数据的结合,智能机器有可能帮助我们去理解和总结相应的知识及其规律。若果真如此,那“阿尔法狗”带给我们的就不仅仅是人工智能技术的进步,而是在认识论、方法论上的进步了。

我们应该如何应对

“阿尔法狗”的胜利为我们描绘了未来战争的蓝图,尽管那还仅仅是个开始。但技术瓶颈一旦突破,那就意味着一个新的时代,即所谓“智能化战争”时代的来临。对此,我们不能置身事外。

提高认知速度。未来认知速度将成为决定胜负的关键,这是不同时代的技术带来的时代差。我们必须意识到,战场上不仅行动要快,即所谓“快吃慢”,而且认知也要快,即所谓“巧吃笨”。同时代尚可“以弱胜强”,若处于不同时代则根本没有这个可能。而提高认知速度最可行的途径,就是首先实现人的智能与机器智能的结合。

突破关键技术。我国在智能基础研究方面并不比其他国家慢,但缺乏将这些理论进行转化的关键技术和领军人才。必须将人工智能作为战略核心技术加以关注,不断加大投入,才能在未来的竞争中不陷于被动。

防止技术突袭。美国已经意识到了这一点,并且展开了大规模的研究布局。美国国防部认为,未来智能项目重在人机结合,所以起名“半人马项目”,以应对第三次抵消战略的需要。其重点目标在无人机群、智能雷达、网络作战,以及应对情报的数据洪流方面。对此,我们必须高度重视,防止出现对我们非常不利的技术突袭。“阿尔法狗”可以说就是一个重要预警信号。

作者简介:胡晓峰,国防大学教授,兵棋工程总师,长期从事智能化战争模拟及军事系统工程教学与研究工作。

轻触,加载更多