德扑人机大战今日落幕:人类的落败,以及AI时代的到来
2017-04-10 14:31 人工智能

人类在AI面前,已经毫无胜算。尽管他们已经足够努力。

从4月6日持续到10日的“冷扑大师V.S.中国龙之队—人机扑克巅峰表演赛”在今天中午正式落幕。经过了5天的征程,这场比赛,最终以人类的落败而告终,德扑AI程序“冷扑大师”最后以792,327总记分牌的战绩获胜,同时,200万元的奖金,也归属冷扑大师所有。

就在今天,谷歌召开发布会,宣布AlphaGo和柯洁对战的相关信息。在此之前,AlphaGo在去年3月战胜李世乭,一战引爆了各界对AI的热烈讨论之后,在去年年末,“Master”更是以连续60胜的战绩,连续击败了多位世界冠军棋手。

人类在AI面前,已经毫无胜算。尽管他们已经足够努力。

李开复:不完美信息AI技术获得验证,人机对弈已经没有悬念

创新工场CEO、人工智能工程院院长李开复,是人机扑克大战巅峰表演赛的发起人。早在龙之队准备出征时,他和龙之队的队长、常春藤资本合伙人杜悦,就预测,人类牌手获胜的概率,大约是10%。而这个数字,李开复说:“这已经非常高了。”他还表示,如果人类还有能够在这类比赛中胜过AI的机会,那么,龙之队的这次出征,很有可能是人类最后获胜的机会了。

最后的结局,证实了他的预测。赛后,李开复更是明确表示:“通过冷扑大师和龙之队表演赛的对战结果,人机对战基本没有悬念了。据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了。”

“冷扑大师”是基于卡内基梅隆大学开发的Libratus的人工智能程序,它在今年1月,在美国宾夕法尼亚曾击败四名顶尖人类德扑高手,获得了20万美元奖金和177万美元的筹码。

比起AlphaGo来,冷扑大师Libratus的获胜具有更加特殊的意义。开发冷扑大师的卡内基梅隆大学TuomasSandholm教授,解密了AI德扑背后的技术奥秘:扑克在几十年来一直是人工智能和博弈论中的一个具有高挑战性的问题。作为带着隐藏底牌的“不完美信息”游戏,扑克对AI来说,具有国际象棋和围棋游戏中未曾出现的信息障碍。而此前的20年里,被人工智能所攻克的围棋、国际象棋和西洋双陆,都是“完美信息”游戏。也即是,所有玩家在游戏中,能够获得公开和对称的确定信息。游戏中需要作出的决策点的数量,决定了机器的计算量。今年1月Libratus的获胜,也是首次机器在德扑比赛中获胜。

Libratus和冷扑大师在三个主要技术模块中都使用了新的算法:包括比赛前采用近于纳什均衡策略的计算(Nash Equilibrium strategies)、每手牌中运用终结解决方案(Endgame Solving)、以及根据对手能被识别和利用的漏洞,持续优化战略打得更为趋近平衡。

冷扑大师相对于AlphaGo更高明之处在于冷扑大师不需要提前背会大量棋谱,也不局限于在公开的完美信息场景中进行运算,而是从零开始,基于扑克游戏规则针对游戏中对手劣势进行自我学习,并通过博弈论来衡量和选取最优策略。

而这也是李开复对之投注了巨大兴趣的原因。在出战前,他就表示,现实中,这种“不完整信息”才是常态。“世界上大部分的决策问题、商业问题,都不是单纯靠强力的搜索和人工智能就可以解决的。我们可以把AlphaGo理解为高‘智商’,但是冷扑大师是高‘情商’的。而且这样的技术可以在很多商业的领域里面应用,因为大部分人类的信息都不是彼此公开的。”他预计,现今这套人工智能扑克程序背后的模型,将适用于需要用到战略推理和多方谈判的场景,从企业谈判、商务谈判、外交谈判、甚至到生活面的房屋买卖谈判,十年内都将会部分或全面被人工智能所取代。

面对AI,人类有多努力你们知道吗?

面对AI,亚洲牌手们在“末日之战”中也进行了奋力抵挡。他们有多努力?龙之队杜悅、许朝军、张淮、童舟、朱亚希、王天健共六位人类牌手坚持了五天,接受每天十小时的心志、体能、压力三重挑战。其中杜悦、许朝军、张淮三人当年均为清华大学计算机主修的高材生,相对于其他职业德扑玩家更为了解人工智能背后的技术原理,在表演赛进程当中,龙之队牌手亲手记录手牌过程,笔记冷扑大师的出牌套路,每天每场复盘总结,集合了真人团队集体智慧来动态研拟作战计划。

在五天的巅峰表演赛中,冷扑大师和中国龙之队双方共完成了36,000手牌,每天鏖战10个小时,全赛程中牌手两两配对,计算机采用复式对称发牌来降低运气等偶然因素。以单日表现来看,比赛首日中国龙之队与冷扑大师的积分差距为65,137记分牌,第二日人类落入低谷差距347,565记分牌、第三日差距233,874记分牌、第四日人机大幅拉近为98,408记分牌、完赛日47,343记分牌,五天下来冷扑大师累计赢得792,327记分牌数,平均22.0每百手损失大盲。

“人工智能在对战时不会受到情感、心理、体能等因素影响,且强大运算能力远超人类大脑,不得不承认冷扑大师很多手牌打得令人拍案叫绝。”杜悦说。许朝军也说出了与一月美国匹兹堡之战中美国玩家同样的感受:“AI有读心术。”

“我认为,未来的人工智能领域不再是几个小伙伴就可以打天下的时代了,而是需要顶尖的人工智能科学家、海量数据、强大的运算能力、以及清晰行业应用几大闭环。创新工场在AI领域的投资布局无疑将帮到这样的创业团队成功。我希望冷扑大师对战龙之队这场人工智能的里程碑事件将推动人们对于人工智能的认知,人机扑克对战中,我们看到了在尔虞我诈、概率不确定、非完美信息需要推理和情商的游戏里,机器一样可以获胜,而类似的场景在真实世界中比比皆是。”李开复说。人工智能已经不再只和AlphaGo对标,人工智能已从不完美信息的处理,进步到对不完美信息海量信息运算,并具备了推理和学习能力。李开复强调,“我期待下一个更加高明的AI大师级应用登场,而我更愿意相信,这些应用会来自优秀的年轻创业者,而不是诸如BAT等的科技巨头黑洞”。