“奕星”存在的问题,江寒总结了一下。
一个是训练不够。
初代阿法狗在训练时,动用了几百块GPU。
对战李世石的版本,也动用了48块TPU、十几台高性能计算机。
训练时长更不是奕星能比的,至少都在半年以上。
其次,“奕星”在打造时,参考了初代阿法狗,其训练过程离不开人类棋谱。
在这种情况下,示范数据的质量,将极大影响它的成长。
甚至学到某些错误的着法,也不足为奇。
虽然有胡大力这样的行家帮忙,但收集到的棋谱数量仍不够充足。
并且其中有一些还存在质量问题,有滥竽充数的嫌疑。
这是手工筛选很难避免的。
最后,奕星欠缺了一点运气,无论现场发挥还是训练过程中,都不够幸运。
没错,“人工神经网络”的训练和运行过程中,包含着一定的运气成分。
复杂到这种程度的算法,人类只能掌握原理,但具体训练出什么东西,是没法完全读懂,并加以解释的。
对于人类来说,机器学习中的一些算法,其实自带“黑箱”属性!
有句“格言”在机器学习圈子里流传很广:
如果一个算法简单到能被大脑理解,又怎么能模拟复杂的大脑?
同理,如果一个算法连大脑都能模拟,那么其一定复杂到无法被大脑理解……
大概就是这么个意思。
落实到具体的点上,在这次对局中,大概率是“奕星”的“快速走子”模块出了问题。
在正常情况下,错误的下法会被“价值判断网络”否决,但在极其罕见的某些特定情况下……
比如:“快速走子”下出了问题手,然后在模拟后续走子时,“价值判定网络”认为其中一半情况对手大优,另外一半情况中,己方大优,平均下来己方略好……
但事实上,这并不绝对可靠。
如果找不准棋形上的关键点,就有可能导致全盘崩溃。
“奕星”下出的无理手,大概率就是这么来的。
事实上,即使原版的阿法狗,也存在类似的问题。
2016年,阿法狗挑战李世石。
在第四局比赛中,李世石突然下出“神之一挖”,阿法狗应对失误,最终全盘崩溃。
但其实,李世石那一手是有问题的,甚至可以说并不成立!
然而,阿法狗却错误地将形势判断为己方大劣……
今天的情况,就与那一次差相仿佛。
江寒瞬间想通了很多,顿时精神一振,翻身而起。
迅速打开笔记本电脑,然后倒在床上,进入了虚拟空间。
排除bug、修改程序并不困难,但需要时间,而现在留给他的时间,只有一个晚上。
幸好有虚拟空间……
江寒在虚拟空间里,忙碌了差不多五天,终于将“奕星”修好了。
在产生问题的地方,紧急打上了“补丁”,增加了一些人工规则,作为神经网络算法的补充。
在普通情况下,通过模拟走子对盘面进行估计,再让“快速走子”和“价值评估网络”分别算出胜率,然后根据胜率落子。
而在特殊情况下,则依靠手工规则……
虽然经过一番努力,“奕星”初步修好了,可以再次投入使用。
但以后要想再提高棋力,必须继续收集各种特殊情况,不停地积累、调试,总结成特殊规则。
这是一个大工程,不花费个十年、八年,投入巨大的人力、物力,是无法达到阿法狗Lee版本的水准的。
这是初代阿法狗的固有缺陷,在不换架构的情况下,很难彻底解决。
所以……
在接下来的奕星2.0版本里,江寒打算彻底抛弃初代架构,以阿法狗Zero为基础重新构建。
并非不能原创一个算法,只是万变不离其宗。
除非机器学习理论能有新的突破,否则做出来的东西,多半和阿法狗Zero大同小异……
江寒修好“奕星”后,就退出了虚拟空间,然后通过网络共享的方式,同步到了笔记本电脑中。
根据规则,每天休赛期间,选手可以在线更新自己的程序。
江寒又用了差不多一个小时,彻底搞定了这件事。
看了看时间,已经9点多。
8月初的东京还是挺热的,当然就算是东北,这时候也凉爽不到哪里去……
江寒冲进盥洗室,迅速洗了个澡,然后去了隔壁。
本打算把夏雨菲叫回来,一起商讨人生,没想到……
靳雪雯把他推了出来,笑嘻嘻的说:“江寒哥哥,今晚你自己睡吧!姐姐借我用一下。”
“干嘛?”
“看新买的的DVD,玩GalGame!”
江寒:“……”
忽然有点不妥的感觉。
夏雨菲也就罢了,毕竟是“过来人”,也已经成年了。
而小丫头才16岁,玩那种游戏真的大丈夫?
回到自己房间,解衣就寝。
夏雨菲不回来,他只好独自在榻榻米上烙煎饼……
第二天一早,江寒匆匆洗漱后,去隔壁敲门。
靳雪雯穿着卡通睡衣,打着哈欠开门:“江寒哥哥,干嘛?”
“雨菲呢?”
“刚睡着……”
靳雪雯说着,揉了揉有些发红的眼睛。
江寒无语一秒:“你们俩不会一宿没睡吧?”
小丫头伸了下小舌头:“这就去睡……”
江寒叹了口气:“那我先去会场了,让雨菲睡醒给我电话。”
“哦……”
看着摇摇欲坠的小丫头,江寒摇了摇头,随手帮她关上房门,转身离开。
会场里人山人海,和昨天一样热闹。
今天的重头戏只有一个,那就是“电圣战”。
第一场,“狂石”对棋圣小林。
这是让子棋,“狂石”先占了四个角上的星位,随后小林执白先行。
这盘棋并没有下很久,大约120多手,小林找到了对手的破绽,下出了一记妙手。
最后黑方无法“一子兼顾两处”,小林中盘胜。
演播室里。
主持人上场:“恭喜小林棋圣在电圣战中,干脆利落地取得了胜利,再次扞卫了人类的尊严……”
随后,对来到演播室的小林,做了个简短的访谈。
主持人:“跟电脑下棋,您感觉怎么样?”
小林露出一贯谦和的微笑:“还好,计算压力的确有点大。不过,AI就是AI,有些东西它没法直观感受到。”
主持人:“也就是说,它缺乏人类棋手的棋感?”
“是这样。”
主持人:“这么说……对AI研究的未来,您其实是持有悲观看法的吗?”
“不,其实我相当乐观。也许用不了五十年,就能出现和人类职业棋手水平相当的AI了……”
……
接下来,轮到第二名“奕星”出场,挑战老牌九段棋手,多次蝉联本因坊头衔的赵名人。
比赛正式开始。
前面的进程和第一场差不多,黑方先在三个角星位上落子,然后人类棋手执白先走……
老实说,一般情况下,布局阶段并没有什么好看的。
绝大多数AI都有开局库,对弈的时候,走定式就完了。
让子棋也差不多,很少有AI一上来就和人类棋手缠斗。
然而,今天这一局,“奕星”却忽然一反常态,下得特别凶狠。
更惊悚的是,拼杀得这么凶,居然还没露出什么明显的破绽!
不仅场上的赵名人陷入了苦战,就连负责解说的高手团队,一时之间都研究不出更好的应对办法。
这样的情况,可以说前所未见。
看棋的观众们,大多具备一定的水平,就算棋力不是特别强,至少看得懂。
于是就更加震惊了。
“奕星”的表现,和昨天可以说判若两AI。
如果不是主办方信誉卓着……
观众们差点忍不住怀疑那台电脑背后藏着个人!
随着棋局进行,赵名人越来越不利。
全盘白方只活了一小块,而黑棋的领地已经密不透风!
又坚持了二十手棋,赵名人只能遗憾地投子认负。
满座哗然。
本来只是一场人类吊打AI的表演棋,可谁也没想到,会是这种结局……