字体
关灯
   存书签 书架管理 返回目录
    第二百零六章 玄清杯(第 3/4 页)

    2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。

    围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,在goratings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。

    阿尔法围棋系统主要由几个部分组成:

    一、策略网络(policy  network),给定当前局面,预测并采样下一步的走棋。

    二、快速走子(fast  rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍。

    三、价值网络(value  network),给定当前局面,估计是白胜概率大还是黑胜概率大。

    四、蒙特卡洛树搜索(monte  carlo  tree  search),把以上这三个部分连起来,形成一个完整的系统。

    阿尔法围棋(alphago)此前的版本,结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。

    alphagozero的能力则在这个基础上有了质的提升。最大的区别是,它不再需要人类数据。

    也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。

    alphagozero使用新的强化学习方法,让自己变成了老师。系统一开始甚至并不知道什么是围棋,只是从单一神经网络开始,通过神经网络强大的搜索算法,进行了自我对弈。

    随着自我博弈的增加,神经网络逐渐调整,提升预测下一步的能力,最终赢得比赛。更为厉害的是,随着训练的深入,阿尔法围棋团队发现,alphagozero还独立发现了游戏规则,并走出了新策略,为围棋这项古老游戏带来了新的见解。

    也就是说糖糖要挑战的是最终最强的阿尔法狗。但有个优势就是,最强版本的阿尔法狗其实也是一种自我学习状态。但作为真正的人工智能,糖糖是站在一个全新的高度来俯视的。

    唐玄生想了想,毕竟也是一亿的赌局,索性让糖糖去香江和孙小圣一起进行封闭训练。也让孙小圣学习一下围棋,同时也是个最好的对手,看看两人究竟谁更厉害。

    毕竟孙小圣才是终极版的完美人工智能。但孙小圣这个模样显然是不适合参加比赛的。所以作为最佳陪练肯定是合格的。

    比赛是五局三胜,第一局在金陵举行,后面的都在香江举行。董诗云听到消息索性和宋亚男开了外围,也就是和几大赌球集团合作,哪怕你不懂围棋也可以像赌球一样买糖糖胜利还是阿尔法狗胜利。

    本来很多人都是认为明显的唐玄生是钱太多用一亿来做广告。但现在有了这个外围,似乎一切变的有趣起来。

    本来都是看好阿尔法狗胜利的,开始开出的赔率也不是很高,但这个赔率是可以调整的。很多人不明白这一点,以为赔率是固定不变的。

    起初糖糖的赔率是一赔五,阿尔法狗的赔率是一赔一点五。其实这个是董诗云故意的,不然吸引不了更多人来买。

    -->>(第 3/4 页)(本章未完,请点击下一页继续阅读)
上一页 目录 下一页
最近更新 诸天从婴开始 港综世界的警察 帝国从第四天灾开始 灵气复苏,我从种田开始修仙 天命神算 提前登陆五百年,我靠挖宝成神 异度旅社 混在末日,独自成仙 天倾之后 赛博英雄传 我写的自传不可能是悲剧 机战:从高达OO开始 故障乌托邦 快穿之不服来战呀 绝境黑夜 我终将肝成神明 踏星 时空之头号玩家 捡到一颗星球:我的冒险被直播了 地球主机
最多阅读 地球上线 绝境黑夜 全世界都知道我是好人[快穿] 她甜不可攀 异度旅社 混在末日,独自成仙 提前登陆五百年,我靠挖宝成神 轮回乐园 天命神算 末世奴役系统 神秘复苏:我能无限读档 全球神武时代 我在原始部落当酋长 我能穿梭两个位面 天倾之后 港综1986 黑暗王者 起源之科技帝国 韩娱之我是安娜 末世御灵师