字体
关灯
   存书签 书架管理 返回目录
    第1542章 夏铭的大礼(第 1/2 页)

    冰河。

    是一款关于围棋的人工智能程序。

    而这款人工智能为了应对围棋的复杂性,结合了监督学习和强化学习的优势。

    它通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

    然后,训练出一个价值网络对自我对弈进行预测,以 -1(对手的绝对胜利)到1(冰河的绝对胜利)的标准,预测所有可行落子位置的结果。

    这两个网络自身都十分强大,而冰河围棋将这两种网络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。

    在获取棋局信息后,冰河围棋会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

    在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为冰河围棋的最终选择。

    在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,冰河围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

    而冰河人工智能系统,主要由几个部分组成:

    一、策略网络(policy network),给定当前局面,预测并采样下一步的走棋;

    首发域名m.xsbiquge。la

    二、快速走子(fast rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;

    三、价值网络(value network),给定当前局面,估计是白胜概率大还是黑胜概率大;

    四、蒙特卡洛树搜索(monte carlo tree search),把以上这四个部分连起来,形成一个完整的系统。

    第一大脑:落子选择器(move-picker)。

    第二大脑:棋局评估器(position-evaluator)。

    -->>(第 1/2 页)(本章未完,请点击下一页继续阅读)
上一章 目录 下一页
最近更新 修罗剑神 我在直播间窥探天机 文豪1978 巅峰学霸 至尊战王 1987我的年代 牧者密续 港片:你洪兴仔,慈善大王什么鬼 混沌天帝诀 大国军垦 重燃青葱时代 那年花开1981 女总裁的全能兵王 华娱从男模开始 国民法医 重回1982小渔村 1979黄金时代 国潮1980 讨逆 离婚后的我开始转运了
最多阅读 捞尸人 慢性沉迷 理我一下 仵作惊华 丹霄万里 顶级诱捕公式 雪意和五点钟 好运时间 漂亮朋友 小蘑菇 白色口哨 黑天 斗爱之冠 刺青 病态占有 离婚后前妻成了债主 盖世神医 宦宠 魔种降临 延迟心动