字体
关灯
   存书签 书架管理 返回目录
    第1542章 夏铭的大礼(第 1/2 页)

    冰河。

    是一款关于围棋的人工智能程序。

    而这款人工智能为了应对围棋的复杂性,结合了监督学习和强化学习的优势。

    它通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

    然后,训练出一个价值网络对自我对弈进行预测,以 -1(对手的绝对胜利)到1(冰河的绝对胜利)的标准,预测所有可行落子位置的结果。

    这两个网络自身都十分强大,而冰河围棋将这两种网络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。

    在获取棋局信息后,冰河围棋会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

    在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为冰河围棋的最终选择。

    在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,冰河围棋的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

    而冰河人工智能系统,主要由几个部分组成:

    一、策略网络(policy network),给定当前局面,预测并采样下一步的走棋;

    首发域名m.xsbiquge。la

    二、快速走子(fast rollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;

    三、价值网络(value network),给定当前局面,估计是白胜概率大还是黑胜概率大;

    四、蒙特卡洛树搜索(monte carlo tree search),把以上这四个部分连起来,形成一个完整的系统。

    第一大脑:落子选择器(move-picker)。

    第二大脑:棋局评估器(position-evaluator)。

    -->>(第 1/2 页)(本章未完,请点击下一页继续阅读)
上一章 目录 下一页
最近更新 舔狗反派只想苟,女主不按套路走! 刚准备高考,离婚逆袭系统来了 讨逆 捞尸人 我在直播间窥探天机 至尊战王 修罗剑神 神州战神 离婚后的我开始转运了 超级修真弃少 1979黄金时代 重燃青葱时代 盖世神医 华娱从男模开始 龙王令 国潮1980 牧者密续 港片:你洪兴仔,慈善大王什么鬼 那年花开1981 大医无疆
最多阅读 慢性沉迷 理我一下 捞尸人 好运时间 丹霄万里 顶级诱捕公式 仵作惊华 小蘑菇 白色口哨 雪意和五点钟 刺青 斗爱之冠 文豪1978 延迟心动 黑天 不循(重生) 刚准备高考,离婚逆袭系统来了 悍将 完美无缺 病弱反派饲养指南