Latest Version: 3
未修改版
Latest Version: 0
MCTS UCB算法
Latest Version: 0
相比较练习1,没有算算胜率这一步
Latest Version: 0
v0 MCTS传统实现,使用随机模拟作为defaultPolicy
Latest Version: 4
v1 使用可行步数作为评估函数,取代随机模拟的def*ultPolicy 与v0相比出现了先下四角等**
Latest Version: 0
v3 继承自v1expand节点选择改为随机法,简单的inline,在Node *expand部分增加了清除的已展开节点
Latest Version: 0
v3.1 继承自v3 改变估值函数,增加接近终局的估值权重
Latest Version: 0
v3.1.1 继承自v3.1 限制搜索宽度,从第一层之后每层限制在40个子节点
Latest Version: 0
v3.1.2 继承自v3.1 改变估值函数,仍采用随机算法
Latest Version: 0
v3.2 继承自v3 在随机几步后评估
Latest Version: 0
v3.3 C调参
Latest Version: 0
v3.4 继承自v3 重构代码
Latest Version: 0
v4 继承自v3 尝试在defaultPolicy中加入几步随机过程 每加入一步都会使搜索节点数下降,但性能没有提升,反而下降,确信深度为王
Latest Version: 0
v5 继承自v4 尝试在利用defaultPolicy中的随机部分增加RAVE
Latest Version: 0
v6 继承自v3 将bestchild改为最多访问的节点
Latest Version: 0
v7 继承自v3 更改评估函数
Bot Version | Description | View Source |
---|---|---|
Please choose a bot on the left first. |