所以我是新手,想让智能体学习玩贝内特·福迪的《小蟋蟀大师》(他是《爬起来》游戏的制作人),我是计算机视觉和强化学习的第一项项目,所以这是一个巨大的学习曲线,但很有趣。奖励函数仍需要改进,但它可以打出半个世纪的分数。
我让RL代理在2D板球中比赛
所以我是新手,想让智能体学习玩贝内特·福迪的《小蟋蟀大师》(他是《爬起来》游戏的制作人),我是计算机视觉和强化学习的第一项项目,所以这是一个巨大的学习曲线,但很有趣。奖励函数仍需要改进,但它可以打出半个世纪的分数。
评论 (0)