如何使用TensorFlow对可变化的目标进行强化学习

查看数: 13512 | 评论数: 2 | 收藏 1
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2018-3-8 13:30

正文摘要:

本帖最后由 Oner 于 2018-3-8 13:35 编辑 问题导读:1. 如何得到能获得最大累积奖励的Q-learning?2. 基于目标的强化学习的快递无人机场景是怎样的?3. 如何使用TensorFlow进行Q-learning?4. 如何直接预测未来?5 ...

回复

jiangzi 发表于 2018-3-9 14:15:26
学习了,尽管不太懂~~~
Mr.k 发表于 2018-3-9 11:37:44
搬板凳来看看
关闭

推荐上一条 /2 下一条