Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。
A.期望值
B.最大值
C.最小值
D.总和
正确答案:A
①扫描下方二维码关注湖北事业单位考试资讯微信公众号。
②点击菜单栏“免费资料”,即可0元领取教资事业单位等备考试题资料。
湖北常识试题
Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的。
湖北华图 | 2022-04-13 09:57
收藏
Q函数Q(s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的()。
A.期望值
B.最大值
C.最小值
D.总和
正确答案:A
①扫描下方二维码关注湖北事业单位考试资讯微信公众号。
②点击菜单栏“免费资料”,即可0元领取教资事业单位等备考试题资料。
微信咨询
微信中长按识别二维码 咨询客服