在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
A.大;小
B.大;大
C.小;小
D.小;大
正确答案:A
①扫描下方二维码关注湖北事业单位考试资讯微信公众号。
②点击菜单栏“免费资料”,即可0元领取教资事业单位等备考试题资料。

湖北常识试题
在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越,采用当前Q函数值最大的动作的概率越。
湖北华图 | 2022-04-13 09:57
收藏
在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。
A.大;小
B.大;大
C.小;小
D.小;大
正确答案:A
①扫描下方二维码关注湖北事业单位考试资讯微信公众号。
②点击菜单栏“免费资料”,即可0元领取教资事业单位等备考试题资料。

微信咨询
微信中长按识别二维码 咨询客服