湖北常识试题

首页 > 试题汇总 > 常识试题

在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越,采用当前Q函数值最大的动作的概率越。

湖北华图 | 2022-04-13 09:57

收藏

在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

A.大;小

B.大;大

C.小;小

D.小;大

正确答案:A

  ①扫描下方二维码关注湖北事业单位考试资讯微信公众号。

  ②点击菜单栏“免费资料”,即可0元领取教资事业单位等备考试题资料。

分享到

微信咨询

微信中长按识别二维码 咨询客服

全部资讯

copyright ©2006-2020 华图教育版权所有