有時我看到一些論文中對超參數進行的搜索範圍是 0.001、0.003、0.006、0.01 等等。許多超參數更適合用負整數 log2 來表示。像學習率這樣的較小值直接使用,而接近 1 的值,如 EMA 因子和 TD lambda / gamma 則用 1-2**val 來表示。 有趣的是,許多參數對加倍或減半相對不敏感,需要更大的變化才能可靠地影響結果。