A volte vedo articoli con sweep di iperparametri su 0.001, 0.003, 0.006, 0.01, ecc. Molti iperparametri sono meglio espressi in log2 integrale negativo. Valori piccoli come i tassi di apprendimento direttamente, e valori vicini a 1 come i fattori EMA e TD lambda / gamma con 1-2**val. È interessante notare quanti parametri siano relativamente insensibili al raddoppio o alla riduzione della metà, e necessitino di cambiamenti maggiori per spostare i risultati in modo affidabile.