A veces veo artículos con barridos de hiperparámetros superiores a 0.001, 0.003, 0.006, 0.01, etc. Muchos hiperparámetros se expresan mejor en log2 integral negativo. Valores pequeños como tasas de aprendizaje directo y valores cercanos a 1 como factores EMA y TD lambda / gamma con 1-2 ** val. Es interesante cuántos parámetros son relativamente insensibles a la duplicación o reducción a la mitad, y necesitan cambios más grandes para mover los resultados de manera confiable.