Terkadang saya melihat makalah dengan sapuan hiperparameter lebih dari 0,001, 0,003, 0,006, 0,01, dll. Banyak hiperparameter lebih baik dinyatakan dalam log integral negatif2. Nilai kecil seperti tingkat pembelajaran secara langsung, dan nilai mendekati 1 seperti faktor EMA dan TD lambda / gamma dengan 1-2**val. Sangat menarik berapa banyak parameter yang relatif tidak sensitif terhadap penggandaan atau halving, dan membutuhkan perubahan yang lebih besar untuk memindahkan hasil dengan andal.