這篇論文很有趣,但我對總獎勵公式有點困惑。對於像我這樣的人,這裡有一個註解版本,所有變數都在同一個螢幕上,無需在頁面之間來回翻閱(為什麼人們不這樣做?也許不需要顏色,但只需要圖例):