Der X-Algorithmus sollte mit RL trainiert werden, wobei die Belohnung die Kardashev-Skala ist.