VCRL Uczenie przez wzmocnienie oparte na wariancji dla dużych modeli językowych