ごく最近(v0.1.3の時点で)ルーブリックレベルの状態+検証器内の報酬関数に利用できるオブジェクトを処理するための「正しい」方法を見つけました 以前は、余分なものをグローバルに宣言するだけでした(アンチパターンを定義し、いつも私を悩ませていました)、報酬関数で非常に一般的に使用されていたため、参照できるフィールドとして「parser」を手動で公開していましたが、これは内部をハッキングすることなくエンドユーザーが簡単に構成できるようにしたいと思っていました 「self.class_objects」と入力します -- ルーブリックのコンストラクタにオブジェクトを辞書に入れるだけで、キーを変数名として参照するだけで、報酬関数が自動的にアクセスできるようになります
5.12K