J'avais un vol entièrement autonome alimenté par RL qui fonctionnait il y a environ 2 semaines, et à un moment donné, il a été perdu. J'ai corrigé comme ça. 4 bugs vraiment, vraiment horribles avant qu'il ne recommence à fonctionner. C'était vraiment terrifiant. J'étais sincèrement sur le point de revenir en arrière. Le matériel + les réseaux neuronaux, c'est en fait vraiment difficile.
la chose folle, c'est que ça fonctionnait encore, je veux dire la politique. comme, si je plissais les yeux, je pouvais voir les comportements dégénérés qui aboutiraient à un échec. où la cause profonde était un bug horrible, horrible (les capteurs gauche et droit échangés dans les observations !)
Je me demandais : peut-être aurais-je dû commencer par des voitures RC au lieu de multirotors RC - mais je suis content d'avoir choisi les multirotors. Les voitures RC auraient été trop indulgentes, et mon infrastructure n'aurait pas dû être aussi bonne qu'elle l'est aujourd'hui
Je dois m'asseoir et réfléchir très, très attentivement à mon test de bout en bout. Le scénario idéal serait un test de bout en bout où j'ai le simulateur de physique, et le formateur en cours d'exécution, et plusieurs multirotors physiques réels lancés et testés automatiquement dans une pièce sombre
Le problème auquel je fais face est principalement que mon infrastructure matérielle change si rapidement. Chaque semaine, j'ai un nouveau châssis multirotor, un nouveau logiciel de contrôle, un nouveau firmware de lien de communication bidirectionnel, de nouveaux capteurs..
Douleur
en fait, c'est le plan pour l'assurance qualité de toute façon. autant le construire plus tôt que plus tard
@BigwetRealism avec RL, j'ai été surpris ; il apprendra des stratégies pour collecter des informations sur le monde dans son état caché avant de l'exploiter. vraiment fou
@BigwetRealism la raison pour laquelle les gens ne font pas de RL, c'est parce qu'ils sont nuls. Ils ne veulent pas passer 4 mois à écrire des simulations en cuda depuis zéro.
@BigwetRealism je suis honnêtement pressé par le temps. J'ai si peu de temps.
@BigwetRealism il y a tellement de choses scientifiques que je veux essayer. Je dois juste construire l'infrastructure, vendre quelque chose, puis embaucher des gens pour m'aider avec ça.
@BigwetRealism un point de données pour toi mon plus gros problème est de modéliser la physique ce qui m'aiderait plus que de nouvelles façons d'apprendre des comportements, ce sont de nouvelles façons d'apprendre l'environnement
176