ik had ongeveer 2 weken geleden een volledig autonome RL-aangedreven vlucht werkend, en op een gegeven moment ging het verloren. Ik heb ongeveer 4 echt, echt vreselijke bugs opgelost voordat het weer begon te werken. Eigenlijk beangstigend. Ik was oprecht van plan om terug te keren hardware + neurale netwerken is eigenlijk echt moeilijk
het krankzinnige was dat het eigenlijk nog steeds werkte, ik bedoel het beleid. zoals, als ik mijn ogen samenknijpt, kon ik de degeneratieve gedragingen zien die zouden culmineren in falen. waar de oorzaak een vreselijke, vreselijke bug was (linker- en rechtersensoren verwisseld in observaties!)
Ik vroeg me altijd af: misschien had ik beter met RC-auto's kunnen beginnen in plaats van met RC-multirotors - maar ik ben blij dat ik voor multirotors heb gekozen. RC-auto's zouden te vergevingsgezind zijn geweest, en mijn infrastructuur zou niet zo goed hoeven te zijn als die nu is.
Ik moet gaan zitten en heel, heel zorgvuldig nadenken over mijn end-to-end test. Het ideale scenario zou een end-to-end test zijn waarbij ik de fysica-simulatie heb, en de trainer draait, en meerdere echte fysieke multirotors automatisch worden gelanceerd en getest in een donkere kamer
Het probleem waar ik mee te maken heb, is voornamelijk dat mijn hardware-infrastructuur zo snel verandert. Elke week heb ik een nieuw multirotorframe, nieuwe besturingssoftware, nieuwe firmware voor de bidirectionele communicatielink, nieuwe sensoren..
Pijn
eigenlijk is dat de planning voor QA in ieder geval. we kunnen het beter eerder dan later bouwen.
@BigwetRealism met RL ben ik verrast; het zal strategieën leren om informatie over de wereld in zijn verborgen toestand te verzamelen voordat het deze benut. echt wild
@BigwetRealism de reden dat mensen geen RL doen, is omdat ze slecht zijn. Ze willen geen 4 maanden besteden aan het schrijven van sims in cuda vanaf nul.
@BigwetRealism ik ben eerlijk gezegd tijdgebonden. ik heb zo weinig tijd
@BigwetRealism er zijn zoveel wetenschappelijke dingen die ik wil proberen. Ik moet gewoon de infrastructuur opbouwen, iets verkopen en dan mensen inhuren om me daarbij te helpen.
@BigwetRealism een datapunt voor jou mijn grootste probleem is het modelleren van fysica wat me meer zou helpen dan nieuwe manieren om gedragingen te leren, zijn nieuwe manieren om de omgeving te leren
177