hydracraft cs175 proj vanilla random agent cd src python multiagent.py dqn cd malmoRL python run_classroom.py --agent dqn