Running environment.
The python version is 3.6
pip install mlagents==0.4
CUDA 9.0
torch-1.0.0-cp36-cp36m-win_amd64
pip3 install https://download.pytorch.org/whl/cu90/torch-1.0.0-cp36-cp36m-win_amd64.whl pip3 install torchvision
# ml-agents 0.5버전 이상 from mlagents.envs import UnityEnvironment # ml-agents 0.4버전 이하 from unityagents import UnityEnvironment
env = UnityEnvironment(file_name="(불러올 환경 주소)") ex) env = UnityEnvironment(file_name="../environment/Banana_Windows_x86_64_0.4/Banana.exe")
brain_name = env.brain_names[0] brain = env.brains[brain_name]
env_info = env.reset(train_mode=True)[brain_name]
# ml-agents 0.4버전 이하 action_size = brain.vector_action_space_size (액션 으로 반환) # ml-agents 0.5버전 이상 action_size = brain.vector_action_space_size[0] ([액션] 으로 반환) state = env_info.vector_observations[0] state_size = len(state)
env_info = env.step(action)[brain_name] next_state = env_info.vector_observations[0] reward = env_info.rewards[0] done = env_info.local_done[0]
신경망을 작성할떄 리스트형식은 입력이 안되므로 state size와 action size를 대입할때 주의하자
정확한 이유를 모르겠지만 cmd에서 git clone하면 환경이 실행하는 오류가 발생하는데 만약 코드를 실행시켰는데 "The Unity environment took too long to respond" 오류가 뜨면 zip 파일로 다운받아서 사용하시면 작동됩니다.