IT3105-AlphaGo

AlphaGo-kockoff MCTS for å spille HEX.

MCTS har rollouts og en actor

Vi bruker rollouts til å begynne med, men vi belager oss mer og mer på the critic ettersom den blir bedre.

MCTS: Balancing exploration and exploitation

UBC1: balanserer exploration og exploitation ved å ta hensyn til hvor mange ganger en node har blitt besøkt og hvor stor verdien er. Blir brukt til å velge hvilken node vi skal utforske videre.
Rollouts: Utfører en simulering av et spill fra en node til en terminal node. Velger neste node basert på Greedy epsilon policy. Det vil si at vi velger en tilfeldig node med sannsynlighet epsilon, og ellers velger vi den noden som gir høyest verdi basert på estimater fra neural networket.

hvordan definere resultatet av en rollout

Hvis vinneren er samme player som har sin tur i noden til MCTS, så er resultatet 1. Hvis vinneren er motstanderen, så er resultatet -1. Hvis det er uavgjort, så er resultatet 0.

TODO: make sure that a node is not added to the tree if it is alrady in the tree.

packages

PrettyPrintTree
numpy
kreas
tensorflow==2.15
tf2onnx
onnxruntime
tabulate
colorama

Name		Name	Last commit message	Last commit date
Latest commit History 112 Commits
.vscode		.vscode
config		config
game		game
neural_net		neural_net
topp		topp
tree_search		tree_search
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
main.py		main.py
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IT3105-AlphaGo

hvordan definere resultatet av en rollout

packages

About

Releases

Packages

Contributors 2

Languages

MatsNissen-Lie/IT3105-AlphaGo

Folders and files

Latest commit

History

Repository files navigation

IT3105-AlphaGo

hvordan definere resultatet av en rollout

packages

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages