OpenAI Hide and Seek (Reinforcement Learning)

OpenAI desarrolló un algoritmo mediante el cual múltiples agentes descubren formas cada vez más complejas de usar herramientas para resolver una tarea, el entorno divide los agentes en dos equipos, uno que debe esconderse y otro encontrarlo.
El algoritmo usa LSTM, Proximal Policy Optimization y otras herramientas del Deep Learning y Reinforcement Learning.
El artículo completo puedes leerlo aquí:
openai.com/blog/emergent-tool...
#MachineLearning #ReinforcementLearning

Пікірлер