log_prob la comprensión de la distribución normal en pytorch

votos
1

Actualmente estoy tratando de resolver Péndulo-V0 del ambiente del gimnasio openAi que tiene un espacio de acción continua. Como resultado, tengo que usar una distribución normal para probar mis acciones. Lo que no entiendo es la dimensión de la log_prob al usarlo:

introducir

Se esperaba un tensor de tamaño 2 (uno para cada log_prob acciones), sino que muestre un tensor de tamaño (2,2).

Sin embargo, cuando se utiliza una distribución categórica para el medio ambiente discreta la log_prob tiene el tamaño esperado. ¿Por qué el log_prob para la distribución normal de un tamaño diferente?

Publicado el 19/03/2020 a las 21:23
fuente por usuario
En otros idiomas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more