Mundo de la cuadrícula
Aplicando evaluación de política y mejora de política en un ejemplo de MDP finito episódico.
Aplicando evaluación de política y mejora de política en un ejemplo de MDP finito episódico.
¿Qué es? y como los métodos iterativos se usa en el reinforcement learning para encontrar una política óptima.
Introducción al modelo computacional cuántico llamado Quantum circuit model.
Introducción al Reinforcement Learning, sus elementos como los procesos de decisión de markov y funciones de valor.
Explicación breve de algunas variantes de redes neuronales para procesar datos secuenciales como GRU y 1D CNN.
Explicación de la aplicación de las redes LSTM a una estructura de árbol.
Explicación de la aplicación de las redes neuronales a datos estructurados como grafos.
Una introducción a las redes neuronales desde cero.
Implementación de una red neuronal solo con numpy.
Una ruta de aprendizaje para poder entender los modelos más comunes para generar imágenes a partir de texto.
Una ruta de aprendizaje para poder entender los modelos grande del lenguaje.
Explicación matemática del PAC y la implementación con python.