Aprendizaje profundo ilustrado, Parte 2: ¿Cómo aprende una red neuronal? | de Shreya Rao | febrero 2024
Bienvenido a la Parte 2 de la serie Deep Learning Illustrated. En el Artículo anterior (¡definitivamente lea esto primero!), cubrimos cómo funciona una red neuronal y cómo entrenado La red neuronal hace predicciones.
En este artículo profundizaremos en capacitación procesar y explorar cómo aprende una red neuronal.
📣 Si no ha leído mis artículos anteriores, le recomiendo que comience con mi serie de artículos que cubren conceptos básicos del aprendizaje automáticoespecíficamente el de Descenso de gradiente porque encontrará que gran parte del material cubierto aquí es relevante.
Paquete de inicio de aprendizaje automático
Digamos que queremos crear una red neuronal que prediga los ingresos diarios de las ventas de helado utilizando funciones de temperatura y día de la semana.
Este es el conjunto de datos de entrenamiento que estamos usando:
Para construir una red neuronal, como aprendimos en el artículo anterior, primero debemos decidir su arquitectura. Esto incluye determinar la cantidad de capas ocultas, la cantidad de neuronas en cada capa y la función de activación de cada neurona.
Digamos que decidimos que nuestra arquitectura es: 1 capa oculta con 2 neuronas y 1 neurona de salida, todas usando la función de activación del rectificador.
La terminología es la siguiente: en el artículo anterior, aprendimos cómo usar subíndices para diferenciar entre diferentes pesos. Seguiremos la misma convención aquí y, además, usaremos superíndices para indicar el…