from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
import matplotlib.pyplot as plt
import numpy as np


"""
Creación de los datos
"""
r0, r1 = 1, 4
k = 1000
X1 = [np.array([r0*np.cos(t),r0*np.sin(t)]) for t in range(0,k)]
X2 = [np.array([r1*np.cos(t),r1*np.sin(t)]) for t in range(0,k)]
X = np.concatenate((X1,X2))
n,d = X.shape
Y = np.zeros(2*k)
Y[k:] += 1
noise = np.array([np.random.normal(0,1,2) for i in range(n)])
X += 0.5*noise 

#Seprara en train y en test
x_train, x_test, y_train, y_test = train_test_split(X,Y, test_size=0.3)

#Visualización de train set
plt.scatter(x_train[:,0], x_train[:,1],c=y_train,s=1)
plt.show()

class DeepNN():
    """Clase para entrenar redes neuronales profundas"""
    def __init__(self,n_input,n_output,n_hidden,width):
        super(DeepNN, self).__init__()
        #Pesos capa de entrada
        self.w_in = np.random.rand(n_hidden, n_input)/np.sqrt(n_input)
        self.b_in = np.ones(n_hidden)
        #Pesos para las capas ocultas
        self.w = np.random.rand(width, n_hidden, n_hidden)/np.sqrt(n_input)
        self.b = np.ones((width,n_hidden))
        #Pesos para la capa de salida
        self.w_output = np.random.rand(n_output, n_hidden)/np.sqrt(n_hidden)
        self.b_output = np.ones(n_output)

    def __call__(self, x):
        """Aplicación de la red neuronal a datos de entrada"""
        # Guarda las pre-activaciones y activaciones en cada capa
        a = np.zeros((layer_width, number_of_hidden_layers))
        h = np.zeros((layer_width, number_of_hidden_layers))
        for k in range(0, layer_width):
            if k == 0:
                # Capa de entrada
                a[k] = np.dot(self.w_in, x) + self.b_in
                h[k] = np.tanh(a[k])
            else:
                # Capas ocultas
                a[k] = np.dot(self.w[k], h[k-1]) + self.b[k]
                h[k] = np.tanh(a[k])

        #Capa de salida
        a_out = np.dot(self.w_output, h[-1]) + self.b_output
        # Función softmax
        tmp = np.exp(a_out)
        f = tmp/tmp.sum(0)

        return f


# script con el código original
from deep_nerual_net import DeepNN

#Neuronas de entrada
n_input = x_train.shape[1]
#Neuronas en capas ocultas
n_hidden = 3
#Número de capas ocultas
width = 10
#Neuronas de salida
n_output = 2

#Creación de la red neuronal
net = DeepNN(n_input, n_output, n_hidden, width)
#Arquitectura de la red
net.w_shape

(3, 10, 10)

def train(self, x_train,y_train, lr=0.01,epochs=100):
    for t in range(epochs):
        for x,y in train_data:
            #FORWARD
            ...

            #BACKWARD
            #Variable en la salida
            d_out = # Derivada de riesgo por derivada de activación en salida
            self.w_output -= lr*np.outer(d_out, h[-1])
            #Variables en las capas ocultas
            d = # Guarda las variables en cada capa oculta
            for k in range(0, number_of_hidden_layers)[::-1]: #Recorre las capas en sentido inverso
                #Se calculan las variables y se actualizan los pesos
                ...
            #Backprop en la capa de entrada
            d_in = # Variable para capa de entrada
            self.w_in -= lr*np.outer(d_in, x)
            self.b_in -= lr*d_in


#Rango de aprendizaje
lr = 0.01
#Número de épocas
epochs = 1000

net.train(x_train, y_train, lr=lr, epochs=epochs)

100%|██████████| 1000/1000 [02:35<00:00,  6.44it/s]


#Predicciones
y_pred = [net(x).argmax() for x in x_test]
#Reporte de clasificación
print(classification_report(y_test,y_pred))

              precision    recall  f1-score   support

         0.0       0.99      0.98      0.98       302
         1.0       0.98      0.99      0.99       298

    accuracy                           0.98       600
   macro avg       0.99      0.99      0.98       600
weighted avg       0.99      0.98      0.98       600


min1, max1 = x_test[:, 0].min()-1, x_train[:, 0].max()+1
min2, max2 = x_test[:, 1].min()-1, x_train[:, 1].max()+1
x1grid = np.arange(min1, max1, 0.1)
x2grid = np.arange(min2, max2, 0.1)
xx, yy = np.meshgrid(x1grid, x2grid)
r1, r2 = xx.flatten(), yy.flatten()
r1, r2 = r1.reshape((len(r1), 1)), r2.reshape((len(r2), 1))
grid = np.hstack((r1,r2))
yhat = np.array([net(x_i).argmax() for x_i in grid])
zz = yhat.reshape(xx.shape)
plt.contourf(xx, yy, zz, alpha=0.6)

plt.scatter(x_test[:,0], x_test[:,1],c=y_test,s=2)
plt.show()

Retropropagación en redes profundas¶

Generación de datos¶

Creación de la red profunda¶

Entrenamiento con backpropagation¶

Evaluación¶