El blog de Machine Learning

¿Qué son las redes neuronales y para qué sirven?

artificial brain

Las Redes Neuronales son el núcleo de la Inteligencia Artificial. Son utilizadas por organizaciones de todo el mundo para innovar,automatizar tareas y para ser más competitivas. En este artículo explicaré en términos sencillos y sin ningún tipo de términos matemáticos o técnicos qué son y cómo puede usarse para innovar en su dominio.

 

No hay nada inteligente acerca de la Inteligencia Artificial

Cuando el término "Inteligencia Artificial" entra en una conversación, la mayoría de la gente probablemente piense en un cerebro robótico hecho de partes electrónicas que sea capaz de autoconciencia ... Hace poco escribí una publicación en un blog sobre la increíble y aburrida verdad sobre Artificial Inteligencia, donde explico en términos simples por qué no hay nada intrínsecamente inteligente acerca de la Inteligencia Artificial ... Es solo un software que usa las matemáticas para hacer cálculos complicados.

Las redes neuronales son una de las formas más populares de hacer Machine Learning. Pero resultó que les dimos ese nombre, simplemente porque la arquitectura del software que hace todos los cálculos fue inspirada por nuestra comprensión del cerebro humano.

 

Cómo funciona el cerebro humano

El cerebro humano es la unidad central de procesamiento del cuerpo humano y está compuesto por aproximadamente 86 billones de células llamadas Neuronas. Cada neurona tiene un núcleo y se conecta a otras neuronas por axones que forman sinapsis. Tenemos aproximadamente un cuatrillón de sinapsis en nuestro cerebro que transportan señales eléctricas. Cada neurona funciona como una "puerta de enlace" que decide si la corriente eléctrica que recibe debe pasar a la siguiente neurona o no.

neuron

Cada vez que hay una "entrada" de nuestro cuerpo, digamos por ejemplo, nuestra mano toca una superficie ardiente, se envía una señal eléctrica de la mano a nuestro cerebro y en un período de tiempo muy corto, la señal eléctrica viajará de neurona a neurona, procesando la información, hasta que una señal de "salida" se envíe de vuelta a la mano, diciéndole que se aleje de la superficie caliente lo más pronto posible.

 

El perceptrón

A fines de la década de 1950, un psicólogo estadounidense con el nombre de Frank Rosenblatt, se le ocurrió el concepto de el perceptrón. El perceptrón es un algoritmo para el aprendizaje supervisado que fue modelado inspirado en la Neurona humana y, como tal, tiene:

  • Varios canales de entrada (diferentes corrientes eléctricas)
  • Una unidad de procesamiento (el núcleo de la neurona)
  • Una salida (la corriente eléctrica pasa a la siguiente neurona o no)

El proceso se repite varias veces y las salidas se convierten en nuevas entradas para otras unidades de procesamiento.

perceptron

Una secretaria virtual con tecnología de AI

Digamos que soy una persona muy famosa y todos los días recibo en mi correo cientos de invitaciones para participar en eventos. Estoy perdiendo demasiado tiempo leyendo cada invitación y decidiendo si debería participar o no. Decido que quiero entrenar a una secretaria virtual y proporcionarle una red neuronal para que pueda hacer el trabajo por mí.
La secretaria podrá filtrar futuras invitaciones y solo enviarme aquellas que valen la pena y merecen mi atención.

machine learning

Clasificación binaria

En aras de la simplicidad, digamos que solo hay dos factores que quiero tener en cuenta al tomar la decisión de si quiero asistir a un evento o no:

  • El interés del tema
  • La distancia desde mi casa

Si el tema es muy interesante y el evento está cerca de mi casa, definitivamente lo atenderé. Si, por el contrario, el evento es aburrido y también está muy lejos de mi apartamento, definitivamente no iré. La red neuronal se vería así:

Perceptron

Digamos que quiero pasar un tiempo con mi secretaria virtual entrenandola para filtrar correctamente mis invitaciones. Si tomo 20 ejemplos, puedo enseñar a mi secretaria virtual los resultados correctos para cada ejemplo.
Si trazo todos los ejemplos en un gráfico de dos dimensiones, los resultados se verían así.

Linear regression

El objetivo final del Machine Learning es descubrir la ecuación matemática que represente con mayor precisión la línea de decisión del límite, de modo que pueda predecir correctamente si asistiré a un evento futuro o no en nuevos datos que le daré.
Con los datos de entrenamiento dados, podemos ver que este es un ejemplo clásico declasificación binaria, donde el límite que separa mi toma de decisiones es una línea recta simple.

Linear regression

Regresión no lineal

A veces, el conjunto de datos no necesariamente se ajusta a una línea recta...
¿Qué sucedería, por ejemplo, si el tema del evento es interesante, pero MUY lejos de mi casa, por ejemplo, en otra ciudad?
Es muy probable que haya una distancia máxima a la que estoy dispuesto a viajar para asistir a cualquier evento dado sin importar lo interesante que sea.
En este caso, necesitaríamos adaptar nuestra ecuación matemática para que pueda proporcionar resultados más precisos y el resultado se vería un poco así.

 

non linear regression

Esto se conoce como "regresión no lineal" y es probablemente una representación más correcta de la realidad. La regresión no lineal se puede aplicar a un número diferente de conjuntos de datos para dibujar con precisión la predicción o "clasificación" de una decisión.

Regresión multivariable

En nuestro ejemplo, solo usamos dos parámetros para predecir un resultado, pero en realidad, existen múltiples criterios que podrían influir en mi decisión, como por ejemplo:

  • El clima
  • El costo del evento
  • Mi salud
  • Que tan libre está mi agenda
  • etc

No todas las entradas tienen el mismo peso en la salida. Por ejemplo, un evento puede ser muy interesante y cercano a mi casa, pero si estoy muy enfermo, no hay forma de que salga de la cama.
En este caso, la entrada "salud" tiene un peso (impacto) muy alto en la salida.

 

sick

Redes neuronales de múltiples capas

A veces es simplemente imposible clasificar todos los datos con una línea y en 1989, el matemático George Cybenko, se le ocurrió la Teoría de aproximación universal. La teoría mostró que las redes neuronales multicapa eran más precisas que la regresion linear.
Las redes multicapa tienen diferentes capas de entradas "ocultas" que se utilizan como pasos adicionales en el cálculo final de la salida.
No es necesariamente simple de entender lo que significan estas unidades ocultas. A medida que las capas están más ocultas en la red neuronal, estas se convierten en conceptos más y más abstractos.

 

multilayer neural network

En el aprendizaje supervisado, el objetivo final es determinar la ecuación matemática correcta que podrá predecir o clasificar una salida. Para esto, el profesional de machine learning necesitará tanto definir la arquitectura de la red neuronal (número de entradas, número de capas ocultas, etc.), como también "enseñar" a su modelo, cuáles son los "parámetros correctos" o los pesos para cada entrada. Para esto, implementará algo llamado "back propagation", un tema que probablemente cubriré en un artículo diferente.

Bien, entonces, ¿qué puedo hacer con la redes neuronales?

Puedes olvidarte de la secretaria virtual :)
Ahora que hemos cubierto los aspectos básicos de las redes neuronales, imagina que las fuentes de entrada para un modelo pueden ser las que elijas utilizar. Las entradas pueden ser datos financieros, números de mercado, estadísticas salariales o cualquier cosa que se pueda imaginar.
Las entradas también pueden ser píxeles de una imagen y esto abre la puerta a aplicaciones muy interesantes como reconocimiento facialconducción autónoma y diagnóstico médico. Sólo para nombrar unos pocos.
Las aplicaciones de las redes neuronales son infinitas y el único límite es nuestra imaginación.

artificial neural networks

Al final, es solo un montón de cálculos

Como mencioné antes, no hay nada intrínsecamente inteligente acerca de la Inteligencia Artificial. Las Redes Neuronales se inspiraron en nuestra comprensión actual del cerebro humano y sus sinapsis, pero este es un campo en el que se están realizando muchas investigaciones y todavía hay mucho por descubrir.
Al final, es solo un montón de matemáticas que tienen lugar para predecir un resultado. Lo maravilloso ahora, es que el cloud computing nos permite hacer todo esto a un precio muy económico

 

¡MLab, los especialistas en Machine Learning a tu servicio!

Si el machine learning te inspira y crees que te gustaría implementar un caso de uso en tu organización, por favor contáctanosSomos independientes de los proveedores y recomendaremos e integraremos la tecnología que se adapte mejor a sus necesidades. Si las tecnologías disponibles no satisfacen tus necesidades, siempre podemos capacitar a un modelo personalizado adaptado a tu proyecto.

Aprendizaje automático