Las redes neuronales como modelo de computación distribuida y
autoprogramable
1 . Características de la computación
neuronal
·
A /
Arquitectura modular
·
B /
Organización en multicapas
·
C / Gran
número de procesadores elementales con gran conectividad entre ellos
·
D / Cada
procesador realiza una función local generalmente analógica y no lineal (usualmente suma ponderada seguida
de sigmoide o abrupta)
·
E /
Eliminación parcial de necesidad de programación
·
F / Empleo de
algoritmos de aprendizaje
·
G / Tolerancia
a fallos
2 . Dificultades de empleo
·
A / Hay
problemas en los que no es aplicable
·
B / No hay
metodología clara
·
C / No existen
entornos de desarrollo
·
D / Se pasa
directamente del nivel del conocimiento al de procesadores (por eso no hay
entornos de desarrollo)
Modelos de neuronas
1 . Modelos analógicos
·
Suma ponderada
(lineal) + función de decisión (no lineal) + retardo

Yj* ( t+ t )
= wij ( t ) * xi ( t )
Yj ( t + t ) =
Gj ( Yj* ( t ) )
·
Posibles
formas de funciones de decisión:
Abrupta :
Yj
( t + t ) = 1 si Yj* ( t ) >= umbral
Yj ( t + t ) = 0 si Yj* ( t ) < umbral
Sigmoide : Yj ( t + t ) = ( 1 + exp ( - Yj* / T ) ) ^ (-1)
( 1 - exp ( - Yj* / T ) )
Tangente hiperbólica: Yj ( t + t ) = ----------------------------
( 1 + exp ( - Yj* / T ) )
Expansión del modelo analógico
·
El modelo
analógico está limitado porque al ser lineal en su función de excitación, sólo
es posible clasificar ciertos grupos de datos (aquellos separables linealmente).
·
Para resolver
esta limitación, se introduce un codificador no lineal para expandir los
espacios de entrada y/o salida y los haga no lineales.
2 . Modelos lógicos
·
Sólo se
modifican del modelo analógico las entradas, que ahora son
variables lógicas (0 o 1).
·
La suma
ponderada es ahora una unión lógica.
·
El producto es
ahora una intersección lógica.
·
Los
campos receptivos Vj y Vj* permanecen
iguales al modelo analógico.
·
Las
estructuras FIFO de entradas y salidas también permanecen
Por lo tanto, una neurona lógica puede
calcular cualquier función lógica de sus entradas, sus salidas y las salidas de
otras neuronas en tiempos anteriores.

Yj ( t+ t ) = wij ( t ) * mi ( t )
Con wij entre 0 y 1 . Vale 1 si el
término mínimo está presente y 0 en caso contrario.
mi
( t ) toma la notación : para dos entradas x1 , x2 :
m0 = x1' x2 ' m1 = x1' x2 m2 = x1 x2 ' m3 = x1 x2
·
Este modelo es
similar a la teoría de autómatas finitos deterministas, por lo que las redes
neuronales lógicas están formalizadas en sus aspectos de análisis y síntesis.
Expansión del modelo lógico: modelo
probabilístico
·
Es similar al
modelo lógico salvo en la función de excitación.
·
En este caso,
los pesos son probabilidades de la existencia de un término mínimo mi
que excluye a todos los demás.

Yj ( t+ t ) = pij ( t ) * mi
Donde pij ( t ) es la probabilidad
de disparo de la neurona j en el instante t si la entrada es mi .
3 . Modelos inferenciales
·
Estos modelos
se han introducido para lanzar un puente entre la IA simbólica y la IA
conexionista. Esto se hace permitiendo funciones de computación local
estructuradas (marcos, guiones…) o reglas.
·
Las funciones
de excitación y de activación (umbral) se sustituyen por la evaluación del
antecedente de una regla y la utilización de una tabla LUT (para el caso de la
utilización de reglas).
·
De esta forma,
es posible introducir redes borrosas y tratarlas con computación neuronal.
·
Los modelos
basados en reglas no pueden simular todo el poder de las reglas en la IA
simbólica, por lo que se suelen emplear marcos en vez de reglas.
Tipos de aprendizaje
1 . Reglas correlacionales
·
Aprendizaje de
tipo no supervisado.
·
Empleo de la
regla de Hebb.
Regla de Hebb
Toda la información necesaria para el
aprendizaje la transporta la propia señal de entrada.
Wij ( t + t ) =
wij ( t ) + lr *
xi ( t ) *
yj ( t )
·
A veces se
utiliza la variante de la regla de Hebb en la que se acota la subida creciente
de los pesos en cada ciclo del aprendizaje. Se introduce un factor de olvido en
la red.
Wij ( t + t ) =
wij ( t ) + lr *
xi ( t ) *
yj ( t ) - dr *
wij ( t )
Aprendizaje asociativo (redes asociativas)
·
Se utiliza la
regla de Hebb.
·
Se trata de
descubrir coincidencias o agrupaciones implícitas en los datos de entrada de la
red.
·
De esta
forma: a/ Se disminuye la
dimensionalidad del espacio de entrada.
b/ Se extraen características de los
datos de entrada.
Aprendizaje competitivo (redes de inhibición
lateral)
·
Primero se
calcula cuál es la neurona cuyo peso está más cerca del vector de entrada.
Distancia ( wij , xi ) = mínima
·
Para esta
neurona es para la única que se modifica el peso (las demás permanecen igual).