Skip to content
Simio background artwork

Redes neurais: O que são e a história por trás delas

Equipe do Simio

novembro 3, 2021

O conceito de uma “máquina que pensa” ou de uma entidade inanimada que pensa remonta aos cientistas da Grécia Antiga, que buscavam imbuir objetos com capacidades analíticas. No entanto, o sucesso dos gregos antigos em concretizar a máquina pensante foi severamente limitado devido a limitações na compreensão de como o cérebro humano funcionava e como a atividade nervosa ocorria. Levaria alguns séculos desde a conceituação da máquina de pensar até o mapeamento de como o cérebro humano poderia produzir padrões complexos por meio de células cerebrais conectadas, também conhecidas como neurônios.

O artigo de pesquisa de 1943 “A Logical Calculus of the Ideas Immanent in Nervous Activity” (Um cálculo lógico das ideias imanentes na atividade nervosa), de Warren S. McCulloch e Walter Pitts, apresentou ao mundo a atividade neural do cérebro. Os colaboradores descreveram o processo no qual os neurônios do sistema nervoso enviam sinais uns aos outros para iniciar um impulso. Eles postularam que um neurônio, que está conectado a milhares de outros neurônios, envia e recebe uma quantidade variável de energia e que um neurônio envia energia somente quando seu limite é atingido.

Esse importante artigo abriu caminho para a integração de redes neurais nos campos STEM de IA, aprendizado de máquina e aprendizado profundo. A pesquisa tornou-se a base para a utilização de redes neurais em programas de computador para permitir que eles reconheçam padrões e resolvam problemas de forma independente.

O que são redes neurais?

As redes neurais refletem os padrões de comportamento do cérebro humano, imitando o processo de comunicação dos neurônios biológicos durante as atividades neurais. Nos campos de aprendizado de máquina e aprendizado profundo, as redes neurais são chamadas de redes neurais artificiais (ANN) ou Redes Neurais Simuladas (SNN). Essas conotações destacam o fato de que a aplicação de redes neurais nesses campos é inspirada no cérebro humano.

As redes neurais artificiais consistem em camadas de nós, incluindo – uma camada de entrada, camadas ocultas singulares ou múltiplas e uma camada de saída. Aqui, os nós representam neurônios artificiais e cada nó tem seus pesos e limites associados. Quando a saída de um nó individual está acima de seu limite definido, o nó é ativado e envia dados para a próxima camada de nó em sua rede. Por outro lado, se a saída não exceder o limite do nó, nenhum dado será enviado para a próxima camada da rede de nós. Assim, o caráter de um neurônio pode ser definido como uma unidade lógica de limiar (TLU) que insere diversas quantidades ponderadas, soma essas quantidades e, quando as quantidades somadas atingem ou ultrapassam o limiar definido (theta), ele produz uma quantidade.

A rotulagem de caracteres, como a quantidade de entrada, o limiar e a saída, proporciona uma melhor compreensão do funcionamento das redes neurais. Por exemplo, uma entrada e seu peso são rotulados como – X 1, X 2,…, X n e W 1, W 2, …,W n. Aqui, X representa a entrada de um nêutron ou nó e W, seu peso. Assim, a soma da entrada e de seu peso é – X!*W! , o que resulta no nível de ativação (a) de um nó. Fazendo a = (X1 * W1) + (X2 * W2) +…+ (Xn * Wn).

Nos cenários em que o nível de ativação (a) é igual ou maior que o limite (teta), é produzida uma saída (y), mas se o nível de ativação for menor que teta, não haverá saída. Portanto, theta deve ser atingido ou ultrapassado para ativar um neurônio e enviar uma saída ponderada para a próxima camada de nós.

Como as unidades lógicas de limiar aprendem

As redes neurais devem ser treinadas para melhorar sua precisão na resolução de problemas e na tomada de decisões antes de aproveitá-las nos aplicativos de IA. O aprimoramento da precisão de uma rede neural começa com a obtenção de uma visão do processo de aprendizado das unidades lógicas de limiar.

Então, como as unidades lógicas de limiar aprendem e como as redes neurais são treinadas?

A resposta curta é que uma TLU aprende alterando continuamente seus pesos e limites. A resposta mais longa envolve o processo de treinamento supervisionado e não supervisionado. No treinamento supervisionado, as redes neurais são treinadas com a entrada de uma série de exemplos de:

  • Diversos itens a serem classificados e
  • As classificações adequadas atribuídas aos itens

A rede neural pega as informações fornecidas e as utiliza para modificar seus pesos até fazer a correspondência entre os itens e suas devidas classificações. Portanto, a rede neural analisa os dados de entrada e saída para desenvolver respostas que correspondam às quantidades inseridas em uma saída.

No treinamento não supervisionado, é fornecida apenas uma série de itens a serem classificados ou dados de entrada. A rede neural aplica a análise estatística para identificar diferenças ou anomalias no conjunto de dados de entrada. Isso significa que o treinamento não supervisionado permite que a rede neural trabalhe com os dados e produza resultados sem qualquer saída que colora as direções analíticas da rede.

O uso de um cenário do mundo real ajuda a entender como as redes neurais aprendem. Por exemplo, um nó singular pode ser treinado para analisar se é necessário equipamento adicional em um chão de fábrica usando valores binários. Primeiro, vamos supor que três fatores influenciem sua tomada de decisão:

  1. Você tem capacidade de acomodação suficiente? (Sim = 1, Não = 0)
  2. A demanda justifica equipamentos adicionais? (Sim = 1, Não = 0)
  3. Você tem fundos suficientes? (Sim = 1, Não = 0)

Em seguida, aplicam-se as seguintes premissas de entrada:

  • X1 = 1, sim, há espaço suficiente disponível para novos equipamentos
  • X2 = 0, a demanda não justifica a necessidade de novos equipamentos
  • X3 = 0, Não há fundos suficientes para novos equipamentos.

Em seguida, os pesos devem ser atribuídos a cada entrada. Aqui, um peso maior significa maior influência sobre a decisão final a ser tomada:

  • W1 = 3, porque o espaço é importante para acomodar novos equipamentos
  • W2 = 5, a demanda é fundamental para decidir se é necessário um novo equipamento
  • W3 = 2, Os fundos sempre podem ser levantados se a necessidade de novos equipamentos for urgente

Por fim, um valor limite deve ser atribuído para garantir que a rede neural avalie as informações fornecidas para responder corretamente. Aqui, o valor limite é 4 e se traduz em um valor de viés de -4. Se você inserir todos esses valores na fórmula acima, “a = (X1 * W1) + (X2 * W2) +…+ (Xn * Wn).”, teremos:

Y = (1 * 3) + (0 * 5) + (0 * 2) – 4 = -1.

O cálculo final é -1 e é menor do que a função de ativação necessária para produzir uma saída. Portanto, o output desse nó é 0. Isso significa que não é necessário ou não é possível comprar novos equipamentos no momento.

O treinamento da rede neural destacado nesses exemplos é feedforward porque flui em uma única direção – da entrada para a saída. A retropropagação é outra técnica usada para treinar redes neurais. Na retropropagação, os erros atribuídos a cada neurônio são incluídos nos cálculos para permitir os ajustes adequados dos parâmetros de um modelo de rede.