Episódio 3 - A virada de chave da inteligência artificial - Transformando o futuro com educação e inovação

DE VOLTA AO BÁSICO

Episódio 3 - A virada de chave da inteligência artificial

Nos episódios anteriores, vimos que a inteligência artificial (IA) não é tão nova assim. Pode-se dizer que ela foi inventada há 70 anos. Mas por que demorou tanto tempo para ela se tornar realidade? Classicamente, três elementos são essenciais para a IA:

grande capacidade de processamento e de memória (armazenamento de informação) dos computadores;
linguagens de programação potentes;
disponibilidade de grande volume de dados, o chamado big data.

Eu acrescentaria um quarto fator, a mudança da lógica de programação de simbólica (baseada em regras) para probabilística (baseada em relações matemáticas ou estatísticas).

Os programas baseados em IA probabilística exigem um grande volume de dados para que eles consigam aprender as relações probabilísticas que existem entre os dados. Para isso, além de muitos dados, é preciso grande capacidade de processamento e de armazenamento.

Imaginem que no início da década de 1990, nos primórdios da internet, os dados eram transportados em disquetes de plástico de 720 kB (quilobytes). Um disquete desses armazenava no máximo 300 páginas de documentos de texto (sem imagens). Para facilitar a comparação, a capacidade de armazenamento de um celular com 64 GB (gigabytes) equivale a 90.000 disquetes! Depois vieram os pendrives e a nuvem.

O desenvolvimento e expansão da internet foram essenciais para o armazenamento de dados na nuvem. E a internet e a nuvem foram essenciais para o big data, termo criado na virada do século. Inicialmente, ele referia-se a grandes volumes de dados, muito variados e gerados rapidamente (velocidade). Os chamados três V’s. Depois esse conceito foi ampliado com mais dois V’s: veracidade (qualidade e confiabilidade do dado) e valor (capacidade de gerar informação útil). Sem a nuvem e o big data não haveria a IA como conhecemos hoje.

Mas como tudo isso virou a aprendizagem de máquina?

No início do século XXI tínhamos as condições para desenvolver a IA probabilística: grande capacidade de processamento, linguagens de programação potentes e grande volume de dados. Existem três abordagens básicas para isso: o treinamento supervisionado, o treinamento não supervisionado e o treinamento por reforço. Elas podem ser utilizadas de forma isolada ou combinada. Existem outras técnicas, mas vamos focar nessas três, que formam a base da IA contemporânea.

No treinamento supervisionado, você precisa fornecer para o computador um banco de dados (base de treinamento) previamente rotulado, ou seja, que possua as entradas e as saídas identificadas. Vamos pensar em um programa de classificação de vinhos. Para cada vinho eu teria um conjunto de características (entrada), como ano da safra, tipo de uva, teor alcoólico, região de fabricação e tempo de envelhecimento, e a sua classificação (saída), que pode ser uma nota ou categorias (ruim, regular, bom e excelente). A IA vai “construir” o seu próprio caminho para sair das características (entrada) e chegar às categorias (saída). Para isso, ela vai testar várias combinações de pesos diferentes para as características de entrada, até alcançar um nível de acerto predefinido. Ao final do processo, teremos um modelo (fórmula matemática) que poderá ser aplicado à classificação automática de outros vinhos, que não fizeram parte da base de treinamento.

Já no treinamento não supervisionado, só existem os dados de entrada. O objetivo é que a IA classifique os dados de entrada em grupos, a partir da identificação de padrões semelhantes entre eles. Voltando ao exemplo do vinho, imagine que você tem um banco de dados apenas com as características dos vinhos, como tipo de uva, teor alcoólico, nível de acidez, quantidade de açúcar residual, cor, região de origem e tempo de envelhecimento. A tarefa da IA seria classificar esses vinhos em diferentes grupos, de acordo com as suas semelhanças. Ao final, você poderia ter três grupos de vinhos: leves e ácidos, encorpados e com maior teor alcoólico e adocicados. Uma observação. A IA cria os grupos, mas é você dá os nomes. Depois que a classificação for validada, você terá as saídas e poderá usar esse banco de dados, com entradas e saídas, para realizar um treinamento supervisionado.

No treinamento por reforço, a IA aprende por tentativa e erro. Em vez de receber um banco de dados com as respostas certas, ela interage com um ambiente e vai recebendo recompensas quando toma boas decisões e punições quando comete erros. Aos poucos, o sistema ajusta seu comportamento para aumentar as recompensas e reduzir as punições. Pense, por exemplo, em um programa que precisa aprender a jogar xadrez. Cada jogada correta, que melhora sua posição no tabuleiro ou leva à vitória, funciona como um reforço positivo. Já uma jogada ruim, que leva à perda de peças ou à derrota, funciona como um reforço negativo. Com o tempo, a IA aprende quais estratégias trazem melhores resultados.

Neste episódio, vimos a importância do big data para o desenvolvimento da IA moderna e três abordagens básicas de treinamento da IA, que podem ser utilizadas tanto na aprendizagem de máquina como na aprendizagem profunda. No próximo episódio, vamos ver como o computador aprende a enxergar o mundo real.

Para aprofundar seu conhecimento sobre IA e modelos de linguagem, conheça o curso Desbravando o ChatGPT (www.antoniotoledo.com.br).