Episódio 3 - Será que a IA realmente entende você? - Transformando o futuro com educação e inovação

ANTES DO PROMPT

Episódio 3 - Será que a IA realmente entende você?

No último episódio, conversamos sobre a formação da base de treinamento e os problemas associados a ela. Hoje, vamos ver os problemas relacionados às outras etapas do desenvolvimento. Nas próximas duas etapas, a IA vai aprender “sozinha” as palavras e como utilizá-las.

Após o fechamento da base de treinamento, tem início a segunda etapa, chamada de treinamento não supervisionado. Nela, o aplicativo aprende as palavras e as relações que existem entre elas. Para isso, são produzidos os tokens, códigos numéricos que representam parte das palavras ou pequenas expressões. Esses códigos são transformados em vetores multidimensionais. De forma simplificada, é através da distância entre esses vetores que os aplicativos conseguem calcular a chance de determinadas palavras estarem relacionadas entre si.

A próxima etapa é o treinamento supervisionado. Nela, é utilizado um conjunto predefinido de situações e explicações ou perguntas e respostas, de 50 a 100 mil duplas. O programa cria suas próprias explicações ou respostas, compara os seus resultados com os resultados predefinidos e realiza ajustes até alcançar a precisão pré-estabelecida. Ao final dessa etapa, o modelo já sabe entender e falar.

A etapa final de desenvolvimento é o ajuste fino, feito por treinamento de reforço com supervisão humana. São definidas novas perguntas ou tarefas e é feito um feedback positivo ou negativo (supervisão). No caso de feedback negativo, o aplicativo refaz sua resposta até que ela seja considerada adequada. O objetivo dessa etapa é ajustar as respostas e o comportamento do modelo de linguagem.

É ao longo dessas três etapas que os modelos de linguagem aprendem a entender e a falar. Mas será que se pode dizer que eles realmente entendem? Que eles possuem a compreensão semântica, o que implica em dizer que eles realmente são capazes de compreender o significado das palavras?

Como vimos, na segunda etapa, eles estabelecem relações estatísticas entre as palavras, calculando a probabilidade de elas aparecerem juntas. Essas probabilidades são reforçadas nas duas etapas seguintes. Não se pode dizer que existe uma compreensão real do que foi escrito, pois o texto se baseia exclusivamente na relação estatística, ou probabilística, entre as palavras.

A falta de compreensão semântica leva a limitações importantes, que muitas vezes não são percebidas, como ausência de intenção e de juízo moral, incapacidade de verificar a verdade e simetria argumentativa. Se você pedir para ele escrever um texto a favor da dieta mediterrânea e outro a favor da inclusão de chocolate na dieta, ele defenderá as duas posições com a mesma qualidade textual e argumentativa.

Outro problema é a proatividade excessiva. Os modelos são projetados para serem úteis e completos, mantendo a fluidez conversacional. Isso quer dizer que eles tentam antecipar as suas necessidades e vão além do que foi solicitado. Esse comportamento aumenta a possibilidade de erros.

Essa necessidade de responder, associada à falta de informações, pode levar às alucinações. Quando o modelo não dispõe de dados suficientes, ele completa as lacunas com associações menos prováveis, gerando respostas plausíveis, mas incorretas.

Outra causa de alucinações é a variabilidade das respostas. Não existem respostas predefinidas, se você fizer a mesma pergunta duas vezes, terá duas respostas diferentes em forma, mas semelhantes em conteúdo. Essa variabilidade pode levar a construção de respostas erradas, pela utilização de palavras menos prováveis para se alcançar a variação de respostas definida no desenvolvimento.

Por fim, temos a fluidez textual. Os modelos de linguagem escrevem bem, de maneira estruturada. A qualidade do texto pode esconder erros argumentativos, associações ilógicas e falácias. É preciso analisar criticamente as respostas, principalmente quando é um tema que você domina pouco.

Essas limitações não invalidam os modelos de linguagem. Eles são ferramentas úteis, capazes de aumentar nossa capacidade de trabalho, mas devem ser utilizadas de forma consciente e criteriosa.

Não perca o próximo episódio: O PROBLEMA NÃO É A RESPOSTA. É A PERGUNTA

Se quiser aprofundar seu conhecimento sobre modelos de linguagem, conheça o curso Desbravando o ChatGPT (www.antoniotoledo.com.br/curso).