Episódio 6 - Os modelos de linguagem são realmente necessários? - Transformando o futuro com educação e inovação

DE VOLTA AO BÁSICO

Episódio 6 - Os modelos de linguagem são realmente necessários?

Você já teve a impressão de que a Alexa não entendeu a sua pergunta? Ou escutou uma resposta totalmente sem sentido da Siri? Apesar de seguirem os princípios do processamento de linguagem natural apresentados no episódio anterior, o núcleo central desses aplicativos era baseado em regras. Para cada conjunto de perguntas próximas, eles tinham um conjunto de respostas predefinido. Depois da transcrição da fala, o sistema escolhia a resposta e a transformava em voz. Por isso eles pareciam inteligentes, mas não resistiam a uma conversa mais longa ou aprofundada.

Os modelos de linguagem mudaram totalmente esse cenário. Eles ampliaram de forma impressionante a capacidade de lidar com a linguagem humana. Em vez de apenas reconhecer comandos e escolher uma resposta, eles conseguem identificar o contexto e criar respostas específicas, mantendo diálogos mais longos, lidando melhor com perguntas abertas e adaptando-se ao rumo da prosa. É essa flexibilidade que transformou a relação das pessoas com seus equipamentos. Pela primeira vez, muita gente acreditou que estava realmente conversando com a máquina.

Os modelos de linguagem funcionam de forma muito diferente desses assistentes. Como visto na série anterior, ANTES DO PROMPT, os modelos de linguagem são desenvolvidos em quatro etapas. A primeira é a preparação da base de treinamento, formada por grandes volumes de textos. A segunda é o treinamento não supervisionado, quando eles aprendem as palavras e criam associações entre elas. Depois, vem o treinamento supervisionado, quando “aprendem” a construir frases, respondendo perguntas ou explicando situações predefinidas. Por fim, temos o ajuste fino, que é feito por meio de treinamento por reforço com feedback humano.

Importante destacar que, ao contrário dos assistentes pessoais, os modelos de linguagem não possuem uma base de consulta com respostas predefinidas. A base de treinamento é integrada ao modelo ao longo do seu desenvolvimento, como se fosse uma “memória”. As respostas são criadas a partir deste conhecimento, que foi “incorporado” ao modelo. Se você fizer a mesma pergunta várias vezes, terá várias respostas, semelhantes em conteúdo, mas diferentes em forma e adaptadas ao contexto de cada pergunta.

Isto trouxe uma mudança importante no processamento de linguagem natural. Em vez de depender de vários conjuntos de respostas, os aplicativos passaram a ter os modelos de linguagem como seu núcleo central. Isso deu a eles maior flexibilidade, permitindo adaptar as respostas ao contexto e manter conversas mais longas. Mais do que ampliar a capacidade de resposta, os modelos de linguagem mudaram a forma como as máquinas lidam com a linguagem e interagem com o ser humano.

Mas é preciso cuidado para não confundir fluidez com compreensão. Como as respostas são construídas a partir de probabilidades, os modelos de linguagem podem alucinar, inventar informações e confundir contextos. Tudo isso em textos bem estruturados e plausíveis. Como vimos em episódios anteriores, eles escrevem bem e mantêm a coerência do diálogo, passando uma sensação de autoridade que nem sempre corresponde à realidade. É aí que surge o risco do viés de automação: assumir que a resposta da IA é a melhor sem nenhum tipo de análise crítica.

Chegamos ao fim dessa série. Partimos das limitações e erros mais comuns dos modelos de linguagem. Retomamos os conceitos básicos sobre IA, passando pela visão computacional e o processamento de linguagem natural. E voltamos, mais bem embasados, aos modelos de linguagem.

Agora, estamos prontos para discutir o uso da IA no nosso dia a dia a partir dos conceitos de inteligência ampliada e cointeligência.

Se quiser aprofundar seu conhecimento sobre IA e modelos de linguagem, conheça o curso Desbravando o ChatGPT (www.antoniotoledo.com.br).