Deutsche Tageszeitung - ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo

ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo


ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo
ChatGPT e IA conversacional continuam incapazes de raciocinar, diz estudo / foto: © AFP/Arquivos

Os grandes modelos de linguagem (LLM, na sigla em inglês), como o ChatGPT, um dos sistemas de inteligência artificial (IA) mais populares do mundo, ainda seguem tendo dificuldades para raciocinar usando a lógica e cometem erros frequentes, de acordo com um estudo.

Alterar tamanho do texto:

Estes robôs conversacionais refletem os preconceitos de gênero, éticos e morais dos humanos presentes nos textos dos quais se alimentam, recorda o estudo publicado na quarta-feira (5) na revista Open Science da Royal Society britânica.

Mas eles também refletem estes preconceitos nos testes de raciocínio?, questionou Olivia Macmillan-Scott, doutoranda do departamento de Ciências da Computação da University College de Londres (UCL).

O resultado da pesquisa é que os LLM mostram "um raciocínio muitas vezes irracional, mas de uma forma diferente da dos humanos", explica a pesquisadora à AFP.

Sob a supervisão de Mirco Musolesi, professor e diretor do Machine Intelligence Lab da UCL, Macmillan-Scott apresentou sete modelos de linguagem — duas versões do ChatGPT (3.5 e 4), da OpenAI, Bard, do Google, Claude 2, da Anthropic, e três versões de LLaMA, da Meta — a uma série de testes psicológicos desenvolvidos para humanos.

Como esta tecnologia aborda o preconceito que leva a privilegiar soluções com um maior número de elementos, em detrimento daquelas com uma proporção adequada?

Um exemplo: se tivermos uma urna com nove bolinhas brancas e uma vermelha e outra urna com 92 bolinhas brancas e 8 vermelhas, qual devemos escolher para ter a melhor chance de obter uma bolinha vermelha?

A resposta correta é a primeira urna, visto que há 10% de possibilidades frente a 8% da segunda opção.

As respostas dos modelos de linguagem foram muito inconsistentes. Alguns responderam corretamente ao mesmo teste seis em cada dez vezes. Outros apenas duas em cada dez, embora o teste não tenha mudado. "Cada vez obtemos uma resposta diferente", diz a pesquisadora.

Os LLM "podem ser bons para resolver uma equação matemática complicada, mas logo te dizem que 7 mais 3 é igual a 12", constatou.

- "Não tenho muita certeza" -

Estes modelos "não falham nestas tarefas da mesma forma que um humano", afirma o estudo. É o que Musolesi chama de "erros de máquina".

"Existe uma forma de raciocínio lógico que é potencialmente correta se a considerarmos por etapas, mas que é errada tomada como um todo", ressalta.

A máquina funciona com "uma espécie de pensamento linear", diz o professor, e cita o modelo Bard (atual Gemini), capaz de realizar corretamente as diferentes fases de uma tarefa, mas que obtém um resultado final incorreto por não ter uma visão geral.

Sobre esta questão, o professor de ciências da computação Maxime Amblard, da University of Lorraine, na França, recorda que os LLM, como todas as inteligências artificiais generativas, não funcionam como os humanos".

Os humanos são "máquinas capazes de criar significado", o que as máquinas não conseguem, explica à AFP.

Existem diferenças entre os diferentes modelos de linguagem e em geral, o GPT-4, sem ser infalível, obteve resultados melhores que os demais.

Macmillan-Scott suspeita que os modelos "fechados", cujo código operacional permanece secreto, "incorporam mecanismos em segundo plano" para responder a questões matemáticas.

De toda forma, neste momento é impensável confiar uma decisão importante a um LLM. Segundo o professor Musolesi, eles deveriam ser treinados para responder "não tenho muita certeza" quando necessário.

(S.A.Dudajev--DTZ)

Apresentou

Avião que decolou de Cabo Verde por surto de hantavírus pousou nas Canárias

Um dos dois aviões que decolaram de Cabo Verde para evacuar os passageiros do navio de cruzeiro afetado por um surto de hantavírus pousou nesta quarta-feira (6) no arquipélago espanhol das Ilhas Canárias, e o outro está viajando em direção aos Países Baixos.

Fifa amplia punição do argentino Prestianni, que pode cumprir suspensão na Copa

A Fifa ampliou para nível mundial os efeitos da punição do argentino Gianluca Prestianni, que foi suspenso por seis jogos pela Uefa por ter ofendido o brasileiro Vinícius Júnior em jogo da Liga dos Campeões, informou à AFP um porta-voz da entidade máxima do futebol nesta quarta-feira (6).

Trump aumenta pressão para alcançar acordo de paz e ameaça Irã com novos bombardeios

O presidente dos Estados Unidos, Donald Trump, ameaçou o Irã com novos bombardeios nesta quarta-feira (6) e aumentou a pressão para chegar a um acordo que ponha fim à guerra, apesar de ter anunciado anteriormente que suspenderia um plano para escoltar navios pelo Estreito de Ormuz.

Venezuela defende na CIJ seu direito 'irrenunciável' à região de Essequibo

A Venezuela tem um direito "irrenunciável" sobre a região de Essequibo, rica em petróleo, declarou nesta quarta-feira (6) um representante do país na Corte Internacional de Justiça (CIJ), durante uma audiência para tentar solucionar uma antiga disputa com a Guiana sobre o território.

Alterar tamanho do texto: