Deutsche Tageszeitung - Empresa chinesa DeepSeek lança novo modelo de IA

Empresa chinesa DeepSeek lança novo modelo de IA


Empresa chinesa DeepSeek lança novo modelo de IA
Empresa chinesa DeepSeek lança novo modelo de IA / foto: © AFP/Arquivos

A startup chinesa DeepSeek apresentou nesta sexta-feira (24) um novo modelo de Inteligência Artificial (IA) com custos "drasticamente reduzidos", mais de um ano depois de surpreender o mundo com um "chatbot" barato que igualava em capacidades seus rivais americanos.

Alterar tamanho do texto:

A indústria tecnológica mundial aguardava há várias semanas por este anúncio, um termômetro das ambições chinesas no setor.

No início de 2025, a startup de Hangzhou conseguiu mudar as regras do jogo da IA com o R1, um "modelo de raciocínio" que, afirmou, rivalizava com um preço menor com Gemini, ChatGPT e Claude, gigantes americanos que receberam investimentos bilionários para seu desenvolvimento.

O novo DeepSeek‑V4 apresentado nesta sexta‑feira "tem um contexto ultralongo de um milhão de palavras, o que lhe permite alcançar a liderança tanto no âmbito nacional como no de código aberto em termos de capacidades dos agentes, conhecimento do mundo e desempenho no raciocínio", afirmou a empresa em um comunicado.

Uma "versão preliminar" já está disponível, acrescentou a empresa.

Os especialistas afirmam que o lançamento do V4, baseado em um modelo de linguagem de grande escala, ou LLM, representa um "ponto de inflexão" em termos de hardware e custos.

"Isto aborda os problemas antigos de desempenho mais lento e custos mais elevados associados a janelas de contexto longas, marcando um verdadeiro ponto de inflexão para a indústria", disse Zhang Yi, fundador da empresa de pesquisa tecnológica iiMedia, à AFP.

"Para os usuários finais, isso trará benefícios amplos e acessíveis. Por exemplo, se o suporte de contexto ultralongo se tornar uma característica padrão, espera‑se que o processamento de textos longos vá além dos laboratórios de pesquisa de ponta e entre nos aplicativos comerciais", disse.

O novo modelo da DeepSeek tem duas versões, DeepSeek‑V4‑Pro e DeepSeek‑V4‑Flash, esta última "uma opção mais eficiente e econômica" por ter um número menor de parâmetros.

- "Momento Sputnik" -

O V4-Pro tem 1,6 trilhão de parâmetros, enquanto o V4-Flash tem 284 bilhões, o que refina a capacidade de tomada de decisões dos modelos.

"Nos testes de desempenho de conhecimento do mundo, o DeepSeek-V4-Pro supera significativamente outros modelos de código aberto e só é levemente superado pelo modelo de código fechado de primeira linha Gemini-Pro-3.1 (da Google)", destaca o comunicado da empresa.

A entrada súbita da empresa chinesa no mercado no ano passado, com o chamado "choque DeepSeek", desencadeou uma venda em larga escala de ações relacionadas com a IA, em particular em Wall Street, e uma revisão das estratégias empresariais.

O anúncio de 2025 foi descrito por alguns analistas como um "momento Sputnik" para o setor, uma expressão que faz referência ao instante em que uma indústria ou uma sociedade toma consciência, com inquietação, de que ficou tecnologicamente atrasada em relação a um concorrente.

O chatbot da DeepSeek tinha um desempenho similar ao do ChatGPT e de outras ferramentas de primeira linha, mas a empresa afirmou que seu desenvolvimento havia exigido uma potência computacional significativamente menor.

A popularidade repentina, no entanto, gerou dúvidas sobre a privacidade dos dados e a censura, já que o "chatbot" frequentemente se recusava a responder a perguntas sobre temas delicados, como a repressão da Praça Tiananmen (Paz Celestial) em 1989.

No país asiático, as ferramentas de IA da DeepSeek foram amplamente adotadas pelos municípios e pelas instituições de saúde chinesas, assim como pelo setor financeiro e por outras empresas.

Isto foi estimulado em parte pela decisão da DeepSeek de tornar os seus sistemas de código aberto, revelando o seu funcionamento interno, em contraste com os modelos patenteados vendidos pela OpenAI e por outros rivais ocidentais.

A Casa Branca acusou recentemente as empresas chinesas de competirem para "roubar" tecnologia americana, antes da reunião de cúpula prevista entre os presidentes Donald Trump e Xi Jinping em Pequim no próximo mês.

Na intensa concorrência de IA, a americana OpenAI, criadora do popular ChatGPT, também apresentou na quinta-feira um novo modelo que pretende ser o mais avançado do mercado.

(L.Møller--DTZ)