DeepSeek: a nova IA chinesa que promete rivalizar com o ChatGPT

4 mins

O DeepSeek V3 é a mais recente evolução da startup chinesa DeepSeek, destacando-se como um modelo de linguagem de código aberto que rivaliza com os principais sistemas de IA globais, como o ChatGPT. Lançado em dezembro de 2024, o DeepSeek V3 utiliza uma arquitetura inovadora chamada Mixture-of-Experts (MoE), que permite ativar apenas os parâmetros necessários para cada tarefa, otimizando a eficiência computacional. Com impressionantes 671 bilhões de parâmetros totais e 37 bilhões ativados por token, o modelo foi treinado em 14,8 trilhões de tokens, abrangendo uma ampla gama de domínios, desde matemática avançada até geração de código e compreensão multilíngue. Para utilizar o DeepSeek V3, os usuários podem acessar a plataforma oficial via web, integrar a IA em sistemas próprios por meio de uma API ou até mesmo executá-la localmente, graças à sua natureza de código aberto. A interface é semelhante à de outros chatbots: basta digitar uma pergunta ou comando no campo de texto para receber respostas em segundos. Empresas chinesas já adotam o DeepSeek para atendimento ao cliente, automação de e-mails e suporte técnico multilíngue, enquanto professores e pesquisadores o utilizam para gerar resumos de artigos ou elaborar planos de aula. O DeepSeek V3 diferencia-se tecnicamente por sua ênfase em conteúdos e expressões culturais chinesas, além de incorporar ferramentas específicas para lidar com caracteres ideográficos, algo ainda limitado em IAs ocidentais. A equipe da DeepSeek também destaca melhorias na filtragem de alucinações e viés, buscando um modelo mais preciso para uso corporativo e acadêmico. Além disso, o modelo apresenta uma janela de contexto estendida de até 128.000 tokens, permitindo o processamento de documentos extensos e análises complexas. Em comparação com o ChatGPT, o DeepSeek V3 apresenta algumas diferenças notáveis. Enquanto o ChatGPT, da OpenAI, foi treinado majoritariamente em inglês e ajustado para contextos ocidentais, o DeepSeek prioriza o mandarim e contextos culturais asiáticos. Além disso, o DeepSeek permite customizações mais granulares no treinamento com dados internos das empresas, algo ainda restrito no ChatGPT padrão. Em termos de interface e capacidades gerais, ambos oferecem funcionalidades similares, mas a escolha entre eles depende do idioma, do mercado-alvo e das exigências regulatórias do usuário.

https://www.zed.com