Código HTML do Conteúdo

Post: DeepSeek desafia gigantes da IA: 50% de custos e cortes de API - Against Invaders - Notícias de CyberSecurity para humanos.

<div> <div data-element_type="widget" data-id="914a4f5" data-widget_type="shortcode.default"> <div> <div> <p><span><b><a href="https://www.redhotcyber.com/post/author/redazione/" target="_blank">Redazione RHC</a>:6 outubro 2025 06:54</b></span></p> <p>A empresa chinesa DeepSeek <a href="https://api-docs.deepseek.com/news/news250929" target="_blank">apresentou</a> uma versão experimental de seu modelo de linguagem, <strong>DeepSeek-V3.2-Exp,</strong> que pela primeira vez <strong>implementa sua própria versão de atenção esparsa,</strong> uma técnica que <em>reduz significativamente o custo computacional do processamento de sequências de texto longas</em> . O novo mecanismo, chamado <strong>DeepSeek Atenção Esparsa,</strong> é dito ser capaz de <strong>reduzir os custos operacionais do modelo quase pela metade</strong> . Para demonstrar essas economias, <strong>a empresa reduziu o preço de sua API em 50%.</strong></p> <p>O problema da sobrecarga computacional em grandes modelos de linguagem é particularmente agudo para diálogos longos. A arquitetura clássica do Transformer, desenvolvida em 2017, compara cada palavra na sequência de entrada com todas as outras palavras, resultando em um aumento quadrático no número de operações. <em>Para mil palavras, isso se traduz em um milhão de comparações e, para dez mil palavras, em cem milhões.</em> Essa sobrecarga <strong>aumenta o uso de recursos em sessões longas e diminui o desempenho,</strong> pois o sistema é forçado a reanalisar todo o histórico de diálogo para cada nova solicitação.</p> <p>A tecnologia de atenção esparsa funciona de maneira diferente. <strong>Ele não combina todas as palavras com todas as outras, mas seleciona um conjunto limitado das conexões mais significativas.</strong> O DeepSeek usa um mecanismo proprietário chamado <strong>o Lightning Indexer,</strong> um pequeno <em>Unidade de rede neural adicional</em> que avalia a significância dos pares de palavras e seleciona até <em>2.048 das conexões mais relevantes para cada posição</em> . A empresa não divulgou detalhes sobre como o indexador toma suas decisões, mas diz <em>não compromete a qualidade da compreensão do texto.</em></p> <p>Testes internos mostraram que <strong>o novo modelo fornece resultados comparáveis à versão anterior, DeepSeek-V3.1-Terminus</strong> , mantendo alta precisão e capacidade de processar sequências longas. Notavelmente, o DeepSeek <strong>abriu o código de seus componentes sob a licença do MIT</strong> e forneceu pesos acessíveis ao público, <em>permitindo que outros pesquisadores testem e desenvolvam as soluções propostas.</em></p> <p>O DeepSeek ganhou as manchetes pela primeira vez em janeiro, quando seu modelo R1 correspondeu ao desempenho o1 da OpenAI <strong>com um custo de treinamento de apenas US$ 6 milhões</strong> . Além disso, o aplicativo de bate-papo da empresa liderou brevemente <strong>a loja de aplicativos do iPhone, superando o ChatGPT.</strong> Desde então, a atenção da indústria se concentrou no laboratório chinês, <em>que foi forçado a encontrar maneiras de otimizar seus cálculos devido ao acesso limitado a GPUs modernas e outros chips especializados devido a restrições de exportação.</em></p> <p>Embora essa abordagem tenha recebido pouca atenção por muito tempo e tenha sido usada pela primeira vez no GPT-3 e em vários outros modelos por desenvolvedores ocidentais, o DeepSeek afirma que <strong>Sua implementação permitiu um ajuste preciso e uma redução significativa nos custos computacionais sem qualquer perda perceptível de qualidade.</strong> Especialistas independentes ainda não confirmaram esses resultados, mas se as conclusões da empresa estiverem corretas, esses métodos podem mudar significativamente a economia do uso de modelos de IA a longo prazo.</p> <div> <div> <div> <div> <p><b><span>Redação</span></b><br /><span>A equipe editorial da Red Hot Cyber é composta por um grupo de indivíduos e fontes anônimas que colaboram ativamente para fornecer informações e notícias antecipadas sobre segurança cibernética e computação em geral.</span></p> <p><a href="https://www.redhotcyber.com/post/author/redazione/" target="_blank">Lista degli articoli</a></p> </div> </div> </div> </div> </div> </div> </div></div>