Código HTML do Conteúdo

Post: DeepSeek desafia gigantes da IA: 50% de custos e cortes de API - Against Invaders - Notícias de CyberSecurity para humanos.


<div> <div data-element_type="widget" data-id="914a4f5" data-widget_type="shortcode.default"> <div> <div> <p><span><b><a href="https://www.redhotcyber.com/post/author/redazione/" target="_blank">Redazione RHC</a>:6 outubro 2025 06:54</b></span></p> <p>A empresa chinesa DeepSeek <a href="https://api-docs.deepseek.com/news/news250929" target="_blank">apresentou</a> uma vers&atilde;o experimental de seu modelo de linguagem, <strong>DeepSeek-V3.2-Exp,</strong> que pela primeira vez <strong>implementa sua pr&oacute;pria vers&atilde;o de aten&ccedil;&atilde;o esparsa,</strong> uma t&eacute;cnica que <em>reduz significativamente o custo computacional do processamento de sequ&ecirc;ncias de texto longas</em> . O novo mecanismo, chamado <strong>DeepSeek Aten&ccedil;&atilde;o Esparsa,</strong> &eacute; dito ser capaz de <strong>reduzir os custos operacionais do modelo quase pela metade</strong> . Para demonstrar essas economias, <strong>a empresa reduziu o pre&ccedil;o de sua API em 50%.</strong></p> <p>O problema da sobrecarga computacional em grandes modelos de linguagem &eacute; particularmente agudo para di&aacute;logos longos. A arquitetura cl&aacute;ssica do Transformer, desenvolvida em 2017, compara cada palavra na sequ&ecirc;ncia de entrada com todas as outras palavras, resultando em um aumento quadr&aacute;tico no n&uacute;mero de opera&ccedil;&otilde;es. <em>Para mil palavras, isso se traduz em um milh&atilde;o de compara&ccedil;&otilde;es e, para dez mil palavras, em cem milh&otilde;es.</em> Essa sobrecarga <strong>aumenta o uso de recursos em sess&otilde;es longas e diminui o desempenho,</strong> pois o sistema &eacute; for&ccedil;ado a reanalisar todo o hist&oacute;rico de di&aacute;logo para cada nova solicita&ccedil;&atilde;o.</p> <p>A tecnologia de aten&ccedil;&atilde;o esparsa funciona de maneira diferente. <strong>Ele n&atilde;o combina todas as palavras com todas as outras, mas seleciona um conjunto limitado das conex&otilde;es mais significativas.</strong> O DeepSeek usa um mecanismo propriet&aacute;rio chamado <strong>o Lightning Indexer,</strong> um pequeno <em>Unidade de rede neural adicional</em> que avalia a signific&acirc;ncia dos pares de palavras e seleciona at&eacute; <em>2.048 das conex&otilde;es mais relevantes para cada posi&ccedil;&atilde;o</em> . A empresa n&atilde;o divulgou detalhes sobre como o indexador toma suas decis&otilde;es, mas diz <em>n&atilde;o compromete a qualidade da compreens&atilde;o do texto.</em></p> <p>Testes internos mostraram que <strong>o novo modelo fornece resultados compar&aacute;veis &agrave; vers&atilde;o anterior, DeepSeek-V3.1-Terminus</strong> , mantendo alta precis&atilde;o e capacidade de processar sequ&ecirc;ncias longas. Notavelmente, o DeepSeek <strong>abriu o c&oacute;digo de seus componentes sob a licen&ccedil;a do MIT</strong> e forneceu pesos acess&iacute;veis ao p&uacute;blico, <em>permitindo que outros pesquisadores testem e desenvolvam as solu&ccedil;&otilde;es propostas.</em></p> <p>O DeepSeek ganhou as manchetes pela primeira vez em janeiro, quando seu modelo R1 correspondeu ao desempenho o1 da OpenAI <strong>com um custo de treinamento de apenas US$ 6 milh&otilde;es</strong> . Al&eacute;m disso, o aplicativo de bate-papo da empresa liderou brevemente <strong>a loja de aplicativos do iPhone, superando o ChatGPT.</strong> Desde ent&atilde;o, a aten&ccedil;&atilde;o da ind&uacute;stria se concentrou no laborat&oacute;rio chin&ecirc;s, <em>que foi for&ccedil;ado a encontrar maneiras de otimizar seus c&aacute;lculos devido ao acesso limitado a GPUs modernas e outros chips especializados devido a restri&ccedil;&otilde;es de exporta&ccedil;&atilde;o.</em></p> <p>Embora essa abordagem tenha recebido pouca aten&ccedil;&atilde;o por muito tempo e tenha sido usada pela primeira vez no GPT-3 e em v&aacute;rios outros modelos por desenvolvedores ocidentais, o DeepSeek afirma que <strong>Sua implementa&ccedil;&atilde;o permitiu um ajuste preciso e uma redu&ccedil;&atilde;o significativa nos custos computacionais sem qualquer perda percept&iacute;vel de qualidade.</strong> Especialistas independentes ainda n&atilde;o confirmaram esses resultados, mas se as conclus&otilde;es da empresa estiverem corretas, esses m&eacute;todos podem mudar significativamente a economia do uso de modelos de IA a longo prazo.</p> <div> <div> <div> <div> <p><b><span>Reda&ccedil;&atilde;o</span></b><br /><span>A equipe editorial da Red Hot Cyber &eacute; composta por um grupo de indiv&iacute;duos e fontes an&ocirc;nimas que colaboram ativamente para fornecer informa&ccedil;&otilde;es e not&iacute;cias antecipadas sobre seguran&ccedil;a cibern&eacute;tica e computa&ccedil;&atilde;o em geral.</span></p> <p><a href="https://www.redhotcyber.com/post/author/redazione/" target="_blank">Lista degli articoli</a></p> </div> </div> </div> </div> </div> </div> </div></div>