Uma vulnerabilidade crítica recentemente divulgada no Apache Tika pode permitir que invasores comprometam servidores simplesmente carregando umPDF malicioso arquivo, de acordo com um aviso de segurança publicado pelos mantenedores do Apache.
Rastreada como CVE-2025-66516, a falha afeta o núcleo do Apache Tika, os analisadores do Apache Tika e o módulo do analisador de PDF do Apache Tika.
| ID do CVE | Gravidade | Tipo de vulnerabilidade | Componente afetado | Versões afetadas |
|---|---|---|---|---|
| CVE-2025-66516 | Crítico | Injeção de entidade externa XML (XXE) | Apache Tika Core, analisadores, módulo PDF | Tika Core 1.13-3.2.1, Tika Parsers 1.13-1.28.5, Módulo PDF 2.0.0-3.2.1 |
A vulnerabilidade é classificada como crítica e afeta uma ampla variedade de versões comumente incorporadas em pipelines de análise de conteúdo, pesquisa e processamento de documentos.
O problema decorre de uma falha de injeção de entidade externa XML (XXE) no manuseio de conteúdo XFA (XML Forms Architecture) incorporado em arquivos PDF pelo Apache Tika.
Quando um PDF criado contendo um componente XFA malicioso é processado, o Tika pode avaliar entidades XML externas, permitindo que um invasor acesse arquivos locais, recursos de rede internos ou outros dados confidenciais no servidor onde o Tika é executado.
De acordo com o consultoria apacheas seguintes versões serão afetadas:
- Núcleo Apache Tika (org. Apache Apache.tika:tika-core)das versões 1.13 a 3.2.1
- Analisadores Apache Tika (org. Apache Apache.tika:tika-parsers) de 1.13 antes de 2.0.0
- Módulo analisador de PDF Apache Tika (org. Apache Apache.tika:tika-parser-pdf-module)de 2.0.0 a 3.2.1
A vulnerabilidade está intimamente relacionada a um problema relatado anteriormente, CVE-2025-54988, mas CVE-2025-66516 expande o escopo dos artefatos afetados.
Embora o relatório original tenha focado no módulo analisador de PDF como ponto de entrada, o ApacheApache esclareceu que a causa raiz e a correção residem no núcleo do Tika.
Isso significa que as organizações que atualizaram apenas o módulo analisador de PDF, mas não atualizaram otika-core para uma versão segura (pelo menos 3.2.2), ainda podem estar expostas.
Além disso, o novo CVE observa que nas versões 1.x mais antigas do Tika, o analisador de PDF foi incluído no módulo generaltika-parsers.
Esses pacotes anteriores não foram explicitamente mencionados no comunicado inicial, deixando algumas implantações potencialmente inconscientes de sua exposição.
Em ambientes do mundo real, o Apache Tika é frequentemente integrado a fluxos de trabalho de upload de arquivos, sistemas de indexação de pesquisa, pipelines de ingestão de dados e ferramentas de segurança que analisam e extraem automaticamente conteúdo de documentos.
Nessas configurações, um invasor pode fazer upload ou enviar um PDF especialmente criado, acionar a lógica de análise vulnerável e aproveitar o XXE para exfiltrar segredos ou migrar ainda mais para a infraestrutura interna.
Administradores e desenvolvedores que usam Apache Tika são incentivados a:
- Identifique se seus aplicativos dependem das versões afetadas do módulo tika-core, tika-parsers e ortika-parser-pdf-module.
- Atualize o tika-core para a versão 3.2.2 ou posterior e certifique-se de que todos os componentes Tika relacionados sejam atualizados de maneira consistente.
- Revise todos os sistemas que processam PDFs não confiáveis, especialmente endpoints de upload voltados ao público, e considere proteção adicional e validação de entrada.
Siga-nos emGoogle Notícias,LinkedIneXpara obter atualizações instantâneas e definir GBH como fonte preferencial emGoogle.
