A Escrituração Fiscal Digital (EFD) do ICMS/IPI representa um dos maiores desafios operacionais no âmbito tributário brasileiro, exigindo a interpretação de manuais extensos, como o Guia Prático, e resultando frequentemente em processos manuais sujeitos a erros e inconsistências fiscais que só são detectadas na transmissão ao Fisco. Este trabalho surge da necessidade de modernizar esse cenário por meio do uso de tecnologias de Inteligência Artificial, visando desenvolver e avaliar um pipeline baseado em Processamento de Linguagem Natural (PLN) e no paradigma de Geração Aumentada de Recuperação (RAG), capaz de extrair, estruturar e validar regras fiscais, apoiando a detecção automatizada de inconsistências. A metodologia incluiu a extração de dados não estruturados de arquivos PDF, segmentação, limpeza e estruturação em formato JSON, seguido da vetorização das informações com modelos de embedding e uso de Large Language Models (LLMs) para gerar respostas contextuais. A avaliação combinou métricas de similaridade semântica com uma análise qualitativa conduzida por especialistas fiscais. Os resultados indicaram que a estrutura JSON melhorou a clareza das respostas, que o modelo Llama apresentou melhor desempenho qualitativo, e que o modelo de embedding (MiniLM-L6-v2) teve maior impacto na qualidade geral das respostas. A análise dos especialistas foi essencial para identificar falhas críticas não capturadas por métricas automáticas, como contradições e informações incompletas. Conclui-se que, embora promissores, os modelos atuais ainda exigem intervenção humana para garantir confiabilidade em um domínio de alto risco como o fiscal. |