O que significa comprimir semanticamente

Um resumo tradicional escolhe pontos principais e descarta o restante. Isso ajuda humanos a ler depressa, mas pode ser pobre para modelos de linguagem que precisam operar sobre relações, tensões, dependências, premissas e continuidade.

ProseFold trabalha em outra direção: transformar um documento extenso em uma versão menor, mas ainda semanticamente fértil. O objetivo não é apenas dizer "sobre o que é"; é preservar como o documento pensa.

Por que LLMs se beneficiam disso

Modelos como ChatGPT, Gemini, Claude e Grok trabalham melhor quando recebem contexto limpo, organizado e denso. Contexto bruto costuma trazer ruído: quebras, repetições, cabeçalhos, rodapés, transcrições verborrágicas, páginas longas e material demais para a janela útil.

Quando o documento é previamente convertido, fatiado, comprimido e costurado, o modelo recebe mais relações em menos tokens. Isso reduz custo, melhora portabilidade e torna possível reutilizar documentos extensos em chatbots, agentes e automações.

O que o ProseFold preserva

O ProseFold procura manter entidades, argumentos, relações, conflitos, decisões, cenas, arcos, hipóteses, métodos, conclusões e pontos de tensão. Em papers, isso significa preservar arquitetura conceitual. Em conversas, significa preservar decisões e continuidade. Em literatura, significa preservar trama, personagens e atmosfera funcional.

Onde isso se encaixa

Compressão semântica fica antes do raciocínio do agente. O fluxo ideal é: documento bruto, conversão para Markdown, compressão ProseFolded, variantes Cypher/Minificado e uso pelo modelo. O agente não precisa engolir tudo cru; ele pode receber contexto já dobrado.