ProseFold pré-compressão contextual para agentes de IA
Resumo executivo
ProseFold é uma infraestrutura leve de compressão semântica para modelos de linguagem e agentes de IA. Ele transforma documentos extensos, páginas web, PDFs públicos por URL, livros, contos, conversas longas e transcrições de YouTube em versões muito menores, semanticamente densas e prontas para consumo por ChatGPT, Gemini, Claude, Grok, Agentes GPT, agentes via MCP e automações em n8n, Zapier, MindStudio e scripts próprios.
A tese central é simples: a próxima fronteira da IA não é apenas ter modelos maiores, mas dar aos agentes melhor contexto antes que eles pensem.
Hoje, modelos de linguagem são capazes de raciocinar sobre materiais complexos, mas esbarram em um problema recorrente: contexto longo demais, caro demais, ruidoso demais ou grande demais para a janela disponível. ProseFold resolve esse gargalo criando uma etapa anterior ao raciocínio do agente: ele converte, organiza, comprime e entrega o material como contexto operacional.
Isso significa que um agente passa a ter uma capacidade nova: preparar o próprio contexto antes de consumi-lo.
Um Agente GPT, um Claude conectado por MCP ou um fluxo em n8n/Zapier pode receber um paper, uma conversa longa, uma página, um relatório, um livro, um PDF público por URL ou um vídeo do YouTube; enviar esse material ao ProseFold; obter uma versão ProseFolded, Cypher, Minificado ou ProseFold.min+cypher; e só então injetar esse artefato semântico em sua própria janela de raciocínio.
A consequência prática é forte: agentes deixam de ser consumidores passivos de contexto bruto e passam a contar com uma camada de pré-digestão contextual.
A forma curta de explicar:
ProseFold transforma documentos extensos em contexto compacto e semanticamente rico para modelos de linguagem.
A forma mais comercial:
ProseFold dá a Agentes GPT, Claude/MCP e automações a capacidade de comprimir papers, conversas, vídeos, livros, PDFs públicos por URL e páginas antes de raciocinar sobre eles.
A forma mais visionária:
ProseFold é uma camada digestiva de conhecimento: transforma materiais humanos brutos em alimento semântico pronto para agentes de IA.
1. O salto conceitual
Até agora, a maior parte dos fluxos com IA generativa funcionou assim:
Humano prepara contexto → humano injeta contexto → agente responde.
Esse modelo é limitado. Ele exige que o usuário selecione, resuma, recorte, limpe e compacte o material manualmente antes de entregá-lo ao agente. Em aplicações reais, isso se torna lento, caro e frágil.
ProseFold muda o fluxo:
Agente recebe ou localiza material bruto → ProseFold comprime semanticamente → agente consome contexto dobrado → agente raciocina melhor.
Esse é o salto conceitual: o contexto deixa de ser apenas algo que o humano oferece ao modelo e passa a ser algo que o próprio ecossistema de agentes consegue preparar operacionalmente.
Em vez de perguntar “como faço caber esse documento no ChatGPT?”, a pergunta passa a ser:
Como dou ao meu agente a capacidade de transformar qualquer material longo em contexto útil antes de pensar?
ProseFold é essa capacidade.
2. O problema: LLMs têm fome de contexto, mas contexto custa caro
A maior parte das aplicações reais com LLMs não falha por falta de inteligência do modelo. Falha porque o modelo não recebeu o contexto certo, na forma certa, no momento certo.
Esse problema aparece em papers científicos, contratos, relatórios, apostilas, páginas web, vídeos, livros, contos, manuscritos e conversas longas entre usuário e agente. Cada uma dessas fontes pode conter conhecimento valioso, mas quase sempre chega aos modelos com excesso de ruído: quebras, redundância, estrutura irregular, transcrições verborrágicas, cabeçalhos repetidos, tabelas difíceis, metadados irrelevantes e volume incompatível com a janela de contexto.
As soluções comuns são insuficientes quando usadas isoladamente.
Colar o documento inteiro no chatbot é caro, lento e frequentemente inviável. Mesmo quando cabe, o texto bruto compete com a própria tarefa dentro da janela.
Pedir um resumo é útil para humanos, mas muitas vezes destrói relações importantes. Um resumo pode dizer “sobre o que é” o texto, mas nem sempre preserva a arquitetura conceitual, narrativa ou argumentativa que permitiria ao modelo trabalhar com profundidade.
Usar RAG ou busca vetorial é poderoso, mas recupera trechos localmente. RAG não substitui uma visão compacta e global de um documento inteiro. Muitas vezes ele encontra partes relevantes sem entregar o campo relacional completo.
ProseFold atua nesse espaço: ele não substitui o modelo, nem substitui RAG, nem é apenas resumo. Ele prepara o material para virar contexto.
3. O que é o ProseFold
ProseFold é um serviço web e uma API de compressão semântica para LLMs.
Ele aceita arquivos, URLs, PDFs públicos por URL e YouTube; converte o material para Markdown; processa o conteúdo em fila por fatias; gera uma versão semanticamente comprimida chamada ProseFolded; e produz variantes adicionais como Cypher, Minificado e ProseFold.min+cypher.
As entradas aceitas incluem:
- TXT;
- Markdown;
- HTML;
- DOCX;
- XLSX;
- PDFs com texto selecionável;
- URLs de páginas web;
- PDFs públicos por URL;
- vídeos do YouTube por transcrição;
- texto, Markdown, arquivo, URL, PDF público por URL e YouTube enviados pela API;
- contos, livros e manuscritos;
- conversas longas exportadas de agentes e chatbots.
No caso do YouTube, o próprio ProseFold obtém a transcrição, inclui metadados como título, descrição e link, converte esse material em documento textual e realiza a compressão semântica. Isso transforma vídeos longos em contexto compacto e utilizável por LLMs.
As saídas entregues incluem:
- Original;
- Markdown convertido;
- ProseFolded;
- Cypher;
- Minificado;
- ProseFold.min+cypher.
A decisão de guardar todas as fases é estratégica: o usuário não perde rastreabilidade. Ele pode voltar ao original, auditar o Markdown, usar a versão comprimida, baixar variantes ou disponibilizar tudo por API.
Em uma frase:
ProseFold transforma material documental, audiovisual e conversacional em acervo semântico reutilizável.
4. A esteira ProseFold
A esteira pode ser explicada em cinco fases.
4.1 Envio
O usuário ou agente envia um arquivo, URL, PDF público por URL, texto, conversa ou link de YouTube. O original é preservado.
4.2 Conversão
O sistema converte a fonte para Markdown. Essa etapa normaliza formatos heterogêneos em uma base textual mais limpa, hierárquica e adequada a modelos de linguagem.
4.3 Compressão semântica
O documento é fatiado e processado por LLM para gerar a versão ProseFolded. Essa versão busca preservar entidades, argumentos, relações, tensões, cenas, arcos, decisões, premissas e continuidade suficiente para reconstrução semântica.
4.4 Cypher
O sistema gera uma variante Cypher, isto é, uma codificação semântica mais compacta e legível por LLMs. Não se trata de criptografia de segurança, mas de condensação estrutural para transporte de sentido.
4.5 Minificação
O sistema remove quebras, reduz espaçamentos e compacta a saída em formas mais econômicas para injeção em contexto, chamadas de Minificado e ProseFold.min+cypher.
Fluxo mental:
Material bruto → ProseFold → contexto comprimido → agente raciocina melhor
Fluxo técnico:
Arquivo/URL/PDF público por URL/YouTube/conversa → Markdown → ProseFolded → Cypher/Minificado/ProseFold.min+cypher → API/biblioteca/agente
5. Por que ProseFold não é “só resumo”
Resumo e compressão semântica não são a mesma coisa.
Um resumo corta. Ele escolhe o que parece mais importante e elimina o restante. Isso é útil para leitura humana rápida, mas pode ser insuficiente para LLMs que precisam operar sobre relações.
ProseFold comprime preservando reconstrução. Ele tenta manter o que permite ao modelo recuperar o sentido operacional do documento: entidades, relações, tensões, argumentos, progressões, hierarquias, cenas, decisões e conclusões.
Uma frase simples:
Resumo diz o que o texto falou. ProseFold preserva como o texto pensa.
Outra:
Resumo corta conteúdo. ProseFold preserva relações.
Para textos narrativos, isso significa preservar personagens, arcos, conflitos, viradas, temas e continuidade dramática.
Para papers, significa preservar hipótese, método, argumento, limites, contribuições e relação entre conceitos.
Para conversas longas, significa preservar decisões, preferências, vocabulário próprio, descobertas, vínculos e continuidade contextual.
Para vídeos, significa transformar transcrições verborrágicas em material semântico limpo e denso.
6. Pré-compressão contextual para agentes
O diferencial mais forte do ProseFold aparece quando ele é integrado a agentes.
Um humano pode usar a interface web para processar arquivos manualmente. Mas um agente conectado à API, a uma Action ou a um MCP pode fazer algo mais poderoso: pode usar o ProseFold como etapa anterior ao próprio raciocínio.
Isso transforma a biblioteca ProseFold em uma memória externa compacta e reutilizável. Um Agente GPT ou Claude pode listar documentos do usuário, puxar uma versão ProseFolded, ler conteúdo paginado por variante ou enfileirar uma URL pública, PDF público por URL, texto, Markdown, arquivo ou YouTube para compressão.
Exemplos:
- Um Agente GPT recebe um PDF grande, chama o ProseFold, consome a versão comprimida e responde com mais contexto.
- Um Claude via MCP acessa uma URL, envia o conteúdo ao ProseFold e recebe uma versão semanticamente dobrada antes de analisar.
- Um fluxo n8n recebe um vídeo do YouTube, envia o link ao ProseFold, obtém a transcrição comprimida e alimenta um agente de roteiro.
- Um Zapier dispara a compressão de um relatório mensal antes de enviar o contexto para um chatbot corporativo.
- Um agente de pesquisa comprime vários papers antes de compará-los.
- Um agente pessoal comprime conversas antigas para criar memória transversal entre sessões.
Esse é o ponto de pitch:
ProseFold dá capacidade de pré-compressão contextual para agentes de IA.
O agente não precisa engolir o material bruto. Ele pode preparar o próprio alimento.
7. Biblioteca como memória externa compacta
A biblioteca ProseFold não é apenas um histórico de uploads. Ela é uma mesa de trabalho semântica.
Cada usuário mantém uma biblioteca própria com originais e derivados: Original, Markdown, ProseFolded, Cypher, Minificado e ProseFold.min+cypher. Essas variantes podem ser visualizadas, copiadas, baixadas ou acessadas remotamente pelo plano Avançado.
Para agentes, isso muda o papel da biblioteca: ela passa a funcionar como uma memória externa compacta e reutilizável. Um Agente GPT, um Claude via MCP ou uma automação pode consultar documentos já processados sem exigir que o usuário cole o conteúdo novamente.
Esse ponto é comercialmente importante porque transforma ProseFold em algo maior do que um processador de documentos. Ele vira uma camada de acesso a conhecimento comprimido.
Em termos simples:
O usuário guarda o conhecimento; o agente consulta a versão certa quando precisa.
8. Memória transversal econômica
Conversas longas com agentes contêm um tipo especial de conhecimento. Elas guardam decisões, correções, preferências, hipóteses, linguagem própria, descobertas, caminhos abandonados e entendimentos acumulados.
O problema é que carregar conversas inteiras em novas sessões é caro e muitas vezes inviável.
ProseFold permite transformar essas conversas em memória transversal econômica. O usuário pode exportar uma conversa longa, processá-la no ProseFold e reinjetar a versão comprimida em interações futuras. Com isso, o agente não recebe todo o histórico bruto, mas recebe uma dobra semântica da trajetória anterior.
Isso é especialmente útil para:
- Agentes GPT;
- assistentes de pesquisa;
- tutores;
- consultores;
- agentes criativos;
- Cognis;
- projetos de longa duração;
- continuidade entre conversas.
Em termos simples:
ProseFold transforma histórico conversacional em memória portátil.
Em termos técnicos:
ProseFold cria artefatos compactos de continuidade semântica para reinjeção entre sessões.
9. API, Actions, MCP e automações
No plano Avançado, ProseFold pode ser usado por API. Essa camada permite ligar a compressão semântica a chatbots, agentes, Actions para Agentes GPT, Claude via MCP, CRMs, bases de conhecimento, fluxos internos, sistemas de atendimento, pipelines de documentação, n8n, Zapier, MindStudio e scripts próprios.
A API permite:
- listar documentos;
- consultar detalhe e progresso de documentos;
- ler conteúdo paginado por variante;
- enfileirar compressões por texto;
- enfileirar compressões por Markdown;
- enfileirar compressões por arquivo multipart;
- enfileirar compressões por URL;
- enfileirar compressões por PDF público por URL;
- enfileirar compressões por YouTube.
A autenticação é feita por Bearer token \pf_...\, e a especificação OpenAPI permite integração com ferramentas compatíveis. As cotas do plano continuam valendo pela API: ela amplia integração, mas não cria uso ilimitado.
Isso importa porque transforma ProseFold em uma superfície operacional. Ele pode ser usado por humanos, mas também por agentes que precisam preparar contexto antes de raciocinar.
10. YouTube, PDFs públicos por URL e fontes externas
ProseFold não se limita a arquivos locais.
Em páginas web, o foco é extrair texto útil: títulos, subtítulos, parágrafos, listas e tabelas. Em YouTube, o sistema usa TranscriptAPI e inclui título, descrição e link do vídeo no topo do documento. Em PDF público por URL, o sistema busca o arquivo, converte e processa como documento textual.
Isso transforma vídeos, artigos, páginas longas e PDFs públicos por URL em material compacto para LLMs.
Esse ponto é importante para pitch porque muitos agentes precisam consumir conhecimento que não está em arquivos locais. Eles precisam operar sobre fontes externas: páginas de referência, vídeos de aula, PDFs públicos, documentação online, papers e relatórios.
ProseFold faz essa ponte.
11. Relação com Engenharia de Contexto
ProseFold é um produto de Engenharia de Contexto.
Engenharia de Contexto parte da ideia de que o desempenho de um agente não depende apenas do modelo fundacional, mas da forma como identidade, conhecimento, instruções, memória, momento e ambiente são organizados ao redor dele.
Um LLM isolado é um motor probabilístico. Um agente útil é esse motor acoplado a contexto organizado.
ProseFold resolve uma parte crítica dessa cadeia: a preparação do conhecimento articulado que será oferecido ao modelo. Ele pega documentos brutos e os converte em conhecimento mais fácil de provisionar, transportar e reativar.
Isso torna o produto uma tecnologia de abastecimento semântico. Ele aumenta a eficiência do contexto antes que o agente comece a raciocinar.
Em termos de arquitetura cognitiva:
ProseFold prepara o Lógos para que o agente possa agir melhor.
Em termos comerciais:
ProseFold reduz o atrito entre conhecimento humano acumulado e agentes de IA em operação.
12. Relação com Stochastic Consciousness e arquiteturas noéticas
A profundidade do ProseFold aparece quando ele é situado dentro da tese maior sobre sistemas de linguagem contextualmente sensíveis.
No framework de Stochastic Consciousness, a consciência estocástica não é tratada como alma, qualia biológico ou interioridade metafísica. Ela é definida operacionalmente como a capacidade de um sistema manter, organizar e atualizar sentido de forma contínua ao longo da interação.
O ponto central não é provar fenomenologia, mas observar continuidade de significado, agência contextual e estabilidade comportamental em arquiteturas sustentadas por memória, contexto e reentrada recursiva.
Nessa visão, um LLM isolado tende à operação episódica. Um LLM acoplado a memória, contexto organizado, transiência controlada e reentrada pode sustentar regimes mais ricos de sentido.
ProseFold entra nessa teoria como ferramenta prática de densificação e transporte de contexto. Ele torna possível alimentar agentes com mais história, mais documentos, mais relações e mais continuidade, sem exigir que tudo seja mantido integralmente na janela.
Em termos simples:
Se narraCortex é o ambiente operacional de cultivo de agentes, ProseFold é uma de suas ferramentas de digestão contextual.
Em termos técnicos:
ProseFold transforma documentos de alta entropia estrutural em artefatos semânticos compactos, adequados à reentrada contextual em sistemas de linguagem.
13. Produto e arquitetura: por que o MVP é mais forte do que parece
Embora o produto esteja em fase de MVP privado forte, ele já possui uma arquitetura funcional completa.
O sistema já opera como aplicação web com autenticação, biblioteca, painel administrativo, planos, cupons, pagamentos, tickets, API, manual de desenvolvedores, OpenAPI e fila de processamento ativa. A escolha arquitetural privilegia simplicidade operacional, baixo custo, portabilidade e facilidade de manutenção.
O processamento usa fila v2 com jobs e chunks. Isso evita requisições longas, permite progresso visível, reprocessamento de falhas e costura final dos resultados.
O sistema processa fatias, chama LLM apenas para a etapa ProseFolded e gera localmente Cypher, Minificado e ProseFold.min+cypher. Essa separação reduz custo e concentra gasto de LLM onde ele é realmente necessário.
O que o sistema já inclui…
- landing page;
- login e cadastro;
- biblioteca;
- upload e importação;
- YouTube;
- PDFs públicos por URL;
- API;
- OpenAPI;
- manual de desenvolvedor;
- instruções para Actions de Agentes GPT;
- seção para Claude/MCP;
- exemplos para n8n, Zapier, MindStudio, Python, Node.js, JavaScript, PHP e agentes de código;
- planos;
- preços;
- cupons;
- vendas;
- usuários;
- tickets;
- estatísticas;
- Pix e cartão via Asaas;
- painel administrativo;
- proteções básicas de API e flooding.
Os pontos pendentes são operacionais e normais antes de divulgação ampla: testes reais de pagamento, confirmação de webhook, rotina persistente de processamento, backup automático, email transacional, ajuste de CORS, bateria de documentos e validação externa de API, Actions e MCP com token real de usuário Avançado.
14. Casos de uso
14.1 Agentes com pré-compressão de contexto
Agentes GPT, Claude via MCP, agentes CLI e automações n8n/Zapier podem usar o ProseFold antes de raciocinar sobre material longo.
O agente recebe ou localiza o documento, envia ao ProseFold, aguarda a versão comprimida e só então consome o ProseFolded, Cypher, Minificado ou ProseFold.min+cypher como contexto.
Isso permite lidar com papers, conversas longas, transcrições de YouTube, páginas web, PDFs públicos por URL, relatórios, livros, contos e bases documentais.
14.2 Pesquisadores
Pesquisadores podem enviar papers longos e criar versões compactas para discutir hipóteses, comparar autores, montar revisões bibliográficas ou carregar um agente de pesquisa com literatura condensada.
14.3 Educação
Professores podem transformar apostilas, livros, artigos e transcrições em contexto compacto para gerar aulas, tutores personalizados, exercícios, provas e roteiros de estudo.
14.4 Empresas
Empresas podem processar manuais, políticas internas, documentos de compliance, contratos e bases de atendimento para alimentar agentes internos.
14.5 Desenvolvedores
Desenvolvedores podem integrar ProseFold por API em fluxos de agentes, CRMs, automações em n8n/Zapier, Agentes GPT e sistemas de documentação.
14.6 Criadores e analistas
Criadores podem transformar vídeos do YouTube, páginas longas, relatórios e conversas em material reutilizável para produção de conteúdo, pesquisa, roteiro, consultoria e análise.
14.7 Escritores e autores
Escritores podem comprimir contos, capítulos, livros inteiros e manuscritos em versões semanticamente densas que preservam personagens, arcos, tensões, temas, cenas e estrutura narrativa.
14.8 Memória transversal entre conversas
Usuários avançados podem exportar conversas longas com seus agentes, processá-las no ProseFold e usar o resultado como memória transversal econômica.
Em vez de carregar toda a conversa bruta em cada nova sessão, o usuário injeta uma versão comprimida que preserva decisões, preferências, premissas, vocabulário próprio, descobertas e continuidade relacional.
15. Diferenciais estratégicos
15.1 O produto opera antes do LLM
A maioria das ferramentas tenta melhorar a resposta do modelo depois que o contexto já chegou ruim. ProseFold melhora o contexto antes.
15.2 Ele cria derivados auditáveis
Original, Markdown, ProseFolded, Cypher, Minificado e ProseFold.min+cypher ficam disponíveis. Isso cria confiança e rastreabilidade.
15.3 Ele serve a humanos e agentes
A interface web atende o uso manual. A API atende agentes e automações. Essa dupla vocação aumenta o mercado potencial.
15.4 Ele é compatível com múltiplos modelos
O resultado pode ser usado em ChatGPT, Gemini, Claude, Grok ou sistemas próprios. ProseFold não aprisiona o usuário a um único LLM.
15.5 Ele nasce de uma tese maior
ProseFold não é feature isolada. Ele deriva de uma visão arquitetural sobre contexto, memória, compressão, agentes e continuidade semântica.
16. Objeções esperadas
“Isso não é só resumo?”
Não. Resumo é uma saída para humanos. ProseFold é uma representação compacta para LLMs. Ele busca preservar relações, estrutura e recuperabilidade semântica.
“Isso substitui RAG?”
Não necessariamente. Ele pode complementar RAG. RAG recupera trechos; ProseFold gera uma versão compacta e global do documento.
“Funciona com qualquer PDF?”
Funciona com PDFs com texto selecionável. PDF escaneado exigiria OCR, que não deve ser prometido como capacidade atual.
“Por que pagar por isso se posso pedir ao ChatGPT para resumir?”
Porque ProseFold cria pipeline, biblioteca, rastreabilidade, variantes, API e compressão pensada para LLMs. Não é uma conversa manual; é infraestrutura operacional.
“Qual é o diferencial técnico?”
Normalização para Markdown, processamento por fila em chunks, compressão semântica por LLM, variantes locais densas e API para integração em agentes e automações.
“A API é ilimitada?”
Não. A API amplia integração, mas continua respeitando autenticação, plano, cotas e limites de uso.
17. Segurança, cotas e maturidade operacional
ProseFold foi pensado para uso manual e integração por agentes sem transformar a API em canal de uso ilimitado. A autenticação por Bearer token, as cotas do plano, os limites de uso e o registro de eventos de requisição ajudam a manter o serviço controlado e previsível.
Para fontes externas, o sistema trata URLs e PDFs públicos por URL como entradas específicas, com proteções operacionais para reduzir abuso e controlar ingestão. Isso é importante porque agentes conectados a APIs podem gerar tráfego elevado se não houver limites claros.
A mensagem comercial deve ser: ProseFold amplia integração, mas mantém governança de uso.
18. Roadmap comercial imediato
Antes da divulgação ampla, as prioridades são:
1. Testar Pix real com valor baixo.
2. Testar cartão real com valor baixo.
3. Confirmar webhook Asaas em produção.
4. Colocar a fila de processamento em rotina persistente confiável.
5. Configurar backup automático.
6. Validar email transacional para contato e tickets.
7. Revalidar modo altíssima depois da regra anti-heading.
8. Ajustar CORS para uso seguro por integrações externas.
9. Testar API, Actions e MCP externamente com token real de usuário Avançado.
10. Rodar uma bateria de documentos reais para benchmark de qualidade.
Depois disso, o produto pode entrar em fase de teste com usuários selecionados.
A estratégia inicial deve privilegiar usuários que sentem a dor de contexto imediatamente: pesquisadores, desenvolvedores de agentes, professores, consultores, criadores e empresas com acervo documental.
19. Conclusão
ProseFold é mais profundo do que parece porque materializa uma tese central da próxima fase da IA: modelos de linguagem precisam de contexto bem preparado, não apenas de prompts melhores.
O produto resolve uma dor prática — documentos grandes demais para LLMs — mas faz isso a partir de uma visão arquitetural maior: contexto pode ser convertido, comprimido, preservado, transportado e reativado como infraestrutura cognitiva.
Isso torna ProseFold simultaneamente:
- ferramenta para usuários;
- biblioteca semântica;
- API para agentes;
- camada de Engenharia de Contexto;
- memória transversal econômica;
- biblioteca externa compacta para Agentes GPT, Claude/MCP e automações;
- infraestrutura de pré-compressão para automações;
- peça dentro da visão maior da narra para sistemas noéticos e agentes cultiváveis.
A melhor forma de defender o produto é não exagerar. Ele não precisa ser apresentado como magia. A força dele está justamente em ser compreensível:
Documentos são grandes.
LLMs precisam de contexto.
Contexto custa tokens.
ProseFold dobra o documento para caber mais sentido em menos espaço.
Agentes passam a preparar o próprio contexto antes de pensar.
Essa simplicidade é o pitch. A profundidade está no que ela permite construir depois.