Solo navegador. El archivo nunca se sube

Anonimiza un PDF o DOCX antes de pegarlo en ChatGPT

Suelta un PDF o DOCX, el texto se extrae en tu navegador, la PII estructurada (emails, teléfonos, DNI/NIE/NIF españoles, IBANs, tarjetas) se detecta y reemplaza con el método que elijas. La salida es un .txt seguro para pegar en ChatGPT.

Suelta un documento para anonimizar

PDF, DOCX o TXT. El texto se extrae en tu navegador, el archivo nunca se sube.

Formatos soportados: .pdf, .docx, .doc, .txt

Por qué un flujo aparte para documentos

Compartir un informe PDF o un Word con ChatGPT o Claude es el escenario de fuga de datos a IA más común para usuarios no técnicos. Contratos de clientes, emails de soporte exportados, informes de gastos. Todos llevan identificadores directos. Este flujo extrae la prosa localmente y aplica el mismo detector regex que el flujo CSV. Solo navegador, gratis hasta 2k líneas.

  • Los PDF y DOCX no llegan a nuestros servidores. Pdf.js y mammoth corren en cliente
  • Detecta emails, teléfonos, DNI/NIE/NIF, IBAN y tarjetas de forma fiable
  • Pseudonimizar guarda el mapeo para revertir luego con la misma herramienta de reversión
  • Honesto sobre los límites: nombres y direcciones necesitan NER y pueden pasarse. Revisa antes de descargar

Cómo funciona

  1. 1
    Suelta el documento
    PDF, DOCX o TXT. El navegador extrae el texto directamente; el binario nunca se sube.
  2. 2
    Elige método por tipo de PII
    Para cada tipo detectado, elige redactar / hash / faker / pseudonimizar. Por defecto pseudonimiza los reversibles y redacta las tarjetas.
  3. 3
    Revisa y descarga
    Vista previa del texto anonimizado en el navegador, luego descarga el .txt y el archivo de mapeo (JSON o CSV).
  4. 4
    Pega en ChatGPT y revierte
    Pega el .txt en ChatGPT, ejecuta tu análisis, luego usa la herramienta de reversión con el mismo mapeo para traducir la respuesta de la IA.

Qué puede y qué no puede hacer

El detector usa regex con validadores de formato (letra de DNI, mod-97 de IBAN, Luhn de tarjetas). Esto da pocas falsas positivas. Cuando marca un IBAN, es un IBAN de verdad. El tradeoff: solo se detectan identificadores estructurados.

Nombres como 'María García' y direcciones como 'Calle Mayor 12' NO se detectan sin un modelo de reconocimiento de entidades nombradas. Te avisamos de esto antes de la descarga. Revisas la vista previa, editas si hace falta, y exportas. Para la mayoría de usos con ChatGPT cubre las fugas de mayor riesgo (emails, teléfonos, IDs) y el usuario revisa el resto en segundos.

Revierte la respuesta de la IA localmente

Cuando ChatGPT te devuelve una respuesta con EMAIL_0001 o DNI_0003, pégala en la herramienta de reversión con el archivo de mapeo. Reemplazo token a token, todo en tu navegador.

Abrir herramienta de reversión →

Herramientas relacionadas

Preguntas frecuentes

¿Mi PDF sale del navegador?+

No. pdf.js y mammoth corren como JavaScript dentro de tu navegador. El binario nunca llega a nuestros servidores. Solo viajan los metadatos de la operación (líneas, bytes) para el control de tier.

¿Qué se detecta y qué no?+

Se detectan de forma fiable: emails, teléfonos, DNI/NIE/NIF españoles (con letra válida), IBANs (con mod-97 válido), tarjetas (Luhn). No se detectan: nombres de personas, nombres de empresas, direcciones, descripciones libres. Esos necesitan NER y están fuera del alcance sin un modelo.

¿Puedo editar el texto antes de descargar?+

En esta primera versión la vista previa es de solo lectura. Revisas y decides si descargas. Una versión futura permitirá editar la salida inline para nombres y direcciones residuales.

¿Cuál es el precio?+

La misma tabla de tramos que el flujo CSV: gratis hasta 2.000 líneas, luego 3$/7$/15$/29$ por número de líneas. La reversión usa la misma tabla.

¿Puedo anonimizar un contrato con cientos de nombres?+

Puedes ejecutarlo, pero solo se reemplazarán los identificadores estructurados. Para contratos donde los nombres son la mayor preocupación, la herramienta captura IDs e IBANs mientras tú gestionas los nombres con buscar-y-reemplazar. Un modo con NER está en el roadmap.