Заменяет имена, организации, финансовые идентификаторы, адреса, email-адреса и телефоны структурированными токенами в .docx, .pdf и .xlsx. Работает локально. Русский + английский. Никакой телеметрии.
curl -fsSL anonymizer.site/install | sh Юристы хотят использовать AI для разбора договоров, но не могут вставить в сторонние сервисы сырые данные клиента. Ручная редактура медленная и подвержена ошибкам, особенно для отсканированных документов. anonymizer автоматизирует этап редактуры локально, не меняя остальной AI-workflow.
Стабильные токены с сохранением грамматической позиции. Нумерация постоянна в рамках сессии.
Иван Петров → [Person_1] ООО Ромашка → [Company_1] i.petrov@example.com → [Email_1] +7 916 555-12-34 → [Phone_1] ИНН 7707083893 → [Tax_ID_1] GB29 NWBK 6016... → [IBAN_1] 4276 1300 ... → [Card_1] Москва, Тверская 1 → [Address_1] 12.03.2024 → [Date_1] 192.168.1.1 → [IP_1] example.com/dashboard → [URL_1] Перетащите .docx, .pdf или .xlsx в локальный веб-интерфейс.
Natasha + spaCy работают на вашем CPU. Регулярные выражения ловят структурированные данные. Сокет не открывается.
Структура сохранена, метаданные очищены. Исходный файл не изменён.
Данные не покидают ваш компьютер. Никогда.
curl -fsSL anonymizer.site/install | sh iwr -useb anonymizer.site/install.ps1 | iex uv tool install docs-anonymizer См. /ru/docs/installation/manual — SHA256 и опции офлайн-зеркала.
Интеграционный тест проверяет, что при обработке документа сокет не открывается (tests/integration/test_no_network.py).
Полный исходник публикуется как sdist рядом с wheel на PyPI.
Обратная связь — только по явному нажатию кнопки в UI. Никакой пассивной аналитики.
Появится в v0.2.
Пока нет. OCR появится в MVP-1.
Потому что мы используем PyMuPDF. Sdist публикуется рядом с wheel.
Да — переключатели по категориям в UI и в конфиг-файле.
Только по нажатию кнопки «Проверить обновления». Пассивной телеметрии нет.
Внутри одной сессии — да. Между сессиями — нет. Это сделано намеренно, см. документацию Token Manager.
Да, но one-liner-установщика пока нет. Используйте 'uv tool install docs-anonymizer'.
MVP-0 — пилотный уровень: ≥99% полноты по P0-категориям на эталонном корпусе. Решение остаётся за вами.