Anonyfiles est une solution open source complète pour l’anonymisation automatisée de documents texte, tableurs et bureautiques, basée sur le NLP (spaCy) et des stratégies avancées de remplacement (Faker, codes, placeholders, etc.).
anonyfiles_cli
) : traitement en ligne de commande, configurable, robuste et multi-format.anonyfiles_gui
) : interface graphique moderne (Tauri + Svelte + Rust) pour une anonymisation intuitive, rapide et multiplateforme.anonyfiles_api
) : API REST FastAPI pour intégration dans des workflows ou systèmes tiers..txt
, .csv
, .docx
, .xlsx
, .pdf
, .json
[REDACTED]
, codes séquentiels, etc.job_id
)anonyfiles/
│
├── README.md # Présent fichier
├── anonyfiles_cli/ # Outil CLI (Python)
│ └── README.md # Documentation CLI détaillée
├── anonyfiles_gui/ # Interface graphique (Tauri / Svelte)
│ └── README.md # Documentation GUI détaillée
├── anonyfiles_api/ # API FastAPI pour appel distant
│ └── README.md # Documentation API détaillée
└── ...
fr_core_news_md
git clone https://github.com/simongrossi/anonyfiles.git
cd anonyfiles
➡️ Voir anonyfiles_cli/README.md
➡️ Voir anonyfiles_gui/README.md
➡️ Voir anonyfiles_api/README.md
Afin d’isoler proprement les dépendances entre la CLI, l’API et la GUI, le projet utilise trois environnements virtuels distincts :
env-cli
→ pour anonyfiles_cli
(spaCy, typer…)env-api
→ pour anonyfiles_api
(FastAPI, pydantic…)env-gui
→ pour les éventuelles dépendances Python liées à la GUIDes scripts de configuration automatique sont disponibles à la racine du projet pour Linux/macOS et Windows :
.nonyfiles.ps1 -action setup # Crée les environnements
.nonyfiles.ps1 -action api # Lance l’API FastAPI
.nonyfiles.ps1 -action cli # Lance le moteur CLI
.nonyfiles.ps1 -action gui # Lance la GUI (Tauri)
.nonyfiles.ps1 -action clean # Supprime les environnements
anonyfiles.bat setup :: Crée les environnements
anonyfiles.bat api :: Lance l’API
anonyfiles.bat cli :: Lance le moteur CLI
anonyfiles.bat gui :: Lance la GUI (Tauri)
anonyfiles.bat clean :: Supprime les environnements
📁 Les scripts
anonyfiles.ps1
etanonyfiles.bat
sont disponibles à la racine du projet.
chmod +x setup_envs.sh
./setup_envs.sh
.\setup_envs.ps1
Ces scripts effectuent les actions suivantes :
env-cli
, env-api
, env-gui
)cli/requirements.txt
anonyfiles_api/requirements.txt
GUI/requirements.txt
(optionnel)anonyfiles_cli/README.md
anonyfiles_gui/README.md
anonyfiles_api/README.md
Priorité | Thème | État | Commentaire / Lien tâche |
---|---|---|---|
1 | Robustesse multi-format (TXT, CSV, DOCX, XLSX) | ✅ Fait | Moteur factorisé, détection commune |
2 | Remplacement positionnel fiable | ⚠️ Test/Debug | En cours de vérification |
3 | Détection universelle des dates et emails | ✅ Fait | Regex avancée + spaCy |
4 | Performance / gestion mémoire | 🔜 À venir | Streaming, lazy processing |
5 | Règles de remplacement par type (YAML) | ⚠️ Test/Debug | Règles personnalisées en test |
6 | Mapping codes <-> originaux | ⚠️ Test/Debug | Mapping inverse, audit, désanonymisation |
7 | Filtre exclusion (YAML / CLI) | ✅ Fait | Configurable, évite faux positifs |
8 | Support PDF / JSON | 🔜 À venir | PDF natif, JSON complet |
9 | Désanonymisation CLI (mapping inverse) | ⚠️ Test/Debug | Tests en cours |
10 | GUI avancée (drag & drop, prévisualisation) | 🚧 En cours | Tauri/Svelte, UX moderne |
11 | Copie, export, gestion multi-fichier dans la GUI | 🚧 En cours | Copier/coller, sélection, batch |
12 | Support anglais, espagnol, allemand | 🔜 À venir | Modèles spaCy additionnels |
13 | API asynchrone avec suivi de jobs (job_id ) |
✅ Fait | CORS, UUID, audit log complet |
Projet distribué sous licence MIT. Voir LICENSE.
Pour toute question, consultez la documentation CLI/GUI/API ou ouvrez une issue sur GitHub.