StylometryAnonymizer

StylometryAnonymizer est conçue pour générer des variations de texte en français tout en préservant le sens original. L’outil modifie le style d’écriture pour rendre l’analyse stylométrique plus difficile, protégeant ainsi l’identité de l’auteur.

Open Source https://github.com/icaza/Ostium-Osint-Browser/tree/feature%2314/StylometryAnonymizer

Category:

Description

Objectif

La stylométrie permet d’identifier un auteur par son style d’écriture unique. StylometryAnonymizer combat cette analyse en :

  • Remplaçant le vocabulaire par des synonymes contextuels
  • Variant la structure syntaxique des phrases
  • Modifiant la ponctuation de manière subtile
  • Restructurant l’ordre et la composition des phrases

Caractéristiques

Transformations Multiples

  • Remplacement de vocabulaire : Utilise un dictionnaire de synonymes personnalisable
  • Variation syntaxique : Change la voix (active/passive), inverse sujet-verbe
  • Modification de ponctuation : Adapte les guillemets, tirets, virgules de façon naturelle
  • Restructuration de phrases : Fusionne ou divise les phrases, réorganise l’ordre

Performance Optimisée

  • Regex précompilés : Patterns compilés pour des performances maximales
  • Thread-safe : Utilisation de ThreadLocal<Random> pour le multithreading
  • StringBuilder optimisé : Pré-allocation mémoire intelligente
  • Lock minimal : Verrouillage uniquement sur les opérations critiques

Protection Anti-Stylométrie

  • Probabilités réduites : Modifications subtiles pour éviter les patterns détectables
  • Élimination des signatures : Suppression automatique des doubles ponctuations
  • Variations naturelles : Transformations qui préservent la lisibilité