Un Kit de Herramientas de Código Abierto para Marcas de Agua Generativas de Modelos de Difusión Latente

Versiones de idioma: English | 中文 | Français | Español

🔥 ¡Como un proyecto recién lanzado, damos la bienvenida a PRs! Si has implementado un algoritmo de marcas de agua LDM o estás interesado en contribuir con uno, nos encantaría incluirlo en MarkDiffusion. ¡Únete a nuestra comunidad y ayuda a hacer las marcas de agua generativas más accesibles para todos!

🔥 Actualizaciones

🛠 (2025.12.19) Agregada una suite de pruebas completa para todas las funcionalidades con 658 casos de prueba.

🛠 (2025.12.10) Agregado un sistema de pruebas de integración continua usando GitHub Actions.

🎯 (2025.10.10) Agregadas herramientas de ataque de imagen Mask, Overlay, AdaptiveNoiseInjection, ¡gracias a Zheyu Fu por su PR!

🎯 (2025.10.09) Agregadas herramientas de ataque de video FrameRateAdapter, FrameInterpolationAttack, ¡gracias a Luyang Si por su PR!

🎯 (2025.10.08) Agregados analizadores de calidad de imagen SSIM, BRISQUE, VIF, FSIM, ¡gracias a Huan Wang por su PR!

✨ (2025.10.07) Agregado el método de marca de agua SFW, ¡gracias a Huan Wang por su PR!

✨ (2025.10.07) Agregado el método de marca de agua VideoMark, ¡gracias a Hanqian Li por su PR!

✨ (2025.9.29) Agregado el método de marca de agua GaussMarker, ¡gracias a Luyang Si por su PR!

🔓 Introducción a MarkDiffusion

👀 Descripción general

MarkDiffusion es un kit de herramientas de Python de código abierto para marcas de agua generativas de modelos de difusión latente. A medida que se expande el uso de modelos generativos basados en difusión, garantizar la autenticidad y el origen de los medios generados se vuelve crítico. MarkDiffusion simplifica el acceso, la comprensión y la evaluación de tecnologías de marcas de agua, haciéndolo accesible tanto para investigadores como para la comunidad en general. Nota: si estás interesado en marcas de agua LLM (marca de agua de texto), consulta el kit de herramientas MarkLLM de nuestro grupo.

El kit de herramientas comprende tres componentes clave: un marco de implementación unificado para integraciones simplificadas de algoritmos de marcas de agua e interfaces fáciles de usar; un conjunto de visualización de mecanismos que muestra intuitivamente los patrones de marcas de agua agregados y extraídos para ayudar a la comprensión pública; y un módulo de evaluación integral que ofrece implementaciones estándar de 31 herramientas en tres aspectos esenciales: detectabilidad, robustez y calidad de salida, además de 6 pipelines de evaluación automatizados.

💍 Características clave

Marco de implementación unificado: MarkDiffusion proporciona una arquitectura modular que admite once algoritmos de marcas de agua generativas de imagen/video de última generación para LDMs.
Soporte integral de algoritmos: Actualmente implementa 11 algoritmos de marcas de agua de dos categorías principales: métodos basados en patrones (Tree-Ring, Ring-ID, ROBIN, WIND, SFW) y métodos basados en claves (Gaussian-Shading, PRC, SEAL, VideoShield, GaussMarker, VideoMark).
Soluciones de visualización: El kit de herramientas incluye herramientas de visualización personalizadas que permiten vistas claras y perspicaces sobre cómo operan los diferentes algoritmos de marcas de agua en varios escenarios. Estas visualizaciones ayudan a desmitificar los mecanismos de los algoritmos, haciéndolos más comprensibles para los usuarios.
Módulo de evaluación: Con 31 herramientas de evaluación que cubren detectabilidad, robustez e impacto en la calidad de salida, MarkDiffusion proporciona capacidades de evaluación integral. Cuenta con 6 pipelines de evaluación automatizados: Pipeline de detección de marcas de agua, Pipeline de análisis de calidad de imagen, Pipeline de análisis de calidad de video y herramientas especializadas de evaluación de robustez.

✨ Algoritmos implementados

Algoritmo	Categoría	Objetivo	Referencia
Tree-Ring	Patrón	Imagen	Tree-Ring Watermarks: Fingerprints for Diffusion Images that are Invisible and Robust
Ring-ID	Patrón	Imagen	RingID: Rethinking Tree-Ring Watermarking for Enhanced Multi-Key Identification
ROBIN	Patrón	Imagen	ROBIN: Robust and Invisible Watermarks for Diffusion Models with Adversarial Optimization
WIND	Patrón	Imagen	Hidden in the Noise: Two-Stage Robust Watermarking for Images
SFW	Patrón	Imagen	Semantic Watermarking Reinvented: Enhancing Robustness and Generation Quality with Fourier Integrity
Gaussian-Shading	Clave	Imagen	Gaussian Shading: Provable Performance-Lossless Image Watermarking for Diffusion Models
GaussMarker	Clave	Imagen	GaussMarker: Robust Dual-Domain Watermark for Diffusion Models
PRC	Clave	Imagen	An undetectable watermark for generative image models
SEAL	Clave	Imagen	SEAL: Semantic Aware Image Watermarking
VideoShield	Clave	Video	VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking
VideoMark	Clave	Video	VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models

🎯 Módulo de evaluación

Pipelines de evaluación

MarkDiffusion admite ocho pipelines, dos para detección (WatermarkedMediaDetectionPipeline y UnWatermarkedMediaDetectionPipeline), y seis para análisis de calidad. La tabla a continuación detalla los pipelines de análisis de calidad.

Pipeline de análisis de calidad	Tipo de entrada	Datos requeridos	Métricas aplicables
DirectImageQualityAnalysisPipeline	Imagen única	Imagen generada con/sin marca de agua	Métricas para evaluación de imagen única
ReferencedImageQualityAnalysisPipeline	Imagen + contenido de referencia	Imagen generada con/sin marca de agua + imagen/texto de referencia	Métricas que requieren cálculo entre imagen única y contenido de referencia (texto/imagen)
GroupImageQualityAnalysisPipeline	Conjunto de imágenes (+ conjunto de imágenes de referencia)	Conjunto de imágenes generadas con/sin marca de agua (+ conjunto de imágenes de referencia)	Métricas que requieren cálculo en conjuntos de imágenes
RepeatImageQualityAnalysisPipeline	Conjunto de imágenes	Conjunto de imágenes generadas repetidamente con/sin marca de agua	Métricas para evaluar conjuntos de imágenes generadas repetidamente
ComparedImageQualityAnalysisPipeline	Dos imágenes para comparación	Imágenes generadas con y sin marca de agua	Métricas que miden diferencias entre dos imágenes
DirectVideoQualityAnalysisPipeline	Video único	Conjunto de fotogramas de video generados	Métricas para evaluación general de video

Herramientas de evaluación

Nombre de la herramienta	Categoría de evaluación	Descripción de la función	Métricas de salida
FundamentalSuccessRateCalculator	Detectabilidad	Calcular métricas de clasificación para detección de marca de agua con umbral fijo	Varias métricas de clasificación
DynamicThresholdSuccessRateCalculator	Detectabilidad	Calcular métricas de clasificación para detección de marca de agua con umbral dinámico	Varias métricas de clasificación
Herramientas de ataque de imagen
Rotation	Robustez (Imagen)	Ataque de rotación de imagen, probando la resistencia de la marca de agua a transformaciones de rotación	Imágenes/fotogramas rotados
CrSc (Crop & Scale)	Robustez (Imagen)	Ataque de recorte y escalado, evaluando la robustez de la marca de agua a cambios de tamaño	Imágenes/fotogramas recortados/escalados
GaussianNoise	Robustez (Imagen)	Ataque de ruido gaussiano, probando la resistencia de la marca de agua a interferencias de ruido	Imágenes/fotogramas corrompidos por ruido
GaussianBlurring	Robustez (Imagen)	Ataque de desenfoque gaussiano, evaluando la resistencia de la marca de agua al procesamiento de desenfoque	Imágenes/fotogramas desenfocados
JPEGCompression	Robustez (Imagen)	Ataque de compresión JPEG, probando la robustez de la marca de agua a la compresión con pérdida	Imágenes/fotogramas comprimidos
Brightness	Robustez (Imagen)	Ataque de ajuste de brillo, evaluando la resistencia de la marca de agua a cambios de brillo	Imágenes/fotogramas modificados en brillo
Mask	Robustez (Imagen)	Ataque de enmascaramiento de imagen, probando la resistencia de la marca de agua a la oclusión parcial por rectángulos negros aleatorios	Imágenes/fotogramas enmascarados
Overlay	Robustez (Imagen)	Ataque de superposición de imagen, probando la resistencia de la marca de agua a trazos y anotaciones estilo grafiti	Imágenes/fotogramas superpuestos
AdaptiveNoiseInjection	Robustez (Imagen)	Ataque de inyección de ruido adaptativo, probando la resistencia de la marca de agua al ruido consciente del contenido (Gaussiano/Sal-pimienta/Poisson/Moteado)	Imágenes/fotogramas ruidosos con ruido adaptativo
Herramientas de ataque de video
MPEG4Compression	Robustez (Video)	Ataque de compresión de video MPEG-4, probando la robustez de compresión de marca de agua de video	Fotogramas de video comprimidos
FrameAverage	Robustez (Video)	Ataque de promedio de fotogramas, destruyendo marcas de agua a través del promedio entre fotogramas	Fotogramas de video promediados
FrameSwap	Robustez (Video)	Ataque de intercambio de fotogramas, probando la robustez cambiando secuencias de fotogramas	Fotogramas de video intercambiados
FrameRateAdapter	Robustez (Video)	Ataque de conversión de velocidad de fotogramas que remuestrea fotogramas preservando la duración	Secuencia de fotogramas remuestreada
FrameInterpolationAttack	Robustez (Video)	Ataque de interpolación de fotogramas insertando fotogramas mezclados para alterar la densidad temporal	Fotogramas de video interpolados
Analizadores de calidad de imagen
InceptionScoreCalculator	Calidad (Imagen)	Evaluar calidad y diversidad de imagen generada	Puntuación IS
FIDCalculator	Calidad (Imagen)	Distancia de Inception de Fréchet, midiendo la diferencia de distribución entre imágenes generadas y reales	Valor FID
LPIPSAnalyzer	Calidad (Imagen)	Similitud de parche de imagen perceptual aprendida, evaluando calidad perceptual	Distancia LPIPS
CLIPScoreCalculator	Calidad (Imagen)	Evaluación de consistencia texto-imagen basada en CLIP	Puntuación de similitud CLIP
PSNRAnalyzer	Calidad (Imagen)	Relación señal-ruido de pico, midiendo la distorsión de imagen	Valor PSNR (dB)
NIQECalculator	Calidad (Imagen)	Evaluador de calidad de imagen natural, evaluación de calidad sin referencia	Puntuación NIQE
SSIMAnalyzer	Calidad (Imagen)	Índice de similitud estructural entre dos imágenes	Valor SSIM
BRISQUEAnalyzer	Calidad (Imagen)	Evaluador de calidad espacial de imagen ciega/sin referencia, evaluando la calidad perceptual de una imagen sin requerir una referencia	Puntuación BRISQUE
VIFAnalyzer	Calidad (Imagen)	Analizador de fidelidad de información visual, comparando una imagen distorsionada con una imagen de referencia para cuantificar la cantidad de información visual preservada	Valor VIF
FSIMAnalyzer	Calidad (Imagen)	Analizador de índice de similitud de características, comparando similitud estructural entre dos imágenes basada en congruencia de fase y magnitud de gradiente	Valor FSIM
Analizadores de calidad de video
SubjectConsistencyAnalyzer	Calidad (Video)	Evaluar consistencia de objetos sujeto en video	Puntuación de consistencia de sujeto
BackgroundConsistencyAnalyzer	Calidad (Video)	Evaluar coherencia y estabilidad del fondo en video	Puntuación de consistencia de fondo
MotionSmoothnessAnalyzer	Calidad (Video)	Evaluar suavidad del movimiento del video	Métrica de suavidad de movimiento
DynamicDegreeAnalyzer	Calidad (Video)	Medir nivel dinámico y magnitud de cambio en video	Valor de grado dinámico
ImagingQualityAnalyzer	Calidad (Video)	Evaluación integral de calidad de imagen de video	Puntuación de calidad de imagen

🧩 Inicio rápido

Demo de Google Colab

Si deseas probar MarkDiffusion sin instalar nada, puedes usar Google Colab para ver cómo funciona.

Instalación

(Recomendado) Hemos publicado un paquete pypi para MarkDiffusion. Puedes instalarlo directamente con pip:

conda create -n markdiffusion python=3.11
conda activate markdiffusion
pip install markdiffusion[optional]

(Alternativa) Para usuarios que están restringidos solo al uso del entorno conda, también proporcionamos un paquete conda-forge, que se puede instalar con los siguientes comandos:

conda create -n markdiffusion python=3.11
conda activate markdiffusion
conda config --add channels conda-forge
conda config --set channel_priority strict
conda install markdiffusion

Sin embargo, ten en cuenta que algunas características avanzadas requieren paquetes adicionales que no están disponibles en conda y no se pueden incluir en la versión. Necesitarás instalarlos por separado si es necesario.

Cómo usar el kit de herramientas

Después de la instalación, hay dos formas de usar MarkDiffusion:

Clonar el repositorio para probar las demos o usarlo para desarrollo personalizado. El notebook MarkDiffusion_demo.ipynb ofrece demostraciones detalladas para varios casos de uso — por favor revísalo para obtener orientación. Aquí hay un ejemplo rápido de generación y detección de imagen con marca de agua usando el algoritmo TR:

import torch
from watermark.auto_watermark import AutoWatermark
from utils.diffusion_config import DiffusionConfig
from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler

# Configuración del dispositivo
device = 'cuda' if torch.cuda.is_available() else 'cpu'

# Configurar pipeline de difusión
scheduler = DPMSolverMultistepScheduler.from_pretrained("model_path", subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained("model_path", scheduler=scheduler).to(device)
diffusion_config = DiffusionConfig(
    scheduler=scheduler,
    pipe=pipe,
    device=device,
    image_size=(512, 512),
    num_inference_steps=50,
    guidance_scale=7.5,
    gen_seed=42,
    inversion_type="ddim"
)

# Cargar algoritmo de marca de agua
watermark = AutoWatermark.load('TR', 
                            algorithm_config='config/TR.json',
                            diffusion_config=diffusion_config)

# Generar medios con marca de agua
prompt = "A beautiful sunset over the ocean"
watermarked_image = watermark.generate_watermarked_media(prompt)
watermarked_image.save("watermarked_image.png")

# Detectar marca de agua
detection_result = watermark.detect_watermark_in_media(watermarked_image)
print(f"Watermark detected: {detection_result}")

Importar la biblioteca markdiffusion directamente en tu código sin clonar el repositorio. El notebook MarkDiffusion_pypi_demo.ipynb proporciona ejemplos completos para usar MarkDiffusion a través de la biblioteca markdiffusion — por favor revísalo para obtener orientación. Aquí hay un ejemplo rápido:

import torch
from markdiffusion.watermark import AutoWatermark
from markdiffusion.utils import DiffusionConfig
from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler

# Dispositivo
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"Using device: {device}")

# Ruta del modelo
MODEL_PATH = "huanzi05/stable-diffusion-2-1-base"

# Inicializar planificador y pipeline
scheduler = DPMSolverMultistepScheduler.from_pretrained(MODEL_PATH, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(
    MODEL_PATH,
    scheduler=scheduler,
    torch_dtype=torch.float16 if device == "cuda" else torch.float32,
    safety_checker=None,
).to(device)

# Crear DiffusionConfig para generación de imágenes
image_diffusion_config = DiffusionConfig(
    scheduler=scheduler,
    pipe=pipe,
    device=device,
    image_size=(512, 512),
    guidance_scale=7.5,
    num_inference_steps=50,
    gen_seed=42,
    inversion_type="ddim"
)

# Cargar algoritmo de marca de agua Tree-Ring
tr_watermark = AutoWatermark.load('TR', diffusion_config=image_diffusion_config)
print("TR watermark algorithm loaded successfully!")

# Generar imagen con marca de agua
prompt = "A beautiful landscape with mountains and a river at sunset"

watermarked_image = tr_watermark.generate_watermarked_media(input_data=prompt)

# Mostrar la imagen con marca de agua
watermarked_image.save("watermarked_image.png")
print("Watermarked image generated!")

# Detectar marca de agua en la imagen con marca de agua
detection_result = tr_watermark.detect_watermark_in_media(watermarked_image)
print("Watermarked image detection result:")
print(detection_result)

🛠 Módulos de prueba

Proporcionamos un conjunto completo de módulos de prueba para garantizar la calidad del código. El módulo incluye 658 pruebas unitarias con aproximadamente un 95% de cobertura de código. Consulta el directorio test/ para más detalles.

Citación

@article{pan2025markdiffusion,
  title={MarkDiffusion: An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models},
  author={Pan, Leyi and Guan, Sheng and Fu, Zheyu and Si, Luyang and Wang, Zian and Hu, Xuming and King, Irwin and Yu, Philip S and Liu, Aiwei and Wen, Lijie},
  journal={arXiv preprint arXiv:2509.10569},
  year={2025}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Un Kit de Herramientas de Código Abierto para Marcas de Agua Generativas de Modelos de Difusión Latente

Contenidos

🔥 Actualizaciones

🔓 Introducción a MarkDiffusion

👀 Descripción general

💍 Características clave

✨ Algoritmos implementados

🎯 Módulo de evaluación

Pipelines de evaluación

Herramientas de evaluación

🧩 Inicio rápido

Demo de Google Colab

Instalación

Cómo usar el kit de herramientas

🛠 Módulos de prueba

Citación

FilesExpand file tree

README_es.md

Latest commit

History

README_es.md

File metadata and controls

Un Kit de Herramientas de Código Abierto para Marcas de Agua Generativas de Modelos de Difusión Latente

Contenidos

🔥 Actualizaciones

🔓 Introducción a MarkDiffusion

👀 Descripción general

💍 Características clave

✨ Algoritmos implementados

🎯 Módulo de evaluación

Pipelines de evaluación

Herramientas de evaluación

🧩 Inicio rápido

Demo de Google Colab

Instalación

Cómo usar el kit de herramientas

🛠 Módulos de prueba

Citación