TheAlgorithms · dhruvidave348 · Oct 8, 2025 · Oct 9, 2025 · Oct 9, 2025 · Oct 10, 2025
diff --git a/computer_vision/vision_transformer.py b/computer_vision/vision_transformer.py
@@ -0,0 +1,58 @@
+"""
+Vision Transformer (ViT) Module
+================================
+
+Classify images using a pretrained Vision Transformer (ViT)
+from Hugging Face Transformers.
+"""
+
+from io import BytesIO
+from typing import Optional
+
+import requests
+import torch
+from PIL import Image, UnidentifiedImageError
+from transformers import ViTForImageClassification, ViTImageProcessor
+
+
+def classify_image(image: Image.Image) -> str:
+    """Classify a PIL image using pretrained ViT."""
+    processor = ViTImageProcessor.from_pretrained("google/vit-base-patch16-224")
+    model = ViTForImageClassification.from_pretrained("google/vit-base-patch16-224")
+
+    inputs = processor(images=image, return_tensors="pt")
+
+    with torch.no_grad():
+        outputs = model(**inputs)
+        logits = outputs.logits
+
+    predicted_class_idx = logits.argmax(-1).item()
+    return model.config.id2label[predicted_class_idx]
+
+
+def demo(url: Optional[str] = None) -> None:
+    """
+    Run a demo using a sample image or provided URL.
+
+    Args:
+        url (Optional[str]): URL of the image. If None, uses default cat image.
+    """
+    if url is None:
+        url = (
+            "https://images.unsplash.com/photo-1592194996308-7b43878e84a6"
+        )  # default example image
+
+    try:
+        response = requests.get(url, timeout=10)
+        response.raise_for_status()
+        image = Image.open(BytesIO(response.content))
+    except (requests.RequestException, UnidentifiedImageError) as e:
+        print(f"Failed to load image from {url}. Error: {e}")
+        return
+
+    label = classify_image(image)
+    print(f"Predicted label: {label}")
+
+
+if __name__ == "__main__":
+    demo()