Search Results

Found 42 repositories(showing 30)

Sparsifiner

lim142857

❤️40

Demo code for CVPR2023 paper "Sparsifiner: Learning Sparse Instance-Dependent Attention for Efficient Vision Transformers"

MIT

Python

Updated 5 months ago

attention-mechanismefficient-transformersefficient-vision-transformers+5

vision-transformer-demo

ajayarunachalam

❤️35

Designing, Implementing & Deploying Transformer Deep Learning Network Architecture for computer vision tasks

Jupyter Notebook

Updated 2 years ago

aries-vision-transformer-demo

mobilint

🧡50

No description available

MIT

TypeScript

Updated 1 week ago

Vision Transformer is a new model to achieve SOTA in vision classification with using transformer style encoders. The demo is a sample implementation of Vision Transformer trained from scratch with TensorFlow on Amazon SageMaker.

Jupyter Notebook

Updated 4 years ago

transformer-gesture

tayo4christ

❤️45

Real-time gesture recognition system using Vision Transformers, ONNX, and Gradio. Includes dataset preparation, training, evaluation, and a browser-based demo app.

Python

Updated 2 months ago

accessibility-tutorialcomputer-visiondeep-learning+7

Thyroid-Nodule-AI

AlexThunder01

🧡50

Deep Learning pipeline for thyroid nodule diagnosis in ultrasound. Benchmarks CNNs vs. Vision Transformers (YOLOv12, DINOv3) on a 7k+ dataset. Features a two-stage approach (Detection + Classification), achieving SOTA results with Foundation Models. Includes explainability maps and a GUI demo.

MIT

Python

Updated 1 month ago

artificial-intelligencecadclinical-decision-support+12

vision-transformer-vit-demo

chinmay-pardeshi

❤️45

Implementation and experimentation with Vision Transformer (ViT) architecture for image classification tasks using PyTorch or TensorFlow.

Jupyter Notebook

Updated 2 months ago

Nuscene_cuda

WaterHorseOnStreet

❤️35

a small demo for using cuda and Vision Transformer to prediction trajectory

Updated 3 years ago

ViTFaceClassification

asu-bridge93

❤️35

K-Pop Idol Classification: Computer vision project using fine-tuned Vision Transformers (ViT) to identify K-pop idols from TOMORROW X TOGETHER. Features YOLOv8 face detection, grayscale preprocessing technique improving accuracy from 60% to 85%, and interactive Gradio demo interface.

Jupyter Notebook

Updated 3 months ago

classificationcomputer-visiondata-science+5

mvtec-vit-anomaly

frederikcodes

❤️45

unsupervised anomaly detection on the mvtec ad dataset using vision transformer embeddings (dino/mae). includes feature extraction, knn/mahalanobis scoring, heatmaps, evaluation metrics (auroc/pro), and a streamlit demo for interactive visualization.

Jupyter Notebook

Updated 2 months ago

Multimodal-AI-Visual-Question-Answering

Yashkatiyar24

❤️35

Upload an image and ask natural-language questions about it — the model answers based on visual understanding. This demo uses ViLT (Vision-and-Language Transformer), a pretrained multimodal model fine-tuned for Visual Question Answering (VQA). The model jointly reasons over image and text inputs to generate accurate answers.

Python

Updated 3 months ago

BLIP-Hugging-Face-Quickstart-Finetune-Lora

ZhuoxuanCao

❤️35

A modular, easy-to-use framework for fine-tuning BLIP-1 on custom image captioning tasks using LoRA and Hugging Face Transformers. Includes data preprocessing, training scripts, and inference demos — with custom patching on the vision backbone. Ideal for researchers, engineers, and AI enthusiasts building lightweight captioning systems.

MIT

Python

Updated 10 months ago

blipfine-tuninghugging-face+3

Vision-Transformer-Demo

ph-phuc

❤️35

Basic Vision Transformer implementation from Scratch and Fine-tuning pretrained ViT using Tensorflow 2.0 Keras.

Jupyter Notebook

Updated 2 years ago

vision-transformers-demos

DSML-march2025-luis

❤️35

A project showcasing Vision Transformers (ViTs) with demos for image classification and object detection to illustrate how ViTs process visual data differently from CNNs.

Jupyter Notebook

Updated 8 months ago

Vision-Transformer-Demo

m-parvaneh

❤️35

A demo of using vision transformers with PyTorch and the Kinetics400 Dataset

Updated 1 year ago

AI2025-autumn-sofia

wenyi999

❤️30

Vision Transformer Attention Visualization Demo

Python

Updated 4 months ago

demo4image-classification-with-vision-transformer

ISHASHENDRE189

❤️25

No description available

Jupyter Notebook

Updated 2 years ago

vit-work

kjanik70

❤️35

Vision Transformer + TensorRT demos and helpers

Python

Updated 6 months ago

demo-tactile-vision-transformer-for-cross-dom

DelbyIntelligence

🧡55

No description available

Updated 11 hours ago

demo-tactile-vision-fusion-transformer-for-fi

DelbyIntelligence

🧡55

No description available

HTML

Updated 4 days ago

on-device-gui-agent-based-on-vision-transformer-demo

j4ndrw

❤️25

No description available

TypeScript

Updated 10 months ago

transformer-mnist

listar2000

❤️35

Demo codes for a basic vision transformer for MNIST dataset

Python

Updated 2 years ago

ViT-NSFW-WebUI

leecool9669

❤️45

Vision Transformer (ViT) based NSFW image classification WebUI - Gradio demo for content moderation

Python

Updated 2 months ago

owlvit-sample

R-Tatara

🧡50

A simple zero-shot object detection demo using Google's OWL-ViT (Open-World Localization Vision Transformer).

MIT

Python

Updated 1 month ago

Codecon-Computer-Vision

ahirtonlopes

❤️40

Repository with demos on fine-tuning Vision Transformers and using Gemini via Colab (Vertex AI), designed for non-scientists to explore Computer Vision techniques.

Apache-2.0

Jupyter Notebook

Updated 6 months ago

EBT_test

sudheesh4

❤️35

A minimal PyTorch demo of Energy-Based model on MNIST/Fashion-MNIST using a frozen Vision Transformer backbone (DINOv2).

Python

Updated 6 months ago

Vision_Transformers

adrienmanciet-sys

❤️45

Notebook de démo permettant d'implémenter un petit Vision Transformer, visualiser les cartes d'attention et tester d'autres architectures.

Jupyter Notebook

Updated 2 months ago

TinyVit-implementation

dhaaivat

❤️35

An end-to-end implementation of a Tiny Vision Transformer (TinyViT) trained from scratch on the CIFAR-10 dataset. This repository is meant to demystify Vision Transformers by breaking down their components clearly and providing a fully functional training + demo pipeline.

MIT

Jupyter Notebook

Updated 9 months ago

Hardware-Aware-Model-Quantization

minhkhoango

❤️35

A demo on achieving a 4x model size reduction for Vision Transformers on the edge by analyzing hardware-aware performance trade-offs.

Python

Updated 9 months ago

Minds-and-Machines-Lecture

cchandel-dev

❤️40

this repo contains a demo of a custom made object detector that uses vision transformers that was shown at Western Universities Minds & Machines Lecture Series

MIT

Jupyter Notebook

Updated 2 years ago

GitHub Explorer

Search Results

Sparsifiner

vision-transformer-demo

aries-vision-transformer-demo

vision-transformer-sagemaker

transformer-gesture

Thyroid-Nodule-AI

vision-transformer-vit-demo

Nuscene_cuda

ViTFaceClassification

mvtec-vit-anomaly

Multimodal-AI-Visual-Question-Answering

BLIP-Hugging-Face-Quickstart-Finetune-Lora

Vision-Transformer-Demo

vision-transformers-demos

Vision-Transformer-Demo

AI2025-autumn-sofia

demo4image-classification-with-vision-transformer

vit-work

demo-tactile-vision-transformer-for-cross-dom

demo-tactile-vision-fusion-transformer-for-fi

on-device-gui-agent-based-on-vision-transformer-demo

transformer-mnist

ViT-NSFW-WebUI

owlvit-sample

Codecon-Computer-Vision

EBT_test

Vision_Transformers

TinyVit-implementation

Hardware-Aware-Model-Quantization

Minds-and-Machines-Lecture

Sparsifiner

vision-transformer-demo

aries-vision-transformer-demo

vision-transformer-sagemaker

transformer-gesture

Thyroid-Nodule-AI

vision-transformer-vit-demo

Nuscene_cuda

ViTFaceClassification

mvtec-vit-anomaly

Multimodal-AI-Visual-Question-Answering

BLIP-Hugging-Face-Quickstart-Finetune-Lora

Vision-Transformer-Demo

vision-transformers-demos

Vision-Transformer-Demo

AI2025-autumn-sofia

demo4image-classification-with-vision-transformer

vit-work

demo-tactile-vision-transformer-for-cross-dom

demo-tactile-vision-fusion-transformer-for-fi

on-device-gui-agent-based-on-vision-transformer-demo

transformer-mnist

ViT-NSFW-WebUI

owlvit-sample

Codecon-Computer-Vision

EBT_test

Vision_Transformers

TinyVit-implementation

Hardware-Aware-Model-Quantization

Minds-and-Machines-Lecture