WS-DAN.PyTorch

A neat PyTorch implementation of WS-DAN (Weakly Supervised Data Augmentation Network) for FGVC (Fine-Grained Visual Classification). (Hu et al., "See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visual Classification", arXiv:1901.09891)

NOTICE: This is NOT an official implementation by authors of WS-DAN. The official implementation is available at tau-yihouxiang/WS_DAN (and there's another unofficial PyTorch version wvinzh/WS_DAN_PyTorch).

Innovations

Data Augmentation: Attention Cropping and Attention Dropping
Bilinear Attention Pooling (BAP) for Features Generation
Training Process and Testing Process

Performance

PyTorch experiments were done on a Titan Xp GPU (batch_size = 12).

Dataset	Object	Category	Train	Test	Accuracy (Paper)	Accuracy (PyTorch)	Feature Net
FGVC-Aircraft	Aircraft	100	6,667	3,333	93.0	93.28	inception_mixed_6e
CUB-200-2011	Bird	200	5,994	5,794	89.4	88.28	inception_mixed_6e
Stanford Cars	Car	196	8,144	8,041	94.5	94.38	inception_mixed_6e
Stanford Dogs	Dog	120	12,000	8,580	92.2	89.66	inception_mixed_7c

Usage

WS-DAN

This repo contains WS-DAN with feature extractors including VGG19('vgg19', 'vgg19_bn'), ResNet34/50/101/152('resnet34', 'resnet50', 'resnet101', 'resnet152'), and Inception_v3('inception_mixed_6e', 'inception_mixed_7c') in PyTorch form, see ./models/wsdan.py.

net = WSDAN(num_classes=num_classes, M=num_attentions, net='inception_mixed_6e', pretrained=True)
net = WSDAN(num_classes=num_classes, M=num_attentions, net='inception_mixed_7c', pretrained=True)
net = WSDAN(num_classes=num_classes, M=num_attentions, net='vgg19_bn', pretrained=True)
net = WSDAN(num_classes=num_classes, M=num_attentions, net='resnet50', pretrained=True)

Dataset Directory

FGVC-Aircraft (Aircraft)

-/FGVC-Aircraft/data/
                └─── images
                        └─── 0034309.jpg
                        └─── 0034958.jpg
                        └─── ...
                └─── variants.txt
                └─── images_variant_trainval.txt
                └─── images_variant_test.txt

CUB-200-2011 (Bird)

-/CUB-200-2011
        └─── images.txt
        └─── image_class_labels.txt
        └─── train_test_split.txt
        └─── images
                └─── 001.Black_footed_Albatross
                        └─── Black_Footed_Albatross_0001_796111.jpg
                        └─── ...
                └─── 002.Laysan_Albatross
                └─── ...

Stanford Cars (Car)

-/StanfordCars
      └─── cars_test
                └─── 00001.jpg
                └─── 00002.jpg
                └─── ...
      └─── cars_train
                └─── 00001.jpg
                └─── 00002.jpg
                └─── ...
      └─── devkit
                └─── cars_train_annos.mat
      └─── cars_test_annos_withlabels.mat

Stanford Dogs (Dog)

-/StanfordDogs
      └─── Images
          └─── n02085620-Chihuahua
                  └─── n02085620_10074.jpg
                  └─── ...
          └─── n02085782-Japanese_spaniel
                  └─── ...
      └─── train_list.mat
      └─── test_list.mat

Run

git clone this repo.
Prepare data and modify DATAPATH in datasets/<abcd>_dataset.py.
Set configurations in config.py (Training Config, Model Config, Dataset/Path Config):
```
tag = 'aircraft'  # 'aircraft', 'bird', 'car', or 'dog'
```
$ nohup python3 train.py > progress.bar & for training.
$ tail -f progress.bar to see training process (tqdm package is required. Other logs are written in <config.save_dir>/train.log).
Set configurations in config.py (Eval Config) and run $ python3 eval.py for evaluation and visualization.

Attention Maps Visualization

Code in eval.py helps generate attention maps. (Image, Heat Attention Map, Image x Attention Map)

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
datasets		datasets
images		images
models		models
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
eval.py		eval.py
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

WS-DAN.PyTorch

Innovations

Performance

Usage

WS-DAN

Dataset Directory

Run

Attention Maps Visualization

About

Releases

Packages

Languages

License

Peiqi00/WS-DAN.PyTorch

Folders and files

Latest commit

History

Repository files navigation

WS-DAN.PyTorch

Innovations

Performance

Usage

WS-DAN

Dataset Directory

Run

Attention Maps Visualization

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages