Todo

Rapport
Sur quel dataset? Idem que l'article/Réduction de types d'objets/Réduction de résolution
Quelle application? Quelle interactivité?
- Visualisation des tSNE?
- Appli qui tourne juste sur CPU laptop? Ou faire aussi une partie plus complexe?
  - Plutôt faire au moins un gros modèle efficace, pré-entraîné avec les poids importés dans streamlit, et un petit modèle entraînable laptop CPU même si réusltats dégeulasses
- Idées interaction :
  - Visualisation des tSNE, visualisation de ce que le MLP voit, et lien entre les 2?
  - Un modèle classique, un modèle avec zero-shot ?
  - Question "fait main" avec un drop down menu pour poser des questions sur l'image
Ne pas oublier de mettre un graph de comparaison de performance sur jeux de donnée classiques?
Docu avec sphinx? Voir quel format de docstrings, extension vscode docstrings auto?
Problème du training GPU poor:
- Checkpointing: Make sure your training loop saves progress frequently so you can resume after a session timeout.
- Mixed Precision: Leverage PyTorch's AMP to take advantage of the T4's tensor cores.

Requirements

Python 3.12.8
Other dependencies listed in requirements.txt

References

The code in this repo is heavily inspired by the repos Film and Clever-iep
Distill: Feature wise transformations
Arxiv: FiLM: Visual Reasoning with a General Conditioning Layer

Get the data

To download the data, run:

mkdir data
wget https://dl.fbaipublicfiles.com/clevr/CLEVR_v1.0.zip -O data/CLEVR_v1.0.zip
unzip data/CLEVR_v1.0.zip -d data

To preprocess the data from pngs to a h5 file for each train/val/test set, run the following code. The data will be the raw pixels, there are options to extract features with the option --model "resnet101 (1024x14x14 output), or to set a maximum number of X processed images --max_images X (check extract_features.py).

bash scripts/extract_features.sh

To preprocess the questions, execute this script:

bash scripts/preprocess_questions.sh

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
docs		docs
scripts		scripts
vr		vr
.gitignore		.gitignore
LICENSE		LICENSE
READme.md		READme.md
notice_venv.md		notice_venv.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Todo

Requirements

References

Get the data

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 3

Uh oh!

Languages

License

Leob000/M1S2_Project_DL

Folders and files

Latest commit

History

Repository files navigation

Todo

Requirements

References

Get the data

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 3

Uh oh!

Languages

Packages