Setting up training pipeline

See the readme from our ICLR 2021 work for details on setting up the basic training pipeline.

Commands

make download-datasets
make normalize-datasets

make apply-transforms-sri-py150
make apply-transforms-csn-python
make extract-transformed-tokens

bash experiments/normal_seq2seq_train.sh

bash experiments/normal_adv_train.sh

bash scripts/augment.sh

Pretrain a seq2seq encoder on a sri/py150 augmented dataset, finetune the encoder on sri/py150, and test the final model on normal and adversarial datasets.

bash experiments/finetune_and_test_0.sh

Pretrain a seq2seq encoder on sri/py150 and run adversasrial training starting from the pretrained model.

bash experiments/pretrain_adv_train.sh