G2P-DDM

Project Link | Demo Link | Supplementary Materials

This repository contains the implementation of our paper "G2P-DDM: Generating Sign Pose Sequence from Gloss Sequence with Discrete Diffusion Model".

requirements

pip install -r requirements.txt

Traning

Stage 1: Pose-VQVAE for Reconstruction

python3 -m train_pose_vqvae \
    --gpus 8 --gpu_ids "0,1,2,3,4,5,6,7" \
    --init_lr 2e-4 \
    --embedding_dim 128 \
    --batchSize 12 \
    --n_codes 1024 \
    --data_path "Data/ProgressiveTransformersSLP" \
    --vocab_file "Data/ProgressiveTransformersSLP/src_vocab.txt" \
    --resume_ckpt "" \
    --default_root_dir "experiments/pose_vqvae/separate" \
    --max_steps 300000 \
    --max_frames_num 300 \

Stage 2: Discrete Diffusion Model for Latent Prior Learning

python3 -m train_text2pose --gpus 4 --gpu_ids "0,1,2,3" \
    --stage2_model "configs/stage2_model/vq_diffusion_codeunet.yaml"  \
    --default_root_dir "experiments/text2pose/vq_diffusion_codeunet"

Inference

python3 -m train_text2pose --gpus 8 --gpu_ids "0,1,2,3,4,5,6,7" \
    --stage2_model "configs/stage2_model/vq_diffusion_codeunet.yaml"  \
    --default_root_dir "experiments/text2pose/test"

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
backmodels		backmodels
configs		configs
data		data
data_phoneix		data_phoneix
imgs		imgs
models_phoneix		models_phoneix
modules		modules
stage1_models		stage1_models
stage2_models		stage2_models
util		util
.DS_Store		.DS_Store
ICCV9970_supplementary.pdf		ICCV9970_supplementary.pdf
README.md		README.md
data_compare.py		data_compare.py
test_text2pose.sh		test_text2pose.sh
train_backtranslate.py		train_backtranslate.py
train_backtranslate.sh		train_backtranslate.sh
train_pose_vqvae.py		train_pose_vqvae.py
train_pose_vqvae.sh		train_pose_vqvae.sh
train_text2pose.py		train_text2pose.py
train_text2pose.sh		train_text2pose.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

G2P-DDM

requirements

Traning

Stage 1: Pose-VQVAE for Reconstruction

Stage 2: Discrete Diffusion Model for Latent Prior Learning

Inference

About

Releases

Packages

Languages

caochengchen/G2P-DDM

Folders and files

Latest commit

History

Repository files navigation

G2P-DDM

requirements

Traning

Stage 1: Pose-VQVAE for Reconstruction

Stage 2: Discrete Diffusion Model for Latent Prior Learning

Inference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages