KoDoc2Dial 한국어 대화 생성을 위한 문서 기반 대화 데이터셋 KoDoc2dial (paper) 입니다. Data description 주어진 문서를 기반으로 하는 목적 지향 대화 데이터입니다. 대화 4,922개, 문서 487개 각 대화는 약 14턴의 발화로 구성 문서 데이터는 5개의 도메인으로 구성 (ssa, va, dmv, studentaid, cdccov19) References 이 데이터셋은 Doc2Dial을 기반으로 구축하였습니다.