Skip to content

A Goal-Oriented Document-Grounded Dialogue Dataset for Korean Dialogue Generation

Notifications You must be signed in to change notification settings

BonbonKim/KoDoc2Dial

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

KoDoc2Dial

한국어 대화 생성을 위한 문서 기반 대화 데이터셋 KoDoc2dial (paper) 입니다.

Data description

주어진 문서를 기반으로 하는 목적 지향 대화 데이터입니다.

  • 대화 4,922개, 문서 487개
  • 각 대화는 약 14턴의 발화로 구성
  • 문서 데이터는 5개의 도메인으로 구성 (ssa, va, dmv, studentaid, cdccov19)

References

이 데이터셋은 Doc2Dial을 기반으로 구축하였습니다.

About

A Goal-Oriented Document-Grounded Dialogue Dataset for Korean Dialogue Generation

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published