Replies: 1 comment
-
데이터 오류 탐지를 위한 EDA : 성재/민서 사회/국어 분류를 위한 EDA : 가연/수진 데이터 출처 및 사전 지식 기반 EDA: 예서/성민 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
제안
우선 데이터셋 파악을 위한 기초 EDA를 진행합니다. 이후 세부 목적에 맞게 추가적인 분석을 진행하는 구조를 제안합니다.
실제 작업을 수행하는 것이 아닌 작업 수행에 필요한 배경을 데이터를 통해 확인하는 과정이라고 보면 되겠습니다.
Pros
Cons
Example
데이터 오류를 탐지하고 수정하는데 목적이 있습니다.
사회 국어 문제를 직접 라벨링하여 분류를 위해 학습에 사용하는 등을 시도할 수 있습니다.
Ko-MMLU, Multilingual MMLU, KLUE-MRC, 수능 데이터를 직접 사용할 수는 없지만 성공적으로 moking하기 위해서 해당 데이터 셋의 특징은 알야한다고 생각합니다.
6 votes ·
Beta Was this translation helpful? Give feedback.
All reactions