2023-07-28 10:29:30 | 최*선
과학기술 논문 원문 정보로부터 주제 분류하기(Top3) 데이터셋 논문 중복 여부 문의
안녕하세요,
'과학기술 논문 원문 정보로부터 주제 분류하기(Top3)' 문제에서 제공되는 데이터셋에서
1) 논문 연구분야 분류 데이터 (국내 논문 3만 건을 대상으로 전문가가 연구분야를 분류한 데이터셋)
2) 국내 논문 전문 텍스트 데이터셋 (국내 논문 481,578건 PDF를 기계학습이 가능한 텍스트 형태로 구축)
--> 이 두 가지 데이터셋의 논문에 중복이 있는 것인지, 중복이 없는 것인지 문의드립니다.
감사합니다.
'과학기술 논문 원문 정보로부터 주제 분류하기(Top3)' 문제에서 제공되는 데이터셋에서
1) 논문 연구분야 분류 데이터 (국내 논문 3만 건을 대상으로 전문가가 연구분야를 분류한 데이터셋)
2) 국내 논문 전문 텍스트 데이터셋 (국내 논문 481,578건 PDF를 기계학습이 가능한 텍스트 형태로 구축)
--> 이 두 가지 데이터셋의 논문에 중복이 있는 것인지, 중복이 없는 것인지 문의드립니다.
감사합니다.