PROBLEM

문제목록
ScienceON 사용자 행동 예측
문제개요

1) 정의: ScienceON 사용자의 로그 데이터를 분석하여 행동 패턴을 분석하고 이를 기반으로 사용자의 행동을 예측하는 모델을 개발

2) 목적 및 배경

ScienceON은 과학기술정보, 정보분석서비스, 연구인프라를 연계·융합하여 연구자가 필요로 하는 지식인프라를 한곳에서 제공하는 서비스입니다. ScienceON은 특히 논문, 특허, 보고서 등 과학기술정보 획득을 위한 다양한 서비스를 지원해 왔으며 이용자 특성에 맞는 최적화된 개인화 서비스를 제공하기 위한 기술을 개발하고 있습니다. 이용자 특성에 맞는 정보를 제공하기 위해서는 사용자의 행동예측 기술과 콘텐츠를 특성별로 클러스터링하는 기술을 연계하여 적합한 콘텐츠를 추천할 수 있는 기술이 필요합니다. 이에, ScienceON 로그에 저장된 사용자별 검색어, 열람한 콘텐츠, 이용한 기능 등을 분석하여 사용자의 행동을 예측하는 기술을 공모하고자 하며, 결과물은 ScienceON 사용자에게 최적화된 콘텐츠를 추천하는 서비스에 활용할 계획입니다.

최종 성과물

1) 결과의 성능

- 모델에 적합한 사용자 행동 패턴 정답 셋을 자율적으로 생성하여 자체 정확도 측정

※ 다음 행동이 없이 종료되는 경우의 예측까지 포함하여 정확도 측정

2) 결과물

- 사용자별 행동 입력 값 + 예측 행동 출력 값

- 빈발 패턴

※ ScienceON 사용자의 다양한 전공과 전문성에 따라 예측에 대한 정확성이 낮을 수 있음을 고려하여 도출된 빈발 패턴을 결과물로 함께 제출

활용 데이터

1) 데이터명/종류

- ScienceON이 제공하는 로그 데이터 활용

2) 유형, 포맷, 용량/건수 등 문제해결을 위해 필요한 설명

- 해당 데이터는 CSV 파일 형태로 제공

- 제공항목은 아래와 같음

<입력 데이터>

입력

사용자IP

가상 값

로그등록시간

이전URL

요청URL

검색구분

검색질의어

검색기능 이용인 경우

조회콘텐츠

상세보기 이용인 경우

※ URL별 서비스명 제공예정 (예:’/slogin/PORLonForm.do’ = ‘로그인’, ‘sch/selectPORSrchTotal.do’=’통합검색‘)

※ 서비스 종류는 로그인, 콘텐츠별 검색, 상세보기, 원문보기, 다운로드 등으로 제한 예정

맨 위로