본문 바로가기

프로젝트/opinion mining

Opinion Mining을 활용한 미니 프로젝트 (1)

Bing Liu 교수님의 Web Data Mining 책의 11장에서 소개되고 있는 Opinion Mining 에 대한 자그만한 프로젝트를 해볼까 합니다. 뭐 거창하게 시작하는 것도 우습고, 우선 경험적으로 프로토타이핑 정도로 시작하려고 합니다.

우선, 아래와 같은 일정으로 진행하면 어떨까 생각하고 있습니다.

범위 : 11.1 Sentiment Classification
목적 : 특정 페이지가 Evaluative document 인지를 구분하는 시스템 구현
기간 : 4/13(일) ~ 4/21(화)

상세일정 :
  1. Text summarization
    1. 책에서 언급된 방법 들 분석 및 요약
  2. Thesis survey and summarization
    1. 3가지 기법 중에서 한 가지 선택
    2. 선택한 기법의 원 논문 읽기 및 분석
  3. Selection methodology
    1. 해당 논문에서 사용하고 있는 기법 분석
  4. Corpus candidates survey
    1. 리뷰관련 사이트 서베이 및 분석
    2. 레뷰
    3. 디씨인사이드
    4. 세티즌
    5. 스사모
    6. 노트북인사이드
    7. 엠피나비
    8. 투데이스피피시
    9. DMB유저
  5. Candidate selection
    1. 적용하기 가장 적절한 후보 선택

이후일정 및 과제 : 4/22(수) ~ 4/30(수)
  1. Crawling corpus
  2. Contents analysis
  3. Vectorizing data
  4. Indexing data
  5. Retrieving information