본문 바로가기

강좌/web data mining

WDM - Chapter 12. Web Usage Mining (1)

이번 장은 웹서버에서 저장되는 많은 로그 및 기타 정보를 이용하여 데이터 마이닝을 수행하는 것을 소개하고 있습니다. 무엇보다도 요즘 한창 각광을 받고 있는 Collective Intelligence 를 위한 밑거름이 될 수 있는 유용한 정보라고 할 수 있겠습니다.

Web Usage Mining:
automatic discovery and analysis of patterns in clickstream and associated data collected or generated as a result of user interactions with web resources on one or more web sites
이용자가 웹 상의 자료를 어떻게 이용하고 있는지 또는 어떠한 의도(intention)을 가지고 행동하는 지에 대한 자동 패턴인식 또는 발견

three stages:

  1. Data collection and pre-processing
    1. Raw data로 부터 필터 및 정재
  2. Pattern discovery
    1. using statistics, database, machine learning
    2. typical behavior of users
  3. Pattern analysis
    1. aggregate user model could be an input of ...
      1. recommendation engines
      2. visualization tool
      3. web analytics
      4. report generation tool

ref links:

  1. Web mining: information and pattern discovery on the world wide web
  2. Web usage mining discovery and applications of usage patterns from web data
  3. Frequent pattern mining on the web log data