본문 바로가기

데이터과학

데이터마이닝의 개요 (2) 지난번 포스팅에 이어 '데이터마이닝'의 연구분야 및 기법에 대한 내용입니다. 데이터마이닝의 연구분야 KDD, 기계학습, 패턴인식, 뉴로컴퓨팅, 통계학 데이터마이닝 활용분야 CRM, 신용평가, 품질개선, 부정행위 적발, 이미지 분석, 생명정보학 고객관계관리에서의 전략 목표마케팅 (target marketing) 고객 세분화 (segementation) 고객 이탈분석 (churn analysis) 교차분석 (cross analysis) 시장바구니 분석 (market basket analysis) 교차분석(Crosstabulation Analysis) 범주형 자료(명목척도)를 두 개 혹은 그 이상의 변수에 대한 결합분포(결합빈도)를 나타내는 분할표를 보여주는 것. 즉, 특정 속성에 대하여 집단별로 어떤 관련성.. 더보기
데이터의 그래프표현과 수치요약 이번에는 통계에서 자주 사용되는 데이터 수치요약에 관한 강좌를 요약했습니다. 그리고 엑셀에서 자주 사용되는 함수 또는 기능을 위주로 작성되어 있습니다. 본 자료는 다른 강좌를 통하여 요약된 정보임을 밝힙니다. 문제가 될 소지가 있는 내용이 있다면, 언제든 삭제토록 하겠습니다. 엑셀의 참조방법 및 기본함수 엑셀의 셀 참조방법 상대참조: AVERAGE(C2:G2)절대참조: AVERAGE($C$2:G$2)혼합참조: AVERAGE($C2:G$2) 엑셀의 기본함수 STDEV (표준편차, Standard deviation)IF (Condition,True,False)Nested IF OK (7개까지 가능)데이터 종류에 따른 그래프의 표현 질적자료, 구성비 : 원그래프항목비교 : 가로막대시간적 추이, 도수분포 : 세.. 더보기
통계학의 기본개념 및 엑셀기초 참고서적 : 패턴인식계론 최근 통계학에 대한 공부가 필요함을 느끼고 강좌를 시간 날 때에 하나씩 듣고 있습니다. 통계학을 독학으로 공부하기에는 조금 버거운 것 같다는 생각도 듭니다. :-) 통계조사 복잡한 사회 또는 집단의 어떤 현상을 수량화하여 객관적이고, 구체적인 특징을 파악하는 과정을 말한다 통계학의 적용과정 문제설정조사 관측정리 요약 -> 정보추출통계적 추론 데이터의 유형 구분 Qualitative data명목척도/순서척도Discrete dataQuantitative data구간척도/비율척도Continuous data 일변량자료 한 개의 구분(변수)에 의해서 구분되는 자료 다변량자료 두 개 이상의 구분(변수)에 의해서 구분되는 자료 모집단이 특정 변량(구분)에 대해서 정규분포임은 어떻게 알 수 있.. 더보기
데이터마이닝의 개요 (1) 지난 주에 우연히 데이터마이닝 관련 강좌를 하나 듣고 있습니다. 시간이 날 때마다 한 강좌씩 듣고 정리를 해보는 것도 좋겠다 싶어서 시작합니다. 데이터마이닝의 도입배경 통신, 보험, 금융권 에서의 고객을 이해, 관리를 위한 CRM으로 시작 데이터마이닝이란? 대용량의 데이터베이스로 부터, 의미있는 정보(관계, 패턴, 규칙 등)를 찾는 것 OLTP vs OLAP vs Data Mining 데이터베이스를 활용한 분야인데, 누구를 대상으로 한 것인지에 따라 조금씩 달라지는 것 같습니다. 이용자를 위한 어플리케이션 또는 절차가 OLTP (On-Line Transaction Processing) 관리자를 위한 것이 OLAP (On-Line Analytical Processing) 정책결정자를 위한 것이 Data M.. 더보기