본문 바로가기

데이터과학/statistics

예측방법론 - 상관도표, 부분상관도표 2000년 1월 ~ 2012년 12월 실업률의 원계열과 계절조정계열에 대한 다음 물음에 답하시오. 문제4) 월별 실업률 계절조정계열에 대한 상관도표, 부분상관도표를 구하고 그 특징을 서술하시오. (10점) 문제의도) 원계열은 문제에서 제외하고, 계절조정계열에 대해서만 물어 본다는 것이 상관도표를 분석하는 데에 있어 원계열을 그대로 분석하기 보다 계절적 요인이 제거된 상태에서 분석을 하는 것을 의도한 것이라 판단되며, 실업률의 경우 전반적으로 떨어지는 추세에 있으므로, 상관도표의 경우 다소 하락추세를 보이면서 상관성을 보일 것이고, 부분상관의 경우도 튀는 경우가 있을 것으로 예상. 1차결과분석) 원계열은 왜 제시하지 않았는지를 잘 보여주고 있는 점은 3차까지 상관관계가 있음을 잘 보여줌으로써 계절적 요인이.. 더보기
예측방법론 - 스펙트럼 2000년 1월 ~ 2012년 12월 실업률의 원계열과 계절조정계열에 대한 다음 물음에 답하시오. 문제3) 월별 실업률 원계열과 계절조정계열에 대한 스펙트럼을 각각 구하고 그 특징을 변동요인과 연계해서 설명하시오. (10점) 질문의도) 원계열과 계절조정계열의 스펙트럼은 차이가 있을 것이며, 그 차이는 계절적 요인이며 스펙트럼 상으로 높은 주파수 대역의 스파이크가 사라지는 것을 예상한다. 분석결과) "실업율 (원계열)"의 경우 높은 주파수의 큰 값으로 보아 계절적 요인이 보이지만, "실업율 (계절조정계열)" 스펙트럼에서는 계절적 요인이 제거되었음을 알 수 있다 ts_ 더보기
예측방법론 - 시계열도표 2000년 1월 ~ 2012년 12월 실업률의 원계열과 계절조정계열에 대한 다음 물음에 답하시오. 문제2) 월별 실업률 원계열과 계절조정계열에 대한 시계열도표를 그리고 특징을 변동요인을 중심으로 기술하시오. (5점) 1. 자료수집 * 월별 실업률 원계열 : 국가통계포털 * 월별 실업률 계절조정계열 : 한국은행경제통계시스템 * R에서 한글출력문제 : 링크#1, 링크#2 * 변동요인 관련 이해 - 기저효과 : 지난 해의 취업자 수가 특히 높아 이듬해의 상대적 하락현상 - 추석효과 : 설/추석연휴 낮은 구직활동에 의한 취업자 하락현상 - 계절효과#1 : 폭설/한파 등의 이유로 임시직, 일용직 근로자수 하락현상 (계절적 요인에 영향을 많이 받는 직업) - 계절효과#2 : 대학 졸업시즌(정규졸업/코스모스졸업) 구.. 더보기
예측방법론 - 고용률, 실업률 2000년 1월 ~ 2012년 12월 실업률의 원계열과 계절조정계열에 대한 다음 물음에 답하시오. 문제1) 실업률이 무엇인지 기술하시오. (5점) 1. 자료수집 * 실업률이란? - '경제활동인구'에서 '실업자'가 차지하는 비율을 말한다. - '경제활동인구'는 만 14세 이상 인구 중 조사기간 동안 재화나 용역을 생산하기 위해 노동을 제공할 의사와 능력이 있는 사람을 말한다. - '실업자'는 15세(만 14세) 이상 인구중 조사대상주간(매월 15일이 낀 한주간)에 일을 하지 않고, 업체에 이력서를 내는 등 적극적인 구직활동을 하며, 일거리가 생기는 동시에 일을 할 수 있는 사람을 말한다. - 실업률(%) = (실업자수/경제활동인구) x 100 한국의 실업률은 비경제활동인구를 포함시키지 않는다는 점에서 현실.. 더보기
확률분포 (1) 이번에는 '확률분포'라는 개념에 대한 내용인데요, 영어로는 Probability Distribution, 한글로 풀어쓴다고 해도 그다지 직관적이지는 못한 개념인 것 같습니다. 내 나름대로 생각하는 정의는 다음과 같습니다. 확률분포란? 세상의 모든 일(사건)이 일어나는 것에 대하여 수학적인 관점에서 보게된다면 확률로 표현할 수 있을 겁니다. 즉 동전을 던졌을 때에 앞면이 나올 확률 또는 성별이 남성이고 나이가 얼마일 때에 신장 또는 몸무게 등이 어느정도 구간에 있을 확률으로 말입니다. 즉, 이러한 사건이 얼마나 공평하게 발생하는지 또는 그렇지 못한 지에 대한 정보를 수치로 표현하는 것이라 생각합니다. 이러한 표현을 할 때에 몸무게, 신장 등과 같이 연속적인 자료의 경우에는 '연속형분포' 동전 던지기와 같이.. 더보기
엑셀 데이터베이스 기능과 해 찾기 이번 강좌에서는 아무래도 엑셀 중심적으로 진행되는 듯 하는군요, 엑셀에 생각보다 많은 기능들이 있습니다. 그리고 관련도구를 사용하면, 일반적인 통계정보는 쉽게 추출할 수도 있군요... 하지만, 언제 이러한 값들을 실무에서 얼마나 잘 사용할 수 있을지는 저도 잘 모르겠습니다. -_-;; 엑셀을 통한 데이터 분석법 - '데이터 분석' 메뉴 사용 '기술통계법'평균, 표준 오차, 중앙값, 최빈값, 표준 편차, 분산, 첨도, 왜도, 범위, 최소값, 최대값, 합, 관측수간단한 클릭 몇 번으로 파워풀한 기능을 그대로 사용할 수 있습니다. '히스토그램'계급과 빈도수에 따른 히스토그램을 표현할 수 있습니다.데이터의 분포도 편중되는 현상 등을 파악할 수 있습니다. '줄기-잎 그림' (stem-leaf plot)연속된 데이.. 더보기
데이터의 그래프표현과 수치요약 이번에는 통계에서 자주 사용되는 데이터 수치요약에 관한 강좌를 요약했습니다. 그리고 엑셀에서 자주 사용되는 함수 또는 기능을 위주로 작성되어 있습니다. 본 자료는 다른 강좌를 통하여 요약된 정보임을 밝힙니다. 문제가 될 소지가 있는 내용이 있다면, 언제든 삭제토록 하겠습니다. 엑셀의 참조방법 및 기본함수 엑셀의 셀 참조방법 상대참조: AVERAGE(C2:G2)절대참조: AVERAGE($C$2:G$2)혼합참조: AVERAGE($C2:G$2) 엑셀의 기본함수 STDEV (표준편차, Standard deviation)IF (Condition,True,False)Nested IF OK (7개까지 가능)데이터 종류에 따른 그래프의 표현 질적자료, 구성비 : 원그래프항목비교 : 가로막대시간적 추이, 도수분포 : 세.. 더보기
통계학의 기본개념 및 엑셀기초 참고서적 : 패턴인식계론 최근 통계학에 대한 공부가 필요함을 느끼고 강좌를 시간 날 때에 하나씩 듣고 있습니다. 통계학을 독학으로 공부하기에는 조금 버거운 것 같다는 생각도 듭니다. :-) 통계조사 복잡한 사회 또는 집단의 어떤 현상을 수량화하여 객관적이고, 구체적인 특징을 파악하는 과정을 말한다 통계학의 적용과정 문제설정조사 관측정리 요약 -> 정보추출통계적 추론 데이터의 유형 구분 Qualitative data명목척도/순서척도Discrete dataQuantitative data구간척도/비율척도Continuous data 일변량자료 한 개의 구분(변수)에 의해서 구분되는 자료 다변량자료 두 개 이상의 구분(변수)에 의해서 구분되는 자료 모집단이 특정 변량(구분)에 대해서 정규분포임은 어떻게 알 수 있.. 더보기