본문 바로가기

데이터과학/statistics

엑셀 데이터베이스 기능과 해 찾기

이번 강좌에서는 아무래도 엑셀 중심적으로 진행되는 듯 하는군요, 엑셀에 생각보다 많은 기능들이 있습니다. 그리고 관련도구를 사용하면, 일반적인 통계정보는 쉽게 추출할 수도 있군요... 하지만, 언제 이러한 값들을 실무에서 얼마나 잘 사용할 수 있을지는 저도 잘 모르겠습니다. -_-;;

  1. 엑셀을 통한 데이터 분석법 - '데이터 분석' 메뉴 사용
    1. '기술통계법'
      1. 평균, 표준 오차, 중앙값, 최빈값, 표준 편차, 분산, 첨도, 왜도, 범위, 최소값, 최대값, 합, 관측수
      2. 간단한 클릭 몇 번으로 파워풀한 기능을 그대로 사용할 수 있습니다.
    2. '히스토그램'
      1. 계급과 빈도수에 따른 히스토그램을 표현할 수 있습니다.
      2. 데이터의 분포도 편중되는 현상 등을 파악할 수 있습니다.
    3. '줄기-잎 그림' (stem-leaf plot)
      1. 연속된 데이터의 분포 형태 표현
      2. 히스토그램과 유사하지만, 수치로 표현되어 있습니다.
    4. '상자 그림' (box plot)
      1. 다섯숫자요약을 이용하여 데이터 분포형태를 표현
      2. 이상점 확인 및 여러상자를 비교하여 속성간의 관계도 분석이 가능
      3. MIN, LOWER QUARTILE, MEDIAN, UPPER QUARTILE, MAX
    5. '부분합' 기능
      1. 반드시 정렬되어 있는 필드를 사용해야만 한다
      2. 데이터베이스의 Group-by 기능과 유사하다
    6. '목표값 찾기' 기능
      1. 수식의 결과값이 목표하는 값과 같아지도록 입력값을 조정하는 기능
        1. 미지수가 하나인 경우
        2. 아래에 간단한 예제를 통하여 이해할 수 있음
    7. '해 찾기' 기능
      1. 입력변수가 2개 이상인 경우 최적값을 만드는 입력변수 값들을 찾는 기능
  1. 'KESS'를 이용한 데이터 분석법
    1. KESS (Korean Educational Statistics Software)
      1. 기술통계, 그래프, t-검정, 모비율검정, 회귀분석, 분산분석 등이 가능
      2. 엑셀 VBA로 만든 파일(.xla)을 열게되면, '통계분석' 메뉴가 추가된다.

문제) 아래와 같은 조건에서 이익률을 15%로 낮추려면 소매점의 판매가는?
  • 디스켓단가: 300원(공장도), 400원(소비자)
  • 한달 평균 : 10,000장 판매
  • 총수입 = 판매가 * 판매개수 = 4,000,000원
  • 고정비용 = 250,000원
  • 총비용 = 원가 * 판매개수 + 고정비용 = 3,250,000원
  • 이익 = 총수입 - 총비용 = 750,000원
  • 이익률 = 이익/비용 (19%)
  • 수식(이익률), 목표값(15%), 값을 바꿀셀(판매가)

정답) 판매단가를 400원에서 382원으로 내리면, 수익률이 15%로 떨어지게 됩니다.
우선 아래의 좌측 그림과 같이 엑셀을 작성하고, 우측그림과 같이 목표값을 설정합니다.
사용자 삽입 이미지 사용자 삽입 이미지

실행하게되면, 아래와 같은 해를 구할 수 있습니다.
사용자 삽입 이미지 사용자 삽입 이미지

그런데 왜 수익률을 떨어뜨릴려고 하는 것인지 문제가 조금 이해가 안되긴 합니다만...
여하튼 엑셀의 '목표값 찾기'를 통하여 간단히 찾을 수 있습니다.


참고로 박스플롯 그림을 위키피디어에서 다운로드 받아 첨부해봅니다.
사용자 삽입 이미지

생각보다 이미지 캡쳐링 하는데에 너무 많은 시간을 소모했습니다.
글 쓰는 것 보다 이미지 캡쳐하고 올리고 하는데에만 30분을 털썩~~ 담부턴 이미지는 자제해야 겠습니다. -_-;;;

'데이터과학 > statistics' 카테고리의 다른 글

확률분포 (1)  (0) 2008.04.10
데이터의 그래프표현과 수치요약  (0) 2008.03.23
통계학의 기본개념 및 엑셀기초  (0) 2008.03.20