티스토리 뷰
발생일: 2016.08.29
키워드: 평균, 표준편차, 표준정규분포, 정규분포, 가우시안 분포
문제:
평균과 분산, 표준편차, 정규분포...
학교다닐 때 배웠을 게 분명한데, 세월이 너무 많이 흘렀나보다. 기억이 나지 않는다. ㅠㅠ
기초부터 다시 정리해봤다.
해결책:
# 평균, 분산, 표준편차
데이터 분석, 통계는 의사 결정의 보조 자료
평균과 분산:
- 얼마나 흩어져있는가?
표준편차
- 평균에서 얼마나 흩어져있는가?
- 얼마나 들쭉날쭉한가?
표준정규분포
- 어떻게 분포되어 있나?
정규분포포에서 확률을 구하는 부분이 좀 헷갈린다.
변동계수
상대적으로 얼마나 들쭉날쭉한가?
# 모집단과 표본집단
사용자가 1000만인데 전체 사용자를 대상으로 하긴 어렵겠다.
몇 명을 뽑으면 될까?
어떻게 뽑으면 될까?
# 예제
각 팀의 매출 비교
영업 사원의 매출 비교
영업 사원 A와 B의 매출: 표준편차
명동의 매장과 지방 매장의 매출 비교: 변동계수
카카오의 평균 연봉
페이스북의 친구수
에버노트 일일 작성 노트 수
스토리 친구 수
스토리 구독 채널 수
일일 작성 편친 수 (대상)
# 구글 닥스에서 해보기
표준편차: Standard Deviation -> SDDEV
정규분포: Normal Distribution -> NORMDIST (누적분포로 설정)
특정 구간의 확률을 확인할 수 있다.
# 주의
표준정규분포는 '종 모양의 형태로 분포할 것이다'라는 가정을 갖고 시작하는 것이다.
실제 종모양 형태의 분포가 아니라면 오차율이 클 수 밖에 없다. 이럴 땐 다른 종류의 분포를 사용해야 한다
통계의 시작은 '가설'이었던 거였구나-
'통계 분포'로 검색. 예) T 분포, 지수 분포 등
반응형
댓글
공지사항