평균, 표준편차, 표준정규분포의 이해와 활용

티스토리 뷰

Daylogs/AI

평균, 표준편차, 표준정규분포의 이해와 활용

ohgyun 2017. 7. 27. 00:22

발생일: 2016.08.29

키워드: 평균, 표준편차, 표준정규분포, 정규분포, 가우시안 분포

문제:

평균과 분산, 표준편차, 정규분포...

학교다닐 때 배웠을 게 분명한데, 세월이 너무 많이 흘렀나보다. 기억이 나지 않는다. ㅠㅠ

기초부터 다시 정리해봤다.

해결책:

# 평균, 분산, 표준편차

데이터 분석, 통계는 의사 결정의 보조 자료

평균과 분산:

- 얼마나 흩어져있는가?

표준편차

- 평균에서 얼마나 흩어져있는가?

- 얼마나 들쭉날쭉한가?

표준정규분포

- 어떻게 분포되어 있나?

정규분포포에서 확률을 구하는 부분이 좀 헷갈린다.

http://math7.tistory.com/45

변동계수

상대적으로 얼마나 들쭉날쭉한가?

http://blog.naver.com/istech7?Redirect=Log&logNo=50151940343

# 모집단과 표본집단

사용자가 1000만인데 전체 사용자를 대상으로 하긴 어렵겠다.

몇 명을 뽑으면 될까?

어떻게 뽑으면 될까?

http://blog.naver.com/istech7/50151725609

# 예제

각 팀의 매출 비교

영업 사원의 매출 비교

영업 사원 A와 B의 매출: 표준편차

명동의 매장과 지방 매장의 매출 비교: 변동계수

카카오의 평균 연봉

페이스북의 친구수

에버노트 일일 작성 노트 수

스토리 친구 수

스토리 구독 채널 수

일일 작성 편친 수 (대상)

# 구글 닥스에서 해보기

표준편차: Standard Deviation -> SDDEV

정규분포: Normal Distribution -> NORMDIST (누적분포로 설정)

특정 구간의 확률을 확인할 수 있다.

평균과 표준편차의 이해

https://support.google.com/docs/answer/3094105

# 주의

표준정규분포는 '종 모양의 형태로 분포할 것이다'라는 가정을 갖고 시작하는 것이다.

실제 종모양 형태의 분포가 아니라면 오차율이 클 수 밖에 없다. 이럴 땐 다른 종류의 분포를 사용해야 한다

통계의 시작은 '가설'이었던 거였구나-

'통계 분포'로 검색. 예) T 분포, 지수 분포 등

http://blog.naver.com/ssacstat/220796201684

저작자표시 비영리 변경금지

공지사항

꿀벌개발일지

티스토리 뷰

평균, 표준편차, 표준정규분포의 이해와 활용

티스토리툴바