본문 바로가기

전체 글124

[통계] 03 표본분포(Sampling distribution) 표본분포 기초 이론에 들어가기에 앞서, 어떻게, 왜 표본분포를 통해 모집단의 특성(모수)를 추정할 수 있는지 살펴보겠습니다. 1. [Why] 표본조사는 왜 하는가? -> '전수조사의 대안, 표본조사' 어떤 집단의 평균값을 계산하는 가장 정확한 방법은, 전수조사를 해서 평균을 구하는 것입니다. 하지만, 집단의 크기가 100만, 1000만이라면 과연 전수조사를 할 수 있을까요? 과다한 비용과 시간 때문에 불가능할 것입니다. 따라서 일부만 추출해서 전체를 추정하는 표본조사를 해야합니다. -> '표본조사의 불확실성' : 하지만 과연 하나의 표본(sample)을 추출하여 모집단의 평균을 정확히 추정할수 있을까요? 사실은 불가능합니다. 우연의 일치로 표본의 평균이 모집단의 평균과 같을 수 있지만, 언제나 우연이 따.. 2021. 4. 19.
[통계] 02 정규분포(Normal distribution) 1. 정규분포란? 1) 정규분포의 정의 : 확률분포 X가 아래와 같은 확률밀도함수 f(X)를 가질 때, X는 평균 μ 분산 σ²인 정규분포를 따른다. 2) 정규분포의 특성 ① 정규분포는 여러 모양이 있으며, 서로 평균과 분산이 다를 수 있다. - [Question] 그럼 어떤 분포를 정규분포라고 할 수 있을까? (Answer) 확률밀도함수 f(X)의 넓이가 아래와 같은 특성을 보인다면, 각각 정규분포를 따른다고 할 수 있다 ② 종모양(bell shaped), 대칭형(symmetrical around the mean) ③ 정규분포의 평균(Mean) = 중앙값(Median) = 최빈값(Mode) ④ 정규분포의 확률 계산 ⑤ 정규분포에 평균, 표준편차가 미치는 영향 영향 구체적 설명 평균 수평(좌우) 이동 -.. 2021. 4. 19.
[통계] 01 분포를 어떻게 설명하는가? 01 중심경향치(Central Tendency) - 중심경향치(Central tendency)는 통계학 및 수학에서 자료 데이터 분포의 중심을 보여주는 값으로서 자료 전체를 대표할 수 있는 값을 이르는 말이다. 대표값이라도 한다 (출처: 위키피디아) - 대표적인 중심경향치: 산술평균(mean), 중앙값(median), 최빈값(mode) 1. 최빈값(mode) - 가장 큰 빈도수를 가진 관측치 - 계산(computation)이 아닌 세기(counting)으로 계산할 수 있음. - 주로 범주형 데이터에서 사용된다(most common category) - 하나의 최빈값을 가질때 unimodal, 2개의 최빈값을 가질 때 bimodal이라고 한다. 2. 중앙값(median) - 어떤 주어진 값들을 크기의 순서.. 2021. 4. 19.
[딥러닝기초] 역전파 알고리즘(Back Propagation)1_ Delta Rule 이 글은 연세대학교 정보대학원 기본머신러닝 과목 수강하면서 공부한 내용을 바탕으로 작성한 글입니다. 역전파 알고리즘(Back Propagation) - 모델의 출력값(output)과 기대값(target)을 비교하여 차이(오차/error)를 줄여나가는 방향으로 가중치를 업데이트하는 방법 - 출력층(ouput layer)에서 입력층(input layer) 방향으로 오차(error)를 역으로 전파하면서 가중치를 업데이트 하기 때문에 역전파(Back Propagation) 알고리즘이라고 합니다. - 역전파 알고리즘에 대한 설명은 Delta Rule을 기본으로 시작하여 이를 일반화하여 확장한 역전파알고리즘을 설명하는 순으로 진행하겠습니다. 1. Delta Rule 1) Delta란? : 정답(target)과 출력.. 2021. 4. 16.