본문 바로가기

통계3

[답답해서 내가 정리한다] 중심극한정리 central limit theorem 일단 우리가 아는 중심극한정리를 여기에 적어 본다. 표본평균의 표본분포에 관한 성질 모집단의 분포가 정규분포 $N(\mu,\sigma^2)$ 일 때 표본평균 $\bar{X}$ 는 정규분포 $N(\mu,\frac{\sigma^2}{n})$ 을 따른다. 한편 모집단의 분포가 정규분포가 아닌 경우에는 위의 사실이 성립하지 않는다고 한다. 하지만! 표본의 크기 n 이 충분히 클 때에는 임의의 모집단으로 부터의 표본평균이라 하더라도 그 분포가 정규분포에 가깝다는 것이 알려져 있는데 이것이 중심극한정리이다. 이것이 무슨 의미인지 간단한 python 코드와 그림으로 정리해 보겠다. import numpy as np import matplotlib.pyplot as plt nnsize=10000 x1=np.random.. 2023. 10. 16.
포아송 분포 유도: 이항 분포로부터 (Poisson distribution: approximation to Binomial) 이항 분포로부터 포아송 분포를 유도할 수 있다. 포아송 분포는 다음과 같은 상황에서의 이항 분포의 근사식이라고 할 수 있다. 가정: 확률 $\theta$ 는 작고 시행횟수 $ n $ 은 매우 클 경우 $ \lambda = n\theta $ 로 둔다. 여기서 우리가 알아야 할 것은 $ n $ 은 무한으로 발산하고 $ \theta $ 는 0으로 수렴하고 있다보니 $ \lambda $ 는 어떤 상수에 수렴할 것이라는 것이다. 그리고 이항 분포 $ Bi(x|\theta, n) = {n \choose x}\theta^x(1-\theta)^{n-x} $ 임을 알고 있다. 그럼 여기에서부터 포아송 분포 유도를 시작한다. 다음 식과 같이 이항 분포를 전개하면 $$ \begin{matrix} Bi(k|\theta,n) .. 2023. 7. 9.
multidimensional scaling (MDS) 의 개념과 PCA 와의 차이점 bing 에게 물었다. "The concept of MDS and what is the difference between PCA and MDS" 아래는 그 답이다. In this blog post, I will explain the concept of multidimensional scaling (MDS) and how it differs from principal component analysis (PCA). Both methods are used for dimensionality reduction, which means transforming a high-dimensional data set into a lower-dimensional representation that preserves some o.. 2023. 5. 25.