통계 기호 l
상징 | 기호 이름 | 의미/정의 |
P ( x ) | 확률 밀도 함수 (pdf-probability density function ) |
P ( a ≤ x ≤ b ) = ∫ f ( x ) dx |
P ( A ) | 확률 함수 | 사건 A의 확률 |
P ( A ∩ B ) | 사건 교차 확률 | 사건 A와 B의 확률 |
P ( A ∪ B ) | 사건 합동 확률 | 사건 A 또는 B의 확률 |
P ( A | B ) | 조건부 확률 함수 | 이벤트 B가 발생한 경우 이벤트 A의 확률 |
Σ | 통계에서는 수열의 합. | 시그마. 수열의 모든 항을 더한것 더하다는 뜻 sum 에서 유래하여 그리스 기호 시그마로 s로 나타낸다. |
F ( x ) | 누적 분포 함수 (cdf-Cumulative distribution function) |
F ( x ) = P ( X ≤ x ) |
E ( X ) | 기대값 | 통계에서 기대값은 평균과 같다고 생각하면 된다. 가능한 값마다 확률을 곱해서 모두 더한 것이다. 확률변수 X의 평균으로 보통E(x)라고 쓴다. |
exp(x) | 기대값 | exp는 expectation, expected value이다. |
∫ | 적분 (인테그럴) |
적분. 적분이란 정의된 함수의 그래프와 그 구간으로 둘러싸인 도형의 넓이를 구하는 것이다.s자 알파벳으로 오인할 수도 있는데 적분 기호는 길쭉한 기호 이다. |
E ( X | Y ) | 조건부 기대 | Y가 주어진 임의 변수 X의 기대 값 예시 ) P ( X | Y = 2 ) = 5 |
var ( X ) | 변화,변수,분산 (Variance) | 랜덤 변수 X의 분산 |
σ | 모수 | 표본 관측에 의해 구하고자 하는 모집단에 대한 정보 |
μ | 모평균(뮤) | 모집단의 평균 |
σ² | 모분산 | 관측값에서 모 평균을 빼고 그것을 제곱한 값을 모두 더한것을 n-1로 나눈것이다. 관찰값들이 얼마나 퍼져 있는지를 구하는 방법이다. 분산을 알기 위해서는 먼저 평균을 알아내고, 각각 관찰값들과 평균 사이의 거리(distance)를 구하기 위해 관찰값에서 평균을 빼게 된다. 이때 평균이 음의 수인것은 평균을 내기 어려워서 과거에는 양의 수로 모두 바꿔서 계산을 하려고 제곱을 하게 됐다. |
σ | 모표준편차 | 모분산σ²에 루트를 씌운것이다. 위의 모분산 설명을 보면 모표준편차에서 왜 루트를 씌우는지 알 수 있는데 평균을 계산하기 위해 제곱했던것에 다시 루트를 씌워서 원래 값으로 돌리기 위함이다. |
Ω | 모집단, 표본공간(sample space)(오메가) |
모집단이나 표본공간 모든 사건의 수를 오메가로 표현한다.확률에서는 표본공간(sample space)를 말한다.표본공간이란 실험의 결과 하나하나를 모두 모은것 |
표준 (X ) | 표준편차 | 랜덤 변수 X의 표준 편차 |
s | 표본표준편차 (Standard deviation) |
|
s² | 표본분산 | 모평균(모집단의 평균)을 추정하기 위한 추정량, 확률표본의 표본값 |
x̄ |
표본평균(sample mean) | 확률표본의 평균값. 표본통계량이란 표본평균이나 표본분산처럼 표본의 특성을 나타내는 대푯값 을 말한다. X 언더바로 읽는다. |
N ( μ , σ ) | 정규분포 ,가우스분포 | |
n ! | 계승 (팩토리얼) | n ! = 1⋅2⋅3⋅ ⋅ ... N 계승은 자연수만을 정의역으로 둔다. 모든 자연수 항을 곱한다. 팩토리얼이라고 읽는다. 0!은 특별히 1로 생각하면 된다. |
n P k | 순열 | |
기하 ( p ) | 기하학적 분포 | f ( k ) = p (1 -p ) k |
X ~ | X 분포 | 랜덤 변수 X의 분포 |
iid | 독립분포 | |
χ² | 카이제곱분포 | |
p-value | p값 | 유의확률, 유의수준, 제1종 오류가 발생할 확률이다. 가설검정에서 쓴다. |
lim n→∞ |
총 시행횟수(무한대로 표현) | 변수가 일정한 법칙에 따라 정해진 값에 한없이 가까워질 때의 값이다. 함수(또는 수열)의 값이 어떠한 값으로 가까워지거나, 또는 점점 멀어지는 움직임을 나타낸다. 연속성을 가진 연속형 확률변수를 정의할때 쓴다. |
λ | 푸아송분포 (람다) |
포아송분포에서 정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값이다. 람다: 정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값 |
Γ | 감마 | 모든 항을 곱할때 쓰는 기호이다. 팩토리얼처럼 0이하로는 정의하지 않는다. 계승함수(팩토리얼)의 성격을 가지고 있다. [예시] Γ(n)=(n−1)! (nn이 자연수일 경우) Γ(n+1)=Γ(n)Γ(n+1)=nΓ(n) Γ(1)=1Γ(1)=1 |
∆ | 델타 | 최소값부터~최대값까지 |
^ | 곱셈 | 캐럿이라고 읽는다. |
∏ | 곱연산 | 계속 곱해 나가라는 뜻 |
r | 피어슨 상관계수 | 표본 상관계수 계산방식. 적률상관계수, 연속형변수, 정규성 가정에 대부분 많이 사용 |
𝜌 | 스피어만 상관계수 | 로우라고 읽음. 순위상관계수, 순서형 변수, 비모수적 방법, 순위를 기준으로 상관관계 측정, 서열척도 P 모양과 비슷해 보일 수 있다. |
COV | 공분산(covariance) | 두 확률변수 X,Y를 한꺼번에 놓는 방향의 조합이다. |
Corr | 상관계수 | |
~ | ~따라서 ~ | b+1 ~ X(n+1) b+1은 따라서 x(n+1)로 규정된다. |
≈ | 근사값이다. | y ≈ X y는 x의 근사값임을 의미한다 |
∝ | 비례기호(proportionality sign) | A∝B A는 B에 비례한다. |
θ | 미지의 기울기 수 (세타) | 최대우도 추정법등에서 사용 |
'ML, DL > 수학' 카테고리의 다른 글
Entropy, Cross Entropy, KL Divergence (0) | 2022.08.27 |
---|---|
확률(probability), 가능도(likelihood), 최대우도측정(likelihood maximization) (1) | 2022.08.27 |