Độ lệch – Skewness
Độ lệch (skewness) của một phân phối xác suất đo lường sự đối xứng của phân phối đó. Giá trị tuyệt đối của độ lệch càng cao thì phân phối đó càng bất đối xứng. Một phân phối đối xứng có độ lệch bằng 0.
Công thức toán học của độ lệch là:
\[skewness\ =\ \frac{n}{\left(n\ -\ 1\right)\left(n\ -\ 2\right)}\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\ ≈\ \frac1n\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\]với:
- \(n\) : số lượng mẫu – sample size
- \(X_i\) : giá trị của mẫu thứ i – i th sample value
- \(\bar X\) : giá trị trung bình của mẫu – sample mean
- \(s \) : độ lệch chuẩn của mẫu – sample standard deviation
[HuyAdsInHere]
Thật may mắn là ông không cần phải biết công thức này, nên hãy trục xuất nó ngay ra khỏi đầu của ông luôn đi nhé. Điều ông cần biết là :
- hình dạng của một phân phối có độ lệch dương (positive skewness) hoặc độ lệch âm (negative skewness)
- độ lệch dương hay âm bao nhiêu thì được coi đáng kể
- một số tính chất của phân phối có độ lệch dương hoặc độ lệch âm
Độ lệch dương có nghĩa là các giá trị cực lớn hơn giá trị trung bình (mean) sẽ ở xa hơn so với giá trị cực nhỏ hơn giá trị trung bình (mean). Một đồ thị điển hình của một phân phối liên tục với độ lệch dương sẽ trông như thế này:
(Phân phối này còn được gọi là right-tailed)
Tương tự, một đồ thị điển hỉnh của một phân phối liên tục có độ lệch âm sẽ có hình dạng như sau
(Phân phối này còn được gọi là left-tailed)
Chú ý: Độ lệch được coi là đáng kể nếu giá trị tuyệt đối của nó \( \geq 0.5 \) (tức là giá trị \( \leq -0.5\) hoặc \( \geq +0.5 \))
Tính chất quan trọng của độ lệch được biểu thị qua 2 hình minh họa ở trên: với một phân phối có một mode duy nhất, ông cần phải biết giá trị tương đối của mean, mode và media . Ở đây có một mẹo để ghi nhớ, đó là sắp xếp các từ này theo thứ tự bảng chữ cái, từ trái qua phải:
mean median mode
Nếu phân phối có độ lệch dương – nó sẽ bị lệch sang phải – khi đó ký hiệu sẽ là dấu >. Cụ thể:
mean > median > mode
Ngược lại, nếu phân phối có độ lệch âm – nó sẽ bị lệch sang trái – ký hiệu sẽ là < :
mean < median < mode
(Bài viết được dịch từ bài viết gốc tại đây)
2 thoughts on “Độ lệch – Skewness”
Dễ hiểu quá bác ơi. Cảm ơn bác
Cho mình hỏi nếu trong trường hợp mode<mean<median thì có ý nghĩa gì vậy ? mình đang quan sát giá biến động của 1 sản phẩm quan từng ngày nhưng khi tính mean, mode,median thì nó xảy ra hiện tượng này