Độ lệch – Skewness

Độ lệch (skewness) của một phân phối xác suất đo lường sự đối xứng của phân phối đó. Giá trị tuyệt đối của độ lệch càng cao thì phân phối đó càng bất đối xứng. Một phân phối đối xứng có độ lệch bằng 0.

Công thức toán học của độ lệch là:

\[skewness\ =\ \frac{n}{\left(n\ -\ 1\right)\left(n\ -\ 2\right)}\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\ ≈\ \frac1n\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^3}{s^3}\]

với:

  • \(n\) : số lượng mẫu – sample size
  • \(X_i\) : giá trị của mẫu thứ i – i th sample value
  • \(\bar X\) : giá trị trung bình của mẫu – sample mean
  • \(s \) : độ lệch chuẩn của mẫu – sample standard deviation

Thật may mắn là bạn không cần phải biết công thức này, hãy trục xuất nó ngay ra khỏi đầu của bạn. Điều bạn cần biết là :

  • hình dạng của một phân phối có độ lệch dương (positive skewness) hoặc độ lệch âm (negative skewness)
  • độ lệch dương hay âm bao nhiêu thì được coi đáng kể
  • một số tính chất của phân phối có độ lệch dương hoặc độ lệch âm

Độ lệch dương có nghĩa là các giá trị cực lớn hơn giá trị trung bình (mean) sẽ ở xa hơn so với giá trị cực nhỏ hơn giá trị trung bình (mean). Một đồ thị điển hình của một phân phối liên tục với độ lệch dương sẽ trông như thế này:

(Phân phối này còn được gọi là right-tailed)

Tương tự, một đồ thị điển hỉnh của một phân phối liên tục có độ lệch âm sẽ có hình dạng như sau

(Phân phối này còn được gọi là left-tailed)

Chú ý: Độ lệch được coi là đáng kể nếu giá trị tuyệt đối của nó \( \geq 0.5 \)  (tức là giá trị \( \leq -0.5\) hoặc \( \geq +0.5 \))

Tính chất quan trọng của độ lệch được biểu thị qua 2 hình minh họa ở trên: với một phân phối có một mode duy nhất, bạn cần phải biết giá trị tương đối của mean, mode và media . Ở đây có một mẹo để ghi nhớ, đó là sắp xếp các từ này theo thứ tự bảng chữ cái, từ trái qua phải:

mean           median           mode

Nếu phân phối có độ lệch dương – nó sẽ bị lệch sang phải – khi đó ký hiệu sẽ là dấu >. Cụ thể:

mean     >     median    >       mode

 

Ngược lại, nếu phân phối có độ lệch âm – nó sẽ bị lệch sang trái – ký hiệu sẽ là < :

mean     <     median    <       mode

(Bài viết được dịch từ bài viết gốc tại đây)

Leave a Reply

Your email address will not be published.