Độ nhọn – Kurtosis

Độ nhọn – Kurtosis

Kurtosis là một chỉ số để đo lường về đặc điểm hình dáng của một phân phối xác suất. Cụ thể hơn, nó so sánh độ cao phần trung tâm của một phân phối so sánh với một phân phối chuẩn. Phần trung tâm càng cao và nhọn, chỉ số Kurtosis của phân phối đó càng lớn. Hay nói cách khác, kurtosis đo lường độ “béo” phần đuôi của một phân phối xác suất. Cái đuôi càng “béo”, kurtosis càng lớn.

Kurtosis của một mẫu có công thức như sau:

\[\begin{align}kurtosis\ &=\ \frac{n\left(n\ +\ 1\right)}{\left(n\ -\ 1\right)\left(n\ -\ 2\right)\left(n\ -\ 3\right)}\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^4}{s^4}\\ \\ &≈\ \frac1n\frac{\sum_{i=1}^n \left(X_i\ –\ \bar X\right)^4}{s^4} \end{align}\]

với

    • \(n\) : số lượng mẫu – sample size
    • \(X_i\) : giá trị của mẫu thứ i – i th sample value
    • \(\bar X\) : giá trị trung bình của mẫu – sample mean
    • \(s \) : độ lệch chuẩn của mẫu – sample standard deviation

Cũng giống như công thức của độ lệch (skewness), hãy quên công thức của kurtosis đi ngay sau khi ông đọc xong luôn hộ tôi nhé. Ông chỉ cần nhớ những thứ sau:

  • excess kurtosis
  • excess kurtosis bao nhiêu thì được coi là đáng kể
  • hình dạng của phân phối xác suất với excess kurtosis dương/âm

Điều đầu tiên cần nhớ, phân phối chuẩn có kurtosis = 3. 

Định nghĩa của excess kurtosis: lấy kurtosis của phân phối trừ đi 3. Excess kurtosis dương có nghĩa là kurtosis của phân phối lớn hơn 3, excess kurtosis âm nghĩa là kurtosis của phân phối nhỏ hơn 3. Cụ thể hơn, phân phối có:

  • excess kurtosis dương được gọi là leptokurtic (“lepto” nghĩa là gầy, hoặc để dễ nhớ: *ngực* lép (nhọn)
  • excess kurtosis bằng 0 được gọi là mesokurtic
  • excess kurtosis âm được gọi là platykurtic (“platy” nghĩa là “rộng”, hay “flat”).

Đồ thị của một phân phối chuẩn chuẩn hóa (µ = 0, σ = 1), một phân phối leptokurtic và một phân phối platykurtic có hình dạng như sau:

Phân phối chuẩn có kurtosis 3.0, hay zero excess kurtosis.

Phân phối leptokurtic có kurtosis 4.0, hay excess kurtosis +1.0 (= 4.0 – 3.0).

Phân phối platykurtic có kurtosis of 2.7, hay excess kurtosis -0.3 (= 2.7 – 3.0).

Lưu ý, tuy trên đồ thị không thể hiện rõ lắm, nhưng phân phối leptokurtic có phần đuôi (phần lớn hơn +4 và nhỏ hơn -4) “béo” hơn phân phối chuẩn khoảng gấp đôi, và phân phối platykurtic có phần đuôi “mỏng” hơn phân phối chuẩn khoảng một nửa.
[HuyAdsInHere]
Excess kurtosis được tính là đáng kể nếu giá trị tuyệt đối của nó lớn hơn hoặc bằng 1.0; vd: kurtosis > 4.0 (excess positive kurtosis > 1.0) hoặc kurtosis < 2.0 (excess negative kurtosis < -1.0).

8 thoughts on “Độ nhọn – Kurtosis

  1. Phân phối chuẩn có kurtosis = 3? Ad cần xem lại nhé! Tỉ số trung bình đối vs 1 phân phối chuẩn là 3. Còn Độ lồi(Kurtosis) của 1 phân phối chuẩn dc xác định là 0.

    1. Hi bạn,
      Khái niệm kurtosis nếu như tính toán theo công thức trong bài thì sẽ bằng 3 với normal distribution.

      Còn cái được sử dụng để xác định độ lồi của 1 phân phối như bạn đề cập thì sẽ là excess kurtosis và bằng 0 (nhiều lúc cũng được đọc tắt nên dễ gây nhầm lẫn). Đây là đường link bọn mình sử dụng để tham khảo: https://stats.stackexchange.com/questions/126346/why-kurtosis-of-a-normal-distribution-is-3-instead-of-0

      Cảm ơn đã góp ý cho bọn mình.

  2. Ad ơi cho em hỏi nếu KURTOSIS mà bị nhọn/ bẹt thì dùng thuật toán nào để giúp dữ liệu được chuẩn hơn trong phần mềm jamovi ạ. Em cảm ơn.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.