p-value vs Alpha
Hồi còn ôn thi Level I, nhóm học của tôi có một ông bạn rất sợ các bài tập trong phần Quant nói về p-value, alpha (α) và kiểm định giả thuyết (hypothesis testing). Lên Level II, hắn vẫn tiếp tục nhầm lẫn, và mất gần 1 tháng trời để học lại sự liên quan giữa các khái niệm này.
Post này được viết dựa trên nguồn cảm hứng đó. Trong bài này, tôi sẽ nói về p-value và α. Chân thành mà nói: nó cực dễ.
Về bản chất, p-value và α cùng là một thứ: mức ý nghĩa (level of significance). Điểm khác nhau là, α được chọn trước, còn p-value thì do tính toán mà ra. Khi kiểm nghiệm một giả thuyết, chúng ta chọn một mức ý nghĩa (α), và sau đó tính toán số liệu thống kê dựa trên các dữ liệu để lấy được một mức ý nghĩa quan sát được (p-value). Cuối cùng, bạn so sánh 2 mức này (α và p-value) để đưa ra quyết định bác bỏ giả thuyết hoặc không bác bỏ giả thuyết.
Đơn giản đúng không? Bây giờ thì phức tạp hơn một chút …
α: Diện tích của miền bác bỏ (rejection region):
Theo định nghĩa, α là phần diện tích phía dưới phân phối chuẩn chuẩn hóa. Với kiểm nghiệm 1-đuôi (1-tailed test), α sẽ là toàn bộ phần diện tích ở phía đuôi phải (đối với right-tailed test) hoặc đuôi trái (đối với left-tailed test).
Đối với kiểm nghiệm 2-đuôi (2-tail test), phần diện tích sẽ được chia đều giữa phần đuôi phải và đuôi trái:
Vì p-value là mức ý nghĩa quan sát được, nó cũng là phần diện tích ở dưới phân phối chuẩn chuẩn hóa. Điểm khác biệt cốt lõi giữa α và p:
- α tương ứng với critical value (được chọn trước). Trong ví dụ ở trên, right-tailed test với critical value = 1.65; khi đó α tương ứng là 5% .
- p tương ứng to the calculated value (được tính toán ra): z-stat được tính từ các số liệu thống kê. Ví dụ, nếu ta tính ra z-stat = 1.80, giá trị p-value tương ứng sẽ là 3.59% (chúng ta có thể lấy được con số này bằng cách nhìn vào bảng phân phối chuẩn, giá trị ứng với z = 1.80 là 0.9641, đồng nghĩa với việc phần diện tích ở phía phải của z =1.80 là 1 − 0.9641 = 0.0359, hay 3.59%)
Nếu critical value = 1.65 và calculated value = 1.8, chúng ta sẽ bác bỏ giả thuyết null (null hypothesis). Một cách nói khác là nếu chúng ta có α = 5% và p-value = 3.59%, ta bác bỏ giả thuyết. Đồ thị minh họa như sau:
Tổng quát hóa: nếu p < α thì bác bỏ giả thuyết null, ngược lại nếu p > α thì không bác bỏ giả thuyết null.
Với kiểm nghiệm 1-đuôi, một vài ví dụ của p-value và giá trị z tương ứng là:
1-Tailed Test | |
p-value | z-statistic |
0.50% | 2.58 |
1.00% | 2.33 |
1.50% | 2.17 |
2.00% | 2.05 |
2.50% | 1.96 |
5.00% | 1.64 |
10.00% | 1.28 |
15.00% | 1.04 |
20.00% | 0.84 |
Với kiểm nghiệm 2-đuôi, một vài ví dụ của p-value và giá trị z tương ứng là:
2-Tailed Test | |
p-value | z-statistic |
0.50% | ±2.81 |
1.00% | ±2.58 |
1.50% | ±2.43 |
2.00% | ±2.33 |
2.50% | ±2.24 |
5.00% | ±1.96 |
10.00% | ±1.64 |
15.00% | ±1.44 |
20.00% | ±1.28 |
Lưu ý: Các giá trị bôi đỏ là các giá trị quan trọng nên ghi nhớ.
Ví dụ minh họa 1:
Ông đang thực hiện kiểm nghiệm 2-đuôi. Mức ý nghĩa α được chọn là 5%. Ông tính được p-value là 2%. Cho biết các mức critical value, z-statistic tương ứng? Dựa vào đó, bác bỏ hay không bác bỏ giả thuyết null ?
Dựa vào quy tắc ở chung, p < α nên chúng ta bác bỏ giả thuyết null. Vùng bác bỏ (α – màu đỏ) và p-value – màu xanh được minh họa như sau:
Vì là kiểm định 2-đuôi, chúng ta tìm trong bảng các giá trị z tương ứng với 2.5% (= 5% / 2) và 1% (= 2% / 2). Ta tìm được critical value (z-crit) là 1.96 và −1.96 và z-stat là 2.33 hoặc -2.33. Do 1.96 < 2.33, và -1.96 > -2.33; ta bác bỏ giả thuyết null.
Ví dụ minh họa 2:
Ông đang thực hiện kiểm nghiệm 1-đuôi với vùng bác bỏ nằm ở đuôi trái. Mức ý nghĩa α được chọn là 2.5%. Ông tính được p-value là 4.5%. Cho biết các mức critical value, z-statistic tương ứng? Dựa vào đó, bác bỏ hay không bác bỏ giả thuyết null?
Dựa vào quy tắc ở trên, p > α nên chúng ta không bác bỏ giả thuyết null. Vùng bác bỏ (α – màu đỏ) và p-value – màu xanh được minh họa như sau:
Chúng ta thấy z-stat = -1.70, và z-crit = 1.96. Vì vậy không nằm trong vùng bác bỏ, và chúng ta không bác bỏ giả thuyết null.
Túm lại, bí quyết khi làm câu hỏi liên quan đến p-value và α là vẽ đồ thị của phân phối chuẩn giống như ở trên, điều này sẽ giúp các ông kiểm tra được luôn z-crit và z-stat các ông tính ra có đúng hay không. Trải qua luyện tập, các ông sẽ vẽ thành thục, và làm đúng 100% các câu hỏi này là chuyện quá đơn giản. Và các ông có thể cười vào mặt ông bạn admin ở đầu post hộ tôi luôn nhé.
(Bài viết được dựa vào bài viết gốc tại đây)