Định lý giới hạn trung tâm là định lý xác suất thống kê đề cập đến mối liên hệ giữa phân phối của tập tổng thể gồm tất cả các đối tượng cùng loại được quan tâm nghiên cứu và phân phối của tập mẫu tuyến tính gồm n đối tượng của tập tổng thể được tách ra để quan sát. Số lượng n đối tượng của mẫu tạo nên kích cỡ của tập mẫu. Thông thường, các đối tượng trong tập mẫu được xem xét theo các dấu hiệu về lượng khác nhau như chiều cao, cân nặng, tính cách, trí thông minh hay sự xuất hiện một biểu tượng nào đó… mà tập hợp các kết quả quan sát về chúng tạo nên các biến. Các biến này là ngẫu nhiên bởi chúng có thể nhận giá trị này hay giá trị kia tùy thuộc vào kết quả của phép đo trên từng đối tượng.
Định lý giới hạn trung tâm thường được giới thiệu như một định lý đặc biệt mô tả sự phân phối của giá trị trung bình mẫu khi xét theo các biến khác nhau. Giá trị trung bình mẫu là tổng hợp tuyến tính của các điểm số trong mẫu, với mỗi điểm có trọng số 1/N, trong đó N là cỡ mẫu. Theo định lý giới hạn trung tâm, kích thước mẫu càng lớn, phân phối của các giá trị trung bình mẫu càng gần với phân phối chuẩn (tức là có phân phối theo đường cong hình chuông, xác suất xảy ra cao nhất ở điểm giữa của đồ thị và giảm dần ở hai cực), khi số đối tượng của tập mẫu tiến tới vô tận thì phân phối đó tiệm cận với phân phối chuẩn. Vì vậy, phân phối chuẩn có thể được sử dụng để ước tính khoảng tin cậy của các trung bình mẫu và kiểm tra các giả thuyết liên quan đến mẫu. Điểm đáng lưu ý là định lý này không đòi hỏi các biến trong tập mẫu phải có phân phối chuẩn. Mẫu vẫn tiệm cận phân phối chuẩn ngay cả khi các biến phân bố rất không chuẩn.
Theo nguyên tắc chung, kích thước mẫu bằng hoặc lớn hơn 30 được coi là đủ để tuân theo định lý giới hạn trung tâm. Liên quan đến kích cỡ mẫu, phân phối của các trung bình mẫu phần nào cũng phụ thuộc vào hình dạng phân phối của các biến trong mẫu. Nếu điểm số của các biến có phân phối chuẩn, trung bình mẫu của chúng luôn luôn có phân phối chuẩn. Nếu điểm số của biến có phân phối rất bát thường, kích thước mẫu có thể phải lớn hơn 30 để phân phối của trung bình mẫu là chuẩn. Càng lấy nhiều đối tượng vào mẫu, kết quả đồ thị càng có hình dạng phân phối chuẩn.
Định lý giới hạn trung tâm giải thích tại sao nhiều phép đo vật lý học, tâm lý học… lại có phân phối chuẩn. Chẳng hạn, chiều cao và cân nặng của con người được quy định bởi nhiều yếu tố, có thể là hàng trăm gen và hàng nghìn biến số liên quan đến quá trình nuôi dưỡng và phát triển tâm lý. Trong lĩnh vực tâm lý học cũng vậy, rất nhiều đặc điểm tâm lý, chẳng hạn, trí thông minh của con người cũng có phân phối chuẩn bởi nó chịu ảnh hưởng của hàng nghìn gen và nhiều sự kiện xảy ra trước hoặc sau khi cá nhân được sinh ra. Sự chệch chuẩn gợi ý rằng đã có những sự kiện nào đó có ảnh hưởng rất nặng nề lên sự phát triển bình thường của cá thể. Những người có chiều cao rất thấp, có vóc dáng không phù hợp với phân phối chuẩn có thể do họ có vấn đề ở tuyến Yên. Chiều cao của họ không chịu ảnh hưởng bởi gen và các sự kiện - những yếu tố đã làm cho chiều cao của những người khác cao hơn. Tương tự như vậy, những người có trí thông minh rất thấp có thể có khiếm khuyết di truyền hiếm gặp hoặc đã bị một số chấn thương gây tổn hại hệ thần kinh trung ương.
Định lý giới hạn trung tâm thể hiện một hiện tượng trong đó giá trị trung bình và độ lệch chuẩn của mẫu bằng giá trị trung bình và độ lệch chuẩn của tổng thể. Trên cơ sở một kích cỡ mẫu đủ lớn có thể dự đoán chính xác các đặc điểm của tổng thể. Tuy nhiên, để có thể dự đoán chính xác các đặc điểm của tổng thể thì cùng với một kích cỡ mẫu đủ lớn, cách chọn mẫu cần đảm bảo để có được mẫu có tính đại diện cho tổng thể, hạn chế tới mức thấp nhất những sai số do chọn mẫu. Định lý giới hạn trung tâm rất hữu ích và nó được ứng dụng rộng rãi trong nhiều lĩnh vực để dự đoán các đặc điểm của các tổng thể khác nhau. Nó cho phép thay thế việc tìm hiểu một tổng thể vô cùng lớn nhưng hữu hạn các biến ngẫu nhiên bằng một mẫu ngẫu nhiên có phân phối chuẩn, nhờ đó, sẽ tiết kiệm hơn về tài chính, thời gian cũng như sức lực cần dành cho nghiên cứu, đồng thời việc tính toán cũng dễ dàng hơn.
Tài liệu tham khảo[sửa]
- Lê Sĩ Đồng, Giáo trình xác suất thống kê, Nxb. Giáo dục, 2013.
- W. Edward Craighead and Charles B. Nemeroff (Editors), The Concise Corsini Encyclopedia of Psychology and Behavioral Science, Published by John Wiley & Sons, Inc, Hoboken, New Jersey, Third edition, 2004,pp. 156 - 157.
- Р. Корсини и А. Ау Эрбаха (под редакцией), Психологическая энциклопедия, Питер, 2-e издание, 2006, cтp. 676 - 677.