Giá trị trung bình
Bách khoa toàn thư mở Wikipedia
Trong ngành Thống kê, giá trị trung bình có hai nghĩa có liên quan:
- trung bình theo nghĩa thông thường, được gọi chính xác hơn là trung bình cộng để phân biệt với trung bình nhân hay trung bình điều hòa. Nó còn được gọi là trung bình của mẫu.
- giá trị kỳ vọng của một biến ngẫu nhiên, còn được gọi là trung bình của quần thể (population mean).
Bên cạnh Thống kê, các giá trị trung bình còn được dùng trong hình học và phân tích; nhiều loại trung bình đã được phát triển cho các mục tiêu này (chúng ít được dùng trong Thống kê.) Xem mục #Các trung bình khác để có một danh sách các trung bình.
Trung bình mẫu thường được dùng với vai trò ước lượng xu hướng trung tâm chẳng hạn trung bình quần thể. Tuy nhiên, người ta còn sử dụng các ước lượng khác. Ví dụ, giá trị trung vị tốt hơn trung bình mẫu trong vai trò ước lượng xu hướng trung tâm.
Với một biến ngẫu nhiên giá trị thực X, giá trị trung bình là giá trị kỳ vọng của X. Nếu không tồn tại giá trị kỳ vọng thì biến ngẫu nhiên không có giá trị trung bình.
Đối với một tập dữ liệu, trung bình là chỉ đơn giản là tổng tất cả các quan sát chia cho số quan sát. Một khi ta đã chọn phương pháp này để mô tả phương sai tương đối (communality) của một tập dữ liệu, ta thường dùng độ lệch tiêu chuẩn (standard deviation) để mô tả sự khác nhau của các quan sát. Độ lệch tiêu chuẩn là căn bậc hai của trung bình các bình phương độ lệch với giá trị trung bình.
Giá trị trung bình là giá trị duy nhất mà quanh đó tổng bình phương các độ lệch là nhỏ nhất.
Nếu ta tính tổng bình phương các độ lệch từ một cách đo xu hướng trung tâm bất kỳ nào khác, ta sẽ được một giá trị lớn hơn kết quả tương ứng của giá trị trung bình. Đó là lí do mà độ lệch tiêu chuẩn và giá trị trung bình thường được đặt cạnh nhau trong các báo cáo thống kê.
Một cách đo độ phân tán khác là độ lệch trung bình, tương đương với trung bình của độ lệch tuyệt đối từ giá trị trung bình. Cách đo này ít nhạy cảm với các giá trị ngoại lệ hơn, nhưng lại khó lần ngược hơn khi ta kết hợp các tập dữ liệu.
Lưu ý rằng không phải phân bố xác suất nào cũng có một giá trị trung bình hay phương sai, phân bố Cauchy là một ví dụ.
Sau đây là tóm tắt của một số phương pháp tính trung bình của một tập gồm n số. Xem giải thích cho các ký hiệu tại Bảng ký hiệu toán học.
Mục lục |
[sửa] Trung bình cộng
Trung bình cộng là trung bình tiêu chuẩn, thường chỉ được gọi ngắn gọn là "trung bình".
Trung bình này thường bị nhầm lẫn với trung vị hoặc mode. Giá trị trung bình là trung bình số học của một tập giá trị hoặc một phân bố; tuy nhiên, với các phân bố xiên, giá trị trung bình không nhất thiết trùng với giá trị nằm giữa (trung vị), hay mode. Ví dụ, thu nhập trung bình bị lệch lên trên do một số ít người có thu nhập rất lớn, và đa số có thu nhập thấp hơn trung bình. Ngược lại, thu nhập trung vị nằm tại vị trí mà có một nửa dân số nằm trên và nửa kia nằm dưới nó. Thu nhập mode là thu nhập thường gặp nhất, nó thiên về số đông với thu nhập thấp hơn. Trung vị hay mode thường là các độ đo trực quan hơn của các dữ liệu có dạng như vậy.
Có nghĩa là, nhiều phân bố xiên, chẳng hạn phân phối mũ và phân bố Poisson, được mô tả tốt nhất bởi giá trị trung bình.
[sửa] Ví dụ
Một thực nghiệm cho kết quả là dữ liệu: 34,27,45,55,22,34 Cách tính trung bình cộng
- Có 6 phần tử. Do đó n=6
- Tính tổng tất cả các phần tử, ta được 217
- Để tính trung bình điều hòa, ta chia tổng trên cho n để được 217/6=36.1666666667
[sửa] Trung bình nhân
Trung bình nhân là trung bình hữu ích cho các tập số mà được quan tâm nhiều đến tích của chúng. Ví dụ: tỉ lệ tăng trưởng.
[sửa] Ví dụ
Một thực nghiệm cho kết quả là dữ liệu: 34,27,45,55,22,34 Cách tính trung bình nhân
- Có 6 phần tử. Do đó n=6
- Tính tích của mọi phần tử, ta được 1699493400.
- Để tính trung bình nhân, ta lấy căn bậc n (6) của tích, và được 34.5451100372
[sửa] Trung bình điều hòa
Trung bình điều hòa (harmonic mean) là một giá trị bình quân hữu ích cho các tập số được định nghĩa trong quan hệ với một đơn vị nào đó, ví dụ vận tốc (khoảng cách đi được trong mỗi đơn vị thời gian).
[sửa] Ví dụ
Một thực nghiệm cho kết quả là dữ liệu: 34,27,45,55,22,34 Cách tính trung bình điều hòa
- Có 6 phần tử. Do đó n=6
- Tính tổng tại biểu thức mẫu số, ta được 0.181719152307
- Lấy giá trị nghịch đảo của tổng đó, ta được 5.50299727522
- Để tính trung bình điều hòa, ta nhân giá trị trên với n để được 33.0179836513
[sửa] Trung bình lũy thừa
Trung bình lũy thừa là tổng quát hóa của trung bình cộng, trung bình nhân, và trung bình điều hòa. Nó được định nghĩa bằng công thức
Bằng cách chọn các giá trị thích hợp cho tham số m ta có thể thu được trung bình cộng (m = 1), trung bình nhân (m → 0) hay trung bình điều hòa (m = −1)
Trung bình này có thể được tổng quát hóa hơn nữa để có trung bình-f suy rộng (generalized f-mean)
lựa chọn thích hợp cho hàm f(x) nghịch đảo được sẽ cho ra trung bình cộng với f(x) = x, trung bình nhân với f(x) = log(x), hay trung bình điều hòa với f(x) = 1/x.
[sửa] Trung bình có trọng số
Trung bình có trọng số (weighted mean) được sử dụng khi ta muốn kết hợp các giá trị bình quân từ các mẫu với các kích thước khác nhau từ cùng một quần thể:
Các trọng số wi biểu diễn biên của mẫu i. Trong các ứng dụng khác, chúng biểu diễn một độ đo độ tin cậy của ảnh hưởng của mẫu lên trung bình bằng các giá trị tương ứng.
[sửa] Trung bình cụt
Đôi khi một tập số (dữ liệu) có thể bị lẫn các giá trị ngoại lệ không chính xác, nghĩa là các giá trị quá lớn hoặc quá nhỏ. Trong trường hợp đó, người ta có thể sử dụng một trung bình cụt (truncated mean). Trung bình cụt được tính băng cách: loại bỏ các phần dữ liệu tại đỉnh hoặc đáy dữ liệu, thường là các lượng như nhau tại mỗi đầu, rồi lấy trung bình cộng của phần dữ liệu còn lại. Số giá trị bị loại bỏ được ghi dưới dạng tỷ lệ phần trăm của tổng số giá trị.
[sửa] Trung bình khoảng tứ phân vị
Trung bình khoảng tứ phân vị (interquartile mean) là một ví dụ về một trung bình cụt. Đó chẳng qua là trung bình cộng sau khi đã loại bỏ phần tư giá trị nhỏ nhất và lớn nhất.
giả thiết rằng các giá trị đã được sắp xếp.
[sửa] Trung bình của một hàm
Trong giải tích (calculus), đặc biệt là giải tích đa biến, trung bình của một hàm được định nghĩa một cách lỏng lẻo là giá trị bình quân của hàm trên miền xác định của nó. Nếu là đơn biến, hàm f(x) trên khoảng (a,b) được định nghĩa là
(Xem thêm Định lý giá trị trung bình.) Trong trường hợp có nhiều biến, trung bình trên một miền compac tương đối U trong một không gian Ơclid được định nghĩa là
Đó là suy rộng của trung bình cộng. Ngoài ra, còn có thể tổng quát hóa trung bình nhân cho các hàm số bằng cách định nghĩa trung bình nhân của hàm f là
Tổng quát hơn, trong lý thuyết độ đo (measure theory) và lý thuyết xác suất, cả hai loại trung bình đều đóng vai trò quan trọng.
[sửa] Các loại trung bình khác
- Arithmetic-geometric mean
- Arithmetic-harmonic mean
- Cesàro mean
- Chisini mean
- Geometric-harmonic mean
- Heronian mean
- Identric mean
- Lehmer mean
- Quadratic mean
- root mean square
- Stolarsky mean
- weighted geometric mean
- weighted harmonic mean
- Rényi's entropy (a generalized f-mean)
[sửa] Xem thêm
- Xu hướng trung tâm (Central tendency)
- Thống kê mô tả (Descriptive statistics)
- Độ nhọn (Kurtosis)
- Trung vị
- Mode (thống kê)
- Thống kê tổng kết (Summary statistics)