Biến ngẫu nhiên
Bách khoa toàn thư mở Wikipedia
Biến ngẫu nhiên là một thuật ngữ được dùng trong toán học và thống kê. Biến ngẫu nhiên là một hàm toán học với đặc điểm: nó gán một giá trị bằng số cho kết quả của một thực nghiệm. Nó có thể được xem là kết quả bằng số của việc vận hành một cơ chế không đơn định hoặc thực hiện một thực nghiệm không đơn định để tạo ra một kết quả ngẫu nhiên. Ví dụ, một biến ngẫu nhiên có thể được sử dụng để mô tả quá trình thả một con súc sắc công bằng và các kết quả có thể thu được { 1, 2, 3, 4, 5, 6 }. Một biến ngẫu nhiên khác có thể mô tả các kết quả có thể của việc chọn ngẫu nhiên một người và đo chiều cao của người đó.
Không như các biến toán học khác, không thể gán giá trị cho một biến ngẫu nhiên; một biến ngẫu nhiên không mô tả kết quả thực tế của một thực nghiệm cụ thể, nó dùng các số thực để mô tả các kết quả có thể có nhưng chưa xác định.
Tuy các ví dụ đơn giản như thả súc sắc và đo chiều cao (như miêu tả ở trên) giúp ta dễ dàng hình dung về ứng dụng thực tế của các biến ngẫu nhiên, cấu trúc toán học của chúng mang lại cho các nhà toán học sự thuận tiện khi làm việc với lý thuyết xác suất độ đo trong một môi trường quen thuộc hơn với các hàm số giá trị thực. Ngược lại, khái niệm này cũng đặt các thực nghiệm có liên quan đến các kết quả với giá trị là số thực vào trong khuôn khổ lý thuyết độ đo một cách vững chắc.
Mục lục |
[sửa] Các định nghĩa
[sửa] Biến ngẫu nhiên
Một số người cho rằng gọi tên biến ngẫu nhiên là một sự nhầm lẫn, do một biến ngẫu nhiên không phải là một biến mà là một hàm số ánh xạ các biến cố tới các số. Cho A là một σ-đại số và Ω là không gian các biến cố liên quan tới thực nghiệm đang được tiến hành. Trong ví dụ thả súc sắc, không gian các biến cố chính là các kết quả có thể của một lần thả, nghĩa là Ω = { 1, 2, 3, 4, 5, 6 }, và A sẽ là tập lũy thừa của Ω. Trong trường hợp này, một biến ngẫu nhiên thích hợp có thể là hàm đồng nhất (identity function) X(ω) = ω, sao cho nếu kết quả là nhất thì biến ngẫu nhiên cũng sẽ bằng 1. Một ví dụ cũng đơn giản nhưng ít tầm thường hơn là việc tung đồng xu: một không gian thích hợp cho các biến cố có thể là Ω = {S, N} (S: sấp, N: ngửa), và A cũng lại bằng tập lũy thừa của Ω. Một trong số nhiều biến ngẫu nhiên có thể được định nghĩa trên không gian này là
Một biến ngẫu nhiên được định nghĩa như là một hàm đo được (measurable function) từ một không gian xác suất tới một không gian đo được nào đó. Không gian đo được này là một không gian của các giá trị có thể của biến, và nó thường được lấy là các số thực với Borel σ-đại số. Phần còn lại của bài này sử dụng giả thuyết đó, trừ khi được chỉ rõ.
Cho không gian xác suất (Ω, A, P). Một hàm X: Ω → R là một biến ngẫu nhiên giá trị thực nếu với mọi tập con Ar = { ω : X(ω) ≤ r } trong đó r ∈ R, ta cũng có Ar ∈ A. Định nghĩa này có tầm quan trọng ở chỗ nó cho phép ta xây dựng hàm phân bố của biến ngẫu nhiên.
[sửa] Các hàm phân bố
Nếu cho trước một biến ngẫu nhiên xác định trên không gian xác suất (Ω,P), ta có thể đặt các câu hỏi như "Khả năng giá trị của X lớn hơn 2 là bao nhiêu?". Đó chính là xác suất của biến cố , thường được viết gọn là P(X > 2).
Việc ghi nhận tất cả các xác suất này của các khoảng biến thiên kết quả của một biến ngẫu nhiên giá trị thực X cho ra phân bố xác suất của X. Phân bố xác suất "bỏ quên" không gian xác suất đã được dùng để định nghĩa X và chỉ ghi nhận các xác suất của các giá trị của X. Bao giờ cũng có thể mô tả một phân bố xác suất như vậy bằng hàm phân bố tích lũy của nó.
và đôi khi còn dùng một hàm mật độ xác suất. Theo thuật ngữ lý thuyết độ đo, ta sử dụng biến ngẫu nhiên X để "đẩy" (push-forward) độ đo P trên Ω tới một độ đo dF trên R.
Không gian xác suất Ω là một thiết bị kỹ thuật để đảm bảo sự tồn tại của các biến ngẫu nhiên, và đôi khi để xây dựng chúng. Trong thực tế, người ta thường bỏ qua không gian Ω và chỉ đặt một độ đo lên R mà độ đo này gán số đo bằng 1 cho toàn bộ đường số thực, nghĩa là người ta làm việc với phân bố xác suất thay vì các biến ngẫu nhiên.
[sửa] Hàm của các biến ngẫu nhiên
Nếu ta có một biến ngẫu nhiên X trên Ω và một hàm đo được (measurable function) f: R → R, thì Y = f(X) cũng là một biến ngẫu nhiên trên Ω, do hợp của các hàm đo được cũng là một hàm đo được. Có thể sử dụng quy trình cho phép đi từ một không gian xác suất (Ω, P) tới (R, dFX) để thu được phân bố của Y. Hàm phân bố tích lũy của Y là
[sửa] Ví dụ
Cho X là một biến ngẫu nhiên liên tục giá trị thực và Y = X2. Khi đó,
Nếu y < 0, thì P(X2 ≤ y) = 0, do đó
Nếu y ≥ 0, thì
do đó
- nếu
[sửa] Mômen
Phân bố xác suất của một biến ngẫu nhiên thường được đặc trưng bởi một số các tham số, các tham số này cũng có một cách hiểu thực dụng. Ví dụ, trong nhiều trường hợp, biết "giá trị trung bình" của biến ngẫu nhiên là đủ. Giá trị này được thể hiện bởi khái niệm toán học giá trị kỳ vọng của một biến ngẫu nhiên, được ký hiệu là E[X]. Lưu ý rằng, nói chung, E[f(X)] khác với f(E[X]). Một khi đã biết được "giá trị trung bình", người ta có thể đặt câu hỏi cái giá trị trung bình này cách bao xa đối với các giá trị điển hình của X, câu hỏi này được trả lời bởi các khái niệm phương sai và độ lệch tiêu chuẩn của một biến ngẫu nhiên.
Trong toán học, bài toán (mở rộng) về các mômen (generalised problem of moments) được phát biểu như sau: cho trước một lớp gồm các biến ngẫu nhiên X, tìm một tập hợp {fi} gồm các hàm sao cho các giá trị kỳ vọng E[fi(X)] đặc trưng đầy đủ cho phân bố của biến ngẫu nhiên X.
[sửa] Tính tương đương của các biến ngẫu nhiên
Các biến ngẫu nhiên có thể được coi là tương đương theo một số nghĩa. Hai biến ngẫu nhiên có thể bằng nhau, gần như bằng nhau, trung bình bằng nhau, hoặc phân bố bằng nhau.
Định nghĩa chính xác của các khái niệm trên được cho dưới đây theo thứ tự tăng dần về độ mạnh.
[sửa] Phân bố bằng nhau
Hai biến ngẫu nhiên X và Y có phân bố bằng nhau nếu chúng có các hàm phân bố giống nhau:
Hai biến ngẫu nhiên có các hàm sinh mômen bằng nhau có phân bố bằng nhau. Điều này cung cấp một phương pháp kiểm tra tính bằng nhau của một số hàm nhất định của các biến phân bố đồng nhất độc lập (dependent identical-distributed variable).
Để có phân bố bằng nhau, các biến ngẫu nhiên không cần phải được định nghĩa trên cùng một không gian xác suất.
Khái niệm phân bố tương đương có quan hệ với khái niệm dưới đây về khoảng cách giữa các phân bố xác suất,
đây là căn bản của thử nghiệm Kolmogorov-Smirnov.
[sửa] Giá trị trung bình bằng nhau
Hai biến ngẫu nhiên X và Y là bằng nhau theo trung bình thứ p nếu mômen thứ p của |X − Y| bằng 0, nghĩa là
Đẳng thức đối với trung bình thứ p hàm ý đẳng thức đối với trung bình thứ q với mọi q<p. Cũng như trong trường hợp trước, khái niệm này có liên quan đến một quan hộ khoảng cách giữa các biến ngẫu nhiên, đó là
[sửa] Gần như bằng nhau
Hai biến ngẫu nhiên X và Y là gần như bằng nhau khi và khỉ khi xác suất chúng khác nhau là bằng 0:
Với mọi mục đích thực tiễn trong lý thuyết xác suất, khái niệm tương đương này cũng mạnh như khái niệm bằng nhau thực sự. Nó liên quan đến khoảng cách sau:
trong đó 'sup' trong trường hợp này biểu diễn cận trên thực chất (essential supremum) với ý nghĩa của ngành lý thuyết độ đo.
[sửa] Bằng nhau
Cuối cùng, hai biến ngẫu nhiên X và Y là bằng nhau nếu chúng bằng nhau với vai trò các hàm số trên không gian xác suất của chúng, nghĩa là,
[sửa] Hội tụ
Nhiều thống kê toán học cốt ở việc chứng minh các kết quả hội tụ đối với một số dãy biến ngẫu nhiên nhất định; xem thêm trong những bài như luật số lớn (law of large numbers) và định lý giới hạn trung tâm (central limit theorem).
Một dãy (Xn) gồm các biến ngẫu nhiên có thể hội tụ thành một biến ngẫu nhiên X theo nhiều kiểu khác nhau. Những kiểu đó được giải thích trong bài sự hội tụ của các biến ngẫu nhiên (convergence of random variables).
[sửa] Tham khảo
Papoulis, Athanasios 1965 Probability, Random Variables, and Stochastic Processes. McGraw-Hill Kogakusha, Tokyo, 9th edition, ISBN 0071199810.
[sửa] Xem thêm
- Biến ngẫu nhiên rời rạc
- Biến ngẫu nhiên liên tục
- Phân bố xác suất
- Biến cố (lý thuyết xác suất)
- Tính ngẫu nhiên
- Véctơ ngẫu nhiên
- Hàm ngẫu nhiên
- Hàm sinh (generating function)
- Lý thuyết thông tin thuật toán (Algorithmic information theory)
Bài này có sử dụng tài liệu từ Random variable tại PlanetMath, với giấy phép sử dụng GFDL.