0

Xác suất có điều kiện – Công thức Bayes

Xác suất có điều kiện – Công thức Bayes

Công thức tính Xác suất có điều kiệnđịnh lý Bayes (Bayes’ Theorem) là các công cụ mạnh mẽ để tính xác suất xảy ra của một sự kiện (biến cố) ngẫu nhiên $ A$ khi biết sự kiện liên quan $ B$ đã xảy ra.

Xem thêm

1. Xác suất có điều kiện

1.1. Ví dụ về xác suất có điều kiện

Xác suất có điều kiện (Conditional probability) là xác suất của một biến cố $ A$ nào đó khi biết rằng một biến cố $ B$ khác xảy ra. Ký hiệu $ \mathrm{P}(A|B)$, và đọc là “xác suất của $ A$, biết $ B$”.

Chẳng hạn, rút một lá bài từ một bộ bài có 52 lá, xác suất để lấy được một lá Át là $ 1/52$. Nhưng nếu người chơi đã rút được lá Át rồi, nếu tiếp tục rút thêm một lá bài nữa thì thì để nhận được một lá Át nữa, xác suất chỉ còn là $ 1/51.$

Để hiểu rõ hơn, chúng ta xét tiếp các ví dụ nữa.

Ví dụ 1. Một bình đựng 5 viên bi kích thước và chất liệu giống nhau, chỉ khác nhau về màu sắc. Trong đó có 3 viên bi xanh và 2 viên bi đỏ. Lấy ngẫu nhiên từ bình ra một viên bi ta được viên bi màu xanh, rồi lại lấy ngẫu nhiên ra một viên bi nữa. Tính xác suất để lấy được viên bi đỏ ở lần thứ hai.

Hướng dẫn. Gọi $ A$ là biến cố: “Lấy được một viên bi đỏ ở lần thứ hai”. Vì một viên bi xanh đã được lấy ra ở lần thứ nhất nên còn lại trong bình 4 viên bi trong đó số viên bi đỏ là 2 và số viên bi xanh cũng là 2. Do đó, xác suất cần tìm là $$ \mathrm{P}(A)=\frac{2}{4}=0{,}5. $$

Ví dụ 2. Gieo một con xúc xắc cân đối và đồng chất hai lần. Tính xác suất để lần đầu gieo được mặt 1 chấm biết rằng tổng số chấm trong hai lần gieo không vượt quá 3.

Hướng dẫn. Không gian mẫu là $$ \Omega=\big\{\left(i, j\right): 1\leqslant i, j\leqslant 6\big\}, $$ trong đó cặp số $ \left(i, j\right)$ thể hiện việc lần gieo đầu xuất hiện mặt $ i$ chấm, lần sau xuất hiện mặt $ j$ chấm.

Gọi $ A$ là biến cố: “Lần đầu gieo xuất hiện mặt 1 chấm”, $ B$ là biến cố: “Tổng số chấm trong hai lần gieo không vượt quá 3”. Chúng ta dễ dàng liệt kê được các phần tử thuận lợi cho từng biến cố là
\begin{align}
A=&\big\{\left(1, 1\right), \left(1, 2\right), \left(1, 3\right), \left(1, 4\right), \left(1, 5\right), \left(1, 6\right)\big\},\\
B=&\big\{\left(1, 1\right), \left(1, 2\right), \left(2, 1\right)\big\},\\
AB=&\big\{\left(1, 1\right), \left(1, 2\right)\big\}.
\end{align}

Theo định nghĩa cổ điển của xác suất thì ta có

$$ \mathrm{P}(A)=\frac{6}{36}, \quad \mathrm{P}(B)=\frac{3}{36},\quad \mathrm{P}(AB)=\frac{2}{36} .$$

Nếu biết rằng $ B$ đã xảy ra thì $ A$ xảy ra khi một trong hai kết quả $ \left(1, 1\right)$ và $ \left(1, 2\right)$ xảy ra. Do đó xác suất của $ A$ với điều kiện $ B$ là $$ \mathrm{P}(A | B)=\frac{2}{3}. $$ Nhận xét rằng $$ \frac{2}{3}=\frac{{2}/{36}}{{3}/{36}}=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)} $$ hay chính là $$ \mathrm{P}(A | B)=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}. $$ Từ đó, chúng ta có công thức tính xác suất có điều kiện như sau đây.

1.2. Công thức tính xác suất có điều kiện

Giả sử số các kết quả đồng khả năng có thể xảy ra khi thực hiện phép thử đó là $ N$, số kết quả thuận lợi cho biến cố $ B$ là $ m$ và số kết quả thuận lợi cho biến cố $ AB$ là $n $.

Theo định nghĩa cổ điển của xác suất thì $$ \mathrm{P}(B)=\frac{m}{N}, \mathrm{P}(AB)=\frac{n}{N}. $$

Khi biến cố $ B$ đã xảy ra thì số các kết quả đồng khả năng của phép thử có thể xảy ra đối với biến cố $ A$ là $ m$, trong đó có $ n$ kết quả thuận lợi cho $ A$ xảy ra. Do đó, xác suất của biến cố $ A$ khi biết $ B$ đã xảy ra là
$$ \mathrm{P}(A | B)=\frac{n}{m}=\frac{n/N}{m/N}=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}. $$

Từ đó, chúng ta có công thức tính xác suất có điều kiện như sau:

Xác suất có điều kiện của biến cố $ A$ với điều kiện $ B$ là một số được ký hiệu là $ \mathrm{P}(A | B)$ xác định bởi công thức $$ \mathrm{P}(A | B)=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}, \mathrm{P}(B)>0. $$

Từ định nghĩa trên ta dễ dàng nhận được các tính chất sau của xác suất có điều kiện:

  • $ \mathrm{P}(A | B)\geqslant 0.$
  • $ \mathrm{P}\left(\Omega | B\right)=\mathrm{P}\left(B | B\right)=1.$
  • Nếu $ A_1, A_2,\ldots, A_n$ là các biến cố xung khắc từng đôi một, nghĩa là $ A_iA_j=\varnothing$ với mọi $ i\neq j$, ta có $$ \mathrm{P} \left( \left(\bigcup\limits_{i=1}^{n}A_i \right) \Bigg| B \right)=\sum\limits_{i=1}^{n}\mathrm{P}\left(A_i | B\right). $$

Ví dụ 3. Gieo đồng thời ba con xúc xắc cân đối đồng chất. Tính xác suất để tổng số chấm xuất hiện trên ba con bằng 8 biết rằng ít nhất có một con xuất hiện mặt 5 chấm.

Hướng dẫn. Không gian mẫu gồm các phần tử $$ \Omega=\big\{\left(i, j, k\right): 1\leqslant i, j, k\leqslant 6\big\}, $$ trong đó bộ số $ \left(i, j, k\right)$ kí hiệu cho việc “con xúc xắc thứ nhất xuất hiện mặt $ i$ chấm, con xúc xắc thứ hai xuất hiện mặt $ j$ chấm và con xúc xắc thứ ba xuất hiện mặt $ k$ chấm”.

Gọi $ A$ là biến cố: “Tổng số chấm xuất hiện trên ba con xúc xắc bằng 8”, $ B$ là biến cố: “Ít nhất một con xúc xắc ra 5 chấm”. Ta có $$ \mathrm{P}(A | B)=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}. $$

Vì $ B$ là biến cố: “Ít nhất một con xúc xắc xuất hiện mặt 5 chấm” nên $ \overline{B}$ là biến cố: “Không có con xúc xắc nào xuất hiện mặt 5 chấm”, do đó $$ \overline{B}=\big\{\left(i, j, k\right): 1\leqslant i, j, k\leqslant 6, i, j, k\neq 5\big\}. $$

Suy ra $$ \mathrm{P}(\overline{B})=\frac{|\overline{B}|}{|\Omega|}=\frac{5^3}{6^3}. $$

Do đó $$ \mathrm{P}(B)=1-\mathrm{P}(\overline{B})=1-\frac{5^3}{6^3}=\frac{91}{216}. $$

Ta thấy $ AB$ là biến cố: “Tổng số chấm xuất hiện trên ba con xúc xắc bằng 8 và ít nhất một con xúc xắc ra 5 chấm”, do đó $$ AB=\big\{\left(1, 2, 5\right), \left(1, 5, 2\right), \left(2, 1, 5\right), \left(2, 5, 1\right), \left(5, 1, 2\right),\left(5, 2, 1\right)\big\}. $$

Suy ra $$ \mathrm{P}(AB)=\frac{|AB|}{|\Omega|}=\frac{15}{6^3}=\frac{15}{216}. $$

Vậy xác suất cần tìm là $$ \mathrm{P}(A | B)=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}=\frac{{15}/{216}}{{91}/{216}}=\frac{15}{91}. $$

Ví dụ 4. Một gia đình có 2 đứa trẻ. Biết rằng có ít nhất 1 đứa trẻ là con gái. Hỏi xác suất 2 đứa trẻ đều là con gái là bao nhiêu?

Hướng dẫn. Chúng ta có các nhận xét sau:

  • Xác suất để một đứa trẻ là trai hoặc gái là bằng nhau và bằng $ 1/2$.
  • Giới tính cả 2 đứa trẻ là ngẫu nhiên và không liên quan đến nhau.

Lời giải. Do gia đình có 2 đứa trẻ nên sẽ có thể xảy ra 4 khả năng:

(trai, trai), (gái, gái), (gái, trai), (trai, gái).

Gọi $ A$ là biến cố “Cả hai đứa trẻ đều là con gái” và $ B$ là biến cố “Có ít nhất một đứa trẻ là con gái” thì có $$ \mathrm{P}(A)=\frac{1}{4},\quad \mathrm{P}(B)=\frac{3}{4}. $$
Do nếu xảy ra $ A$ thì đương nhiên sẽ xảy ra $ B$ nên ta có: $$ \mathrm{P}(AB) = \mathrm{P}(A) =\frac{1}{4}. $$
Suy ra, xác suất để cả hai đứa trẻ đều là con gái khi biết ít nhất có một đứa trẻ là gái là
$$\mathrm{P}(A | B) = \dfrac{\mathrm{P}\left(A,B\right)}{\mathrm{P}(B)} = \dfrac{{1}/{4}}{{3}/{4}} = \frac{1}{3}.$$
Bằng trực quan ta cũng có thể nhìn ra xác suất này. Khi biết một đứa trẻ là gái, giới tính của 2 đứa trẻ sẽ có 3 khả năng: (trai, gái), (gái, trai), (gái, gái).

Ví dụ 5. Một hộp chứa 8 bi trắng, 2 bi đỏ. Lần lượt bốc từng bi. Giả sử lần đầu tiên bốc được bi trắng. Xác định xác suất
lần thứ 2 bốc được bi đỏ.

Hướng dẫn. Gọi $ B$ là biến cố lần 1 bốc được bi trắng, $ A$ là biến cố lần 2 bốc được bi đỏ. Xác suất lần 2 bốc được bi đỏ khi lần 1 đã bốc được bi trắng là $$ \mathrm{P}(A | B)=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}=\frac{8/10\times 2/9}{8/10}=\frac{2}{9}. $$

2. Công thức nhân xác suất

2.1. Công thức nhân xác suất

Từ công thức tính xác suất có điều kiện $$ \mathrm{P}(A | B)=\frac{\mathrm{P}(AB)}{\mathrm{P}(B)}, \quad \mathrm{P}(B|A)=\frac{\mathrm{P}(AB)}{\mathrm{P}(A)},$$ ta suy ra công thức nhân xác suất $$ \mathrm{P}(AB)=\mathrm{P}(B)\mathrm{P}(A | B)=\mathrm{P}(A)\mathrm{P}\left(B | A\right), $$ với $ \mathrm{P}(A)>0{,} \mathrm{P}(B)>0$.

Công thức nhân xác suất sử dụng trong một số trường hợp, khi mà chúng ta có thể biết ngay xác suất $ \mathrm{P}\left(B | A\right)$ hoặc $ \mathrm{P}(A | B)$ thì sẽ tính được xác suất $ \mathrm{P}(AB)$.

Ví dụ 1. Trong hộp có 20 nắp chai bia Tiger, trong đó có 2 nắp ghi “Chúc mừng bạn đã trúng thưởng”. Bạn được chọn lên rút thăm lần lượt hai nắp chai bia, tính xác suất để cả hai nắp đều trúng thưởng.

Hướng dẫn. Gọi $ A$ là biến cố “nắp chai bia thứ nhất trúng thưởng”, $ B$ là biến cố “nắp chai bia thứ hai trúng thưởng”, $ C$ là biến cố “cả 2 nắp đều trúng thưởng”.

Khi bạn rút thăm lần đầu thì trong hộp có 20 nắp trong đó có 2 nắp trúng nên $$ \mathrm{P}(A)=\frac{2}{20}. $$

Khi biến cố $ A$ đã xảy ra thì còn lại 19 nắp trong đó có 1 nắp trúng thưởng. Do đó $$ \mathrm{P}\left(B/A\right) = \frac{1}{19}. $$
Suy ra, xác suất để cả hai nắp đều trúng thưởng là $$ \mathrm{P}\left(C\right) = \mathrm{P}(A). \mathrm{P}\left(B/A\right) = \frac{2/20}{1/19} = \frac{1}{190} \approx 0{,}0053. $$

Ví dụ 2. Một bình đựng 5 viên bi kích thước, chất liệu như nhau, trong đó có 3 viên bi xanh và 2 viên bi trắng. Lấy ngẫu nhiên ra một viên bi, rồi lại lấy ngẫu nhiên ra một viên bi nữa. Tính xác suất để lấy được một viên bi xanh ở lần thứ nhất và một viên bi trắng ở lần thứ hai.

Hướng dẫn. Gọi $ A$ là biến cố: “Lấy được một viên bi xanh ở lần thứ nhất”, $ B$ là biến cố: “Lấy được một viên bi trắng ở lần thứ hai”. Chúng ta cần tính xác suất $ \mathrm{P}(AB)$.

Theo công thức nhân xác suất $$ \mathrm{P}(AB)=\mathrm{P}(A)\mathrm{P}\left(B | A\right). $$
Vì có 3 viên bi xanh trong tổng số 5 viên bi nên $$ \mathrm{P}(A)=\frac{3}{5}=0{,}6. $$
Nếu $ A$ đã xảy ra, tức là một viên bi xanh đã được lấy ra ở lần thứ nhất, thì còn lại trong bình 4 viên bi trong đó số viên bi trắng là 2, do đó $$ \mathrm{P}\left(B | A\right)=\frac{2}{4}=0{,}5. $$
Vậy xác suất cần tìm là $$ \mathrm{P}(AB)=\mathrm{P}(A)\mathrm{P}\left(B | A\right)=0{,}6\times 0{,}5=0{,}3. $$

2.2. Công thức nhân xác suất tổng quát

Bằng phương pháp quy nạp, ta có công thức nhân xác suất tổng quát sau:

Giả sử $ n\geqslant 2$ và $ A_1, A_2,\ldots, A_n$ là các biến cố sao cho $ \mathrm{P}\left(A_1A_2\ldots A_{n-1}\right)>0$. Khi đó ta có $$ \mathrm{P}\left(A_1A_2\ldots A_{n}\right)=\mathrm{P}\left(A_1\right)\mathrm{P}\left(A_2 | A_1\right)\mathrm{P}\left(A_3 | A_1A_2\right)\ldots\mathrm{P}\left(A_n | A_1A_2\ldots A_{n-1}\right). $$

Ví dụ 3. Một thủ kho có một chùm chìa khóa gồm 9 chiếc bề ngoài giống hệt nhau trong đó chỉ có hai chiếc mở được cửa kho. Anh ta thử ngẫu nhiên từng chìa (chìa nào không đúng thì bỏ ra khỏi chùm chìa khóa). Tìm xác suất để lần thử thứ ba thì anh ta mới mở được cửa.

Hướng dẫn. Gọi $ A_1$ là biến cố: “Không mở được cửa ở lần thử thứ 1”, $ A_2$ là biến cố: “Không mở được cửa ở lần thử thứ 2” và $ A_3$ là biến cố: “Mở được cửa ở lần thử thứ 3”. Ta phải tìm $ \mathrm{P}\left(A_1A_2A_3\right)$. Theo công thức nhân xác suất ta có $$ \mathrm{P}\left(A_1A_2A_3\right)=\mathrm{P}\left(A_1\right)\mathrm{P}\left(A_2|A_1\right)\mathrm{P}\left(A_3|A_1A_2\right). $$

Ta có $$ \mathrm{P}\left(A_1\right)=\frac{7}{9}, \mathrm{P}\left(A_2|A_1\right)=\frac{6}{8}, \mathrm{P}\left(A_3|A_1A_2\right)=\frac{2}{7}. $$

Do đó $$ \mathrm{P}\left(A_1A_2A_3\right)=\frac{7}{9}\times\frac{6}{8}\times\frac{2}{7}=\frac{1}{6}. $$

Ví dụ 4. Một người săn thỏ trong rừng, khả năng anh ta bắn trúng thỏ trong mỗi lần bắn tỷ lệ nghịch với khoảng cách bắn. Anh ta bắn lần đầu ở khoảng cách 20 m với xác suất trúng thỏ là 0,5, nếu bị trượt anh ta bắn viên thứ 2 ở khoảng cách 30 m, nếu lại trượt anh ta bắn viên thứ 3 ở khoảng cách 50 m. Tính xác suất để người thợ săn bắn được thỏ.

Hướng dẫn. Gọi $ A_k$ là biến cố “Người thợ săn bắn trúng thỏ ở lần thứ $ k$” với $ k=1,2,3.$ Theo đề bài, chúng ta có
\begin{align}
\mathrm{P}\left(A_1\right)&=0{,}5,\\
\mathrm{P}\left(A_2|\overline{A_1}\right)&=\frac{20\times 0{,}5}{30}=\frac{1}{3},\\
\mathrm{P}\left(A_3|\overline{A_1}.\overline{A_2}\right)&=\frac{20\times 0{,}5}{50}=\frac{1}{5}.
\end{align}
Gọi $ A$ là biến cố “Người thợ săn bắn trúng thỏ” thì $$ A=A_1\cup \overline{A_1}A_2\cup \overline{A_1}.\overline{A_2}.A_3. $$
Vì các biến cố $ A_1, \overline{A_1}A_2, \overline{A_1}.\overline{A_2}.A_3$ xung khắc từng đôi một, nên ta có
$$ \mathrm{P}(A)=\mathrm{P}\left(A_1\right)+\mathrm{P}\left(\overline{A_1}A_2\right)+\mathrm{P}\left(\overline{A_1}.\overline{A_2}.A_3\right) $$
Theo công thức nhân xác suất thì
$$ \mathrm{P}\left(\overline{A_1}A_2\right) = \mathrm{P}\left(\overline{A_1}\right)\mathrm{P}\left(A_2|\overline{A_1}\right)=\left(1-0{,}5\right)\times \mathrm{P}\left(A_2|\overline{A_1}\right)=\frac{1}{6}. $$
$$ \mathrm{P}\left(\overline{A_1}.\overline{A_2}.A_3\right)= \mathrm{P}\left(\overline{A_1}\right) \mathrm{P}\left(\overline{A_2}|\overline{A_1}\right)\mathrm{P}\left(A_3|\overline{A_1}.\overline{A_2}\right)=\left(1-0{,5}\right)\left(1-\frac{1}{3}\right)\times \frac{1}{5} =\frac{1}{15}.$$
Do đó, xác suất cần tìm là $$ \mathrm{P}(A)=0{,}5+\frac{1}{6}+\frac{1}{15}=\frac{11}{15}. $$

3. Công thức xác suất đầy đủ

3.1. Hệ đầy đủ các biến cố

Hệ các biến cố $ \big\{B_1, B_2,\ldots, B_n\big\}$ được gọi là đầy đủ nếu thỏa mãn đồng thời hai điều kiện:

  • $ B_1, B_2,\ldots, B_n$ là các biến cố xung khắc từng đôi một, nghĩa là $ B_iB_j=\varnothing$ với mọi $ i\neq j$,
  • $ \Omega=B_1\cup B_2\cup\cdots\cup B_n$.

Nhận xét rằng, hệ $ \big\{B, \overline{B}\big\}$ là một hệ đầy đủ, trong đó $ B$ là một biến cố bất kỳ.

3.2. Công thức xác suất đầy đủ

Giả sử $ \big\{B_1, B_2,\ldots, B_n\big\}$ là hệ đầy đủ các biến cố với $ \mathrm{P}\left(B_i\right)>0,\,\forall i=1,2,\ldots,n$. Khi đó với bất kỳ biến cố $ A$, ta có $$ \mathrm{P}(A)=\mathrm{P}\left(B_1\right)\mathrm{P}\left(A | B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A | B_2\right)+\cdots+\mathrm{P}\left(B_n\right)\mathrm{P}\left(A | B_n\right). $$

Ví dụ 1. Có 3 hộp giống nhau. Hộp thứ nhất đựng 10 sản phẩm, trong đó có 6 chính phẩm, hộp thứ hai đựng 15 sản phẩm, trong đó có 10 chính phẩm, hộp thứ ba đựng 20 sản phẩm, trong đó có 15 chính phẩm. Lấy ngẫu nhiên một hộp và từ đó lấy ngẫu nhiên một sản phẩm. Tìm xác suất để lấy được chính phẩm.

Hướng dẫn. Ký hiệu $ B_k$ là biến cố: “Sản phẩm lấy ra thuộc hộp thứ $ k$”, $ k=1, 2, 3$ và $ A$ là biến cố: “Lấy được chính phẩm”. Chúng ta có ngay $ \big\{B_1, B_2, B_3\big\} $là hệ đầy đủ các biến cố và

  • $ \mathrm{P}\left(B_1\right)=\frac{1}{3}, \mathrm{P}\left(B_2\right)=\frac{1}{3}, \mathrm{P}\left(B_3\right)=\frac{1}{3},$
  • $ \mathrm{P}\left(A | B_1\right)=\frac{6}{10}, \mathrm{P}\left(A | B_2\right)=\frac{10}{15}, \mathrm{P}\left(A | B_3\right)=\frac{15}{20}.$

Theo công thức xác suất đầy đủ $$ \mathrm{P}(A)=\mathrm{P}\left(B_1\right)\mathrm{P}\left(A | B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A | B_2\right)+\mathrm{P}\left(B_3\right)\mathrm{P}\left(A | B_3\right) $$

Thay các giá trị tính được ở trên vào công thức này ta thu được $$ \mathrm{P}(A)=\frac{1}{3}\times \frac{6}{10}+\frac{1}{3}\times \frac{10}{15}+\frac{1}{3}\times \frac{15}{20}=\frac{31}{45} $$
Vậy xác suất để lấy được chính phẩm là $ {31}/{45}$.

Ví dụ 2. Từ một hộp chứa $ m$ quả cầu trắng và $ n$ quả cầu đen, người ta rút ngẫu nhiên không hoàn lại từng quả một hai lần. Tính xác suất để quả lấy lần thứ hai là trắng.

Hướng dẫn. Ký hiệu $ A$ là biến cố: “Lần thứ hai rút được quả cầu trắng”, $ B_1$ là biến cố: “Lần thứ nhất rút được quả cầu trắng”, $ B_2$ là biến cố: “Lần thứ nhất rút được quả cầu đen”.

Ta có

  • $ \mathrm{P}\left(B_1\right)=\frac{m}{m+n}, \mathrm{P}\left(B_2\right)=\frac{n}{m+n},$
  • $ \mathrm{P}\left(A|B_1\right)=\frac{m-1}{m+n-1}, \mathrm{P}\left(A|B_2\right)=\frac{m}{m+n-1}.$

Vì $ \big\{B_1, B_2\big\}$ là một hệ đầy đủ nên theo công thức xác suất đầy đủ, chúng ta có \begin{align}
\mathrm{P}(A)&=\mathrm{P}\left(B_1\right)\mathrm{P}\left(A|B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A|B_2\right)\\
=&\frac{m}{m+n}\times\frac{m-1}{m+n-1}+\frac{n}{m+n}\times\frac{m}{m+n-1}\\
=&\frac{m\left(m-1\right)+mn}{\left(m+n\right)\left(m+n-1\right)}
=&\frac{m\left(m+n-1\right)}{\left(m+n\right)\left(m+n-1\right)}
=&\frac{m}{m+n}.
\end{align}
Vậy xác suất để quả lấy lần thứ hai là trắng là$ \frac{m}{m+n}$.

Ví dụ 3. Có 10 chiếc túi đựng bi như sau:

  • 4 túi loại 1, trong mỗi túi loại 1 chứa 6 viên bi trắng và 4 viên bi đen,
  • 2 túi loại 2, trong mỗi túi loại 2 chứa 3 viên bi trắng và 7 viên bi đen,
  • 1 túi loại 3, trong mỗi túi loại 3 chứa 7 viên bi trắng và 3 viên bi đen,
  • 3 túi loại 4, trong mỗi túi loại 4 chứa 4 viên bi trắng và 6 viên bi đen.

Chọn ngẫu nhiên 1 chiếc túi rồi lấy ngẫu nhiên 2 viên bi. Tính xác suất để lấy được hai viên bi cùng màu.

Hướng dẫn. Ký hiệu $ B_k$ là biến cố “chọn được túi loại $ k$”, $ k=1, 2, 3, 4$ và $ A$ là biến cố “lấy được hai viên bi cùng màu”.

Ta có $ \big\{B_1, B_2, B_3, B_4\big\} $ là hệ đầy đủ các biến cố và

\begin{align}
\mathrm{P}\left(B_1\right)=\frac{4}{10}, \mathrm{P}\left(B_2\right)=\frac{2}{10},\\
\mathrm{P}\left(B_3\right)=\frac{1}{10}, \mathrm{P}\left(B_4\right)=\frac{3}{10},\\
\mathrm{P}\left(A | B_1\right)=\frac{C_6^2+C_4^2}{C_{10}^2}=\frac{21}{45},\mathrm{P}\left(A | B_2\right)=\frac{C_3^2+C_7^2}{C_{10}^2}=\frac{24}{45},\\
\mathrm{P}\left(A | B_3\right)=\frac{C_7^2+C_3^2}{C_{10}^2}=\frac{24}{45}, \mathrm{P}\left(A | B_4\right)=\frac{C_4^2+C_6^2}{C_{10}^2}=\frac{21}{45}.
\end{align}

Theo công thức xác suất đầy đủ
$$ \mathrm{P}(A)=\mathrm{P}\left(B_1\right)\mathrm{P}\left(A | B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A | B_2\right)+\mathrm{P}\left(B_3\right)\mathrm{P}\left(A | B_3\right)+\mathrm{P}\left(B_4\right)\mathrm{P}\left(A | B_4\right) $$

Suy ra $$ \mathrm{P}(A)=\frac{4}{10}\times \frac{21}{45}+\frac{2}{10}\times \frac{24}{45}+\frac{1}{10}\times \frac{24}{45}+\frac{3}{10}\times \frac{21}{45} =\frac{219}{450}. $$

Vậy xác suất cần tìm là $ \frac{219}{450}$.

Ví dụ 4. Có hai cái hộp. Hộp thứ nhất có 4 bi trắng và 5 bi đen. Hộp thứ hai có 5 bi trắng và 4 bi đen. Chọn ngẫu nhiên 3 viên bi ở hộp thứ nhất bỏ vào hộp thứ hai rồi sau đó chọn ngẫu nhiên một viên bi ở hộp thứ hai ra. Tính xác suất để lấy được bi trắng từ hộp thứ hai.

Hướng dẫn. Gọi $ A$ là biến cố: “Lấy được bi trắng từ hộp thứ hai”, $ B_k$ là biến cố: “Trong 3 viên bi lấy ra từ hộp thứ nhất có $ k$ bi trắng”, $ k=0, 1, 2, 3$.

Khi đó $ \big\{B_0{,} B_1, B_1, B_3\big\} $ là hệ đầy đủ các biến cố và ta có
\begin{align}
\mathrm{P}\left(B_0\right)&=\frac{C_5^3}{C_9^3}=\frac{10}{84},\\
\mathrm{P}\left(B_1\right)&=\frac{C_4^1C_5^2}{C_9^3}=\frac{40}{84},\\
\mathrm{P}\left(B_2\right)&=\frac{C_4^2C_5^1}{C_9^3}=\frac{30}{84},\\
\mathrm{P}\left(B_3\right)&=\frac{C_4^3}{C_9^3}=\frac{4}{84}.
\end{align}

Theo công thức xác suất đầy đủ
$$ \mathrm{P}(A)=\mathrm{P}\left(B_0\right)\mathrm{P}\left(A | B_0\right)+\mathrm{P}\left(B_1\right)\mathrm{P}\left(A | B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A | B_2\right)+\mathrm{P}\left(B_3\right)\mathrm{P}\left(A | B_3\right). $$

Dễ thấy
\begin{align}
\mathrm{P}\left(A | B_0\right)=\frac{5}{12},\quad & \mathrm{P}\left(A | B_1\right)=\frac{6}{12},\\
\mathrm{P}\left(A | B_2\right)=\frac{7}{12},\quad & \mathrm{P}\left(A | B_3\right)=\frac{8}{12}.
\end{align}

Thay các giá trị này vào công thức xác suất đầy đủ ta được $$ \mathrm{P}(A)=\frac{10}{84}\times\frac{5}{12}+\frac{40}{84}\times\frac{6}{12}+\frac{30}{84}\times\frac{7}{12}+\frac{4}{84}\times\frac{8}{12} =\frac{532}{1008} =\frac{19}{36}. $$

Vậy xác suất cần tìm là $ {19}/{36}$.

Ví dụ 5. Trong một cái hộp có $ n$ sản phẩm, ta bỏ vào cái hộp đó một sản phẩm tốt sau đó lấy ngẫu nhiên ra một sản phẩm. Tính xác suất để sản phẩm lấy ra là tốt nếu mọi giả thiết về trạng thái cấu thành ban đầu của hộp là đồng xác suất.

Hướng dẫn. Gọi $ A$ là biến cố: “Lấy được sản phẩm tốt”, $ B_i$ là biến cố: “Lúc ban đầu hộp có $ i$ sản phẩm tốt”, $ i=0,1,\ldots,n$. Khi đó $ \big\{B_0{,} B_1,\ldots, B_n\big\} $ là hệ đầy đủ các biến cố.

Theo giả thiết $$ \mathrm{P}\left(B_i\right)=\frac{1}{n+1}, i=0,1,\ldots,n.$$

Ta có $ \mathrm{P}\left(A | B_i\right)=\frac{i+1}{n+1}$ với mọi $ i=0,1,\ldots,n$. Theo công thức xác suất đầy đủ

$$ \mathrm{P}(A)=\sum\limits_{i=0}^{n}\mathrm{P}\left(B_i\right)\mathrm{P}\left(A | B_i\right). $$

Thay vào ta được
\begin{align}
\mathrm{P}(A)&=\sum\limits_{i=0}^{n}\frac{i+1}{\left(n+1\right)^2}\\
&=\frac{1+2+\cdots+\left(n+1\right)}{\left(n+1\right)^2}\\
&=\frac{\left(n+1\right)\left(n+2\right)}{2\left(n+1\right)^2}\\
&=\frac{n+2}{2\left(n+1\right)}.
\end{align}

4. Công thức Bayes – Định lý Bayes

Giả sử $ \mathrm{P}(A)>0$ và $ \big\{B_1, B_2,\ldots, B_n\big\} $ là hệ đầy đủ các biến cố với $ \mathrm{P}\left(B_k\right)>0$ với mọi $ k=1,2,\ldots,n$. Khi đó với mọi $ k=1,2,\ldots,n$, ta có $$ \mathrm{P}\left(B_k | A\right)=\frac{\mathrm{P}\left(B_k\right)\mathrm{P}\left(A | B_k\right)}{\mathrm{P}\left(B_1\right)\mathrm{P}\left(A | B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A | B_2\right)+\cdots+\mathrm{P}\left(B_n\right)\mathrm{P}\left(A | B_n\right)}. $$

Ví dụ 1. Dây chuyền lắp ráp nhận được các chi tiết do hai máy sản xuất. Trung bình máy thứ nhất cung cấp 60\% chi tiết, máy thứ hai cung cấp 40\% chi tiết. Khoảng 90\% chi tiết do máy thứ nhất sản xuất là đạt tiêu chuẩn, còn 85\% chi tiết do máy thứ hai sản xuất là đạt tiêu chuẩn. Lấy ngẫu nhiên từ dây chuyền một sản phẩm, thấy nó đạt tiêu chuẩn. Tìm xác suất để sản phẩm đó do máy thứ nhất sản xuất.

Hướng dẫn. Gọi $ A$ là biến cố: “Chi tiết lấy từ dây chuyền đạt tiêu chuẩn”, $ B_1$ là biến cố: “Chi tiết do máy thứ nhất sản xuất” và $ B_2$ là biến cố: “Chi tiết do máy thứ hai sản xuất”. Ta cần tính xác suất $ \mathrm{P}\left(B_1|A\right)$.

Theo công thức Bayes $$ \mathrm{P}\left(B_1|A\right)=\frac{\mathrm{P}\left(B_1\right)\mathrm{P}\left(A|B_1\right)}{\mathrm{P}\left(B_1\right)\mathrm{P}\left(A|B_1\right)+\mathrm{P}\left(B_2\right)\mathrm{P}\left(A|B_2\right)}. $$

Theo điều kiện bài toán $$ \mathrm{P}(B_1)=0{,}6; \mathrm{P}(B_2)=0{,}4; $$
$$ \mathrm{P}(A|B_1)=0{,}9; \mathrm{P}(A|B_2)=0{,}85. $$

Thay vào ta có $$ \mathrm{P}\left(B_1|A\right)=\frac{0{,}6\times 0{,}9}{0{,}6\times 0{,}9+0{,}4\times 0{,}85}=0{,}614. $$

Sau đây là một bài toán khá nổi tiếng trong xác suất thống kê, được giải theo nhiều cách khác nhau. Ta hãy thử giải bài toán này bằng định lý Bayes.
Ví dụ 2.[Bài toán Tuesday Child] Một gia đình có hai đứa trẻ. Biết có ít nhất có một đứa trẻ là con gái và sinh vào thứ 3. Hỏi xác suất 2 đứa trẻ đều là con gái là bao nhiêu?

Hướng dẫn. Chúng ta có nhận xét sau:

  • Xác suất để một đứa trẻ sinh vào một ngày nhất định trong tuần là $ 1/7$.
  • Giới tính của đứa trẻ và ngày sinh của nó là 2 sự kiện không liên quan đến nhau.

Ta ký hiệu các biến cố như sau:

  • $ B$ là biến cố “Ít nhất 1 đứa trẻ là con gái sinh ra vào thứ 3”,
  • $ A$ là biến cố “Cả 2 đứa trẻ đều là con gái”, xác suất là $ \mathrm{P}(A)=1/4$,
  • $ A_1$ là biến cố “Chỉ một trong 2 đứa trẻ là con gái”, $ \mathrm{P}(A_1)=1/2$,
  • $ C $ là biến cố “Đứa trẻ sinh ra vào thứ 3”, $ \mathrm{P}(C)=1/7$,
  • $ \overline{C} $ là biến cố “Đứa trẻ sinh ra vào thứ 3”, $ \mathrm{P}(\overline{C})=6/7$.

Để sử dụng định lý Bayes tính $ \mathrm{P}(A | B)$ ta cần tính được $ \mathrm{P}(B|A)$ và $ \mathrm{P}(B)$.

$ \mathrm{P}(B|A)$ được hiểu là xác suất ít nhất 1 đứa trẻ là con gái sinh ra vào thứ 3 nếu biết trước 2 đứa trẻ là con gái.
Ta sẽ tính xác suất phần bù $ \mathrm{P}(\overline{B}|A)$, đây là xác suất để không có đứa trẻ nào sinh ra vào thứ 3.
$$ \mathrm{P}(\overline{B}|A) = \mathrm{P}(\overline{C}) \mathrm{P}(\overline{C}) = \dfrac{6}{7} \times \dfrac{6}{7} = \dfrac{36}{49} $$
Như vậy ta có
$$ \mathrm{P}(B|A) = 1 – \mathrm{P}(\overline{B}|A) = \dfrac{13}{49} $$
$ \mathrm{P}(B)$ là xác suất sự ít nhất 1 đứa trẻ là con gái sinh ra vào thứ 3. Sự kiện này bao gồm 2 khả năng:

  • Cả 2 đứa trẻ đều là con gái $ A$,
  • Chỉ 1 đứa trẻ là con gái $ A_1$.

Ta có \begin{align}
\mathrm{P}(B) &= \mathrm{P}(BA) + \mathrm{P}(BA_1) \\
&= \mathrm{P}(B|A)\mathrm{P}(A) + \mathrm{P}(B|A_1)\mathrm{P}(A_1)\\
&= \dfrac{13}{49} \times \dfrac{1}{4} + \dfrac{1}{7} \times \dfrac{1}{2}\\
&=\dfrac{27}{196}
\end{align}

Thay vào định lý Bayes, ta tính được
$$ \mathrm{P}(A | B) = \dfrac{\mathrm{P}(B|A)\times \mathrm{P}(A)}{\mathrm{P}(B)} = \dfrac{\tfrac{13}{49} \times \tfrac{1}{4}}{\tfrac{27}{196}} = \dfrac{13}{27} \approx 0{,}481 $$
Chúng ta có thể minh họa bằng hình vẽ sau đây, xác suất cần tìm chính bằng số ô màu xanh chia cho tổng số ô màu vàng và xanh.

xác suất có điều kiện, định lý công thức bayes

Ta dùng một đoạn code Python nho nhỏ để kiểm tra thử kết quả vừa tính được.

import random

def random_kid():
   gender = random.choice(["boy", "girl"])
   birth_date = random.choice(["mon", "tue", "wed", "thu", "fri", "sat", "sun"])
   return (gender, birth_date)

both_girls = 0
tuesday_girl = 0

random.seed(0)
total = 100000
for _ in range(total):
   first_child = random_kid()
   second_child = random_kid()

if first_child == ("girl", "tue") or second_child == ("girl", "tue"):
   tuesday_girl += 1
if first_child[0] == "girl" and second_child[0] == "girl":
   both_girls += 1

print("both_girls = ", both_girls)
print("tuesday_girl = ", tuesday_girl)
print("P(both_girls|tuesday_girl) = ", both_girls / tuesday_girl)

Đoạn code trên thực hiện random 100K dữ liệu. Thu được kết quả in ra như sau

both_girls = 6506
tuesday_girl = 13637
P(both_girls|tuesday_girl) = 0.4770844027278727

Xác suất tính ra tương đối sát với con số ta tính bằng định lý Bayes ở trên.

Bài viết tổng hợp từ https://1upnote.me/post/2018/11/ds-ml-bayes-theorem/ và https://math4rum.wordpress.com/2013/04/01/bai-1-5-cong-thuc-xac-suat-day-du-cong-thuc-bayes/

hocbaicungcon

Leave a Reply

Your email address will not be published. Required fields are marked *