German Tank Problem
Alianci chcieli oszacować jak szybko siły niemieckie produkują czołgi
Stąd pochodzi nazwa zagadnienia - German tank problem.
Oczywiście na początek przychodzą do głowy jedynie tradycyjne metody wywiadowcze. Jednakże statystycy wpadli na nieco inny pomysł, który w praktyce okazał się o wiele bardziej dokładny, niż informacje uzyskane tradycyjnymi sposobami.
Na początek rozpatrzmy sytuację, która tylko pozornie wydaje się być oderwaną od problemu. Załóżmy, że mamy urnę z kolejno ponumerowanymi kulami (1, 2, 3 i tak dalej) i chcemy w przybliżeniu określić ile jest wszystkich kul w urnie mogąc wyciągnąć jedynie pięć. Dla przykładu, ile w urnie najprawdopodobniej jest kul skoro udało nam się wyciągnąć te o numerach: 52, 71, 129, 151, 320? Oczywiście częśc osób może olać wyciągnięte kule i próbować ważyć urnę (choć ciężko oszacować wagę samej urny), bądź wkładając rączki do środka starać się jakoś policzyć ile ich jest (nie jest to jednak łatwe bez zerkania do środka). Te sposoby nazwałbym tradycyjnymi metodami wywiadowczymi ;) Przejdźmy jednak do konkretów.
Na pewno wiemy, że kul jest przynajmniej 320, ponieważ największy numer, który widzieliśmy to 320. Oznacza to, że możemy z pełną pewnością określić minimalną ilość kul. Nas jednak interesuje górne ograniczenie.
Okazuje się, że możemy je określić. Nie wdawać się w szczegóły (choć nie są skomplikowane - wymagają podstaw rachunku prawdopodobieństwa, bądź statystyki), przy takim ułożeniu kul możemy być prawie pewni, że kul jest co najwyżej 582 (pisząc prawie pewni, mam na myśli, iż istnieje jedynie 5% prawdopodobieństwo, że się pomylimy).
Jak można to intuicyjnie zrozumieć? Dlaczego kul najprawdopodobniej nie ma więcej?
Wyobraźmy sobie, że kul jest 2000 i wybralibyśmy 5 z nich. Czy wydaje się możliwe, że nie wybralibyśmy żadnej z numerem większym niż 320? Okazuje się, że wybranie jedynie małych liczb jest bardzo nieprawdopodobne i maleje wykładniczo z każdą kolejną kulą. To znaczy, że z każdą kolejną kulą nasza dokładność znacznie wzrasta.
A może na przykładzie?
Gdybyśmy mogli wyciągnąć jedynie jedną kule, a nie pięć, nie powiedzielibyśmy zbyt wiele. Gdyby tą jedyną kulą była trzydziestkadwójka wiedzielibyśmy prawie napewno, że kul jest co najwyżej 6400. Dokładność nie robi wrażenia i pewnie ważenie urny, czy oszacowanie liczby kul wkładąc do niej łapki byłoby dokładniejsze.
Z drugiej strony, jeśli moglibyśmy wyciągnąć dziesięć kul i największy numer byłby równy 320 to oznaczałoby, że kul jest prawie napewno od 320 do 432. Przy dwudziestu kulach, wiedzielibyśmy prawie na pewno, że kul jest od 320 do 371. O wiele dokładniejszy wynik.
W praktycznym zagadnieniu alianci zdecydowali się zamiast kul rozważać czołgi, których koła miały wpisywane numery seryjne. Gdybyśmy przyglądnęli się problemowi dokładniej to wiedzielibyśmy, że znamy nie tylko przedział w którym zawiera się możliwa produkcja czołgów, ale wiemy która z liczb w danym przedziale jest najbardziej prawdopodobną. To znaczy, że po za tym, że ilość czołgów zawiera się między 320 a 582, wiemy że napewniej jest to 383. Jest na to prosty wzór: m - 1 + m/k, gdzie m to maksimum wśród znalezionych liczb, a k to ilość wylosowanych liczb.
Dla pierwszego przykładu byłoby to odpowiednio 32 oraz 5, czyli szacunkowa ilość wszystkich kul to 320 - 1 + 320/5 = 319 + 64 = 383.
A jak to było na prawdę?
Według szacunków wywiadu aliantów Niemcy produkowali około 1400 czołgów miesięcznie od czerwca 1940 r. do września 1942. Stosując powyższy wzór dla numerów seryjnych przechwyconych niemieckich czołgów (zarówno sprawnych i zniszczonych), liczba została obliczona na 246 miesięcznie. Po wojnie okazało się, że pokazał rzeczywistą liczbą było 245 (Gavyn Davies. How a statistical formula won the war The Guardian, 20 July 2006).
Przejdź do komentarzy
Autor: Kot