małe kłamstwa, duże kłamstwa, statystyka, PKW i Bronisław

Będąc pod wrażeniem tygodniowych obliczeń głosów oddanych przez nasze (cytując klasyka) ¨przypadkowe społeczeństwo¨, zastanawiałem się nad pewnymi zawiłościami natury statystycznej. Oczywiście statystyka jako taka może pokazać dokładnie te rzeczy, jakie uprawiajacy statystykę sobie życzy ale ma tez to do siebie, że stosując ją z zachowaniem pewnych prawideł możemy z b. dużym prawdopodobieństwem szacować, czy dane zdarzenie mieściło się w kategoriach normalnej różnorodności zachodzącej niejako per se, czy raczej powinniśmy mówić o zdarzeniu wskutek ingerencji zjawisk pozornie niezwiązanych. Niektórzy mogliby wpleść tu pojęcie cudu, w tym jego popularnej ostatnio odmiany - cudu nad urną. Zeby zilustrować w prostych słowach: w pewnej wsi jedna z dziecieciu zamężnych pań zdradziła męża 100 razy, dziewięć z owych pań nigdy. Statystycznie mamy więc we wsi dziesięciu rogaczy lub też jedną panią, która zdradza męża w stopniu zdecydowanie odbiegającym od średniej dla całej wsi - oczywiście w zależności od tego, czy statystykę i jej interpretację przeprowadzała sama główna bohaterka lub jej adwokat czy ktoś patrzący na zjawisko beznamiętnie z boku i mający do tego trzeźwy osąd rzeczywistości.

Przymyślenia przerwała mi wizyta na onecie w celu ¨próbkowania¨ nastrojów społecznych. Byłem po prostu ciekawy, czy wobec przewidywalnej aktywności aktywu wiadomej partii i jej koalicjanta spontaniczny spontaniczny odbiór społeczny wyborów samorządowych ad. 2014 będzie silniejszy czy też nie. Muszę przyznać, że byłem mile rozczarowany, gdyż wybory nie cieszyły się wielką wiarygodnością. Mimo tego natrafiłem na jeden komentarz:

¨Dlaczego politycy przed każdymi wyborami twierdzą, że sondaże są nic nie warte, a teraz powołują się na sondaż, który wskazywał na lepsze wyniki niż osiągnęli. Politycy chcą decydować o wynikach wyborczych. Wmawiają Wam, że wybory są sfałszowane kiedy nie są po ich myśli.¨

Postanowiłem odpowiedzieć:

¨Powoluja sie na sondaz, ktory bez pudla (z bledem np. rzedu 0,2%) przewidzial wyniki wyborow na prezydentow, wojtow i burmistrzow natomiast rzekomo pomylil rozklad glosow az o 10% w przypadku wyborow do sejmikow wojewodzkich. Biorac pod uwage, ze o oddany w tych polaczonych wyborach glos pytano dokladnie tych samych ludzi wychodzacych z lokali, nalezy zalozyc ze w przypadku prezydentow i burmistrzow powiedzieli ankieterom prawde natomiast w przypadku sejmikow wojewodzkich z premedytacja zrobili sobie z ankieterow jaja :)¨

No właśnie, chciałem zweryfikować swoją b. pobieżną interpretację o dane źrodłówe, których na stronie PKW niestety nie odnalazłem a które słyszałem jedynie wyrywkowo, np wg. ex-poll w Warszawie miała być druga tura i była, HGW miała dostać 47,5 i dostała, podobnie sytuacja z bardzo trafnymi rezultatami w Gdańsku, Lublinie, Krakowie i wielu innych miastach, gdzie prowadzono ex-poll. Chciałbym więc znać wyniki wyborów na prezydentów oraz wyniki do sejmików wojewódzkich w tym samych miastach a następnie skonfrontować je z ex-poll, aby stwierdzic, czy moja ironiczna hipoteza dla naiwnych ma racje bytu czy tez nie. Nastepnie chcialbym sprawdzic jeszcze jedną rzecz - czy liczba głosów w województwach, w których wygrało PSL i PO, oddanych na zwycięskie partie korelowała znacząco statystycznie z liczbą głosów nieważnych czy tez nie. I ostatnia rzecz, mianowicie czy województwa z wygrana PIS wyróżniały się statystycznie pod względem głosów nieważnych od wszystkich innych województw w sensie pozytywnym, t.j. było ich tamże najmniej. Odpowiednio uprawiana statystyka naprawde nie kłamie i pozwala weryfikować prawodpodobieństwo danej hipotezy na zasadzie małe - duże juz na wstępie. Oczywiście, można wierzyć, iż szansa 1 na 1.000.000 to spore prawdpodobieństwo (wszak ludziom udaje sie wygrać w lotto), tymniemniej ja osobiście patrząc realnie na swoje szanse nie postawiłbym dorobku swego życia na wytypowanie 6 z 49 kulek. Podobnie, mozna wierzyć, że szansa na rozbieżności między ex poll a wynikami PKW wyniesie + 7% dla PSL, - 5% dla PIS ale prawdopodobieństwo pokazałoby realne szanse na taki scenariusz.

Niestety nie posiadam tych danych i będę wdzięczny PKW za ich udostępnienie. ALE.... danych tych nie posiadał też z przyczyn oczywistych imć Bronisław Komorowski w momencie, kiedy wygłaszał do Narodu swoje słynne orędzie o odmętach szaleństwa na 4 dni przed podaniem wyników przez PKW. Przypomnę, iż prezydent sugerował odejście od zmysłów osobom, które kwestionowały prawidłowość procesu wyborczego a umocowaniem tejże tezy była rozmowa z przełożonymi sędziów mianowanych do PKW, którzy zresztą za kolejne dwa dni zrobili panu prezydentowi małego psikusa... Kwiatki typu oficjalne wyniki cząstkowe podane do publicznej wiadomości, skonfrontowane z rozbrajająco szczerą deklaracją szefa komisji wojewódzkiej pt. ¨ale przecież ja nie przesłałem im żadnego protokołu¨, pominę. Reasumując, uważam raczej za odmęty szaleństwa wygłaszanie takich buńczycznych tez bez skonfrontowania ich z danymi ale Bronisław ¨wpadka¨ Komorowski słynie już przecież ze swoich stwierdzeń a ludzie mimo wszystko go kochają w 70%. Prostym wyjaśnieniem tego paradoksu jest fakt, że nawet jeśli Prezydent z matematycznego punktu widzenia byłby skrajnym naiwniakiem, większość przecież i tak nie zrozumie sedna problemu. A dane ...... kto by tam o nie pytał.. zapewne jakies oszołomy.