Man patīk, ka cilvēki eksperimentē ar datu vizualizāciju. Bet, ne vienmēr ieguldītais darbs attaisno sevi. Turklāt, ja nav piešauta roka, labāk zīmēt grafikas vispārpieņemtā veidā. Citādi var gadīties, ka dati kļūst pilnīgi neuztverami.
LSM.LV ir rubrika Melu detektors, kas analizē dažādu publisku personu izteikumu patiesumu. Žurnāliste Evita Puriņa pieķērās Saeimas deputāta Jāņa Dombrava izteikumiem par tuvredzīgo politiku, slēdzot vairākas dzemdību nodaļas Latvijas reģionos. Lai pētījuma publikācija neizskatītos pārlieku pliekani, to papildināja Liene Rubane, sagatavojot divas visnotaļ interesantas grafikas.
Pirmajā grafikā ir mēģināts salīdzināt dzemdību skaita izmaiņas dažādās dzemdību nodaļās Latvijā. Pamēģiniet izsekot līdzi katras dzemdību nodaļas skaitļiem un saprast, kāpēc gadi tiek mainīti vietām. Ja slinkums skatīties visu, pamēģiniet saprast, kurš skaitlis attiecās uz kuru gadu Valmierā.
Tā kā raksta autore argumentēja, ka pēc vairāku reģionālo dzemdību nodaļu slēgšanas Rīgas dzemdību nodaļās būtisku izmaiņu nebija, to ilustrēja ar dzemdību skaitu Rīgas dzemdību namā, nez kāpēc pie reizes piemetot arī stipri senākus datus.
Nevar pārmest Lienei atjautīgu krāsu un dažādu objektu lietošanu, tomēr datiem ne īpaši patīk, ja tos izraibina. Ja atmet pirmajā grafikā fona čūskas, bet otrajā grafikā oranžos trijstūrus, mūsu priekšā būs praktiski lietojama grafika ar ikdienišķām, kaitinošām kļūdām.
Par kļūdām. Abās grafikās bezjēdzīgi ir izvietotas mēroga asis. Katram punktam blakus jau ir uzrakstīta precīza vērtība, līdz ar to asīm nav nekādas funkcionālas jēgas.
Pirmajā grafikā ir vairākas atsauces (leģendas), kas traucē, nevis paskaidro. Pat pēc iedziļināšanās es saputrojos ar slēgtajām iestādēm. Sarkans nozīmē slēgts, bet vēl ir sarkans ar zvaigznīti, kas nozīmē, ka slēgts bija 2008. gada februārī. Un atsauces vispār nav nekas labs. Iesaku grafikās no tām pēc iespējas izvairīties.
Pats galvenais pirmās grafikas trūkums ir nepareiza grafikas veida izvēle. Skaidrs, ka meitenei bija grūti izdomāt, kā veiksmīgi salīdzināt vairākus tūkstošus ar dažiem desmitiem, pa vidam salīdzinot arī ļoti līdzīgus skaitļus pie simtiem. Palīgā nāk grafikas veids, kuru ļoti plaši izmanto maršrutu plānošanā sabiedriskajam transportam, īpaši dzelzceļam.
Gadījumā ar mūsu datiem gan būs daudz vienkāršāka grafika, jo dati ir tikai par diviem gadiem (OpenTrack piemērā var izsekot katra vilciena atrašanās vietai maršrutā jebkurā laika sprīdī).
Turklāt, daudz loģiskāk būtu otrās grafikas datus skatīties kopā ar Latvijā notikušajām dzemdībām tajā pašā periodā. Paņemam datus no Centrālās statistikas pārvaldes, pieliekam klāt pie jau esošajiem no Rīgas Dzemdību nama. Top skaidrs, ka tendences ir praktiski vienādas, tāpēc datus var rādīt kā sīkdiagrammu (sparkline), izceļot vien minimālās un maksimālās vērtības. Datus pirms 2008. gada rādīt nevajag, jo raksts nav par to.
Vēl dažas īpatnības. Es pieliku klāt krāsu kodējumu tām dzemdību nodaļām, kurās vērojams jaundzimušo pieaugums. Un sīkumainais skatītājs pamanīs, ka slēgtās dzemdību nodaļas atrodas vienā mērogā un skalā ar pārējo grafiku. Vienīgais izlecējs ir Rīgas dzemdību nams, kuru atdalīju, lai parādītu, ka dati ir ārpus mēroga.
Un jā, tieši tagad kļūst redzams, ka Latvijas austrumos: Valmierā, Siguldā, Cēsīs, Madonā un Preiļos ir būtiski pieaudzis dzemdību skaits. Un būtu muļķīgi apgalvot, ka šo būtisko pieaugumu nav veicinājusi Aizkraukles, Limbažu, Smiltenes, Gulbenes un Alūksnes dzemdību nodaļu slēgšana. Tāpēc jautājums ir, vai tieši šīs nodaļas bija tādam pieaugumam gatavas, nevis Rīga, kurai līdz 1983. gada rekordam vēl patālu.
Sēdies, Jāni. Divi.