Statistikas izdomājumi muldēšanas pēc. Kristapa un Kārļa recepte.

Šķiet, ka nekad līdz šim neesmu bijis tik ļoti dusmīgs uz kādu Latvijas blogeri par to, ka viņš saraksta muļķības. Bet nu šoreiz «the time has come», jo viņi ir veseli divi.

 

Ievads

Lasu Krizdabz rakstu «Ko cilvēki dara ar saviem Android telefoniem?» un nemaz neesmu ticis līdz burtu lasīšanai, tik ieraudzījis grafiku pie sevis padomāju: «Kristap, es taču vairākas reizes esmu aizrādījis, ka pie grafikām ir jāliek atsauces uz avotiem, lai datiem būtu ticamība un iespēja tos pārbaudīt!»

Tirgus. Online. Android. iOS.

Bet ne, Kristaps ir malacis, devis norādi zem bildes uz Kārļa rakstu «Kāpēc Android lietotāji neizmanto internetu?». Top skaidrs, ka pirmavots šim pasākumam ir Kārlis (grafika ir latviešu valodā), tāpēc sākumā iedziļinos Kārļa rakstā un tam sekojošos komentāros.

 

Kas tad tur īsti ir avots?

Atļaušos pilnībā nocitēt visu Kārļa rakstu, jo tādu pērli gribas saglabāt.

Nē, nē, tas nav mans apgalvojums. Tas ir fakts. Statistika. Šo tendenci pētnieki novēro jau no sākta gala, taču šobrīd, kad Android tirgus daļa ir dramatiski apsteigusi visus pārējos, jautājums sāk bažīt daudzus.
Ko Android lietotāji dara ar saviem viedtālruņiem? Kāpēc viņi tik maz pārlūko internetu? Viens no minējumiem ir tāds, ka lielai daļai Android vienkārši ir aizstājis “parastos” telefonus un īpašnieki tos tā arī lieto – kā “parastos” telefonus.
Droši vien nav jēga prasīt bloga lasītājiem, jo minu, ka šeit visi ir aktīvi internetu lietotāji.
Šeit, iespējams, arī meklējama atbilde kāpēc lielākā daļa aplikāciju un webservisu tiek primāri pielāgoti iOS nevis Android.

Te nu ir. Kārlis, atšķirībā no Kristapa, atsauci vispār nav devis «jo tas ir fakts». Tālāk komentāros pavīd viena Kārļa atbilde–pērle komentētājam:

Aizmirsu norādīt, šie ir dati par pasauli kopumā.

Viss, apocalyptic crash, es vairs nevaru izturēt. Jāsāk meklēt, no kurienes abi jampampiņi jokaiņi ir to visu izdomājuši.

 

Idiotiskās grafikas avotu meklējumi Latvijā

Ok. Sākam ar Latvijas tirgu, varbūt tepat kaut kur kāds gudrinieks ko tādu izmetis. Pie mobilajiem operatoriem neko tādu neatrodu. Gemius mobilo iekārtu statistika ir satriecoša — iPhone ir tikai viens, bet Samsungi kādi divdesmit. Ātri sametot kopā, sanāca tāpat +/- vienāds tirgus sadalījums iOS un Android. Un statistika ir tikai no Latvijas mājaslapām, kurās ir Gemius kods. Tātad arī sūds, kam nevar ticēt un kas neko īsti neparāda. Piemēram, SS.LV aplikācijai ir desmiti tūkstošu lejuplāžu, Gemius nemaz nezina, vai es kādreiz esmu bijis skatīties kādu sludinājumu SS.LV.

No tā secinu, ka Latvijā bez mobilo operatoru informācijas, cita, ticamāka avota par mobilo datu izmantošanu vispār nav. Tīri iespējams, ka es ar savu Nokia N8 savulaik pumpējot sviestu caur wi-fi esmu dienas laikā uztaisījis visu iOS gada trafiku, bet to Latvijā neviens neuzzinās.

Skaidrs. Meklējam citur.

 

Idiotiskās grafikas avotu meklējumi ārpus Latvijas

Pieņemsim, tikai pieņemsim, ka mums ir iespēja izpētīt dažādu valstu tirgus pēc kaut kādām ūberticamām metodēm un no tā secināt, kas notiek pasaulē kopsummā. Lai to izdarītu, mēģināsim atrast visus avotus, ko izmantoja abi palaidņi.

Kristaps atsaucas uz Gigaom rakstu «Why are Android users less engaged than iOS users?». Savā rakstā Kristaps pat ieliek dažas no tēzēm, kas parādās šajā visnotaļ cienījamā publikācijā (ar atsaucēm uz avotiem). Raksta beigās parādās viena būtiska frāze:

To be clear, the data we’re looking at is from the U.S. only, and it’s based primarily on shopping traffic.

Pasaules tendences my ass, Kārli. Tieši tāpat, kā atsauce uz rakstu, ka iPhone 5 internetam lieto vairāk, nekā Samsung Galaxy SIII. Raksts apskatīja uzņēmuma Chitika veidoto statistiku par ASV un Kanādas tirgu un runa arī ir tikai par interneta mājaslapu apmeklējuma trafiku. Tātad, ne par ko īpašu. Šīs Chitika publikācijas «iPhone 5 Usage Surpasses Samsung Galaxy S III After Less than 3 Weeks on Market» noslēgumā ir viens lielisks komentārs, kas labi raksturo salīdzināmos objektus no kvalitatīvā viedokļa:

I think this is a false statistic, as everyone who bought a new iphone, would be spending days downloading apps, music and other media on to their new device and browsing more using a lot of bandwith. Also if it was their first smartphone they would be using it everyday to excess for the first few weeks as it still holds it novelty value. Comparing two devices on the same launch date would make more sense.

Tam seko arī atbilde no Chitika, kas tikai apstiprināja manas aizdomas, ka tiek ņemts vērā tikai interneta mājaslapu apmeklējuma trafiks.

Our statistics are based on advertising impressions when users browse the Web, rather than in-app activity or downloading items from the iTunes store. Certainly, there may be a slight “honeymoon” phase with a new device, as you mentioned, but as we’ve seen previously, Web traffic volume from individual devices tends to adhere to more gradual increases or decreases following launch, barring an outside event (e.g. a sale on the device itself, which could cause usage to spike). In this way, spikes directly around launch are a good measure of initial consumer fervor around a particular device. (..)  Unless stated otherwise, all of our studies are representative of U.S. and Canadian Web traffic only.

Nu un tagad pats galvenais. Visas tās jezgas autors ir IBM Digital Analytics Benchmark, kas kā izrādās, arī visus savus datus ņemt tikai un vienīgi no mājaslapu apmeklējuma datiem. Ar pilnu atskaiti «IBM 2012 Holiday Benchmark Reports» arī var iepazīties (*.pdf). Lūk šis arī bija patiesais īstās informācijas avots, kuru pēc tam katrs locīja pa savam.

Un bija tikai divas lietas, ko par ASV un Kanādas tirgu varēja pateikt:

Mobile Shopping: Mobile purchases soared with 24 percent of consumers using a mobile device to visit a retailer’s site, up from 14.3 percent in 2011. Mobile sales exceeded 16 percent, up from 9.8 percent in 2011.
The iPad Factor: The iPad generated more traffic than any other tablet or smart phone, reaching nearly 10 percent of online shopping. This was followed by iPhone at 8.7 percent and Android 5.5 percent. The iPad dominated tablet traffic at 88.3 percent followed by the Barnes and Noble Nook at 3.1 percent, Amazon Kindle at 2.4 percent and the Samsung Galaxy at 1.8 percent.

Tas arī viss. Tātad debīlā grafika bez atsauces uz avotu bija pieņēmums, kas balstīts uz diviem nesalīdzināmiem datiem:
— pārdoto iekārtu skaits pasaules mērogā (pieļauju, ka tie ir pašu ražotāju dati, avotu necentos atrast, jo tam nav nozīmes)
— IBM dati par to, ar kādām mobilajām iekārtām ASV un Kanādas teritorijā Black Friday laikā tika veikti iepirkumi (pirkumi ar mobilajām iekārtām sastādīja tikai 16,26% no visiem veiktajiem).

 

Noslēgums

Oficiāli paziņoju, ka Kristapa rakstā «Ko cilvēki dara ar saviem Android telefoniem?» un Kārļa rakstā «Kāpēc Android lietotāji neizmanto internetu?» paustie fakti ir nepārbaudītas muļķības, kas parāda vienīgi to, ka ASV un Kanādā Black Friday iepirkumu laikā iOS lietotāji vairāk iztērēja naudas virtuālu lietu pirkšanai, izmantojot mājaslapas, nevis šīm iekārtām radītajās aplikācijās. Es no tā izsecinu, ka iOS lietotāji daudz mazāk par Android lietotājiem izmanto aplikācijas pirkumiem. Ar interneta lietošanu vispārīgi tam nav nekāda sakara.

Savukārt tam sekojošais nepārprotamais aicinājums uz «iOS pret Android» polemiku ir tikpat nozīmīgs, kā Maijas Silovas dzejoļu krājums «Stihiya».

 

Aicinājums Kristapam un Kārlim

1) Vienmēr norādiet informācijas avotus;
2) nevispāriniet virsrakstus, ja atsaucieties uz pētījumiem, kas ir lokāli un pēta kādu konkrētu tirgu;
3) pārbaudiet avotus;
4) nelieciet stulbas grafikas, kurām pēc tam Sergejs var piekasīties.

Krizdabz.lv akcija un RSS statistika

Es gan nekad īpaši neesmu uzticējies Feedburner statistikai, jo tai allaž ir problēmas bijušas, bet kopsummā kaut kādu vīziju tās tomēr sniedz. Tad nu bija lielisks iemesls izmēģināt Microsoft Excel 2010 iebūvēto sparkline izveidi apvienojumā ar XML datu apstrādi, parādot, kā līdz 2. decembrim Kristapam klājies ar RSS padevi. Ja pēc tam būs vēlme kādam redzēt un Kristaps pats to nebūs parādījis (kam es īpaši neticu), tad paskatīsimies arī, kā viņam būs klājies pēc šīs akcijas.

Krizdabz.lv feedburner statistika par pēdējo mēnesi.
Krizdabz.lv feedburner statistika par pēdējo mēnesi.

Šādi izskatās pēdējais mēnesis. Kā redzam, nekas īpaši mainījies nav, tāpēc izvilku datus par garāku laika periodu, lai varētu papētīt tendenci kopsummā.

Krizdabz.lv statistika par pēdējiem trijiem gadiem.
Krizdabz.lv statistika par pēdējiem trijiem gadiem.

Rokdarbi #17. Kā salīdzināt lielu ar mazu

Informācijas uztveramība un ātra sagremošana ir viens no svarīgākajiem principiem, kas ir jāsaprot dizainerim. Boring.

Lai salīdzinātu informācijas vienības, bieži vien nepietiek ar smadzenēs iezombētiem līdzekļiem. Visbiežāk ar to mēs saskārsimies brīžos, kad saviem teksta blāķiem vēlēsimies pievienot saprātīga apjoma atslodzi. Avīzēs komentāru lapās (kur pārsvarā ir tikai tekstuālā informācija) visbiežāk mēs redzēsim ielauztu citātu no teksta, autora fotogrāfiju vai karikatūru. Elektroniskajā vidē šādi risinājumi tiek veikti divējādi: 1. iemetam reklāmas laukumu; 2. iemetam vairāk vai mazāk sakarīgu grafiskās informācijas apjomu (foto, grafikas, ilustrācijas, video, utt.).

Uz domu par šo ierakstu mani pamudināja Kristapa raksts par torentu trekera Mininova pāreju uz 100% legālu torentu uzturēšanu uz saviem serveriem.

Kristapa grafika pie raksta par Mininova trekeri.
Kristapa grafika pie raksta par Mininova trekeri.

Teorētiski, uz kopējā informācijas apjoma, ko Kristaps rakstā ir devis, šī grafika būtu pat apsveicama, jo slinkajam lasītājam būtu iespēja vismaz virspusēji saprast, par ko rakstā ir runa. Tomēr tas, kas mani pašu pamudināja šo grafiku papētīt vairāk, ir tās bezjēdzība gadījumā, kad es vēlētos precīzāk saprast notikuma būtību — pēc redzamās informācijas varētu saprast, ka Mininova trekerī 2009. gada 26. novembrī vairāk neviena torenta nav.

Iedziļināsimies jautājuma būtībā. Tātad, mums ir jāattēlo vizuāli viegli uztveramā veidā informācijas vienību skaita izmaiņa, par pamatu ņemot datus divos datumos vienā gadā. Dodamies uz Mininova oficiālo statistiku un skatamies, ko varam iegūt no tās uz doto mirkli.

Trekera Mininova statistika uz 8. decembri.
Trekera Mininova statistika uz 8. decembri.

Aha! Tas jau ir kaut kas vērtīgāks — varam ne tikai ieraudzīt straujo torentu skaita kritumu laikaposmā starp 24. novembri un 1. decembri aptuvenos miljonos, bet salīdzināt torentu daudzuma un meklēšanas vaicājumu attiecību, kam seko lejuplādēto torentu skaits šajā laika posmā. Bez šaubām, mēs vēl joprojām netiekam pie precīziem datiem un torentu skaits pēc trekera īpašnieku novembra nogales lēmuma mums ir «kaut kur zem divnieka bet virs nulles». Tātad, jautājums par to, cik tad daudz torentu šobrīd ir trekerī mums paliek neatbildēts (toties citā šķēlumā mums šīs grafikas ir sniegušas atbildes uz daudziem citiem jautājumiem). Vēl ir jāņem vērā arī fakts, ka Kristaps informāciju publicēja 27. novembrī, kas ir dienu pēc pārmaiņām, tāpēc tik daudz analītisku spriedumu uz to brīdi nebija iespējami.

Nāksies atgriezties izejas pozīcijā. Kā salīdzināt un vizuāli vienkārši, uztverami parādīt esošos datus?

Ārkārtīgi kolosālus vizuālos elementus mēs varam iegūt, lapojot praktiski jebkuru ar astronomiju saistītu resursu. Piemēram, šī kolosālā vizualizācija, kas parāda Zemes un Mēness savstarpējās proporcijas un attālumu starp planētu un tās pavadoni.

Wikipedia. Zemes un Mēness savstarpējās proporcijas.
Wikipedia. Zemes un Mēness savstarpējās proporcijas.

Šajā grafikā vairs nav būtiski saprast, precīzi cik liela ir Zeme un cik mazs Mēness vai arī tas, cik liels attālums precīzi ir starp abiem ķermeņiem — vizuāli mēs to uztveram pietiekami saprotamā veidā. Tomēr precizitātes pēc, grafikas autors ir pierakstījis klāt: «The Earth and the Moon to scale. One pixel equals 100 km». Ko gan vēl varētu vēlēties?

Ja mēs to reducējam uz mūsu problēmu, tad ko līdzīgu varētu parādīt sekojoši.

Mininova pieejamo torrentu izmaiņas 2009. gadā. 1. piemērs.
Mininova pieejamo torrentu izmaiņas 2009. gadā. 1. piemērs.

Šajā brīdī der atcerēties, ka jebkura stabiņu, bumbuļu, utt. grafika reāli reprezentē konkrētas skaitliskās vērtības aizpildīto laukumu divās dimensijās, mērogā vai bez tā. Respektīvi, ja mēs redzam divus šādus bumbuļus, tad lielajā bumbulī teorētiski ir tieši 1316806 pikseļu, bet mazajā — 8859 pikseļu, kas attēloti mērogā. Vizualizācija kļūst prātīgāka, jo atšķirība torentu skaitā 24. un 26. novembrī tiek parādīta. Tomēr proporcijās 26. novembra bumbulis mums izskatās pēc punkta un šajā mērogā neļauj uztvert informāciju precīzi.

Atgriežamies pie astronomijas un izmēģinām jaunu variantu.

Mininova pieejamo torentu izmaiņas 2009. gadā. 2. piemērs.
Mininova pieejamo torentu izmaiņas 2009. gadā. 2. piemērs.

Esam tikuši daudz tālāk. Tagad mums ir kaut cik skaidra attiecību proporcija un mēs jau varam izdarīt secinājumus vizuāli uztveramā veidā.

Tomēr arī šis vizualizācijas variants nav līdz galam pietiekams. Iemesls ir gaužām vienkāršs — mums ir tikai divi skaitļi, kurus mēs vēlamies salīdzināt un mēs no šiem skaitļiem tagad mēģinām «izpūst burbuli».

Es domāju, ka arī tev ir kļuvis skaidrs, mans mīļais lasītāj, kā es šo rakstu mēģinu noslēgt.

Mininova pieejamo torentu izmaiņas 2009. gadā. 3. piemērs.
Mininova pieejamo torentu izmaiņas 2009. gadā. 3. piemērs.

Bieži vien (patiesību sakot, pārāk bieži) cilvēki aizmirst, ka arī skaitļu pierakstam pašam par sevi ir dimensijas — jo vairāk simbolu ir skaitlī, jo lielāka ir tā absolūtā vērtība. Līdz ar to pat gadījumā, ja mums ir jāsalīdzina vairāk kā divi skaitļi, šī metode nebūt nav tā sliktākā. Bez šaubām, to var arī nedaudz izkrāšņot (kas gan man ne visai patīk konkrēti šajā gadījumā, bet citkārt var izrādīties kā noderīgs piemērs).

Mininova pieejamo torentu izmaiņas 2009. gadā. 3. piemēra otrā versija.
Mininova pieejamo torentu izmaiņas 2009. gadā. 3. piemēra otrā versija.

Kā redzams, mēs esam atstājuši skaitļus kā dimensiju rādītājus, toties tīri dekoratīvi esam pievienojuši laika skalu.

Lūk, vēl viens piemērs par skaitļu izmantošanu dimensiju attēlojumam. Šoreiz ar mājaslapas apmeklējuma statistiku par laikaposmu, kurā būtiski pieauga vidējais apmeklējums.

Mājaslapas apmeklējuma statistikas vizualizācijas piemērs.
Mājaslapas apmeklējuma statistikas vizualizācijas piemērs.

Vēl tikai divas piebildes.

Vienmēr miniet grafikās savu datu avotus vai vismaz atsaucieties uz kaut ko tekstā (piemēram, ja šajās grafikās informācija nav patiesa, tad mani neviens nenospļaudīs ar sempenēm, toties Kristaps un Google cietīs no sirds).

Šis nav pret tevi naidu un necieņu kurinošs raksts, tikai ļoti veiksmīgs piemērs, kā noformulēt manu domu. Bučas tev, Kristap!

Netieku gudrs ar Google Analytics

Iespējams, ka es tagad prasu vairāku tūkstošu vērtu jautājumu, kuru SEO speciālisti tik ļoti man gribētu pārdot, bet Googe Analytics Help sistēma uz šo banālo jautājumu tiešām nespēj atbildēt.

google analytics dashboard compare site wtf
google analytics dashboard compare site wtf

Ko tieši ar šo konkrēto Compare to Site izvēlni var iesākt? Man iekš šī konkrētā Account stāv desmit dažādi domeni. Sākotnēji domāju, ka varēšu tos savā starpā salīdzināt, bet izrādās, ka nevar viss.

Visus ieteikumus lūgums aprakstīt detalizētāk, jo es tālāk par primitīvu statistikas grafiku apskatīšanos šai sistēmā neesmu braucis iekšā.

Rokdarbi #16. Signāla un trokšņa attiecība (Signal-to-Noise ratio)

Es jau pirms tam esmu rakstījis nedaudz par vienu no dizaina aksiomām — signāla un trokšņa attiecību (Labojam grafikus, Labojam skaidrojošās kartes, Sakārtojam drukas iekārtas shēmu). Lai neviens nekad nekļūdītos, šim ierakstam pēc būtības nav nekāda sakara ar elektronikas teoriju vai līdzīgām fizikas atvasēm. Gribētu koncentrēti vēlreiz atgriezties pie šī jautājuma, lai izskaidrotu to no vairākiem aspektiem.

Piebilde pēc raksta tapšanas: tā kā mana koncentrētā valoda sanāca ne pārāk koncentrēta, tad pilnā versija tomēr ir apgriezta un pieejama lasīšanai tikai atverot visu rakstu. Savādāk baigi daudz jāskrollējās būs, lai citus rakstus ieraudzītu, hi hi.

Turpināt lasīt “Rokdarbi #16. Signāla un trokšņa attiecība (Signal-to-Noise ratio)”

Par GMetrix vizuālo saprotamību

Gmetrix.lv logo logotype

Man jau bija kaut kādas aizdomas, ka ar TextAds.lv un BlogAds.lv lietojamības apskati nebeigsies. Šoreiz gan tik daudz negribu pievērsties visai mājaslapai, jo GMetrix.lv vēl joprojām ir beta testēšanas stadijā, cik daudz gribēju pievērst uzmanību tieši niansēm, kas saistītas ar šīs mājaslapās sniegtās informācijas uztveramību.

Turpināt lasīt “Par GMetrix vizuālo saprotamību”

Type timeline — lielisks resurss par burtu vēsturi

Dažkārt man nākas dzirdēt jautājumus par to, kā es zinu to vai to informāciju par burtiem un to vēsturi. Protams, atbilde ir elementāra — šis tas prātiņā ir sakrājies. Tomēr atstāstīt to visu nav iespējams, bet viens krievu rūķītis ir pacenties un uzskatāmi vismaz pašus pamatus ir sametis kopā vienā lapā, lai var pasekot līdzi cilvēces attīstībai.

Baudiet un priecājieties: Type timeline.

Savukārt visiem tiem «asajiem» komentētājiem, kas mēģina man un citiem šī bloga lasītājiem dažādus jaunumus par latviešu valodu pastāstīt (ieskaitot to, ka latviešu valoda ir apstiprinājusi ISO standartu izmantošanu, hi hi), vēlreiz atgādinu par šo resursu — Valsts valoda.

Seleckis mokās un veido JavaScript domuzīmju pareizam attēlojumam, cerams, ka drīzumā viss tiks pieslīpēts un varēsim viņu kā spraudni iekš WordPress izmantot.

P.S. Man ir šodien satapusi interesanta statistika: bloga ieraksti pret bloga komentāriem pret bloga mēstuļierakstiem veido attiecību: 1:2:231. Sviests, ne?

Problēmas ar korektiem datiem no Google Analytics

16. augustā padevos vispārējai eletrifikācijai googolizācijai un uzliku Google Analytics kodu savā blogā. Tagad mokos jautājumiem, jo nesaprotu, kāpēc mana statistika ir kaut kāda absurda tam, ko tas Google man te rāda.

Pirmkārt — Google uzskata, ka man ir 2–6 apmeklētāji dienā. Tādā gadījumā es nesaprotu, kā var būt tā, piemēram, ka katru manu ierakstu publicēšanas dienā apskata vismaz 19 cilvēki no Nekur.lv vien, mana Mint statistika uzrāda pavisam citus skaitļus, bet TextAds servisa statistika — vairākus simtu baneru skatījumu dienā pat vismazāk apmeklētās dienās? Vēl klāt nāk arī FeedBurner statistika par apmeklējumiem no RSS barotnes — dati par 22. augustu: 55 subscribers (tie, kas pierakstījušies barotnei), 148 reach (tie, kas atnākuši uz lapu no barotnes).

Es vēl saprastu, ja man pašam nebūtu ko darīt un es visās iespējamās vietās klikšķinātu un skatītos savu blogu, lai tikai palielinātu kaut kur kaut kādus klikšķus.

Ja es raugos uz to pašu TextAds, tad man šis skaitlis būtu daudz nozīmīgāks, jo tur paralēli arī naudiņa nāk no tā pasākuma, savukārt tas Google Analytics mani interesēja tikai tāpēc, lai pievienotos tam jaunajam latviešu krāniņu mērīšanas statistikas agregātam. Tagad, kad redzu, ka man Google Analytics rāda statistiku, kas ir pilnīgi neloģiska un neiespējama, es neredzu pamatojumu, lai es to darītu.

Ja kāds gudrais sarkanačaino cilts loceklis var paskaidrot, kas ir par vainu nekorektiem datiem un kā to salabot, būšu ļoti pateicīgs.