pułapki w analizie danych

Jak unikać pułapek w analizie ruchu na stronie internetowej?

Google Analytics nie zawsze prezentuje prawdziwe dane. Z drugiej strony ekranu, człowiek nie zawsze dobrze je interpretuje. W obu przypadkach może dojść do nieporozumień, które skutkować będą błędnymi decyzjami w biznesie. Jak nie popełniać gaf w analizie danych z ruchu na stronie?

Z pomocą przyjdzie psychologia, Nicolas Cage oraz kilka praktycznych metod statystycznych.

Iluzja korelacji, czyli czekolada nie wpływa na ilość noblistów

Oceniając efekty działań marketingowych, często konstruujemy wnioski w oparciu o swoje własne przeświadczenia lub wręcz naginamy rzeczywistość do swoich oczekiwań. W psychologii nazywa się to iluzją korelacji – tendencją do wyłapywania nieistniejących powiązań między zachodzącymi zdarzeniami. 

Dla przykładu, możesz mylnie ocenić, że wzrost ilości zjedzonych lodów ma wpływ na populację pingwinów, jeśli oba zjawiska zachodzą w tym samym czasie. Podobnie w marketingu, jeśli właśnie w świat ruszyła nowa kampania z odświeżonymi kreacjami i w tym samym czasie wzrosła konwersja, możesz wyciągnąć wniosek, że przyczyną sukcesu był właśnie odświeżony projekt. 

Ruszysz wtedy z wesołą nowiną do zespołu i przełożonych. Ten kolor lepiej konwertuje. Zdjęcie z kotem lepiej klika się niż grafika z psem. Dłuższy tekst lepiej rankinguje w Google. 

Tymczasem, wokół mogło zadziać się wiele innych rzeczy. 

Prawdą jest, że na każdym kroku jesteś wystawiany na próby. 

Prowadząc działania marketingowe, jesteś zależny od wielu czynników zewnętrznych, o których często nie masz nawet pojęcia. Dzieje się tak zwykle, gdy:

👀 działasz w środowisku opierającym się na algorytmach zewnętrznych serwisów, takich jak Google, czy Facebook. 

👀 lepsze lub gorsze wyniki poprzedzone są zmianami, o których nikt Cię nie poinformował (najgorzej).

👀 prowadzisz działania w branży silnie zależnej od trendu i sezonowości. 

Jeśli w tym samym czasie prowadzono prace w innym obszarze, możesz znaleźć tutaj błedną korelację, która odbije się na Twoich przyszłych wskaźnikach efektywności. 

Jak unikać iluzji korelacji i wyciągać lepsze wnioski z danych?

Błędy poznawcze, do których należy między innymi iluzja korelacji, na przestrzeni wieków prowadziły do wielu pomyłek z mniejszym lub większym skutkiem na dobrobycie ludzkości. Wszystkie one wynikały z prostej rzeczy – lubimy naciągać fakty do własnych przekonań. 

Badacze udowodnili nawet, że mamy tendencję do projektowania testów, które mają potwierdzić nasze wnioski. W psychologii nazywa się to 🔎 strategią pozytywnego testu. Możesz poczytać o tym na Wikipedii. 

Mądre głowy wypracowały oczywiście szereg metod, które mają zniwelować efekt błędnych korelacji. 

✅ Unikaj testów na małej próbie danych.

✅ Znajdź konsultanta, który spojrzy na Twoje dane w obiektywny sposób.

✅ Zbadaj trend.

Pewien magazyn naukowy w 2012 roku wysnuł wniosek, że wysokie spożycie czekolady bezpośrednio wpływa na liczbę noblistów w danym kraju. Podobnie zestawienie danych utonięć w latach 1999 – 2009 z ilością premier filmów z udziałem Nicolasa Cage’a wskazuje, że aktor ten ma mocny wpływ na ilość zgonów przez utonięcie w basenach. Zerknij na 🔎 więcej podobnych i dziwnych korelacji.

Wszystkie one wskazują na to, z jak dużą ostrożnością musisz podchodzić do analizy danych dotyczących ruchu i zachowania użytkowników na swojej stronie internetowej. 

Uważaj na średnią liczbę odwiedzin

Wyprowadzając psa, statystycznie macie po 3 nogi. Na pierwszy rzut oka widać, że takie dane nie będą dla Ciebie w żaden sposób przydatne. Przykład jest dosyć absurdalny, ale jeśli zastosujesz go w przypadku tematów bardziej zbliżonych z marketingiem, natychmiast zrozumiesz co chodzi. 

Powiedzmy, że opublikowaliście w miesiąc 5 postów na social media, z których pierwsze 4 miały podobną liczbę wyświetleń (np. 600). Ostatni post jednak został udostępniony przez umiarkowanie popularnego specjalistę i podbił Ci zasięgi (do np. 3000 wyświetleń). Analizując średnią wszystkich wyświetleń, wyjdzie, że każdy post wyświetlany był w okolicach 6 480 razy.

Porównując znowu średnie wyciągnięte z dwóch czynników, by znaleźć między nimi widoczną korelację, możesz wyciagnać zupełnie absurdalne wnioski. Wyjdzie Ci wtedy, że wysokie spożycie sera wpływa na ilość ludzi zaplątanych w prześcieradła. 

Trzy problemy, jakie widzę w obliczaniu średniej z ruchu na stronie:

  1. Ruch na stronie może nie być równomiernie rozłożony w czasie, gdy analizujemy zbyt długie przedziały. 
  2. Kilka bardzo dużych, albo bardzo małych wartości może znacznie wpłynąć na ostateczny wynik.
  3. Średnia mało mówi o jakości ruchu na stronie.

W takich przypadkach lepszym rozwiązaniem będzie obliczenie:

✅ mediany, czyli wartości środkowej dla zestawienia danych. 

✅ mody, czyli wartości, która pojawia się najczęściej.

Korzystając z nich łatwo zidentyfikujesz, że Twoje posty zwykle wyświetlają się 600, a nie 6 480 razy. 

Ile czasu tak naprawdę użytkownicy spędzają na Twojej stronie?

Pomiar czasu spędzonego przez użytkownika to jedna najprostszych rzeczy, jakie można sprawdzić w Google Analytics. Uśredniony czas podany jest przy każdym adresie, co – z definicji – powinno dać Ci informację o tym, jak CHWYTLIWY jest tekst na danej podstronie.

Jesli spędzasz na stronie sporo czasu, oznacza to, że naprawdę lubisz content, który tam znalazłeś. 

I tak, i nie. Oto dlaczego:

👀 Google Analytics nie liczy czasu, gdy odwiedziłeś tylko jedną podstronę.

👀  Google Analytics nie liczy czasu na ostatniej stronie, którą odwiedziłeś w serwisie.

👀 Google Analytics liczy czas nawet jeśli aktualnie znajdujesz się w innej zakładce.

Wynika to ze sposobu, w jaki mierzona jest długość wizyty użytkownika na podstronie. W skrócie, jest to różnica między momentem wejścia na dany adres URL i przejściem na inną podstronę. Brzmi logicznie, ale jeśli nie przejdziesz na inną podstronę, Analytics uznaje to jako odrzucenie (bounce). Nie przeszedłeś na inną podstronę, więc narzędzie nie jest w stanie obliczyć czasu spędzonego na podstronie. 

Ma to miejsce zarówno, gdy wchodzisz na stronę, np. z Google i wychodzisz, jak i w sytuacji, gdy opuszczasz stronę po dłuższej wizycie na innych podstronach. 

Krótko mówiąc, uśredniony czas wskazany w narzędziu może wprowadzić Cię na manowce, gdy bezgranicznie mu zaufasz. Możesz pomyśleć choćby, że dana strona jest interesująca dla użytkowników, więc uzupełnisz ją o dodatkowe CTA i puścisz kampanię, by zwiększyć ruch na tym adresie. Obyś nie przepalił przy okazji swojego budżetu. 

Pamiętasz jeszcze jak wspominałem wcześniej o niebezpieczeństwie obliczania średnich wartości? Google Analytics również nie czyści tutaj danych, dlatego wskaże wysoki średni czas, gdy zaliczyłeś kilka krótkich wizyt i jedną bardzo długą. Zamiast mediany 15 sekund, dostaniesz 3 minuty 45 sekund, co może wpłynąć na Twoje decyzje marketingowe. 

Rozwiązaniem tego problemu może być skonfigurowanie 🔎 własnych zdarzeń w Google Tag Managerze.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *