Szanowni Państwo,
na naszym blogu chcielibyśmy przede wszystkim inspirować Państwa do poszukiwania nowych możliwości wykorzystania Tableau w analizie i prezentacji Waszych danych. Tak aby zgodnie z misją Tableau – pomagać ludziom zobaczyć i zrozumieć ich dane – mieli Państwo coraz większą wiedzę i doświadczenie w jaki sposób z tego znakomitego narzędzia korzystać podczas eksploracji swoich danych.
Najczęściej będziemy się starali korzystać z własnych doświadczeń i prezentować Państwu ciekawe analizy, z jakimi mieliśmy do czynienia podczas wspólnej pracy z naszymi Klientami. Czasami jednak będziemy również chcieli zwrócić Waszą uwagę na interesujące materiały, jakie pojawiają się w Internecie. Tak właśnie jest w przypadku niniejszego artykułu, który powstał na bazie materiałów zamieszczonych na blogu Tableau: http://www.tableau.com/about/blog/2016/2/how-small-tweak-can-tell-radically-different-data-story-50084
Post, który pojawił się na blogu Tableau został przygotowany na podstawie źródłowego artykułu, którego autorem jest Tableau Zen Master Joshua Milligan, a który został opublikowany na prowadzonym przez niego blogu http://vizpainter.com/ (link do artykułu źródłowego: http://vizpainter.com/perspective-how-a-small-dataviz-tweak-can-tell-a-radically-different-data-story/).
Naszym zdaniem artykuł ten jest bardzo inspirujący i warty szerszego spopularyzowania, ponieważ pokazuje i uświadamia jak istotne – niezależnie od dobrej znajomości wszystkich funkcjonalności i technicznych możliwości samego oprogramowania – jest odpowiednie podejście do analizy danych i umiejętność spojrzenia na te same informacje z różnej perspektywy. Okazuje się, że czasami jedna zmiana w sposobie prezentacji danych może odsłonić nowe możliwości i „opowiedzieć” nowe historie ukryte w danych …
Wyobraźmy sobie, że chcemy przeanalizować w czasie, przy pomocy wykresu liniowego, sprzedaż pewnych wybranych produktów.
W „klasyczny” sposób możemy zrobić to tak:
Na osi X odłożony jest czas w postaci ciągłej, natomiast na osi Y pokazana jest wartość sprzedaży narastająco. Dzięki takiemu układowi danych możemy zobaczyć, jak kształtowała się w czasie sprzedaż poszczególnych produktów, obserwując wartości sprzedaży narastająco i chronologicznie.
Ale te same dane możemy również pokazać inaczej:
W tym przypadku na osi Y również pokazana jest wartość sprzedaży narastająco, ale na osi X mamy – zamiast czasu bezwzględnego – liczbę dni, jaka upłynęła od daty pierwszej sprzedaży danego produktu (nazwaną tutaj jako „Wiek produktu” w dniach).
Oczywiście możemy w analogiczny sposób przedstawić bardzo wiele różnych zależności. W swoim artykule Joshua Milligan analizuje jak wyglądała oglądalność postów opublikowanych na portalu VizPainter.com, natomiast analogiczne analizy można przeprowadzić np. dla sprzedaży w kontekście klientów, dla zakupów od dostawców, dla zabiegów i operacji wykonywanych w szpitalu itp.
Rozważmy teraz podobieństwa łączące te dwa wykresy:
- oba typy wizualizacji to wykresy liniowe w czasie,
- oba wykresy posiadają taką samą liczbę linii,
- oba mają ten sam dokładny kształt linii.
Jedyne, co się naprawdę zmieniło to umiejscowienie początków tych linii. W pierwszym przypadku początek każdej linii przypada na konkretną datę – jest to dzień, w którym nastąpiła pierwsza sprzedaż danego produktu. W drugim przypadku wszystkie produkty „startują” od dnia 0.
A jednak oba wykresy opowiadają zupełnie inną historię danych.
Historia nr 1: Ile i kiedy?
Pierwsza historia jest skupiona na znalezieniu odpowiedzi na pytania „kiedy” oraz „ile” i stosunkowo łatwo można odczytać z tej wizualizacji następujące informacje:
- kiedy produkt został sprzedany po raz pierwszy? (A)
- jakie były odstępy czasowe pomiędzy pojawianiem się w sprzedaży kolejnych produktów? (A)
- jaki jest ranking produktów pod względem sprzedaży? (B)
- jaka była sprzedaż poszczególnych produktów? (B)
- jaka była dynamika sprzedaży poszczególnych produktów? (C)
Popatrzmy teraz na drugą historię, która wydaje się podobna a jednak dostarcza obserwatorowi wiele innych informacji.
Historia nr 2: Jak szybko?
Ta historia jest zorientowana na odpowiedź na pytanie „jak szybko” i pokazuje następujące aspekty analizowanych danych:
- jak „stary” jest dany produkt (ile dni upłynęło od wprowadzenia go do sprzedaży)? (A)
- jak popularny stał się dany produkt (jaka była wielkość jego sprzedaży)? (B)
- jak szybko rosła sprzedaż danego produktu? (C)
- jak szybko rosła sprzedaż danego produktu w stosunku do innych? (C)
- jak duża była sprzedaż danego produktu po N dniach od jego pojawienia się na rynku? (C)
Warto w tym miejscu podsumować jaka jest ogólna charakterystyka obu sposobów prezentacji danych i jakie aspekty każdy z nich uwypukla.
W pierwszym przypadku mamy klasyczną analizę operującą na chronologicznych zdarzeniach następujących kolejno w czasie, co pozwala przede wszystkim na analizę typu: jakie wydarzenia miały miejsce w danych okresach czasu, jaka była kolejność tych zdarzeń itp.
W drugim przypadku mamy analizę względną, pozbawioną wymiaru czasu absolutnego, co zdecydowanie bardziej przydaje się w pokazywaniu dynamiki pewnych procesów oraz przede wszystkim w porównywaniu tych procesów pomiędzy sobą.
A teraz rozważmy kolejną modyfikację dotyczącą sposobu prezentacji danych, która pokazuje naszą historię w jeszcze inny sposób:
Na powyższej animacji pokazujemy, jak zmieniała się w czasie sprzedaż pewnej liczby produktów, przy czym dane prezentowane są w układzie „wiek produktu” na osi X i wartość sprzedaży narastająco na osi Y, natomiast kolejne zmiany w czasie pokazywane są chronologicznie w kontekście daty sprzedaży.
Należy zwrócić uwagę na fakt, w jaki sposób animacja dodaje nowe elementy do naszej historii.
Dzięki takiemu sposobowi prezentacji danych można uchwycić pewne dodatkowe zależności, jak np. wpływ pojawiania się określonych produktów oraz wzrostu ich sprzedaży na sprzedaż innych produktów. Mówiąc obrazowo widoczny jest dodatkowy aspekt wzajemnej relacji pomiędzy sprzedażą określonych produktów, pokazany jako zmiana „trajektorii” sprzedaży danego produktu w zależności od pojawiania się innych produktów oraz zmian ich trajektorii. Łatwiej jest też w tym przypadku „zobaczyć” i zrozumieć porównanie bezwzględnej chronologii zdarzeń w zestawieniu z ich prezentacją w układzie względnym.
Na koniec chciałem jeszcze zwrócić Państwa uwagę na dwie kwestie.
Pierwsza dotyczy technicznych szczegółów przygotowania odpowiedniej prezentacji danych. Otóż aby uzyskać analizę w układzie względnym należy przede wszystkim dla każdego produktu wyznaczyć datę jego pierwszej sprzedaży i w dalszej kolejności wykorzystać ją do wyliczania „wieku produktu” jako liczby dni będącej różnicą pomiędzy bezwzględną datą sprzedaży a datą pierwszej sprzedaży tego produktu.
Musimy zatem utworzyć pole wyliczane, w którym powinniśmy zastosować funkcję FIXED z grupy funkcji Tableau określanych wspólnie jako „Level of Detail Expressions” (są to funkcje FIXED oraz EXCLUDE i INCLUDE):
Wyrażenie { FIXED [Produkt-nazwa]: MIN([Data_zamówienia])} pozwala nam znaleźć najwcześniejszą datę zamówienia dla każdego produktu niezależnie od tego, jakich wymiarów użyjemy w wizualizacji danych.
Druga uwaga dotyczy stosowania animacji w Tableau. Jak pisze w swoim blogu Joshua Milligan jest to ciekawa funkcjonalność Tableau, która z jednej strony niejednokrotnie pozwala na interesującą prezentację danych, natomiast z drugiej strony jest niestety rzadko wykorzystywana. W związku z tym mam nadzieję, że „przypomnienie” tej funkcjonalności i pokazanie jednego ze sposobów jej zastosowania zaowocuje również w Państwa przypadku ciekawymi pomysłami niekonwencjonalnej prezentacji danych.
Mam nadzieję, że zaprezentowane powyżej sposoby wizualizacji danych przy pomocy Tableau, które zostały zasygnalizowane przez Joshuę Milligana, staną się dla Państwa źródłem inspiracji dla tworzenia własnych ciekawych analiz.