Histogram to jeden z najpopularniejszych wykresów przedstawiających dane statystyczne. Służy do przedstawiania danych gromadzonych na podstawie konkretnych doświadczeń – jest to tak zwany rozkład empiryczny.
Do czego służy histogram?
Histogram to wykres składający się z prostokątnych słupków. Przedstawia dwie osie – pionową i poziomą. Pionowa odpowiada za określenie liczebności obserwacji, natomiast pozioma pokazuje przedział.
Dla przykładu stwórzmy histogram, który będzie przedstawiał wykres wiekowy klientów marketu SHOP. Pionowa oś Y będzie oznaczała ilość obserwacji, czyli najprościej mówiąc ilość klientów. Oś pozioma, czyli X, będzie określała dane dotyczące przedziału wiekowego. Na podstawie tego wykresu będziemy mogli w wizualny sposób odczytać wiek klientów – czyli jaka grupa wiekowa stanowi największy odsetek kupujących.
Jest to graficzne przedstawienie częstotliwości występowania zmiennej losowej w określonym przedziale.
Kiedy warto wykorzystać histogram?
Musimy jednak pamiętać, że analiza wizualna zmiennych losowych w danym przedziale, nie pokaże zmienności tej wizualizacji. Głównym zadaniem jest poprawienie w dalszych etapach jakości badanego obiektu. Histogram umożliwia graficzne przedstawienie badanej cechy, której konsekwencją będzie lepsze zrozumienie analizowanego zjawiska. Dzięki niemu będziemy mogli określić rozkład ciągły prawdopodobieństwa, który posłuży nam do prognozowania. Ta metoda pomoże nam wyeliminować hipotetyczne wady i wykryje możliwe trudności z zakresu jakości danych na wcześniejszym etapie.
Pozostając przy przykładzie klientów w SHOPie – ten wykres pomoże nam wyciągnąć wnioski z danych. Dostajemy w ten sposób informację, która grupa wiekowa jest najliczniejsza w naszym markecie. Pozwoli nam to zareagować w odpowiednim momencie na zmianę oferty reklamowej i odpowiednio dopasować komunikaty sprzedażowe do określonej grupy wiekowej.
Jak zbudować histogram?
- Obliczyć ilość obserwacji – należy przeliczyć ile razy występuje dana obserwacja.
- Uszeregować obserwacje – pozwoli to skategoryzować przedział.
- Określić liczbę przedziałów – czyli k.
k≈n−−√, gdzie n- ilość obserwacji
- Określić długość każdego z przedziału – czyli h.
h= , gdzie max i min to odpowiednio wartości największa i najmniejsza
- Wyznaczyć przedziały – dzielimy je na lewostronne domknięte i prawostronne otwarte, czyli Xp,Xk), Xp – początek przedziału, Xk – koniec przedziału. Ostatni przedział zawsze musi być domknięty również z prawej strony aby “złapać” wartość największą. Koniec jednego przedziału stanowi początek drugiego przedziału.
- Policzyć ilość obserwacji, które wpadają do każdego przedziału oraz sprawdzić czy sumują się do n!
Sumujemy w celu uniknięcia błędu- w tym momencie mamy skonstruowany histogram ilości.
- Histogram częstości : ni zamień na wi =
Na tej podstawie możemy zrobić histogram.
Jak wykonać histogram w Tableau?
Tableau ma wbudowane 24 typy wykresów. Jednym z nim jest histogram. Narzędzie „Show me” pozwala utworzyć tego typu wykres. Opcja „Show me” znajduje się w prawym górnym rogu menu Tableau Desktop.
Histogramy w Tableau tworzone są przy użyciu jednej miary. Wykonanie wykresu w Tableau nie jest skomplikowane. Znajdziecie wiele poradników, czy webinarów, jak krok po kroku wykonać histogram przy użyciu tego narzędzia BI. W rezultacie utworzony wykres dotyczący wieku klientów w markecie będziemy mogli w Tableau modyfikować. Następne wykresy mogą wizualizować kolejne etapy dostosowania zachowań zakupowych klientów w danych grupach wiekowych.
Przykład tego typu wykresu jest opisany na stronie >