Podstawowe narzędzia statystyki opisowej stosowane w analizie danych to:
1. Narzędzia tabelaryczne:
* Tablice częstości (szeregi rozdzielcze): prezentują liczebność lub częstość występowania
określonych wartości lub przedziałów.
* Tablice kontyngencji: pokazują zależności między dwoma cechami (np. w badaniach rynkowych).
2. Narzędzia graficzne:
* Histogramy: rozkład częstości w klasach.
* Diagramy słupkowe i kołowe: do analizy struktury (np. udział segmentów rynku).
* Wykresy ramkowe (boxplot): do analizy rozkładu, rozproszenia i obserwacji odstających.
Przykłady zastosowań w biznesie:
* Analiza sprzedaży według grup klientów,
* Badanie rozkładu przychodów firmy,
* Analiza kosztów produkcji,
* Badania marketingowe – preferencje klientów
Podstawowe numeryczne miary statystyki opisowej to:
1. Miary tendencji centralnej:
* Średnia arytmetyczna – przeciętna wartość (np. średnia sprzedaż w miesiącu).
* Mediana – wartość środkowa (np. typowa wartość transakcji).
* Dominanta (moda) – najczęściej występująca wartość (np. najczęściej kupowany produkt).
2. Miary zmienności (rozproszenia):
* Rozstęp – różnica między największą a najmniejszą wartością.
* Wariancja – średnia kwadratów odchyleń od średniej.
* Odchylenie standardowe – miara przeciętnego odchylenia od średniej (np. zmienność cen).
* Współczynnik zmienności – odchylenie standardowe w relacji do średniej (np. ocena ryzyka).
3. Miary kształtu rozkładu:
* Skośność – miara asymetrii rozkładu.
* Kurtoza – miara spłaszczenia rozkładu.
Przykłady zastosowania w biznesie:
* Ocena ryzyka finansowego (zmienność przychodów),
* Analiza wyników sprzedaży i planowanie budżetu,
* Badanie preferencji klientów na podstawie częstości zakupu produktów
Zmienna losowa to funkcja, która przypisuje każdemu wynikowi doświadczenia losowego określoną
liczbę rzeczywistą.
Rozkład prawdopodobieństwa opisuje, jakie wartości może przyjąć zmienna losowa i z jakim
prawdopodobieństwem.
Rozkłady dyskretne (dla zmiennych przyjmujących określone wartości):
* Rozkład Bernoulliego – np. sukces/porażka; zastosowanie: analiza ryzyka decyzji biznesowych.
* Rozkład Poissona – liczba zdarzeń w danym czasie; zastosowanie: analiza liczby reklamacji, awarii.
Rozkłady ciągłe (dla zmiennych przyjmujących dowolne wartości z przedziału):
* Rozkład normalny – powszechnie stosowany w analizie zysków, sprzedaży, odchyleń jakościowych.
* Rozkład wykładniczy – czas między zdarzeniami; zastosowanie: analiza czasu do wystąpienia
awarii.
W biznesie rozkłady służą m.in. do prognozowania sprzedaży, szacowania ryzyka i optymalizacji
procesów.
Rozkład normalny to ciągły rozkład prawdopodobieństwa, którego krzywa ma kształt dzwonu
(symetryczna względem średniej). Opisuje wiele zjawisk naturalnych i ekonomicznych.
Podstawowe własności:
* Symetria względem średniej,
* Średnia, mediana i dominanta są równe,
* Kształt zależy od średniej (położenie) i odchylenia standardowego (rozproszenie),
* Reguła trzech sigm:
o 68% obserwacji mieści się w przedziale ±1σ,
o 95% w przedziale ±2σ,
o 99,7% w przedziale ±3σ.
Przykłady zastosowań w biznesie:
* Prognozowanie sprzedaży i przychodów,
* Analiza jakości produkcji (kontrola odchyleń),
* Szacowanie ryzyka finansowego,
* Badanie wydajności procesów produkcyjnych.
Wnioskowanie statystyczne polega na formułowaniu wniosków o całej populacji na podstawie
wyników uzyskanych z próby. Wykorzystuje się metody rachunku prawdopodobieństwa.
Estymacja przedziałowa:
Polega na określeniu przedziału, w którym z określonym prawdopodobieństwem (np. 95%) znajduje
się nieznany parametr populacji (np. średnia).
Przykład: Oszacowanie, że średnia sprzedaż miesięczna wynosi 1000–1200 sztuk z 95%
pewnością.
Testowanie hipotez statystycznych:
Polega na sprawdzeniu, czy przyjęte przypuszczenie o populacji (hipoteza) jest prawdziwe na
podstawie próby.
Przykład: Sprawdzenie, czy wprowadzenie nowej reklamy wpłynęło na wzrost sprzedaży – poprzez
porównanie wyników przed i po kampanii.