Statystyczna analiza danych w Pythonie – kurs online

NS/9865 Nauka i Środowisko

Kurs realizowany w formie zdalnej na platformie ZOOM i Google Colab. Wymagane jest posiadanie konta Gmail.

Celem kursu jest wyposażenie Słuchaczy w zaawansowaną wiedzę i umiejętności analityczne z zakresu statystyki i analizy danych. Kurs jest zaprojektowany tak, aby zapewnić wszechstronne zrozumienie narzędzi i technik statystycznych, niezbędnych do skutecznej analizy danych w różnych dziedzinach.

Program kursu obejmuje następujące moduły i tematy:

  1. Streszczenia danych – Słuchacze nauczą się identyfikować i stosować miary położenia, takie jak średnia, mediana i moda, a także różne miary rozrzutu, w tym wariancję, odchylenie standardowe i bezwzględne. Zajęcia pokryją również zaawansowane metody statystyczne, takie jak entropia i współczynnik Giniego. W tym module zostanie także omówiony boxplot oraz miary bliskości i zależności między cechami, w tym błąd średniokwadratowy, odległość Kullbacka Leiblera i korelacje.
  2. Estymacja gęstości – Słuchacze zdobędą umiejętności w tworzeniu histogramów i stosowaniu estymatorów jądrowych do modelowania rozkładów danych.
  3. Redukcja wymiaru cech – w tym module zostaną omówione techniki, takie jak analiza składowych głównych (PCA), skalowanie wielowymiarowe i analiza odpowiedniości, które są kluczowe dla efektywnego zrozumienia i przetwarzania wysokowymiarowych zbiorów danych.
  4. Klasteryzacja – Słuchacze poznają różne metody grupowania danych, od k-średnich i k-medoidów po techniki aglomeracyjne i oparte na modelu statystycznym, co pozwoli na efektywne segmentowanie danych i odkrywanie w nich ukrytych wzorców.
  5. Obserwacje odstające i brakujące dane – kurs pokryje metody identyfikacji i obsługi obserwacji odstających oraz techniki radzenia sobie z brakującymi danymi, które są niezbędne do utrzymania wiarygodności analiz.
  6. Predykcja statystyczna – ten moduł wprowadzi Słuchaczy w świat predykcji za pomocą regresji, klasyfikacji i dyskryminacji. Omówione zostaną metody, takie jak k-najbliższych sąsiadów, regresja liniowa i logistyczna, a także ocena błędów predykcyjnych przez kroswalidację i inne techniki walidacji modeli.
  7. Metody parametryczne i nieparametryczne – Słuchacze nauczą się różnic między modelowaniem parametrycznym a nieparametrycznym oraz zastosują te metody do analizy danych, w tym regresji nieparametrycznej i metod opartych na drzewach decyzyjnych.

Kurs skierowany jest do:

  • profesjonalistów, którzy chcą poszerzyć swoje kompetencje w zakresie analizy danych,
  • osób rozpoczynających swoją przygodę z analizą danych, które pragną zdobyć solidne podstawy i zaawansowane umiejętności analityczne,
  • badaczy i naukowców, którzy chcą zastosować techniki analizy danych w swoich pracach badawczych,
  • specjalistów z różnych dziedzin, takich jak marketing, finanse, medycyna, czy inżynieria, którzy chcą wykorzystać analizę danych do podejmowania bardziej świadomych decyzji.

Wymagana wiedza i umiejętności:

  • podstawowa znajomość statystyki opisowej, w tym miar położenia i rozrzutu (średnia, mediana, wariancja),
  • podstawowa umiejętność pracy z arkuszami kalkulacyjnymi (np. Excel).

Grupa ze zmniejszonym limitem osób.

770.00 PLN 40 godzin 19.25 PLN / h

Grupa NS/9865/2

08.02.2025 - 23.02.2025 Lokalizacja:
l.p. data rozpoczęcie zakończenie przerwa
1 08.02.2025 , sobota 08:00 17:30 00 min
2 09.02.2025 , niedziela 08:00 17:30 00 min
3 22.02.2025 , sobota 08:00 17:00 00 min
4 23.02.2025 , niedziela 08:00 10:00 00 min

Grupa NS/9865/3

15.02.2025 - 30.03.2025 Lokalizacja:
l.p. data rozpoczęcie zakończenie przerwa
1 15.02.2025 , sobota 08:00 17:30 00 min
2 16.02.2025 , niedziela 08:00 17:30 00 min
3 29.03.2025 , sobota 08:00 17:00 00 min
4 30.03.2025 , niedziela 08:00 10:00 00 min
770.00 PLN 40 godzin 19.25 PLN / h