Big Data – Praktyczne Wprowadzenie w Pythonie – kurs online

NS/10232 Nauka i Środowisko

Kurs realizowany w formie zdalnej na platformie ZOOM.

Przetwarzanie współbieżne i równoległe w kursie koncentruje się na nauce efektywnego zarządzania dużymi wolumenami danych z użyciem współczesnych narzędzi, takich jak Apache Spark, Apache Kafka, Google BigQuery, Dask i Ray. Słuchacze poznają podstawy przetwarzania współbieżnego i równoległego, ucząc się, jak zaprojektować, wdrożyć i zoptymalizować procesy przetwarzania danych, zarówno w czasie rzeczywistym, jak i wsadowym.

Program obejmuje omówienie teoretycznych aspektów współbieżności i równoległości oraz praktyczne ćwiczenia. Pierwsze zajęcia wprowadzają w koncepcje i narzędzia, a kolejne skupiają się na przetwarzaniu równoległym w Google BigQuery, z naciskiem na optymalizację zapytań i minimalizację kosztów. Następnie Słuchacze dowiedzą się, jak wykorzystywać asyncio i aiohttp do współbieżnego przetwarzania danych w Pythonie oraz jak implementować asynchroniczne operacje I/O. Kurs omawia również bibliotekę Dask, jej zastosowanie w przetwarzaniu dużych zbiorów danych oraz integrację ze Spark do realizacji zadań równoległych.

Kolejne moduły skupiają się na przetwarzaniu strumieniowym z Apache Kafka oraz integracji z Apache Spark Streaming, ucząc Słuchaczy przetwarzania strumieni w czasie rzeczywistym. Ostatnie zajęcia obejmują techniki optymalizacji wydajności oraz projektowanie pełnych pipeline’ów Big Data, co pozwoli Słuchaczom na budowę skalowalnych, efektywnych systemów przetwarzania danych.

Grupa ze zmniejszonym limitem osób.

770.00 PLN 40 godzin 19.25 PLN / h

Grupa NS/10232/1

18.01.2025 - 26.01.2025 Lokalizacja:
l.p. data rozpoczęcie zakończenie przerwa
1 18.01.2025 , sobota 08:00 17:30 00 min
2 19.01.2025 , niedziela 08:00 17:00 00 min
3 25.01.2025 , sobota 08:00 17:30 00 min
4 26.01.2025 , niedziela 08:00 10:00 00 min
770.00 PLN 40 godzin 19.25 PLN / h