Bookbot

Zaawansowana analiza danych w PySpark

Auteurs

  • Collectif d'auteurs

En savoir plus sur le livre

Potrzeby analizy dużych zbiorów danych rosną, a PySpark, interfejs API systemu Spark dla Pythona, staje się kluczowym narzędziem. Apache Spark doskonale nadaje się do analizy dużych danych, a PySpark ułatwia integrację z narzędziami PyData. Aby w pełni wykorzystać te możliwości, istotne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami analitycznymi. Przewodnik po wersji 3.0 systemu Spark przedstawia metody statystyczne i rzeczywiste zbiory danych, omawiając zasady rozwiązywania problemów analitycznych za pomocą PySpark oraz dobre praktyki programowania. Po lekturze można łatwo zgłębić analityczne wzorce oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie IT i finansach. Książka zawiera również opisy przetwarzania obrazów i języka naturalnego oraz rzeczywiste przykłady analizy dużych zbiorów danych. Dzięki niej poznasz model programowania w ekosystemie Spark, podstawowe metody w nauce o danych, pełne implementacje analiz publicznych zbiorów danych, konkretne przypadki użycia narzędzi uczenia maszynowego oraz kod, który można łatwo dostosować do własnych potrzeb. PySpark to odpowiedź na wyzwania inżynierów danych!

Achat du livre

Zaawansowana analiza danych w PySpark, Collectif d'auteurs

Langue
Année de publication
2023
product-detail.submit-box.info.binding
(souple)
Nous vous informerons par e-mail dès que nous l’aurons retrouvé.

Modes de paiement

Personne n'a encore évalué .Évaluer