SKOLENI.net Školení, kurzy, semináře # apache spark 3 0 for data scientists - advanc ed analytics
KURZ: Apache Spark 3.0 for Data Scientists - Advanced Analytics
Apache Spark je distribuovaný výpočetní engine, který poskytuje unifikovaný framework pro zpracování velkých objemů dat, interaktivní analýzu, machine learning, analýzu grafu a streaming. V průběhu posledních několika let se stává standardem pro zpracování těchto workloadů a to nejen v prostředí velkých dat. Jedním z důvodů proč roste popularita Sparku je také jeho programové API, neboli tzv. DataFramy, které nabízejí univerzální datovou abstrakci, již je možné použít ve všech výše zmíněných
Program kurzu
Cíle kurzu - Umět analyzovat data pomocí Sparku
- Naučit se Sparkem trénovat ML modely
- Umět Spark integrovat s dalšími data science technologiemi jako je Pandas, SciPy, TensorFlow, Keras
- Vidět state of the art postupy a funkcionalitu v nejaktuálnější verzi Sparku
* - Umět analyzovat data pomocí Sparku
- Naučit se Sparkem trénovat ML modely
- Umět Spark integrovat s dalšími data science technologiemi jako je Pandas, SciPy, TensorFlow, Keras
- Vidět state of the art postupy a funkcionalitu v nejaktuálnější verzi Sparku
Garant
kurzu David Vrba Ph.D. David pracuje v Socialbakers jako data scientist a data engineer. Na denní bázi se zabývá optimalizací Spakových aplikací a vyvíjí Sparkové joby, které zpracovávají data na různých škálách od jednotek GBs až po desítky TBs. Vedle toho se zabývá výukou Sparkových trainingů a jeho
školeními již prošla celá řada týmů zejména datoví analytici, scientisti a inženýři. David je také Sparkovým kontributorem, přispívá do zdrojového kódu a pravidelně mluví na konferencích a meetupech jako je Spark + AI Summit, MLPrague nebo Spark + AI Prague meetup.
Osnova Data analysis with DataFrame API
- Advanced features of DataFrame API
- Integration with Pandas
Lab I
- Analyzing data with DataFrame API
Machine learning with ML Pipelines
- Basic concepts: Transformer, Estimator, Evaluator, Pipeline
- Training/saving/loading a model
- Classification problems
- Cluster analysis
Lab II
Deep learning
- Integration with Tensorflow and Keras
- Image processing
- Transfer learning
Lab III
- Inference with DL model on large scale
Graph processing with GraphFrames
- Basic concepts: Vertices & Edges
- Running Graph algoritms
Předpoklady účastníka Tento kurz je navazujícím kurzem ke
školení Apache Spark
- od jednoduchých transformací po vysoce výkonné joby , ve kterém člověk mimo jiné získá dobrou znalost DataFramového API a úvod do analytiky ve Sparku. Pro absolvování tohoto
kurzu je tedy dobré mít předchozí (alespoň základní) zkušenosti se Sparkem. Dále je užitečné chápat základní koncepty datové analytiky a machine learningu.
Cíl školení - poznámka ke kurzu Cíle kurzu Umět analyzovat data pomocí Sparku Naučit se Sparkem trénovat ML modely Umět Spark integrovat s dalšími data science technologiemi jako je Pandas, SciPy, TensorFlow, Keras Vidět state of the art postupy a funkcionalitu v nejaktuálnější verzi Sparku
Podrobnosti o kurzu
-
Cílová skupina Datoví analytici, scientisti a další uživatelé Sparku, kteří již mají se Sparkem nějakou zkušenost a chtějí Spark používat pro pokročilou analytiku jako je machine learning, deep learning nebo graph processing. Všichni uživatelé Sparku, kteří chtějí vidět kam se technologie posouvá v nejaktuálnější verzi a to zejména v oblasti datové analytiky.
-
David Vrba Ph.D. David pracuje v Socialbakers jako data scientist a data engineer. Na denní bázi se zabývá optimalizací Spakových aplikací a vyvíjí Sparkové joby, které zpracovávají data na různých škálách od jednotek GBs až po desítky TBs. Vedle toho se zabývá výukou Sparkových trainingů a jeho školeními již prošla celá řada týmů zejména datoví analytici, scientisti a inženýři. David je také Sparkovým kontributorem, přispívá do zdrojového kódu a pravidelně mluví na konferencích a meetupech jako je Spark + AI Summit, MLPrague nebo Spark + AI Prague meetup.
-
DataScript s.r.o.
-
Předpoklady účastníka Tento kurz je navazujícím kurzem ke školení Apache Spark - od jednoduchých transformací po vysoce výkonné joby , ve kterém člověk mimo jiné získá dobrou znalost DataFramového API a úvod do analytiky ve Sparku. Pro absolvování tohoto kurzu je tedy dobré mít předchozí (alespoň základní) zkušenosti se Sparkem. Dále je užitečné chápat základní koncepty datové analytiky a machine learningu.
-
Objednavateli bude zaslána závazná přihláška k podpisu. Poté bude účastník na školení registrován. Objednavatel uhradí částku kurzovného za výše uvedeného posluchače na základě faktury vystavené poskytovatelem.
Dotazy a komentáře ke kurzuPřihláška na kurz
🔥 NA VYBRANÉ ŠKOLENÍ & datum konání SE MŮŽETE PŘIHLÁSIT zde:
Odesláním formuláře 'Přihláška na kurz' se zaregistruje Vaše přihláška a na zadaný email přijde potvrzení o odeslání této přihlášky.
V případě poskytnutí osobních údajů, souhlasíte s archivací těchto údajů v souladu s podmínkami zákona č. 101/2000 Sb.,
o ochraně osobních údajů, ve znění pozdějších předpisů. Souhlas se zpracováním osobních údajů pro marketingové účely nevyžadujeme, tyto data nezpracováváme.
Server pouze zprostředkovává objednávky kurzů & kontakt na jejich pořadatele. Před odesláním přihlášky je nutno souhlasit s obchodními podmínkami účasti na kurzu daného pořadatele kurzu.
Neodpovídáme za správnost uvedených údajů. © OBEC.net, sro.
URL >>
https://skoleni.net/skoleni_87887_apache-spark-3-0-for-data-scientists---advanced-analytics.html
ApacheSparkDataScientistsAdvancedAnalytics