SKOLENI.net Školení, kurzy, semináře # apache spark for data engineers - advanced op timizations

KURZ: Apache Spark for Data Engineers - Advanced Optimizations

Apache Spark je distribuovaný výpočetní engine, který poskytuje unifikovaný framework pro zpracování velkých objemů dat, interaktivní analýzu, machine learning, analýzu grafu a streaming. V průběhu posledních několika let se stává standardem pro zpracování těchto workloadů a to nejen v prostředí velkých dat. Jedním z důvodů proč roste popularita Sparku je také jeho programové API, neboli tzv. DataFramy, které nabízejí univerzální datovou abstrakci, již je možné použít ve všech výše zmíněných obl


Program kurzu


Cíle kurzu :
* :
Garant kurzu : David Vrba Ph.D. David pracuje v Emplifi (dříve Socialbakers) jako datový inženýr. Na denní bázi se zabývá optimalizací Spakových aplikací a vyvíjí Sparkové joby, které zpracovávají data na různých škálách od jednotek GBs až po desítky TBs. Vedle toho se zabývá výukou Sparkových trainingů a jeho školeními již prošla celá řada týmů zejména datový analytici, scientisti a inženýři. David je také Sparkovým kontributorem, přispěl do zdrojového kódu a pravidelně mluví na konferencích a meetupech jako je Spark + AI Summit, MLPrague nebo Spark + AI Prague meetup.
Osnova : Spark SQL internals (Query Execution)
Query optimization
Optimization tips Data layout

Předpoklady na účastníka:  

Cíl školení - poznámka ke kurzu     Cíle kurzu: Rozumět a orientovat se ve fyzických plánech Spark SQL Přepsat query za účelem dosažení efektivnějšího plánu Používat některá konfigurační nastavení Připravit Sparkem data pro efektivní analytiku ve Sparku Diagnostikovat botlneck Sparkoveho jobu

Podrobnosti o kurzu

Dotazy a komentáře ke kurzu

Přihláška na kurz

Odesláním formuláře 'Přihláška na kurz' se zaregistruje Vaše přihláška a na zadaný email přijde potvrzení o odeslání této přihlášky. V případě poskytnutí osobních údajů, souhlasíte s archivací těchto údajů v souladu s podmínkami zákona č. 101/2000 Sb., o ochraně osobních údajů, ve znění pozdějších předpisů. Souhlas se zpracováním osobních údajů pro marketingové účely nevyžadujeme, tyto data nezpracováváme. Server pouze zprostředkovává objednávky kurzů & kontakt na jejich pořadatele. Před odesláním přihlášky je nutno souhlasit s obchodními podmínkami účasti na kurzu daného pořadatele kurzu. Neodpovídáme za správnost uvedených údajů. © OBEC.net, sro.
URL >> https://skoleni.net/skoleni_83390_apache-spark-for-data-engineers---advanced-optimizations.html

ApacheSparkDataEngineersAdvancedOptimizations


Počet kurzů: 144765
Máte zájem nabízet Vaše kurzy na těchto stránkách? - Pošlete nám email na adresu info(at)skoleni.net