Květen 2024 # Apache Spark je distribuovaný výpočetní engine, který poskytuje unifikovaný framework pro zpracování velkých objemů dat, interaktivní analýzu, machine learning, analýzu grafu a streaming. V průběhu posledních několika let se stává standardem pro zpracování těchto workloadů a to nejen v prostředí velkých dat. Jedním z důvodů proč roste popularita Sparku je také jeho programové API, neboli tzv. DataFramy, které nabízejí univerzální datovou abstrakci, již je možné použít ve všech výše ...
ApacheSparkDataScientistsAdvancedAnalytics
Květen 2024 # Apache Spark je distribuovaný výpočetní engine, který poskytuje unifikovaný framework pro zpracování velkých objemů dat, interaktivní analýzu, machine learning, analýzu grafu a streaming. V průběhu posledních několika let se stává standardem pro zpracování těchto workloadů a to nejen v prostředí velkých dat. Jedním z důvodů proč roste popularita Sparku je také jeho programové API, neboli tzv. DataFramy, které nabízejí univerzální datovou abstrakci, již je možné použít ve všech výše zmíněných ...
ApacheSparkDataEngineersAdvancedOptimizations
Červen 2024 # Tento kurz se zaměřuje na použití Apache Kafky pro rozsáhlé systémy, které jsou typicky provozovány ve velkých datových centrech. Zaměříme se především na zajičtení dostupnosti dat a na zrcadlení dat mezi datovými centry. Cíle: V současnosti se stále častěji setkáváme s nasazením Apache Kafky. Mnohdy se jedná o centrální prvek celé architektury (která může být založena například na mikroslužbách). Ovšem v praxi je nutné zajistit zrcadlení dat mezi několika Kafka clustery. To zajišťuje ...
ApacheKafkaAdvanced
Květen 2024 # Apache Cassandra * Účastníci kurzu se seznámí se správou distribuované databáze Apache Casssandra. Kurz bude vedený z pohledu DevOps, kdy budou vysvětleny základní principy práce s touto databází, návrh datového modelu aplikace a její následná opt...
ApacheCassandra