Денис Ефаров - Hadoop 3: Erasure coding catastrophe

Ближайшая конференция - SmartData 2024, 4 сентября (online), 8-9 сентября, (Москва + трансляция).
Подробности и билеты: jrg.su/KFFBS7
- -
Представьте себе картину: ваши HDFS кластера близятся по объему к 100 Pb, вы каждый год заказываете машин на десяток петабайт, заводите их, месяцами балансируете и повторяете эту процедуру раз за разом. Затем выходит Hadoop 3, который обещает экономию места в два раза при тех же гарантиях - хочется немедленно применить это. Но вы опытны, не бросаетесь в latest сразу, дожидаетесь версии 3.1+, тестируете, последовательно выкатываете, еще раз тестируете. Но через полгода начинаете наблюдать за тем, как ваши данные превращаются в тыкву и далеко не только в полночь. Представляете себе исчезновение 100 Pb данных? Это очень больно!
Команда прошла практически по краю этой пропасти и многое узнала. Этот доклад о находках и ошибках, новом опыте при работе с Hadoop и о том, как можно избежать подобных ситуаций.
Аудитория: инженеры и разработчики в BigData, использующие экосистему Hadoop или планирующие на нее переходить.
Скачать презентацию: assets.ctfassets.net/oxjq45e8...

Пікірлер: 3

  • @QuadRomb
    @QuadRomb Жыл бұрын

    Восхищён тем, что докладчик ни разу не употребил ни одного матерного слова. Занырнуть в такой мясокомбинат, а потом выплывать из него больше года - это дорогого стоит. Короче, в Хадуп - ни ногой!

  • @neektt

    @neektt

    Жыл бұрын

    Все матерные слова остались вне конференции. Но поверьте участнику событий, они были в достатке.

  • @AM-od3hr
    @AM-od3hr2 ай бұрын

    Легасов на конференции МАГАТЭ

Келесі