Евгений Ермаков, Николай Гребенщиков - Highly Normalized Hybrid Model

Ближайшая конференция - SmartData 2024, 4 сентября (online), 8-9 сентября, (Москва + трансляция).
Подробности и билеты: jrg.su/KFFBS7
- -
Общепринятым и проверенным временем подходом к построению DWH является схема «Звезда» или «Снежинка». Такой подход каноничен, фундаментален, вотрфоллен и совсем не отвечает той гибкости, к которой призывает Agile.
Для того, чтобы сделать структуру DWH гибкой, существуют современные подходы к проектированию: Data Vault и Anchor modeling - похожие и разные одновременно. Задавшись вопросом, какую из двух методологий выбрать, Евгений и Николай пришли к неожиданному ответу: выбирать надо не между подходами, выбирать надо лучшее из двух подходов.
В своем докладе спикеры расскажут:
- DV и AM: в чем разница и где точки соприкосновения;
- «гибридный» подход к построению хранилища;
- «фишки» этого подхода, его сильные и слабые стороны;
- примеры кода, как это работает;
- дальнейший вектор развития hNhM.

Пікірлер: 5

  • @realfreeman40k
    @realfreeman40k3 жыл бұрын

    Спасибо за доклад!

  • @user-zm5wq2tx2p
    @user-zm5wq2tx2p3 жыл бұрын

    Евгений почему-то ставит знак равенство между 3НФ и Звездой/Снежинкой. Классическая звезда это точно не по 3НФ! Почему не рассмотрели вариант проектирования DDS по чистому 3НФ?

  • @jkermakov

    @jkermakov

    3 жыл бұрын

    Если посмотреть самих классиков, то в "The Data Warehouse Lifecycle Toolkit 2nd Edition" есть такой абзац. fact tables are typically normalized to 3NF in a dimensional model because the related context is removed to dimension tables. The second step is to denormalize the remaining tables into flat dimension tables with single-part keys that connect directly to the fact table; dimension tables most often resemble second normal form tables with many low cardinality descriptors. В общем смысле, и измерения можно привести к 3NF, если мы уходим в снежинку\созвездие, но именно поэтому мы старались употреблять «нормализация ДО 3NF» и делали это скорее иллюстративно и обобщающе тем подходам, что вы написали, для контраста по сравнению с более современными

  • @alekseyvadimovich1304

    @alekseyvadimovich1304

    3 жыл бұрын

    @@jkermakov, здравствуйте! Командой DWH внедряем Hadoop. Записываюсь на бета-тест open source framework! ;)

  • @ivani3237
    @ivani3237 Жыл бұрын

    зачем нужна таблица якорь?

Келесі