Apache NiFi. Введение и первый опыт на практике. Это же конструктор!

Apache NiFi Tutorial.
Знакомимся с инструментом и его возможностями на примере обработки данных от сервиса погоды OpenWeather.
00:00 Знакомство
02:15 ETL/ELT
03:56 Apache NiFi. Первый взгляд
08:08 Примеры задач
13:10 Терминология
15:30 Вопросы
18:30 Делаем свой процесс (установка NiFi и создание процесса)
41:05 Вопросы
43:40 Попробуй сам
46:15 Полезные ссылки
47:39 Вопросы
Ссылка на скачивание шаблона процесса:
drive.google.com/file/d/1AHGs...
#Apache #NiFi #Tutorial

Пікірлер: 30

  • @user-fj7on8le9g
    @user-fj7on8le9g2 жыл бұрын

    Спасибо хорошее обучение!! Все понятно человеку с нуля) продолжай дальше снимать очень хорошо рассказываешь)

  • @IT_like_bricks_building

    @IT_like_bricks_building

    2 жыл бұрын

    Спасибо!

  • @romanborodin_official
    @romanborodin_official Жыл бұрын

    Спасибо большое!!! Прекрасный материал, отличная позитивная понятная подача!

  • @IT_like_bricks_building

    @IT_like_bricks_building

    Жыл бұрын

    Огромное спасибо за фидбек!

  • @user-vr9rz5pb9m
    @user-vr9rz5pb9m2 жыл бұрын

    Круто!

  • @user-ew9gg1fh8z
    @user-ew9gg1fh8z2 жыл бұрын

    Да, интересно

  • @IT_like_bricks_building

    @IT_like_bricks_building

    2 жыл бұрын

    Спасибо, дальше больше)

  • @goelrengis
    @goelrengis9 ай бұрын

    Спасибо. А то при беглом сравнении Airflow и Nifi писали что последний только про потоковые данные.

  • @user-ic8mr6ey9h
    @user-ic8mr6ey9h Жыл бұрын

    Подскажите, как вы удаляете лишние стрелки? У меня нет кнопки удалить, и она не появляется после очищения очереди. Кнопка delete на клаве тоже не работает.

  • @IT_like_bricks_building

    @IT_like_bricks_building

    Жыл бұрын

    Нужно остановить 2 связанных этой очередью процессора. Только после этого получится удалить

  • @user-ic8mr6ey9h
    @user-ic8mr6ey9h Жыл бұрын

    Подскажите, пожалуйста; столкнулась с такой проблемой, что после ввод значений в atributestoJson при просмотре самого json файла вместо вывода ключевого слова и значения ("city":"Moscow") появляется только ключевое слово ("city":"") в чем может быть проблема?

  • @IT_like_bricks_building

    @IT_like_bricks_building

    Жыл бұрын

    Вообще есть 2 варианта почему это может быть так. Либо название атрибута неправильно указано в процессоре, либо в входящем флоуфайле нет указанного атрибута или он имеет пустое значение ""

  • @ecomanermetaverse522
    @ecomanermetaverse522 Жыл бұрын

    А откуда на первом шаге, когда генерируем флоуфайлы, они берутся? 10000 чего и откуда пришло? Уточните, пожалуйста. За видео спасибо!!!!

  • @IT_like_bricks_building

    @IT_like_bricks_building

    Жыл бұрын

    Если я правильно понял, то речь про 25:50. Первым процессором выступает GenerateFlowFile. Он так устроен, что он умеет генерировать flowfile с указанными атрибутами и указанным контентом (может случайную строку выбранной длины вставлять). Я ничего там дополнительно не настраивал. А по умолчанию, вроде бы, он делает пустой контент во всех flowfile. Так как расписание запуска по умолчанию раз в 0 сек, грубо говоря как можно чаще, то он и успел нагенерировать много. Надеюсь ответил:)

  • @bomarshee
    @bomarshee11 ай бұрын

    Спасибо за видео. Возникают проблемы с подключением к psql . Как проверить, что драйвер и остальные настройки верны?

  • @IT_like_bricks_building

    @IT_like_bricks_building

    11 ай бұрын

    Мне кажется, что в последних версиях найфай научился валидировать указанные настройки в процессорах при нажатии на кнопку check/validate. Возможно путь к драйверу тоже может. В любом случае при первом же тестовом запуске станет всё понятно.

  • @AlBad-pc7up

    @AlBad-pc7up

    7 ай бұрын

    @@IT_like_bricks_building Добрый день! Подскажите, пожалуйста, сформировавшийся json который содержит инфу про погоду я хочу загрузить в табличку postgresql, но у меня возникла ошибка: None of the fields in the JSON map to the columns defined by the "table_name"z Как я понял суть ошибки, в том, что название ключа jsonа не мапится с названием колонки в таблице? Делал я так: 1) invokehttp (взял данные api) 2) evaluatejsonpath (создал переменную температура и туда запихал значение температуры=)) 3) attributestojson (сформировал json) 4) putdatabaserecord (пытаюсь загрузить данные в БД)

  • @IT_like_bricks_building

    @IT_like_bricks_building

    7 ай бұрын

    @@AlBad-pc7up Добрый! Вообще очень похоже, что вы правы, да. Атрибут в json должен в точности соответствовать названию колонки в таблице "table_name". Во всяком случае алгоритм по пунктам выглядит разумно.

  • @user-qb9ys4nd9f

    @user-qb9ys4nd9f

    7 ай бұрын

    ​@@IT_like_bricks_building, я следовал по шагам как из видео)) Просто в конце добавил еще один процессор загрузки в postgres. Может нужно добавить еще один шаг преобразования jsonа?

  • @IT_like_bricks_building

    @IT_like_bricks_building

    7 ай бұрын

    Да, нужно:) причем там на выбор. Можно json преобразовать через jolt, можно структуру бд подогнать под имеющийся json, можно использовать процессор, который прям сделает insert, а туда подставить данные через $.xxx

  • @maksimus.ssirotkin1124
    @maksimus.ssirotkin1124 Жыл бұрын

    Добрый день, что можете посоветовать для изучения Эластик?

  • @IT_like_bricks_building

    @IT_like_bricks_building

    Жыл бұрын

    Добрый день. Зависит от того, с какой стороны вы планируете изучать его. Если с точки зрения разработки и оптимизаций, то у них отличная документация есть с лучшими практиками ( www.elastic.co/guide/en/elasticsearch/reference/current/how-to.html ). Если со стороны получения данных из него, то лучше всего иметь какую-то задачу, пускай даже абстрактную, и писать различные запросы под нее. В помощь опять же документация ( www.elastic.co/guide/en/elasticsearch/reference/current/search-search.html ) или куча видео, статей. Тут я особо не подскажу, так как я обычно гуглю по необходимости по конкретным проблемам.

  • @maksimus.ssirotkin1124

    @maksimus.ssirotkin1124

    Жыл бұрын

    @@IT_like_bricks_building Спасибо

  • @user-nv9yj3qz3t
    @user-nv9yj3qz3t9 ай бұрын

    Здравствуйте, подскажите пожалуйста, не работает процессор InvokeHTTP , выдает ошибку Request processing failed: java.net.ConnectException Failed to connect to openWeather.... И т.д , эту же апишку смотрел через браузер и постман все работает, а вот через InvokeHTTP не работает,помогите пожалуйста.

  • @IT_like_bricks_building

    @IT_like_bricks_building

    8 ай бұрын

    Здравствуйте, а вы брали пример прям из моего шаблона? Может, он уже устарел чуток, и они что-то поменяли...

  • @alexzir
    @alexzir2 жыл бұрын

    Спер подача!

  • @IT_like_bricks_building

    @IT_like_bricks_building

    2 жыл бұрын

    Спасибо!

  • @goelrengis
    @goelrengis9 ай бұрын

    Спасибо. А то при беглом сравнении Airflow и Nifi писали что последний только про потоковые данные.

  • @IT_like_bricks_building

    @IT_like_bricks_building

    9 ай бұрын

    С одной стороны да, верно. Но я бы не использовал слово "только". Лучше NiFi рассматривать как etl/elt инструмент с соответствующими задачами. Это будет необязательно только входящий поток

  • @goelrengis

    @goelrengis

    9 ай бұрын

    @@IT_like_bricks_building еще есть pentaho, тоже старый open source инструмент. Но почему-то nifi более популярен

Келесі