Apache NiFi. Введение и первый опыт на практике. Это же конструктор!
Apache NiFi Tutorial.
Знакомимся с инструментом и его возможностями на примере обработки данных от сервиса погоды OpenWeather.
00:00 Знакомство
02:15 ETL/ELT
03:56 Apache NiFi. Первый взгляд
08:08 Примеры задач
13:10 Терминология
15:30 Вопросы
18:30 Делаем свой процесс (установка NiFi и создание процесса)
41:05 Вопросы
43:40 Попробуй сам
46:15 Полезные ссылки
47:39 Вопросы
Ссылка на скачивание шаблона процесса:
drive.google.com/file/d/1AHGs...
#Apache #NiFi #Tutorial
Пікірлер: 30
Спасибо хорошее обучение!! Все понятно человеку с нуля) продолжай дальше снимать очень хорошо рассказываешь)
@IT_like_bricks_building
2 жыл бұрын
Спасибо!
Спасибо большое!!! Прекрасный материал, отличная позитивная понятная подача!
@IT_like_bricks_building
Жыл бұрын
Огромное спасибо за фидбек!
Круто!
Да, интересно
@IT_like_bricks_building
2 жыл бұрын
Спасибо, дальше больше)
Спасибо. А то при беглом сравнении Airflow и Nifi писали что последний только про потоковые данные.
Подскажите, как вы удаляете лишние стрелки? У меня нет кнопки удалить, и она не появляется после очищения очереди. Кнопка delete на клаве тоже не работает.
@IT_like_bricks_building
Жыл бұрын
Нужно остановить 2 связанных этой очередью процессора. Только после этого получится удалить
Подскажите, пожалуйста; столкнулась с такой проблемой, что после ввод значений в atributestoJson при просмотре самого json файла вместо вывода ключевого слова и значения ("city":"Moscow") появляется только ключевое слово ("city":"") в чем может быть проблема?
@IT_like_bricks_building
Жыл бұрын
Вообще есть 2 варианта почему это может быть так. Либо название атрибута неправильно указано в процессоре, либо в входящем флоуфайле нет указанного атрибута или он имеет пустое значение ""
А откуда на первом шаге, когда генерируем флоуфайлы, они берутся? 10000 чего и откуда пришло? Уточните, пожалуйста. За видео спасибо!!!!
@IT_like_bricks_building
Жыл бұрын
Если я правильно понял, то речь про 25:50. Первым процессором выступает GenerateFlowFile. Он так устроен, что он умеет генерировать flowfile с указанными атрибутами и указанным контентом (может случайную строку выбранной длины вставлять). Я ничего там дополнительно не настраивал. А по умолчанию, вроде бы, он делает пустой контент во всех flowfile. Так как расписание запуска по умолчанию раз в 0 сек, грубо говоря как можно чаще, то он и успел нагенерировать много. Надеюсь ответил:)
Спасибо за видео. Возникают проблемы с подключением к psql . Как проверить, что драйвер и остальные настройки верны?
@IT_like_bricks_building
11 ай бұрын
Мне кажется, что в последних версиях найфай научился валидировать указанные настройки в процессорах при нажатии на кнопку check/validate. Возможно путь к драйверу тоже может. В любом случае при первом же тестовом запуске станет всё понятно.
@AlBad-pc7up
7 ай бұрын
@@IT_like_bricks_building Добрый день! Подскажите, пожалуйста, сформировавшийся json который содержит инфу про погоду я хочу загрузить в табличку postgresql, но у меня возникла ошибка: None of the fields in the JSON map to the columns defined by the "table_name"z Как я понял суть ошибки, в том, что название ключа jsonа не мапится с названием колонки в таблице? Делал я так: 1) invokehttp (взял данные api) 2) evaluatejsonpath (создал переменную температура и туда запихал значение температуры=)) 3) attributestojson (сформировал json) 4) putdatabaserecord (пытаюсь загрузить данные в БД)
@IT_like_bricks_building
7 ай бұрын
@@AlBad-pc7up Добрый! Вообще очень похоже, что вы правы, да. Атрибут в json должен в точности соответствовать названию колонки в таблице "table_name". Во всяком случае алгоритм по пунктам выглядит разумно.
@user-qb9ys4nd9f
7 ай бұрын
@@IT_like_bricks_building, я следовал по шагам как из видео)) Просто в конце добавил еще один процессор загрузки в postgres. Может нужно добавить еще один шаг преобразования jsonа?
@IT_like_bricks_building
7 ай бұрын
Да, нужно:) причем там на выбор. Можно json преобразовать через jolt, можно структуру бд подогнать под имеющийся json, можно использовать процессор, который прям сделает insert, а туда подставить данные через $.xxx
Добрый день, что можете посоветовать для изучения Эластик?
@IT_like_bricks_building
Жыл бұрын
Добрый день. Зависит от того, с какой стороны вы планируете изучать его. Если с точки зрения разработки и оптимизаций, то у них отличная документация есть с лучшими практиками ( www.elastic.co/guide/en/elasticsearch/reference/current/how-to.html ). Если со стороны получения данных из него, то лучше всего иметь какую-то задачу, пускай даже абстрактную, и писать различные запросы под нее. В помощь опять же документация ( www.elastic.co/guide/en/elasticsearch/reference/current/search-search.html ) или куча видео, статей. Тут я особо не подскажу, так как я обычно гуглю по необходимости по конкретным проблемам.
@maksimus.ssirotkin1124
Жыл бұрын
@@IT_like_bricks_building Спасибо
Здравствуйте, подскажите пожалуйста, не работает процессор InvokeHTTP , выдает ошибку Request processing failed: java.net.ConnectException Failed to connect to openWeather.... И т.д , эту же апишку смотрел через браузер и постман все работает, а вот через InvokeHTTP не работает,помогите пожалуйста.
@IT_like_bricks_building
8 ай бұрын
Здравствуйте, а вы брали пример прям из моего шаблона? Может, он уже устарел чуток, и они что-то поменяли...
Спер подача!
@IT_like_bricks_building
2 жыл бұрын
Спасибо!
Спасибо. А то при беглом сравнении Airflow и Nifi писали что последний только про потоковые данные.
@IT_like_bricks_building
9 ай бұрын
С одной стороны да, верно. Но я бы не использовал слово "только". Лучше NiFi рассматривать как etl/elt инструмент с соответствующими задачами. Это будет необязательно только входящий поток
@goelrengis
9 ай бұрын
@@IT_like_bricks_building еще есть pentaho, тоже старый open source инструмент. Но почему-то nifi более популярен