Ủa Database, Datalake, Data Warehouse là gì ? Giải thích bởi Senior Data Engineer

Chào các bạn, ở video này mình giải thích cho về các khái niệm siêu cơ bản của Data Engineer: Database - Datalake và Data Warehouse nha. Bonus thêm DataMart và vai trò của Data Engineer, Data Analytics, Data Scientist khi làm việc với hệ thống nữa.
Một số thuật ngữ mà mình sử dụng: OLTP, OLAP, Snowflake, Star Schema, Data Modeling
Fanpage: dataguystory
About me: www.calvinio.com/about/
Chúc mọi người xem video vui vẻ.
🐻 a b o u t 🐻
Mình tốt nghiệp thạc sĩ tại đại học quốc gia Singapore chuyên ngành Data Science (Khoa học dữ liệu). Mình từng làm Data Scientist được khoảng 2.5 năm tại một tập đoàn tự động hóa lớn nhất nhì thế giới. Hiện tại mình đang làm Senior Data Engineer ở Grab Singapore với 5 năm kinh nghiệm. Hy vọng những video của mình sẽ giúp đỡ các bạn phần nào đó bước trên con đường Data này.
Credits:
Feelin Good by Kevin MacLeod được under license Creative Commons Attribution (creativecommons.org/licenses/...)
Source: incompetech.com/music/royalty...
Artist: Kevin MacLeod (incompetech.com/)
#dataengineer #datawarehouse #datalake

Пікірлер: 71

  • @DataGuyStory
    @DataGuyStory3 жыл бұрын

    Cái mô hình từ Database - Datalake - Data Warhouse này là ELT nhé. Sorry mọi người

  • @DataGuyStory
    @DataGuyStory3 жыл бұрын

    Cám ơn ý kiến của một bạn, mình xin đính chính database là cơ sở dữ liệu chứ không phải hệ quản trị cơ sở dữ liệu nhé. Xin lỗi anh chị em :)

  • @ourworld7206

    @ourworld7206

    2 жыл бұрын

    Mình từ ngành khác - bây giờ muốn tìm hiểu data analyst thì mình bắt đầu từ đâu. Thks bạn.

  • @minhly650

    @minhly650

    2 жыл бұрын

    @@ourworld7206 Bắt đầu bằng việc học Python. Sau đó tìm hiểu về các library của Python dùng để xử lí và hiển thị dữ liệu là Pandas, Numpy...

  • @04.thanhatphan75
    @04.thanhatphan753 жыл бұрын

    Video nào của anh cũng chất lượng hết trơn ❤️❤️

  • @hoangtuyen2000
    @hoangtuyen2000 Жыл бұрын

    Tuyệt quá tìm mãi mới thấy anh để hiểu về cái này. Cám ơn a rất nhiều

  • @buiky6860
    @buiky68602 жыл бұрын

    Cảm ơn anh về video. Rất ngắn gọn và dễ hiểu. Mong anh ra nhiều video hơn về ngành DE này ạ

  • @tuannguyenba9513
    @tuannguyenba95132 жыл бұрын

    Giải thích và cho vd dễ hiểu, cảm ơn anh nhiều nhé, chúc a thành công ^^

  • @Peter-Donate
    @Peter-Donate2 жыл бұрын

    Video chất lượng cho người mới tìm hiểu như em anh ạ

  • @tranduyphuc4045
    @tranduyphuc40453 жыл бұрын

    cảm ơn anh về những chia sẽ ^^ hóng từng video một của anh

  • @davidle1342
    @davidle13423 жыл бұрын

    Video rất bổ ích. Cảm ơn Cảnh!

  • @tungminh159
    @tungminh1592 жыл бұрын

    Cảm ơn anh Cảnh. dễ hiểu và hữu ích lắm anh

  • @ngochuyentrinh5585
    @ngochuyentrinh55852 жыл бұрын

    Anh giải thích dễ hiểu quá ạ

  • @Ari_Peace68
    @Ari_Peace68 Жыл бұрын

    Video hữu ích lắm, cảm ơn Cảnh nhiều 👍👍👍

  • @desolate_tunes__
    @desolate_tunes__3 жыл бұрын

    Hóng video mới ạ! 😍

  • @juhandvan
    @juhandvan4 ай бұрын

    Hay và dễ hiểu lắm anh. Cám ơn anh nhiều ạ

  • @tiepchu6650
    @tiepchu6650 Жыл бұрын

    mong anh ra thêm video cần học và làm gì để có thể định hướng trở thành DE ạ. Xem vid của anh cuốn quá ạ !!!

  • @nhancao6515
    @nhancao6515 Жыл бұрын

    Video rất hay, cảm ơn anh.

  • @xemvido
    @xemvido Жыл бұрын

    Cảm ơn bạn, rất dễ hiểu ạ

  • @Crackinglife2x
    @Crackinglife2x3 жыл бұрын

    Video rất hay, rất mong anh làm một video về xây dựng một data warehouse

  • @anguctung4176
    @anguctung41763 жыл бұрын

    Video của anh không dài, tần suất ra ít, nhưng ra cái nào là chất cái đó :)))

  • 2 жыл бұрын

    Cảm ơn anh rất nhiều! Chúc anh luôn thành công, hạnh phúc và gặp nhiều may mắn trong cuộc sống. Anh có thể làm video về quá trình sự nghiệp của anh được không ạ?

  • @tamhuynhthanh874
    @tamhuynhthanh8743 жыл бұрын

    cảm ơn video của anh, đúng lúc project có cái này luôn

  • @tongtran6024
    @tongtran60242 жыл бұрын

    cảm ơn a ạ. Video rất hay, anh có thể làm một video hướng dẫn về ETL một cách chi tiết được không ạ.

  • @ucnguyenang601
    @ucnguyenang6012 жыл бұрын

    Anh thêm các Tut trong chủ đề này nữa đi hả. Xem rất dễ hiểu, đúng là Senior có khác ạ

  • @HungNguyen-ys3kj
    @HungNguyen-ys3kj2 жыл бұрын

    Ok, tôi đã bấm đăng ký kể từ video này

  • @jonnynguyen3087
    @jonnynguyen3087 Жыл бұрын

    Hay...mình kg phải chuyên ngành này nhưng cũng làm việc liên quan lên số liệu và data nên cần phân tích số liệu để đưa ra cái nhìn trực quan hơn .

  • @dpad-tinhhoatoanhoc4725
    @dpad-tinhhoatoanhoc4725 Жыл бұрын

    Worked , thanks a lot!

  • 3 жыл бұрын

    Hay quá b

  • @dpad-tinhhoatoanhoc4725
    @dpad-tinhhoatoanhoc4725 Жыл бұрын

    Still working as of today, ty!

  • @chiho7311
    @chiho73113 жыл бұрын

    Rất chi tiết

  • @BuiQuangChinh-BDCVT
    @BuiQuangChinh-BDCVT2 жыл бұрын

    anh ơi video rất bổ ích ạ. Nhưng ngoài ra a có thể nói thêm về các cách để chuyển từ datawarehouse sang datamart như nào không ạ???

  • @LongTran-Spacebar
    @LongTran-Spacebar3 жыл бұрын

    Awesome! More please !!!

  • @DataGuyStory

    @DataGuyStory

    3 жыл бұрын

    On it! :D

  • @divichuy2575
    @divichuy25752 жыл бұрын

    anh có thể làm một ví dụ cụ thể nào đó về một quá trình ETL được không ạ, Cảm ơn anh

  • @NguyenHuy-jw5yy
    @NguyenHuy-jw5yy3 жыл бұрын

    Cảm ơn anhh

  • @dinhkhoi8207
    @dinhkhoi8207 Жыл бұрын

    cám ơn bạn

  • @anhbui3759
    @anhbui37593 жыл бұрын

    From Toi di code dao with love

  • @truongnv84
    @truongnv842 жыл бұрын

    Anh có thể làm kèm theo demo được không ạ.

  • @BAGGame-be3rw
    @BAGGame-be3rw3 жыл бұрын

    được vl anh ơi :D

  • @nightcorerelax2560
    @nightcorerelax25603 жыл бұрын

    Cho mình hỏi mình học hệ thống thông tin làm về Data engineer dc k vậy bác ?

  • @PeddyNguyenishere
    @PeddyNguyenishere3 жыл бұрын

    úi database chỉ là dữ liệu cơ sở thôi chứ anh nhỉ? hệ qtri CSDL em nhớ là DBSM thì phải. Hy vọng trong tương lai a sẽ làm video emphasize rõ hơn role của Data Scientist khi liên hệ với business side ạ! Btw keep up with your good work anh, videos của anh rất dễ hiểu và xúc tích 👍👍

  • @DataGuyStory

    @DataGuyStory

    3 жыл бұрын

    DBMS, có đính chính lại ùi á :D

  • @vuhuynh4592

    @vuhuynh4592

    3 жыл бұрын

    là BDSM chứ =))

  • @mindset5228

    @mindset5228

    2 жыл бұрын

    "A database system, also called a database management system (DBMS), consists of a collection of interrelated data, known as a database" Sách Data Mining nè bác. Gọi như nhau.

  • @yourhealthyvegangirl7410
    @yourhealthyvegangirl74103 жыл бұрын

    Hi ạ! Anh có thể làm video chia sẻ về AWS được không ạ? Giả dụ công ty đã sử dụng AWS rồi, thì có cần phải tuyển thêm Data Engineer, Data Analyst,.. nữa không ạ? Em cảm ơn anh!

  • @DataGuyStory

    @DataGuyStory

    3 жыл бұрын

    AWS chỉ là nền tảng. Không có DE, DA thì AWS đâu để làm gì em

  • @dangtran9405
    @dangtran94052 жыл бұрын

    hay vl, subscribe ngay và lon

  • @itranh9066
    @itranh90662 жыл бұрын

    data lake co ve giong staging

  • @hiderrmark4019
    @hiderrmark40193 жыл бұрын

    data Science can trang bi nhung gi ha a , e cam on a

  • @ronme9636
    @ronme96362 жыл бұрын

    giá mak biết sớm hơn về kênh

  • @thenguyen5887
    @thenguyen5887Ай бұрын

    a ơi, vậy nếu như mỗi cái nhu cầu báo cáo, phân tích khác nhau thì dữ liệu mình đổ vào data warehouse sẽ khác nhau, vậy thì với một datalake mình sẽ có nhiều data warehouse đúng k ạ

  • @DataGuyStory

    @DataGuyStory

    Ай бұрын

    Data Warehouse chỉ có một thôi nhé. Nên người ta mới gọi là Single Source of Truth

  • @cuongnguyenquoc6309
    @cuongnguyenquoc6309 Жыл бұрын

    A học trường nào vậy ạ

  • @angkhoanguyen7566
    @angkhoanguyen7566 Жыл бұрын

    Anh Cảnh cho em hỏi: Case thứ 2 nếu như extract từ Datalake ra Report và send email cho sếp. Nếu như mình ko cần lưu thì mình tới Data warehouse làm gì a nhỉ?

  • @DataGuyStory

    @DataGuyStory

    Жыл бұрын

    Thông thường là đều lưu lại hết em. Còn nếu không cần lưu thì khỏi cần DWH nha

  • @angkhoanguyen7566

    @angkhoanguyen7566

    Жыл бұрын

    @@DataGuyStory Thanks a. Anyway cho em hỏi về quá trình Ingestion, các phương thức Ingestion theo em tìm hiểu thì có Batch - Stream - ELT - API. Thì khi nào mình áp dụng phương thức cho mỗi DB vậy anh Cảnh nhỉ? Thứ 2 cho em hỏi về việc backup data ở trong Datalake, giữa real-time backup và T-1 backup thì cách thức hoạt động của nó sẽ như nào a ha?

  • @sockbenzero10
    @sockbenzero103 жыл бұрын

    Data Engineer co phai cung la database manager lun khong anh

  • @DataGuyStory

    @DataGuyStory

    3 жыл бұрын

    Không em. Database là khác nữa

  • @loutruong8000
    @loutruong80003 жыл бұрын

    Dạ a ứi, hiện tại bên Việt Nam một số bạn làm hệ thống crm có thêm một từ khoá là cdp customer data platform. A cho e hỏi đó là gì và sao câc bạn crm lại cho ra hệ thống đó ạ

  • @DataGuyStory

    @DataGuyStory

    3 жыл бұрын

    À, Customer Data Platform (CDP) là một hệ thống data riêng và phục vụ duy nhất cho Marketing team. Data Warehouse thì nó phục vụ toàn bộ công ty, còn CDP chỉ phục vụ cho một team, tối ưu cho việc marketing để segment khách hàng và target customers cho marketing campaign. Thường thì nếu công ty nhỏ mà xây dựng Data Warehouse chỉ cho việc phân tích dữ liệu Marketing thì có thể xài CDP. Còn nếu công ty lớn đã có sẵn Data Warehouse rồi thì việc xây dựng hệ thống CDP con từ DW có sẵn lại dễ dàng hơn nữa.

  • @loutruong8000

    @loutruong8000

    3 жыл бұрын

    @@DataGuyStory Dạ a, tại e làm mkt á a, lead của customer của e đổ vào trong CRM. Khi e cần visualize 1 cái ad hoc hypothesis thì các anh DE bảo sẽ là phải đổ vào trong CDP để làm sạch r từ đó e mới query ra thành bảng mà đi visualize lại

  • @DataGuyStory

    @DataGuyStory

    3 жыл бұрын

    @@loutruong8000 mình nghĩ do bên bạn hệ thống data chủ yếu là cho marketing nên các bạn DE mới xây dựng CDP, phương pháp tốt nhất mà hiệu quả nhất rồi :)

  • @linh-phgvu
    @linh-phgvu3 жыл бұрын

    First like =))))

  • @lokito5338
    @lokito53382 жыл бұрын

    anh cho em hỏi data load vô data lake sao lại là ETL vậy anh? Vì theo em biết thì quy trình ETL không có support data lake thì phải.

  • @DataGuyStory

    @DataGuyStory

    2 жыл бұрын

    Nó là ELT đó em. Anh vẽ lộn cái lười edit đó

  • @DataGuyStory

    @DataGuyStory

    2 жыл бұрын

    Với anh có cái comment đính chính lại á em. 1 năm trước nên nó trôi mất tiêu thì phải

  • @quannguyenthe3520
    @quannguyenthe3520 Жыл бұрын

    mình đanh vướng mắc ở phần OLAP, có ai support mình kh ạ 😢

  • @ngochuyentrinh5585
    @ngochuyentrinh55852 жыл бұрын

    Mình ở đây vì hông muốn giống bò :))))

  • @quoccuongnguyen9751
    @quoccuongnguyen9751 Жыл бұрын

    Vứt

  • @buison6454
    @buison64543 ай бұрын

    Cô đọng và dễ hiểu.

Келесі