top of page

Chuẩn hóa dữ liệu và lập mô hình dữ liệu

Mục tiêu của bài viết này là giúp bạn hiểu sự khác biệt giữa chuẩn hóa (𝘀𝗵𝗮𝗽𝗶𝗻𝗴) dữ liệu bằng cách sử dụng Power Query và lập mô hình dữ liệu (𝗱𝗮𝘁𝗮 𝗺𝗼𝗱𝗲𝗹𝗹𝗶𝗻𝗴) bằng cách sử dụng các công cụ lập mô hình bên trong Power Pivot / Power BI. Đây là hai bước cần phải làm trước khi viết các công thức tính toán mà mọi người cần phải hiểu và phân biệt nó. Hình ảnh dưới cho thấy luồng dữ liệu đi từ nguồn ban đầu đến báo cáo cuối cùng được gửi ra. Bài viết này tập trung vào hai bước đầu tiên của chu trình (1) 𝒄𝒉𝒖𝒂̂̉𝒏 𝒉𝒐́𝒂 𝒅𝒖̛̃ 𝒍𝒊𝒆̣̂𝒖 và (2) 𝒍𝒂̣̂𝒑 𝒎𝒐̂ 𝒉𝒊̀𝒏𝒉 𝒅𝒖̛̃ 𝒍𝒊𝒆̣̂𝒖.


ree

(𝟭) 𝗦𝗵𝗮𝗽𝗶𝗻𝗴 𝗹𝗮̀ 𝗴𝗶̀? Shaping là quá trình trích xuất dữ liệu từ nguồn (extract), chuyển đổi (transform) dữ liệu thành shape bạn cần, sau đó tải (load) dữ liệu đó vào Power Pivot / Power BI. Quá trình này thường được gọi là ETL (extract, transform and load). Quá trình shaping dữ liệu bao gồm: • 𝘛𝘢́𝘪 𝘤𝘢̂́𝘶 𝘵𝘳𝘶́𝘤 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 đ𝘦̂́𝘯 𝘵𝘶̛̀ 𝘤𝘢́𝘤 𝘣𝘢̉𝘯𝘨 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 𝘯𝘨𝘶𝘰̂̀𝘯 𝘵𝘩𝘢̀𝘯𝘩 𝘤𝘢́𝘤 𝘣𝘢̉𝘯𝘨 𝘮𝘰̛́𝘪 đ𝘢́𝘱 𝘶̛́𝘯𝘨 𝘤𝘢́𝘤 𝘺𝘦̂𝘶 𝘤𝘢̂̀𝘶 đ𝘰̂́𝘪 𝘷𝘰̛́𝘪 𝘤𝘰̛ 𝘴𝘰̛̉ 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 𝘣𝘢́𝘰 𝘤𝘢́𝘰 (𝘳𝘦𝘱𝘰𝘳𝘵𝘪𝘯𝘨 𝘥𝘢𝘵𝘢𝘣𝘢𝘴𝘦). 𝘊𝘢̂́𝘶 𝘵𝘳𝘶́𝘤 𝘣𝘢̉𝘯𝘨 𝘵𝘳𝘰𝘯𝘨 𝘳𝘦𝘭𝘢𝘵𝘪𝘰𝘯𝘢𝘭 𝘥𝘢𝘵𝘢𝘣𝘢𝘴𝘦 𝘩𝘪𝘦̂́𝘮 𝘬𝘩𝘪 (𝘯𝘦̂́𝘶 𝘤𝘰́) 𝘱𝘩𝘶̀ 𝘩𝘰̛̣𝘱 𝘷𝘰̛́𝘪 𝘗𝘰𝘸𝘦𝘳 𝘗𝘪𝘷𝘰𝘵 / 𝘗𝘰𝘸𝘦𝘳 𝘉𝘐. • 𝘊𝘩𝘪̉ 𝘤𝘩𝘰̣𝘯 𝘤𝘢́𝘤 𝘤𝘰̣̂𝘵 𝘷𝘢̀ 𝘩𝘢̀𝘯𝘨 𝘤𝘢̂̀𝘯 𝘵𝘩𝘪𝘦̂́𝘵. 𝘛𝘢̉𝘪 𝘮𝘰̣𝘪 𝘵𝘩𝘶̛́ 𝘣𝘢̣𝘯 𝘤𝘢̂̀𝘯 𝘷𝘢̀ 𝘬𝘩𝘰̂𝘯𝘨 𝘵𝘢̉𝘪 𝘣𝘢̂́𝘵 𝘤𝘶̛́ 𝘵𝘩𝘶̛́ 𝘨𝘪̀ 𝘣𝘢̣𝘯 𝘬𝘩𝘰̂𝘯𝘨 𝘤𝘢̂̀𝘯. • 𝘛𝘰̂̉𝘯𝘨 𝘩𝘰̛̣𝘱 𝘵𝘳𝘶̛𝘰̛́𝘤 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 (𝘯𝘦̂́𝘶 𝘮𝘶𝘰̂́𝘯/𝘤𝘢̂̀𝘯 𝘵𝘩𝘪𝘦̂́𝘵 𝘵𝘳𝘰𝘯𝘨 𝘵𝘳𝘶̛𝘰̛̀𝘯𝘨 𝘩𝘰̛̣𝘱 𝘯𝘨𝘰𝘢̣𝘪 𝘭𝘦̣̂), 𝘷𝘢̀ 𝘵𝘩𝘶̛𝘰̛̀𝘯𝘨 𝘵𝘩𝘪̀ 𝘤𝘢́𝘤 𝘤𝘩𝘶𝘺𝘦̂𝘯 𝘨𝘪𝘢 𝘬𝘩𝘰̂𝘯𝘨 𝘬𝘩𝘶𝘺𝘦̂́𝘯 𝘬𝘩𝘪́𝘤𝘩 đ𝘪𝘦̂̀𝘶 𝘯𝘢̀𝘺. • Đ𝘢̣̆𝘵 𝘵𝘦̂𝘯/đ𝘰̂̉𝘪 𝘵𝘦̂𝘯 𝘤𝘢́𝘤 𝘤𝘰̣̂𝘵 𝘷𝘢̀ 𝘣𝘢̉𝘯𝘨 𝘴𝘢𝘰 𝘤𝘩𝘰 𝘵𝘩𝘢̂𝘯 𝘵𝘩𝘪𝘦̣̂𝘯 𝘥𝘦̂̃ 𝘩𝘪𝘦̂̉𝘶 đ𝘰̂́𝘪 𝘷𝘰̛́𝘪 𝘯𝘨𝘶̛𝘰̛̀𝘪 𝘴𝘶̛̉ 𝘥𝘶̣𝘯𝘨. • Đ𝘪̣𝘯𝘩 𝘥𝘢̣𝘯𝘨 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 𝘵𝘩𝘦𝘰 đ𝘶́𝘯𝘨 𝘤𝘩𝘶𝘢̂̉𝘯 𝘤𝘶̉𝘢 𝘯𝘰́ (𝘯𝘶𝘮𝘣𝘦𝘳, 𝘵𝘦𝘹𝘵, 𝘥𝘢𝘵𝘦/𝘥𝘢𝘵𝘦 𝘵𝘪𝘮𝘦…) • 𝘛𝘢̉𝘪 𝘮𝘰̣𝘪 𝘵𝘩𝘶̛́ 𝘷𝘢̀𝘰 𝘥𝘢𝘵𝘢 𝘮𝘰𝘥𝘦𝘭 𝘤𝘶̉𝘢 𝘗𝘰𝘸𝘦𝘳 𝘗𝘪𝘷𝘰𝘵 / 𝘗𝘰𝘸𝘦𝘳 𝘉𝘐.

(𝟮) 𝗠𝗼𝗱𝗲𝗹𝗹𝗶𝗻𝗴 𝗹𝗮̀ 𝗴𝗶̀? Lập mô hình là quá trình thiết kế cấu trúc bảng dữ liệu, xây dựng mối quan hệ giữa các bảng và viết các measures để tính toán, trích xuất thông tin có ý nghĩa Mô hình hóa dữ liệu bao gồm: • 𝘟𝘢́𝘤 đ𝘪̣𝘯𝘩 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 𝘯𝘢̀𝘰 𝘭𝘰𝘢𝘥 𝘷𝘢̀ 𝘬𝘩𝘰̂𝘯𝘨 𝘭𝘰𝘢𝘥. • 𝘟𝘢́𝘤 đ𝘪̣𝘯𝘩 𝘮𝘰̣̂𝘵 𝘮𝘰̂ 𝘩𝘪̀𝘯𝘩 (𝘴𝘤𝘩𝘦𝘮𝘢); 𝘭𝘢̀ 𝘮𝘰̣̂𝘵 𝘣𝘢̉𝘯𝘨, 𝘩𝘢𝘪 𝘣𝘢̉𝘯𝘨 𝘩𝘺 𝘯𝘩𝘪𝘦̂̀𝘶 𝘣𝘢̉𝘯𝘨? 𝘝𝘢̀ 𝘯𝘦̂𝘯 𝘭𝘶𝘰̂𝘯 𝘶̛𝘶 𝘵𝘪𝘦̂𝘯 𝘮𝘰̂ 𝘩𝘪̀𝘯𝘩 𝘴𝘵𝘢𝘳 𝘴𝘤𝘩𝘦𝘮𝘢. • 𝘟𝘢́𝘤 đ𝘪̣𝘯𝘩 𝘵𝘦̂𝘯 đ𝘢̣̆𝘵 𝘤𝘩𝘰 𝘤𝘢́𝘤 𝘤𝘰̣̂𝘵 𝘷𝘢̀ 𝘣𝘢̉𝘯𝘨 • 𝘟𝘢́𝘤 đ𝘪̣𝘯𝘩 𝘣𝘢̉𝘯𝘨 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 𝘳𝘰̣̂𝘯𝘨 𝘷𝘢̀ 𝘯𝘨𝘢̆́𝘯 (𝘯𝘩𝘪𝘦̂̀𝘶 𝘤𝘰̣̂𝘵) 𝘩𝘢𝘺 𝘥𝘢̀𝘪 𝘷𝘢̀ 𝘩𝘦̣𝘱 (𝘪́𝘵 𝘤𝘰̣̂𝘵 𝘩𝘰̛𝘯) • 𝘑𝘰𝘪𝘯𝘯𝘪𝘯𝘨 𝘤𝘢́𝘤 𝘣𝘢̉𝘯𝘨 𝘣𝘢̆̀𝘯𝘨 𝘤𝘢́𝘤𝘩 𝘴𝘶̛̉ 𝘥𝘶̣𝘯𝘨 𝘤𝘢́𝘤 𝘮𝘰̂́𝘪 𝘲𝘶𝘢𝘯 𝘩𝘦̣̂ (𝘯𝘦̂́𝘶 𝘤𝘢̂̀𝘯) • 𝘝𝘪𝘦̂́𝘵 𝘤𝘢́𝘤 𝘮𝘦𝘢𝘴𝘶𝘳𝘦𝘴 đ𝘦̂̉ 𝘵𝘳𝘪́𝘤𝘩 𝘹𝘶𝘢̂́𝘵 𝘵𝘩𝘰̂𝘯𝘨 𝘵𝘪𝘯 𝘤𝘰́ 𝘺́ 𝘯𝘨𝘩𝘪̃𝘢 𝘵𝘶̛̀ 𝘥𝘶̛̃ 𝘭𝘪𝘦̣̂𝘶 𝘵𝘩𝘰̂. • Đ𝘪̣𝘯𝘩 𝘥𝘢̣𝘯𝘨 𝘤𝘩𝘪́𝘯𝘩 𝘹𝘢́𝘤 𝘤𝘢́𝘤 𝘮𝘦𝘢𝘴𝘶𝘳𝘦𝘴 𝘷𝘢̀ 𝘤𝘰̣̂𝘵 đ𝘦̂̉ đ𝘢́𝘱 𝘶̛́𝘯𝘨 𝘤𝘢́𝘤 𝘺𝘦̂𝘶 𝘤𝘢̂̀𝘶 𝘬𝘪𝘯𝘩 𝘥𝘰𝘢𝘯𝘩 (𝘷𝘪́ 𝘥𝘶̣: 𝘵𝘪𝘦̂̀𝘯 𝘵𝘦̣̂, 𝘵𝘺̉ 𝘭𝘦̣̂ 𝘱𝘩𝘢̂̀𝘯 𝘵𝘳𝘢̆𝘮, 𝘴𝘰̂́ 𝘵𝘩𝘢̣̂𝘱 𝘱𝘩𝘢̂𝘯 𝘵𝘩𝘪́𝘤𝘩 𝘩𝘰̛̣𝘱) • Đ𝘢̣̆𝘵 𝘵𝘦̂𝘯 𝘤𝘩𝘰 𝘤𝘢́𝘤 𝘮𝘦𝘢𝘴𝘶𝘳𝘦𝘴 đ𝘦̂̉ 𝘮𝘰̂ 𝘵𝘢̉ 𝘤𝘩𝘪́𝘯𝘩 𝘹𝘢́𝘤 𝘯𝘩𝘶̛̃𝘯𝘨 𝘨𝘪̀ đ𝘢𝘯𝘨 đ𝘶̛𝘰̛̣𝘤 𝘵𝘪́𝘯𝘩 𝘵𝘰𝘢́𝘯. Lưu ý rằng quyết định tải nội dung nào là một phần của quá trình lập mô hình nhưng quá trình cấu trúc dữ liệu là một phần của quá trình shaping. Rõ ràng 2 khái niệm này có mối liên hệ chặt chẽ và phụ thuộc lẫn nhau.

Comments


VR Goggles

Practice makes perfect

Sign up for our newsletter

Thanks for subscribing!

Contact Us

Thu Duc, HCM city

  • Slack
  • Twitter
  • Linkedin
  • Facebook

© 2023 by Finclvr. Powered and secured by Microsoft

bottom of page