CÔNG CỤ PHÂN TÍCH DỰ ĐOÁN
- AutoReport
- Jul 14, 2023
- 6 min read
(theo Thomas H. Davenport)

Không ai có khả năng nắm bắt và phân tích dữ liệu từ tương lai. Tuy nhiên, có một cách để dự đoán tương lai là sử dụng dữ liệu từ quá khứ. Nó được gọi là phân tích dự đoán, và các tổ chức làm điều đó mỗi ngày.
Ví dụ, công ty của bạn đã phát triển một công thức đo lường giá trị khách hàng trọn đời (CLTV)? Bằng cách sử dụng các phân tích dự đoán để xác định số lượng khách hàng sẽ mua của công ty theo thời gian. Bạn đã có một “ưu đãi tốt nhất tiếp theo” chưa ? hay giới thiệu sản phẩm? Đó là một phân tích dự đoán về sản phẩm hoặc dịch vụ mà khách hàng có nhiều khả năng mua tiếp theo. Bạn đã có dự báo doanh số cho quý tiếp theo ?
Tiếp thị kỹ thuật số sử dụng các mô hình để xác định quảng cáo nào sẽ đặt lên và đặt trên trang web của nhà xuất bản nào? Tất cả đều là các hình thức phân tích dự đoán.
Phân tích dự đoán đang trở nên phổ biến, nhưng bạn thực sự cần biết gì để giải thích kết quả và đưa ra quyết định tốt hơn? Bằng cách hiểu một vài điều cơ bản, bạn sẽ cảm thấy thoải mái hơn khi làm việc và giao tiếp với những người khác trong tổ chức của bạn về kết quả và khuyến nghị từ phân tích dự đoán. Phân tích định lượng không phải là ma thuật - nhưng nó là thường được thực hiện với rất nhiều dữ liệu trong quá khứ, một chút thống kê phù thủy, và một số giả định quan trọng.
Dữ liệu
Thiếu dữ liệu tốt là rào cản phổ biến nhất đối với các tổ chức đang tìm cách sử dụng các phân tích dự đoán. Để đưa ra dự đoán về những gì khách hàng sẽ mua ví dụ như trong tương lai, bạn cần có dữ liệu tốt về những gì họ đang mua (có thể yêu cầu chương trình khách hàng thân thiết hoặc ít nhất là nhiều phân tích về thẻ tín dụng của họ), những gì họ đã mua trong quá khứ, các thuộc tính của những sản phẩm (dự đoán dựa trên thuộc tính thường chính xác hơn kiểu “người mua cái này cũng mua cái này” của mô hình), và có lẽ một số thuộc tính nhân khẩu học của khách hàng (tuổi, giới tính, vị trí cư trú, tình trạng kinh tế xã hội, v.v.). Nếu bạn có nhiều kênh hoặc điểm tiếp xúc khách hàng, thì bạn cần đảm bảo rằng họ thu thập dữ liệu về hoạt động mua hàng của khách hàng giống như các kênh trước mà bạn đã làm.
Nói chung, đó là một công việc khá khó khăn để tạo ra một kho dữ liệu khách hàng với ID khách hàng duy nhất cho mọi người. Và tất cả các giao dịch mua trước đây mà khách hàng có thực hiện qua tất cả các kênh. Nếu bạn đã làm điều đó, bạn đã có một tài sản đáng kinh ngạc cho các phân tích dự đoán khách hàng.
Thống kê
Phân tích hồi quy dưới nhiều hình thức khác nhau là công cụ chính mà các tổ chức sử dụng để phân tích dự đoán. Nó hoạt động như thế này, nói chung: Một nhà phân tích đưa ra giả thuyết rằng một tập hợp các biến độc lập (ví dụ: giới tính, thu nhập, lượt truy cập trang web) có tương quan với việc mua sản phẩm của một mẫu khách hàng. Nhà phân tích thực hiện phân tích hồi quy để xem mức độ tương quan mỗi biến là; điều này thường đòi hỏi một số lần lặp lại để tìm sự kết hợp đúng của các biến và mô hình tốt nhất. Giả sử rằng nhà phân tích thành công và thấy rằng mỗi biến trong mô hình đều quan trọng trong việc giải thích việc mua sản phẩm, và các biến cùng với nhau giải thích rất nhiều về tác động đối với doanh số bán hàng của sản phẩm. Sử dụng phương trình hồi quy đó, nhà phân tích sau đó có thể sử dụng các hệ số hồi quy —mức độ mà mỗi biến số ảnh hưởng đến hành vi mua hàng—để tạo ra một số điểm dự đoán khả năng mua hàng tiếp theo.
Bạn đã tạo một mô hình dự đoán cho những người khác những khách hàng không có trong mẫu. Tất cả những gì bạn phải làm là tính điểm của họ và cung cấp cho họ sản phẩm nếu họ có điểm vượt quá một mức nhất định. Rất có khả năng là những khách hàng có điểm số cao sẽ muốn mua sản phẩm— giả sử nhà phân tích đã làm tốt công việc thống kê và rằng dữ liệu có chất lượng tốt.
Giả định
Một yếu tố quan trọng khác trong bất kỳ mô hình dự đoán nào là các giả định làm cơ sở cho nó. Mỗi mô hình đều có chúng, và điều quan trọng là phải biết chúng là gì và theo dõi liệu chúng có còn đúng không. Giả định lớn trong phân tích dự đoán là tương lai sẽ tiếp tục như thế nào của quá khứ. Như Charles Duhigg mô tả trong cuốn sách Sức mạnh của thói quen, mọi người thiết lập các mẫu hành vi mạnh mẽ mà họ thường duy trì theo thời gian. Thỉnh thoảng, tuy nhiên, họ thay đổi những hành vi đó và các mô hình đã được sử dụng để dự đoán chúng có thể không còn giá trị. Điều gì làm cho các giả định không hợp lệ? Lý do phổ biến nhất là thời gian. Nếu mô hình của bạn đã được tạo ra một số năm trước, nó có thể không còn dự đoán chính xác hành vi hiện tại. Thời gian trôi qua càng lớn, càng có nhiều khả năng đó là hành vi của khách hàng đã thay đổi. Ví dụ: một số mô hình dự đoán Netflix đã tạo cho những người dùng internet sớm đã bị lỗi thời vì sau đó hành vi người dùng internet khác nhau đáng kể. Những người đầu tiên thường tập trung hơn vào kỹ thuật và tương đối trẻ; người dùng sau này về cơ bản là tất cả mọi người.
Một lý do khác khiến các giả định của mô hình dự đoán có thể không còn giá trị nếu nhà phân tích không có biến chính trong mô hình và biến đó đã thay đổi đáng kể theo thời gian. Ví dụ tuyệt vời—và đáng sợ là cuộc khủng hoảng tài chính năm 2008–2009, gây ra phần lớn bởi các mô hình không hợp lệ để dự đoán khả năng khách hàng vay thế chấp sẽ trả được khoản vay của họ như thế nào. Các mô hình không bao gồm khả năng giá nhà đất có thể ngừng tăng và thậm chí có thể giảm. Khi giá bắt đầu giảm, nó làm cho các mô hình này dự đoán kém về khả năng trả nợ thế chấp. Về bản chất, niềm tin rằng giá nhà đất sẽ luôn tăng là một giả định ẩn trong các mô hình.
Vì các giả định sai lầm hoặc lỗi thời rõ ràng có thể kéo xuống toàn bộ ngân hàng và thậm chí (gần như!) toàn bộ nền kinh tế, điều khá quan trọng là chúng phải kiểm tra cẩn thận. Các nhà quản lý phải luôn hỏi các nhà phân tích xem các giả định chính là gì và điều gì sẽ xảy ra với họ để không còn hiệu lực. Và cả các nhà quản lý và các nhà phân tích nên liên tục theo dõi thế giới để xem liệu các yếu tố chính tham gia vào các giả định có thay đổi theo thời gian không.
Với những nguyên tắc cơ bản này trong tâm trí, đây là một số câu hỏi tốt để hỏi các nhà phân tích của bạn:
Bạn có thể cho tôi biết điều gì đó về nguồn gốc dữ liệu bạn đã sử dụng trong phân tích của mình?
Bạn có chắc chắn rằng dữ liệu mẫu là đại diện cho dân số?
Có bất kỳ ngoại lệ nào trong phân phối dữ liệu của bạn không? Chúng đã ảnh hưởng đến kết quả như thế nào?
Những giả định đằng sau phân tích của bạn là gì?
Có bất kỳ điều kiện nào có thể khiến bạn giả định không hợp lệ?
Ngay cả với những cảnh báo đó, nó vẫn còn khá tuyệt vời chúng ta có thể sử dụng phân tích để dự đoán tương lai. Tất cả chúng ta cần phải làm là thu thập đúng dữ liệu, thực hiện đúng loại mô hình thống kê và cẩn thận với các giả định.
Comments