LÍ DO BẠN NÊN SỬ DỤNG AB TESTING?
Mình nghĩ 99% các bạn đã và đang dùng AB Testing rồi, có điều không nhiều bạn biết tên chính thức và các bước thực hiện chi tiết của nó thôi. AB Testing là phương pháp so sánh trực tiếp 2 phiên bản của cùng 1 đối tượng (Website, Ads, App, etc.) trong cùng 1 hoàn cảnh để tìm ra phiên bản tốt hơn, thông thường 2 phiên bản chỉ khác nhau ở 1 đặc điểm duy nhất. AB Testing là phương pháp căn bản phổ biến nhất, so với các phương pháp tối ưu hóa khác nó có các ưu điểm:
– Đơn giản, không yêu cầu kiến thức hoặc kĩ năng quá cao
– Chi phí thấp
– Hiệu quả có thể thấy ngay
– Có thể áp dụng gần như trong mọi mặt của cuộc sống, ngay cả trong tự nhiên
– Không chỉ giúp tối ưu kết quả campaign, nó còn cung cấp nhiều dữ liệu hữu ích để hiểu thêm về nhóm khách hàng mục tiêu
Tất nhiên phương pháp này cũng có 1 số hạn chế, mình sẽ nói sâu hơn về vấn đề này và cách khắc phục ở các bài viết sau.
Trên thị trường hiện tại có rất nhiều tool hỗ trợ AB Testing cho Facebook Ad. Trong bài viết này mình chỉ chia sẻ theo hướng tự quản lý AB Testing bằng Excel / Google Spreadsheet để tiết kiệm chi phí.
BƯỚC 1: XÁC ĐỊNH CHỈ SỐ MÀ BẠN CẦN TỐI ƯU HÓA.
VD như: Giá mỗi lượt comment, giá mỗi lượt like page, tỉ lệ chuyển đổi, v.v.
Trong bài viết mình sẽ chọn tối ưu Tỉ Lệ Hoàn Vốn Đầu Tư (ROI – Tổng doanh thu chia Tổng chi phí quảng cáo)
Bạn nên lưu lại giá trị trung bình hiện tại của chỉ số đó để 3-6 tháng sau so sánh lại.
Bạn cũng nên chọn thêm 1 số KPI liên quan trực tiếp đến nó để cái nhìn bao quát hơn. VD như có trường hợp:
– ROI của 2 phiên bản test bằng nhau
– Kiểm tra cho thấy Frequency (Số lần nhìn thấy quảng cáo) hoặc CPM (Chi phí 1000 lần hiển thị) của Version 1 lại tốt hơn nhiều so với Version 2
Tức là điểm khác nhau giữa 2 version đã dẫn tới 1 hệ quả mới nào đó mà chúng ta chưa biết (tuy ROI vẫn như nhau). Nếu tận dụng được hệ quả này thì chúng ta có thể tối ưu các chiến dịch tiếp theo tốt hơn nữa.
BƯỚC 2: XÁC ĐỊNH ĐƠN VỊ SO SÁNH
Độ chính xác của AB Testing bị ảnh hưởng mạnh khi quy mô test quá nhỏ (Thời gian, ngân sách, lượng người truy cập, v.v), đây là lí do lớn nhất khiến nhiều bạn sử dụng AB Testing thời gian dài nhưng kết quả vẫn không được cải thiện.
Chúng ta cần 1 công cụ xác nhận lại độ chính xác của kết quả. Công cụ mà mình chọn là SIGNIFICANCE TEST, nhưng nó chỉ áp dụng được khi mẫu thử và kết quả có cùng 1 “đơn vị” để có thể tính ra Tỉ lệ chuyển đổi / Tỉ lệ thành công (Conversion Rate), VD:
– 1000 người click thì có 1 người mua hàng (Áp dụng được, TLCĐ là 0.1%)
– 1000 người click thì doanh thu được 1.000.000VND (Không áp dụng được)
– 1000 người click thì được 3 đơn hàng (Áp dụng được, TLCĐ là 0.3%)
Ở trường hợp của mình muốn tối ưu ROI nhưng mình sẽ không dùng VND mà sử dụng Số lượng đơn hàng để so sánh, mình sẽ hướng dẫn chi tiết hơn về việc này ở bài viết sau.
BƯỚC 3: XÁC ĐỊNH CHỈ TIÊU WINNER/LOSER
Nhiều trường hợp 2 phiên bản sẽ có kết quả khá gần nhau vd 80-100. Bạn nên cân nhắc kĩ chỉ tiêu để chọn ra Winner/Loser. VD như nếu B có kết quả thấp hơn hoặc bằng 70% của A thì sẽ bị xem là Loser và loại.
Điều này rất quan trọng vì đôi khi bạn sẽ mất 1 nhóm lớn khách hàng khi nhóm đó bị xem là Loser. Nhưng bạn cũng đừng quá lo lắng, chúng ta sẽ quay lại test các yếu tố cũ sau mỗi 3-6 tháng để chắc chắn chỉ loại nhưng Loser thật sự kém.
BƯỚC 4: XÁC ĐỊNH CÁC YẾU TỐ CẦN TEST
Chúng ta có vô số thứ có thể test:
– Tệp khách hàng: Độ tuổi, giới tính, khu vực, sở thích,…
– Vị trí hiển thị: Mobile, Desktop Newsfeed, Column,…
– Thiết bị: Android, iPhone, Desktop, Tablet/Phone,…
– Thời gian: Giờ trong ngày, ngày trong tuần, ngày trong tháng,…
– Định dạng Ad: Single/Multiple Images, Product Catalog, Canvas,…
– Design Ad: Ảnh có mặt người, phong cảnh, màu sắc, bố cục,…
– Nội dung Ad: Headlines, Text, CTA,…
– Hình thức đấu thầu: Impression, Link Click, Conversion,…
– Sản phẩm: Sản phẩm cao cấp, sản phẩm tầm trung, sản phẩm mới,…
Các bạn vừa bắt đầu thường sẽ bị choáng ngợp bởi quá nhiều thứ cần test nên không biết chọn cái nào trước. Kinh nghiệm của mình là HÃY KIÊN NHẪN, test từng phần một và chờ đợi. Ngoài ra, bạn nên bắt đầu với những yếu tố ảnh hưởng nhiều nhất đến kết quả, sau đó mới đến các yếu tố nhỏ hơn.
VD ở một số ngành hàng:
– Khác biệt độ tuổi thường sẽ ảnh hưởng nhiều đến kết quả hơn là khác biệt về khu vực
– Khác biệt về Giờ trong Ngày có thể sẽ ảnh hưởng nhiều hơn so với Ngày trong Tháng
– Khác biệt về định dạng Ad có thể ảnh hưởng nhiều hơn Khác biệt Headline
Ở series này mình chọn mặt hàng Thời Trang Nữ. Chúng ta sẽ chọn 3 yếu tố cần test VD như:
– Độ tuổi: 25-29 vs 30-39
– Hệ điều hành: Android vs iOS
– Sở thích: Zara vs Exclude Zara
GIẢI THÍCH:
– Mình chọn test hệ điều hành Mobile vì sau nhiều lần test các Ad chạy trên Desktop không thể thắng Mobile và ngân sách mình có hạn. Nhiều trường hợp Desktop có thể tốt hơn hoặc bạn cần target rộng hơn có thể chọn cả Mobile & Desktop mà ko cần test nhiều.
– Tương tự, bạn có thể test độ tuổi bao quát nhất từ 18-65 và rút gọn lại từ từ sau mỗi lần test. Nhưng nếu bạn tự tin đã nắm rõ độ tuổi tốt nhất là từ 25-40 thì cứ dùng thôi, để dành thời gian test các yếu tố khác.
– Nhiều bạn cho rằng target sở thích của Facebook Việt Nam không chính xác. Nhưng với AB Testing thì không quan trọng lắm, vì chúng ta chỉ cần biết tệp khách hàng “chứa sở thích X” có tốt hơn “không chứa sở thích X” hay không thôi.
(Nhưng các nhân mình thấy một số sở thích trên Facebook khá chính xác so với khảo sát thực tế)
CÁC BẠN LƯU Ý:
– Với các yếu tố liên quan đến tệp khách hàng. Bạn nên cân đối so cho số lượng 2 tệp không quá chênh lệch. VD như nếu mình chọn độ tuổi 20-29 số lượng người tiếp cận có thể hơn gấp đôi 30-39 nên mình giới hạn lại chỉ từ 25-29 thôi
– Hoặc khi dùng sở thích để test, bạn lưu ý 2 tệp Include vs Exclude không nên quá chênh lệch và cũng không nên quá nhỏ
BƯỚC 5: Chuẩn bị file data – Mình sẽ gửi các bạn file mẫu (Google Sheet) và hướng dẫn sử dụng ở phần 2 của series. Cũng rất đơn giản thôi.
Phần chuẩn bị đã xong, bài hơi dài cảm ơn mọi người đã đọc tới đây nhé. Vài bữa tới mình sẽ đăng phần 2 về cách tiến hành AB Testing.
Mình xin nhắc lại chút là:
– Nội dung trên chỉ là kinh nghiệm cá nhân còn nhiều cách khác hay hơn nên các bạn cứ góp ý thoải mái để chúng ta cùng rút kinh nghiệm
– Mình viết hơi dài dòng chỗ nào chưa rõ thì bạn comment bên dưới mình sẽ giải thích lại nhé
– Bạn hãy comment hoặc lưu bài viết này, khi có bài viết mới mình sẽ thông báo bằng cách comment tại đây
– Nếu bạn thấy nội dung hữu ích thì nhớ tương tác (Comment, share hoặc tag bạn bè cần đọc) để mình có động lực viết các bài tiếp theo nhé.
Nếu series AB Testing này được ủng hộ mình sẽ viết thêm 1 series khác về chủ đề Phương pháp phân loại nhóm khách hàng tiềm năng dựa trên Vòng đời & Giá trị nhóm khách hàng nhằm tối ưu Target / Phân bổ ngân sách.
1. KHÔNG NÊN QUÁ PHỤ THUỘC VÀO TARGET INTEREST (SỞ THÍCH)
Tùy theo ngành nghề và ngân sách, bạn nên cân đối tệp khách hàng đủ lớn để có thể ra đơn đều mỗi tháng. Nếu target quá sâu có thể bạn sẽ bị sai đối tượng hoặc cạn đơn hàng vì bỏ sót nhiều khách hàng tiềm năng khác.
Bạn có thể ước lượng đại khái, vd mình tự làm với đơn hàng thời trang nữ:
– Mục tiêu doanh thu 100.000.000đ/tháng, trung bình bán 1 đơn 1.000.000đ – Vậy bạn cần 100 đơn/tháng
– Trung bình cứ 5 người Inbox (hoặc Add to Cart) thì có 1 người mua – Vậy bạn cần 500 Inbox/tháng
– Trung bình mỗi khách hàng mua hàng của bạn 3 tháng 1 lần. Vậy bạn cần ít nhất 1500 khách để mua bán cho tới khi người khách đầu tiên quay lại mua của bạn lần 2.
– Nếu bạn có 1 tệp khách hàng cực tốt với tỉ lệ chuyển đổi 10% thì size tệp tối thiểu mà bạn cần sẽ là 15.000 người.
Bạn còn phải tăng size của tệp lên 50-100% để dự phòng các yếu tố khác như vụ mùa, mức độ cạnh tranh, giá trị trọn đời khách hàng (Customer Lifetime Value – vì thường mỗi khách chỉ mua chỗ bạn tối đa 5-10 lần).
Tóm lại bạn nên ước lượng được size tệp tối thiểu mà bạn cần có, không target quá sâu nếu chưa rành.
———-
2. TẬN DỤNG LOOKALIKE
Lookalike là một trong những tính năng hay nhất của Facebook để mở rộng tệp khách hàng của bạn. Khi nãy mình đã nói không nên target interest quá sâu vì bạn sẽ giới hạn số khách hàng của mình, nhưng với Lookalike bạn có thể mở rộng tệp khách 1 cách hiệu quả nhất.
Tính năng Lookalike sẽ tự động tìm cho bạn những khách hàng có đặc điểm gần giống nhất với nhóm khách hàng mẫu mà bạn gửi cho nó, vì vậy bạn nên lọc ra nhóm khách hàng tiềm năng nhất của bạn. Tùy mục đích của bạn mà đó có thể là nhóm 200 khách hàng VIP nhất, nhóm những người đã inbox trong vòng 60 ngày gần nhất, nhóm khách đã Add to Cart trong 30 ngày gần nhất, v.v.
Lưu ý là tệp khách hàng mẫu này nên có ít nhất 200-500 người để áp dụng Lookalike cho chính xác nhé. Tuy Facebook có nói tệp này càng lớn thì độ chính xác của Lookalike càng cao nhưng mình lại thấy tệp lớn vài nghìn người thì không chất lượng nên mình thường chỉ chọn ra vài trăm khách hàng VIP nhất thôi.
Lookalike rất hiệu quả khi phối hợp với các phương pháp tối ưu Ad vd như AB Testing:
– Nếu bạn chưa có bất cứ thông tin gì về khách hàng, dùng AB Testing để tìm ra vài đặc điểm cơ bản của khách (VD: Age Range, Interest, Devices, v.v.) đến khi có được tệp khá ưng ý thì áp dụng Lookalike mở rộng tệp đó ra
– Ở VN thì tệp Lookalike nhỏ nhất (1%) sẽ vào khoảng hơn 500.000 người, bạn tiếp tục áp dụng AB Testing để thu nhỏ tệp 1% đó lại cho chất lượng hơn nữa
– Đến khi số lượng khách hàng và đơn hàng đủ lớn bạn chọn ra tệp khách hàng tốt nhất của mình (VD tệp khách Inbox, tệp sđt/email 300 khách mua nhiều nhất…) để tạo Lookalike lần 2
– Sau đó lại dùng AB Testing để tối ưu tệp Lookalike đó thêm nữa.
– Sau một thời gian lại quay về bước 3 và thực hiện tiếp, vì khách hàng dù VIP thế nào cũng sẽ không ở với bạn mãi mãi nên chúng ta cần tối ưu tệp khách hàng liên tục.
Cứ như thế qua thời gian tệp của bạn sẽ ngày càng chính xác hơn.
———-
3. TẬN DỤNG RETARGETING
Với ngân sách giới hạn, bạn nên tập trung quảng cáo lại cho những người đã có tương tác (click quảng cáo, inbox, comment, add to cart, v.v.) vì họ là những người đã thể hiện mối quan tâm đến sản phẩm/dịch vụ của bạn. Bạn nên tìm hiểu về Customers Buying Process, các khách hàng càng đi vào các giai đoạn cuối thì khả năng mua càng cao nên chúng ta cần dồn ngân sách vào các nhóm cuối.
VD đơn giản với ngân sách 1000$, mình sẽ:
– Dành ra 250$ quảng cáo để kiếm được 5000 người xem trang chi tiết sản phẩm (Website)
– 500$ chỉ để Retargeting 5000 người này cho đến khi có được 200 người Add to Cart (Bỏ vào giỏ hàng)
– 150$ để Retarging 200 người đó đến khi có được 20-40 người mua hàng
– 50$ còn lại tiếp tục Retargeting để Upsell nhóm khách đã mua hoặc nhóm Add to Cart để họ mua thêm các sản phẩm liên quan khác. (VD nếu họ đã mua camera thì có khả năng sẽ mua thêm hộp đựng, đèn, pin, v.v)
Tóm lại là bạn nên tập trung tối ưu RETARGETING.
———-
4. CHIA KHÁCH LÀM NHIỀU NHÓM ĐỂ CHĂM SÓC/QUẢNG CÁO
Mỗi nhóm khách hàng sẽ có 1 nhu cầu khác nhau nên cần có cách chăm sóc khác nhau, ngoài ra chúng ta cũng có nhiều cách phân loại khách hàng vd:
– Theo số lần mua: Khách lần đầu, khách quay lại (mua lần 2), khách thân thiết (>3 lần)
– Theo giá trị mua: Khách mua lẻ, mua sỉ, khách VIP, Khách mua đồ mắc/trung bình/rẻ tiền
– Theo giai đoạn mua: Khách click nhưng chưa inbox, Khách inbox nhưng chưa mua, Khách mua nhưng chưa quay lại, Khách quay lại nhiều lần, …
Còn nhiều cách phân loại khác bạn có thể search Cách phân loại nhóm khách hàng hoặc Customers Segmentation để tìm hiểu kĩ hơn, chọn ra cách phân loại phù hợp với ngành nghề của mình.
———-
5. ƯU TIÊN NHÓM KHÁCH HÀNG THÂN THIẾT
Muốn cải thiện doanh thu cách đơn giản nhất là tăng số đơn hàng MỚI hoặc tăng số đơn hàng QUAY LẠI từ khách hàng cũ. Cái này thì chắc nhiều bạn có kinh nghiệm cũng biết chi phí quảng cáo để 1 khách hàng mới mua hàng cao gấp 4-5 lần so với 1 khách hàng cũ.
Hoặc bạn có thể search thử Pareto Principle (80/20 Rule) để thấy rõ tầm quan trọng của nhóm khách hàng thân thiết.
Tóm lại chúng ta nên ưu tiên ngân sách cho nhóm khách hàng cũ và các chương trình chăm sóc khách thân thiết.
———-
6. THU THẬP TỐI ĐA THÔNG TIN KHÁCH HÀNG
Bạn cứ thu thập thông tin khách hàng nhiều nhất có thể (Địa chỉ, SĐT, ngày tháng năm sinh, sở thích, giờ mua hàng, công việc, gia đình…) nhưng nhớ không nên làm phiền khách hàng. Có nhiều cách thu thập như tạo form online kèm voucher, giảm giá khi khách đăng ký thành viên (kèm điền thông tin),…
Khi lượng thông tin đủ lớn bạn sẽ có thể tìm ra được nhiều cách phân loại khách hàng hơn và nhận ra được 1 vài đặc điểm nào đó của nhóm khách hàng thân thiết nhất. Thông tin này rất tốt cho Target hoặc viết Content.
Bạn cũng có thể search How to gain Customer Insight để tìm hiểu thêm về mảng này.
———-
Cám ơn mọi người đã đọc đến đây, cũng như lần trước:
– Mình viết hơi dài dòng chỗ nào chưa rõ thì bạn comment mình sẽ giải thích lại
– Các bạn đừng dùng nick ảo để nhắn tin hay add friend mình nhé, mình sẽ không phản hồi nick ảo.
– Các bạn quan tâm vấn đề nào nhất: Retargeting, Lookalike, Customer Segmentation, Customer Buying Process,…? Comment bên dưới để mình biết chọn chủ đề cho series tiếp theo nhé.
AB TESTING – CÁCH KIỂM TRA ĐỘ CHÍNH XÁC
BƯỚC 1: XÁC ĐỊNH 2 PHIÊN BẢN CHO MỖI YẾU TỐ CẦN TEST
AB Testing có nhiều biến thể tùy theo mục đích của người dùng. Ở series này chúng ta sẽ dùng MUTUALLY EXCLUSIVE AB TESTING.
Tức chúng ta sẽ test cùng lúc 2 hoặc 3 yếu tố để tiết kiệm thời gian và ngân sách. VD:
– Age: 20-29 vs 30-39
– Interest: Exclude Zara vs Include Zara
– Device: Android vs iOS
Mình thường bắt đầu bằng Include A vs Exclude A vì như vậy đảm bảo 2 tệp test không bị trùng lặp khách hàng
Sau đó giả sử Include A là winner thì tiếp tục test tệp (Include A, must also Include B) vs (Include A, exclude B)
Bạn cũng có thể chọn test trực tiếp A vs B, chỉ cần bạn chắc chắn A là tốt không cần test Include vs Exclude, ngoài ra thì A với B không quá trùng lặp.
Nếu bạn mới bắt đầu dùng Facebook Ad và có nhiều thời gian thì mình đề nghị test tất cả khả năng vì nhiều lúc thực tế không như mình nghĩ. VD: Lúc mình lần đầu set campaign cho shop thời trang nữ (giá đắt ngang Zara), khảo sát bằng giấy tại shop thì nhiều khách hàng đánh giá đồ Zara cao nhất trong list các thương hiệu và đã từng mua bên đó. Nhưng khi tạo campaign mình vẫn quyết định test thử Include Zara vs Exclude Zara, kết quả là nhóm Exclude Zara lại có doanh thu cao hơn đến 30%. Mình test lại lần 2 và lần 3 kết quả vẫn như vậy nên đến nay mình vẫn áp dụng Exclude Zara (tất nhiên cần kiểm tra lại mỗi 4-6 tháng)
LƯU Ý:
– Với Mutually Exclusive AB Testing, Audience của mỗi nhóm test sẽ tách biệt hoàn toàn với các nhóm còn lại, không có trùng lặp giữa các nhóm vì vậy size của Audience mỗi nhóm phải đủ lớn. VD không nên test Interest Yoga cùng lúc với Meditation vì chắc chắn sẽ có hơn 80-90% khách hàng trùng lặp, lượng khách còn lại rất nhỏ.
– Nếu bạn test các yếu tố liên quan đến Interest thì nhớ bỏ chọn ô Expand interest when it may increase conversion… để tránh nhiễu thông tin. Và nếu test nhiều hơn 1 interest cùng lúc thì nhớ dùng Must Also để không bị trùng khách nhé.
– Vậy trường hợp chúng ta cần test nhưng biết trước sẽ bị trùng lặp khách hàng thì sao? VD như test Platform Desktop vs Mobile (Khách có thể thấy Ad ở Laptop sau đó lại thấy lần 2 ở điện thoại)
➡Chúng ta sẽ loại bỏ các khách hàng đã tương tác với Ad trong vòng X ngày. Xem ảnh dưới:
Các bạn vào Audience ➡ Create Audience ➡ Custom Audience ➡Engagement ➡ Facebook Page ➡ People who engaged with any Post or Advert ➡ điền số ngày bạn muốn vào.
– Thiết lập mỗi nhóm test là 1 Ad Set riêng để đảm bảo tất cả đều chạy ngân sách bằng nhau trong cùng 1 khoảng thời gian. Nếu bạn set 2 nhóm test vào cùng 1 Ad Set thì Facebook sẽ ưu tiên dồn ngân sách vào nhóm test có kết quả tốt hơn vào lúc ban đầu (dù có thể nhóm đó là loser).
———-
BƯỚC 2: PHÂN BỔ NGÂN SÁCH
Cách 1: Trích 1 phần ngân sách (30-50%) để test sau đó chọn phiên bản tốt hơn để chạy nốt phần ngân sách còn lại. Qua chu kỳ ngân sách mới lại tiếp tục như thế.
Lưu ý là ngân sách test đủ lớn để có kết quả chính xác trong thời gian không quá dài nhé. Còn làm thế nào để kiểm tra độ chính xác của kết quả thì mình sẽ hướng dẫn bên dưới.
Cách 2 : Sử dụng toàn bộ ngân sách để test liên tục không nghỉ (hiện mình làm cách này)
VD: Sau lần đầu test có kết quả Include A là winner, tiếp tục test 2 phiên bản khác dựa trên kết quả lần 1 vd như (Include A, Include B) vs (Include A, Exclude B)
Quan điểm của mình là không có phiên bản nào hoàn hảo, luôn luôn có thể cải thiện thêm vì thị trường luôn thay đổi trong khi ngân sách có giới hạn nên mình phải tận dụng toàn bộ ngân sách để test liên tục.
Về đấu thầu thì các bạn chọn Manual hay Auto đều được nhưng nhớ đảm bảo tất cả phiên bản đều có ngân sách bằng nhau nhé.
———-
BƯỚC 3: FILE DỮ LIỆU
Mình gửi các bạn 1 file quản lý mẫu, toàn bộ chỉ dùng +-x/ và IF thôi, rất đơn giản ai cũng có thể dùng.
Link file Google Spreadsheet : bit.ly/2w3WFXP
Mình sẽ giải thích sơ nhưng chỗ nào chưa rõ thì bạn comment bên dưới nhé:
CỘT A : Mã test – dùng để đặt tên cho dễ quản lý và search nhanh Ad Set trong Adverts Manager. Mình điền sẵn từ số 001-099, các bạn kiên nhẫn test đủ ít nhất 50 lần thì chắc chắn sẽ có cải thiện.
CỘT B & C : Ngày bắt đầu và ngày kết thúc test, cột B bạn điền trước khi bắt đầu chạy test, cột C thì có thể điền sau khi có kết quả cũng được vì nhiều trường hợp phải chạy test lâu hơn dự tính
CỘT D : Điền yếu tố mà bạn muốn test vào. Sau 1 thời gian chúng ta có thể lọc nhanh yếu tố để biết đã từng test những phiên bản nào
CỘT E & F : Điền 2 phiên bản của yếu tố mà bạn muốn test vào
CỘT G : Điền tên phiên bản thắng vào, nếu không có phiên bản thắng thì điền 0
CỘT H : Điền kết quả Significance Test, mình sẽ hướng dẫn bên dưới. Kết quả càng cao thì càng chính xác, nhưng cũng tốn thời gian và ngân sách hơn, nên tốt nhất bạn chỉ cần canh >90% là được.
CỘT I : Ghi chú vì có những lúc AB Test không cho ra kết quả rõ ràng hoặc cần test thêm
CỘT J đến N : Đây là các cột mà các bạn dùng điền công thức vào để check nhanh các KPI quan trọng. Mình đã điền sẵn vài công thức mẫu rất đơn giản, các bạn thay đổi lại hoặc thêm cột cho phù hợp với mục đích nhé. Hoặc nếu không cần thì các bạn bỏ trống cũng được.
CỘT O-S tương tự CỘT T-X : Dùng để điền các thông số cơ bản để tính KPI. Các dữ liệu này lấy từ Adverts Manager
CỘT Y : Dùng để check nhanh thông số điền đã đúng chưa, vì chúng ta đang dùng Mutually Exclusive AB Testing nên tổng thông số của 2 phiên bản của các yếu tố test (trong cùng 1 lần test) sẽ bằng nhau: 1A + 1B = 2A +2B = 3A + 3B… Nếu lệch thì chắc chắn có chỗ điền sai.
LƯU Ý:
– Hãy chọn 1 phiên bản mà bạn cho rằng sẽ chiến thắng và đặt nó bên NHÓM B để sau này kiểm tra lại dự đoán của bạn đúng được bao nhiêu lần nhé. Có thể bạn sẽ bất ngờ đấy.
– Các cột trên chỉ là mẫu thôi, các bạn thêm bớt hoặc đổi tên cột, công thức lại cho phù hợp
———-
BƯỚC 4 : TẠO AD & ĐẶT TÊN
LƯU Ý:
• Bên dưới là cách mình đặt tên cho dễ quản lý và search kết quả lúc chạy nhiều campaign thôi. Bạn nào có cách khác tiện hơn thì cứ dùng nhé không ảnh hưởng gì.
• Nếu bạn test các yếu tố liên quan đến Ad (tiêu đề, hình ảnh, …) thì mỗi Ad Set chỉ nên tạo 1 Ad thôi nhé để tất cả Ad đều chạy ngân sách bằng nhau, vì như nãy mình nói Facebook sẽ ưu tiên Ad chạy tốt lúc ban đầu dù có thể mẫu Ad đó là Loser.
• Nếu bạn test 1 yếu tố thì sẽ cần tạo 2 Ad Set, test 2 yếu tố thì cần tạo 4 Ad Set, test 3 thì cần tạo 8 Ad Set, test 4 thì cần 16 Ad Set. Cứ số mũ lên như thế, nhưng nếu ngân sách hàng tháng không lớn hơn 100 triệu thì mình nghĩ 3 yếu tố là đủ rồi.
Quay lại VD 3 yếu tố ban nãy
• Nhóm 1A tuổi 20-29 vs nhóm 1B tuổi 30-39
• Nhóm 2A Exclude Zara vs nhóm 2B Include Zara
• Nhóm 3A Device Android vs Nhóm 3B dùng iOS
– Đầu tiên chúng ta tạo 1 Ad Set với tên 001A – 002A – 003A và Ad hoàn chỉnh
– Chỉnh thông số tương ứng: Tuổi 20-29 – Exclude Zara – Device Android
– Duplicate Ad Set đó (bao gồm cả Ad)
– Chỉnh lại độ tuổi thành 30-39 và đổi tên Ad thành 001B – 002A – 003A
– Duplicate cùng lúc cả 2 Ad Set vừa tạo
– Chọn 2 Ad Set mới và sửa (cùng lúc) phần Interest thành Include Zara
– Sửa tên 2 Ad Set đó lại cho đúng: 001A – 002B – 003A và 001B – 002B – 003A
– Tiếp tục Duplicate cả 4 Ad Set vừa tạo
– Chọn 4 Ad Set mới và sửa (cùng lúc) phần Device thành iOS
– Sửa tên 4 Ad Set lại cho đúng: 001A – 002A – 003B, 001B – 002A – 003B, 001A – 002B – 003B, 001B – 002B – 003B
Như vậy chúng ta sẽ có tổng cộng 8 Ad Set khác nhau, các bạn chia đều ngân sách vào 8 Ad Set (các bạn có thể thêm ghi chú đằng sau mỗi tên để dễ hiểu hơn):
001A – 002A – 003A
001B – 002A – 003A
001A – 002B – 003A
001B – 002B – 003A
001A – 002A – 003B
001B – 002A – 003B
001A – 002B – 003B
001B – 002B – 003B
TIẾN HÀNH TEST VÀ CHỜ KẾT QUẢ THÔI !!!
———-
BƯỚC 5: SIGNIFICANCE TEST
Như mình đã nói ở phần trước, độ chính xác của AB Testing bị ảnh hưởng mạnh khi quy mô test quá nhỏ (Thời gian, ngân sách, lượng người truy cập, v.v), đây là lí do lớn nhất khiến nhiều bạn sử dụng AB Testing thời gian dài nhưng kết quả vẫn không được cải thiện.
Chúng ta cần 1 công cụ xác nhận lại độ chính xác của kết quả. Công cụ mà mình chọn là SIGNIFICANCE TEST, rất dễ sử dụng:
– Sau khi đã có kết quả đủ lớn, chúng ta điền dữ liệu vào file
– Cách lấy dữ liệu rất đơn giản vì chúng ta đã đặt sẵn tên ở bước 4 rồi. Các bạn vào Adverts Manager Search (góc trên bên phải) Advert Set Name Contains Nhập 001A hoặc 001B vào
– Các bạn search google SIGNIFICANCE TEST CALCULATOR sẽ ra rất nhiều trang, mình thường dùng Getdatadriven.com/ab-significance-test
– Ở bài trước trước các bạn đã chọn sẵn đơn vị để so sánh. VD lần này mình sẽ chọn so sánh xem lượt chuyển đổi từ Click sang Comment của 2 phiên bản
– Nếu lượt comment quá ít các bạn có thể lấy tổng Comment + Share, nhưng không nên lấy lượt Like vì giá trị rất nhỏ so với Comment
– Trong file mình có để sẵn ví dụ phiên bản 001A có 1423 Click chuyển đổi sang được 35 Comment & Share, 001B có 1295 Click chuyển đổi được 34 Comment & Share
– Các bạn điền các thông số tương ứng trên vào link mình đã đưa nhé. Lượt Click thì điền vào ô THE NUMBER OF VISITORS, lượt Comment & Share thì điền vào ô THE NUMBER OF OVERALL CONVERSIONS
– Nếu kết quả (cột ngoài cùng bên phải) trả về là: Test “B” converted 7% better than Test “A.” We are 61% certain that… giống như ảnh dưới đây thì bạn đã làm đúng rồi.
– Kết quả đó có nghĩa là gì? 001B có tỉ lệ chuyển đổi tốt hơn 7% so với 001A, nhưng mức độ đáng tin của lần test này rất thấp, chỉ vào khoảng 61% (Test 100 lần thì chỉ 61 lần 001B thắng, còn lại là 001A thắng)
———-
BƯỚC 6 : QUYẾT ĐỊNH BƯỚC TIẾP THEO
Ở bài trước bạn cũng đã chọn sẵn chỉ tiêu Winner/Loser rồi. Nếu kết quả thỏa chỉ tiêu thì cứ thế mà áp dụng, tất nhiên sẽ có 1 vài trường hợp ngoại lệ vd như:
1. Mức độ tin tưởng thấp : ở ví dụ trên thì 61% là quá thấp. Có nhiều lí do dẫn đến việc này như quy mô test quá nhỏ, tỉ lệ chuyển đổi quá thấp, hoặc tỉ lệ chuyển đổi của 2 phiên bản quá sát nhau, v.v Các bạn nên đợi thêm 1 thời gian hoặc tăng ngân sách lên, hoặc test lại lần 2 (sau đó cộng dữ liệu comment/share của cả 2 lần) để có kết quả chính xác hơn. Thông thường thì nên >90%
2. Mức độ tin tưởng cao, nhưng tỉ lệ chuyển đổi chênh lệch ít: VD độ tin tưởng lên >90% nhưng tỉ lệ chuyển đổi chỉ cải thiện được 5-10%. Như mình đã nói ở phần trước, nếu bạn xác định 1 nhóm khách là Loser thì bạn sẽ loại hẳn nhóm đó, tức là mất 1 phần lớn tệp khách hàng. Giả sử tổng 2 nhóm A+B gồm 1 triệu người nhưng nhóm A (Loser) chiếm đến 45%, đồng nghĩa với việc bạn sẽ hi sinh 45% tệp khách để tăng chất lượng quảng cáo lên 5-10%. Như thế có đáng hay không thì còn tùy vào nhiều yếu tố như ngành nghề, mục tiêu hoặc ngân sách của bạn (Chẳng hạn nếu bạn có có ngân sách nhỏ và nhóm B đã là quá lớn so với bạn thì ok, loại A)
3. Mức độ tin tưởng cao, tỉ lệ chuyển đổi chênh lệch lớn nhưng doanh thu nhóm Loser lại cao hơn. VD: Gần đây mình làm AB Testing với mục tiêu là tăng doanh thu đơn hàng online đặt trong website. Sau khi có kết quả thì rõ ràng nhóm B rất tốt, giá mỗi Add to Cart lẫn giá mỗi Purchase thấp hơn 2-3 lần nhóm A. Nhưng tổng doanh thu nhóm A lại cao hơn 30%. Việc này có nhiều lí do tác động như: Audience nhóm A ít mua hơn nhưng giá trị mỗi đơn hàng lại cao hơn, hoặc Audience nhóm A dễ quay lại mua lần 2-3, hoặc lần test đó có vài khách VIP trong nhóm A, hoặc do ngẫu nhiên trong thời gian test có sự kiện gì đó chỉ tác động đến nhóm A (VD bán thời trang, nhóm A interest du lịch trong khi nhóm B là exclude thì vào mùa cao điểm du lịch sẽ ảnh hưởng kết quả)…
LƯU Ý:
– Nếu có điều kiện, bạn nên test mỗi yếu tố 3-5 lần. Như mình đã nói ở trên sẽ có nhiều yếu tố khách quan xảy ra trong thời gian test ảnh hưởng đến kết quả nên chúng ta cần test nhiều lần để chắc chắn đã chọn đúng Winner.
– Vậy chúng ta nên test 1 lần với ngân sách lớn hay chia ra test 3 lần nhỏ? Theo mình thì nên chia ra 3 lần (tất nhiên mỗi lần test vẫn phải đủ lớn để đáp ứng độ tin tưởng >90%). Nếu bạn chỉ setup test 1 lần với ngân sách lớn thì sau một thời gian các Ad sẽ không còn độ Fresh và chất lượng sẽ giảm. Cá nhân mình thấy nếu nhóm Winner đều thắng tuyệt đối ở cả 3 lần test nhỏ thì sẽ chính xác hơn là chỉ thắng 1 lần khi test lớn.
– Nếu sau 3 lần mà kết quả Winner thắng 2 hoặc cả 3 lần, kết quả có độ tin tưởng cao, tỉ lệ chuyển đổi cải thiện nhiều và doanh thu tốt thì loại nhóm Loser và tiếp tục chia tách nhóm Winner để thu gọn hơn nữa. Cho đến khi nhóm Winner quá nhỏ để có thể khai thác hoặc bị khai thác quá nhiều thì bạn nên áp dụng Lookalike để mở rộng tệp ra. Có thời gian mình sẽ viết thêm về việc này.
– Nếu sau 3 lần mà kết quả không xê xích nhiều, không cần test yếu tố đó nữa vì không đáng để hi sinh nhóm khách hàng. Chuyển qua yếu tố khác.
– Và quan trọng nhất, các bạn cần kiểm tra lại mỗi 4-6 tháng vì kết quả test sẽ bị ảnh hưởng bới nhiều yếu tố ngoại cảnh như mức độ khai thác, chất lượng sản phẩm, thời vụ v.v. VD như khi bán thời trang nữ, nhóm Áo có thể thắng nhóm Đầm trong suốt 3 lần test. Nhưng sau 4-6 tháng khi bắt đầu vào mùa cưới, bạn cần test lại thì nhóm Đầm có thể sẽ có doanh thu tốt hơn trong dịp này.
———-
Cám ơn mọi người đã đọc đến đây, cũng như lần trước:
– Mình viết hơi dài dòng chỗ nào chưa rõ thì bạn comment mình sẽ giải thích lại. Nếu bạn thấy nội dung hữu ích thì tương tác like/comment để ủng hộ mình nhé.
– Các bạn đừng dùng nick ảo để nhắn tin hay add friend mình nhé, mình sẽ không phản hồi nick ảo.
– Khoảng 2-3 tuần nữa mình sẽ viết nốt Phần 3 của Series này bao gồm các điểm hạn chế của AB Testing và cách khắc phục.
– Các bạn đang quan tâm vấn đề nào nhất: Retargeting, Lookalike, Customer Segmentation, Customer Buying Process,…? Comment bên dưới để mình biết chọn chủ đề cho series tiếp theo nhé.
Đỗ Khang