Nếu đã từng biết đến Google Analytics 4 thì chắc hẳn bạn sẽ nghe đến cụm từ”regex”. Đây là một công cụ mạnh mẽ giúp bạn lọc và khớp dữ liệu theo mẫu cụ thể được sử dụng rộng rãi rất nhiều trong nhiều công cụ khác nhau. Chỉ trong bài viết này thì mời bạn đọc cùng tìm hiểu trong việc ứng dụng regex với việc khớp dữ liệu trong GA4.
Regex là gì?
Regex là viết tắt của Regular Expression (biểu thức chính quy), một công cụ mạnh mẽ được sử dụng để tạo ra các mẫu (patterns) nhằm tìm kiếm, so khớp hoặc thao tác với các chuỗi văn bản. Regex thường được sử dụng trong các ngôn ngữ lập trình, công cụ phân tích dữ liệu, hệ thống quản lý nội dung, và nhiều ứng dụng khác.
Ứng dụng của Regex
Regex có thể được sử dụng để:
- Tìm kiếm văn bản: Tìm một từ hoặc cụm từ trong một chuỗi.
- Thay thế văn bản: Thay thế các từ hoặc ký tự cụ thể bằng nội dung mới.
- Xác thực đầu vào: Kiểm tra xem một chuỗi có phù hợp với một mẫu cụ thể hay không, chẳng hạn như định dạng email, số điện thoại, hoặc mã bưu chính.
- Phân tích chuỗi: Tách chuỗi thành các phần dựa trên các ký tự hoặc từ đặc biệt.
- Tự động hóa xử lý dữ liệu: Xử lý và trích xuất thông tin từ các tệp nhật ký, cơ sở dữ liệu hoặc API.
Partial match regex và full match regex trong GA4
Partial Match Regex (Matching một phần)
- Đây là cách thức matching mặc định trong Universal Analytics.
- Hoạt động: Regex khớp với dữ liệu nếu mẫu xuất hiện ở bất kỳ đâu trong chuỗi cần so khớp, không cần khớp toàn bộ.
Full match regex (Matching đầy đủ/chính xác)
- Đây là cách thức matching mặc định trong Google Analytics 4 (GA4).
- Hoạt động: Regex chỉ khớp nếu toàn bộ chuỗi khớp chính xác với mẫu Regex được cung cấp.
- Ví dụ:
- Regex:
India
- Các chuỗi khớp:
- Chỉ khớp với
India
. - Không khớp với
Indian
,Indiana
, hoặcIndianapolis
.
- Chỉ khớp với
- Regex:
Để đạt được hiệu ứng tương tự như Partial Match trong GA4 (vì mặc định là Full Match), bạn có thể sử dụng metacharacter như .*
.
Metacharacter trong Regex
Metacharacter là những kí tự đặc biệt được sử dụng trong Regex để mở rộng khả năng tìm kiếm và khớp mẫu. Dưới đây là những metacharacter quan trọng trong GA4:
1. Dấu chấm (.
):
- Khớp với một ký tự bất kỳ (ngoại trừ ký tự xuống dòng).
- Ví dụ:
- Regex:
a.b
- Khớp với:
aab
,acb
,adb
.
- Regex:
2. Dấu chấm và dấu sao (.*
):
- Ký tự đại diện, khớp với bất kỳ chuỗi ký tự nào, bao gồm chuỗi rỗng.
- Ví dụ:
- Regex:
India.*
- Khớp với:
India
,Indian
,Indiana
.
- Regex:
3. Dấu gạch chéo ngược (\
):
- Dùng để thoát metacharacter, khiến ký tự đó được xử lý theo nghĩa đen.
- Ví dụ:
- Regex:
\.
- Khớp với:
.
(chấm thật, không phải metacharacter).
- Regex:
4. Dấu mũ (^
):
- Chỉ định chuỗi phải bắt đầu bằng mẫu sau dấu mũ.
- Ví dụ:
- Regex:
^India
- Khớp với:
India
,Indianapolis
. - Không khớp với:
MyIndia
.
- Regex:
5. Dấu đô la ($
):
Chỉ định chuỗi phải kết thúc bằng mẫu trước dấu đô la.
Ví dụ:
- Regex:
India$
- Khớp với:
India
. - Không khớp với:
Indian
.
6. Dấu hỏi (?
):
- Khớp với ký tự trước đó 0 hoặc 1 lần.
- Ví dụ:
- Regex:
colou?r
- Khớp với:
color
,colour
.Dấu gạch thẳng (|
): - Toán tử HOẶC (OR), khớp với một trong các mẫu được phân tách bởi
|
. - Ví dụ:
- Regex:
cat|dog
- Khớp với:
cat
,dog
.
- Regex:
- Regex:
Ứng dụng Partial và Full Match trong GA4
- Partial Match (Mặc định trong Universal Analytics):
- Dùng để khớp với một phần của chuỗi.
- Trong GA4, đạt được bằng cách sử dụng
.*
. - Ví dụ:
.*India.*
sẽ khớp với tất cả các chuỗi chứaIndia
.
- Full Match (Mặc định trong GA4):
- Dùng để khớp toàn bộ chuỗi chính xác.
- Ví dụ:
India
chỉ khớp với chuỗi chính xácIndia
.
Hướng dẫn sử dụng Regex trong công cụ khám phá (Exploration) của GA4
Regex trong GA4 là công cụ mạnh mẽ để lọc và phân tích dữ liệu chính xác hơn. Dưới đây là hướng dẫn chi tiết sử dụng Regex trong Exploration của GA4 với ví dụ minh họa:
Ví dụ sử dụng Regex trong Exploration
Mục tiêu:
Lọc các sự kiện (event name
) chỉ bao gồm page_view
và internal_link_click
.
Thực hiện:
Chọn chiều dữ liệu (Dimension):
- Trong Exploration, thêm Landing Page hoặc Event Name làm dimension.
- Sử dụng Event Count làm thước đo (metric).
Áp dụng bộ lọc Regex:
- Trong phần bộ lọc (
Filter
), chọn chiều dữ liệu Event Name. - Chọn “matches regex” làm điều kiện lọc.
- Nhập biểu thức Regex:regexSao chép mã
^(page_view|internal_link_click)$
Giải thích biểu thức Regex
^
: Đánh dấu bắt đầu chuỗi.(
: Mở nhóm lựa chọn.page_view
: Sự kiện đầu tiên.|
: Hoạt động như OR (hoặc).internal_link_click
: Sự kiện thứ hai.)
: Đóng nhóm lựa chọn.$
: Đánh dấu kết thúc chuỗi.
Kết quả: Báo cáo chỉ hiển thị dữ liệu cho hai sự kiện:
page_view
vàinternal_link_click
.
Một số lưu ý quan trọng
1. Loại bỏ các metacharacter không cần thiết:
- Regex cũng sẽ hoạt động nếu bạn loại bỏ
^
và)
hoặc(
. - Ví dụ:regexSao chép mã
page_view|internal_link_click
Cách này vẫn trả về kết quả tương tự.
2. Sử dụng dấu mũ (^) và dấu ngoặc đơn khi cần nhóm các điều kiện phức tạp:
- Điều này giúp tăng độ chính xác và dễ đọc cho biểu thức.
3. Event tùy chỉnh:
- Ví dụ sử dụng sự kiện
internal_link_click
là một event tùy chỉnh. - Nếu bạn chưa thiết lập sự kiện này trong GA4, bạn cần thay thế bằng sự kiện khác có trong property của bạn, ví dụ:
scroll
hoặcclick
.
Ứng dụng bộ lọc Regex trong GA4
Lọc các sự kiện cụ thể:
Dùng Regex để tập trung vào các event quan trọng như:
- Lượt xem trang (
page_view
). - Các click nội bộ (
internal_link_click
). - Lượt xem video (
video_start
hoặcvideo_complete
).
Lọc dữ liệu URL hoặc Landing Page:
Ví dụ: Lọc chỉ các trang có URL bắt đầu bằng /blog
hoặc /product
:
regexSao chép mã^/blog|/product
Phân tích nâng cao:
Regex giúp giảm nhiễu bằng cách chỉ hiển thị dữ liệu liên quan, cải thiện hiệu quả phân tích.
Hướng dẫn sử dụng Regex audience và segment trong GA4
Regex là công cụ mạnh mẽ để tạo các phân khúc (segments) và đối tượng (audiences) trong GA4, giúp bạn thu hẹp phạm vi dữ liệu và tập trung vào các nhóm người dùng hoặc hành vi cụ thể. Dưới đây là hướng dẫn chi tiết:
Bước 1: Hiểu loại phân khúc cần tạo
GA4 cung cấp ba loại phân khúc chính:
- User Segment: Tập trung vào người dùng có đặc điểm hoặc hành vi cụ thể trong toàn bộ thời gian sử dụng.
- Session Segment: Tập trung vào các phiên (sessions) đáp ứng điều kiện nhất định.
- Event Segment: Tập trung vào các sự kiện (events) cụ thể trong dữ liệu.
Ví dụ thực tế:
- Tạo phân khúc cho các phiên đến từ Google Organic Search và Bing Organic Search (Session Segment).
Bước 2: Tạo phân khúc bằng Regex
- Truy cập công cụ phân khúc trong GA4: Trong giao diện GA4, vào Explore > Chọn Segments > Nhấn nút + để tạo phân khúc mới.
- Chọn loại phân khúc: Chọn Session Segment nếu bạn muốn tập trung vào các phiên.
- Định nghĩa điều kiện phân khúc: Thêm điều kiện lọc dựa trên Session source/medium traffic (Nguồn phiên/lưu lượng truy cập trung bình).
- Chọn Condition > matches regex. Nhập biểu thức Regex: Sử dụng biểu thức để bao gồm các nguồn từ Google và Bing:regexSao chép mã
google/organic|bing/organic
Giải thích:
google/organic
: Bao gồm các phiên từ Google Organic Search.
|
: Hoạt động như OR (hoặc).
bing/organic
: Bao gồm các phiên từ Bing Organic Search.
Bước 3: Áp dụng phân khúc và phân tích
- Sau khi thiết lập xong phân khúc, nhấn Apply để áp dụng phân khúc vào báo cáo.
- Bây giờ, bạn có thể phân tích dữ liệu chỉ cho các phiên đến từ tìm kiếm tự nhiên trên Google và Bing.
Các lưu ý khi sử dụng Regex để tạo phân khúc
- Kiểm tra điều kiện Regex trước khi sử dụng:
- Bạn có thể kiểm tra biểu thức Regex bằng các công cụ kiểm tra Regex trực tuyến để đảm bảo hoạt động chính xác.
- Sử dụng metacharacter để tinh chỉnh điều kiện:
^
: Đánh dấu bắt đầu chuỗi.$
: Đánh dấu kết thúc chuỗi..*
: Ký tự đại diện, khớp với bất kỳ chuỗi nào.
- Tạo phân đoạn đối tượng (Audience):
- Regex cũng có thể được sử dụng để tạo đối tượng cho các chiến dịch Google Ads hoặc phân tích sâu hơn.
Hướng dẫn sử dụng Regex vào ustom channel grouping trong GA4
Giới thiệu
Google Analytics 4 (GA4) cho phép bạn tạo nhóm kênh tùy chỉnh (Custom Channel Grouping) để điều chỉnh định nghĩa kênh mặc định (default channel). Tính năng này đặc biệt hữu ích khi bạn muốn kết hợp hoặc điều chỉnh các biến thể UTM để phân loại traffic chính xác hơn.
Ví dụ thực tế:
- Phân loại Affiliate traffic khi
medium
chứa cả “affiliate” và “affiliates”.
Cách sử dụng Regex trong Custom Channel Grouping
Bước 1: Truy cập phần quản trị nhóm kênh (Channel Grouping)
- Đăng nhập vào GA4.
- Đi tới Admin (Quản trị).
- Trong mục Property Settings, chọn Data Settings > Channel Groups.
Bước 2: Tạo nhóm kênh tùy chỉnh
- Nhấp vào nút Create new channel group (Tạo nhóm kênh mới).
- Cuộn xuống để tìm kênh mặc định bạn muốn thay đổi (ví dụ: Affiliates traffic).
- Chọn Affiliates và quan sát định nghĩa kênh mặc định (như medium = affiliate).
Bước 3: Chỉnh sửa điều kiện kênh với Regex
- Thay đổi điều kiện
medium
của kênh bằng cách chọn matches regex. - Nhập biểu thức Regex phù hợp để bao gồm các biến thể UTM mong muốn.
Ví dụ Regex:
regexSao chép mãaffiliate|affiliates
Giải thích:
affiliate
: Khớp với traffic có medium là “affiliate”.|
: Hoạt động như toán tử “HOẶC” (OR).affiliates
: Khớp với traffic có medium là “affiliates”.
- Nhấn Save để lưu nhóm kênh tùy chỉnh mới.
Lưu ý quan trọng
- Không phân biệt chữ hoa/chữ thường:
- Regex trong GA4 không phân biệt giữa chữ hoa và chữ thường. Ví dụ, cả “Affiliate” và “affiliate” đều sẽ khớp.
- Kiểm tra kết quả:
- Sau khi áp dụng nhóm kênh tùy chỉnh, kiểm tra dữ liệu trong Exploration Reports để đảm bảo rằng traffic được phân loại đúng.
- Ứng dụng Regex linh hoạt:
- Nếu bạn muốn bao gồm nhiều biến thể hơn, chỉ cần mở rộng Regex
Hướng dẫn sử dụng Regex để tạo sự kiện (event) tùy chỉnh trong GA4
Tổng quan
Sử dụng Regex để tạo các sự kiện tùy chỉnh trong GA4 giúp bạn dễ dàng ghi nhận các hoạt động cụ thể trên website. Bài viết này hướng dẫn cách sử dụng công cụ tích hợp sẵn trong GA4 để tạo sự kiện tùy chỉnh dựa trên điều kiện sử dụng biểu thức chính quy (Regex).
Cách tạo sự kiện tùy chỉnh với Regex trong GA4
Bước 1: Truy cập trình quản lý sự kiện (Events Manager)
- Mở Google Analytics 4 và đi tới tab Configure (Cấu hình).
- Chọn Events (Sự kiện).
- Nhấp vào nút Create Event (Tạo sự kiện) ở góc trên bên phải.
Bước 2: Tạo sự kiện mới
- Trong phần Create Event, nhấp vào nút Create để bắt đầu tạo sự kiện tùy chỉnh.
- Đặt tên cho sự kiện trong trường Custom Event Name. Ví dụ:
page_view_tag_page
.
Bước 3: Thêm điều kiện sự kiện
- Trong mục Matching Conditions, thêm điều kiện đầu tiên để lọc các sự kiện cơ sở:
- Parameter: Chọn
event_name
. - Operator: Chọn
equals
. - Value: Nhập
page_view
.
- Parameter: Chọn
- Thêm điều kiện thứ hai để lọc dữ liệu URL bằng Regex:
- Parameter: Chọn
page_location
(hoặc tham số phù hợp khác, ví dụ:page_path
). - Operator: Chọn
matches regular expression
. - Value: Nhập Regex để chỉ định các trang cụ thể.
- Parameter: Chọn
Bước 4: Giải thích Regex
- ^: Chỉ định rằng URL phải bắt đầu bằng chuỗi sau.
- Xác định phần URL cố định cần so khớp.
- .*: Ký tự đại diện, khớp với mọi ký tự hoặc chuỗi ký tự sau
/tag/
.
Bước 5: Lưu sự kiện
- Nhấp vào Save để lưu sự kiện tùy chỉnh.
- GA4 sẽ tự động bắt đầu ghi nhận sự kiện mới khi các điều kiện được đáp ứng.
Kiểm tra sự kiện tùy chỉnh
- Truy cập tab Realtime (Thời gian thực) trong GA4.
- Kiểm tra xem sự kiện tùy chỉnh vừa tạo (ví dụ:
page_view_tag_page
) có xuất hiện không khi bạn truy cập vào các trang đáp ứng điều kiện Regex.
Lưu ý
- Dữ liệu cần thời gian xử lý: Sự kiện mới có thể mất vài phút để hiển thị trong báo cáo.
- Cẩn thận khi tạo Regex phức tạp: Một lỗi nhỏ có thể dẫn đến việc không ghi nhận sự kiện.
- Kiểm tra trước khi triển khai: Đảm bảo kiểm tra kỹ Regex bằng các công cụ trực tuyến như regex101.com để tránh sai sót.
Trường hợp khác có thể sử dụng Regex trong GA4
Ngoài các ứng dụng phổ biến như tạo sự kiện tùy chỉnh, phân đoạn đối tượng, và nhóm kênh tùy chỉnh, Regex còn được sử dụng trong GA4 cho các trường hợp sau:
1. Xác định Internal Traffic (Lưu lượng nội bộ)
GA4 cho phép bạn sử dụng Regex để lọc hoặc xác định lưu lượng nội bộ (internal traffic). Điều này hữu ích để loại trừ dữ liệu của nhân viên hoặc đối tác, tránh ảnh hưởng đến báo cáo.
Cách thực hiện:
- Truy cập Admin > Data Streams > Chọn luồng dữ liệu của bạn.
- Trong mục Additional Settings, chọn Define Internal Traffic.
- Tạo định nghĩa internal traffic bằng cách nhập thông tin:
- Parameter:
traffic_type
- Value: Sử dụng Regex để xác định lưu lượng, ví dụ:regexSao chép mã
^internal$
- Parameter:
- Lưu cấu hình.
2. Tạo danh sách loại trừ tham chiếu (Referral Exclusion)
Regex cũng có thể được sử dụng để tạo danh sách loại trừ tham chiếu, giúp bạn đảm bảo rằng các phiên chuyển đổi nội bộ hoặc không mong muốn không được tính là traffic referral.
Cách thực hiện:
- Đi tới Admin > Data Settings > Referral Exclusions.
- Nhấp vào Add Referral.
- Nhập một Regex để xác định các nguồn tham chiếu cần loại trừ. Ví dụ:
- Loại trừ tất cả các tên miền phụ của
example.com
:regexSao chép mã^.*\.example\.com$
- Loại trừ tất cả các tên miền phụ của
3. Sử dụng Regex để Lọc Dữ Liệu trong Báo Cáo
Trong các báo cáo GA4 (Exploration), Regex có thể được áp dụng để lọc nhanh các tập dữ liệu:
Ví dụ:
- Lọc tất cả các trang có URL bắt đầu bằng
/blog/
:regexSao chép mã^/blog/.*
- Lọc các từ khóa tìm kiếm bao gồm cả “SEO” hoặc “Marketing”:regexSao chép mã
SEO|Marketing
4. Xác định các event không mong muốn (Unwanted Events)
Bạn có thể sử dụng Regex để phát hiện hoặc loại bỏ các sự kiện không mong muốn, chẳng hạn như các click chuột không hợp lệ hoặc sự kiện lỗi:
Ví dụ:
- Phát hiện các sự kiện lỗi có tên bắt đầu bằng “error_”:regexSao chép mã
^error_.*
Kết luận
Regex trong GA4 không chỉ giới hạn ở việc tạo sự kiện và phân đoạn dữ liệu mà còn linh hoạt trong việc quản lý traffic, loại trừ tham chiếu và lọc dữ liệu báo cáo. Việc tận dụng Regex đúng cách sẽ giúp bạn phân tích và hiểu rõ hơn về hành vi người dùng trên website, đồng thời tối ưu hóa hiệu quả chiến lược kinh doanh.
Nếu bạn cần thêm hướng dẫn, đừng ngần ngại để lại câu hỏi bên dưới nhé, đội ngũ bên mình sẽ hỗ trợ bạn
Đăng ký nhận newsletter
Đón đọc các tin tức và thủ thuật mới nhất từ bản tin của Digital Marketing Việt Nam qua email