Đánh giá kết quả tìm kiếm của google

Những năm qua, Tìm kiếm đã thay đổi để đáp ứng nhu cầu và kỳ vọng không ngừng gia tăng của người dùng Google. Từ các sáng kiến như Sơ đồ tri thức cho đến những lần cập nhật hệ thống nhằm đảm bảo chúng tôi không ngừng cung cấp nội dung phù hợp, mục tiêu của chúng tôi luôn là giúp kết quả bạn nhận được trở nên hữu ích hơn.

Với mọi thay đổi dự định thực hiện với Tìm kiếm, chúng tôi đều áp dụng quy trình đánh giá nghiêm ngặt để phân tích các chỉ số và quyết định xem có nên triển khai một đề xuất thay đổi cụ thể hay không.

Dữ liệu từ những quy trình đánh giá và thử nghiệm như thế này đều phải trải qua quá trình xem xét của đội ngũ kỹ sư và chuyên viên phân tích tìm kiếm giàu kinh nghiệm, cũng như các chuyên gia về pháp lý và quyền riêng tư với để quyết định xem có chấp thuận cho triển khai thay đổi nào đó hay không. Năm 2022, chúng tôi đã tiến hành hơn 800.000 thử nghiệm, đem lại hơn 4.000 điểm cải tiến đối với Tìm kiếm.

Chúng tôi đánh giá theo nhiều cách. Năm 2022, chúng tôi đã tiến hành:

Mọi thay đổi đề xuất đối với Tìm kiếm đều phải trải qua quá trình xem xét của các kỹ sư và nhà khoa học dữ liệu giàu kinh nghiệm. Họ sẽ đánh giá kỹ lưỡng dữ liệu từ mọi thử nghiệm để quyết định có cho phép thực hiện thay đổi nào đó hay không. Trong số các thay đổi được đề xuất trong năm qua, có nhiều thay đổi chưa từng được triển khai vì chúng tôi sẽ không áp dụng thay đổi nếu không chứng minh được rằng thay đổi đó thực sự mang lại lợi ích cho mọi người.

Đánh giá kết quả tìm kiếm của google

13.280 thử nghiệm lưu lượng truy cập trực tiếp

Chúng tôi triển khai thử nghiệm lưu lượng truy cập trực tiếp để nắm được cách người dùng thực tương tác với một tính năng trước khi ra mắt tính năng đó cho tất cả mọi người. Chúng tôi chỉ bật tính năng đang thử nghiệm cho một tỷ lệ nhỏ người dùng, thường bắt đầu ở mức 0,1%. Sau đó, chúng tôi so sánh nhóm thử nghiệm với một nhóm đối chứng không sử dụng tính năng đó. Chúng tôi xem xét một danh sách dài gồm nhiều chỉ số, chẳng hạn như mọi người nhấp chuột vào nội dung nào, có bao nhiêu lượt tìm kiếm được thực hiện, lượt tìm kiếm có bị bỏ ngang hay không, mọi người mất bao lâu để nhấp vào một kết quả, v.v. Chúng tôi sử dụng những kết quả này để xác định xem người dùng có tương tác tích cực với tính năng mới hay không, qua đó đảm bảo thay đổi chúng tôi thực hiện sẽ giúp kết quả trở nên phù hợp và hữu ích hơn với mọi người.

Đánh giá kết quả tìm kiếm của google

894.660 bài kiểm tra chất lượng tìm kiếm

Chúng tôi hợp tác với Người đánh giá chất lượng Tìm kiếm ngoài Google để liên tục đo lường chất lượng của kết quả trên Tìm kiếm. Người đánh giá sẽ đánh giá mức độ đáp ứng của nội dung đối với một yêu cầu tìm kiếm, họ cũng xác định chất lượng của kết quả dựa trên chuyên môn, tính xác thực và độ tin cậy của nội dung. Những đánh giá này không ảnh hưởng trực tiếp đến thứ hạng nhưng vẫn giúp chúng tôi thiết lập tiêu chuẩn cho kết quả và đảm bảo rằng kết quả đáp ứng được yêu cầu cao trên toàn thế giới.

Người đánh giá sẽ đánh giá mức độ đáp ứng của trang web đối với nhu cầu của người dùng đã nhấp vào trang web đó, họ cũng xác định chất lượng của kết quả dựa trên chuyên môn, tính xác thực và độ tin cậy của nội dung.

Để đảm bảo duy trì một phương pháp thống nhất, chúng tôi đã xuất bản Nguyên tắc cho người đánh giá chất lượng kết quả của Tìm kiếm nhằm cung cấp cho những Người đánh giá này hướng dẫn và ví dụ về cách đánh giá đúng. Mặc dù việc đánh giá chất lượng kết quả trông có vẻ đơn giản nhưng vẫn có nhiều trường hợp phức tạp cần xem xét kỹ. Vì thế, phản hồi này là yếu tố rất quan trọng để đảm bảo chúng tôi luôn cung cấp kết quả chất lượng cao cho người dùng.

Đánh giá kết quả tìm kiếm của google

72.367 thử nghiệm song song

Tìm kiếm không phải là một quá trình tĩnh. Chúng tôi liên tục cải thiện thuật toán để trả về kết quả hữu ích. Trong quá trình triển khai những thay đổi đó, Người đánh giá chất lượng của Tìm kiếm đóng vai trò rất quan trọng. Trong một thử nghiệm song song, chúng tôi cung cấp hai bộ kết quả trên Tìm kiếm cho Người đánh giá: một bộ đã áp dụng thay đổi đề xuất và một bộ chưa áp dụng. Chúng tôi hỏi xem họ thích kết quả nào hơn và tại sao.