Ý nghĩa của việc lập chỉ mục đoạn văn và xử lý ngôn ngữ tự nhiên với SEO

Ý nghĩa của việc lập chỉ mục đoạn văn và xử lý ngôn ngữ tự nhiên với SEO

Mục lục

Các bản cập nhật gần đây của Google đem đến cho người làm SEO sự tự do và thoải mái hơn khi tập trung vào người dùng thay vì chỉ tập trung vào bot. Cụ thể việc lập chỉ mục đoạn văn và xử lý ngôn ngữ tự nhiên của Google đã tác động đến tương lai làm SEO sau này.

Cụ thể, các thông báo gần đây của Google về việc mở rộng sử dụng các thuật toán hiểu ngôn ngữ tự nhiên thể hiện một bước tiến lớn trong việc xác định nội dung thông tin nào là phù hợp nhất để hiển thị trong kết quả tìm kiếm của người dùng. Đổi lại, các thuật toán này sẽ tác động đến cách Google tiếp cận nội dung và tối ưu hóa các nội dung đó.

Lập chỉ mục đoạn văn và xếp hạng các đoạn cụ thể trong kết quả tìm kiếm 

Hiện nay Google đang triển khai lập chỉ mục dựa trên các đoạn văn trong bài viết (trước mắt là đối với các ngôn ngữ tiếng Anh). Đây là một thay đổi cho phép Google xác định được các đoạn văn riêng lẻ trong một trang cụ thể và xử lý sao cho nội dung đoạn văn đó phù hợp nhất với câu hỏi tìm kiếm của người dùng - ngay cả khi đó không phải là chủ đề chính của bài viết. Lưu ý rằng Google không lập chỉ mục riêng biệt cho từng đoạn văn cụ thể xét trên phương diện kỹ thuật. Những thay đổi này sẽ tác động và làm thay đổi khoảng 7% kết quả tìm kiếm cho các truy vấn của mọi ngôn ngữ trên toàn cầu khi được triển khai rộng rãi.

BERT tăng từ 10% cho đến gần 100% tất cả các câu hỏi tìm kiếm

natural-language-processing 1

BERT tăng từ 10% cho đến gần 100% tất cả các câu hỏi tìm kiếm

BERT - viết tắt của Bidirectional Encoder Representations from Transformers - được đánh giá là một bước đột phá mới trong công nghệ xử lý ngôn ngữ tự nhiên của Google và của Bing. Đây là một mô hình học có sẵn (pre-train model), một kỹ thuật dựa trên mạng nơ-ron để hiểu các ngôn ngữ tự nhiên và phân biệt được các ngữ cảnh của từ ngữ tốt hơn. 

Hiện nay nó hỗ trợ hầu hết mọi câu hỏi tìm kiếm bằng tiếng Anh trên công cụ tìm kiếm Google và Bing. Có thể nói đây là một sự gia tăng đột phá đáng kể so với con số 1/10 thời điểm tháng 10 năm ngoái, khi mà Google lần đầu tiên công bố sự dụng công nghệ BERT trong thuật toán của mình.

Việc ứng dụng rộng rãi của BERT đối với Google mà nói sẽ giúp cho Google cải thiện được "hiểu biết" của mình về nội dung và mục đích tìm kiếm của người dùng., nâng cao hơn chất lượng các kết quả tìm kiếm hướng đến người dùng.

Cải thiện lỗi chính tả

Theo Google thì cứ 10 câu hỏi tìm kiếm được search trên Google thì có 1 câu hỏi tìm kiếm bị sai chính tả. Để cải thiện hơn chất lượng tìm kiếm cũng như tăng trải nghiệm người dùng tốt nhất cho những câu hỏi đó, Google cũng đang áp dụng những tiến bộ mới về công nghệ "hiểu" ngôn ngữ để mô hình hóa tốt hơn các trường hợp bị sai chính tả.

Các ngữ cảnh có thể yêu cầu bạn xác định lại lỗi và chỉnh sửa lại lỗi chính tả đó, hoặc khi Google "thấy" bạn sai chính tả trầm trọng thì chúng cũng yêu cầu bạn phải sửa lại. 

Đối với những người học Seo có thể đã rất cố gắng tối ưu tốt nhất vấn đề lỗi chính tả. Những thay đổi này trong tương lai sẽ được triển khai vào cuối tháng này, đồng nghĩa với việc bạn không cần phải quá bận tâm quá nhiều nữa đến vấn đề đó, bạn sẽ có thể dành nhiều sự tập trung của mình cho những công việc khác tốt hơn.

Ý nghĩa đối với SEO và xu hướng tìm kiếm của Google

Người làm SEO được tự do hơn để tập trung vào độc giả chứ không phải trình thu thập thông tin tìm kiếm trên Google 

Công nghệ BERT được Google sử dụng để hỗ trợ lập chỉ mục đoạn văn sẽ cho phép các thuật toán của Google xác định được nội dung đoạn văn riêng lẻ trong bài viết của bạn có nội dung phù  hợp nhất với các câu hỏi tìm kiếm của người dùng, ngay cả khi những nội dung còn lại của bài viết không liên quan nhiều bằng.

Chuyên gia marketing của MOZ - tiến sỹ Peter Meyers cho biết: "Nếu có bất cứ điều gì, những cập nhật này sẽ hướng chúng ta đến với một thế giới mà ở đó chúng ta có thể tập trung nhiều hơn vào người dùng hơn là quan tâm nhiều đến các con bot, từ góc độ content và xếp hạng". ("If anything, these updates move us toward a world where we can focus more on users and not worry as much about bots, from a content and ranking perspective”)

Ngoài ra ông còn cho biết thêm việc tạo ra các trang web thân thiện với Google Bot để thu thập dữ liệu và hành vi người dùng sẽ là quan trọng hơn nhiều nếu xét về góc độ kỹ thuật SEO.

"Khi Google triển khai Đoạn trích nổi bật và tập trung nhiều hơn vào tầm quan trọng của chuyên đề đã có thêm một biến động nhỏ hướng đến nội dung và tập trung nhiều hơn vào nó" - tiến sỹ Peter Meyers nói thêm. Sự ưa chuộng các công cụ tìm kiếm của người dùng và nội dung tập trung đến có thể đã vô tình dồn người làm SEO vào một suy nghĩ rập khuôn, đó là người dùng và công cụ tìm kiếm bình đẳng như những ưu tiên khi tạo nội dung, chứ không phải là hướng đến người dùng. 

“Nếu thuật toán có thể hiểu mức độ liên quan của các đoạn văn, chúng tôi hy vọng có thể thư giãn một chút về điều này và không đi quá đà. Ví dụ chúng tôi không cần một trang cho mọi câu hỏi mà người dùng có thể hỏi" (“If the algorithm can understand the relevance of passages, we can hopefully relax a bit about this and not go overboard. We don’t need a page for every question a visitor might ask, for example.”)

Sự linh hoạt trong việc sắp xếp nội dung cho các công cụ tìm kiếm sẽ cho phép người làm SEO tự do hơn. Thay vào đó là tạo ra các nội dung phù hợp với ý định và thắc mắc của người tìm kiếm theo cách có nghĩa nhất đối với chủ đề hoặc câu hỏi mà người dùng đặt ra, dù nội dung đó trải dài hay laser -  tập trung. 

Xác định được điều gì tốt, điều gì xấu và điều gì cần lưu ý

Trong một số trường hợp, Google có thể hiểu và trình bày nội dung đoạn văn được lập chỉ mục như một cột mốc quan trọng khác của xu hướng tìm kiếm không cần nhấp chuột. 

natural-language-processing 2

Ví dụ về cách lập chỉ mục đoạn văn sẽ hiển thị trong kết quả tìm kiếm trên thiết bị di động. Hình ảnh: Google.

Kaushal Thakkar - Founder và là Giám đốc điều hành của Giải thưởng Search Engine Land Award 2020 - cơ quan đạt giải INFIDIGIT cho biết:

"Việc hiển thị tốt hơn các thông tin liên quan đến đoạn văn trên Google SEPs có nghĩa là xác suất người dùng click vào kết quả tìm kiếm sẽ giảm, bởi nội dung mà họ đi tìm - chính là đoạn văn được liệt kê ra để hiển thị và cung cấp thông tin cho người tìm kiếm - sẽ cung cấp thông tin bổ sung cho người dùng trên chính là SERP, và không yêu cầu họ truy cập và trang đích nữa" (“The better display of passage-related information on Google SERPs means the probability of users clicking on the search result would reduce. Since the passage listed will provide additional information to the users on the SERP itself, not requiring them to visit the source page.”)

Tuy nhiên xét về xu hướng lượng tìm kiếm tăng tổng thể qua mỗi năm, thì việc tụt giảm lưu lượng truy cập vào trang đích trên thực tế sẽ không ảnh hưởng hiểu và có thể không được chú ý đến.

Còn Hamlet Batista - Giám đốc điều hành của RankSense thì cho biết: 

"Là một người làm SEO, tôi sẽ chú ý nhiều hơn đến thông tin hiển thị tìm kiếm trong Search Console. Vậy nên tôi cũng có lời khuyến nghị tới những người làm SEO khác cũng nên theo dõi tỉ lệ nhấp, khả năng tương tác cũng như chất lượng click vào trang web của họ khi những thuật toán nào ảnh hưởng đến kết quả tìm kiếm của người dùng. Rất tiếc là tại thời điểm này, không có một báo cáo cụ thể nào trong Google Search Console hiển thị lượng truy cập từ các đoạn văn được lập chỉ mục, thế nhưng bạn vẫn có thể có được số lần hiển thị trang tăng lên nếu những đoạn văn đó được xếp hạng cho các câu hỏi tìm kiếm"

(As an SEO, I'd pay more attention to search impressions data in Search Console. Recommending that SEOs also monitor their clickthrough rates, engagement and the quality of their traffic as these algorithms impact search results. Unfortunately, at this time there isn't a specific report in Google Search Console showing traffic from passage indexation, but you may see a rise in page impressions if those passages start ranking for queries.")

"Tôi sẽ không từ bỏ việc nghiên cứu từ khóa, tuy nhiên sẽ điều chỉnh nó thành nghiên cứu mục tiêu" - anh nói thêm. Đồng thời còn nói thêm với các mục đích khác tương tự như vậy, chúng vẫn có thể được thể hiện bằng cách sử dụng các từ khóa khác nhau. Kỳ vọng của Google trong tương lai chỉ là 7% cho các câu hỏi tìm kiếm sẽ được cải thiện bằng lập chỉ mục đoạn văn, nghĩa là nghiên cứu từ khóa vẫn là một phần rất quan trọng của SEO, ít nhất là trong tương lai gần.

" Những người làm SEO nửa vời sẽ nhận ra điều đó khi người dùng tìm kiếm nhiều hơn, cũng như các công cụ tìm kiếm cũng trở nên hữu ích hơn" (“Glass-half-full SEOs see this as people searching more as [search] engines become more useful")

Các kết quả tích cực cũng có thể xảy ra nếu như cập nhật các thuật toán này. Ngoài khối lượng người dùng tìm kiếm tiềm năng hơn, những cập nhật thế này cũng có thể hấp dẫn đến lưu lượng truy cập chất lượng cao hơn vì kết quả trả về có thể cũng phù hợp hơn với người dùng so với trước đây.

Lập chỉ mục đoạn văn và xử lý ngôn ngữ tự nhiên trong tương lai

Những cập nhật mới này cũng nói lên những thiết sót của các công cụ tìm kiếm ở thời điểm hiện tại, cũng như hướng giải quyết mà Gogole đang thực hiện.

Eric Enge - Tổng giám đốc tại Perficient Digital cho biết: 

"Trước hết, việc lập chỉ mục đoạn văn có thể coi là một ví dụ minh họa một trong những thách thức lớn với người tìm kiếm, đó là trả lại một loạt các thông tin mà mọi người có thể đang tìm kiếm. Trong nhiều trường hợp, những thông tin này lại quá cụ thể và chi tiết. Nhưng Google cũng đã báo cáo rộng rãi rằng nó chỉ ảnh hưởng đến 7% tất cả các truy vấn tìm kiếm đó. Rất có thể nếu các thuật toán này được nâng cấp thì con số 7 % sẽ tăng lên đáng kể". 

(“First of all, [passage indexation] illustrates one of the big challenges with search, which is the vast array of types of information that people might be looking for. Many times this is information that is so specific, yet we already see Google reporting that it impacts 7% of all search queries.)

"Ngoài ra điều này làm nổi bật những thách thức mà tất cả chúng ta phải đối mặt với vai trò là người làm SEO, đó là bạn  và doanh nghiệp của mình phải tạo ra nhiều loại nội dung để trả lời được câu hỏi của người dùng và giải đáp được vấn đề của họ, mà theo dự đoán ban đầu của tôi nó sẽ phức tạp hơn nhiều" - anh cười nói thêm.

Trong thời gian tới nếu Google tiếp tục cập nhật và cải tiến hơn khả năng hiểu và xử lý ngôn ngữ tự nhiên của mình, thì Google sẽ được trang bị tốt hơn để đánh giá mức độ liên quan. Do đó người làm SEO sẽ không cần phải tiếp cận nội dung theo cách cứng nhắc ban đầu nữa. Điều này càng khẳng định hơn Google đang nỗ lực đem đến cho người dùng bất kỳ thông tin mà họ muốn. Và là một người sáng tạo nội dung của trang web, bạn cần phải có trách nhiệm với điều đó.

Xin cảm ơn bạn đọc đã đón đọc bài dịch "Ý nghĩa của việc lập chỉ mục đoạn văn và xử lý ngôn ngữ tự nhiên với SEO" của Unica. Chúc bạn thành công!

Đánh giá :

Tags: Seo SEO & Analytics