Nội dung bài viết
ToggleContent knowledge graph – Sơ đồ tri thức nội dung là gì?
Content knowledge graph là một loại sơ đồ tri thức chuyên biệt.
Nó là một lớp dữ liệu có cấu trúc, có thể tái sử dụng của các Entity trên trang web của bạn, thuộc tính của chúng và mối quan hệ của chúng với các Entity khác trên trang web của bạn và hơn thế nữa.
Trong một sơ đồ tri thức nội dung, các Entity trên trang web của bạn và mối quan hệ của chúng có thể được định nghĩa bằng cách sử dụng một từ vựng chuẩn hóa như Schema.org và được biểu diễn dưới dạng các bộ ba Khung mô tả tài nguyên (Resource Description Framework) (RDF).
Các bộ ba RDF được biểu diễn dưới dạng các câu “chủ ngữ-vị ngữ-tân ngữ”, và chúng minh họa cách một Entity (chủ ngữ) liên quan đến một Entity khác hoặc một giá trị đơn giản (tân ngữ) thông qua một thuộc tính cụ thể (vị ngữ).
Ví dụ, tôi, Martha van Berkel, làm việc cho Schema App. Điều này được nêu rõ bằng văn bản trên trang web của chúng tôi, và chúng tôi có thể sử dụng Schema.org để diễn đạt điều này trong JSON-LD, cho phép máy hiểu các câu lệnh RDF về các Entity.

Nội dung trang web của bạn chứa nhiều Entity có liên quan với nhau.
Khi bạn sử dụng Schema Markup để mô tả các Entity trên trang của bạn và mối quan hệ của chúng với các Entity khác, bạn thực chất đang thể hiện chúng dưới dạng các bộ ba RDF tạo thành sơ đồ tri thức nội dung của mình.
Chắc chắn, chúng tôi có thể đang đơn giản hóa quá trình một chút, vì có một vài bước nữa để tạo một sơ đồ tri thức nội dung.
Nhưng trước khi bạn bắt đầu xây dựng một content knowledge graph, bạn cần hiểu lý do tại sao mình phải xây dựng sơ đồ này và nhóm của bạn có thể hưởng lợi như thế nào từ biểu đồ này.
Sơ đồ tri thức nội dung thúc đẩy sự hiểu biết ngữ nghĩa cho công cụ tìm kiếm
Trong vài năm qua, các công cụ tìm kiếm đã chuyển từ tìm kiếm theo từ khóa (lexical) sang tìm kiếm theo ngữ nghĩa (semantic). Điều này có nghĩa là ít đối chiếu từ khóa hơn và tập trung nhiều hơn vào việc đối chiếu các Entity có liên quan.
Sự hiểu biết về mặt ngữ nghĩa này thậm chí còn có lợi hơn trong thời đại của các công cụ tìm kiếm do AI điều khiển như Gemini, SearchGPT, và các công cụ khác.
Sơ đồ tri thức nội dung của bạn thể hiện tất cả các mối quan hệ giữa các Entity trên trang web của bạn và trên toàn bộ web, giúp công cụ tìm kiếm có được bối cảnh và hiểu biết sâu sắc hơn về các chủ đề và thực thể được đề cập trên trang web của bạn.
Bạn cũng có thể kết nối các Entity trong sơ đồ tri thức nội dung của mình với các Entity đã biết được tìm thấy trong các cơ sở tri thức có thẩm quyền bên ngoài như Wikipedia, Wikidata và Google’s Knowledge Graph.
Điều này được gọi là Entity Linking, và nó có thể thêm nhiều bối cảnh hơn cho các Entity được đề cập trên trang của bạn, giúp chúng rõ ràng hơn.

Cuối cùng, sơ đồ tri thức nội dung của bạn cho phép các công cụ tìm kiếm hiểu rõ mức độ liên quan của nội dung với truy vấn tìm kiếm của người dùng, mang lại kết quả tìm kiếm chính xác và hữu ích hơn cho người dùng và lưu lượng truy cập chất lượng cho tổ chức của bạn.
Sơ đồ tri thức nội dung có thể làm giảm ảo giác AI (AI Hallucinations)
Ngoài SEO, sơ đồ tri thức nội dung cũng rất quan trọng để cải thiện hiệu suất AI. Khi các doanh nghiệp áp dụng nhiều công nghệ AI hơn như AI chatbots, việc chống lại ảo tưởng AI hiện là một yếu tố quan trọng để thành công.
Mặc dù các mô hình ngôn ngữ lớn (Large Language Models) (LLMs) có thể sử dụng các mẫu và xác suất để tạo ra câu trả lời, chúng thiếu khả năng kiểm tra thực tế, dẫn đến các câu trả lời sai hoặc mang tính suy đoán.
Sơ đồ tri thức nội dung, mặt khác, được xây dựng từ các nguồn dữ liệu đáng tin cậy như trang web của bạn, đảm bảo độ tin cậy và độ chính xác của thông tin.
Điều này có nghĩa là sơ đồ tri thức nội dung mà bạn đã xây dựng để thúc đẩy SEO cũng có thể được tái sử dụng để làm nền tảng cho LLMs kiến thức có cấu trúc, đã được xác minh và cụ thể theo lĩnh vực, giúp giảm nguy cơ ảo giác.
Sơ đồ tri thức nội dung được bắt nguồn từ thông tin thực tế về các thực thể liên quan đến tổ chức của bạn, làm cho chúng trở thành một nguồn dữ liệu tuyệt vời để hiểu sâu hơn về nội dung.
Sơ đồ tri thức nội dung có thể thúc đẩy chiến lược nội dung
Nội dung chất lượng cao là một trong những nền tảng của SEO tuyệt vời. Tuy nhiên, các content marketer thường gặp khó khăn trong việc tìm ra những khoảng trống trong nội dung hiện có của họ về các Entity và chủ đề mà họ muốn thúc đẩy lưu lượng truy cập.
Sơ đồ tri thức nội dung có khả năng cung cấp cho các nhóm nội dung một cái nhìn tổng thể về các thực thể của họ để thu được những hiểu biết hữu ích nhằm định hướng chiến lược nội dung. Hãy cùng tìm hiểu sâu hơn.
Có được cái nhìn toàn diện về các thực thể trên toàn bộ nội dung của bạn
Truyền thống, các đội ngũ content marketing sẽ kiểm tra thủ công hoặc sử dụng sheet, cơ sở dữ liệu quan hệ (relational database) (bảng, hàng và cột) để quản lý nội dung của họ. Vấn đề với relational database là thiếu ý nghĩa ngữ nghĩa.
Ví dụ, một bảng có thể ghi lại tiêu đề, URL, tác giả, meta description, số lượng từ và chủ đề của một bài viết. Tuy nhiên, nó không thể nắm bắt các thực thể được đề cập trong một bài viết văn bản thuần túy.
Nếu bạn muốn biết những trang nào trên trang web của mình hiện đang đề cập đến sản phẩm cũ mà bạn không còn cung cấp nữa thì việc xác định những trang này rất khó và thủ công.
Mặt khác, sơ đồ tri thức nội dung cung cấp một hệ thống phân loại đa chiều cho nội dung của bạn.
Khi được xây dựng bằng cách sử dụng từ vựng Schema.org, các loại và thuộc tính chi tiết cho phép bạn ghi lại các kết nối giữa các phần nội dung khác nhau dựa trên các thực thể và phân loại.
Ví dụ, một bài đăng blog trên trang web của bạn có thể xuất hiện trên sơ đồ tri thức nội dung của bạn dưới dạng một BlogPosting với các thuộc tính như tác giả, nhà xuất bản, đề cập, ngày xuất bản, ngày sửa đổi, đối tượng, trích dẫn, và nhiều hơn nữa.
Những thuộc tính này kết nối bài viết blog của bạn (một thực thể) với các thực thể khác mà bạn đã xác định trên trang web của mình. Tác giả của một bài viết cụ thể là một Người mà bạn có thể đã định nghĩa trên trang Tác giả.
Bài viết của bạn có thể đề cập đến một sản phẩm hoặc dịch vụ mà bạn đã định nghĩa trên các trang khác trong trang web của mình.

Đối với các đội ngũ marketing phải quản lý khối lượng lớn nội dung, việc cấu trúc nội dung của bạn thành một content knowledge graph có thể mang lại cho bạn một cái nhìn toàn diện hơn về nội dung và các thực thể của bạn.
Bạn có thể dễ dàng thực hiện kiểm tra nội dung để tìm hiểu những gì hiện có trên trang web của mình mà không cần phải kiểm tra thủ công trang web hoặc cập nhật bảng tính.
Đổi lại, điều này cho phép bạn dễ dàng thực hiện phân tích nội dung và có được cái nhìn sâu sắc hơn về nội dung của mình.
Hiểu sâu hơn về nội dung của bạn
Với cái nhìn toàn diện được cung cấp bởi content knowledge graph của bạn, bạn có thể dễ dàng kiểm tra nội dung và các thực thể của mình để xác định các khoảng trống và cơ hội để cải thiện chiến lược nội dung của bạn.
Ví dụ 1: Bạn muốn củng cố E-E-A-T cho các tác giả cụ thể trên trang của bạn. Sơ đồ tri thức nội dung của bạn sẽ hiển thị:
- Tất cả nội dung mà tác giả này đã tạo, chỉnh sửa hoặc đóng góp.
- Cách tác giả liên quan đến tổ chức của bạn và các thực thể nổi tiếng khác.
- Vai trò, chức danh công việc, giải thưởng, chứng chỉ và chứng nhận của tác giả.
Cái nhìn thống nhất này có thể cung cấp cho đội ngũ của bạn một cái nhìn tổng quan rộng về tác giả này và xác định các cơ hội nội dung để cải thiện thẩm quyền chủ đề của tác giả trên trang của bạn.
Ví dụ 2: Tổ chức của bạn muốn loại bỏ tất cả các đề cập đến các giao thức COVID-19 khỏi trang web của bạn.
Bạn có thể truy vấn sơ đồ tri thức nội dung của mình để xác định nội dung trước đây đề cập đến chủ đề “COVID-19” và đánh giá sự liên quan và cần thiết của từng đề cập trước khi loại bỏ nó khỏi nội dung của bạn.
Cách tiếp cận có mục tiêu này có thể cho phép đội ngũ của bạn tinh chỉnh nội dung của họ mà không cần đầu tư quá nhiều thời gian vào việc xem xét thủ công.
Vì các sơ đồ tri thức nội dung được xây dựng bằng Schema.org được biểu diễn dưới dạng các bộ ba RDF, bạn có thể sử dụng ngôn ngữ truy vấn SPARQL để tìm hiểu trang nào một thực thể cụ thể được đề cập hoặc có bao nhiêu nội dung bạn có về một thực thể hoặc chủ đề cụ thể.
Điều này sẽ giúp đội ngũ của bạn trả lời các câu hỏi chiến lược như:
- Những thực thể nào không được đại diện trong nội dung trang web của bạn?
- Nơi nào có thể tạo thêm nội dung để cải thiện độ phủ thực thể?
- Nội dung hiện có nào cần được cải thiện?
Vượt ra ngoài lợi ích SEO và AI của nó, sơ đồ tri thức nội dung có tiềm năng giúp các đội ngũ content marketing thực hiện phân tích nội dung với hiệu quả và độ chính xác cao hơn.
Đã đến lúc bắt đầu đầu tư vào Content Knowledge Graphs
Ngày nay, sơ đồ tri thức nội dung thể hiện một sự chuyển dịch từ cách nghĩ rằng việc tạo nội dung là nhiệm vụ của người quản lý nội dung, sang việc xem đây là cơ hội để các chuyên gia SEO tạo ra một nguồn dữ liệu nội dung có tính kết nối, giúp trả lời các câu hỏi và xác định cơ hội cho nhóm nội dung.
Đây là một công nghệ quan trọng đối với các tổ chức đang tìm cách tạo sự khác biệt trong một bối cảnh số ngày càng phức tạp.
Đầu tư vào content knowledge graphs ngay bây giờ sẽ đưa tổ chức của bạn lên vị trí hàng đầu về SEO và tối ưu hóa nội dung, cung cấp cho bạn các công cụ để vượt qua những thách thức trong tương lai.
Và tất cả bắt đầu bằng việc triển khai đánh dấu lược đồ ngữ nghĩa trên trang web của bạn.
Nguồn tham khảo: searchenginejournal