Phát hành NukeViet 07.2023

Dữ liệu có cấu trúc kiến thức quan trọng bạn cần biết

Thứ sáu - 13/08/2021 05:00
Dữ liệu có cấu trúc là gì? Có bao nhiều loại dữ liệu cấu trúc? Nguyên tắc khi xây dựng dữ liệu cấu trúc và nên sử dụng công cụ nào để kiểm tra? Nếu bạn đọc đang thắc mắc những vấn đề liên quan đến dữ liệu cấu trúc thì hãy theo dõi ngay bài viết sau đây của chúng tôi để biết thêm những thông tin hữu ích trong quá trình tìm hiểu nhé.
Dữ liệu có cấu trúc kiến thức quan trọng bạn cần biết

I. Khái niệm dữ liệu có cấu trúc là gì?

Dữ liệu có cấu trúc là dữ liệu được sắp xếp theo một cấu trúc nhất định. Cấu trúc này thường được chỉ ra trong file metadata cấu trúc. 

Đối với SEO, dữ liệu có cấu trúc sẽ giúp cho các Search Engine có thể đọc được dữ liệu cần tìm kiếm dễ dàng hơn. Việc chỉ sẵn ra cho các Search Engine những thông tin chi tiết nhất có thể sẽ giúp chúng liệt kê và trích dẫn những thông tin đó trên các công cụ tìm kiếm.

Ví dụ minh hoạ:

hình dữ liệu có cấu trúc
Những đoạn in đậm là dữ liệu có cấu trúc
hình dữ liệu có cấu trúc 2
Phân loại xe ô tô là 1 dạng dữ liệu có cấu trúc

 

hình dữ liệu có cấu trúc 3
Đây là 1 dạng dữ liệu có cấu trúc 

>>> Xem nhiều ví dụ hơn tại đây

Hiện các Search Engine đang hỗ trợ nhiều loại định dạng (JSON-LD, Microdata, hay RDFa), trong đó Google khuyến khích sử dụng JSON-LD. 

Nên:

  • Dữ liệu có cấu trúc của trang phải mô tả nội dung của bài viết của trang đó.

Không nên:

  • Tạo các trang trắng chỉ để chứa dữ liệu có cấu trúc.

  • Dùng dữ liệu có cấu trúc về thông tin không thể hiện cho người dùng

II. Các loại dữ liệu có cấu trúc mà Google hỗ trợ 

  • Schema là một đoạn code html hoặc code khai báo javascript dùng để đánh dấu dữ liệu có cấu trúc (structured data). Schema được tạo ra với sự hợp tác của 4 công cụ tìm kiếm nổi tiếng hiện nay là Google, Bing, Yandex và Yahoo.

  • Tìm thấy tại Schema.org

  • Các loại đánh dấu phổ biến:

    • Đoạn trích nổi bật

    • Breadcrumbs Schema Markup

    • Sitelinks

    • Tìm kiếm trang web

    • Schema Article

    • Review Schema

    • Local Business Schema

    • Recipe Schema

    • Product Schema

    • Sự kiện (Event)

    • Person Schema Markup

    • Tổ chức (Organization Schema)

    • Course Schema

    • Service Schema

    • Book Schema

    • Job Posting Schema

Bạn cũng có thể xem nhiều các loại đánh dấu hơn về dữ liệu có cấu trúc Google đưa ra.

1. Đoạn trích nổi bật

dữ liệu có cấu trúc
Ví dụ về đoạn trích nổi bật. Chúng ta có thể đánh dấu nhưng thường thì Google sẽ tự lấy

Ví dụ về đoạn trích nổi bật. Google sẽ lấy những đoạn văn bản phù hợp với kết quả tìm kiếm của người dùng.
Chi tiết tại đây

2. Breadcrumbs

hình dữ liệu có cấu trúc 5
Ví dụ về dữ liệu có cấu trúc Breadcrumbs

3. Sitelinks

hình dữ liệu có cấu trúc 6
Ví dụ về dữ liệu có cấu trúc sitelinks, nhưng thường Google sẽ tự nhận

4. Tìm kiếm trang web

hình dữ liệu có cấu trúc 7
Ví dụ về dữ liệu có cấu trúc tìm kiếm trang web

5. Review Schema

hình dữ liệu có cấu trúc 8
Ví dụ về dữ liệu có cấu trúc tìm kiếm trang web

6. Local Business Schema

hình dữ liệu có cấu trúc 9
Ví dụ về dữ liệu có cấu trúc Local Business

 

hình dữ liệu có cấu trúc 10
Ví dụ về dữ liệu có cấu trúc Local Business

III. Nguyên tắc chung đối với dữ liệu có cấu trúc

1. Nguyên tắc kỹ thuật

Trước hết kiểm tra trang web có tuân thủ nguyên tắc kỹ thuật hay không bằng cách sử dụng:

hình dữ liệu có cấu trúc 11
Minh họa với DauThau.Net
hình dữ liệu có cấu trúc 12
Công cụ kiểm tra URL Goolge Search Console

Đọc rõ các nguyên tắc về dữ liệu có cấu trúc để hiểu rõ hơn về các công cụ

1.1. Định dạng

Để đủ điều kiện xuất hiện dưới dạng kết quả nhiều định dạng, bạn nên đánh dấu các trang trên trang web của mình bằng một trong ba định dạng được hỗ trợ sau:

  • JSON-LD (nên dùng)
  • Vi dữ liệu
  • RDFa

1.2. Quyền truy cập

Đừng dùng tệp robots.txt, thẻ noindex hay bất kỳ phương pháp kiểm soát quyền truy cập nào khác để chặn Googlebot truy cập vào các trang chứa dữ liệu có cấu trúc.

2. Nguyên tắc về chất lượng

Các nguyên tắc này không dễ kiểm tra bằng một công cụ tự động. Nếu vi phạm nguyên tắc về chất lượng, thì dữ liệu có cấu trúc đó sẽ:

hình dữ liệu có cấu trúc 13
Ví dụ về thao tác thủ công

Nếu bị Google đánh dấu vi phạm, mình sẽ xử lý như thế nào? => Chỉnh sửa và yêu cầu xem xét lại trong trình Google Search Console

Về cơ bản của nguyên tắc dữ liệu có cấu trúc hãy tạo các trang có mục đích chính là phục vụ người dùng, thay vì phục vụ công cụ tìm kiếm. Không đánh lừa người dùng của bạn.

Tránh sử dụng các mánh khóe để tăng thứ hạng trên công cụ tìm kiếm. Về cơ bản là bạn chỉ cần thấy thoải mái khi giải thích với một trang web cạnh tranh hoặc với một nhân viên của Google về điều bạn đã làm. Một cách kiểm tra hữu ích khác là đặt ra câu hỏi, "Điều đó có giúp ích cho người dùng của tôi không? Nếu như công cụ tìm kiếm không tồn tại thì tôi có làm việc đó không?"

Hãy nghĩ về những điều khiến trang web của bạn độc đáo, có giá trị hoặc hấp dẫn. Làm cho trang web của bạn nổi bật so với những trang khác cùng lĩnh vực.

III. Các công cụ kiểm tra và đánh dấu dữ liệu có cấu trúc

1. Công cụ kiểm tra dữ liệu có cấu trúc

Kiểm tra chi tiết 1 website hợp lệ về dữ liệu có cấu trúc hay không tại đây.

2. Công cụ đánh dấu dữ liệu có cấu trúc thủ công

Chúng ta sẽ sử dụng công cụ thủ công này đối với những trang web hoặc những URL cụ thể mà không thể truy cập vào được quyền quản trị code hệ thống trang web. Hoặc đối với những trang web có rất ít dữ liệu có thể dùng thao tác này.

hình dữ liệu có cấu trúc 14
Ví dụ minh họa về công cụ thủ công

CÁC BƯỚC THỰC HIỆN

  1. Mở Trình trợ giúp đánh dấu dữ liệu có cấu trúc.

  2. Chọn tab Trang web.

  3. Chọn loại trang bạn sắp đánh dấu. Ví dụ: trang xem phim hoặc trang sự kiện. Bạn có thể sử dụng nhiều mục trên một trang, nhưng tất cả các mục nên thuộc cùng một loại (ví dụ: tất cả các mục đều là phim hoặc sự kiện)

  4. Nhập URL của trang hiện tại hoặc HTML của trang cơ bản. Đối với một URL, hãy chắc chắn rằng bất kỳ ai cũng có thể truy cập trang mà không cần đăng nhập. (Bạn có thể kiểm tra quyền truy cập trang bằng cách mở một cửa sổ ẩn danh trong Chrome và cố gắng truy cập trang của bạn. Nếu bạn có thể truy cập trang thì không có vấn đề gì.)

  5. Chọn Bắt đầu gắn thẻ.

  6. Đánh dấu các phần của trang chứa thông tin quan trọng (ví dụ: thời gian bắt đầu trên trang sự kiện), sau đó xác định loại thông tin trong trình đơn thả xuống xuất hiện ("Thời gian bắt đầu").

    • Nếu bạn có chuỗi ngày phức tạp hoặc gặp vấn đề khi gắn thẻ ngày, hãy xem phần Cách nâng cao để gắn thẻ ngày.

    • Nếu bạn cần thêm thông tin chưa hiển thị trong trang của mình, hãy xem phần Thêm dữ liệu bị thiếu.

    • Nếu bạn cần xóa thẻ được tạo bởi Trình trợ giúp đánh dấu dữ liệu có cấu trúc, hãy xem phần Xóa thẻ.

  7. Hãy nhớ cung cấp tất cả thông tin cần thiết cho loại dữ liệu cụ thể của mình. Trong ngăn Mục dữ liệu của tôi, bạn sẽ thấy danh sách tất cả các giá trị có thể có cho mỗi mục, trong đó các giá trị bắt buộc được gắn nhãn. Ví dụ: đối với sự kiện, bạn phải cung cấp tên sự kiện, vị trí và ngày bắt đầu.

  8. Khi bạn đã hoàn tất việc gắn thẻ tất cả dữ liệu thích hợp trên trang, hãy chọn Tạo HTML để tạo mã trang. Tiếp theo, hãy chọn định dạng đầu ra: định dạng mặc định là JSON-LD (được Google ưu tiên), nhưng bạn cũng có thể chọn Microdata. Sau đó, hãy sao chép và dán mã từ cửa sổ đầu ra hoặc chọn Tải xuống. Cách bạn sử dụng mã sẽ tùy thuộc vào định dạng:

    • Đối với JSON-LD: Hãy sao chép và dán mã đã tạo vào phần nội dung của trang hiện tại.

    • Đối với Microdata: Hãy thay thế trang của bạn bằng HTML đã tạo.

  9. Để kiểm tra mã của bạn, hãy sao chép và dán mã đã tạo vào công cụ Kiểm tra kết quả nhiều định dạng. Công cụ này sẽ cho bạn biết về trường bị thiếu mà bạn phải cung cấp để giúp Google hiểu được trang. Đối với một số loại dữ liệu, công cụ có thể cung cấp bản xem trước về cách trang của bạn hiển thị trong Kết quả tìm kiếm của Google.

  10. Có thể mất vài tuần để Google tìm thấy mã trang mới của bạn. Nếu dữ liệu của bạn hoàn chỉnh, chính xác và đã được thu thập thông tin, thì dữ liệu đó có thể xuất hiện dưới dạng kết quả nhiều định dạng. Nếu trang web của bạn không hiển thị dưới dạng kết quả nhiều định dạng, hãy xem các lý do có thể cho việc này.

ĐÁNH DẤU EMAIL

Sau đây là cách đánh dấu email có định dạng HTML:

  1. Mở Trình trợ giúp đánh dấu dữ liệu có cấu trúc.

  2. Chọn tab Email.

  3. Chọn loại thông tin bạn sẽ đánh dấu. Ví dụ: thông tin đặt chỗ xe buýt hoặc đặt mua sản phẩm.

  4. Nhập mã HTML của email của bạn.

  5. Chọn Bắt đầu gắn thẻ.

  6. Đánh dấu các phần của trang chứa thông tin quan trọng (ví dụ: mã đặt vé xe buýt), sau đó chọn loại thông tin trong trình đơn thả xuống xuất hiện ("Mã đặt vé").

    • Nếu bạn có chuỗi ngày phức tạp hoặc gặp vấn đề khi gắn thẻ các ngày, hãy xem phần Cách nâng cao để gắn thẻ ngày.

    • Nếu bạn cần thêm thông tin chưa hiển thị trong email của mình, hãy xem phần Thêm dữ liệu bị thiếu.

    • Nếu bạn cần xóa thẻ được tạo bởi Trình trợ giúp đánh dấu dữ liệu có cấu trúc, hãy xem phần Xóa thẻ.

  7. Hãy nhớ cung cấp tất cả thông tin cần thiết cho loại dữ liệu cụ thể của mình. Trong ngăn Mục dữ liệu của tôi, bạn sẽ thấy danh sách tất cả các giá trị có thể có, trong đó các giá trị bắt buộc được đánh dấu. Nếu bạn không cung cấp tất cả các giá trị bắt buộc, Google sẽ không thể xử lý email

  8. Nếu biểu tượng cảnh báo (Alert Icon) xuất hiện bên cạnh phần tử được gắn thẻ, hãy chọn dữ liệu bên cạnh biểu tượng, xem lại cách gắn thẻ và thực hiện một trong các thao tác sau:

    • Nếu bạn gắn thẻ không đúng cách, hãy chọn dấu X bên cạnh dữ liệu. Sau đó, bạn có thể gắn thẻ lại dữ liệu.

    • Nếu bạn gắn thẻ đúng cách, hãy chọn biểu tượng cảnh báo (Alert Icon) và chọn Xóa cảnh báo.

  9. Khi bạn đã hoàn tất việc gắn thẻ, hãy chọn Tạo HTML để tạo HTML mà bạn nên sử dụng cho email. Định dạng mặc định là JSON-LD, vì Google ưu tiên JSON-LD, nhưng bạn cũng có thể chọn Microdata. Sau đó, hãy chọn Tải xuống hoặc sao chép và dán HTML đã tạo.

    • Đối với JSON-LD: Hãy sao chép và dán mã đã tạo vào phần nội dung email của bạn.

    • Đối với Microdata: Hãy thay thế email của bạn bằng HTML đã tạo.

  10. Để kiểm tra mã của bạn, hãy gửi email đến một tài khoản Gmail hoặc sử dụng trình xác thực giản đồ email.

Lưu và tiếp tục chỉnh sửa trang hoặc email

Để lưu thẻ đánh dấu của bạn ở trạng thái hiện tại, hãy đánh dấu trang trong trình duyệt của bạn. Trình trợ giúp đánh dấu dữ liệu có cấu trúc sẽ lưu trạng thái của bạn trong một tháng, bao gồm tất cả các giá trị đánh dấu.

IV. Đánh dấu dữ liệu

Công cụ đánh dấu dữ liệu là công cụ quản trị trang web hướng dẫn Google về mẫu dữ liệu liên quan đến sự kiện trên trang web của bạn. Bạn chỉ cần sử dụng Công cụ đánh dấu dữ liệu để gắn thẻ các trường dữ liệu trên trang web của mình bằng chuột. Khi đó, Google có thể trình bày dữ liệu của bạn một cách lôi cuốn hơn -- và theo các cách thức mới -- trong kết quả tìm kiếm và trong các sản phẩm khác như Sơ đồ tri thức của Google.

hình dữ liệu có cấu trúc 15

Tóm lại, cấu trúc dữ liệu là cách lưu trữ, tổ chức dữ liệu có thứ tự, có hệ thống để dữ liệu có thể được sử dụng một cách hiệu quả. Có rất nhiều loại cấu trúc dữ liệu khác nhau, tùy thuộc vào sản phẩm, dịch vụ của doanh nghiệp mà hệ thống cấu trúc dữ liệu sẽ được xây dựng theo loại nào. Mong rằng qua những chia sẻ từ bài viết trên website của bạn sẽ có được một hệ thống cấu trúc dữ liệu chất lượng, giúp người dùng có thể dễ dàng tìm kiếm những thông tin, dữ liệu hữu ích nhất. 

Tổng số điểm của bài viết là: 10 trong 2 đánh giá

Xếp hạng: 5 - 2 phiếu bầu
Click để đánh giá bài viết
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây