Những lỗi căn bản trong xây dựng và quản trị website (Phần 4): Lỗi lập trình liên quan đến URL

Thứ năm - 02/11/2017 03:00
Đường link kém thân thiện (URL Not Friendly) dẫn đến S.E.O kém là lỗi thường gặp nhất trong các lỗi lập trình liên quan đến URL. Các lỗi này thường gặp ở các website của các cơ quan nhà nước. Trong khi đó nhóm website thương mại điện tử, bán hàng... thì hay gặp các lỗi liên quan đến việc cho sửa đổi URL (vì quá dễ dãi trong việc làm cho đường link trở nên thân thiện mà không kiểm tra các quy tắc an toàn.

1. Đường link kém thân thiện (URL Not Friendly) dẫn đến S.E.O kém.

Một trong những ví dụ kinh điển về việc đường link kém thân thiện là khi nhìn địa chỉ website, bạn hoàn toàn bó tay không hiểu nó "đi đâu về đâu".

Dễ thấy lỗi này nhất ở các URL của các website của cơ quan nhà nước,các đơn vị này là những đơn vị chậm đổi mới công nghệ nhất quả đất (cũng dễ hiểu thôi, vì họ không bán hàng, không cần làm SEO, Marketing cao như giới kinh doanh, cho nên cũng chả quan tâm. Nhưng xét cho cùng, website là để truyền thông, hiệu quả truyền thông kém tức là website không đạt yêu cầu)

 

1.1. Đường link "xấu", chưa nhiều ký tự mã hóa khó hiểu.

Ví dụ website của Sở giáo dục và đào tạo Hải Phòng:
http://haiphong.edu.vn/default.aspx?sname=SoGDHP&sid=4&pageid=468
http://haiphong.edu.vn/pgdqdoson/383/8045/12421/gioi-thieu-chung/

Trường hợp dưới đây dù đã cố làm URL thân thiện hơn nhưng thực sự là vẫn tệ hại còn hơn cả cấu trúc link ở trên.

Đây là URL của bài viết "Cảnh báo tàu, thuyền khi lưu thông qua các cầu đang xây dựng" đăng trên website của Cổng thông tin điện tử - Cục Đường thủy nội địa Việt Nam: http://viwa.gov.vn/tin-moi/-/asset_publisher/CuGyxvPudaOh/content/canh-bao-tau-thuyen-khi-luu-thong-qua-cac-cau-dang-xay-dung
=> Website này vẫn dính lỗi do "đường link chưa thân thiện", mặc dù lập trình viên đã cố gắng "làm đẹp" đường link bằng cách tạo thêm alias cho bản tin, tuy nhiên vẫn chưa đạt yêu cầu!

Phần văn bản pháp quy của site này chưa được để ý thì nó hoàn toàn rối mù luôn: http://viwa.gov.vn/van-ban-phap-quy?p_p_id=4_WAR_portalvbpqportlet&p_p_lifecycle=0&p_p_state=normal&p_p_mode=view&p_p_col_id=column-1&p_p_col_pos=1&p_p_col_count=2&_4_WAR_portalvbpqportlet_id=1608&_4_WAR_portalvbpqportlet_mvcPath=%2Fhtml%2Fportlet%2Flist%2Fview_detail.jsp

 

1.2. Không khử được dấu hoặc việc khử dấu làm mất các ký dự có dấu.

1.3. Cấu trúc link rối rắm, không logic.

Chính cổng thông tin điện tử chính phủ bị dính lỗi này: http://www.gov.vn/portal/page/portal/chinhphu/GioiThieu/giaidoanIII
 

1.4. Lạm dụng trong việc làm URL friendly hoặc làm cẩu thả.

Ví dụ điển hình là trường hợp của website hiện tại của Hiệp hội internet: link chuyên mục và link bài viết được làm... ngang cấp. Không thể nhìn vào link để biết đau là bài viết, đâu là chuyên mục:
http://via.org.vn/KINH-DOANH-ONLINE-STEP-BY-STEP

http://via.org.vn/Su-Kien
 

2. Chấp nhận các đường link giả

Nguyên nhân dẫn đến lỗi này là website đã không loại bỏ các đường link không tồn tại mà vẫn trả dữ liệu về hợp lệ. Việc này gây nhiều hệ lụy, đặc biệt dễ gây hiểu lầm do đường link bị thay đổi tạo thành những ý nghĩa xấu. Ví dụ:

http://via.org.vn/hot-girl-midu trong đó "hot-girl-midu" là đoạn được thêm vào!
http://petrotimes.vn/kinh-te?phim-xxx trong đó "?phim-xxx" là đoạn được thêm vào!

Đã từng có những trường hợp các facebooker sửa các đường link sau đó thay chú thích khi share trên facebook để là trò cười từ chính các bản tin hết sức bình thường từ các báo điện tử hồi năm 2013-2014. Sau đó một loạt báo đã phải sửa lỗi này. Tuy nhiên một số báo nhỏ vẫn chưa kịp sửa chữa và cập nhật cho hệ thống của mình.

Hiện tại các hệ thống CMS/ Portal hiện đại như NukeViet CMS, NukeViet Portal, NukeViet eGovernment... đều đã xử lý triệt để các vấn đề ở trên. Thậm chí một số mã nguồn mở còn cho phép thay đổi đường link một cách linh hoạt phục vụ các nhu cầu sử dụng khác nhau.

 

3. Sinh ra quá nhiều đường link cho một bài viết

Nguyên nhân cho việc này có thể là do kỹ thuật xử lý đường link thân thiện đã tạo ra một số các đường link khác nhau: link cho người sử dụng, link phục vụ việc quản lý và xử lý thông tin của hệ thống. Một nguyên nhân thường gặp trong việc xử lý bản tin nhiều chuyên mục có thể tạo ra nhiều đường link theo chuyên mục khác nhau. Cuối cùng, có thể do chính việc chấp nhận các đường link giả (như chỉ ra ở trên).

Những lỗi này có thể khiến Google phạt website của bạn vì "tội" trùng lặp nội dung. Và để tránh hiểu nhầm, có thể xử lý bằng kỹ thuật
khai báo link chính (canonical) của bài viết. Xem thêm tại bài "Những lỗi căn bản trong xây dựng và quản trị website (Phần 2): Điều hướng tên miền sai" để có thêm thông tin!

Theo bạn, về kỹ thuật xử lý URL còn những vấn đề gì nữa. Hãy bình luận và thể hiện quan điểm của mình xuống phần comment  nhé!
Lưu ý: Bài viết chỉ mang tính minh họa và thể hiện quan điểm chuyên môn của tác giả, các lỗi được kiểm tra của các website được lấy làm ví dụ là ở thời điểm tháng 5/2017 và có thể đã bị thay đổi. Nếu quý vị không muốn website của mình có mặt trong danh sách ví dụ minh họa, xin vui lòng email về admin@nukeviet.vn để chúng tôi gỡ bỏ khỏi bài viết!
 
 Từ khóa: Canonical

Tổng số điểm của bài viết là: 10 trong 2 đánh giá

Xếp hạng: 5 - 2 phiếu bầu
Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin cũ hơn

Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây