Link URL là một trong những thành phần tiền đề để có thể test được một website. Có được những hiểu biết nhất định về link URL sẽ giúp tester đưa ra được những quan điểm test đúng đắn và phù hợp khi tiến hành test web. Bài viết dưới đây sẽ cung cấp các thông tin cơ bản nhất về URL và một vài cách đơn giản để nhận biết một link ULR “sạch”.
1, URL là gì?
URL đơn giản là một đường dẫn liên kết đến website, tham chiếu tới các tài nguyên trên internet. Để sử dụng các tài nguyên này cần có những đường dẫn chính xác và URL đảm nhận công việc này. URL là viết tắt của thuật ngữ Uniform Resource Locator, dùng để thay thế cho các địa chỉ IP, giúp máy tính có thể giao tiếp với máy chủ, hệ thống server. Các URL giúp xác định cấu trúc của file trên từng website nhất định.
2, Mục đích sử dụng của URL:
URL dùng để định vị địa chỉ site trên Internet, có thể là địa chỉ của một website, một webpage, một wap, wappage hoặc một bài đăng cụ thể nào đó trên Website.
3, Thành phần cấu trúc của URL:
Các phần tương ứng trên ảnh bao gồm:
1.Hypertext Transfer Protocol : URL scheme hay còn được gọi là tên của giao thức ( http://, https://, ftp://). Ngoài ra, nó còn có các tên khác như New, Mailto, … giao thức ứng dụng phổ biến nhất được sử dụng trên các trang web trên toàn thế giới.
2.Tên miền của trang web.
3.Thư mục con của tập tin.
4.Tên tập tin của tài nguyên yêu cầu
Có ba yếu tố của một URL mà chúng ta có thể tùy chỉnh: tên miền, các thư mục con và các tên tập tin.
3.1 Tên miền
Tên miền là địa chỉ trang web được đăng ký của cá nhân, doanh nghiệp dùng để thiết lập một website trên mạng internet. Tên miền là một phần của một URL và dễ nhìn thấy nhất, thường được truyền đạt trong email, trên tờ rơi, thẻ kinh doanh, vv
3.2 Phần mở rộng tên miền
Thống kê cho thấy 87% có một phần mở rộng tên miền com., 6% là tên miền org. Và 3% một mạng lưới khác.
3.3 Thư mục con Khi chúng ta nói về các thư mục hoặc thư mục con, chúng ta có thể nhìn vào chiều sâu và chiều rộng của các thư mục này. a, Chiều sâu cấp độ thư mục Chiều sâu là số thư mục con tìm thấy trong một tên miền.
Ví dụ: http://dantri.com.vn/giao-duc-khuyen-hoc/guong-sang.htm
Trong ví dụ này mục “giao-duc-khuyen-hoc” là cấu trúc lớp thư mục sâu cấp độ 1, “Gương sáng” có cấu trúc lớp thư mục sâu cấp độ 2. b, Chiều rộng Chiều rộng đề cập đến số lượng các trang trong một thể loại.
Trong ảnh trên độ rộng của thể loại tin Giáo dục là 4 trang gồm: Tin tuyển sinh, Khuyến học, Gương sáng, Du học. Nhận định được độ rộng của thư mục qua URL giúp tester tránh được việc lack các màn hình cùng thể loại. c, Phân biệt thư mục con hoặc các tên miền phụ Sự khác biệt giữa một tên miền phụ và một thư mục con: Ví dụ về tên miền phụ:
- bản đồ (maps.google.com)
- tin tức (news.google.com) -> Tên miền phụ thường đứng trước tên miền chính. Ví dụ về thư mục con: http://dantri.com.vn/xahoi -> Thư mục con thường đứng sau tên miền.
4, Điều kiện thiết lập một URL:
- URL phải ít hơn 2048 ký tự để được hiển thị trên trình duyệt Chrom, Cốc cốc, Firefox, IE,…v.v
- Sử dụng ” / ” để ngăn cách thư mục, dấu ” – ” giữa các từ.
- Không nên dùng dấu “_” hay dấu cách
- Không nên dùng tiếng việt có dấu như: â, ê, ư…
5, Định dạng URL chuẩn SEO:
Ngày nay với mục tiêu nâng cao thứ hạng của website trong bộ máy tìm kiếm Google việc tối ưu hóa đường dẫn URL sao cho thân thiện được chú trọng. URL phải rõ ràng và mô tả đúng sản phẩm, dịch vụ. Các ký tự trong URL phải cách nhau bằng dấu “-” cho dịch vụ đó. Trong SEO, URL có thể đóng vai trò là một Anchor Text của Liên kết. Bởi vậy, một URL chuẩn SEO phải luôn chứa từ khóa, ngắn gọn, có ý nghĩa, dễ copy, dễ nhớ, không chứa những từ không cần thiết, không chứa các ký tự đặc biệt, url không có dấu,…v.v
6, Một số lưu ý thêm khi tối ưu URL chuẩn SEO
- Phải chứa từ khóa chính và tốt nhất nên nằm ngay đầu URL
- URL của website phải đảm bảo ngắn gọn và mang tính miêu tả cao.
- URL của 1 page riêng cũng cần mang tính miêu tả và không nên quá dài, để người dùng chỉ cần nhìn vào URL sẽ biết page chứa nội dung gì.hiểu hơn cấu trúc URL và hiểu chính xác các từ khóa bắt đầu và kết thúc thế nào.
- Giữ nguyên cấu trúc URL: Không nên thay đổi cấu trúc URL khi google đã index liên kết đó.
- Giới hạn ký tự trong URL: URL của bạn chỉ nên gồm khoảng 10 từ hoặc 96 ký tự, ký tự, quá dài thì SE sẽ bị giới hạn.
- Sử dụng URL dạng tĩnh và không nên có kí tự lạ trong URL, Google sẽ không nhận diện được liên kết đó của bạn.
7, URL tĩnh và URL động
URL động thường có thể được xác định bằng cách tìm kiếm ký tự đặc biệt, chẳng hạn như dấu hỏi … Các ký tự xác định một số thông số, thường là ngôn ngữ hoặc ID người dùng. Nhưng điều này có nghĩa là cùng một nội dung có thể có URL khác nhau. VD: http://www.webtretho.com/forums/thread.php?threadid=12345&sort=date Một URL tĩnh, là một URL không thay đổi , và không có các chuỗi, biến. URL tĩnh thường được xếp hạng tốt hơn trong công cụ tìm kiếm , và được lập chỉ mục nhanh hơn so với các URL động , nếu các URL động hầu như là giống nhau thì URL tĩnh dễ dàng hơn cho người dùng xem và hiểu trang web của bạn nói về những gì . Nếu họ thấy một URL trong một truy vấn cụ tìm kiếm phù hợp với các tiêu đề và mô tả, họ có nhiều khả năng nhấp vào URL đó hơn. VD: http://webtretho.com/tin-tuc-b2.html
8, Cách nhận biết 1 link URL có an toàn hay không
Ngày nay các link “độc hại” xuất hiện ngày càng nhiều và được chia sẻ thông qua các mạng xã hội với một tốc độ “chóng mặt”. Chỉ cần click vào một đường link “độc hại” nào đó có thể mang lại những nguy hiểm tiềm ẩn cho bạn. Lời khuyên cho bạn là trước khi click vào một đường link nào đó, bạn cần chắc chắn rằng đường link đó là link an toàn và không tiềm ẩn malware. Tuy nhiên, vấn đề nằm ở chỗ làm sao để biết link đó có an toàn hay không? Chúng ta cần làm các công việc sau:
8.1 Kiểm tra thuộc tính target của link
Step 1: kích chuột phải vào link để copy thuộc tính target của 1 link. Lấy được URL của trang web mà bạn muốn kiểm tra. Step 2: Copy link address (nếu dùng trình duyệt Google Chrome), hoặc Copy link location (trình duyệt Firefox) hoặc Copy shortcut (nếu sử dụng trình duyệt Internet Explorer). Thuộc tính target của link sẽ được sao chép trên bộ nhớ máy tính Step 3: Paste vào các tool kiểm tra link dưới đây để kiểm tra.
8.2. Một vài tool kiểm tra link URL
8.2.1. Norton Safe Web
Norton Safe Web cung cấp cho bạn một cái nhìn tổng quan để có thể dễ dàng nhận biết được link có an toàn hay không? Cung cấp một bảng tóm tắt các “mối đe dọa” mà chương trình phát hiện trên đường link của bạn bằng cách đề cập thông qua các yếu tố như Computer Threats, Identify Threats và Annoynce.
8.2.2. SiteAdvisor (by McAfee)
- click vào nút Download anything on your computer McAfee cung cấp cho bạn danh sách các link out-bound có chứa link của bạn.
8.2.3. Browser Defender Browser Defender giúp bạn nhận biết link có an toàn hay không một cách nhanh chóng.
8.2.4. URL Void URL Void là chương trình quét web uy tín giúp phân tích một địa chỉ web bằng nhiều engine (khoảng 30) và danh sách đen các tên miền, như Google SafeBrowsing, Norton SafeWeb và MyWOT để phát hiện bất kỳ website tiềm ẩn nguy hiểm nào. Người dùng phải chèn thủ công một đường link và URLVoid sẽ liệt kê trạng thái phát hiện tích cực hay tiêu cực bằng những egine được sử dụng. Người dùng có thể kiểm tra danh sách đe dọa (threat log) để biết chi tiết.
8.2.5. UnMask Parasites Unmask Parasites là một công cụ bảo mật đơn giản để quét một site và cho bạn biết nếu site mang những link spam, mã độc hay chuyển hướng liên kết. Thường thì các website bị xâm nhập và mã độc được chèn mà quản trị viên không hề biết. Unmask Parasites tải về đường link (trang web) được cung cấp, phân tích mã HTML, đặc biệt là các link ngoài, iframe và JavaScript. Đây thực sự là giải pháp nhanh chóng và dễ thực hiện.
8.2.6. Dr.Web Anti-Virus Link Checker
Dr.Web Anti-Virus Link Checker là một add-on cho cả Chrome, Firefox, Opera và IE. Tiện ích sử dụng engine diệt virus trực tuyến Dr.Web để quét tìm nội dung độc hại trên một link tải về. Tiện ích cũng tự động quét nội dung tải về và quét nhanh trên tất cả các link mạng xã hội Facebook, Vk.com, Google+. Dịch vụ này xuất hiện từ năm 2003, và được cập nhật định kỳ.
8.2.7. VirusTotal
VirusTotal cung cấp hai công cụ cho người dùng. Một công cụ đăng tải để quét file nghi vấn và một chương trình quét link kiểm tra site trước khi nhấn vào. VirusTotal cũng sử dụng một chuỗi các engine diệt virus, quét website, các công cụ phân tích file và URL trả về những báo cáo chi tiết. Chẳng hạn như, một số engine sẽ hiển thị thêm thông báo rất rõ ràng về việc URL có nằm trong một mạng botnet nào đó hay không. Các công cụ được cập nhật sau mỗi 15 phút.
Kết luận
Trên đây là những thông tin cơ bản về link URL của một website bất kỳ và các cách để kiểm tra link an toàn. Hi vọng sẽ giúp ích cho mọi người khi sử dụng internet nói chung và khi test web nói riêng. Tài liệu tham khảo: https://quantrimang.com/8-cach-kiem-tra-link-an-toan-89576