Với những bạn làm SEO thì cụm từ URL khá là thân thuộc. Tuy nhiên để hiểu rõ URL là gì? URL có cấu trúc và thành phần như thế nào thì không phải ai cũng hiểu rõ? Bài viết dưới đây sẽ giúp bạn đọc những cái nhìn tổng quan nhất về URL!
URL là gì? Những điều cần biết về URL
Các tài nguyên được lưu trữ trên Internet đều sẽ có địa chỉ truy cập riêng hay còn gọi là đường dẫn URL. Vậy URL là gì?
URL là gì?
URL là gì? URL là chữ viết tắt của “Uniform Resource Locator” đây là đường dẫn hay địa chỉ dùng để truy cập vào các trang chứa tài nguyên trên mạng Internet. Hay nói cách khác URL chính là “định vị tài nguyên thống nhất”.
Đường dẫn URL có định dạng là đoạn text có thể khả năng liên kết với các website và đọc thay cho địa IP để máy có thể truy cập vào server. Hay nói một cách thông thường thì URL chính là một địa chỉ web để định vị vị trí của tài nguyên trên web và cơ chế để truy xuất nó.
URL là gì? URL là một loại mã nhận dạng tài nguyên thống nhất. Ví dụ đơn giản, http://www.example.com là một URL nhưng www.example.com thì lại không phải. Giao thức định dạng phổ biến của URL cho các trang web tham chiếu là “http” hoặc một số sử dụng “FTP” để truyền file, “Mailto” cho email, “jdbc” để truy cập cơ sở dữ liệu,…
Về bản chất URL được tạo nên bởi sự kết hợp tên miền với việc sử dụng đường dẫn file, từ đó sẽ tạo ra cấu trúc file và thư mục cụ thể. Cấu trúc này sẽ giúp người dùng tìm đúng máy chủ trên Internet và sử dụng giao thức để truy cập thông tin nhanh chóng.
Nguồn gốc của URL
Khái niệm “URL là gì” được định nghĩa vào năm RFC 1738 và được xác định cấu trúc vào năm 1994 bởi Tim Berners-Lee. Ông là nhà phát minh của World Wide Web và nhóm URL của Lực lượng đặc nhiệm kỹ thuật Internet (IETF).
Định dạng URL có kết hợp hệ thống tên miền được tạo năm 1985 với cú pháp đường dẫn tệp. Các dấu gạch chéo “//” trong đường dẫn được sử dụng để phân tách tên thư mục và tên tệp với nhau.
Bản nháp URL đầu tiên được xây dựng vào năm 1993 và được đề cập đến như bộ định vị tài nguyên “phổ quát”. Tuy nhiên, bản này đã bị bác bỏ một thời gian vào giữa tháng 6 năm 1994 và tháng 10 năm 1994.
Cấu trúc của URL
Sau khi đã hiểu rõ hơn URL là gì thì chúng ta sẽ cùng đi tìm hiểu về cấu trúc cơ bản của URL. URL được chia thành hai thành phần chính, gồm: Scheme (giao thức kết nối) và Authority (nhà cung cấp):
Scheme (giao thức kết nối của URL)
Không phải tất cả URL đều là địa chỉ một trang web mà chỉ có địa chỉ web là URL bởi chúng ta vẫn có thể truy cập Internet bởi các định dạng như FTP hoặc thậm chí MAILTO. Bên cạnh những giao thức này thì URL còn nhiều biểu thị web khác nữa.
Tuy nhiên, về cấu trúc thì đa số URL đều có phần Scheme (các chữ cái theo sau dấu hai chấm) đều thể hiện biểu thị giao thức ứng dụng và máy chủ giao tiếp. Hiện nay có các Scheme phổ biến như:
- Giao thức truyền tải siêu văn bản (http): dùng để xác định hành động của các máy chủ web và trình duyệt để đáp ứng các lệnh để truy cập. Đây là biểu thị URL phổ biến nhất.
- Giao thức http an toàn (https): hoạt động trên một lớp bảo mật giúp việc truy cập, truyền tải thông tin được an toàn hơn bởi các mã hóa.
- Giao thức truyền tập tin (File Transfer Protocol – FTP): được sử dụng để truyền file qua Internet.
Authority (nhà cung cấp)
Phần Authority của một URL, phần này tính từ phía sau hai dấu gạch chéo. Ví dụ, phần Authority gồm phần “www.example.com” hay còn gọi là hostname và có chức năng để lấy địa chỉ IP.
Thành phần của Authority gồm:
- Tên miền cấp cao nhất: dùng để dịch địa chỉ IP thành ngôn ngữ dễ hiểu và đơn giản nhất, tên miền ví dụ như trên là “com” và đây cũng là tên miền cấp cao nhất, tiếp là “.net”, “.gov”, “.vn”…
- Tên miền phụ (Subdomain): trong ví dụ trên thì cả hai phần “www” và “example” là tên miền phụ. Phần “www” là tên miền phụ của tên miền “com” và “www” là tên miền phụ của tên miền “example”.
- Thông tin người dùng: đây là phần chứa tên người dùng và mật khẩu của trang web, ví dụ “//username:password@www.example.com” gồm thông tin người sử dụng.
- Số cổng: đây là thành phần thể hiện số cổng máy tính truy cập vào, ví dụ như: “//www.example.com:8080”.
Thành phần bổ sung của URL
Để hiểu rõ hơn URL là gì thì chúng ta sẽ tìm hiểu tiếp về thành phần tạo nên URL. Thành phần URL gồm: đường dẫn, truy vấn và phân mảnh được thể hiện phía sau phần Authority.
Đường dẫn (path)
Đường dẫn của URL sẽ đưa người dùng đến đúng thư mục hoặc file trên máy chủ. Đường dẫn được bắt đầu bằng dấu gạch chéo “//” và có các dấu gạch chéo giữa các thư mục và thư mục con. Ví dụ: “www.example.com/folder/subfolder/filename.html”.
Trong đường phần, phần cuối cùng là tên file có thể không nhìn thấy trên thanh địa chỉ và chỉ thấy khi mở trang web. Và điều này không có nghĩa là nó không có tên file.
Truy vấn (query)
Truy vấn của URL dùng để xác định những thứ không phải là thành phần của một cấu trúc đường dẫn cố định. Người dùng sẽ nhìn thấy phần truy vấn khi tìm kiếm trang web hoặc phân phối dữ liệu web thông qua biểu mẫu.
Phần truy vấn bắt đầu bằng dấu hỏi chấm và theo sau đường dẫn (hoặc sau tên máy chủ). Ví dụ, truy vấn của trang Amazon là “wi-fi extender”.
Phân mảnh (fragment)
Thành phần cuối cùng của URL là phân mảnh, được bắt đầu bằng một dấu thăng “#”. Phân mảnh được dùng để xác định vị trí chính xác của trang web.
Khi viết code cho một trang web người lập web có thể tạo liên kết neo (anchor) cho văn bản cụ thể như tiêu đề. Phân mảnh sẽ liên kết với neo này để tạo ra mục lục trang web giúp điều hướng dễ dàng hơn.
Hy vọng rằng với những chia sẻ trên sẽ giúp bạn đọc có thể hiểu rõ hơn URL là gì gồm những thành phần nào và cấu trúc ra sao? Từ đó có cái nhìn tổng quát hơn về URL và có thể giải thích cho mọi người xung quanh hiểu URL là gì dễ dàng hơn!