Nếu bạn thực sự tinh mắt khi nhìn vào các địa chỉ web trong thanh trên cùng của trình duyệt, có thể bạn sẽ nhận thấy phần đầu tiên của bất kỳ địa chỉ trang web nào, các chữ cái “HTTP” hoặc “HTTPS”. Tuy nhiên, HTTP là gì và nó hoạt động như thế nào? Chúng ta hãy xem chất keo giữ các trang web lại với nhau.
HTTP: Phiên bản ngắn
HTTP là một từ viết tắt và là viết tắt của hypertmở rộng tnhượng lại Protocol. Hãy chia nhỏ nó ra một chút, bắt đầu với phần “giao thức”. Trong công nghệ, một giao thức là tập hợp các quy tắc mà các máy cần tuân thủ để “nói chuyện” với nhau. Ví dụ: các giao thức VPN xác định cách VPN tương tác với máy chủ. HTTP ít cụ thể hơn thế và thay vào đó, nó đặt ra các quy tắc về cách thức hoạt động của internet.
Đây không phải là cường điệu. Không có HTTP, sẽ không có giao tiếp trên toàn thế giới web. Điều này là do HTTP chi phối việc giao tiếp giữa máy chủ web và máy khách web—phần “chuyển giao”. Máy chủ web là nơi bạn kết nối để có thể xem các trang web; ví dụ: bạn hiện đang liên hệ với máy chủ web của How-to Geek để bạn có thể đọc bài viết này.
Để truy cập một máy chủ web, bạn cần một máy khách web. Hầu hết thời gian, ứng dụng khách này là trình duyệt của bạn, nhưng nó thực sự có thể là bất kỳ loại ứng dụng nào. Ví dụ: nếu bạn nhấp qua bài viết này từ ứng dụng Facebook dành cho thiết bị di động thì trình duyệt trong ứng dụng của Facebook là ứng dụng khách web của bạn. Sự tương tác giữa máy khách và máy chủ gần như là những gì mà toàn bộ Internet hiểu được và HTTP là một phần không thể thiếu trong đó.
Phần cuối cùng của từ viết tắt HTTP là phần “siêu văn bản”, là loại tệp được truyền, hầu như luôn thông qua tệp HTML. Các loại tệp này là khối xây dựng của web vì chúng không chỉ hiển thị ngôn ngữ mà còn có thể được liên kết với nhau. Điều này khác với các loại tệp bạn có trên thiết bị của mình, thường không thể làm được điều đó.
Tóm tắt cách thức hoạt động của HTTP
HTTP là một giao thức chạy trên cái gọi là lớp ứng dụng của internet, phía trên lớp internet, nơi các chi tiết thực sự của web giống như địa chỉ IP. Lớp ứng dụng là nơi bạn sẽ tìm thấy các trình duyệt và ứng dụng mà bạn sử dụng hàng ngày và HTTP là một phần trong số đó.
Cách thức hoạt động là trình duyệt của bạn, ứng dụng khách, sẽ gửi yêu cầu HTTP qua mạng, yêu cầu này được xử lý bởi máy chủ của trang web bạn muốn truy cập. Sau đó, trang web sẽ gửi lại một phản hồi HTTP, đó là—nếu mọi thứ suôn sẻ—trang bạn muốn xem. Trình duyệt sau đó hiển thị phản hồi.
Phá vỡ các yêu cầu HTTP
Tất nhiên, có một chút nhiều hơn thế. Một yêu cầu HTTP thực sự được tạo thành từ nhiều phần, mỗi phần đóng vai trò quan trọng trong cách trang web được hiển thị. Trong số các phần quan trọng nhất của bất kỳ yêu cầu nào là phương thức HTTP, tiêu đề yêu cầu và nội dung yêu cầu.
Phương thức này thường là hành động mà HTTP được yêu cầu thực hiện, do đó, truy xuất hoặc cung cấp thông tin (tương ứng là các lệnh “GET” và “POST”, mặc dù có rất nhiều lệnh khác). Các tiêu đề yêu cầu HTML khó giải thích hơn một chút, nhưng hãy coi chúng như những chiếc phong bì: mỗi cái chứa địa chỉ của nơi nó sẽ đến, địa chỉ của người gửi, cộng với một loạt thông tin khác, chẳng hạn như loại hộp thư (trình duyệt) và cả thông tin về mã hóa.
Phần thân HTML “lấp đầy” phong bì với thông tin như thông tin đăng nhập hoặc bất kỳ thứ gì khác mà máy chủ cần biết để hiển thị trang; đôi khi nó trống và phong bì, tiêu đề yêu cầu, là đủ.
Phản hồi HTTP
Với yêu cầu nhận được, máy chủ web hiện bắt đầu hoạt động dựa trên phản hồi của nó, phản hồi này cũng bao gồm ba phần: mã trạng thái HTTP, tiêu đề phản hồi và nội dung phản hồi. Phần đầu và phần thân giống như phần tương ứng của chúng trong các yêu cầu, ngoại trừ phần thân sẽ chứa nhiều thông tin quay trở lại, giống như các tệp chứa thông tin để hiển thị trang web.
Các mã trạng thái là một điểm nhấn thú vị, vì có thể tất cả chúng ta đều đã gặp chúng mà không nhận ra chúng là gì. Chúng là ba chữ số có thể bắt đầu bằng các số từ 1 đến 5. Mỗi chuỗi tượng trưng cho một thứ gì đó. Vì vậy, bất kỳ mã gồm ba chữ số nào bắt đầu bằng 2 có nghĩa là thành công (trang được hiển thị mà không gặp sự cố), trong khi mã bắt đầu bằng 4 có nghĩa là có lỗi, chẳng hạn như mã 404: không tìm thấy trang khét tiếng.
Hệ thống gọi và phản hồi này là cơ sở cho mọi thứ chúng tôi làm trên internet. Mặc dù nó phức tạp hơn những gì chúng tôi mô tả ở trên, nhưng điều này bao gồm những điều cơ bản. Tất nhiên, có một vấn đề là làm thế nào tất cả các thông tin liên lạc này được giữ an toàn.
Bảo mật HTTP
Đây là lúc chúng tôi gặp sự cố với HTTP: không có bất kỳ thông tin nào được mã hóa hoặc bảo vệ theo bất kỳ cách nào. Đó hoàn toàn là yêu cầu và nhận, không có bước bảo mật nào được thêm vào. Bất kỳ ai có thể chặn tin nhắn đều có thể xem nội dung đang được gửi, bao gồm những thông tin như số thẻ tín dụng hoặc thông tin tài khoản.
Theo một cách nào đó, nó giống như khi bạn nói chuyện với một người hàng xóm qua hàng rào ngăn cách các khu nhà của bạn: mỗi người ở trong khu vực của riêng mình, nhưng nếu ai đó đứng đủ gần, họ có thể nghe thấy từng lời bạn nói.
Như bạn có thể tưởng tượng, đây là tin cực kỳ xấu đối với hầu hết người dùng internet và là tin cực kỳ tốt cho những người săn lùng chúng. Để khắc phục điều này, một loại HTTP mới đã được triển khai, được gọi là HTTPS, trong đó chữ “S” cuối cùng là viết tắt của “secure”. Loại HTTP này mã hóa thông tin, khiến mọi người khó nghe hơn rất nhiều, có thể nói như vậy.
Hiện tại, việc nhìn thấy cái được gọi là HTTP “thuần túy” ở bất cứ đâu đang ngày càng trở nên ít phổ biến hơn vì trong vài năm qua, hầu hết mọi trang web đáng được đề cập đều đã chuyển sang HTTPS. Có một số người—vì những lý do khác nhau tùy thuộc vào chủ sở hữu trang web—đã chống lại sự thay đổi này. Bạn có thể muốn tránh xa chúng hoặc ít nhất là sử dụng VPN để bảo vệ mọi thông tin nhạy cảm.
Điều đó nói rằng, mặc dù HTTPS chắc chắn là một bản nâng cấp quan trọng, nhưng đó chỉ là một bản nâng cấp. HTTP đã cung cấp năng lượng cho internet kể từ khi nó bắt đầu và chúng tôi nghi ngờ rằng điều đó sẽ sớm thay đổi.