Tính năng Content Filter được dùng để quản lý, giới hạn, ngăn cấm...người dùng truy cập, tải dữ liệu từ các Website nhằm tăng cường bảo vệ, giảm thiểu rủi ro có thể tác động đến sự vận hành của hệ thống thông tin thông qua môi trường Web.
Bluecoat tích hợp tính năng Filtering Web Content (FWC) trên thiết bị ProxySG với các giải pháp:
· On-box: cơ sở dữ liệu FWC được lưu trữ trên thiết bị và có tốc độ truy suất nhanh. Có nhiều sư chọn lựa cơ sở dữ liệu FWC On-box từ các hãng như: BC Web Filter, IWF, Optenet, Proventia, Surfcontrol, I-Filter, Intersafe, Webwasher hoặc cơ sở dữ liệu tổ chức tự tạo ra.
· Off-box: cơ sở dữ liệu FWC không được lưu trên thiết bị ProxySG. ProxySG cần phải gửi URL đến máy chủ chứa cơ sở dữ liệu FWC để tiến hành xử lý phân loại.
· Hybrid: là sự kết hợp giữa On-box và Off-box theo thời gian thực (Real Time). Trong trường hợp ProxySG không phân loại được URL dựa vào on-box thì thông tin URL ngay lập tức sẽ được gửi đến dịch vụ WebPulse của Bluecoat để phân loại. Dịch vụ WebPulse được gọi là dịch vụ phân loại URL theo thời gian thực (Real Time) hoặc phân loại động (Dynamic), thường được sử dụng để phân loại URL đổi với các Website mới hoặc chưa được nhận biết trước đó.
Ghi chú: WebPulse là dịch vụ thời gian thực do hãng cung cấp. Bluecoat Web Filter(BCWF) là dịch vụ On-box
ProxySG hỗ trợ nhiều nguồn cơ sở dữ liệu FWC
· Local: danh sách các URL tự tạo
· Blue Coat WebRilter: gồm cơ sở dữ liệu On-box và dịch vụ WebPulse
· Internet Watch Foundation (IWF): cơ sở dữ liệu miễn phí do tổ chứ IWF cung cấp
· Các FWC của hãng thứ 3: Proventia, Optenet, Surfcontrol, I-Filter, Intersafe, Washer...
Các nguồn cơ sở dữ liệu có thể được sử dụng kết hợp với nhau, tuy nhiên không thể sử dụng cùng lúc 2 nguồn của hãng thứ 3. (Trong cấu hình thiết bị không cho phép)
Do giới hạn về thiết bị ProxySG, bài viết này tập trung vào tính năng WebFilter trên thiết bị và dịch vụ WebPulse.
· WebFilter là cơ sở dữ liệu FWC On-box trên ProxySG
· WebPulse là một dịch vụ Off-box của Bluecoat nhằm phân loại theo thời gian thực những URL không nằm trong danh sách của On-box .WebPulse là mạng lưới tất cả WebFilter, K9, Proxy Client tạo thành một dịch vụ Cloud. Dựa vào mạng lưới này các URL mới, chưa được phân loại sẽ được đánh giá rồi cập nhật vào cơ sở dữ liệu FWC của Blue Coat WebFilter. Sau đó ProxySG sẽ tiến hành cập nhật định kỳ các cơ sở dữ liệu cho On-box.
Do thời gian đáp ứng của WebPulse trong khoảng 500ms nên ProxySG cung cấp cơ chế vận hành Background Mode hoặc Immediately Mode để lựa chọn.
Immediately Mode: ProxySG gửi thông tin URL cho WebPulse và chờ cho đến khi nhận được kết quả phân loại rồi mới xử lý tiếp yêu cầu của Client
Background Mode: ProxySG gửi thông tin URL cho WebPulse và tiếp tục xử lý yêu cầu của Client theo chính sách thiết lập cho URL chưa phân loại. Sau khi nhận được kết quả từ WebPulse trả về, ProxySG sẽ dựa trên chính sách thiết lập mà ra quyết định đối với URL đó.
Quy trình ProxySG xử lý phân loại URL sử dụng on-box và off-box:
1. Client gửi yêu cầu một trang Web
2. ProxySG kiểm tra thông tin URL yêu cầu với cơ sở dữ liệu On-box để phân loại.
3. Sau khi URL được phân loại, ProxySG sẽ dựa trên chính sách thiết lập để quyết định truy cập URL có được phép hay không
4. Nếu URL được phép, yêu cầu sẽ được chuyển tiếp đến nơi chứa Website
5. Nếu URL bị từ chối, ProxySG sẽ gửi trả về Client một thông điêp từ chối
Quy trình ProxySG xử lý phân loại URL sử dụng on-box và off-box thời gian thực (dịch vụ WebPulse):
1. Client gửi yêu cầu một trang Web
2. ProxySG kiểm tra thông tin URL yêu cầu với cơ sở dữ liệu Bluecoat WebFilter On-box để phân loại.
3. Nếu tra On-box không ra kết quả. ProxySG sẽ gửi đến WebPulse để phân loại. Nếu trong Cache có sẵn kết quả, WebPulse sẽ trả về cho ProxySG ngay lập tức
4. Nếu WebPulse chưa có kết quả, nó sẽ tiến hành truy cập và phân tích Website yêu cầu. Nếu kết quả có độ tin cậy cao, WebPulse sẽ trả về ProxySG ngay lập tức. Nếu kết quả chưa đủ độ tin cậy, WebPulse sẽ trả về phân loại Unknow và ghi nhận URL của Website để phân loại trong tương lai.
5. Sau khi URL được phân loại, ProxySG sẽ dựa trên chính sách thiết lập để quyết định truy cập URL có được phép hay không
6. Nếu URL được phép, yêu cầu sẽ được chuyển tiếp đến nơi chứa Website
7. Nếu URL bị từ chối, ProxySG sẽ gửi trả về Client một thông điêp từ chối
Một số vấn đề cần quan tâm thêm về FWC
· FWC hoạt động trên Layer mấy của mô hình OSI? Cách thức hoạt động trên Layer đó? Dùng WireShark để phân tích gói tin gửi nhận để thấy được chắc thức gửi thông tin URL
· Các URL có thể chứa thông tin cá nhân, tài khoản. Do đó cần xem xét đến nguy cơ rò rỉ thông tin khi gửi nội dung URL đến dịch vụ WebPulse.