互联网骨干的主要任务是在保证可连通性的同时,尽可能快速地提供数据交换通道,这就要求网络结构和配置尽可能简单。属于网络高层应用的内容过滤本来不应该在互联网骨干上部署实施,但是,出于国家安全的需要,对一些网站还是需要进行屏蔽。电信运营商在互联网骨干上使用的内容过滤技术主要是DNS过滤和IP地址过滤。互联网骨干
DNS服务器拒绝解析指定URL列表,通过ACL拒绝到指定IP地址的连接。这些手段会轻微地影响互联网性能,但是技术在现实中还是可以实现和接受的。
另外,现在中国有些地区的宽带运营商还提供“
绿色上网”服务,为申请此项服务的用户提供内容过滤的功能,以保护青少年和儿童。这些“绿色上网”服务的原理同以上的内容过滤原理是一样的,不同之处在于每个用户的可定制化功能。还有些运营商采取了“投诉”的方式来维护更新不良内容网址,通过奖励上网费用和时间的方式来鼓励宽带用户投诉不良网络,同样这也是一个很好的思路和现实的做法。
实际上,每个月都有超过100万个新注册的网站出现在互联网上,也就是说互联网是变化的,这种变化是永不停息的。我们不可能把所有的网站和网页都进行归类并放在数据库当中,这样的话,这个数据库的规模将会远远超过实际应用中硬件平台性能所能承受的最大限制。那么最好的办法还是挑选一部分网站放在数据库当中,这些网站至少具有两个特征:访问量比较大和包含不良内容。对于那些访问量不大,或者内容“不咸不淡”的网站,大可以忽略不计。
在变化之外,每个企业或者每个人的浏览习惯都是不一样的,也可能有些人特别喜欢浏览一些冷门的网站,这就涉及一个个性化的问题。为了对这些访问进行控制和过滤,内容过滤产品本身还要具有一定的智能,能够自动分析归类这些网站的内容,并对用户的访问进行过滤。这样的分析结果应该保留在访问者的本地内容过滤设备上,而不是上传同步到所有的用户。这样的话,所有用户就有一个集中的公共数据库,包含了绝大部分热门网站,每个用户还有一个分散的私人数据库,包含了自己的浏览分析归类数据。