|
 
- UID
- 2
- 帖子
- 926
- 精华
- 5
- 积分
- 1486
- 威望
- 1486 度
- 论坛币
- 2323 元
- 阅读权限
- 10
- 在线时间
- 211 小时
- 注册时间
- 2007-1-18
- 最后登录
- 2008-12-25
|
1楼
发表于 2007-4-3 14:59
| 只看该作者
防采集设想。如果可以完成将彻底解决防采集
本人是菜鸟,最进这段时间想开设一个文章类型的网站。但是现在网络世界已经被采集软件覆盖
所以我选择了dedecms系统,虽然这套系统的采集功能很完善,而且也是开原的。但是做文章站。采集别人的,同时也将会被别人采集
这又是一个很头痛的事情。其实网络中。有了采集软件。让大家更快的增加资源。但是一方面又怕别人采集。有利有必啊。
所以这几天里。我研究了一下防采集技术。希望可以彻底的防采集。可是网络上好多文章都没有一个完善的办法解决防采集。
网络上通常使用的办法。图片水印。代码加密。这些。但是这些方法大大降低了。搜索引擎的收录。和降低了网站的访问速度。
下面是本人经过这些时间的研究。和自己的设想。理论上可以实现。但因为本人很菜。所以无法实现,所以希望高手看到本文章。如果对您
有帮助。希望高手把此功能实现吧。
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
首先我们先分析采集软件的工作原理:
其实说白了很简单。就是把实现设置好的网页中的唯一代码中间部分,采集下来。因为现在网站基本都属于一种固定模式生成
所以也就有了规则性。所谓的设置采集规则。也就是设置需要内容两段的唯一性代码。
如果防采集:
我们竟然已经了解了采集软件,其实就是事先人设置好的规则按照这个规则去采集。只要我们网站的代码是不规则型的。让采集器无法查找这个规则
那也就做到了防采集
具体功能:
大家现在普遍喜欢使用 生成HTML的网站程序,HTML网站有两个优点。容易被搜索引擎收入 访问速度也比较快,我们防采集也就是利用这种生成HTML的
特性,其实生成HTML,也就是根据实现设置好的代码规则去生成,如果我们的后台设置有 两种甚至更多的规则。。也就是说文章与文章之间有标签不同。
比如第一个规则文章名称是 <a>文章名称</a> 那我们第二个规则是 <b>文章名称</b> 这样就有了两个不同的规则。当我们生成HTML的时候。可以选择。
使用两个一规则 在(使用一个二规则 还有一个规则)选择是 ( 使用一个一规则 使用两个二规则 )这样在我们每次生成的时候都选择不同的模式去生成HTML。
采集者也就无法找到你网站的规律 其实说白了 这样的定义规则去生成HTML 连站长都不知道他到底是什么规则。采集者又怎么能找到规律呢。其实这样子也比较麻烦。如果可以实现随即规则生成 那就更完美了。
这种防采集模式的优点:
不用担心无法搜索引擎难收录。不用担心访问速度慢。更不用担心每次生成的是不同规则。网民觉得不喜欢。因为所谓的不同规则。只是网站内的标签换一下。在用户实际浏览中。他们是没有任何区别的。最主要的一点。他是防采集。 |
|