越来越多的人利用blog来进行搜索引擎的优化和利用此进行重定向. 这样的搜索引擎优化的SPAM严重影响了搜索引擎的正常排名也严重影响了BSP(博客服务托管)的良性运行. 两个月前曾经对博客动力和博客中国的spam进行了一次比较全面的整理, 但是2个月后的今天, 又有抬头趋势, 不得不再次动手清理, 而这次清理, 将公布这些垃圾源, 就是目标网站, 这些SEO的SPAM的目标网站我将定期公布, 以便各个搜索引擎定期清理. 下面具体介绍清理方法, 如果您对 trustlink比较熟悉, 就可以简单带过. 1. 由点到面. 先从系统内寻找任何一个垃圾词汇, 例如[免费激情小电影], 然后利用搜索引擎进行搜索: search $key site:blogchina.com 得到一系列的SEO网站 2. 从面上进行抓取, 分词: 将这一系列的SEO网站全部抓取后进行分词, 分句, 得到一个扩展的垃圾词汇列表 3. 再次重复 1. 的过程. 将全部的SEO网站的网页得到后进行 URL 的抽取, 得到一系列的垃圾网站的URL的源地址 4. 清理: 凡是有两个以上的垃圾词汇, 将被清理 凡是含有目标网站URL的, 清理 下面公布一些片段, 更多的垃圾网站的列表我已经整理好, 从这里下载. 全部的垃圾词汇, 从这里下载: 垃圾联接网站: 92 http://www.kan126.com/ 87 http://www.555b.com/143.htm 84 http://www.555b.com/666.htm 84 http://freemovie.2288.org/00001\index.htm 垃圾词汇: 48 成人小电影 39 pp成人小电影 28 免费成人电影 27 激情成人小电影 27 免费电影频道 27 免费激情小电影 26 在线小电影 26 免费性电影 另外, 请在本站恶意留言(SEO)也会被加入这个垃圾源列表....
博客中国个人博客系统全面支持 tag, 支持 tag 并不是一件困难的事情, 困难的事情是要将这些 tag 如何处理. tag engine 即 标签搜索引擎是将这些 tag/标签 进行归类整理的搜索引擎, 是一个能够进行智能分类的搜索引擎, 希望借助这个搜索引擎将现有的众多的文章进行整理和分类. 这里我引用以前我写的一段文字: 什么是Tag 兼谈软分类- - 硬分类:就是已往我们发文章的时候通过选择系统现有的固定的分类。 软分类:根据文本或者信息的意义由信息的组织者为信息指定一个或者多个“标签”。 Tag(中文叫做“标签”) 是一种新的组织和管理在线信息的方式。它不同于传统的、针对文件本身的关键字检索,而是一种模糊化、智能化的分类。例如我可以为本文打上如下的标签: Tag、标签、分类、博客 标签的增加有信息的组织者自主添加,带有很强的个性化因素. 因此在个性中寻找共性将是一个Tag engine 区别于其它搜索引擎的一个特征....