主办单位: 共青团中央   中国科协   教育部   中国社会科学院   全国学联  

承办单位: 贵州大学     

基本信息

项目名称:
使用遗传规划检测链接作弊
小类:
信息技术
简介:
链接作弊技术通过欺骗手段操作网页间的链接结构图扰乱超链接结构分析算法来增加某些网页的重要性,使其获得比实际应得更高的排序值,从而在搜索引擎结果中排在更加靠前的位置。本文提出根据已有的链接特征使用遗传规划产生新的特征,并用这些新的特征作为分类器的输入来检测链接作弊。另外,多个分类器的集成能取得更好的分类性能,本文又提出使用遗传规划集成多个不同类型的分类器来检测链接作弊。
详细介绍:
链接作弊技术通过欺骗手段操作网页间的链接结构图扰乱超链接结构分析算法来增加某些网页的重要性,使其获得比实际应得更高的排序值,从而在搜索引擎结果中排在更加靠前的位置。这严重降低了搜索结果的质量,检测链接作弊已成为搜索引擎的重要挑战之一。分类方法可以检测出链接作弊。对于分类问题,特征起到很重要的作用,本文提出根据已有的链接特征使用遗传规划产生新的特征,并用这些新的特征作为分类器的输入来检测链接作弊。另外,多个分类器的集成能取得更好的分类性能,本文又提出使用遗传规划集成多个不同类型的分类器来检测链接作弊。在WEBSPAM-UK2006数据集上的实验表明,与原有的链接特征相比,使用遗传规划产生的特征能大大提高链接作弊的分类性能;与经典的集成算法Bagging和AdaBoost相比,使用遗传规划能得到分类性能更好的分类器。

作品专业信息

撰写目的和基本思路

网络上的信息呈爆炸式增长,搜索引擎就成了帮助人们发现其想要信息的重要工具,如Google、Baidu等。在搜索引擎中网页排名非常重要。任何使某些网页获得不应有的高排序值的欺骗行为都被称为网络作弊。网络作弊严重降低了搜索结果的质量,检测网络作弊已成为搜索引擎的重要挑战之一。 我们的工作是使用遗传规划方法识别链接作弊。

科学性、先进性及独特之处

1、使用遗传规划产生新特征检测链接作弊 2、使用遗传规划集成异态分类器检测链接作弊

应用价值和现实意义

应用价值:应用于baidu,google等网络搜索引擎,为其检测出采用不正当手段提高排名的网页。 现实意义:通过检测链接作弊,避免网页排名作假,使用户可以得到想要的有用的信息

学术论文摘要

链接作弊技术通过欺骗手段操作网页间的链接结构图扰乱超链接结构分析算法来增加某些网页的重要性,使其获得比实际应得更高的排序值,从而在搜索引擎结果中排在更加靠前的位置。这严重降低了搜索结果的质量,检测链接作弊已成为搜索引擎的重要挑战之一。分类方法可以检测出链接作弊。对于分类问题,特征起到很重要的作用,本文提出根据已有的链接特征使用遗传规划产生新的特征,并用这些新的特征作为分类器的输入来检测链接作弊。另外,多个分类器的集成能取得更好的分类性能,本文又提出使用遗传规划集成多个不同类型的分类器来检测链接作弊。在WEBSPAM-UK2006数据集上的实验表明,与原有的链接特征相比,使用遗传规划产生的特征能大大提高链接作弊的分类性能;与经典的集成算法Bagging和AdaBoost相比,使用遗传规划能得到分类性能更好的分类器。 关键词:链接作弊;遗传规划;特征产生;分类器集成

获奖情况

暂无

鉴定结果

暂无

参考文献

暂无

同类课题研究水平概述

暂不详
建议反馈 返回顶部