基本信息
- 项目名称:
- 互联网论坛用户识别的建模与数学实验
- 来源:
- 第十二届“挑战杯”省赛作品
- 小类:
- 数理
- 大类:
- 自然科学类学术论文
- 简介:
- 本文针对互联网论坛用户识别问题,根据网上数据内容,进行合理化的简化假设,运用数据挖掘技术, 针对话题用户、活跃用户、言论领袖的不同特点,分别建立相应的模型,运用多种算法。其中最核心的是数据挖掘和处理算法。本文所提出的数据挖掘处理的方法和思想也适用于解决其他类似问题,如应用在搜索引擎中的信息检索、电子商务中的获取潜在客户信息、网站设计中优化管理等方面。
- 详细介绍:
- 本文针对互联网论坛用户识别问题,根据网上数据内容,进行合理化的简化假设,运用数据挖掘技术,分别建立相应的模型。 首先,对言论领袖识别问题,我们以论坛的页面访问量、会员积分、会员威望、精华数四个因子进行两两比较,运用层次分析法建立成对比较矩阵,利用MATLAB软件解出结果。 其次,在话题用户识别问题上,我们采用基于聚类的话题识别算法, 基于平均值的K-Means算法, 基于相似度矩阵的K-Medoids算法等。 然后,对于活跃用户识别,经过活跃函数的分析,结果并采用BP神经网络模型进行了评判和改进。 最后,对于关系圈识别,我们建立共点圆系模型,将用户关联关系描述出来。另外还针对要求提出实例说明和说明数据获取途
作品专业信息
撰写目的和基本思路
- 目的:成功实现企业对论坛内的用户进行有效识别。进而有效解决在互联网互动氛围中衍生的很多商业机会和运营难题。 基本思路:首先,对言论领袖识别问题,建立层次分析模型。 其次,我们采用基于聚类的话题识别算法进行话题用户识别。并对识别结果采用BP神经网络模型进行了评判和改进。 最后,对于关系圈识别,我们建立共点圆系模型,将用户关联关系描述出来。
科学性、先进性及独特之处
- 本文研究基于数据挖掘技术,充分利用互联网数据,对发帖行为进行研究,进行合理的简化假设,从而从实验角度对网络论坛中部分网络论坛形成现象进行剖析,分别建立相应的数学模型。能够很好的解决互联网在运营过程中出现的难题,成功实现企业对论坛内的用户进行有效识别。并据此提出一种定量评价网络论坛用户识别的新指标 .实验表明,该指标可有效用于网络论坛用户的识别,该方法新颖,独特,研究前景广阔。
应用价值和现实意义
- 实用价值:本文在针对话题用户、活跃用户、言论领袖的不同特点,分别建立相应的模型,运用多种算法。同时本文提出的数据挖掘处理方法和思想也适用于解决其他类似问题,如应用在搜索引擎中的信息检索、电子商务中的获取潜在客户信息等方面。 现实意义:本文研究还只是在该领域应用的初步尝试,更本质研究可能还需要引入新的系统科学理论或工具,并需要对大量网络论坛形式与现象进行深入分析,深入研究取得的成果将非常诱人。
学术论文摘要
- 现在的互联网正从信息单向推送模式向互动模式转型,互联网论坛已经成为互联网企业与用户、用户与用户之间重要的互动平台。在这样的互动氛围中衍生出了很多商业机会和运营难题,那么企业怎样才能够对论坛内的用户进行有效识别。 本文针对互联网论坛用户识别问题,根据网上数据内容,进行合理化的简化假设,运用数据挖掘技术,分别建立相应的模型。 首先,对言论领袖识别问题,我们以论坛的页面访问量、会员积分、会员威望、精华数四个因子进行两两比较,运用层次分析法建立成对比较矩阵,利用MATLAB软件解出结果。 其次,在话题用户识别问题上,我们采用基于聚类的话题识别算法, 基于平均值的K-Means算法, 基于相似度矩阵的K-Medoids算法等。 然后,对于活跃用户识别,经过活跃函数的分析,结果并采用BP神经网络模型进行了评判和改进。 最后,对于关系圈识别,我们建立共点圆系模型,将用户关联关系描述出来。另外还针对要求提出实例说明和说明数据获取途径。
获奖情况
- 荣获第三届BiZ-WiZ杯华中地区大学生数学建模邀请赛二等奖。 韶关学院第九届大学生课外学术科技作品竞赛三等奖。 第十一届“挑战杯”广东大学生课外学术科技作品竞赛三等奖
鉴定结果
- 此作品是由申报者完成,所填内容真实可靠。 本文基于数据挖掘技术,利用互联网数据,进行合理的假设,从实验角度对发帖行为等网络论坛现象进行研究。实验表明,该方法新颖,独特,研究前景广阔。
参考文献
- 参考文献 [1]薛冰冰,普杰信,王峰.数据挖掘技术及其在BBS管理中的应用,现代电子技术,2004,(2):55-57 [2]李保利,愈士汶.话题识别与跟踪研究.计算机工程与应用,2003,(17) [3]丁伟莉,赵华,郑德权等.中文Blog热门话题检测与排序技术研究.中国中文信息学会二十五周年学术会议,北京,2006:282-289 [4]姚晓娜.BBS热点话题挖掘与观点分析:(工学硕士学位论文).大连海事大学,2008.6 [5]王尧基,人际关系“圈”的“圆系模型”与关系网-读《特权与优惠的经济学分析》有感,世界经济文汇,1998年第六期 [6]余红,《网络时政论坛舆论领袖研究——以强国社区中日论坛为例》博士学位论文,2007年10月 [7]高功敬,《BBS虚拟社区的人际互动---对“泡网俱乐部江湖论剑”虚拟社区的个案研究》硕士学位论文
同类课题研究水平概述
- 国内同类课题研究水平概述: 国内第一个网络论坛出现于1991年。到1995年,随着计算机及其外设大幅降价,网络论坛逐渐被人们所认识。1997年还处于聊天室的时代,大部分利用网络交流信息的网民流连于各大网站的聊天室中,网络论坛尚未成气候。网络论坛的兴起始1997年的十强赛,当时的四通利方体育沙龙聚集了一批体育迷,畅谈对足球和体的看法。体育沙龙处于鼎盛时期时,全国各地的体育记者编辑都在这寻找第一手信息。随着网络迅猛发展,网民逐渐分化,网络论坛分类细化。目前网络论坛主要分为以下几类:综合性网络论坛、特色网络论坛、专业类网络论坛、商业类网络论坛。综合性网络论坛往往划出了不同的版块与主题,包括情感、旅游、体育、文学、购物等,涵盖生活的方面面,网民可以在不同的版块就自己感兴趣的问题进行交流。目前此类论坛中最关注的有“强国论坛”、“天涯社区”、“西祠胡同”、“猫扑”。 国外同类课题研究水平概述: 国外网络论坛研究综述检索到的43篇国外网络论坛研究文献主要从以下几个方面展开:(1)网络论坛的扩散,包括网络论坛在不同领域和在不同人群的扩散;(2)网络论坛的使用,包括网络论坛采纳动机、使用和满足;(3)网络论坛的规范和管理;(4)网络论坛的议程、议题建构;(5)网络论坛语体特点;(6)网络论坛的社会效果。不同时期研究侧重点不同。从1990年代中后期以来,网络论坛扩散研究、网络论坛使用研究和效果研究一直保持稳定,是研究热点。43篇论文中,扩散研究有11篇,其中8篇为网络论坛在不同领域的扩散,3篇关于网络论坛在不同人群的扩散;网络论坛的社会效果有13篇,使用研究有4篇;网络论坛的规范和管理、网络论坛的议程、议题建构在1990年代曾经是讨论热点,2000年以后研究热度显著下降。2000年以后几乎没有研究单独探讨网络论坛的议程、议题建构。