摘要随着Web 2.0的快速发展,网络社区已成为一个重要的披露和传播舆情的方式。意见领袖在网络社区舆论的形成过程中扮演了一个很重要的作用。本文设计并实现了一个意见领袖识别的检测方法,该方法是基于PageRank算法改进的。改进的PageRank算法使用链接的相关性来定义用户之间的链接的权重。第一步是爬取网络社区的数据和预处理数据。然后构建权重矩阵计算用户之间的链接的相关性。最后,利用改进的PageRank算法的排名用户发现意见领袖。实验结果表明,与基线相比,提出的方法可以有效地识别网络社区意见领袖。25440
关键词  网络社区 意见领袖  PageRank算法
Title  Study on identification of opinion leaders in online  communities.                                     
With the rapid development of web 2.0, online communities have become an important way to disclosure and spread the public sentiment. Opinion leaders in online communities play an important role during the formation of public opinion. The paper designs and implements an opinion leader detecting method based on an improved PageRank algorithm. The improved PageRank algorithm uses link relevance to define the weight of the link between users. The first step is crawling data from online communities and preprocessing them. Then construct the weight matrix by calculating link relevance between users. Finally, use the improved PageRank algorithm to rank users and detect opinion leaders. The experimental results show that, compared with the baselines, the proposed method can effectively identify opinion leaders in online communities.
Keywords   online community   opinion leaders   PageRank
1 引言    1
1.1 研究背景与意义    1
1.2 研究的内容与问题    2
2 意见领袖研究现状及方法    4
2.1 国内意见领袖识别的研究现状    4
2.2 国外意见领袖识别的研究现状    5
2.3 意见领袖识别研究方法    6
2.3.1 社会网络分析法    6
2.3.2 基于节点属性的指标法    7
2.3.3 基于PageRank算法的意见领袖识别方法    8
3 基于PageRank思想意见领袖识别的研究    10
3.1 PageRank算法简介    10
3.2 改进的PageRank算法    10
4 实验    12
结  论    15
本文工作总结    15
本文的不足及展望    15
致  谢    16
参考文献    17
1 引言
计算机网络技术的迅猛发展,互联网逐步渗入到人们生活的各个方面,网络成为继报纸、广播、电视之后的又一新兴信息传播载体。通过互联网,信息的传播速度空前加快,传播范围急剧扩大,信息传播的方式也更加多样化。在Web2.0时代,普通的互联网用户不仅是信息的接收者,也是信息的发布者和传播者。互联网使人们可以方便地获取信息和发布信息,人们之间的交流也更加方便和快捷。但与此同时社会中发生的重大事件通过网络迅速扩散,受众广、传播影响力大,甚至远远超过媒体渠道。2012年9月,由于中日"钓鱼岛"争端,国内民众反日情绪先在网络上酝酿,然后在全国50多个城市相继爆发"反日游行",出现打砸抢等不理性行为,造成了巨大的社会影响及社会财产损失,若政府能够在事件在网络上酝酿时期通过一定手段控制引导国民情绪,则此类事件或许能够避免或减轻其造成的影响。因此网络舆情应当引起人们必要的重视。