毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

无监督的互联网评论挖掘与情感分析技术

时间:2019-10-06 15:10来源:毕业论文
基于字典的无监督情感分析方法,主要运用了单项单词得分、否定、加强、非现实阻碍等一系列机制,经过层层处理分析出评论背后的情感走向。通过对论文的研究和学习并进行尝试,

摘要在互联网产品飞速发展的今天,互联网早已发展为人人皆可参与的社会化媒体。这种发展趋势使得互联网上的电影、音乐以及其他的商品评论给其他用户提供了很好的参考,然而同时也导致了互联网评论数据的爆炸式增长。而对商品评论进行有效快速的情感分析,可以获取到有用的信息。本文采用了基于字典的无监督情感分析方法,主要运用了单项单词得分、否定、加强、非现实阻碍等一系列机制,经过层层处理分析出评论背后的情感走向。通过对论文的研究和学习并进行尝试,达到对基于字典的方法的学习,对无监督情感分析方法深层次的了解。本文开始对论文进行主要原理方法的介绍,然后详细描述了自己程序的施行过程。最后在Epinions1语料库上对论文算法的试验和评估得到了较高的分类准确率。18803
关键词  商品评论  基于字典  情感分析   无监督
毕业设计说明书(毕业论文)外文摘要
Title   An Unsupervised Internet product reviews mining And analysis technique                               
Abstract
With the rapid development of Internet products, the internet has become a social media that everyone can participate in. The trend makes movie, music and other product reviews provide good reference to other users, However, it leads to the explosive growth of internet comments data. Through the he rapid and effective analysis of product reviews, we can get valuable information. This paper based on a lexicon-based method for   sentimental analysis, trying to use a series of methods to calculate the sum score of one view, which contain not, intensification and so forth. Through the process of studying and trying to implement it, give me a deep understanding of unsupervised methods.  This paper introduces main principles and methods of it, and then describes the detailed implementation process of my program. Finally I will show the experimental results and the conclusion.
Keywords  product reviews  lexicon-based   sentimental analysis   Unsupervised
目   次
1  引言    1
1.1  论文背景    1
1.2  研究的目的和意义    2
1.3  国内外研究现状    2
1.4  本文研究内容    3
2  主要研究方法    4
2.1  字典设置    4
2.2  强化    6
2.3  否定    8
2.4  非现实阻碍    9
2.5  文本级特征    10
3  具体算法实现    12
3.1  文本预处理    14
3.2  字典装入    14
3.3  对单词进行情感语义值累加    15
3.4  否定    15
3.5  加强    18
3.6  非现实阻碍    20
3.7  消极权重和重复权重    20
3.8  多字操作    21
4  实验结果评估    22
4.1数据集    22
4. 2 实验评估    23
结  论    31
致  谢    32
参考文献33
 1  引言
1.1  论文背景
    随着Web2.0的快速发展,各种网站应用层出不穷,从博客到微博,从线下商品到淘宝、京东等电商网站,诸如早期论坛到人人豆瓣等社交型网站,网络格局逐渐呈现社会化媒体的趋势。因此产生大量对于不同的人物、事件及产品等有价值的评论信息【1】。这些信息表达了人们不同的情感指向,如褒贬,喜爱讨厌等。基于了解大众舆论对某一事件或产品的观点的目的,潜在的用户可以在互联网上浏览这些旁人的带有主观色彩的评论来【2】。在电商领域,随着电子商务的蓬勃发展,越来越多的客户青睐网上购买,对于这样的潜在客户,商品评论这样的信息价值显得尤为重要。事实上,当价格已经都差不多的时候,消费者在购买商品时很大的参考因素来自电商对评论的处理。用户在选购商品前,可以通过评论来得知商品的具体情况,优缺点以及注意事项。同时,电商也可以通过产品评价得知产品使用中的缺陷不足或顾客喜好,以往需要耗费大量的人力做长时间的市场调查后才能得到消费者对产品的反馈意见。【3】 而现在因为互联网络的发展,对于公司来说,搜集顾客对产品反馈不单单局限于市场调查,他们可以从网上的消费者产生的评论中提取到足够的有价值的信息【4】。这些评论使得他们能了解到消费者对某商品的某些性能的喜好程度,以便继续保持受广大消费者喜爱的产品或产品特性,改进不受消费者喜爱的产品和特性。继而提高产品的市场竞争力。同时,企业也可以通过对竞争对手的产品评论信息的挖掘来了解对手,制定市场战略决策,从而在激烈的市场竞争中创造有利的优势。 无监督的互联网评论挖掘与情感分析技术:http://www.youerw.com/jisuanji/lunwen_40334.html
------分隔线----------------------------
推荐内容