毕业论文

打赏
当前位置: 毕业论文 > 管理论文 >

CRFs商品评论信息的观点抽取及其分类研究(2)

时间:2018-08-14 20:46来源:毕业论文
4.1 汽车评论数据集 20 4.2 观点抽取结果与分析 20 4.3 观点分类结果与分析 22 5. 总结 25 6. 局限性 26 致 谢 28 参考 文献 29 1. 绪论 1.1 研究背景 网络 购物是人


4.1 汽车评论数据集    20
4.2 观点抽取结果与分析    20
4.3 观点分类结果与分析    22
5. 总结    25
6. 局限性    26
致  谢    28
参考文献29
1. 绪论
1.1 研究背景
网络购物是人们消费的一种新形式,网购用户目前已超过8000万,大量的在线商品评论信息也随之产生。网络购物本身的虚拟性,使得消费者在购物前渴望对想要购买的商品进行充分的了解,进一步减少网络购物的不确定性,因此商品的评论信息已成为消费者网购过程中了解商品及相关服务的一个重要渠道。然而商品评论数量庞大、无结构化的特点,导致人工阅读的方式无法全面地概括、总结评论信息。为了解决评论信息海量化与人工阅读能力有限之间的矛盾,快速有效地获取商品评论信息中的有效信息,观点挖掘越来越受到学者们的重视。观点挖掘按照不同的任务层次,可以分为观点抽取、观点分类与观点检索归纳。
1.2 研究意义
商品评论是消费者在消费或使用过该商品后发布的信息,表达了用户的使用体验,包含了用户对商品的特征、功能和性能等的看法,同时又是其他潜在消费者购买商品前了解该商品和服务的重要渠道,为企业沟通客户、改善商品销量提供了参考。观点抽取是指从海量的网络数据中提取出表达评论者观点的文本,以便于从商品评论中快速地获取有效信息,更高效的挖掘商品评论信息。观点分类一般以观点的语义倾向性为基础进行分类。在观点抽取的基础上对评论信息进行观点分类,有助于消费者和商品生产者查看不同类别的观点、了解观点的整体以及类别的分布。
1.3 观点抽取综述
观点是人们对于事物的看法,往往具有主观性较强的特点。观点抽取是指利用计算机技术自动分析带有观点信息的句子或文档,从中提取出用户感兴趣的主题或特征,并分析其语义极性倾向(褒义、贬义或中性)和强度[1]。网络信息观点抽取的方法主要是利用自然语言处理技术,通过预定义主题或特征词,利用主语与极性成分之间的修饰、匹配关系进行观点抽取[2]。
针对评论信息,观点抽取的基本思路是通过语言分析来获知评论信息中观点的构成特点,进而构建评论中观点抽取的方法。商品评论中的观点指用户在评论中提到的对于该商品或该商品使用过程中某个对象的评价,一般包含评价的对象,评价词以及情感倾向性。因此,对评论信息进行观点抽取的核心是对评论中的评价对象和评价词的识别以及抽取。
目前商品评论观点抽取的方法主要包括有监督的方法和无监督的方法两类。有监督的方法主要是借助机器学习技术,如徐冰等利用句子中产品特征周围的词、词性、上下文、浅层句法信息(如主谓宾信息)和位置信息等构造了一个基于条件随机场的模型来抽取产品特征[3]。Li等结合产品特征和观点的词信息、字典信息、句法依存信息,利用条件随机场模型提出了一种新的抽取观点的架构[4]。以上有监督的算法需要标注训练大量的数据,并且算法的有效性往往依赖于标注的数据。无监督的算法无需训练数据,往往利用句法分析,根据评论的特征进行观点抽取,具有更强的适用性。徐叶强[5]用词性序列模板抽取候选评价对象,使用三种过滤方法,利用置信度排序确定评价对象。张莉等[6]提出利用核心句进行学习的思想,并确定了10种句法关系作为语言特征,基于词、词性和句法关系,将原始句和核心句分别利用条件随机场模型进行学习和比较,实现抽取评价对象的目的。郗亚辉[7]对现有的双向传播算法进行改进,利用产品特征和观点之间的句法依存关系模式,不断迭代抽取新的产品特征和观点,直到无法抽取出新的产品特征和观点为止。 CRFs商品评论信息的观点抽取及其分类研究(2):http://www.youerw.com/guanli/lunwen_21370.html
------分隔线----------------------------
推荐内容