毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

课程在线答疑系统的中文分词技术研究与实现(4)

时间:2021-03-17 21:26来源:毕业论文
Dreamweaver具有以下特点: (1)所见即所得的网页开发功能。开发者在开发网页时使开发者不需要使用浏览器就能预览网页。 (2)强大的网站管理功能。

Dreamweaver具有以下特点:

(1)所见即所得的网页开发功能。开发者在开发网页时使开发者不需要使用浏览器就能预览网页。

(2)强大的网站管理功能。

(3)可与其他设计工具配合使用,将其他软件制作的文档移植到网页上。

(4)利用表格对网页进行排版设计,提供了精确的定位功能。

(5)强大的模板功能。

(6)可适应不同的浏览器。

1.3.3 ACCESS简介

随着社会的飞速发展和计算机技术在各个行业的广泛应用,在社会生活的各个领域中,每天都要进行大量的数据处理工作,这些工作主要是通过数据库软件完成的。

目前常用的数据库软件很多,例如SQL Sever、Oracle、MySQL等等,功能十分强大。但是对于数据量处理相对较少的普通用户来说,大型的数据库管理软件既过于复杂又难于掌握,普通用户很难在短期内学会,而且用它们处理数据量较小、数据关系简单的情况更是大材小用,浪费人力物力。在这样的情况下,微软公司推出的Access就是一种适合普通用户、简单方便而易学易用的数据库管理工具。和同类产品一样,Access可以存储和检索信息、提供所请求的信息和自动完成可重复执行的任务,它是一个功能强大而操作简单的数据库应用程序,同时,作为微软开发的Office办公软件之一,其数据库管理效率充分利用Windows的功能,并与其协调一致,并与其他办公软件界面风格统一,便于用户熟悉操作,并能方便地实现不同办公软件之间的交互,减少了很多数据传输、共享方面的麻烦。

Access与其他数据库系统相比,具有以下特点:

(1)用户界面简单。

(2)操作方便。

(3)数据对象丰富。

(4)窗体和报表美观大方。

(5)数据共享功能强大。

(6)网络应用广泛。

(7)拥有数十个常用数据库模版。

本文一共包含四章内容,除了本章介绍之外,剩下部分是这样安排的,第二章介绍中文分词技术,第三章介绍系统的总体设计,第四章介绍中文分词在本系统智能答疑模块中的应用,最后对本次研究进行总结。源:自~优尔-·论`文'网·www.youerw.com/

2 中文分词简介

中文分词是提高智能答疑准确率的关键技术之一,在许多其他领域中,也有着广泛的应用。目前,中文分词技术的研究已比较成熟。本章对中文分词的概念、中文分词的难点、目前流行的几种分词算法以及中文分词的应用展开具体描述。

2.1 中文分词的概念

所谓中文分词,就是将中文语句中的单词切分出来的过程。研究人员普遍认为中文分词是中文语言处理的第一步。与英文文本不一样,英文文本中,句子的单词序列由空格分开,如“I am a student”,单词的边界一目了然。而在中文文本中,字是最小的表意单位,词是由一个或多个汉字组成的,句子是有一定逻辑顺序的词序列,句子与句子之间由标点隔开,没有类似的自然分隔符,如“我是一个学生”,虽然使用中文的人能很容易判断出单词序列,但计算机不能理解这样一个简单句子。再者,人们在搜索信息时,通常会以词为单位,而非整个句子,这就使得计算机即使懂得“我是一个学生”这样一个句子,也无法将关键词“学生”与其对应起来。中文的这些基本特点决定了在自动分析中文文本之前,必须将整句切分成小的单词的集合,即中文分词。如将“我是一个学生”切分开来,得到“我/是/一个/学生”的词序列记录起来,计算机就很容易通过“学生”这个词来找到这个句子。因此,中文处理的第一步就是确认句子的单词序列。这听起来似乎很简单,但实际上识别中文单词是一个中文语言处理界做了很多研究的巨大问题。当然,英文中的自动分析也有难点,如时态和词性的变化等。但在词这一层上,中文比之英文要复杂的多,这也就给中文分词带来了很大的困难。下面举例说明一段文本经过分词之后产生的词序列。文献综述 课程在线答疑系统的中文分词技术研究与实现(4):http://www.youerw.com/jisuanji/lunwen_71765.html

------分隔线----------------------------
推荐内容