计算机毕业设计中文分词技术探究与实施方法有哪些?
- 内容介绍
- 文章标签
- 相关推荐
本文共计14294个文字,预计阅读时间需要58分钟。
1. 主题:中文分词的意义及发展,中文分词技术不断进步,各种中文分词系统层出不穷。分词技术应用也日益广泛,如搜索引擎应用、语音识别系统、机器翻译、自动分类等。学生应通晓分词概念。
1.课题意义及目标
中文分词技术不断发展,各种中文分词系统层出不穷。中文分词技术应用也原来越广泛。如搜索引擎的应用、语音识别系统、机器翻译、自动分类校对等。学生应通过本次毕业设计,综合运用所学过的基础理论知识,深入中了解文分词技术,为学生在毕业后相关工作打好基础。
2.主要任务
研究常见的几种分词方法,阐述其原理、优缺点。
着重研究正向最大分词的原理,得出相关结论。
根据最大分词方法做出相应程序来实现对若干句子的分词,在记事本(或Word)中显示出来并比较几种分词方法的优缺点。
3.主要参考资料
[1] 宗成庆.统计自然语言处理[M].北京:清华大学出版社.2008:105-143.
[2] 刘件,魏程. 中文分词算法研究[J]. 微计算机应用.
[3] 崔彦翔.基于条件随机场的网络研究[D].大连:大连理工大学,2013.
4.进度安排
摘 要
本毕业设计主要对几种常见的中文分词算法的切分结果进行了研究对比。阐述了分词算法的原理,着重研究了正向最大分词的原理,分析了分词算法的思想、数学模型及算法的实现。在以上分析研究的基础上,本毕业设计基于机械分词算法,结合了N-Gram模型在前人研究的基础上采用JAVA程序设计语言,结合更加优良的存储和匹配方法,设计出相应的分词程序,最终实现了对若干句子的分词,并在文本文档中显示出切分结果。同时相应的提高了中文分词的效率和正确率。
本文共计14294个文字,预计阅读时间需要58分钟。
1. 主题:中文分词的意义及发展,中文分词技术不断进步,各种中文分词系统层出不穷。分词技术应用也日益广泛,如搜索引擎应用、语音识别系统、机器翻译、自动分类等。学生应通晓分词概念。
1.课题意义及目标
中文分词技术不断发展,各种中文分词系统层出不穷。中文分词技术应用也原来越广泛。如搜索引擎的应用、语音识别系统、机器翻译、自动分类校对等。学生应通过本次毕业设计,综合运用所学过的基础理论知识,深入中了解文分词技术,为学生在毕业后相关工作打好基础。
2.主要任务
研究常见的几种分词方法,阐述其原理、优缺点。
着重研究正向最大分词的原理,得出相关结论。
根据最大分词方法做出相应程序来实现对若干句子的分词,在记事本(或Word)中显示出来并比较几种分词方法的优缺点。
3.主要参考资料
[1] 宗成庆.统计自然语言处理[M].北京:清华大学出版社.2008:105-143.
[2] 刘件,魏程. 中文分词算法研究[J]. 微计算机应用.
[3] 崔彦翔.基于条件随机场的网络研究[D].大连:大连理工大学,2013.
4.进度安排
摘 要
本毕业设计主要对几种常见的中文分词算法的切分结果进行了研究对比。阐述了分词算法的原理,着重研究了正向最大分词的原理,分析了分词算法的思想、数学模型及算法的实现。在以上分析研究的基础上,本毕业设计基于机械分词算法,结合了N-Gram模型在前人研究的基础上采用JAVA程序设计语言,结合更加优良的存储和匹配方法,设计出相应的分词程序,最终实现了对若干句子的分词,并在文本文档中显示出切分结果。同时相应的提高了中文分词的效率和正确率。

