自然语言处理(natural language processing,NLP)是人类语言和电脑的交互,属于计算机科学和人工智能的范畴,其研究内容包括理解和掌握语言两部分。NLP是计算机对人类语言进行分析、理解的工具,通过使用NLP可以实现自动化总结、翻译、人名识别、关系抽取、情感分析、语音识别、主题分割。
普通的文字处理器是把文字当成一个符号序列来处理,NLP的原理是把语言当成多层次的结构,由文字组成短语,短语构成句子,通过句子来表达意图、情感等。通过分析语言来得到其意思,NLP已经很好地实现了搜集语法,已经实现通过语音识别将语言转化为文本、机器翻译和自动提问回答等功能。
NLP的原理是基于机器学习的算法,通过深度学习来自动掌握规则,从而在语句之间建立数据关联。深度学习的样本越丰富,则语言处理后的结果就越好。
自然语言处理包括以下一些具体研究内容:
①文本朗读(text to speech);
②语音合成(speech synthesis);
③语音识别(speech recognition);
④中文自动分词(Chinese word segmentation);
⑤词性标注(part-of-speech tagging);
⑥句法分析(parsing);(www.xing528.com)
⑦自然语言生成(natural language generation);
⑧文本分类(text categorization);
⑨信息检索(information retrieval);
⑩信息抽取(information extraction);
文字校对(text-proofing);
问答系统(question answering);
机器翻译(machine translation);
自动摘要(automatic summarization);
文字蕴涵(textual entailment)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。