首页 理论教育 学术文本研究:发现新研究点!

学术文本研究:发现新研究点!

时间:2023-11-20 理论教育 版权反馈
【摘要】:D遇到的问题在现实中并不少见,本书将这一应用场景问题称为研究点发现问题。假设深度卷积神经网络到目前为止并没有被利用到文本分类工作中,则可以认为将深度卷积神经网络应用于文本分类可能是一个具有可行性的研究点。本章的6.2节将会详细研究这一问题,并给出一个可行的解决方案。假设博士研究生D的研究领域是文本分类,使用6.2节中给出的算法,得到表6.3所示方法,所得到的方法在文本分类上的应用可能会构成创新性的研究点。

学术文本研究:发现新研究点!

本书的开头部分提出的四个场景中,第四个场景描述如下:

(*)博士研究生D需要设计研究方案和研究课题,希望通过调研发现新的尚未被人探索或者还较少为人探索的研究课题。D对相关文献做了周密的分析,但是似乎并没有什么可行的研究点值得探索。

D遇到的问题在现实中并不少见,本书将这一应用场景问题称为研究点发现问题。在科学研究中,研究点常常涉及问题、方法、材料三个要素,其中,最重要的两个要素是研究问题及其解决方法,这两个要素构成了本节所说的研究点。研究点推荐的目标是基于已有的问题方法对发现潜在的问题方法对应关系,帮助研究人员寻找指定问题可能存在的新方法或者指定方法可能解决的新问题。

下面给出了两个句子示例,从第一个句子中,可以发现支持向量机(support vector machines)能够用于文本分类(text categorization);从第二个句子中,则可以识别出深度卷积神经网络(deep convolutional neural network)能够应用于图像分类(image classification)。如果能够识别出深度卷积神经网络和支持向量机通常能够处理相同的任务,则可以认为两个方法在应用环境中是可以互相替换的。假设深度卷积神经网络到目前为止并没有被利用到文本分类工作中,则可以认为将深度卷积神经网络应用于文本分类可能是一个具有可行性的研究点。

• This paper explores the use of Support Vector Machines(SVMs)for learning text classifiers from examples.[4]

• We trained a large,deep convolutional neural network to classify the 1.3 m il-lion high-resolution images in the LSVRC-2010 ImageNet training set into the 1000 different classes.[5]

6.1.1小节曾提及可以将问题和方法关系表示成二部图G={M,T},相比于6.1.1小节提出的问题,研究点发现工作实质上是在二部图中发现潜在的关系,如图6-2所示。

图6-2中,实线表示该方法已经在已有的文献中标明可以用于解决线条箭头指向的问题,虚线表示该方法潜在意义上可以被用于指向问题,但并没有被已有研究证实。

图6-2 问题与方法二部图(包含潜在关联关系)(www.xing528.com)

给出两个假设:

• 问题相似度可以通过方法进行衡量;方法相似度可以通过其解决的问题进行衡量。如果两个问题(方法)对应的方法(问题)集合的交集越大,那么两个问题(方法)越相似。

• 问题越相似,越有可能使用同一方法加以解决;方法越相似,越能够解决同一类问题。

基于这两个假设,可以将研究点发现问题转化为一个推荐问题,也即基于已有的问题方法对应关系,发现和推荐问题的潜在解决方法以及技术方法的潜在应用领域。本章的6.2节将会详细研究这一问题,并给出一个可行的解决方案

本小节的最后再回到本书开头提到的博士研究生D遇到的问题。假设博士研究生D的研究领域是文本分类,使用6.2节中给出的算法,得到表6.3所示方法,所得到的方法在文本分类上的应用可能会构成创新性的研究点。

需要说明的是,表中列举的方法可能已经在某些研究论文中被证实可以应用于文本分类,但这里仍然将其识别为一个新的研究点,原因在于两个方面:一是本书收集的数据覆盖度有限,并没有覆盖到这些研究论文;二是词汇功能识别出现错误,未能识别出特定问题方法对。

表6-3 为文本分类(text categorization)推荐的方法

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈