【摘要】:通过这个例子,我们可以看到模式分类过程的优点和缺点。由于一些猫的重量大于10千克,而许多狗的重量小于10千克,因此,我们的标准并没有很好的辨别力。继续考虑我们的简单例子,首先,我们可以尝试选择关于重量的更好的阈值。通过观察这两个概率分布,我们可以期望:能够得到一个重量标准,来对猫和狗进行更好的区分。此外,知道测试样本中猫和狗的比例,对于分类任务也是有帮助的。一个好的阈值可能是:使得期望误差最小的阈值。
模式分类的目的是:测量我们想要分类的物体的特征,并且,根据特征测量结果来判断物体的所属类别。例如,如果所有的猫的重量都小于10千克,而所有狗的重量都大于10千克,那么,我们可以用这个信息来对给定的一组动物进行分类。通过这个例子,我们可以看到模式分类过程的优点和缺点。由于一些猫的重量大于10千克,而许多狗的重量小于10千克,因此,我们的标准并没有很好的辨别力。我们的方法尽管简单,但是,分类效果并不好。为了得到更好的分类结果,我们可以加入其他的标准,但是,这样做同时会使得分类过程变得更加复杂。
继续考虑我们的简单例子,首先,我们可以尝试选择关于重量的更好的阈值。为了做到这一点,我们需要得到关于猫和狗的重量的概率分布的统计信息。通过观察这两个概率分布,我们可以期望:能够得到一个重量标准,来对猫和狗进行更好的区分。此外,知道测试样本中猫和狗的比例,对于分类任务也是有帮助的。(www.xing528.com)
这里,我们可以得到两种误差:1)一只猫被错误地判断成狗,或者反过来,2)一只狗被错误地判断成猫。一个好的阈值可能是:使得期望误差最小的阈值。通常情况下,分类结果会导致一些后续的行为,我们可以将这些后续行为和误差结合起来,计算出误差所造成的代价。我们可以通过调整阈值,来使得这个代价最小,而不是使得总的期望误差最小。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。