新闻动态
NEWS CENTER
NEWS CENTER
2019-05-18
精确率(precision):是精确性的度量,表示被分为正例的示例中实际为正例的比例,precision=TP/(TP+FP)
召回率(recall):是覆盖面的度量,度量有多个正例被分为正例,recall=TP/(TP+FN)=TP/P=sensitive,可以看到召回率与灵敏度是一样的。
正确率(accuracy):是我们最常见的评价指标,accuracy = (TP+TN)/(P+N),这个很容易理解,就是被分对的样本数除以所有的样本数,通常来说,正确率越高,分类器越好。
f1:是统计学中用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的准确率和召回率。f1分数可以看作是模型准确率和召回率的一种加权平均,它的最大值是1,最小值是0。f1=2*precision*recall/(precision+recall)
根据模型效果可以将模型分成二分类模型,多分类模型,回归模型,时间序列模型,聚类模型,推荐模型,笔者尝试通过案例一句话介绍常用模型应用场景,并附上通俗易懂的拓展阅读材料,帮助大家更深刻的理解这些模型可以如何应用。
二分类:可以把预测目标抽象成两类,如预测是否患有心脏病,预测用户对某个产品是否感兴趣,可以将预测结果抽象成0和1。阿里PI平台提供了心脏病预测案例https://help.aliyun.com/knowledge_detail/34929.html
多分类:可以把预测目标抽象成多个类别,如预测用户年龄段等,一般情况会将多分类问题转化成二分类处理。
回归:预测某个时间点数值的模型,如预测房价,预测产品价格等。典型案例是预测波士顿房价。https://blog.csdn.net/Teresa_Xin/article/details/79204769
时间序列:预测某一段时间多个数值的模型,如预测未来一周每天股票价格,预测未来一段时间最高气温。
聚类:无监督学习,数据无需标签,根据设定分组数自动进行分组,通过观察分组数据特征给用户分群打标,常用于用户分群,案例青少年市场细分。http://cookdata.cn/note/view_static_note/201ad8d4a6c12768f7f79754a45e1b77/
推荐模型:经典推荐模型是协同过滤,协同过滤分为两类,基于产品的协同过滤和基于用户的协同过滤。基于产品的协同过滤是用户A喜欢苹果,然后通过算法计算出其他水果与苹果的相似度,然后进行推荐给A;基于用户的协同过滤是用户A喜欢苹果,将同样喜欢苹果的用户B喜欢的额其他产品推荐给A。推荐阅读文章https://www.jianshu.com/p/e56665c54df8
不同类模型的常用算法如下图所示,希望读者们再看到这些抽象模型名字后莫慌,可以思考他们处理哪类,一步步思考如何应用。