笔趣阁

笔趣阁>职场聪明的女人 > 第603章 机器学习里的分类问题和回归问题一个故事解释(第2页)

第603章 机器学习里的分类问题和回归问题一个故事解释(第2页)

用故事解释分类问题和回归问题

1.分类问题的故事——森林里的神秘果子

在一片神秘的森林里,小明发现了许多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一个方法来区分这些果子。

他观察到:

?颜色:红色的果子通常是可食用的,紫色的果子通常是有毒的。

?形状:圆形的果子大多能吃,尖尖的果子往往有毒。

?大小:太小的果子似乎更危险。

于是,小明决定建立一个“吃不吃果子”的规则系统:

?如果果子是红色且圆形,就吃!

?如果是紫色且尖尖的,就不吃!

?其他情况要谨慎判断。

这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。

分类问题的典型特征:

答案是离散的类别(例如:“可吃”vs.“不可吃”)

数据用于区分不同类别(红色vs.紫色,圆形vs.尖形)

最终输出是一个标签(1=可吃,0=不可吃)

现实中的应用:

?邮件是否是垃圾邮件?(垃圾vs.非垃圾)

?贷款申请者是否值得批准?(批准vs.拒绝)

?识别图片中的动物是什么?(猫vs.狗)

2.回归问题的故事——小明卖柠檬水

夏天到了,小明在街头卖柠檬水。他想预测明天应该准备多少杯柠檬水,以免浪费或卖不够。

他发现:

?温度越高,卖出的柠檬水越多。

?天气越晴朗,卖出的柠檬水也越多。

?湿度太高时,人们反而不太想买柠檬水。

他收集了一些数据,比如:

?昨天30°c,卖出50杯

?昨天35°c,卖出70杯

?昨天28°c,卖出45杯

他想建立一个预测模型,比如:

这样,如果明天预测是32°c,他可以计算:

那么,他就应该准备大约76杯柠檬水。

这个过程就是回归问题——它的目标是预测一个连续的数值,而不是一个固定类别。

回归问题的典型特征:

答案是一个数值,而不是分类标签(如“明天卖76杯”而不是“卖得多”或“卖得少”)

数据之间有连续性的关系(温度从20°c到40°c,销量随之变化)

最终输出是一个数值预测(如“销量=76”)

现实中的应用:

?预测房价(基于面积、地段等因素预测房价)

?预测股票价格(基于历史数据预测未来走势)

?预测某人未来的收入(基于年龄、教育、工作经验等)

用比喻解释分类问题和回归问题

1.分类问题——“选择哪种衣服?”

想象你站在衣柜前,思考今天穿什么衣服。你会根据天气决定:

?晴天→穿t恤

?下雨→穿雨衣

?下雪→穿羽绒服

这是一个分类问题,因为你的决策结果是几个固定选项之一(t恤、雨衣、羽绒服)。

2.回归问题——“决定穿多厚?”

如果你不仅要决定穿什么,还想确定该穿多厚的衣服,就成了回归问题。

你会想:

?10°c,应该穿厚毛衣+外套(厚度8分)

?20°c,应该穿薄外套(厚度5分)

?30°c,应该穿短袖(厚度2分)

这样,你的决定不只是t恤雨衣羽绒服,而是一个连续数值(衣服的厚度),这就类似于回归问题。

总结

对比点分类问题回归问题

输出类型固定类别(离散值)连续数值

目标识别类别(苹果or橘子)预测数值(温度vs.柠檬水销量)

典型应用垃圾邮件分类、疾病诊断房价预测、销量预测

示例这封邮件是垃圾邮件吗?(是否)明天应该卖多少杯柠檬水?(75杯)

分类问题适合选出某个类别,而回归问题适合预测一个数值。希望这些比喻能帮你更容易理解它们的区别!

请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

相邻推荐:重生78,带着妹妹深山打猎  盘点短视频名场面,古人全麻了  抢我姻缘?转身嫁暴君夺后位  月师妹那么乖,怎么可能会是海王  通天剑帝  四合院:刀劈易中海,院里谁不服  血谍:十号军机  量子传奇  我的技能没伤害  师姐穿军嫂:兵哥,一起养孩子呗  从娱乐圈太子到刑侦新人  快穿之平淡生活  被宝可梦团宠的我有钞能力  飞鱼传  死神:不谈恋爱当什么死神?  星际帝国:我是舰队指挥官  开局SSS级楼区,舞蹈校花请进  穿成兽世娇雌,大佬们每天都在修罗场  养了只小狗  珠玉错  

已完结热门小说推荐

最新标签