您的位置 : 首页 > 哎呀网 > > 职场小聪明

职场小聪明第603章 机器学习里的分类问题和回归问题一个故事解释

用故事解释分类问题和回归问题 1. 分类问题的故事——森林里的神秘果子 在一片神秘的森林里小明发现了许多奇怪的果子。

有些果子可以吃而有些果子有毒。

他想找到一个方法来区分这些果子。

他观察到: ? 颜色:红色的果子通常是可食用的紫色的果子通常是有毒的。

? 形状:圆形的果子大多能吃尖尖的果子往往有毒。

? 大小:太小的果子似乎更危险。

于是小明决定建立一个“吃不吃果子”的规则系统: ? 如果果子是红色且圆形就吃! ? 如果是紫色且尖尖的就不吃! ? 其他情况要谨慎判断。

这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。

分类问题的典型特征: 答案是离散的类别(例如:“可吃” vs. “不可吃”) 数据用于区分不同类别(红色vs. 紫色圆形vs. 尖形) 最终输出是一个标签(1=可吃0=不可吃) 现实中的应用: ? 邮件是否是垃圾邮件?(垃圾 vs. 非垃圾) ? 贷款申请者是否值得批准?(批准 vs. 拒绝) ? 识别图片中的动物是什么?(猫 vs. 狗) 2. 回归问题的故事——小明卖柠檬水 夏天到了小明在街头卖柠檬水。

他想预测明天应该准备多少杯柠檬水以免浪费或卖不够。

他发现: ? 温度越高卖出的柠檬水越多。

? 天气越晴朗卖出的柠檬水也越多。

? 湿度太高时人们反而不太想买柠檬水。

他收集了一些数据比如: ? 昨天 30°C卖出 50 杯 ? 昨天 35°C卖出 70 杯 ? 昨天 28°C卖出 45 杯 他想建立一个预测模型比如: 这样如果明天预测是 32°C他可以计算: 那么他就应该准备大约 76 杯柠檬水。

这个过程就是回归问题——它的目标是预测一个连续的数值而不是一个固定类别。

回归问题的典型特征: 答案是一个数值而不是分类标签(如“明天卖 76 杯”而不是“卖得多”或“卖得少”) 数据之间有连续性的关系(温度从 20°C 到 40°C销量随之变化) 最终输出是一个数值预测(如“销量=76”) 现实中的应用: ? 预测房价(基于面积、地段等因素预测房价) ? 预测股票价格(基于历史数据预测未来走势) ? 预测某人未来的收入(基于年龄、教育、工作经验等) 用比喻解释分类问题和回归问题 1. 分类问题——“选择哪种衣服?” 想象你站在衣柜前思考今天穿什么衣服。

你会根据天气决定: ? 晴天 → 穿T恤 ? 下雨 → 穿雨衣 ? 下雪 → 穿羽绒服 这是一个分类问题因为你的决策结果是几个固定选项之一(T恤、雨衣、羽绒服)。

2. 回归问题——“决定穿多厚?” 如果你不仅要决定穿什么还想确定该穿多厚的衣服就成了回归问题。

你会想: ? 10°C应该穿厚毛衣+外套(厚度 8 分) ? 20°C应该穿薄外套(厚度 5 分) ? 30°C应该穿短袖(厚度 2 分) 这样你的决定不只是T恤/雨衣/羽绒服而是一个连续数值(衣服的厚度)这就类似于回归问题。

总结 对比点 分类问题 回归问题 输出类型 固定类别(离散值) 连续数值 目标 识别类别(苹果 or 橘子) 预测数值(温度 vs. 柠檬水销量) 典型应用 垃圾邮件分类、疾病诊断 房价预测、销量预测 示例 这封邮件是垃圾邮件吗?(是/否) 明天应该卖多少杯柠檬水?(75 杯) 分类问题适合选出某个类别而回归问题适合预测一个数值。

希望这些比喻能帮你更容易理解它们的区别! 喜欢职场小聪明请大家收藏:()职场小聪明20小说网更新速度全网最快。

本文地址职场小聪明第603章 机器学习里的分类问题和回归问题一个故事解释来源 http://www.aybqz.com