什么是 KNN 分类以及这种分析如何帮助企业
Posted: Sat Feb 22, 2025 6:42 am
什么是KNN分类算法?
KNN(K 最近邻)算法分析所有可用数据点并对这些数据进行分类,然后根据这些已建立的类别对新案例进行分类。它适用于识别模式并用于估算。假设我们想根据两个预测因子(年龄和贷款类型)确定贷款违约的可能性,其中“违约”是目标。
我们首先确定 K = 最近邻居 加拿大电话号码数据 的数量(就距离而言)以检查类别分配。然后,我们将计算一个实例与所有训练实例之间的距离。然后,我们将按距离对实例进行排序并找到最近的邻居。换句话说,我们将找到与新实例的最短距离。之后,我们将收集最近邻居的类别以找到大多数。这个类别的大多数是类别的最终预测值。
让我们看一个基于耐酸性和强度两个属性的 KNN 分类示例。目标是将纸巾分为好/坏质量类别。
图片来源:优雅的微网
由于三个最近邻居的多数类 = 好(三个记录中的两个类 = 好),因此预测实例的类 = 好,即耐酸性 =3 和强度 =7 的纸巾质量为好。
KNN分类如何帮助企业?
KNN 分类分析可用于评估多种类型的数据。
信贷/贷款审批分析:给定客户交易属性列表,企业可以预测客户是否会拖欠银行贷款。
天气预测:根据温度、湿度、压力等,组织可以预测是否会下雨/晴朗/寒冷。
欺诈分析:根据员工提交的食品、旅行和其他费用报销的各种账单,企业可以预测欺诈的可能性。
让我们看两个用例来说明 KNN 分类的好处。
KNN(K 最近邻)算法分析所有可用数据点并对这些数据进行分类,然后根据这些已建立的类别对新案例进行分类。它适用于识别模式并用于估算。假设我们想根据两个预测因子(年龄和贷款类型)确定贷款违约的可能性,其中“违约”是目标。
我们首先确定 K = 最近邻居 加拿大电话号码数据 的数量(就距离而言)以检查类别分配。然后,我们将计算一个实例与所有训练实例之间的距离。然后,我们将按距离对实例进行排序并找到最近的邻居。换句话说,我们将找到与新实例的最短距离。之后,我们将收集最近邻居的类别以找到大多数。这个类别的大多数是类别的最终预测值。
让我们看一个基于耐酸性和强度两个属性的 KNN 分类示例。目标是将纸巾分为好/坏质量类别。
图片来源:优雅的微网
由于三个最近邻居的多数类 = 好(三个记录中的两个类 = 好),因此预测实例的类 = 好,即耐酸性 =3 和强度 =7 的纸巾质量为好。
KNN分类如何帮助企业?
KNN 分类分析可用于评估多种类型的数据。
信贷/贷款审批分析:给定客户交易属性列表,企业可以预测客户是否会拖欠银行贷款。
天气预测:根据温度、湿度、压力等,组织可以预测是否会下雨/晴朗/寒冷。
欺诈分析:根据员工提交的食品、旅行和其他费用报销的各种账单,企业可以预测欺诈的可能性。
让我们看两个用例来说明 KNN 分类的好处。