AI模型稳定性评估指标:PSI的原理和计算
人人都是产品经理
2024-01-15 16:51:35
0

原标题:AI模型稳定性评估指标:PSI的原理和计算

在构建AI模型的过程中,需要处理很多模型和算法。之前我们介绍了如何评估分类模型和回归模型的性能,这篇文章,我们介绍一下常用的模型稳定性指标———客群稳定性指标(PSI)。

前面两篇文章分别介绍了如何评估分类模型和回归模型的性能。

模型上线前的评估,除了前文提到的模型性能之外,还需要考虑模型的稳定性,只有稳定性足够好的模型才能达到上线的标准。

本文就来介绍一下常用的模型稳定性指标———客群稳定性指标(PSI)。

一、什么是PSI?

模型构建时,我们以历史数据作为样本,以历史数据的表现作为模型评估的依据。

但实际上,由于客群变化(不同时间段给到模型的样本数据会有变化)或数据源采集变化等因素影响,实际样本分布也会不可避免的发生偏移,从而导致模型不稳定。

如果模型不稳定,那么我们根据历史数据样本得到的“合适”阈值,去给实际数据样本做评判,就会直接影响模型结果的合理性。

所谓PSI指标就是客群稳定性指标(Population Stability Index),通过该指标,可以得到不同时间段的样本下,模型在各分数段分布的稳定性。

二、如何计算PSI?

我们先来看一下PSI的计算公式:

PSI(Population Stability Index)= SUM((实际占比-预期占比) * ln(实际占比/预期占比))

从公式中可以看到,想要计算稳定性,就需要有一个基准数据(预期占比)作为参照,然后用实际数据和基准数据就可以计算PSI值。

计算PSI值一般分为以下三步:

  1. 分箱:分别将模型输出的预期分布和实际分布进行分箱操作。有等频分箱和等距分箱两种方式。
  2. 计算分布:分别计算落在各区间的人数占比,分别得到每个区间的预期占比和时机占比数值。
  3. 计算PSI值:根据公式 (实际占比-预期占比) * ln(实际占比/预期占比) 计算每个区间的PSI值,再求和,就可以得到最终的PSI值。
三、判断标准

PSI表示的是实际占比和预期占比之间的差距,所以PSI值越小,说明实际占比和预期占比的差异也比较小,代表模型越稳定。

我们一般会这么定义模型的稳定性:

  • 若PSI<0.1,稳定性良好,说明样本分布仅有微小变化,模型很稳定;
  • 若PSI在0.1~0.25之间,稳定性一般,说明样本分布有变化,需要根据实际情况调整评分切点或调整模型;
  • 若PSI>0.25,稳定性较差,说明样本分布有显著变化,模型不稳定,必须调整模型。
四、局限性

但是我们也不能迷信PSI指标,PSI只是一个粗糙的指标,有它的局限性,严重受制于数据质量、样本代表性和分档数量。

  • 数据质量:当PSI指标表明模型不稳定时,首先要确定数据是否存在问题,比如数据是否正常提供、接口是否正常工作、网关数据传输过程是否正常、加工过程是否遭到数据污染或逻辑上有疏忽遗漏等。
  • 样本代表性:既要确保选取的样本数量足够反应总体数据的信息,又要确保选取的样本结构和总体数据的结构一致(分层抽样)
  • 分档数量和方式:不同的分组数和分组方式也会对PSI值有小幅的影响
五、总结

本文我们介绍了如何使用PSI指标评估模型的稳定性,模型稳定性是判断模型是否可用的一个非常重要的条件,虽然我们实际上不需要手动计算PSI值,但通过计算过程我们可以更深入的理解其原理。

至此,我们用三篇文章分别讲述了分类模型性能评估、回归模型性能评估和模型稳定评估的指标和计算方法,希望对大家有所帮助。

接下来,我们开始进入AI算法大篇章的学习,由于计算分享的算法较多,我会在算法篇适当增加更新的频率,争取在一个月内完成算法相关的文章,敬请期待。

本文由 @AI小当家 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

相关内容

热门资讯

昆明云锗申请续接生长消除锗单晶... 金融界2025年5月13日消息,国家知识产权局信息显示,昆明云锗高新技术有限公司申请一项名为“续接生...
与华为就具身智能和人形机器人开... 5月13日, 港股优必选大幅高开近15%,报100.2港元。 消息面上,5月12日,华为与优必选科...
Claude 25000字提示... AI领域近日再起波澜,焦点集中于Anthropic公司旗下的明星大语言模型Claude。据广泛报道,...
太阳辐射监测站:解码太阳能量的... 鸣乔【MQ-TGF】太阳辐射监测站是现代气象、能源及生态领域的关键设备,它通过集成高精度传感器与智能...
科达利获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示科达利(002850)新获得一项实用新型专利授权,专利名为“顶...
固态电池量产节奏加快 上市公司... 本报记者 李昱丞 固态电池产业化加速,多家上市公司计划推新。据公开报道,贝特瑞新材料集团股份有限公司...
官宣!华为将于5月19日发布鸿... 5月13日,据华为终端微博消息,nova14系列及鸿蒙电脑新品发布会,5月19日14:30见。 据...
2025上海科技节本周六启幕,... 5月13日,澎湃新闻记者从上海市科委获悉,2025上海科技节将于5月17日启动,为期两周,覆盖全市1...
宇树正遭遇“墙倒众人推”? 文|未来图灵 2025年4月,镜相工作室一篇《宇树机器人租不出去了》的文章在科技圈引发讨论。文章称...
天开东丽园开启航空航天及低空经... 昨天,由东丽区科学技术局、东丽区科学技术协会、东丽临空经济区、东丽天开集团、中国民航大学科技园联合主...
支付宝新增通话功能,对支付业务... 图源:支付宝官方 “新上线的‘好友语音通话功能’,是为了保障用户安全,方便转账双方直接语音对话以核实...
探索生态奥秘,点燃科学梦想——... 2025年5月11日,由国家自然博物馆主办的“环球自然日”第十四届青少年自然科学挑战活动2025年度...
河北卓锦取得电路板用夹持装置专... 金融界2025年5月12日消息,国家知识产权局信息显示,河北卓锦科技有限公司取得一项名为“电路板用夹...
江苏奥功取得带反馈结构欧标直流... 金融界2025年5月12日消息,国家知识产权局信息显示,江苏奥功电能科技有限公司取得一项名为“一种带...
滚塑保温箱:做始终靠谱的“实力... 酷尔保温箱。受访企业供图 我是酷尔滚塑保温箱——既是户外探险者的“随行冷库”,也是食材鲜度的“恒温卫...
宜青夜校|教你用“DeepSe... 为帮助广大青年掌握Deepseek等AI技术核心技能,有效提升工作效率,助力青年解锁智能办公新体验。...
医院常见微生物可分解医用塑料 科技日报讯 (记者刘霞)英国《自然》网站5月8日刊发的一项研究称,一种医院常见的致病菌——铜绿假单胞...
苹果2027年将推新品曝光 涵... 【太平洋科技快讯】近日,据相关爆料透露,苹果计划将在2027年推出一系列令人振奋的新产品,他将其描述...
华为与优必选围绕具身智能和人形... 南都讯 记者陈紫嫣 记者从优必选方面获悉,5月12日,华为与优必选科技在深圳正式签署全面合作协议。双...
业界首个安全智能体再次升级 5月9日,“让安全更智能让智能更安全”西湖论剑AI + 新品发布会于安恒大厦举行。 安恒信息高级副总...