什么是预测建模
编辑预测建模使用统计数据来预测结果。大多数情况下,人们想要预测的事件发生在未来,但预测建模可以应用于任何类型的未知事件,无论它何时发生。例如,预测模型通常用于在犯罪发生后检测犯罪和识别嫌疑人。
在许多情况下,模型是根据检测理论选择的,以尝试猜测给定输入数据量的结果的概率,例如给定一封电子邮件,确定它是垃圾邮件的可能性。
模型可以使用一个或多个分类器来尝试确定一组数据属于另一组数据的概率。例如,可以使用模型来确定电子邮件是垃圾邮件还是“非垃圾邮件”(非垃圾邮件)。
根据定义边界,预测建模与机器学习领域同义或在很大程度上与其重叠,因为它在学术或研究和开发环境中更常被提及。在商业部署时,预测建模通常称为预测分析。
预测建模通常与因果建模/分析形成对比。在前一种情况下,人们可能完全满足于使用感兴趣的结果的指标或代理。在后者中,人们试图确定真正的因果关系。这种区别导致了研究方法和统计领域的新兴文献以及“相关性并不意味着因果关系”的共同声明。
预测建模的应用
编辑隆起建模
提升建模是一种对由动作引起的概率变化进行建模的技术。通常,这是一种营销行为,例如提供购买产品、更多使用产品或重新签订合同的提议。例如,在保留活动中,您希望预测联系后客户仍为客户的概率变化。概率变化模型允许保留活动针对概率变化将对其有益的那些客户。这允许保留计划避免触发不必要的流失或客户流失,而不会浪费金钱联系那些无论如何都会采取行动的人。
考古
考古学中的预测建模的基础来自GordonWilley五十年代中期在秘鲁VirúValley的工作。进行了完整、深入的调查,然后确定了文化遗迹与自然特征(如坡度和植被)之间的协变性。定量方法的发展和更多适用数据的可用性导致了1960年代该学科的发展,到1980年代后期,全球主要土地管理者取得了实质性进展。
通常,考古学中的预测建模正在建立自然代理(例如土壤类型、海拔、坡度、植被、与水的接近程度、地质学、地貌学等)与考古特征的存在之间的统计上有效的因果关系或协变量关系。通过对经过考古调查的土地的这些可量化属性进行分析,有时可以根据这些地区的自然代理来预测未调查地区的“考古敏感性”。美国的大型土地管理者,如土地管理局(BLM)、国防部(DOD),许多公路和公园机构都成功地采用了这一策略。通过在他们的文化资源管理计划中使用预测模型,他们能够在规划可能需要地面干扰并随后影响考古遗址的活动时做出更明智的决策。
客户关系管理
预测建模广泛用于分析客户关系管理和数据挖掘,以生成描述客户采取特定行动的可能性的客户级模型。这些操作通常与销售、营销和客户保留相关。
例如,移动电信运营商等大型消费者组织将拥有一套用于产品交叉销售、产品深度销售(或追加销售)和流失的预测模型。对于这样的组织来说,现在更常见的是使用提升模型来建立可保存性模型。与标准的流失预测模型相反,这预测了在合同期结束时可以挽救客户的可能性(流失概率的变化)。
汽车保险
车辆保险中使用预测模型根据从保单持有人获得的信息将事故风险分配给保单持有人。这广泛用于基于使用的保险解决方案,其中预测模型利用基于遥测的数据来构建索赔可能性的预测风险模型。黑盒汽车保险预测模型仅利用GPS或加速度计传感器输入。一些模型包括基本遥测之外的广泛预测输入,包括高级驾驶行为、独立碰撞记录、道路历史和用户档案,以提供改进的风险模型。
保健
2009年,ParklandHealth&HospitalSystem开始分析电子病历,以使用预测模型来帮助识别再入院风险较高的患者。最初,医院专注于充血性心力衰竭患者,但该项目已扩展到包括糖尿病、急性心肌梗塞和肺炎患者。
2018年,班纳吉等人。提出了一种深度学习模型——ProbabilisticPrognosticEstimatesofSurvivalinMetastaticCancerpatient(PPES-Met)——通过分析电子医疗中的自由文本临床笔记来估计患者的短期预期寿命(>3个月)记录,同时保持时间访问顺序。该模型在大型数据集(10,293名患者)上进行了训练,并在单独的数据集(1818名患者)上进行了验证。它实现了ROC(接收器操作特性)下的区域)曲线为0.89。为了提供解释能力,他们开发了一种交互式图形工具,可以提高医生对模型预测基础的理解。PPES-Met模型的高精度和可解释性可能使该模型能够用作决策支持工具来个性化转移性癌症治疗并为医生提供有价值的帮助。
算法交易
交易中的预测建模是一个建模过程,其中使用一组预测变量来预测结果的概率。可以为股票、期货、货币、商品等不同资产建立预测模型。预测模型仍然被贸易公司广泛用于制定策略和交易。它利用数学上先进的软件来评估价格、成交量、持仓量和其他历史数据的指标,以发现可重复的模式。
潜在客户跟踪系统
预测模型给出了铅发电机先拔头筹的预测数据驱动的结果对于每一个潜在的竞选。这种方法可以节省时间并暴露潜在的盲点,以帮助客户做出更明智的决策。
预测建模的显着失败
尽管主流预测建模社区并未广泛讨论,但预测建模是过去在金融业中广泛使用的一种方法,其中一些重大失败导致了2007-2008年的金融危机。这些失败体现了完全依赖本质上是向后看的模型的危险。以下示例绝不是完整列表:
1)债券评级。标准普尔、穆迪和惠誉用称为评级的离散变量量化债券违约的概率。评级可以采用从AAA到D的离散值。评级是基于与xxx人相关的各种变量和历史宏观经济数据的违约风险预测指标。评级机构未能对6,000亿美元抵押xxx支持的抵押债务义务(CDO)进行评级)市场。CDO市场的几乎整个AAA部门(以及超级AAA部门,评级机构提供的代表超级安全投资的新评级)在2008年都违约或严重降级,其中许多获得评级的时间还不到一年。
2)到目前为止,没有任何统计模型试图根据历史数据来预测股票市场价格,这些模型被认为可以长期一致地做出正确的预测。一个特别令人难忘的失败是LongTermCapitalManagement的失败,该基金聘请了包括诺贝尔经济学奖获得者在内的高素质分析师来开发复杂的统计模型,以预测不同证券之间的价差。这些模型产生了令人印象深刻的利润,直到发生重大崩溃,导致当时的美联储主席艾伦格林斯潘介入,促成华尔街的救援计划经纪交易商,以防止债券市场崩溃。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/124686/