将此人工智能预测模型想象成一棵树。每个内部节点(新分支的起源点)代表一个数据特征。每个分支代表决策规则,叶子显示可能的结果。
使用基尼杂质、熵或均方误差 (MSE) 等方法将输入数据划分为特征进行回归。它不断分裂节点和分支,直到每个属性都达到结果。
当我们将测试数据插入模型时,模型将数据分解为属性,并将它们与树中的属性进行比较。然后它跟踪这些属性,直到达到结果并将其声明为最终预测。
决策树模型的示例一家拥有众多员工的公司希望评估绩效以确定适合晋升或培训的人员。
人力资源团队可以将员工数据输入模型并设置目标预测 - 例如绩效评级(高、中或低)。决策树将数据拆分为工作年限、教育程度、部门、出勤记录等特征,并与目标预测进行比较。
随着树的发展,模型会识别出达到目标的员工。它还可能找到一种将以前晋升的员工联系起来的模式,例如更高的教育水平和在特定部门的多年经验、参加特定的培训计划等。通过这些预测,人力资源部门可以就晋升、培训和培训做出明智的决策。人才管理。
随机森林随机森林模型结合了多个决策树,可以更准确地进行预测。与决策树模型不同,决策树模型的每个内部节点都有不同的对于数据子集,在随机森林中,我们在不同的数据子集上训练每棵树。这有助于模型避免从不同子集中学习随机波动或噪声,从而导致错误的预测。
我发现最有趣的是该方法如何将数据子集随机分配给每个决策树,以确保树不会全部学习相同的模式,从而增加森林的多样性。然后,该模型通过聚合每棵树的预测来进行单个预测,方法是通过平均(对于数值)或多数投票(对于二元或多选结果)。
随机森林模型的示例一家电信公司希望通过预测哪些客户可能会离开来减少客户流失。首先,他们将收集有关客户行为的历史数据,包括服务使用情况、支持交互、计费历史记录、人口统计数据和过去的客户流失情况。他们还将考虑支持电话频率、客户任期和付款方式等指标pes(每月或每年)。
接下来,他们将这些数据输入到随机森林模型中,并将每个属性分配给不同的树以训练和识别模式。训练后,公司插入新数据进行测试,模型会将这些数据传递给树。然后,该公司利用这些见解来实施有针对性的保留策略,以减少客户流失。
使用人工智能进行预测的挑战 缺乏人类专业知识组织投资先进的人工智能工具,但往往忽视雇用了解如何使用这些工具的技术人员。
“预测工具擅长做出预测。他们不擅长解释。绝对不是将预测转化为可行的业务战略。你需要人类,” 的首席供应链官说道。
我同意 Gangulee 的观点,并坚信有能力的人应该引领人工智能的一切。合适的团队充当护栏,确保您的预测准确。
数据质量和 Ava无力要获得最佳的 AI 预测结果,您需要拥有相关且可访问的高质量数据。不幸的是,许多企业都面临着数据不准确、不一致和信息缺失等问题。这种情况很常见,因为很难找到实时准确的数据,尤其是在数据来自不同来源的行业中。这还意味着公司必须清理数据并检查错误。
跨解决方案架构副总裁的话完美地总结了这一点:如果您的 AI 预测模型给出了错误的预测,您可能应该检查您提供给它的数据。
模型复杂性和可解释性另一个挑战? Walch 说得最好:“过于复杂的预测模型并不等于准确的模型。”
我同意。我发现理解我在本文中讨论的一些模型如何运作非常困难,即使专家用简单的术语解释了它们。我只能想象对于数据分析师来说,追踪这些模型如何实现预测是多么困难和耗时。这种复杂性会削弱对模型的信任并导致资源浪费。我建议企业平衡其对准确性和简单性的需求。通过选择更简单的模型,组织可以从更清晰、更易于实施的预测中受益。
使用人工智能进行预测人工智能预测方法可以帮助您在竞争中保持领先地位。借助充足的历史数据、熟练的数据分析师和准确的模型,您可以取得显着的成果。
但是,谨慎使用预测工具的预测非常重要。在我之前提到的 Target 故事中,该公司甚至在顾客告诉亲人之前就预测了她们怀孕的情况。这是否会引起对隐私和个人数据使用的担忧?当然。尽管塔吉特没有遇到任何问题,但他们的故事对于处理个人信息资源的公司来说是一个警示。负责任地使用人工智能预测工具。
来源:hubspot