预测生成器

预测生成器可以为业务创建个性化预测。无需手动进行数据的提取、转换和加载（ETL）、选择和调整预测算法，更无需考虑模型部署和再训练的繁琐细节。设置完成后，模型的训练和评分过程将自动在后台进行，预测结果可以存储于数对象的自定义字段，不仅优化了用户体验，也为业务决策提供了即时的数据支持，使预测的应用更加直接和高效。下面，我们将使用预测生成器进行商机预测为例，介绍预测生成器的详细功能。

下面将带您了解使用预测生成器建立预测模型解决业务实际需求的六个步骤。

第 1 步：定义用例

精准的预测和分析是提升业绩的关键。以下是一些通过预测模型可以显著改善的实际业务场景：

销售线索转化评分：通过分析销售线索的转化过程，预测模型可以帮助识别那些最有可能转化为商机的线索。这不仅提高了转化率，还优化了资源分配，确保团队将精力集中在最有潜力的线索上。
潜在客户管理优化：预测模型能够分析潜在客户的行为和偏好，预测他们转化为订单的可能性。这样，销售团队可以更有效地管理潜在客户关系，减少无效跟进，提高转化效率。
商机转化率增强：在商机阶段，预测模型可以预测订单成交的可能性，帮助团队识别关键的成交障碍。通过针对性的策略调整，可以提高商机的成交率，减少资源浪费。

第 2 步：生成训练数据集

预测生成器支持创建数据集，并基于数据集训练预测模型。

数据集管理入口： 设置/AI平台管理/预测生成器/数据集管理

功能按钮：

新建：点击【新建】按钮，可新建数据集。
删除：可删除不使用数据集，删除后，模型训练时将不可使用该数据集。

新建数据集入口

新建数据集的步骤为：

1. 选择数据集范围：

支持选择所有预置对象以及自定义对象；
增加数据集过滤条件，对对象数据进行细分，例如：以时间范围 ,生成一份三个月以前的商机数据集。

注意：在导入数据集时，由于近期数据还未跟进完成，无法确定近期商机数据对应标签（赢单/输单），因此，在尽量不要选择近期数据训练模型。

2. 选择特征：

选择业务对象字段加入数据集；
数据集最少选择3个特征，最多选择100个特征；

选择数据集范围

选择特征

第 3 步：创建预测模型

预测生成器可以处理以下类型的预测：

二分类预测（例如：商机是/否赢单）

模型管理入口： 设置/AI平台管理/预测生成器/模型管理；

功能按钮：

新建：点击【新建】按钮可新建预测模型。
模型报告：点击进入模型报告后可查看模型表现、以及模型设置，并可进行模型重训。
编辑：点击编辑后可以替换模型特征进行模型重训。
移除：移除模型后，已部署该模型的前端模型预测组件将失效，移除前请将该模型与组件解绑。
发布：可发布训练完成状态模型，发布后可在预测模型组件中部署该模型。
停用：停用已发布状态模型，停用后将不可使用。

新建预测模型入口

新建预测模型的步骤为：

1. 设置模型基础信息

模型名称：输入框，最多支持50字符；
模型描述：长文本，支持500字符；
选择数据集：单选下拉选择已导入成功数据集；

设置模型基础信息

2. 数据集标注。
目标字段：从数据集中的字段中，选择要预测的值，仅支持类型为【单选】的字段；例如：若要预测商机赢单概率，则将商机对象的状态字段设置为目标字段。
期望字段值：目标字段中的某个枚举值，用于将符合该期望值的目标字段标记为正样本；例如，若要预测商机赢单概率，则将赢单状态的商机标注为正样本，期望字段值选择赢单即可。

数据集标注

3. 选择特征方式
支持选择【自动】【手动】两种，默认选中自动；

自动：选择自动后，系统会自动进行预先进行一轮模型推理，并基于模型自动推荐适合的字段，字段会自动选择12个特征，用户可再自行调整。
手动：点击后，系统会直接跳到特征选择页面，默认为空，用户可自行选择，特征选择至少3条，最多30条。

为了降低特征噪声，提高模型预测准确率，我们总结了以下特征筛选原则以供参考：
特征筛选的原则:

去除空缺太高的字段，推荐选择空缺率<50%的字段；
去除信息过于分散的字段，例如 id , 或一些每个数据都独特的字段如备注)；
去除在目标变量确认之后才填写的数据，例如商机阶段和失败原因字段；
去除PSI过大的值，PSI表示字段值分布在不同时期的变化，例如2022年的线索20%转换，而2023年的线索90%都转换，说明此类字段的PSI较大；推荐使用<25%的字段
去除偏离值较大的值，偏离值表示字段"个例"的情况有多少，例如“所属地区在北京”占比90%以上；推荐偏离值<50%的字段。