基于因果推断与机器学习方法，研发Uplift精准营销分析系统，已搭建可交互网页应用在线体验，支持用户上传数据，自动完成模型训练、评估、预测人群、策略分组及后续 AB 流量评估闭环。

构建以 S-Learner 为核心的 Uplift 模型训练模块，使用 Gradient Boosting Decision Tree 预测个体化干预效应
实现 Qini 曲线、AUUC、Decile 分组等评估指标，验证排序有效性和单调性
支持基于 SHAP 差值的 uplift 可解释性分析（全局 + 单用户级别）
提供策略推送模拟工具，可按 uplift 分数自动 Top-K 分组并模拟 ROI 效果
实现实验组 vs 对照组的闭环 A/B 评估与数据采集模块，支持策略二次迭代优化

系统具备完整因果闭环能力，适用于营销投放、用户召回、会员运营等场景，已部署上线供实际使用和演示。

项目介绍

✅ 系统流程概览

flowchart TD
    A[上传用户数据 X T Y] --> B[SLearner 模型训练 fx]
    B --> C[模型评估输出]
    C --> C1[Decile 验证单调性]
    C --> C2[Qini 曲线绘制]
    C --> C3[AUUC 指标输出]
    B --> D[ROI 模拟评估]
    B --> M[SHAP uplift 差值解释]
    D --> M1[整体特征贡献度分析]
    D --> M2[单样本 SHAP 可视化]
    B --> E[新人群预测与策略输出]
    E --> F[TopK 分群 AB 分组 随机一半]
    F --> G[实验转化数据收集]
    G --> H[效果评估与 ROI 分析]
    H --> A

📥 1. 数据上传模块

用户上传数据需包含字段：
- X: 用户特征（结构化）
- T: treatment 标记（0=control, 1=treatment）
- Y: outcome 是否转化
数据校验：
- 样本量是否充足（推荐每组 ≥ 1000）
- treatment/control 分布是否过于失衡
- 特征缺失值检查

🌲 2. 模型训练：S-Learner

模型形式为：f(x, t)，即将 treatment 作为特征一同输入
uplift 分数 = f(x, t=1) - f(x, t=0)
推荐使用 GBDT 作为底层模型（如 XGBoost, LightGBM）

📊 3. 模型评估模块

📈 Decile Analysis

将用户按 uplift 分数从高到低划分为 10 组
验证 uplift 是否具有良好的排序性和单调性

📉 Qini 曲线

横轴：人群比例，纵轴：累积 uplift
对比随机 baseline，判断模型排序是否有效

📐 AUUC 指标

Qini 曲线下的面积（Area Under Uplift Curve）
AUUC 越大表示模型排序效果越好

🔍 4. SHAP uplift 差值解释模块

使用 SHAP 分别计算 f(x, t=1) 与 f(x, t=0) 的 SHAP 值
差值即为 uplift 的解释来源

✅ 全局解释：

shap.summary_plot(shap_t1 - shap_t0, X)

✅ 单样本解释：

shap.plots.waterfall(...)

🧠 5. 新人群预测与策略分组

上传新用户特征 X_new
模型预测 uplift 分数
选择 Top-K% 作为候选人群
候选人群中随机 1/2 分为 A（发券）组，1/2 为 B（对照）组

[
  {"user_id": 123, "uplift": 0.25, "group": "A"},
  {"user_id": 456, "uplift": 0.24, "group": "B"}
]

📈 6. 实验流量与 ROI 估算模块

示例输入：

DAU：100w
发券目标：Top 10% → 10w 用户
uplift：1%
成本：¥2/张券
GMV：¥100/转化

关键指标计算：

多转化人数 = uplift × 发券人数 = 10w × 1% = 1000
GMV = 1000 × ¥100 = ¥100,000
成本 = 10w × ¥2 = ¥200,000
ROI = (GMV - 成本) / 成本 = (100000 - 200000) / 200000 = -50%

🔁 7. 实验数据收集与闭环迭代

收集结构为：X, T, Y
可用于：
- 再评估 uplift 效果是否真实体现
- 作为新一轮训练数据继续 fine-tune 模型

ZYX HOME

Explorer

Uplift精准营销分析系统

项目介绍

✅ 系统流程概览

📥 1. 数据上传模块

🌲 2. 模型训练：S-Learner

📊 3. 模型评估模块

📈 Decile Analysis

📉 Qini 曲线

📐 AUUC 指标

🔍 4. SHAP uplift 差值解释模块

✅ 全局解释：

✅ 单样本解释：

🧠 5. 新人群预测与策略分组

📈 6. 实验流量与 ROI 估算模块

示例输入：

关键指标计算：

🔁 7. 实验数据收集与闭环迭代

Graph View

Table of Contents

Backlinks