易明智能建模

一键式智能数据建模

手工建模

  • 探索数据?
  • 数据噪音?
  • 时间特征?
  • 高基数变量?
  • 模型需求多?
  • 如何有效评估模型?
  • 非正态分布?
  • 标准化?
  • LR, RF,GBDT…..使用哪种算法?
  • 项目周期长?
  • 缺失值?
  • 参数配置?
VS

易明智能建模

建模流程完全自动进行。一键式建模,又快又好!
无需数据科学家即可建模

建模过程

需要数据科学家完成的众多人工任务
  • 数据输入
  • 建模数据预处理
  • 人工建模
  • 模型表现
  • 模型输出
    • 变数识别
    • 基本统计量产生
    • 异常值处理
    • 缺失值处理
    • 高基数变量处理
    • 数据平滑处理
    • 数值变量智能筛选
    • 添加衍生变量
    • 筛选重要变量
    • 优化设置模型参数
    • 选择建模方法
    • 自动筛选重要变量
    • 自动优化设置模型参数
    • 自动优化选择建模方法
    • AUC
    • GINI
    • MSE
    • LIFT
    • KS
    • RECALL RATE...z
  • 数据输入
  • 数据自动预处理
  • 智能建模
  • 模型表现
  • 模型输出
  • 原本要数据科学家完成的人工任务,智能建模工具一键完成,并确保模型质量和稳定性

    易明智能建模过程

    1.变量类型识别

    2.变量统计

    3.自动预处理+建模

    4.多种模型评估指标

    易明智能建模架构

    为什么是我们?

    统计学专家毕生追求的呕心力作

    数十年数据挖掘建模的实战经验,参与和主持过多次国内外银行、保险业数据挖掘项目,屡次带队在国际SAS大赛中获奖。

    研发团队的扛鼎力作

    深刻的数学理解能力、超强的软件实现能力、业界领先的高性能大数据技术。

    案例:个人信贷违约预测

    目标

    • 建立信贷违约模型,给出用户信贷违约概率
    • 给出用户合理的信贷额度
    • 让业务人员根据经验选择数据建模,帮助业务人员接受模型的应用与普及
    • 提高违约客户捕获率

    痛点

    • 找到合理的数据维度
    • 高基数与非线性问题对模型的影响
    • 挑选合理的模型或者模型组合
    • 阳性样本少,避免模型过拟合

    建模结果对比

    智能建模 传统建模
    人数 1 1
    建模时间 5分钟(数据预处理+建模) 2个月
    建模数量 1 1
    数据规模 100000+ / 28MB 100000+/ 28MB
    模型AUC 0.9728(测试集0.965) 0.957

    模型表现(测试集)

    案例:理财产品精准营销

    客群1 客群2 客群3 客群4
    建模人数 1 1 1 1
    模型数量 13 13 13 13
    建模时间 1.5小时/个 1.5小时/个 1分钟/个 2分钟/个
    数据量 134万 155万 6400 1.2万
    累计提升度 累计捕获率 AUC值
    前5% 14.4 72% >0.9
    前10% 9.4 94%
    前15% 6.3 94.5%
    前20% 4.8 96%

    当前该产品购买率为1.72%

    1. 使用模型前5%的数据比不使用模型效果提升 14.4倍购买率。 即每一百名精选的客户,可以完成24.77次交易,远高于平均每百名客户成交1.72次。
    2. 由模型抓取的前5%的数据中,可以捕获72.0%的目标客户。由模型抓取的前20%的数据中,可以捕获96.0%的目标客户。

    智能建模 VS 手工建模

    模型数量 时间 项目参与人数
    智能建模 50-60个 2周 1人
    手工建模 不适合大量建模 1周~2个月/个
    (实际取决于模型复杂程度和建模人员水平,时间不可控)
    数人

    易明智能建模特点

    人工智能少人工
    自动建模

    效率高

    非数据科学家

    成本低

    模型完善

    准确率高

    智能建模改变应用模式:业务用户主导,应用过程中随时随地建模。