- 探索数据?
- 数据噪音?
- 时间特征?
- 高基数变量?
- 模型需求多?
- 如何有效评估模型?
- 非正态分布?
- 标准化?
- LR, RF,GBDT…..使用哪种算法?
- 项目周期长?
- 缺失值?
- 参数配置?
数十年数据挖掘建模的实战经验,参与和主持过多次国内外银行、保险业数据挖掘项目,屡次带队在国际SAS大赛中获奖。
深刻的数学理解能力、超强的软件实现能力、业界领先的高性能大数据技术。
智能建模 | 传统建模 | |
---|---|---|
人数 | 1 | 1 |
建模时间 | 5分钟(数据预处理+建模) | 2个月 |
建模数量 | 1 | 1 |
数据规模 | 100000+ / 28MB | 100000+/ 28MB |
模型AUC | 0.9728(测试集0.965) | 0.957 |
客群1 | 客群2 | 客群3 | 客群4 | |
---|---|---|---|---|
建模人数 | 1 | 1 | 1 | 1 |
模型数量 | 13 | 13 | 13 | 13 |
建模时间 | 1.5小时/个 | 1.5小时/个 | 1分钟/个 | 2分钟/个 |
数据量 | 134万 | 155万 | 6400 | 1.2万 |
累计提升度 | 累计捕获率 | AUC值 | |
---|---|---|---|
前5% | 14.4 | 72% | >0.9 |
前10% | 9.4 | 94% | |
前15% | 6.3 | 94.5% | |
前20% | 4.8 | 96% |
当前该产品购买率为1.72%
模型数量 | 时间 | 项目参与人数 | |
---|---|---|---|
智能建模 | 50-60个 | 2周 | 1人 |
手工建模 | 不适合大量建模 | 1周~2个月/个 (实际取决于模型复杂程度和建模人员水平,时间不可控) |
数人 |
智能建模改变应用模式:业务用户主导,应用过程中随时随地建模。