benchmark介绍¶

为了验证算法的准确性、帮助用户更好的使用EasyRec，我们做了大量的benchmark测试。我们还提供公开数据集、EasyRec配置文件，供用户更好的理解和使用EasyRec。

单目标数据集¶

在PAI上面测试使用的资源包括2个parameter server，9个worker，其中一个worker做评估:

{"ps":{"count":2,
       "cpu":1000,
       "memory":40000},
"worker":{"count":9,
          "cpu":1000,
          "memory":40000}
}

model	global_step	best_auc	config
MultiTower	1800	0.614680	taobao_mutiltower.config
DIN	1600	0.617049	din.config
DeepFM	1600	0.580521	deepfm.config
DCN	1500	0.596816	dcn.config
BST	3500	0.566251	bst.config
AutoInt	700	0.605982	autoint.config

该数据集是DSP广告公司Avazu在Kaggle平台举办的移动广告点击率预测模型挑战赛中使用的。Click-Through Rate Prediction比赛链接
训练数据表：pai_online_project.dwd_avazu_ctr_deepmodel_train
测试数据表：pai_online_project.dwd_avazu_ctr_deepmodel_test

在PAI上面测试使用的资源包括2个parameter server，9个worker，其中一个worker做评估:

{"ps":{"count":2,
       "cpu":1000,
       "memory":40000},
"worker":{"count":9,
          "cpu":1000,
          "memory":40000}
}

model	global_step	ctr auc	masked cvr auc	ctcvr auc	训练时间	config
SimpleMultiTask	4100	0.592606		0.6306802	1小时	simple_multi_task.config
MMoE	3100	0.5869702		0.6330008	1小时	mmoe.config
ESMM	800	0.5974812	0.6841141	0.6362526	3小时	esmm.config
PLE	3200	0.5874		0.6159	2小时	ple.config

CENSUS有48842个样本数据，每个样本14个属性，包括age, occupation, education, income等。样本的标注值为收入水平，例如>50K、<=50K。Census Income数据集链接
训练数据表：pai_online_project.census_income_train
测试数据表：pai_online_project.census_income_test