自己生成了一些组合特征,将一些特征独热编码了,用的GBDT或者XGB模型,要不要用模型之前先进行特征选择?要的话用什么方法进行特征选择好?加入weather特征独热编码后要不要删掉原来的weather特征?然后有些大佬说多个模型融合效果好,基于单个模型的线性回归等得到的RMSE都是20-30左右,而单个GBDT、XGB、RF调下参就有15左右,那选择哪几个模型融合效果会较好呢?哪位排名靠前的大佬分享下思路呗。。
2个回答
请问一下大佬计算RMSE时,测试集的真实值提供了吗?
SofaSofa数据科学社区DS面试题库 DS面经
				测试集的没有提供啊,提供的话每个人都是满分了
				- 
             abuu
           
				
          
          2020-03-19 16:21
			
				那计算RMSE值怎么算,不是需要预测值和真实值才能算吗
				- 
             Super Wang
           
				
          
          2020-03-19 16:40
			
				系统里肯定有的吧,在后台计算的,没有在网站上公布真实值
				- 
             abuu
           
				
          
          2020-03-20 08:47
			
				那楼主的RMSE值不是自己算的吗,怎么看RMSE的值呢?
				- 
             Super Wang
           
				
          
          2020-03-20 12:53
			
				真实值的RMSE您提交了就能看到了,系统每两小时更新一次。测试集的RMSE可以自己做交叉验证。
				- 
             SofaSofa驹炜
           
				
          
          2020-03-20 21:44
			
    
  相关讨论
  随便看看