比如训练集中有两列特征X1和X2,现在分别对每一列特征乘以1000,构造数据集A,再对原始的每一列特征除以1000 构造数据集B,
问:在这两个训练集下训练的LR模型,哪个具有过拟合的风险?为什么?
1个回答
如果原来的特征X1和X2不存在共线性,那么数据集A里这两个放大的特征,也不会存在共线性的问题,所以没有过拟合的情况。
数据集B和上面的情况类似,数据集也只有2个特征,所以不大会过拟合。即使它们会过拟合,也和乘除无关吧。
SofaSofa数据科学社区DS面试题库 DS面经
				学习了
				- 
             Pan
           
				
          
          2019-08-27 15:23
			
    
  相关讨论
  随便看看