我的任务利用13到16年的NBA比赛统计数據去预测17年的每场NBA比赛。数据是从这个网站获得的前期参考了这里的分析与实现方法。这个实验楼里实现用了LogisticRegression现在我想对数据做一些预处理,并且用其他分类方法做决策比较着看效果。Michael
用一个阈值来去除方差小的变量是一種最基础最方便的方法比如某个特征在所有样本中都是同一个值,那么这个特征没有什么信息量可以去掉。
分数评价标准对于分类有彡种分别是
- chi2 计算每个非负特征和类之间的卡方统计。
- f_classif 计算所提供样本方差的F统计值