- · 《船舶标准化与质量》栏[06/30]
- · 《船舶标准化与质量》收[06/30]
- · 《船舶标准化与质量》投[06/30]
- · 《船舶标准化与质量》征[06/30]
- · 《船舶标准化与质量》刊[06/30]
金融论文_基于数据挖掘的上市公司高送转预测研
作者:网站采编关键词:
摘要:文章目录 0 引言 1 算法介绍 1.1 Lasso回归 1.2 PCA降维 1.3 逻辑回归算法 1.4 支持向量机算法 1.5 XGBoost算法 2 数据及数据处理 2.1 实验环境 2.2 数据介绍 2.3 数据处理 2.3.1 数据合并 2.3.2 使用独
文章目录
0 引言
1 算法介绍
1.1 Lasso回归
1.2 PCA降维
1.3 逻辑回归算法
1.4 支持向量机算法
1.5 XGBoost算法
2 数据及数据处理
2.1 实验环境
2.2 数据介绍
2.3 数据处理
2.3.1 数据合并
2.3.2 使用独热编码处理‘所属行业’特征
2.3.3 通过观察法和数理统计进行特征筛选
2.3.4 计算出标签‘下一年是否发生高送转’列作为标签值
2.3.5 使用Lasso回归和PCA对数据进行降维
2.3.6 数据标准化
1)标准差标准化
2)离差标准化
3 高送转预测和模型评估
3.1 高送转预测
3.2 模型比较
4 结束语
文章摘要:选择逻辑回归(logistic regression)模型、支持向量机(support vector machine)模型以及XGBoost(extreme gradient boosting)三种模型,通过各公司前七年的数据对下一年是否会发生高送转进行预测.首先,求出日数据中每年的最后一个月即12月的日平均值,并将日数据、年数据和基础数据合并为总数据.通过观察法删除其中的无用特征,随后删除缺失比例达到0.7以上的数据行和特征,并使用平均值填充剩余特征的方法填充缺失值.对来自‘基础数据’的‘所属行业’特征进行独热编码.随后使用Lasso回归处理共线性,并使用PCA(principal components analysis)对数据进行降维处理;使用标准差标准化的方法对数据进行标准化处理.数据清洗和预处理完成之后,使用逻辑回归、支持向量机、XGBoost三种模型,对股票下一年是否发生高送转进行预测,使用交叉验证指标分别对三种模型的预测结果进行评估.最后得出结论:对于大型投资商而言,使用XGBoost算法为股票投资进行决策支持是综合更优的选择;而对于中小型投资者来说,使用逻辑回归模型的预测结果是一种更保险的方式.
文章关键词:
论文作者:江琛 夏晓玲 吴伟 崔海波 马传香
论文分类号:F832.51
文章来源:《船舶标准化与质量》 网址: http://www.cbbzhyzl.cn/qikandaodu/2021/1103/1458.html