在该项目中,构建并训练了 XG-Boost 分类器来预测一个人是否有患宫颈癌的风险。数据来自委内瑞拉加拉加斯“加拉加斯大学医院”的 858 名患者,包括怀孕次数、吸烟习惯、性传播疾病 (STD)、人口统计和历史医疗记录等特征。对训练数据集进行探索性数据分析和数据可视化。在模型训练之前准备数据并分为训练和测试数据集。使用 Python 中的 sci-kit 库针对此任务对 XG-Boost-Algorithm 进行了训练和评估。该机器学习模型的准确度为:0.997(训练数据集)0.953%(测试数据集)
数据展示
数据来自委内瑞拉加拉加斯“加拉加斯大学医院”的 858 名患者,包括怀孕次数、吸烟习惯、性传播疾病 (STD)、人口统计和历史医疗记录等35个特征。详细的
![图片[1]-基于XG-Boost B预测宫颈癌-点头深度学习网站](https://venusai-1311496010.cos.ap-beijing.myqcloud.com/wp-content/upload-images/2023/12/20231212184037435-1024x644.png)
绘制热力图进行相关性分析
![图片[2]-基于XG-Boost B预测宫颈癌-点头深度学习网站](https://venusai-1311496010.cos.ap-beijing.myqcloud.com/wp-content/upload-images/2023/12/20231212185022661-950x1024.png)
模型搭建与训练
!pip install --upgrade pip
!pip install seaborn
!pip install xgboost
import xgboost as xgb
model = xgb.XGBClassifier(learning_rate = 0.1, max_depth = 50, n_estimators = 100)
model.fit(X_train, y_train)
验证结果可视化
![图片[3]-基于XG-Boost B预测宫颈癌-点头深度学习网站](https://venusai-1311496010.cos.ap-beijing.myqcloud.com/wp-content/upload-images/2023/12/20231212191255148-1024x570.png)
项目资源下载
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容