如何使用Python进行大数据信用卡欺诈检测分析?
- 内容介绍
- 文章标签
- 相关推荐
本文共计655个文字,预计阅读时间需要3分钟。
一、背景与目标+ 本数据集包含使用信用卡进行金融交易的客户数据。+ 数据涉及的是指欧洲运营商的客户的2013年9月期间数据。+ 研究目标:构建一个预测模型,通过数据集预测相关金融交易。
一、背景和目的
该数据集包含使用信用卡进行的金融交易的数据。这些数据是指欧洲运营商的客户,指的是 2013/9年期间。
该研究的目的是创建一个预测模型,该模型能够从通过数据集获得的“学习”中识别欺诈交易。信用卡公司能够提前识别欺诈行为至关重要。
数据集内容
交易发生在两天内,总共 284,807 笔交易中有 492 笔是欺诈。数值变量是通过 PCA 变换(降维)获得的。
特征 V1、V2、… V28 是使用 PCA 获得的主成分,唯一没有使用 PCA 转换的特征是“时间”和“金额”。特征“时间”包含每个事务与数据集中第一个事务之间经过的秒数。特征“金额”是交易金额,该特征可用于依赖示例的成本敏感学习。特征“类”是响应变量,在欺诈的情况下取值为 1,否则为 0。
本文共计655个文字,预计阅读时间需要3分钟。
一、背景与目标+ 本数据集包含使用信用卡进行金融交易的客户数据。+ 数据涉及的是指欧洲运营商的客户的2013年9月期间数据。+ 研究目标:构建一个预测模型,通过数据集预测相关金融交易。
一、背景和目的
该数据集包含使用信用卡进行的金融交易的数据。这些数据是指欧洲运营商的客户,指的是 2013/9年期间。
该研究的目的是创建一个预测模型,该模型能够从通过数据集获得的“学习”中识别欺诈交易。信用卡公司能够提前识别欺诈行为至关重要。
数据集内容
交易发生在两天内,总共 284,807 笔交易中有 492 笔是欺诈。数值变量是通过 PCA 变换(降维)获得的。
特征 V1、V2、… V28 是使用 PCA 获得的主成分,唯一没有使用 PCA 转换的特征是“时间”和“金额”。特征“时间”包含每个事务与数据集中第一个事务之间经过的秒数。特征“金额”是交易金额,该特征可用于依赖示例的成本敏感学习。特征“类”是响应变量,在欺诈的情况下取值为 1,否则为 0。

