如何将高频金融数据导入R语言,构建大数据部落分析平台?
- 内容介绍
- 文章标签
- 相关推荐
本文共计530个文字,预计阅读时间需要3分钟。
R包highfrequency用于处理高频数据,便于组织高频数据、清理和整理高频数据,以及汇总高频数据。它还支持使用高频数据建立相关模型,操作非常方便。然而,在数据输入过程中,会使用到该包。
R中针对高频数据的添加包highfrequency,用于组织高频数据, 高频数据的清理、整理,高频数据的汇总,使用高频数据建立相关模型 都非常方便。但是其中数据输入的过程中,会使用到包里的函数convert()。该函数支持三类的高频数据:
NYSE TAQ数据库中的.txt文件
WRDS数据库中的.csv文件
Tickdata.com的.asc文件
不易获取,因此,输入数据转换成xts,然后进行时间序列分析的过程中存在困难。
因此对于原始数据,我们可以整理成sample数据的格式,然后使用xts包先将其转换成xts格式。
对于时间序列数据要注意的一点是时间数据不单独作为一列,仅作为行名存在,否则在进行转换的过程中会出现colnames和列的数目不符合的错误。
因此对于数据可以先进行预处理。
对于列数据间分隔建议使用tab制表符,否则在r读取的过程中会将时间的日期时间识别为两列。
本文共计530个文字,预计阅读时间需要3分钟。
R包highfrequency用于处理高频数据,便于组织高频数据、清理和整理高频数据,以及汇总高频数据。它还支持使用高频数据建立相关模型,操作非常方便。然而,在数据输入过程中,会使用到该包。
R中针对高频数据的添加包highfrequency,用于组织高频数据, 高频数据的清理、整理,高频数据的汇总,使用高频数据建立相关模型 都非常方便。但是其中数据输入的过程中,会使用到包里的函数convert()。该函数支持三类的高频数据:
NYSE TAQ数据库中的.txt文件
WRDS数据库中的.csv文件
Tickdata.com的.asc文件
不易获取,因此,输入数据转换成xts,然后进行时间序列分析的过程中存在困难。
因此对于原始数据,我们可以整理成sample数据的格式,然后使用xts包先将其转换成xts格式。
对于时间序列数据要注意的一点是时间数据不单独作为一列,仅作为行名存在,否则在进行转换的过程中会出现colnames和列的数目不符合的错误。
因此对于数据可以先进行预处理。
对于列数据间分隔建议使用tab制表符,否则在r读取的过程中会将时间的日期时间识别为两列。

