量化涉及的数据
涉及的数据
量化交易需要对大量的数据进行定量分析,数据是量化交易的基础资源,交易者可以使用的数据越多,在构建量化策略时就越有优势
基础数据
- 股票列表、名称、简称、代码、地域、行业、在哪个交易所上市、上市日期、上市状态、是否 ST 等等
- 交易所交易日历,不管是回测、模拟交易还是实盘交易,都只能在交易日进行
行情数据
- 各种标的(股票、指数、可转债等)的基本行情数据:交易日期和时间、开盘价、最高价、最低价、收盘价、昨收盘价、成交量、成交额、换手率。需要注意的是基本行情数据有复权和未复权之分,如果获取的是未复权的数据,使用前要先用复权因子进行复权 根据数据的时间频率,基本行情数据可以分为:月线行情、周线行情、日线行情、小时行情、分钟行情、Tick 数据等。通常来说,数据的时间颗粒越精细,数据中包含的交易信息越丰富,数据的价值越大,相应的数据获取的成本也越高
- 复权因子。复权因子用于将未复权的数据调整为复权后的数据
- 每日的停复牌信息。停牌的股票没有行情数据,也不能交易。策略回测要跟实际情况符合,股票在停牌期间就不能买卖
- 估值数据,包括每个交易日的:市盈率、市净率、市销率、股息率、总股本、流通股本、自由流通股本、总市值、流通市值、自由流通市值等
- 资金流数据,包括每个交易日的:小单、中单、大单、特大单的买入量、买入金额、卖出量、卖出金额等。需要注意在不同的数据来源中大中小单的划分标准各不相同
- 每日的涨跌停价格、涨跌停和炸板情况。在策略回测时要注意涨停的股票无法买进,跌停的股票无法卖出。但不同的交易市场在不同的历史期间涨跌停的标准是有变化的,而且由于股票的最小交易金额是1分钱,某只股票的涨跌停价格也不会正好是10%或20%。获取每日的涨跌停数据,有助于我们准确判断股票当日是否涨停或跌停
财务数据
- 利润表、资产负债表、现金流量表的各个项目的数据、报告期、公告日期
- 业绩预告和业绩快报的数据
- 审计意见
- 各种财务指标数据 使用财务数据要注意两个方面,一是财务数据是滞后的,不像行情数据这么及时;二是要注意公告日期,因为在公告日期之后才能获取到相关的财务数据,这在策略回测时要特别注意
公司资料
- 股东数据:股东人数、公司前十大股东、前十大流通股东、主要股东增减持
- 管理层数据:管理层简介、管理层薪酬和管理层持股
- 股权质押数据
- 股票回购数据
- 限售股解禁的数据
- 大宗交易的数据
- 上市公司分红送股(除权除息)数据
市场数据
- 沪深港通数据,包括:北向资金、南向资金、沪深港通十大成交股等。跟随北上资金的策略会用到这些数据
- 融资融券数据,包括:融资融券标的、融资融券交易明细等
- 龙虎榜数据
行业、指数、概念数据
- 行业、指数、概念的列表
- 行业、指数、概念的成分股。成分股的范围是动态变化的,要注意成分股的纳入时间和剔除时间,在用历史数据进行回测时要与实际相符
公募基金数据
- 基金管理人、基金经理的数据
- 基金规模
- 基金历史净值数据
- 基金持仓数据
可转债数据
- 可转债基本信息
- 可转债行情数据。除了基本行情数据外,可转债的纯债价值、纯债溢价率、转股价值、转股溢价率也是重要的数据。
- 可转债的转股价格
- 可转债的转股情况
- 可转债的赎回信息
宏观数据
包括各项宏观经济指标的数据:国内生产总值(GDP)、各类利率、居民消费价格指数(CPI)、工业生产者出厂价格指数(PPI)、货币供应量、固定资产投资情况、社会消费品销售总额、货物进出口总额、各种景气指数等等
机构数据
- 券商盈利预测的数据
- 券商月度金股的数据
- 机构调研数据
其他数据
例如:新闻、公告、社交媒体上的数据等