In [1]:
## 因子计算分析
 
import datetime

from tqsdk import TqApi, TqAuth
from tqsdk.tafunc import get_t, get_bs_price

import numpy as np
import pandas as pd
import plotly.express as px

pd.options.display.max_rows= None
pd.options.display.max_columns = None
pd.options.display.width = 0
pd.options.display.float_format = '{:.6f}'.format

在使用天勤量化之前，默认您已经知晓并同意以下免责条款，如果不同意请立即停止使用：https://www.shinnytech.com/blog/disclaimer/


In [2]:
# 标准 BS 定价模型假设波动律为常量, 但是波动率实际和时间相关, 这里扩展 BS 定价模型引入时间相关波动率并与标准模型进行对比
api = TqApi(auth=TqAuth('快期账户', '快期密码'))
quote = api.get_quote('CFFEX.IO2405-C-3550')
underlying = quote.underlying_symbol
exp = datetime.datetime.fromtimestamp(quote.expire_datetime)

2024-06-26 16:40:45 -     INFO - 通知 : 与 wss://api.shinnytech.com/t/nfmd/front/mobile 的网络连接已建立


In [3]:
# 获取沪深300指数过去一年的5分钟现数据，用来分析波动率
csi = api.get_kline_data_series(symbol=underlying, duration_seconds=300, start_dt=exp-datetime.timedelta(days=365), end_dt=exp)
# 将 unix time 转换成 pandas.Datetime 并获得周几及时间信息
csi["dt"] = pd.to_datetime(csi["datetime"], utc=True).dt.tz_convert('Asia/Shanghai')
csi["time"] = csi["dt"].dt.time
csi["week"] = csi["dt"].dt.weekday+1
# p 为每五分钟的波动率, 不计算跨交易时段的波动, 用来分析波动率的周期性
csi["p"] = np.log(csi["close"]/csi["open"])

In [4]:
# 可以看到周一到周五的波动率有显著性的差异
px.bar(csi.groupby("week").std(numeric_only=True), y="p")


In [5]:
# 每天不同时间段的波动率也有显著性的差异
# 早上及下午开盘的波动率显著偏高
# 注意这里的波动率是收盘价对比开盘价, 而不是收盘价对比上个收盘价, 因此 9:30 开盘的高波动率只包含集合竞价之后的价格波动, 不包含相对昨天收盘的波动
px.bar(csi.groupby("time").std(numeric_only=True), y="p")

In [6]:
# 按周一~五绘制出不同时段的波动率, 可以观察到周一的 9:30 又显著高于周二~五
px.line(csi.groupby(["week","time"]).std(numeric_only=True).reset_index(), x="time", y="p", color="week")

In [7]:
# 上述信息验证了波动率实际和时间相关的假设, 接下来基于该假设计算改进版的 BS 定价
# Tσ² = ∫σ²(dt)
# 其中 T 是距离到期时间, 按照波动率的周期性积分出改进版波动率
# 这里计算的 r 是使用当前周期的收盘价对比上一周期的收盘价, 使得积分的结果能够完整的覆盖 T
csi["r"] = np.log(csi["close"].shift(1)/csi["close"])
# 得到周一~五不同时间段的周期性收益率方差
csiv = csi.groupby(["week","time"]).var(numeric_only=True).reset_index()[["week", "time", "r"]]

In [8]:
# 只关注期权最后一周的行情数据
serial = api.get_kline_serial(symbol=[underlying, quote.instrument_id], duration_seconds=300, data_length=48*5)
serial["dt"] = pd.to_datetime(serial["datetime"], utc=True).dt.tz_convert('Asia/Shanghai')
serial["time"] = serial["dt"].dt.time
serial["week"] = serial["dt"].dt.weekday+1
# 最后一个交易日使用最后两小时的算数平均数作为交割结算价
serial["close_avg"] = serial["close"]
serial.iloc[-24:, serial.columns.get_loc("close_avg")] = serial["close"].iloc[-24:].expanding().mean()

In [9]:
# 将 csi 周期性收益率方差 join 期权价量信息, 计算出改进版波动率
serial = serial.merge(csiv, on=["week", "time"])

In [10]:
# v 为年化后的改进版波动率
serial["v"] = np.sqrt(serial["r"].iloc[::-1].expanding().mean()*48*250)

In [11]:
# 无风险利率 1.5%
rf = 0.015
# 距离到期的时间序列
t = get_t(serial, quote.expire_datetime)
# 行权价格的折现, 用于计算时间价值
serial["present_k"] = quote.strike_price * np.exp(-rf * t)
serial["time_value"] = (serial["close_avg"] - serial["present_k"]) - serial["close1"]
# 计算标准和改进版 BS 模型价格, 以及和实际期权价格的差
# 最后两小时使用算数平均作为交割结算价导致不能简单的使用波动率来估计交割结算价的变化, 因此跳过最后两小时
# v 为标准 BS 模型所用到的波动率
v = np.sqrt(np.var(csi["r"]) * 250*48)
serial["bs"] = get_bs_price(serial["close"].iloc[:-24], k=quote.strike_price, r=rf, v=v, t=t.iloc[:-24], option_class=quote.option_class)
serial["bs_diff"] = serial["bs"] - serial["close1"]
serial["tdbs"] = get_bs_price(serial["close"].iloc[:-24], k=quote.strike_price, r=rf, v=serial["v"].iloc[:-24], t=t.iloc[:-24], option_class=quote.option_class)
serial["tdbs_diff"] = serial["tdbs"] - serial["close1"]

In [12]:
# 计算结果
serial[["dt", "close_avg", "time_value", "close1", "bs", "bs_diff", "tdbs", "tdbs_diff"]]

Unnamed: 0,dt,close_avg,time_value,close1,bs,bs_diff,tdbs,tdbs_diff
0,2024-05-13 09:30:00+08:00,3642.43,1.654996,91.4,94.05525,2.65525,94.053467,2.653467
1,2024-05-13 09:35:00+08:00,3642.54,0.764482,92.4,94.157842,1.757842,93.81784,1.41784
2,2024-05-13 09:40:00+08:00,3640.66,0.083969,91.2,92.360068,1.160068,91.990269,0.790269
3,2024-05-13 09:45:00+08:00,3642.88,-0.096545,93.6,94.477975,0.877975,94.127435,0.527435
4,2024-05-13 09:50:00+08:00,3644.59,-0.387058,95.6,96.114526,0.514526,95.779602,0.179602
5,2024-05-13 09:55:00+08:00,3644.78,0.602428,94.8,96.294486,1.494486,95.954176,1.154176
6,2024-05-13 10:00:00+08:00,3643.4,0.021915,94.0,94.968284,0.968284,94.607889,0.607889
7,2024-05-13 10:05:00+08:00,3649.69,-1.288599,101.6,101.022761,-0.577239,100.73044,-0.86956
8,2024-05-13 10:10:00+08:00,3653.49,0.710888,103.4,104.706017,1.306017,104.447285,1.047285
9,2024-05-13 10:15:00+08:00,3658.29,-0.289626,109.2,109.383127,0.183127,109.167791,-0.032209


In [13]:
# 绘制出时间价值(time_value), 标准 BS 定价与期权价格的差(bs_diff), 改进版 BS 定价与期权价格的差(tdbs_diff)
px.line(serial, x="dt", y=["time_value", "bs_diff", "tdbs_diff"])

In [14]:
# 残差均值
serial[["bs_diff", "tdbs_diff"]].mean()

bs_diff     0.873137
tdbs_diff   0.793846
dtype: float64

In [15]:
# 标准模型的残差标准差
np.log(serial["bs"]/serial["close1"]).std()

0.016289936725434342

In [16]:
# 改进模型的残差标准差
np.log(serial["tdbs"]/serial["close1"]).std()

0.016233962768335282

In [17]:
api.close()