光计算在金融领域的应用
曦智科技光计算芯片
曦智科技的光计算芯片排布了一系列光学矩阵乘法器,利用光在光子器件中快速传播的原理,达到高通量、低延迟、低功耗的优势,可以用于NP完全问题例如最大团问题的快速求解。
曦智科技在2021年发布的PACE(Photonic Arthetric Computing Engine)光子计算处理器,核心是64x64的光学矩阵乘法器,由一块集成硅光芯片和一块CMOS微电子芯片以3D封装形式堆叠而成,单个光子芯片中集成超过10000个光子器件,在1GHz系统时钟的条件下,求解Ising问题,最大割/最小割,最大团问题上的速度可达目前高端GPU的数百倍,具体参数如下表1所示。
| 表1:PACE参数数值 | |
| 参数内容 | 数值 |
| 计算核心 | 64x64光学矩阵乘法器 |
| 数值精度 | 7bit(有效计算精度) |
| 理论峰值算力 | 8Tops |
| 功耗 | 2W |
| 能效比 | 4Tops/W |
| 光子矩阵算法(oMAC)计算时延 | 150ps |
光计算加速矩阵乘法运算
矩阵乘法是一种典型的线性运算,可使用光子线性计算单元来加速。可编程的光子矩阵计算(Optical Multiply Accumulate,oMAC)有望在摩尔定律失效后继续支持算力的不断提升,为数字经济时代提供强劲的硬件基础设施。
oMAC (Optical Multiply Accumulate)- 光学乘积累加运算 对于每个光学乘积累加运算,输入向量值首先从片上存储中提取,由数模转换器转换为模拟值,通过电子芯片和光子芯片之间的微凸点应用于相应的光调制器,形成输入光矢量。接着,输入光矢量通过光矩阵传播,产生输出光矢量,并达到一组光电探测器阵列,从而将光强转换为电流信号。最后,电信号通过微凸点返回到电子芯片,通过跨阻放大器和模数转换器返回数字域。
相比于传统的CMOS数字电路,光子矩阵计算最显著的优势在于低延迟。由于计算的过程即为光信号阵列在芯片中传输的过程,计算本身的延迟即可看作光在芯片中传输的时间,一般在1ns以下。如图3所示,对于一个N×N 的脉动矩阵运算单元,其延迟正比于O(N)。一些专门优化延迟的架构,在矩阵规模较小的情况下,延迟可以接近O(logN) 。而光子矩阵计算消耗的时间主要来自于光电转换和数模转换,一般为数个时钟周期,和矩阵的尺寸几乎无关,相当于O(1)。单次光子矩阵计算的延迟可以做到 3ns以下。因此,在N较大的情况下,光子矩阵计算的延迟优势非常明显。除此之外,传统的数字计算,在28nm等相对成熟的制程下,较难实现全局1GHz以上的主频。而光子矩阵计算的控制电路达到数GHz的频率的难度较低,从而进一步提高了延迟优势。
除了延迟优势以外,光子计算还拥有低能耗的特点。对于N×N 的数字矩阵运算单元,其能耗为k×N,其中k与单次乘加的功耗有关,正比于O(N)。而对于光学矩阵乘法器,它的功耗可用k1×N+k2×N2 ,k1 与向量输入和接收端的功耗关联,而 k2 与矩阵权 重部分的功耗关联。在矩阵本身刷新速度远低于信号输入的情况下,其能耗主要来自于前半部分,因此正比于O(N)。在光学器件和其控制电路被较好的优化前提下,基于相对传统制程的光子计算的能效比可媲美甚至凌驾先进制程的数字芯片。
案例金融衍生品期权定价问题
雪球(Snowball)结构属于路径依赖型奇异衍生品,其结构相对复杂,但自 2019 年开始,雪球这种非保本型收 益凭证受到市场上越来越多的关注,各类金融机构纷纷以不同角色参与其中,雪球在市场中的影响也逐渐增强。 雪球型收益凭证实际是卖出了敲入结构的看跌期权,只要标的不发生大幅下跌,持有该收益凭证的时间越长,获 得票息收益越多,类似于滚雪球一样,只要地面不出现非常大的坑洼,雪球就会越滚越大。
不难发现,雪球类产品之所以受到热捧,与其具有固定收益的特征有极大的关系。在利率整体下行的市场环境中, 极少有产品能像雪球一样提供年化 20%左右的票息,但市场总是风险中性的,其高票息的背后必定隐藏着潜在的风险,本报告将带领读者对雪球结构逐层解析,揭开雪球类衍生品神秘的面纱。
金融期权定价解决方案:
- 传统方案:采用蒙特卡洛雪球模型进行金融期权的定价方案。
- 神经网络方案:使用DNN神经网络模型来实现对金融期权定价的预估,替代传统的蒙特卡洛雪球模型。
图1. 结构图
模型介绍
- 雪球模型的AI方案是采用DNN神经网络模型,其主要是采用matmul算子来实现,采用多层的fc连接,通过输入不同的输入参数,来预测其对应的期权定价的一种预测模型。
- 通过光计算芯片可实现矩阵乘法加速,加速整体DNN网络推理性能,提升期权定价效率
图2. 百万路径生成
[数据生成]:通过对不同影响定价参数进行蒙特卡洛算法的雪球模型百万路径生成来得到对应的输出定价,生成数据集,把该数据集拿过来作为神经网络模型训练数据,进而来预测定价。
[构建模型]:可以使用多层fc的神经网络来实现,同时对激活函数和每一层神经元个数按照实际情况进行选择。
[训练模型]:这个训练策略是非常重要的,一个好的训练策略可以获得拟合更好的模型,这里可以采用低精度量化模型。更能符合在光计算卡中推理计算。
[测试]:对生成的模型进行测试,各项评价指标需要满足实际需要,同时保证模型的敏感性。
总结
注意,以上步骤只是列出DNN类型的神经网络模型来实现期权定价的预测,该应用场景对算力和计算速度要求比较高。因此我们提出利用光计算低延迟、高带宽的特点,来求解这整个问题。光计算算法也可以与经典算法混合集成,进一步加速问题的求解。
参考文献
[1] https://developer.nvidia.com/blog/accelerating-python-for-exotic-option-pricing/
[2] Ferguson R, Green A. Deeply learning derivatives[J]. arXiv preprint arXiv:1809.02233, 2018.