



# 申威 421 处理器 软件接口手册

2017年10月

成都申威科技有限责任公司



#### 免责声明

本文档仅提供阶段性信息,所含内容可根据产品的实际情况随时更新,恕不另行通知。如因文档使用不当造成的直接或间接损失,本公司不承担任何责任。

#### 成都申威科技有限责任公司

Chengdu Sunway Technology Corporation Limited 地址:成都市华府大道四段电子科大科技园 D22 栋 Building D22, National University Science and technology park, Section 4, Huafu Avenue, Chengdu

Mail: sales@swcpu.cn Tel: 028-68769016 Fax: 028-68769019



#### 阅读指南

《申威 421 处理器软件接口手册》主要描述了申威 421 处理器核心结构、特权指令及程序、内部寄存器 CSR 说明、存储管理、异常终端介绍、初始化复位说明等内容。并详细说明了调试支持和编程优化等内容。

### 文档修订

|            | 文档名  | 申威 421 处理器软件接口手册 |
|------------|------|------------------|
| サ松田がつヨ     | 版本号  | V1.0             |
| 文档更新记录<br> | 创建人  | 研发部              |
|            | 创建日期 | 2017-10-8        |

### 版本更新

| 版本号  | 更新内容 | 更新日期      |
|------|------|-----------|
| V1.0 | 初稿   | 2017-10-8 |
|      |      |           |
|      |      |           |
|      |      |           |

### 技术支持

可通过邮箱或问题反馈网站向我司提交产品使用的问题,并获取技术支持。

售后服务邮箱:sales@swcpu.cn

问题反馈网址: http://www.swcpu.cn/



# 目 录

|   | 1 核心结构概述                                                                                                                                                                                                                                       |                                                                                        |
|---|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------|
| 2 | 2 处理器模式与特权程序                                                                                                                                                                                                                                   |                                                                                        |
|   | 2.1 处理器模式                                                                                                                                                                                                                                      |                                                                                        |
|   | 2.2 特权程序                                                                                                                                                                                                                                       |                                                                                        |
|   | 2.3 特权指令                                                                                                                                                                                                                                       | 6                                                                                      |
|   | 2.4 系统寄存器                                                                                                                                                                                                                                      | (                                                                                      |
| 3 | 3 控制与状态寄存器                                                                                                                                                                                                                                     |                                                                                        |
|   | 3.1 CSR 的编址                                                                                                                                                                                                                                    |                                                                                        |
|   | 3.2 CSR 访问机制                                                                                                                                                                                                                                   | 10                                                                                     |
|   | 3.3 指令部件中的 CSR                                                                                                                                                                                                                                 |                                                                                        |
|   | 3.4 数据 Cache 管理部件中的 CSR                                                                                                                                                                                                                        | 2                                                                                      |
|   | 3.5 二级 Cache 管理部件中的 CSR                                                                                                                                                                                                                        |                                                                                        |
|   | 3.6 整数部件中的 CSR                                                                                                                                                                                                                                 |                                                                                        |
|   | 3.7 浮点运算部件中的 FPCR                                                                                                                                                                                                                              |                                                                                        |
| 4 | 4 存储管理和存储结构                                                                                                                                                                                                                                    |                                                                                        |
|   | 4.1 存储空间                                                                                                                                                                                                                                       |                                                                                        |
|   | 4.2 Cache 结构                                                                                                                                                                                                                                   |                                                                                        |
|   | 4.3 地址转换缓冲                                                                                                                                                                                                                                     |                                                                                        |
|   | 4.4 存储空间访问方式                                                                                                                                                                                                                                   |                                                                                        |
|   | 4.5 错误检测及错误处理                                                                                                                                                                                                                                  |                                                                                        |
| 5 | 5 中断                                                                                                                                                                                                                                           |                                                                                        |
|   | 5.1 中断源                                                                                                                                                                                                                                        |                                                                                        |
|   | 5.2 中断的优先级                                                                                                                                                                                                                                     |                                                                                        |
|   | 5.3 中断的嵌套                                                                                                                                                                                                                                      |                                                                                        |
|   |                                                                                                                                                                                                                                                |                                                                                        |
| 6 | 6 异常                                                                                                                                                                                                                                           | 80                                                                                     |
| 6 | <b>6 异常</b><br>6.1 DTB 脱靶                                                                                                                                                                                                                      |                                                                                        |
| 6 | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80                                                                                     |
| 6 | 6.1 DTB 脱靶<br>6.2 ITB 脱靶                                                                                                                                                                                                                       |                                                                                        |
| 6 | 6.1 DTB 脱靶                                                                                                                                                                                                                                     |                                                                                        |
| 6 | 6.1 DTB 脱靶<br>6.2 ITB 脱靶<br>6.3 浮点屏蔽故障<br>6.4 不对界故障                                                                                                                                                                                            |                                                                                        |
| 6 | 6.1 DTB 脱靶<br>6.2 ITB 脱靶<br>6.3 浮点屏蔽故障<br>6.4 不对界故障<br>6.5 数据流故障                                                                                                                                                                               |                                                                                        |
| 6 | 6.1 DTB 脱靶<br>6.2 ITB 脱靶<br>6.3 浮点屏蔽故障<br>6.4 不对界故障<br>6.5 数据流故障<br>6.6 指令流故障                                                                                                                                                                  |                                                                                        |
| 6 | 6.1 DTB 脱靶         6.2 ITB 脱靶         6.3 浮点屏蔽故障         6.4 不对界故障         6.5 数据流故障         6.6 指令流故障         6.7 操作码非法                                                                                                                       | 80<br>80<br>81<br>82<br>82<br>82                                                       |
|   | 6.1 DTB 脱靶         6.2 ITB 脱靶         6.3 浮点屏蔽故障         6.4 不对界故障         6.5 数据流故障         6.6 指令流故障         6.7 操作码非法         6.8 算术自陷                                                                                                      |                                                                                        |
|   | 6.1 DTB 脱靶         6.2 ITB 脱靶         6.3 浮点屏蔽故障         6.4 不对界故障         6.5 数据流故障         6.6 指令流故障         6.7 操作码非法                                                                                                                       |                                                                                        |
|   | 6.1 DTB 脱靶                                                                                                                                                                                                                                     |                                                                                        |
|   | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80<br>80<br>81<br>82<br>82<br>82<br>83<br>87<br>87                                     |
|   | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80<br>80<br>81<br>82<br>82<br>82<br>83<br>84<br>85<br>86<br>87<br>88<br>88             |
|   | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80<br>80<br>81<br>82<br>82<br>83<br>83<br>83<br>84<br>85<br>85<br>86<br>87<br>88       |
| 7 | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80<br>80<br>81<br>82<br>82<br>82<br>83<br>84<br>85<br>85<br>86<br>87<br>87<br>88<br>88 |
| 7 | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80 80 80 81 81 82 82 82 83 83 86 87 87 89 89 89 89 89 89                               |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算术自陷 7 复位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR                                                                     | 80 80 80 81 81 82 82 82 83 83 83 84 85 86 87 87 88 88 88 88 88                         |
| 7 | 6.1 DTB 脱靶                                                                                                                                                                                                                                     | 80 80 80 80 81 81 82 82 82 83 83 83 84 84 85 86 86 87 87 87 87 87 88 88 88 88 88 88 88 |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算术自陷 7 复位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR 8.2 事件计数的模式 8.3 事件计数的流程                                             | 80 80 80 80 81 81 82 82 82 83 85 86 87 87 89 89 90 92                                  |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算术自陷 7 复位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR 8.2 事件计数的模式 8.3 事件计数的流程                                             | 80 80 80 81 81 82 82 82 82 83 83 85 87 87 89 89 90 90 92                               |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算术自陷 7 复位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR 8.2 事件计数的模式 8.3 事件计数的模式 8.3 事件计数的流程 9 功耗管理 9.1 核心深睡眠                | 80 80 80 80 81 81 82 82 82 83 83 85 87 87 87 88 88 88 88 88 89 90 92                   |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算术自陷 7 复位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR 8.2 事件计数的模式 8.3 事件计数的模式 8.3 事件计数的模式 9.1 核心深睡眠 9.1 核心深睡眠                      | 80 80 80 80 81 81 82 82 82 83 83 84 85 86 87 87 87 87 87 87 87 87 87 87 87 87 87       |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算作码非法 6.8 算位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR 8.2 事件计数的模式 8.3 事件计数的流程 9 功耗管理 9.1 核心深睡眠 9.2 核心浅睡眠 9.2 核心浅睡眠 9.3 关闭浮点部件时钟 | 80 80 80 81 81 82 82 82 83 84 85 87 87 87 89 89 90 90 90 90 90 90 90 90 90 90 90 90 90 |
| 7 | 6.1 DTB 脱靶 6.2 ITB 脱靶 6.3 浮点屏蔽故障 6.4 不对界故障 6.5 数据流故障 6.6 指令流故障 6.7 操作码非法 6.8 算术自陷 7 复位和初始化 7.1 复位的种类 7.2 上电复位 7.3 冷复位 7.4 睡眠复位 7.5 复位后的 CSR 8 事件计数 8.1 事件计数相关 CSR 8.2 事件计数的模式 8.3 事件计数的模式 8.3 事件计数的模式 9.1 核心深睡眠 9.1 核心深睡眠                      | 80 80 80 81 81 82 82 82 83 85 87 87 87 89 90 90 90 90 90 90 90 90 90 90 90 90 90       |



#### 申威 421 处理器软件接口手册

| 10.1 指令流调试支持             | 99  |
|--------------------------|-----|
| 10.2 数据流调试支持             | 100 |
| 11 编程优化                  |     |
| 11.1 转移预测优化              |     |
| 11.2 寄存器和指令的使用           |     |
| 11.3 避免重发自陷或冲突重试         | 112 |
| 11.4 数据流访问               |     |
| 11.5 低功耗优化               | 117 |
| 附录 A CSR 的限制             | 119 |
| <br>附录 В 事件计数内容与方法       |     |
| M录 C CHIP ID 定义          |     |
| ·····<br>附录 D 各种中断的初始向量值 |     |
| 附录 ε 修改记录                |     |
|                          |     |



# 1 核心结构概述

SW421 核心的基本结构如图 1-1 所示:



图 1-1 SW421 核心结构框图

SW421 由指令部件、整数执行部件、浮点执行部件、数据 Cache 控制部件、二级 Cache 控制部件以及一级指令 Cache、一级数据 Cache 和二级 Cache 组成。其技术特征如下:

- 1)继承申威 Core3 的指令系统,进行了少量的指令集扩展和修改;
- 2) 核心为采用并行发射、乱序发射、乱序执行和推测执行技术的4译码7发射超标量结构;
- 3) 采用短向量加速计算技术提高整数和浮点运算性能,支持浮点双 256 位 SIMD 流水线、整数单 256 位 SIMD 流水线,每个时钟周期可产生 11 个整数运算结果或 16 个浮点运算结果;
- 4) 一级指令 Cache 容量为 32KB, 采用四路组相联结构, 虚地址访问方式, Cache 行大小为 128 字节, 采用可容错的偶校验:
- 5) 一级数据 Cache 容量为 32KB,采用四路组相联结构,物理地址访问方式,Cache 行大小为 128 字节,采用可纠错的 ECC 校验:
- 6) 二级 Cache 容量为 512KB,采用八路组相联结构,物理地址访问方式,Cache 行大小为 128 字节,为指令和数据混合 Cache,采用可纠错的 ECC 校验;
- 7)一级数据 Cache 与二级 Cache 为严格的包含关系,一级指令 Cache 与二级 Cache 为既不包含,也不互斥关系,硬件自动支持指令与数据的 Cache 一致性。



# 2 处理器模式与特权程序

### 2.1 处理器模式

SW421 核心设置了 4 种处理器模式 (Processor Mode: PM), 具体定义如下:

- 1) 硬件模式 (Hardware Mode: HM): 最高级模式,为特权程序运行环境。此模式下,可使用特权指令直接对底层硬件进行控制和操作,可使用系统寄存器。指令流只能以物理地址访问,不进行虚实地址转换,数据流可以用物理地址访问,也可以用虚地址访问,由具体的访存指令决定。所有的中断被屏蔽,不响应任何中断请求;
- 2) 虚拟模式(Virtual Mode: VM): 次高级模式,介于硬件与操作系统之间,提供虚拟层服务。 此模式下,不能使用特权指令和系统寄存器,指令流和数据流可采用包括超页模式在内的 虚地址访问,由访问地址[52]位决定,允许响应中断请求;
- 3) 内核模式 (Kernel Mode: KM): 次低级模式,为操作系统运行环境。此模式下,不能使用特权指令和系统寄存器,指令流和数据流都采用虚地址访问(不支持超页模式),允许响应中断请求:
- 4) 用户模式(User Mode: UM): 最低级模式,为用户程序运行环境。此模式下,不能使用特权指令和系统寄存器,指令流和数据流都采用虚地址访问(不支持超页模式),允许响应中断请求。

程序计数器 PC 的最低两位用于记录当前处理器模式值,为" $00_2$ "表示硬件模式 (HM),为" $01_2$ "表示虚拟模式 (VM),为" $10_2$ "表示内核模式 (KM),为" $11_2$ "表示用户模式 (UM)。处理器模式有以下几种转换方式:

- 1) 非硬件模式下执行 SYS CALL 或者 SYS CALL/b 指令,可以从非硬件模式转换到硬件模式;
- 2) 核心响应中断请求时,可以从非硬件模式转换到硬件模式;
- 3) 核心发现异常时,可以从非硬件模式转换到硬件模式;
- 4) 硬件模式下执行 PRI\_RET 指令,可以从硬件模式转换到任意模式。

### 2.2 特权程序

特权程序是针对特定操作系统的一组程序,只能在 HM 模式下运行。在特权程序中,可使用五 条特权指令,读写处理器控制与状态寄存器,进行存储器管理等操作。

特权程序可以由以下事件触发:



- 1) 中断,包括复位、内部中断、外部中断和机器检查错等;
- 2) 异常,包括算术自陷和存储管理故障等;
- 3) SYS CALL或者 SYS CALL/b 指令。

特权程序主要应用于以下几种情况:

- 1) 一些必要的功能用硬件实现过于复杂,但又无法用常规程序来实现。如 TLB 装填、中断确 认和异常处理等:
- 一些必须为原子操作的功能,实现的指令序列较长,且需要访问底层硬件。如从异常或中 断返回等;
- 3) 一些为实现不同处理器之间的兼容或者减少编程工作量的功能,不经常使用,由专门硬件来实现的代价过大。

特权程序在指定的入口被调用,SW421 核心有两种特权程序入口,一种是 SYS\_CALL 和 SYS\_CALL/b 指令相关的特权程序入口,另一种是异常和中断相关的特权程序入口。

### 2.2.1 SYS\_CALL 和 SYS\_CALL/b 入口

SYS\_CALL 和 SYS\_CALL/b 指令的区别在于,前者不会中断指令流水线,而后者会中断指令流水线、并且在 ROB 空之后才会根据 SYS\_CALL/b 所指示的地址重新取指。两者用指令编码的[25]位加以区分:指令编码[25]位为"1"表示 SYS\_CALL,指令编码[25]位为"0"表示 SYS\_CALL/b。在 VM、KM 和 UM 模式下,执行 SYS\_CALL 或者 SYS\_CALL/b 指令时,会将指令流转到特权程序入口执行,入口地址由基址寄存器(PRI\_BASE)和指令功能码决定。SYS\_CALL 或者 SYS\_CALL/b 指令的返回地址由系统寄存器 SR23 来保存,其中 SR23[1:0]记录运行 SYS\_CALL 或者 SYS\_CALL/b 指令时的处理器模式。

SYS\_CALL 或者 SYS\_CALL/b 指令含一个入口程序地址相关的功能码,需要对该功能码的合法性进行检查,若其功能码满足以下任何一个条件,则产生非法操作码异常:

- 1) UM 模式下, SYS\_CALL 或者 SYS\_CALL/b 指令只能启动用户级特权程序,如果对应的指令功能码[7:0]位不在 0x80~0xBF(用户级特权程序)范围内,则产生非法操作码异常;
- 2) KM 模式下, SYS\_CALL 或者 SYS\_CALL/b 指令可以启动用户级和内核级特权程序,如果对应的指令功能码[7:0]位不在 0x00~0x3F(内核级特权程序)和 0x80~0xBF(用户级特权程序)范围内,则产生非法操作码异常;
- 3) VM 模式下, SYS\_CALL 或者 SYS\_CALL/b 指令可以启动用户级、内核级和虚拟级特权程序, 如果对应的指令功能码[7:0]位不在 0x00~0x3F(内核级特权程序)、0x80~0xBF(用户级特权程序)和 0x40~0x7F(虚拟级特权程序)范围内,则产生非法操作码异常;
- 4) UM、KM、VM 和 HM 模式下, SYS\_CALL 或者 SYS\_CALL/b 指令功能码[24:8]位不为全 "0",则产生非法操作码异常。



在 HM 模式下, SYS\_CALL 或者 SYS\_CALL/b 指令功能码[24:8]位为全 "0"则当作空指令。 SYS\_CALL 或者 SYS\_CALL/b 指令的功能码与其对应的特权程序入口地址(PC)的计算方法如下:

- 1) PC[63:48]=全"0";
- 2) PC[47:15]={PRI\_BASE[47:16], 0<sub>2</sub>};
- 3) PC[14:13]与功能码[7:6]的对应关系如表 2-1;

表 2-1SYS\_CALL 或者 SYS\_CALL/b 指令部分功能码与特权程序入口关系表

| 功能码[7:6] | PC[14:13] |
|----------|-----------|
| 102      | 112       |
| $00_{2}$ | $10_{2}$  |
| $01_{2}$ | 012       |

- 4) PC[12:7]=功能码[5:0];
- 5) PC[6:2]=全"0";
- 6) PC[1:0]= "00<sub>2</sub>" (进入 HM 模式的标志)。

由此可见,虚拟级特权程序起始偏移地址为 0x2000,内核级特权程序起始偏移地址为 0x4000,用户级特权程序起始偏移地址为 0x6000。2 条功能码相邻的 SYS\_CALL 或者 SYS\_CALL/b 指令的特权程序入口地址间距为 128 字节,即可以包含连续的 32 条指令,对于指令数量超过 32 条的特权程序,必须跳转到另一地址继续处理。

### 2.2.2 异常和中断入口

当硬件检测到没有屏蔽的异常或中断时,会自动跳到对应的特权程序入口进行处理。触发异常或被中断的指令 PC 值保存在异常地址寄存器(EXC\_PC)中。表 2-2 列出了各种异常入口相对于基址寄存器(PRI\_BASE)的偏移,表中各种异常或中断按优先级从低到高依次排列。

表 2-2 异常或中断服务特权程序入口偏移地址

| 序<br>号 | 入口名称          | 类型 | 偏移                                                     | 描述                                                                 |
|--------|---------------|----|--------------------------------------------------------|--------------------------------------------------------------------|
| 1      | DTBM_DOUBLE   | 故障 | 0x800 DTB 二次脱靶。指示 PRI_LDx/vpte 指令进行数据实地址转换时产生的 DTB 脱靶。 |                                                                    |
| 2      | DTBM_SINGLE_0 | 故障 | 0x880                                                  | DTB 用户脱靶。指示非 PRI_LDx/vpte 指令进行数据流虚实地址转换时产生的 DTB 脱靶且虚地址 VA[52]为"0"。 |
| 3      | DTBM_SINGLE_1 | 故障 | 0x900                                                  | DTB 核心脱靶。指示非 PRI_LDx/vpte 指令进行数据流虚实地址转换时产生的 DTB 脱靶且虚地址 VA[52]为     |



|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                          |         | "1"。                        |
|-----|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------|---------|-----------------------------|
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 11 = 3:                  |         | ITB 用户脱靶。指示指令流进行虚实地址转换时产生   |
| 4   | ITB_MISS_0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 故障                       | 0x980   | 的 ITB 脱靶且虚地址 VA[52]为 "0"。   |
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | 1.1 . tr <del>\$</del> r |         | ITB 核心脱靶。指示指令流进行虚实地址转换时产生   |
| 5   | ITB_MISS_1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 故障                       | 0xA00   | 的 ITB 脱靶且虚地址 VA[52]为"1"。    |
|     | FEN                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | +47字                     | 0 400   | 浮点屏蔽故障。指示浮点屏蔽时运行浮点或 SIMD 扩  |
| 6   | FEN                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | 故障                       | 0xA80   | 展指令产生的故障。                   |
| 7   | UNALIGN                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | 故障                       | 0xB00   | 不对界异常。指示数据流访问地址不对界产生的故障。    |
| 0   | ADITH                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | 算术                       | 0 D00   | 算术自陷。指示浮点或整数运算指令产生异常且对应     |
| 8   | ARITH                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | 自陷                       | 0xB80   | 的算术自陷使能。                    |
| 9   | 保留                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             | _                        | 0xC00   |                             |
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                          |         | 数据流故障。指示数据流地址越界、访问越权、数据     |
|     | DFAULT                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         | 故障                       | 0xC80   | 流地址匹配、数据流数值匹配、数据流地址和数值同     |
| 10  |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                          |         | 时匹配、虚地址符号检查错、数据 Cache 的标记偶校 |
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                          |         | 验错、数据 Cache 数据校验错、存储器数据多错等故 |
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                          |         | 障。                          |
| 11  | IA CV                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | 故障                       | 0. 500  | 指令流故障。指示指令流访问越权、虚地址符号检查     |
| 11  | IACV                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | 以悍                       | 0xD00   | 错、指令流地址匹配或目标地址匹配。           |
| 12  | OPCDEC                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         | 故障                       | 0xD80   | 操作码非法故障。指示出现非法的操作码或功能码。     |
| 13  | INTERRUPT0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 中断                       | 0xE00   | 一般中断 0。指示产生了核间中断。           |
| 1.4 | DATE DATE OF THE STATE OF THE S | → N/C                    | 0. 1700 | 一般中断 1。指示产生了核间中断之外的普通硬件中    |
| 14  | INTERRUPT1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 中断                       | 0xE80   | 断。                          |
| 15  | SLEEP                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | 中断                       | 0xF00   | 睡眠中断。指示产生了请求核心进入睡眠状态的中断。    |
| 1.5 | MOTHY                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | A Nort                   | 0. 1500 | 机器检查错中断。指示核心内部产生不能恢复的故障,    |
| 16  | МСНК                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           | 中断                       | 0xF80   | 精确和不精确的机器检查错,都进入该入口。        |
|     |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | , <b>↓</b> , Nbr^        |         | 复位/睡眠唤醒中断。指示核心进入复位或从睡眠状态    |
| 17  | RESET/WAKEUP                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | 中断 (                     | 0x1000  | 被唤醒。                        |

上表中,RESET/WAKEUP 具有最高优先级,总是无条件中止正常指令流,进入对应的特权程序入口执行。MCHK、SLEEP、INTERRUPT1、INTERRUPT0 中断的优先级依次降低,且都只能在指令边界上被识别,产生这些中断时,必须等前面所有指令都正常退出后,才能进入对应的特权程序入口执行。

除中断以外,其它入口都与具体的指令执行相关。在指令退出时,检查指令执行过程中是否产生异常,如果产生,则进入对应的特权程序入口执行。如果同一条指令在流水线上的不同站台产生多个异常,则优先处理先产生的异常,忽略后产生的异常。如果同一条指令在流水线上的同一站台



产生多个异常,则按上表中的优先级,优先处理优先级高的异常,忽略优先级低的异常。

如浮点指令或 SIMD 扩展指令可同时产生 IACV、FEN 和 OPCDEC 异常,这时就要按照优先级,优先处理 OPCDEC 异常,无 OPCDEC 异常时再处理 IACV 异常,无 OPCDEC 异常和 IACV 异常时,再处理 FEN 异常。转移指令可能同时发生转移地址符号扩展错(BAD\_IVA)和转移目标地址匹配(IDA\_MATCH),此时都进指令流故障故障(IACV),但优先报地址符号扩展错,只登记 CSR:EXC\_SUM[BAD\_IVA]。

基于基址寄存器(PRI\_BASE)的 0x0~0x7FF 范围内存储器空间,没有作为任何特权程序的入口,此空间可以作为特权程序的数据空间或者信息保留空间。0x1000~0x1FFF 范围内的存储器空间,都可作为 RESET/WAKEUP 特权程序存放空间。

### 2.3 特权指令

特权指令与 SW421 核心的具体实现有关,用于访问核心的控制与状态寄存器 CSR,进行存储管理等。特权指令只能在 HM 模式下执行,在其它模式下执行将产生非法操作码异常。特权指令共有5条,如表 2-3 所示,具体的指令定义参看《SW421 核心结构手册》。

| 序号 | 指令       | 操作码       | 描述                      |
|----|----------|-----------|-------------------------|
| 1  | PRI_LD   | 0x25      | 特权装入指令                  |
| 2  | PRI_ST   | 0x2D      | 特权存储指令                  |
| 3  | PRI_RET  | 0x07      | 特权程序返回指令。               |
| 4  | PRI_RCSR | 0x06.FExx | 将控制与状态寄存器 CSR 内容读到整数寄存器 |
| 5  | PRI_WCSR | 0x06.FFxx | 将整数寄存器内容写到控制与状态寄存器 CSR  |

表 2-3 特权指令一览

### 2.4 系统寄存器

SW421 核心包含 10 个特殊的寄存器,用作特权程序的临时数据存储空间,被称作系统寄存器 (SR)。当 SW421 核心处于 HM 模式且指令流控制寄存器 (IS\_CTL)的 SRE 位为"1"时,整数结构寄存器中的R1、R2、R4~R7和R20~R23被识别为系统寄存器。运行 SYS\_CALL或者 SYS\_CALL/b 指令时默认使用系统寄存器 R23 来保存 SYS\_CALL 或者 SYS\_CALL/b 指令的返回地址。



# 3 控制与状态寄存器

核心设置了一组处理器控制与状态寄存器(CSR),用于实现对核心的控制,记录核心的运行状态。CSR 只能在 HM 模式下,通过特权指令 PRI\_RCSR 和 PRI\_WCSR 进行读写操作。

为简化对 CSR 描述,使用一些符号来对 CSR 内容的软件访问特性和复位状态进行描述,其中

- 1) "W"指示可写,"WO"指示只写;
- 2) "R"指示可读, "RO"指示只读;
- 3) "RW"指示可读写;
- 4) "W1C"指示写"1"清除,写"0"无影响;
- 5) "WC"指示写清除;
- 6) "RO,x"指示只读且复位时初值为"x";
- 7) "WO,x" 指示只写且复位时初值为"x";
- 8) "RW.x"指示可读写且复位时初值为"x":
- 9) "SEXT(x)"指示将"x"符号扩展指定位数。

以上"x"可以为"0",也可以为"1",没有指定复位设置值的 CSR 在复位后是一个不确定的值,需要在复位后进行初始化时设置。读保留位时,返回"0";写保留位时,写入的值被忽略。

### 3.1 CSR 的编址

通过特权指令 PRI\_RCSR 和 PRI\_WCSR 来读写 CSR 时,这两条指令的[7:0]位作为 CSR 访问的 地址,表 3-1,表 3-2,表 3-3,表 3-4 分别列出所有 CSR 的名称、符号、缺省使用的记分板位和存取特性等。

|    | W O I JE       | 14時14 ピンバ |            |      |
|----|----------------|-----------|------------|------|
| 序号 | 名称             | 符号        | 索引         | 存取特性 |
| 1  | ITB 的 TAG 写寄存器 | ITB_TAG   | 0000 00002 | WO   |
| 2  | ITB 的 PTE 写寄存器 | ITB_PTE   | 0000 00012 | WO   |
| 3  | ITB 全部刷新寄存器    | ITB_IA    | 0000 00102 | WO   |
| 4  | ITB 虚拟机刷新寄存器   | ITB_IV    | 0000 00112 | WO   |
| 5  | ITB 虚拟机部分刷新寄存器 | ITB_IVP   | 0000 01002 | WO   |
| 6  | ITB 用户进程刷新寄存器  | ITB_IU    | 0000 01012 | WO   |

表 3-1 指令部件中 CSR



|    |                                       | 1                                     | T /XX +2               | 21 处理希认什 |
|----|---------------------------------------|---------------------------------------|------------------------|----------|
| 7  | ITB 条目刷新寄存器                           | ITB_IS                                | 0000 01102             | WO       |
| 8  | 指令虚地址格式寄存器                            | IVA_FORM                              | 0000 01112             | RO       |
| 9  | PTBR 页表基地址寄存器                         | PTBR                                  | 0000 10002             | RW       |
| 10 | 核间中断使能寄存器                             | II_ER                                 | 0000 10012             | RW       |
| 11 | 核间中断 0 寄存器                            | IIO                                   | 0000 10102             | RO       |
| 12 | 异常摘要寄存器                               | EXC_SUM                               | 0000 11012             | RO       |
| 13 | 异常地址寄存器                               | EXC_PC                                | 0000 11102             | RO       |
| 14 | 清除核间中断寄存器                             | II_CLR                                | 0000 11112             | WO       |
| 15 | 特权程序基地址寄存器                            | PRI_BASE                              | 0001 00002             | RW       |
| 16 | 指令流控制寄存器                              | IS_CTL                                | 0001 00012             | RW       |
| 17 | 发射控制寄存器                               | ISSUE_CTL                             | 0001 00112             | RW       |
| 18 | 指令流状态寄存器                              | IS_STAT                               | 0001 01002             | R, W1C   |
| 19 | 指令 Cache 刷新寄存器                        | IC_FLUSH                              | 0001 01012             | WO       |
| 20 | 虚页表基地址寄存器                             | VPT_BASE                              | 0001 01112             | RW       |
| 21 | 虚拟机控制寄存器                              | VPCR                                  | 0001 10012             | RW       |
| 22 | 指令流地址匹配寄存器                            | IA_MATCH                              | 0001 10102             | RW       |
| 23 | 指令流地址屏蔽寄存器                            | IA_MASK                               | 0001 10112             | RW       |
| 24 | 核间中断 1 寄存器                            | II1                                   | 0001 11002             | RO       |
| 25 | 核间异步消息中断寄存器                           | II_MAIL                               | 0001 11012             | RO       |
| 26 | 中断向量映射寄存器                             | INT_VEC                               | 0001 11112             | RW       |
|    | ᄄᄀᄼᄮᄯᄓᆄᆇᆈᄼᆉᆉᄜ                         |                                       | 0010 00nn <sub>2</sub> | W        |
| 27 | 用户进程控制寄存器                             | UPCR                                  | 0010 00xx <sub>2</sub> | R        |
| 28 | 事件计数与控制寄存器 0                          | PC0_CR                                | 0010 01002             | RW       |
| 29 | 事件计数与控制寄存器 1                          | PC1_CR                                | 0010 01012             | RW       |
| 30 | 核心可纠正错计数器                             | HSERR_CNT                             | 0010 01102             | RW       |
| 31 | 计数阀值寄存器                               | HSERR_TH                              | 0010 01112             | RW       |
| 32 | 非法指令寄存器                               | IGL_INST                              | 0010 10002             | RO       |
| 33 | 软件故障寄存器                               | SOFT_ERR                              | 0010 10012             | RW       |
| 34 | 定时器控制寄存器                              | TIMER_CTL                             | 0010 10102             | RW       |
| 35 | 定时器阈值寄存器                              | TIMER_TH                              | 0010 10112             | RW       |
| 36 | 中断状态寄存器 0                             | INT_STAT0                             | 0011 00002             | RO       |
| 37 | 中断状态寄存器 1                             | INT_STAT1                             | 0011 00012             | RO       |
| 38 | 中断状态寄存器 2                             | INT_STAT2                             | 0011 00102             | RO       |
|    | · · · · · · · · · · · · · · · · · · · | · · · · · · · · · · · · · · · · · · · |                        |          |



| 39 | 中断状态寄存器 3     | INT_STAT3 | 0011 00112 | RO |
|----|---------------|-----------|------------|----|
| 40 | 清除普通硬件中断寄存器 0 | INT_CLR0  | 0011 01002 | WO |
| 41 | 清除普通硬件中断寄存器 1 | INT_CLR1  | 0011 01012 | WO |
| 42 | 清除普通硬件中断寄存器 2 | INT_CLR2  | 0011 01102 | WO |
| 43 | 清除普通硬件中断寄存器 3 | INT_CLR3  | 0011 01112 | WO |
| 44 | 普通硬件中断使能寄存器 0 | IER0      | 0011 10002 | RW |
| 45 | 普通硬件中断使能寄存器 1 | IER1      | 0011 10012 | RW |
| 46 | 普通硬件中断使能寄存器 2 | IER2      | 0011 10102 | RW |
| 47 | 普通硬件中断使能寄存器 3 | IER3      | 0011 10112 | RW |
| 48 | 硬件故障寄存器       | HARD_ERR  | 0011 11002 | RW |

表 3-2 数据 Cache 管理部件中 CSR

| 序号 | 名称             | 符号            | 索引         | 存取特性  |
|----|----------------|---------------|------------|-------|
| 1  | DTB 的 TAG 写寄存器 | DTB_TAG       | 0100 00002 | WO    |
| 2  | DTB 的 PTE 写寄存器 | DTB_PTE       | 0100 00012 | WO    |
| 3  | DTB 全部刷新寄存器    | DTB_IA        | 0100 00102 | WO    |
| 4  | DTB 虚拟机刷新寄存器   | DTB_IV        | 0100 00112 | WO    |
| 5  | DTB 虚拟机部分刷新寄存器 | DTB_IVP       | 0100 01002 | WO    |
| 6  | DTB 用户进程刷新寄存器  | DTB_IU        | 0100 01012 | WO    |
| 7  | DTB 刷新寄存器      | DTB_IS        | 0100 01102 | WO    |
| 8  | DTB 进程号寄存器     | DTB_PCR       | 0100 01112 | RW    |
| 9  | 数据流状态寄存器       | DS_STAT       | 0100 10002 | R,WC  |
| 10 | 数据流控制寄存器       | DS_CTL        | 0100 10012 | RW    |
| 11 | 数据 Cache 控制寄存器 | DC_CTL        | 0100 10102 | RW    |
| 12 | 数据 Cache 状态寄存器 | DC_STAT       | 0100 10112 | R,W1C |
| 13 | 数据流地址匹配寄存器     | DA_MATCH      | 0100 11002 | RW    |
| 14 | 数据流地址屏蔽寄存器     | DA_MASK       | 0100 11012 | RW    |
| 15 | 数据虚地址寄存器       | DVA           | 0100 11102 | RO    |
| 16 | 数据虚地址格式寄存器     | DVA_FORM      | 0100 11112 | RO    |
| 17 | 数据流地址匹配模式寄存器   | DA_MATCH_MODE | 0101 00002 | RW    |
| 18 | 保留             | 保留            | 0101 00012 | -     |
| 19 | 数据流数值屏蔽寄存器     | DV_MASK       | 0101 00102 | RW    |
| 20 | 数据流数值相等匹配寄存器   | DV_MATCH      | 0101 00112 | RW    |

表 3-3 二级 Cache 管理部件中 CSR



| 序号 | 名称             | 名称    符号     |            | 存取特性  |
|----|----------------|--------------|------------|-------|
| 1  | 二级 Cache 控制寄存器 | SC_CTL       | 1000 00002 | RW    |
| 2  | 二级 Cache 状态寄存器 | SC_STAT      | 1000 00012 | R,W1C |
| 3  | 中断请求寄存器        | INT_REQ      | 1000 00102 | RW    |
| 4  | Cache 一致性控制寄存器 | CP_CTL       | 1000 00112 | RO    |
| 5  | 合并缓冲超时控制寄存器    | MERGE_OVTIME | 1000 01002 | RW    |

表 3-4 整数部件中 CSR

| 序号 | 名称                  | 符号                   | 索引          | 存取特性     |
|----|---------------------|----------------------|-------------|----------|
| 1  | 指令虚地址寄存器            | IVA                  | 1100 00002  | RO       |
| 2  | 计时器                 | TC                   | 1100 00012  | RW       |
| 3  | 周期计数控制寄存器           | TC_CTL               | 1100 00102  | RW       |
| 4  | 整数控制寄存器             | ICR                  | 1100 00112  | RW       |
| 5  | 核心识别码寄存器            | CID                  | 1100 01002  | RW       |
| 6  | 指令流目标地址寄存器          | IDA_MATCH            | 1100 01012  | RW       |
| 7  | 指令流目标地址屏蔽寄存器        | IDA_MASK             | 1100 01102  | RW       |
| 8  | 线程号寄存器 <sup>注</sup> | TID                  | 1100 01112  | 硬件模式 RW  |
|    |                     |                      |             | 非硬件模式 RO |
| 9  | 软件读写寄存器             | SOFTCSR0~ SOFTCSR31  | 1110 00002  | RW       |
|    |                     |                      | ~1111 11112 |          |
| 10 | 软件读写寄存器             | SOFTCSR32~ SOFTCSR47 | 1101 00002  | RW       |
|    |                     |                      | ~1101 11112 |          |

注:对于线程号寄存器,软件可在硬件模式下,通过特权指令显示读写,也可在非硬件模式下 用特定指令RUSR进行显示读,但不能在非硬件模式下进行显示写,硬件也不能进行隐式读写。

对没有定义的CSR进行读写,不产生任何故障与异常,即PRI\_WCSR写指令不产生任何影响,PRI\_RCSR读指令读出的内容是不可预测的。浮点部件中的FPCR属于特殊的CSR,可以在任何模式下通过非特权指令RFPCR、WFPCR、SETFPEC0、SETFPEC1、SETFPEC2、SETFPEC3进行读写访问。

# 3.2 CSR 访问机制

CSR 既可被软件读写,也可被核心硬件读写,对 CSR 的访问可分为以下四类:

- 1) 显式读 CSR: 通过 PRI\_RCSR 指令读出 CSR 中的内容;
- 2) 隐式读 CSR: 硬件根据 CSR 中的内容执行相应的操作,如进行指令流地址虚实代换时,就



是对 ITB 的隐式读;

- 3) 显式写 CSR: 通过 PRI WCSR 指令修改 CSR 中的内容:
- 4) 隐式写 CSR: 硬件执行过程中根据当前的状态更新 CSR 中的内容,如 Load 指令产生数据流故障而修改 EXC PC、DVA、DS STAT 等 CSR;接到中断请求时,更新 INT STAT 等 CSR。

为保证隐式和显示读写 CSR 的正确性,SW421 核心在具体实现时设置了相应的访问控制机制,但在某些特殊情况下需要软件来保证。

### 3.2.1 CSR 记分牌

SW421在指令流水线中共设置8个CSR记分牌,读写CSR指令,即PRI\_WCSR和PRI\_RCSR指令,以CSR地址的最低3位为索引访问这8个CSR记分牌。

- 1) PRI WCSR 指令发射时,要求所对应的 CSR 记分牌为无效;
- 2) PRI\_WCSR 指令在发射后,将所对应的 CSR 记分牌有效位置"1",同时在该记分牌条目中登记地址、指令序列号等信息,在该指令完成处理并退出或被中止时,将所对应的 CSR 记分牌有效位清除;
- 3) PRI\_RCSR 指令发射时,要求所对应的 CSR 记分牌为无效或者对应的 CSR 记分牌有效但访问地址与本条指令不同:
- 4) 访存指令发射时,要求所有 CSR 记分牌中无 DBOX 和 SBOX 相关的有效记分牌;
- 5) 整数指令发射时,要求所有 CSR 记分牌中无 EBOX 相关的有效记分牌。

### 3.2.2 CSR 写机制

CSR 中的内容直接控制处理器的运行,因此 SW421 核心必须保证 CSR 不会被推测执行的指令修改。在执行显示写 CSR 操作时,硬件只能在 PRI\_WCSR 指令退出时,才能修改对应的 CSR 内容。在发生异常等产生隐式写 CSR 的请求时,硬件只能在异常指令退出时,将该指令相关的异常信息写入对应的 CSR 中。

根据上一节对记分牌机制描述,只要 CSR 地址的低 3 位不同,最多允许 8 条写 CSR 指令在流水线上飞行,但每个周期只允许退出一条写 CSR 指令。

### 3.2.3 CSR 的存取顺序

下面分别说明 CSR 四种访问方式下各种组合之间的顺序关系。描述方式采用"方式 1→方式 2",其中方式 1 是先发生的访问 CSR 方式,方式 2 后发生的访问 CSR 方式。

1) 隐式读→隐式读:允许两个读操作被重排序;



- 2) 隐式读→隐式写: 不存在这种情况;
- 3) 隐式读→显式读: 允许两个读操作被重排序:
- 4) 隐式读→显式写: 由 CSR 写机制来保证顺序性;
- 5) 隐式写→隐式读:不存在这种情况;
- 6) 隐式写→隐式写: 由 CSR 写机制来保证顺序性;
- 7) 隐式写→显式读: 这类都是与异常和中断相关的 CSR 访问,由 HM 模式下访问机制保证:
- 8) 隐式写→显式写: 这类都是与异常和中断相关的 CSR 访问,由 HM 模式下访问机制保证;
- 9) 显式读→隐式读:允许两个读操作被重排序;
- 10) 显式读→隐式写:由 CSR 写机制来保证顺序性;
- 11) 显式读→显式读:允许两个读操作被重排序;
- 12) 显式读→显式写:由 CSR 记分板机制保证;
- 13) 显式写→隐式读:通常情况下 CSR 记分板机制可以保证,特殊情况下需要软件协助保证:
- 14) 显式写→隐式写: 通常情况下 CSR 写机制可以保证, 特殊情况下需要软件协助保证:
- 15) 显式写→显式读:由 CSR 记分板机制保证顺序性;
- 16) 显式写→显式写:由 CSR 记分板机制保证顺序性。

需要软件协助保证CSR访问顺序的要求,详见附录A。

# 3.3 指令部件中的 CSR

### **3.3.1 ITB TAG**

ITB\_TAG 为 ITB 的虚页号写寄存器,只写,装填 ITB 时,先将虚页号写入该寄存器,随后写 CSR: ITB\_PTE 寄存器时,才将该寄存器内容一并写入 ITB 中。

 名称
 范围
 类型
 描述

 VA[52:13]
 [52:13]
 WO
 装入ITB条目中的虚页号。

 其它位
 保留。

表 3-5ITB\_TAG 寄存器域描述

### **3.3.2 ITB PTE**

ITB\_PTE 为 ITB 的 PTE 写寄存器,只写,装填 ITB 时,写该寄存器,将 CSR: ITB\_TAG、 VPCR[VPN]、UPCR[UPN]和该寄存器内容一并写入 ITB。



#### 表 3-6ITB\_PTE 寄存器域描述

| 名称         | 范围      | 类型 | 描述                                                                                            |
|------------|---------|----|-----------------------------------------------------------------------------------------------|
| PFN[47:13] | [47:13] | WO | 物理页面号,ITB装填时,实际只写入[46:13]位。                                                                   |
| UEE        | [11]    | WO | 用户模式可执行位,为"1"表示指令流可在用户模式下访问该页面。                                                               |
| KEE        | [10]    | WO | 核心模式可执行位,为"1"表示指令流可在核心模式下访问该页面。                                                               |
| VEE        | [9]     | WO | 虚拟模式可执行位,为"1"表示指令流可在虚拟模式下访问该页面。                                                               |
| GH[1:0]    | [6:5]   | WO | 页面粒度,值为0、1、2或3,分别指示该页为1、32、1024或32768<br>个连续的8KB页组成的大页(分别对应8KB、256KB、8MB或256MB<br>地址对界的连续空间)。 |
| KS         | [4]     | WO | 系统空间标志,为"0"表示该页面为用户空间,为"1"表示该页面为系统空间。                                                         |
| _          | 其它位     | _  | 保留。                                                                                           |

### 3.3.3 ITB\_IA

ITB\_IA 为 ITB 全部刷新寄存器,只写,写该寄存器不需要数据,将清除 ITB 中所有条目。

### 3.3.4 ITB\_IV

ITB\_IV 为 ITB 虚拟机刷新寄存器,只写,写该寄存器不需要数据,将清除 ITB 中 VPN 与 CSR: VPCR[VPN]相同的所有条目。

### **3.3.5 ITB\_IVP**

ITB\_IVP 为 ITB 虚拟机部分刷新寄存器,只写,写该寄存器不需要数据,将清除 ITB 中 VPN 与 CSR: VPCR[VPN]相同且 KS 为 "0"的所有条目。

### **3.3.6 ITB\_IU**

ITB\_IU为ITB用户进程刷新寄存器,只写,写该寄存器不需要数据,将清除ITB中VPN与CSR: VPCR[VPN]相同,且UPN与CSR:UPCR[UPN]相同,且KS为"0"的所有条目。

### 3.3.7 ITB\_IS

ITB\_IS 为 ITB 条目刷新寄存器,只写,写该寄存器可刷新 ITB 中满足以下条件之一的条目:



- 1)ITB 条目中虚页面号与所写 CSR: ITB\_IS 数据[52:13]位匹配(要根据条目中页面粒度 GH 来确定实际比较的地址位数)、VPN与 CSR: VPCR[VPN]相同、UPN与 CSR: UPCR[UPN]相同且 KS为"0";
- 2) ITB 条目的虚页面号与所写 CSR: ITB\_IS 数据[52:13]位匹配(要根据条目中页面粒度 GH 来确定实际比较的地址位数)、VPN 与 CSR: VPCR[VPN]相同,且 KS 为 "1"。

表 3-7ITB\_IS 寄存器域描述

| 名称              | 范围      | 类型 | 描述        |
|-----------------|---------|----|-----------|
| INVL_ITB[52:13] | [52:13] | WO | 需要刷新的虚页号。 |
| _               | 其它位     | _  | 保留。       |

#### 3.3.8 EXC PC

EXC PC 为异常地址寄存器,只读,用于保存异常或中断时的指令流虚地址,它由硬件隐式修改。

名称 范围 类型 描述 指令流虚地址[52]位的符号扩展。 SEXT (PC[52]) [63:53] RO 指令流虚地址。 [52:2] RO PC[52:2] PM [1:0] RO 异常或中断产生时的处理器模式。

表 3-8EXC\_PC 寄存器域描述

该寄存器记录的地址有两种含义:

- 1) 如果是异常,则该寄存器记录的是产生异常的指令 PC 值;
- 2) 如果是中断,则该寄存器记录的是中断处理完成后准备执行的指令 PC 值。

### **3.3.9 IVA\_FORM**

IVA\_FORM 为指令虚地址格式寄存器,只读,该寄存器读出的内容来自 CSR: EXC\_PC 和 VPT\_BASE,目的是为了便于软件处理 ITB 脱靶异常。

| 表 3-9IVA_FOR | M 寄存器域描述 |
|--------------|----------|
|--------------|----------|

| 名称                  | 范围      | 类型 | 描述                 |
|---------------------|---------|----|--------------------|
| SEXT (VPT_BASE[52]) | [63:53] | RO | 虚页表基地址[52]位的符号扩展。  |
| VPT_BASE[52:49]     | [52:49] | RO | 虚页表基地址。            |
| SEXT(EXC_PC[52])    | [48:43] | RO | 异常指令虚页号[52]位的符号扩展。 |
| EXC_PC[52:13]       | [42:3]  | RO | 异常指令虚页号。           |
| _                   | [2:0]   | _  | 保留。                |



#### 3.3.10 PTBR

名称

PTBR PA[47:0]

PTBR 为页表基地址寄存器,读写,用于存放一级页表的基址,方便软件处理二次脱靶。

类型 描述

表 3-10PTBR 寄存器域描述

保留。

一级页表基址。

#### 3.3.11 IER0~3

IER0~3为普通硬件中断请求使能寄存器,可读写,该寄存器用于控制CSR: INT\_STAT0~3中所 有中断的使能(最多支持64种中断请求的屏蔽),与INT STAT0~3一一对应。当该寄存器中某一位为 "1"且对应的中断请求有效则进入中断请求处理。复位以后,各种中断在INT STATO~3中对应的位 置见附录D。

#### 3.3.12 II ER

II ER为核间中断使能寄存器。

范围

其它

[47:0]

RW, 0

表 3-11II\_ER 寄存器域描述

| 77.5 _ 77.17 M. W.A. |     |    |                                                           |  |  |  |  |
|----------------------|-----|----|-----------------------------------------------------------|--|--|--|--|
| 名称 范围 类型             |     | 类型 | 描述                                                        |  |  |  |  |
| _                    | 其它  | _  | 保留。                                                       |  |  |  |  |
| II_MAIL_EN           | [2] | RW | 处理器内部各核心之间发送的异步消息中断使能, 当为"1"时, 如果收到异步消息的数量大于0, 则允许进入中断处理。 |  |  |  |  |
| II1_EN               | [1] | RW | 处理器内部各核心之间发送的核间中断1使能, 当为"1"时, 如果收到核间中断1, 则允许进入中断处理。       |  |  |  |  |
| IIO_EN               | [0] | RW | 处理器内部各核心之间发送的核间中断0使能, 当为"1"时, 如果收到核间中断0,则允许进入中断处理。        |  |  |  |  |

#### 3.3.13 II0

II0为核间中断0寄存器,只读,用于记录核0到核15发向本核心的核间中断0请求有效位。在上电 复位或冷复位时清除,睡眠复位时内容保持不变。本寄存器记录的核间中断请求与对应的核间中断 使能(II\_ER[II0\_EN])无关,显式读此寄存器可获得本核心收到的所有的核间中断0请求,有效位为



"1",则说明收到了核间中断0请求;有效位为"0",则说明没有收到核间中断0请求。

表 3-12II0 寄存器域描述

| 名称             | 范围     | 类型   | 描述                                                        |
|----------------|--------|------|-----------------------------------------------------------|
| _              | 其它位    | _    | 保留                                                        |
| II0Valid[15:0] | [15:0] | RO,0 | 核心0到15向本核心发出的核间中断0请求有效位,当第i位为"1"时,表示第i个核心向本核心发的核间中断0请求有效。 |

#### 3.3.14 II1

II1为核间中断1寄存器,只读,用于记录核0到核15发向本核的核间中断1请求有效位。在上电复位或冷复位时清除,睡眠复位时内容保持不变。本寄存器记录的核间中断请求与对应的核间中断使能(II\_ER[II1\_EN])无关,显式读此寄存器可获得本核心收到的所有的核间中断1请求,有效位为"1",则说明收到了核间中断1请求;有效位为"0",则说明没有收到核间中断1请求。

表 3-13II1 寄存器域描述

| 名称             | 范围     | 类型   | 描述                                                          |
|----------------|--------|------|-------------------------------------------------------------|
| _              | 其它位    | _    | 保留                                                          |
| II1Valid[15:0] | [15:0] | RO,0 | 核心0到15向本核心发出的核间中断类型1请求有效位,当第i位为"1"时,表示第i个核心向本核心发的核间中断1请求有效。 |

### 3.3.15 II\_MAIL

II\_MAIL 为核间异步消息中断寄存器,只读,用于记录核心 0 到核心 15 发向本核心的异步消息数量。在上电复位或冷复位时清除,睡眠复位时内容保持不变。

表 3-14II\_MAIL 寄存器域描述

| 名称       | 范围    | 类型    | 描述                      |
|----------|-------|-------|-------------------------|
| _        | 其它    | _     | 保留。                     |
|          | [5:0] | RO, 0 | 是本核心收到的异步消息数量的          |
| MAH NUNG |       |       | 补码表示,最高位为符号位。当          |
| MAIL_NUM |       |       | MAIL_NUM大于"0"时,如果       |
|          |       |       | II_ER[II_MAIL_EN]为"1",则 |



|  | <del>之中日下冰白中岭(本中</del> |
|--|------------------------|
|  |                        |
|  |                        |

注: II\_MAIL 是核心对收到的异步消息数量的计数,其它核心向本核心发送一个异步消息时,该计数器加"1",本核心成功读走一个异步消息时,该计数器减"1",由于允许软件随意读异步消息,因此该计数器的值可能出现负数,但负数只是一种中间状态,当对异步消息的读写操作停止一段时间后,该计数器的值一定为正数或"0"。

#### 3.3.16INT STAT0~3

INT\_STAT0~3 为中断状态寄存器,只读,用于记录 C3 核心产生的、对应中断使能有效的所有普通硬件中断请求,共 256 个。INT\_STAT0 对应 0~63 号中断,INT\_STAT1 对应 64~127 号中断,INT\_STAT2 对应 128~191 号中断,INT\_STAT3 对应 192~255 号中断。该寄存器记录睡眠中断、机器检查错中断、已纠正中断、事件计数中断 1、事件计数中断 0 和所有外部中断,每位具体代表哪种中断由核心内部的 CSR: INT\_VEC 或核心外部的部分 I/O 寄存器(IOR)决定(IOR 的地址和类型可参看《SW421 核心 I/O 寄存器手册》)。在上电复位或冷复位时清"0",睡眠复位时内容保持不变,复位后各种中断在 INT\_STAT0~3 中对应的位置见附录 D。

本组寄存器记录的普通硬件中断请求与对应的普通硬件中断使能(IER0~3)相关,显式读此寄存器只能获得使能打开的普通硬件中断请求信息,对应位为"1",则说明收到了对应类型的中断请求,并且该类型的中断使能打开;对应位为"0",则可能是收到了对应类型的中断请求,并且该类型的中断使能关闭,也可能是没有收到对应类型的中断请求。

### **3.3.17 INT\_VEC**

INT\_VEC 为中断向量映射寄存器,可读写,用于设置事件计数中断、已纠正中断、机器检查错中断、睡眠中断在 INT\_STAT0~3 中位置。在上电复位或冷复位时进行设置,睡眠复位时内容保持不变。

| 表 3-13INI_VEC                  |         |         |                 |  |  |  |  |
|--------------------------------|---------|---------|-----------------|--|--|--|--|
| 名称                             | 范围      | 类型      | 描述              |  |  |  |  |
| _                              | 一 其它 一  |         | 保留。             |  |  |  |  |
| TIMER_VEC[7:0] [47:40] RW,0xFA |         | RW,0xFA | 指定定时器中断对应的向量。   |  |  |  |  |
| PC0_VEC[7:0] [39:32] RW,0xFB   |         | RW,0xFB | 指定事件计数0中断对应的向量。 |  |  |  |  |
| PC1_VEC[7:0]                   | [31:24] | RW,0xFC | 指定事件计数1中断对应的向量。 |  |  |  |  |
| CR_VEC[7:0]                    | [23:16] | RW,0xFD | 指定已纠正错中断对应的向量。  |  |  |  |  |
| MCHK_VEC[7:0]                  | [15:8]  | RW,0xFE | 指定机器检查错中断对应的向量。 |  |  |  |  |

表 3-15INT VEC 寄存器域描述



|  | SLEEP_VEC[7:0] | [7:0] | RW,0xFF | 指定睡眠中断对应的向量。 |
|--|----------------|-------|---------|--------------|
|--|----------------|-------|---------|--------------|

### 3.3.18 INT\_CLR0~3

INT\_CLR0~3 为清除普通硬件中断寄存器,只写,用于清除 INT\_STAT0~3 中对应的普通硬件中断请求,与 INT\_STAT0~3 一一对应。写该寄存器时,若对应的数据位为"1",则 INT\_STAT0~3 中对应的中断请求被清除。复位以后,各种中断在 INT STAT0~3 中对应的位置见附录 D。

#### 3.3.19 II\_CLR

II CLR 为清除核间中断寄存器,只写,用于清除 IIO 和 II1 中记录的核间中断请求有效位。

| 名称            | 范围      | 类型 | 描述                                                       |
|---------------|---------|----|----------------------------------------------------------|
| _             | 其它      | _  | 保留。                                                      |
| II1_CLR[15:0] | [31:16] | WO | 清除核间中断1寄存器,写该寄存器的某位为"1"时,值表示将CSR: II1[II1Valid]中的某位清"0"。 |
| II0_CLR[15:0] | [15:0]  | WO | 清除核间中断0寄存器,写该寄存器的某位为"1"时,值表示将CSR: II0[II0Valid]中的某位清"0"。 |

表 3-16II\_CLR 寄存器域描述

### 3.3.20 EXC\_SUM

EXC\_SUM 为异常摘要寄存器,只读,用于存放产生异常指令的相关信息,硬件在产生异常的指令退出时更新此 CSR,仅当在异常处理特权程序的第一个指令组读该寄存器,得到的内容才是准确、有效的。该寄存器保存下列三种异常相关的信息:

- 1) 算术自陷: 指令产生了必须报告给操作系统的异常情况,该寄存器的 REG 域包含触发自陷的指令目标寄存器号;
- 2) 指令流故障:产生了指令流目标地址与指定地址匹配成功、指令流地址与指定地址匹配成功,以及跳转目标指令地址符号扩展错,但不包括 ITB 访问引起的指令流地址越权。当 IDA MATCH或 BAD IVA 有效时,该寄存器的 REG 域包含跳转指令的 Ra 域;
- 3) 数据流故障: 数据流访问产生了 DTB 脱靶、地址不对界以及其它数据流故障,该寄存器 REG 域包含触发故障的访存指令 Ra 域。

表 3-17EXC\_SUM 寄存器域描述

| 名称        | 范围   | 类型 | 描述                      |
|-----------|------|----|-------------------------|
| IDA_MATCH | [34] | RO | 指示整数转移指令的目标地址与指定地址匹配成功。 |



|          | 1                  | 1    | 中威 421 处理命状计按口于测                      |         |  |
|----------|--------------------|------|---------------------------------------|---------|--|
| IA_MATCH | [33]               | RO   | 指示指令流地址与指定地址匹配成功。                     |         |  |
| "0"      | [32]               | RO   | 固定为"0"。                               |         |  |
| INE3     | [31]               | RO   | 指示浮点扩展部件产生浮点不精确结果自陷。  浮点向量第           |         |  |
| UNF3     | [30]               | RO   | 指示浮点扩展部件产生浮点下溢自陷。    个元素运算            |         |  |
| FOV3     | [29]               | RO   | 指示浮点扩展部件产生浮点上溢自陷。                     | 生的浮点算术  |  |
| DZE3     | [28]               | RO   | 指示除数为"0"自陷。                           | 自陷。     |  |
| INV3     | [27]               | RO   | 指示浮点扩展部件产生无效操作自陷。                     |         |  |
| "0"      | [26]               | RO   | 固定为"0"                                |         |  |
| INE2     | [25]               | RO   | 指示浮点扩展部件产生浮点不精确结果自陷。                  | 浮点向量第三  |  |
| UNF2     | [24]               | RO   | 指示浮点扩展部件产生浮点下溢自陷。                     | 个元素运算产  |  |
| FOV2     | [23]               | RO   | 指示浮点扩展部件产生浮点上溢自陷。                     | 生的浮点算术  |  |
| DZE2     | [22]               | RO   | 指示除数为"0"自陷。                           | 自陷。     |  |
| INV2     | [21]               | RO   | 指示浮点扩展部件产生无效操作自陷。                     |         |  |
| "0"      | [20]               | RO   | 固定为"0"                                |         |  |
| INE1     | [19]               | RO   | 指示浮点扩展部件产生浮点不精确结果自陷。                  | 浮点向量第二  |  |
| UNF1     | [18]               | RO   | 指示浮点扩展部件产生浮点下溢自陷。    个元素运算            |         |  |
| FOV1     | [17]               | RO   | 指示浮点扩展部件产生浮点上溢自陷。 生 的 算 术             |         |  |
| DZE1     | [16]               | RO   | 指示除数为"0"自陷。 陷。                        |         |  |
| INV1     | [15]               | RO   | 指示浮点扩展部件产生无效操作自陷。                     |         |  |
| Picc     | E4 43              | D.C. | 指示处理"取并加1"或"取并减1"指令时,产生整数溢出           |         |  |
| INCO     | [14]               | RO   | 陷。                                    |         |  |
| BAD_IVA  | [13]               | RO   | 指示跳转类指令的跳转目标指令地址产生符号扩展错。              |         |  |
|          |                    |      | 产生异常的Load/Store指令或跳转指令的Ra域,或          | 或者运算类指令 |  |
| DEC[4.0] | [12.0]             | DO.  | 的目标寄存器域(Ra或Rc或Rd)。若产生异常的是ITB脱靶、       |         |  |
| KEG[4:0] | REG[4:0] [12:8] RO |      | 中断、OPCDEC、IA_MATCH、非Load、Store指令和运算类指 |         |  |
|          |                    |      | 令,则该域的值是不可预测的。                        |         |  |
| INT      | [7]                | RO   | 指示整数部件产生整数溢出自陷。                       |         |  |
| OVI0     | [6]                | RO   | 指示浮点转换为整数或整数运算时产生溢出自                  |         |  |
| 0 4 10   | [6]                | NO.  | 陷。                                    | 浮点或浮点   |  |
| INE0     | [5]                | RO   | 指示不精确结果自陷。                            | 向量第一个   |  |
| UNF0     | [4]                | RO   | 指示下溢自陷。        元素运算                   |         |  |
| FOV0     | [3]                | RO   | 指示上溢自陷。    生的算术                       |         |  |
| DZE0     | [2]                | RO   | 指示除数为"0"自陷。 陷。                        |         |  |
| INV0     | [1]                | RO   | 指示无效操作自陷。                             |         |  |
|          |                    |      |                                       |         |  |



| SWC | [0] | RO | 指示需要操作系统异常处理程序对出现异常的浮点指令进行仿<br>真处理(即在 FPCR[1]位为"0"时产生浮点异常)。 |
|-----|-----|----|-------------------------------------------------------------|
| _   | 其它位 | _  | 保留。                                                         |

### **3.3.21 PRI\_BASE**

PRI\_BASE 为特权程序基地址寄存器,可读写,用于保存特权程序的物理基地址,在上电复位或冷复位时,复位值为全"0",睡眠复位时内容保持不变。

|                 | 农 3-10FRI_DASE |    |                                               |  |  |  |
|-----------------|----------------|----|-----------------------------------------------|--|--|--|
| 名称              | 范围             | 类型 | 描述                                            |  |  |  |
| PRI_BASE[47:16] | [47:16]        | RW | 特权程序的物理基地址,[47]固定为"0",上电复位和<br>冷复位时,复位值为全"0"。 |  |  |  |
| _               | 其它位            | _  | 保留。                                           |  |  |  |

表 3-18PRI\_BASE 寄存器域描述

#### 3.3.22 IS CTL

IS\_CTL 为指令流控制寄存器,可读写,该寄存器用于控制指令部件的各种功能,复位时设置为"0x10088"。

| 名称           | 范围      | 类型   | 描述                                                                                                                      |
|--------------|---------|------|-------------------------------------------------------------------------------------------------------------------------|
| HM_PEN       | [16]    | RW,1 | 硬件模式下进行预测使能信号,为"1"表示可以进行预测。                                                                                             |
| PC1_EN       | [15]    | RW,0 | 事件计数器1使能。                                                                                                               |
| PC0_EN       | [14]    | RW,0 | 事件计数器0使能。                                                                                                               |
| PC_CM        | [13:12] | RW,0 | 指定在何种模式下进行事件计数: "00 <sub>2</sub> "为硬件模式; "01 <sub>2</sub> "<br>为虚拟模式; "10 <sub>2</sub> "为内核模式; "11 <sub>2</sub> "为用户模式。 |
| CM_PCE       | [11]    | RW,0 | 指定模式事件计数使能。                                                                                                             |
| AM_PCE       | [10]    | RW,0 | 任何模式事件计数使能。                                                                                                             |
| BIST_FAIL    | [9]     | RO,0 | BISR自修复或BIST自测试结果:为"0"表示BISR或BIST成功,否则表示失败。                                                                             |
| CHIP_ID[5:0] | [8:3]   | RO   | 保留。固定为0x3F,具体定义详见附录C。                                                                                                   |
| F_BAD_DPAR   | [2]     | RW,0 | 指令Cache装填时,强制装填错误的数据校验位。                                                                                                |
| F_BAD_TPAR   | [1]     | RW,0 | 指令Cache装填时,强制装填错误的标记地址校验位。                                                                                              |
| SRE          | [0]     | RW,0 | 系统寄存器使能:若SRE为"1",则在HM模式下可访问系                                                                                            |

表 3-19IS\_CTL 寄存器域描述



|   |     |   | 统寄存器。 |
|---|-----|---|-------|
| _ | 其它位 | _ | 保留。   |

其中,PC0\_EN、PC1\_EN、AM\_PCE、CM\_PCE、PC\_CM 是事件计数相关的控制位,当 PC0\_EN 为"1", 且 AM PCE 为"1"或 CM PCE 为"1"时,事件计数器 0 中断使能;当 PC1 EN 为"1", 且 AM\_PCE 为 "1" 或 CM\_PCE 为 "1" 时,事件计数器 1 中断使能。AM\_PCE 和 CM\_PCE 不能同 时为"1",如果同时为"1",则按所有模式进行事件计数。当 CM PCE 为"1"时,硬件只对 PC CM 中指定的模式下发生的事件计数。事件计数的具体方法详见 8.3 和附录 B。

#### **3.3.23 ISSUE CTL**

ISSUE CTL 为指令发射控制寄存器,可读写, ISSUE INT[9:0]控制整数指令发射,发射站台判 断最低位若为"1",则表示此周期允许整数指令发射,否则禁止整数指令发射,ISSUE\_INT[9:0]中 的值在每个周期都进行循环右移。ISSUE\_FLT[9:0]作用与 ISSUE\_INT[9:0]相同,不同在于控制浮点 指令发射。此寄存器在上电复位或冷复位时设置为 0xFFFFF, 睡眠复位时内容保持不变。

| 7 0 1010002_012 A) () HH-W/HZ |         |          |          |  |  |  |  |
|-------------------------------|---------|----------|----------|--|--|--|--|
| 名称                            | 范围      | 类型       | 描述       |  |  |  |  |
| ISSUE_FLT[9]                  | [19]    | RO,1     | 固定为"1"。  |  |  |  |  |
| ISSUE_FLT[8:0]                | [18:10] | RW,0x1FF | 浮点发射控制位。 |  |  |  |  |
| ISSUE_INT[9]                  | [9]     | RO,1     | 固定为"1"。  |  |  |  |  |
| ISSUE_INT[8:0]                | [8:0]   | RW,0x1FF | 整数发射控制位。 |  |  |  |  |
| _                             | 其它位     | _        | 保留。      |  |  |  |  |

表 3-20ISSUE CTL 寄存器域描述

### **3.3.24 IS STAT**

IS STAT 为指令流状态寄存器,可读写,用于保存指令流发现的各种错误状态,通过写"1"可 清除对应的状态。

| b th     | -#*-1553 | अंद्र क्या | T#+ 7                                         |
|----------|----------|------------|-----------------------------------------------|
| 名称       | 范围       | 类型         | 描述                                            |
| MEM_MERR | [5]      | R,W1C      | 指令流访问主存时,主存数据产生ECC多错。                         |
| DATA_PAR | [4]      | R,W1C      | 指令Cache的数据偶校验错,指示在取指时读指令Cache数据<br>存储器产生偶校验错。 |
| TAG_PAR  | [3]      | R,W1C      | 指令Cache的标记偶校验错,指示在取指时读指令Cache标记<br>存储器产生偶校验错。 |



| ROB_ERR  | [2] | R,W1C | 重排序缓冲状态非法,指示重排序缓冲(ROB)的头尾指针管理混乱。           |
|----------|-----|-------|--------------------------------------------|
| ADDR_ERR | [1] | R,W1C | 指令流数据响应错,指示从主存取指令时,因指令流访问不存在的地址空间而返回数据错响应。 |
| ACK_ERR  | [0] | R,W1C | 指令流引起访存响应错,指示从主存取指令时,访存部件收到的响应和请求类型不匹配。    |
| _        | 其它位 | _     | 保留。                                        |

#### **3.3.25 IC FLUSH**

IC\_FLUSH为指令Cache 刷新寄存器,只写,写不需要数据。写该寄存器时将清除整个指令Cache,刷新过程中,不再进行新的取指令操作,直到刷新完成。

### **3.3.26 VPT\_BASE**

VPT\_BASE 寄存器为虚页表基地址寄存器,可读写。

 名称
 范围
 类型
 描述

 SEXT(VPTB[52])
 [63:53]
 RO
 虚页表基地址[52]位的符号扩展。

 VPTB[52:49]
 [52:49]
 RW
 虚页表基地址。

 其它位
 保留。

表 3-22VPT\_BASE 寄存器域描述

#### 3.3.27 UPCR

UPCR为用户进程控制寄存器,可读写,记录进程的相关信息。读总是返回寄存器所有位域的信息,写既可以修改整个寄存器,也可以只修改此寄存器中某个域,CSR索引号[0]位为"1"指示写SCE、FPE和FCE域,CSR索引号[1]位为"1"指示写UPN域。复位时设置为"0x07"。

|          |         |      | 衣 3-23UPC | JR 奇仔岙现抽处                             |
|----------|---------|------|-----------|---------------------------------------|
| 名称       | 范围      | 类型   | CSR索引     | 描述                                    |
| 其它       | _       | _    | _         | 保留。                                   |
| UPN[7:0] | [46:39] | RW,0 | [1]位      | 用户进程号。                                |
| SCE      | [2]     | RW,1 | [0]位      | SIMD从流水线时钟使能,若为"0",则关闭<br>SIMD从流水线时钟。 |

表 3-23UPCR 寄存器域描述



| FPE | [1] | RW,1 | [0]位 | 浮点使能,若为"0",则不允许执行浮点指令。          |
|-----|-----|------|------|---------------------------------|
| FCE | [0] | RW,1 | [0]位 | 浮点部件时钟使能, 若为"0", 则关闭浮点<br>部件时钟。 |

#### 3.3.28 PC0\_CR

PC0\_CR为事件计数与控制寄存器0,可读写。用于读写事件计数器0的计数值和设置事件计数器0的计数条件。

 名称
 范围
 类型
 描述

 PC0\_SEL[3:0]
 [63:60]
 RW
 事件计数器0的计数对象选择,具体定义详见8.2

 [59:58]
 保留。

 PC0[57:0]
 [57:0]
 RW
 事件计数器0。

表 3-24PC0\_CR 寄存器域描述

### 3.3.29 PC1\_CR

PC1\_CR为事件计数与控制寄存器1,可读写。用于读写事件计数器1的计数值和设置事件计数器1的计数条件。

|              | 次 5-25FCI_CN 有仔留以油处 |    |                         |  |  |  |
|--------------|---------------------|----|-------------------------|--|--|--|
| 名称           | 范围                  | 类型 | 描述                      |  |  |  |
| PC1_SEL[5:0] | [63:58]             | RW | 事件计数器1的计数对象选择,具体定义详见8.2 |  |  |  |
| PC1[57:0]    | [57:0]              | RW | 事件计数器1。                 |  |  |  |

#### 3.3.30 VPCR

VPCR为虚拟机进程控制寄存器,可读写,记录虚拟机的相关信息。复位时设置为全"0"。

表 3-26VPCR 寄存器域描述

| 名称    | 范围      | 类型 | 描述       |
|-------|---------|----|----------|
| VPN   | [45:44] | RW | 虚拟机号。    |
| VM_ST | [43:0]  | RW | 虚拟模式状态位。 |
| _     | 其它位     |    | 保留。      |



### **3.3.31 IA MATCH**

IA\_MATCH 为指令流地址匹配寄存器,可读写,复位时设置为全"0"。该寄存器用于指令流调试,当指令流访问地址与该寄存器内容匹配时,将产生指令流故障。

|            | 71.5    |      |                                |  |  |
|------------|---------|------|--------------------------------|--|--|
| 名称         | 范围      | 类型   | 描述                             |  |  |
| EN         | [63]    | RW,0 | 匹配使能信号,为"1"表示匹配使能。             |  |  |
| VPN[1:0]   | [62:61] | RW,0 | 指定需要匹配的虚拟机号。                   |  |  |
| UPN[7:0]   | [60:53] | RW,0 | 指定需要匹配的用户进程号。                  |  |  |
|            |         |      | 指定需要匹配的指令虚地址,其中[1:0]位指定需要匹配的处理 |  |  |
| ADDR[52:0] | [52:0]  | RW,0 | 器模式。                           |  |  |

表 3-27IA\_MATCH 寄存器域描述

#### **3.3.32 IA MASK**

IA\_MASK 为指令流地址屏蔽寄存器,可读写,复位时为"0x7FFF,FFFF,FFFF,FFFF"。该寄存器用于指令流调试,屏蔽进行指令流地址比较的位数。

| 名称          | 范围     | 类型       | 描述                              |
|-------------|--------|----------|---------------------------------|
| _           | 其它位    | _        | 保留。                             |
| MASK[62:0]  | [62:0] | DW 今 "1" | 指令流地址匹配屏蔽位,对应IA_MATCH[62:0]中的每一 |
| WIA3K[02.0] | [02.0] | RW,全"1"  | 位,为"1"表示该位参与比较。                 |

表 3-28IA\_MASK 寄存器域描述

### 3.3.33 HSERR\_CNT

HSERR\_CNT 为核心可纠正错计数器,复位时清"0"。当核心内的 ICache、DCache 和 SCache 存储阵列发生可纠正错时,该寄存器的已纠正错计数器 HSERR\_CNT 加"1";当时间计数器溢出时,将该计数器清"0"。当已纠正计数器溢出时,将 SERR\_OF 置为"1",如果已纠正错中断使能打开,则产生已纠正错中断。判断溢出的条件由核心已纠正错阀值寄存器 HSERR\_TH 决定。软件写该寄存器时,如果第[0]位为"1",则 HSERR\_CNT[31:0]清"0";如果第[32]位为"1",则 SERR\_OF 清"0"。

表 3-29HSERR 寄存器域描述

| 名称 范围            |         | 类型       | 描述             |
|------------------|---------|----------|----------------|
| _                | 一 其它位 一 |          | 保留。            |
| SERR_OF [32] RO, |         | RO,W1C,0 | 核心已纠正错计数器溢出标志。 |



| HSERR_CNT[31:0] | [31:0] | RO,W1C,0 | 核心已纠正错计数器的数值。 |
|-----------------|--------|----------|---------------|

### **3.3.34 HSERR\_TH**

HSERR\_TH 为已纠正错计数器阀值寄存器,复位时已纠正错计数器阀值置为"0x00",时间计数器阀值置为"0x1F"。该寄存器的 SERR\_THLD[4:0]用于控制已纠正错计数器的溢出条件,即指示这 32 位计数器中某位有进位时,则表示该计数器已溢出。该寄存器的 TIME\_THLD[5:0]用于控制时间计数器的溢出条件,即分别指示这 64 位计数器中某位有进位时,则表示已该计数器溢出。TIME\_THLD[6]为时间计数屏蔽位,为"1"时,时间计数器不计数。

| 农 5-50H5ERR_TH 前 行品效温度 |        |         |                                         |  |  |
|------------------------|--------|---------|-----------------------------------------|--|--|
| 名称                     | 范围     | 类型      | 描述                                      |  |  |
| _                      | 其它位    | _       | 保留。                                     |  |  |
| SERR_THLD[4:0]         | [11:7] | RW,0    | 核心已纠正错计数器的阀值,指示已纠正错计数器产生溢出的条件。          |  |  |
| TIME_THLD[6:0]         | [6:0]  | RW,0x1F | 时间计数器的阀值。最高位为时间计数屏蔽位,低6位指示时间计数器产生溢出的条件。 |  |  |

表 3-30HSERR\_TH 寄存器域描述

### 3.3.35 IGL\_INST

IGL\_INST 为非法指令寄存器,只读,复位时,清0。当指令流出现非法操作码故障、指令流地址匹配成功、浮点屏蔽故障时,该寄存器表示非法指令的32位信息。

| 表 3-31IGL_INST 奇仔ถ以描述 |        |        |                              |  |  |
|-----------------------|--------|--------|------------------------------|--|--|
| 名称                    | 范围     | 类型     | 描述                           |  |  |
| _                     | 其它位    | _      | 保留。                          |  |  |
|                       |        |        | 锁指令非法标志,当该位为"1"表示:           |  |  |
|                       |        |        | 1) 译码站台收到LSTx指令时,如果LSTx指令不在指 |  |  |
|                       |        |        | 令0位置,或者指令1位置上不是RD_F指令,则LSTx  |  |  |
| LOCK_IGL              | [32]   | RO,0   | 指令报操作码非法故障;                  |  |  |
|                       |        |        | 2) 译码站台收到RD_F指令时,如果指令0位置上不是  |  |  |
|                       |        |        | LSTx指令,或者RD_F指令不在指令1位置,则RD_F |  |  |
|                       |        |        | 指令报操作码非法故障。                  |  |  |
| IGL_INST [31:0]       | [31:0] | RO,0x0 | 非法指令信息。                      |  |  |

表 3-31IGL\_INST 寄存器域描述



#### **3.3.36 SOFT\_ERR**

SOFT\_ERR 为软件故障标志寄存器,软件可读写,复位时,清0。该寄存器置从"0"变为"1"时,可向维护接口报告一个软件故障,该故障可产生一个故障中断,也可通过芯片引脚向系统报错。

 名称
 范围
 类型
 描述

 其它位
 保留。

 SOFT\_ERR
 [0]
 RW,0x0
 软件故障标志位,只能由软件来设置。

表 3-32SOFT\_ERR 寄存器域描述

### **3.3.37 HARD\_ERR**

HARD\_ERR 为硬件故障标志寄存器,软件可读写,复位时,清0。该寄存器置从"0"变为"1"时,可向维护接口报告一个硬件故障,该故障可产生一个故障中断,也可通过芯片引脚向系统报错。

 名称
 范围
 类型
 描述

 其它位
 保留。

 HARD\_ERR
 [0]
 RW,0x0
 硬件故障标志位,只能由软件来设置。

表 3-33HARD\_ERR 寄存器域描述

### **3.3.38 TIMER\_CTL**

TIMER\_CTL 为核心定时器控制寄存器,软件可读写,复位时清 0,产生定时器中断时自动清 0。

 名称
 范围
 类型
 描述

 其它位
 保留

 TIMER\_EN
 [0]
 RW,0
 定时器使能信号,只有在该信号为1时,内部定时器才开始从0开始进行加1计数,直至到达TIMER\_TH指定的阈值。

表 3-34TIMER\_CTL 寄存器域描述

### **3.3.39 TIMER\_TH**

TIMER\_TH 为核心定时器阈值寄存器,软件可读写,复位时清 0。软件如果需要修改该阈值,应该确保 TIMER\_CTL[TIMER\_EN]为关闭的情况下进行,否则可能会产生意想不到的后果。



| 表 3-35TIMER | _TH | 寄存器域描述 |
|-------------|-----|--------|
|-------------|-----|--------|

| 名称       | 范围     | 类型   | 描述                                                                            |
|----------|--------|------|-------------------------------------------------------------------------------|
| TIMER_TH | [63:0] | RW,0 | 定时器阈值,当CSR: TIMER_CTL[TIMER_EN]<br>为"1"时,计数器就从0开始加"1"计数,加到<br>所设阈值以后便产生定时器中断。 |

# 3.4 数据 Cache 管理部件中的 CSR

#### **3.4.1 DTB\_TAG**

DTB\_TAG 为 DTB 的虚页号写寄存器,只写,装填 DTB 时,先将虚页号写入该寄存器,随后写 CSR: DTB\_PTE 寄存器时,才将该寄存器内容一并写入 DTB 中。

表 3-36DTB\_TAG 寄存器域描述

| 名称        | 范围      | 类型 | 描述          |
|-----------|---------|----|-------------|
| VA[52:13] | [52:13] | WO | 数据流访问地址虚页号。 |
| _         | 其它位     | _  | 保留。         |

### **3.4.2 DTB\_PTE**

DTB\_PTE 为 DTB 的 PTE 写寄存器,只写,装填 DTB 时,写该寄存器,将 CSR: DTB\_TAG、 DTB\_PCR[VPN、UPN]和该寄存器内容一并写入 DTB。

表 3-37DTB\_PTE 寄存器域描述

| 名称        | 范围      | 类型 | 描述                            |  |  |
|-----------|---------|----|-------------------------------|--|--|
| PA[47:13] | [58:24] | WO | 数据流访问地址物理页面号。                 |  |  |
| UWE       | [15]    | WO | UM可写位,为"1"时,在UM模式下可对该页面执行写操作。 |  |  |
| KWE       | [14]    | WO | KM可写位,为"1"时,在KM模式下可对该页面执行写操作。 |  |  |
| VWE       | [13]    | WO | VM可写位,为"1"时,在VM模式下可对该页面执行写操作。 |  |  |
| HWE       | [12]    | WO | HM可写位,为"1"时,在HM模式下可对该页面执行写操作。 |  |  |
| URE       | [11]    | WO | UM可读位,为"1"时,在UM模式下可对该页面执行读操作。 |  |  |
| KRE       | [10]    | WO | KM可读位,为"1"时,在KM模式下可对该页面执行读操作。 |  |  |
| VRE       | [9]     | WO | VM可读位,为"1"时,在VM模式下可对该页面执行读操作。 |  |  |
| HRE       | [8]     | WO | HM可读位,为"1"时,在HM模式下可对该页面执行读操作。 |  |  |



| GH[1:0] | [6:5] | WO | 页面粒度,值为0、1、2或3,分别对应1、32、1024或32768个连续且对界的8KB页(分别对应8KB、256KB、8MB或256MB地址对界的连续空间)。 |
|---------|-------|----|----------------------------------------------------------------------------------|
| KS      | [4]   | WO | 系统空间标志,为"0"表示该页面为用户空间,为"1"表示该页面为系统空间。                                            |
| FOW     | [2]   | WO | 写故障位,为"1"指示对此页面的写访问将产生数据流故障(DFAULT)。                                             |
| FOR     | [1]   | WO | 读故障位,为"1"指示对此页面的读访问将产生数据流故障(DFAULT)。                                             |
| _       | 其它位   | _  | 保留。                                                                              |

#### 3.4.3 DTB\_IA

DTB\_IA为DTB全部刷新寄存器,只写,写不需要数据。写该寄存器将所有DTB的条目置为无效。

### 3.4.4 DTB\_IV

DTB\_IV为DTB虚拟机刷新寄存器,只写,写该寄存器不需要数据,将清除DTB中所有VPN与CSR: DTB\_PCR[VPN]相同的所有条目。

### **3.4.5 DTB\_IVP**

DTB\_IVP为DTB虚拟机部分刷新寄存器,只写,写该寄存器不需要数据,将清除DTB中VPN与 CSR: DTB\_PCR[VPN]相同且KS为"0"的所有条目。

### **3.4.6 DTB\_IU**

DTB\_IU 为 DTB 用户进程刷新寄存器,只写,写该寄存器不需要数据,将清除 DTB 中 VPN 与 CSR: DTB\_PCR[VPN]相同,且 UPN 与 CSR: DTB\_PCR[UPN]相同,且 KS 为 "0"的所有条目。

### **3.4.7 DTB\_IS**

DTB\_IS为DTB条目刷新寄存器,只写。写该寄存器可刷新DTB中满足以下条件之一的条目:

1) DTB 条目的虚页面号与该寄存器的 VA[52:13]位匹配 (要根据条目中的页面粒度 GH 来确定



实际匹配的地址位数),且 VPN 域与 CSR: DTB\_PCR[VPN]相同,且 UPN 域与 CSR: DTB\_PCR[UPN]相同,且 KS 为 "0";

2) DTB 条目的虚页面号与该寄存器的 VA[52:13]位匹配(要根据条目中的页面粒度 GH 来确定实际匹配的地址位数), VPN 域与 CSR: DTB PCR[VPN]相同,且 KS 为"1"。

| 次 3-30D I D_13 引 行曲 均油处 |         |    |                |  |
|-------------------------|---------|----|----------------|--|
| 名称                      | 范围      | 类型 | 描述             |  |
| VA[52:13]               | [52:13] | WO | 需要刷新DTB条目的虚页号。 |  |
| _                       | 其它位     | _  | 保留。            |  |

表 3-38DTB\_IS 寄存器域描述

#### **3.4.8 DTB PCR**

DTB\_PCR为DTB进程控制寄存器,可读写。该寄存器用于设置DTB装填和刷新时的虚拟机号、用户进程号,以及HM模式下的虚地址数据流访问指令查询DTB时使用的替代处理器模式。

| 名称       | 范围      | 类型 | 描述     |  |
|----------|---------|----|--------|--|
| VPN[1:0] | [63:62] | RW | 虚拟机号   |  |
| UPN[7:0] | [61:54] | RW | 用户进程号  |  |
| PM[1:0]  | [1:0]   | RW | 处理器模式。 |  |
| _        | 其它位     | _  | 保留。    |  |

表 3-39DTB PCR 寄存器域描述

### **3.4.9 DS STAT**

DS\_STAT 为数据流状态寄存器,可读写,写不需要数据,直接将其内容清"0"。该寄存器用于记录数据流发生地址符号扩展错、SIMD 对界错、校验错或存储管理故障时的相关状态和指令信息。注意,当标量指令发生不对界错时,会清除所有标志,该错误的处理不依赖于这个寄存器的内容;当产生 DTBM\_DOUBLE 异常自陷时,不修改此寄存器内容。

|           |      |      | I                                            |
|-----------|------|------|----------------------------------------------|
| 名称        | 范围   | 类型   | 描述                                           |
| _         | 其它位  | _    | 保留。                                          |
| DAV_MATCH | [20] | R,WC | 指示数据流地址和数值同时匹配成功,进入数据流故障(只有Store类指令会发生匹配成功)。 |
| DV_MATCH  | [19] | R,WC | 指示数据流数据匹配成功,进入数据流故障(只有Store类指<br>令会发生匹配成功)。  |

表 3-40DS\_STAT 寄存器域描述



| _           | [18]  | _    | 保留。                             |
|-------------|-------|------|---------------------------------|
|             |       | R,WC | 访存指令对二级Cache执行读操作时,数据产生ECC单错。由  |
| SCD_SERR    | [17]  |      | 于该错误是通过硬件重发流程进行纠错的,因此软件应该忽略此标志。 |
| MEM_MERR    | [16]  | R,WC | 对存储器执行读操作时,主存数据产生ECC多错。         |
| CDAD MY     | [15]  | R,WC | 指示一般SIMD访存指令的地址不对界(对指令访问的向量数    |
| SIMD_MV     | [15]  |      | 据而言不对界,但对每个向量元素访问粒度而言是对界的)。     |
| DAT EDD     | F1 41 | R,WC | 指示访存指令读数据Cache的数据阵列时产生ECC校验错,作  |
| DAT_ERR     | [14]  |      | 为数据流故障。                         |
| DA_MATCH    | [13]  | R,WC | 指示数据流地址匹配成功,作为数据流故障。            |
|             | [12]  | R,WC | 指示数据流访问地址超出主存容量、读访问不存在的I/O寄存    |
| A CV/1      |       |      | 器、SIMD访存指令、原子操作指令或不可Cache访存指令访  |
| ACV1        |       |      | 问I/O空间地址、锁指令访问IO空间或不可Cache空间,作为 |
|             |       |      | 数据流故障。                          |
| BAD_DVA     | [11]  | R,WC | 指示计算数据流虚地址时产生符号扩展错。             |
| T. C. DEDD  | 54.03 | R,WC | 指示访存指令读数据Cache的标记阵列时产生偶校验错,作为   |
| TAG_PERR    | [10]  |      | 数据流故障。                          |
| OPCODE[5:0] | [9:4] | R,WC | 指示引起DTB脱靶、不对界异常或数据流故障的指令操作码。    |
| FOW         | [3]   | R,WC | 指示写访问一个具有FOW属性的页面而产生写故障。        |
| FOR         | [2]   | R,WC | 指示读访问一个具有FOR属性的页面而产生读故障。        |
| ACV0        | [1]   | R,WC | 指示在DTB虚实地址转换过程中出现存取越权。          |
| WR          | [0]   | R,WC | 指示写访问产生DTB脱靶、不对界异常或数据流故障。       |

# 3.4.10 DS\_CTL

DS\_CTL为数据流控制寄存器,可读写,存放数据流访问的控制信息。复位时为全"0"。

表 3-41DS\_CTL 寄存器域描述

| 名称          | 范围      | 类型   | 描述         |
|-------------|---------|------|------------|
| VPTB[52:49] | [52:49] | WO,0 | 数据流虚页表基地址。 |
| _           | 其它位     | _    | 保留。        |



DC\_CTL为数据Cache的控制寄存器,可读写,用于实现对数据Cache的各种控制,复位时为 "0x9456\_0000\_0000\_000F"。关于地址匹配和数值匹配调试功能的使用方法,详见6.5节。

表 3-42DC\_CTL 寄存器域描述

| 名称              | 范围                   | 类型       | 描述                         |
|-----------------|----------------------|----------|----------------------------|
| _               | 其它                   | _        | 保留。                        |
| PFH_L1_EN       | [63]                 | RW,1     | L1 Cache硬件预取使能,为"1"表示开启硬   |
|                 |                      |          | 件预取,否则关闭。                  |
| PFH_STRIDE_L1   | [62:60]              | RW,0x1   | L1 Cache硬件预取距离,复位值为"0x1",  |
|                 | [ ]                  | ,-       | 可配范围是: 0x0~0x7, 但不建议设为0x0。 |
| PFH_STRIDE_L2   | [59:56]              | RW,0x4   | L2 Cache硬件预取距离,复位值为"0x4",  |
| TTTI_STRIDE_L2  | [39.30]              | K W ,0X4 | 可配范围是: 0x0~0xF, 但不建议设为0x0。 |
| DELL CEDIDE 1.2 | [55 51]              | DWO      | L3 Cache硬件预取距离,复位值为"0xA",  |
| PFH_STRIDE_L3   | [55:51]              | RW,0xA   | 可配范围是: 0x0~0x1F,但不建议设为0x0。 |
|                 |                      |          | L2 Cache硬件预取使能,为"1"表示开启硬   |
| PFH_L2_EN       | [50]                 | RW,0x1   | 件预取,否则关闭。                  |
|                 |                      |          | L3 Cache硬件预取使能,为"1"表示开启硬   |
|                 | [49]                 |          | 件预取,否则关闭。注意: 当PFH_L3_EN    |
| PFH_L3_EN       |                      | RW,0x1   | 和ECACHE_EN同时为1时,才会进行L3     |
|                 |                      |          | Cache硬件预取。                 |
|                 |                      |          | 表示是否条件置脏请求。为"1"表示支持,       |
| LST_TODIRTY_EN  | [21]                 | RW,0     | 为"0"表示不支持。                 |
|                 |                      |          | 表示是否同时进行数据流地址和数值匹配         |
|                 |                      |          | (只有Store类指令会匹配成功,但是此使能     |
| DAV_ MATCH_EN   | [20]                 | RW,0     | 对Load类指令的匹配有影响,即该位为1时,     |
|                 |                      |          | Load类指令即使发生地址匹配,也不会记录      |
|                 |                      |          | 地址匹配状态或进入数据流故障)。           |
|                 |                      |          | 表示是否进行数据流数值匹配(只有Store类     |
| DV_MATCH_EN     | DV_MATCH_EN [19] RW, |          | 指令会匹配成功)。                  |
|                 |                      |          | 表示是否核外存在Cache,为"1"时,核心     |
| ECACHE_EN       | [18]                 | RW,0     | 可将核外Cache预取指令、核外Cache刷新指   |
|                 |                      |          | 令发出核心,否则当作空指令。             |



|               | T              | I      | 中放 421 处          | 埋器软件接口手册      |
|---------------|----------------|--------|-------------------|---------------|
|               |                |        | 二级DTB小页阵列的偶校      | 验使能;          |
|               |                |        | L2DTBS增加偶校验;当E    | BOX查询L2DTBS   |
|               |                |        | 时,对于该索引的四路的       | 任意一路(可以多      |
| LADED DEDD EN | [17]           | DWO    | 路),如果其有效、有偶       | 校验错,且该位使      |
| L2DTB_PERR_EN | [17]           | RW,0   | 能,则向Rob报自陷,硬何     | 件会记录出错的年      |
|               |                |        | 龄、索引地址和组号,当       | 收到该指令的清空      |
|               |                |        | 流水线时,硬件会根据索       | 引地址和组号对发      |
|               |                |        | 生偶校验错的几路置无效       | 0             |
|               |                |        | 强制装填指令处理DTB m     | iss;该位有效时,    |
| F_DTB_MISS    | [16]           | RW,0   | 装填指令访问DTB发生脱      | 靶时,需要进入脱      |
|               |                |        | 靶处理流程。            |               |
|               |                |        | 强制关闭SQMB使能;该      | 位有效,当SQMB     |
| PRB_CTRL      | [15]           | RW,0   | 处于合并状态1024个GCL    | K时钟周期时,强      |
|               |                |        | 制关闭SQMB。          |               |
| E DC CEDD     | [1.4]          | DWO    | 强制产生数据Cache ECC   | 只 对           |
| F_DC_SERR     | [14]           | RW,0   | 单错。               | SW421FPGA 环   |
| E DO MEND     | [13]           | RW,0   | 强制产生数据Cache ECC   | 境有意义,正常       |
| F_DC_MERR     |                |        | 多错。               | 使用对此位写全       |
| E DE DAD      | [12]           | RW,0   | 强制产生数据Cache标记     | <b>"</b> 0"。  |
| F_DT_PAR      |                |        | 偶校验错。             |               |
| _             | [11]           | _      | 保留。               |               |
| ATOP_OVF_EN   | [10]           | RW,0   | 原子操作指令溢出报错使       | 能。            |
| DCDAT_ERR_EN  | [9]            | RW,0   | 数据Cache的数据ECC校验   | <b>益</b> 错使能。 |
| PROBE_ERR_EN  | [8]            | RW,0   | 查询请求的错误使能。        |               |
| A GYL TOD THE | ( <del>-</del> | RW,0   | 二级Cache管理部件给数     | 据Cache管理部件    |
| ACK_ERR_EN    | [7]            | 1000,0 | 的响应错使能。           |               |
| _             | [6]            | _      | 保留。               |               |
|               |                |        | Cache淘汰指令(EVICTD) | L和EVICTDG)错   |
|               |                |        | 误检查使能,当Cache淘汉    | 太指令在地址转换      |
|               | 5.57           | RW,0   | 过程中产生存储管理故障       | 时,或在向核外发      |
| EVICTD_ERR_EN | [5]            | K W ,0 | 出淘汰请求后收到错误的       | 响应时,如果该位      |
|               |                |        | 为"0",则Cache淘汰指令   | 仍然正常退出; 否     |
|               |                |        | 则Cache淘汰指令进入异常    | <b></b>       |
| DCTAG_PAR_EN  | [4]            | RW,0   | 数据Cache的标记偶校验错    | 昔使能。          |
|               |                |        |                   |               |



|             |       |        | 数据Cache的组使能,只允许配置为所有组 |
|-------------|-------|--------|-----------------------|
| SET_EN[3:0] | [3:0] | RW,0xF | 使能或只有一个组被使能,其它组合将导致   |
|             |       |        | 不可预测的结果。              |

### **3.4.12 DC STAT**

DC\_STAT为数据Cache的状态寄存器,可读写,写"1"清除。该寄存器用于记录数据Cache管理部件发现的机器检查错状态,这些错都不可纠正,当机器检查错中断使能时,可产生机器检查错中断请求。

| 名称        | 范围  | 类型    | 描述                                                                                           |  |  |
|-----------|-----|-------|----------------------------------------------------------------------------------------------|--|--|
| DAT_MERR  | [2] | R,W1C | 存储器写指令在读出数据Cache中数据进行读修改写时,产生不能被写数据完全覆盖的ECC不可纠正多错,且该指令已退出。在该标志置起时,向软件报非精确的机器检查错,并向维护接口报多错。   |  |  |
| PROBE_ERR | [1] | R,W1C | 二级Cache管理部件送数据Cache管理部件的查询请求与数<br>R,W1C 据Cache管理部件中记录的状态不一致。在该标志置起时,<br>报非精确的机器检查错。          |  |  |
| ACK_ERR   | [0] | R,W1C | 访存指令产生的一次请求,通过二级Cache管理部件发给存储控制器,从存储控制器返回二级Cache管理部件的响应是错误响应,且该指令未退出。在该标志置起时,对应的指令报精确的机器检查错。 |  |  |
| _         | 其它位 | _     | 保留。                                                                                          |  |  |

表 3-43DC\_STAT 寄存器域描述

# **3.4.13 DA\_MATCH**

DA\_MATCH 为数据流地址匹配寄存器,可读写,复位时清"0"。该寄存器用于数据流调试, 当数据流访问地址与该寄存器内容匹配时产生数据流故障。

| 名称 | 范围      | 类型   | 描述                                   |
|----|---------|------|--------------------------------------|
| _  | [63:56] | _    | 保留。                                  |
| DA | [66]    | DW 0 | 物理地址标志,为"1"表示物理地址比较。即数据流的物理地         |
| PA | [55]    | RW,0 | 址PA[47:0]与ADDR[47:0]进行比较。否则进行虚地址比较,即 |

表 3-44DA\_MATCH 寄存器域描述



|            |         |      | 数据流的虚地址VA[52:0]与ADDR[52:0]进行比较;       |
|------------|---------|------|---------------------------------------|
|            |         |      | 注1:具体比较时首先根据DA_MASK[52:0]决定该位是否进行比    |
|            |         |      | 较;                                    |
|            |         |      | 注2: 具体比较时按DA_MATCH_MODE[52:0]指定的类型进行  |
|            |         |      | 相等比较或不等比较;                            |
|            |         |      | 注3:对于HM模式的物理地址访问(hw_st/p、hw_ld/p)物理PA |
|            |         |      | 指示,无条件按物理地址比较;该指令不参与虚地址比较。            |
|            |         |      | 地址匹配使能位,"002"指示禁止地址比较;"012"指示允许读      |
| EN[1:0]    | [54:53] | RW,0 | 访问地址比较;"102"指示允许写地址比较;"112"指示允许读      |
|            |         |      | 写地址比较。                                |
| ADDR[52:0] | [52:0]  | RW,0 | 与数据流地址进行比较的地址。                        |

### **3.4.14DA MASK**

DA\_MASK 为数据流地址屏蔽寄存器,可读写。该寄存器用于数据流调试,屏蔽进行数据流地址比较的位数。复位时设置为"0x1F,FFFF,FFFF,FFFF"。

|                   | 次 5 15DH_IMISH 前 门 品级间距 |                       |                            |  |  |  |  |  |
|-------------------|-------------------------|-----------------------|----------------------------|--|--|--|--|--|
| 名称                | 范围                      | 类型                    | 描述                         |  |  |  |  |  |
| _                 | [63:53]                 | _                     | 保留。                        |  |  |  |  |  |
| MASK[52:0]        | [52:0]                  | RW,全"1"               | 数据流地址匹配屏蔽位,与DA_MATCH[ADDR] |  |  |  |  |  |
| WASK[32.0] [32.0] | IXVV,土 I                | 中的每一位对应,为"1"表示该位参与比较。 |                            |  |  |  |  |  |

表 3-45DA MASK 寄存器域描述

# 3.4.15 DA\_MATCH\_MODE

DA\_MATCH\_MODE 为数据流地址匹配模式寄存器,可读写。该寄存器用于数据流调试,定义地址比较的类型(DA\_MASK 具有更高的优先级)。复位时设置为"0x1F,FFFF,FFFF,FFFF"。

| 77 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - |         |         |                          |  |  |  |  |
|------------------------------------------|---------|---------|--------------------------|--|--|--|--|
| 名称                                       | 范围      | 类型      | 描述                       |  |  |  |  |
| _                                        | [63:53] | _       | 保留。                      |  |  |  |  |
|                                          |         |         | 与DA_MATCH[ADDR]中的每一位对应,  |  |  |  |  |
| DAMATCH_MODE[52:0]                       | [52:0]  | RW,全"1" | 为"1"表示该位进行相等比较,否则进行不等比较。 |  |  |  |  |

表 3-46DA\_MATCH\_MODE 寄存器域描述

注: DA\_MASK具有更高的优先级



### 3.4.16 DVA

DVA 为数据流虚地址寄存器,只读,用于记录数据流地址不对界、DTB 脱靶以及各种数据流故障时的相关数据流地址,DTB\_DOUBLE 异常自陷时,该寄存器内容不更新。

表 3-47DVA 寄存器域描述

| 名称        | 范围     | 类型 | 描述         |
|-----------|--------|----|------------|
| DVA[63:0] | [63:0] | RO | 异常时的数据流地址。 |

一般情况下,该寄存器保留的是数据流虚地址,但以下原因产生数据流故障,记录的是数据流物理地址,只有DVA[47:0]有意义:

- 1) 数据 Cache 的标记出现偶校验错;
- 2) 数据 Cache 的数据出现 ECC 错;
- 3) 数据流地址超出主存容量;
- 4) 访问存储控制器中不存在的 I/O 寄存器;
- 5) 主存返回的响应数据有 ECC 多错;
- 6) CSR: DC\_CTL[DAV\_MATCH\_EN]为1时,发生数据流数值地址同时匹配;
- 7) CSR: DC\_CTL[DAV\_ MATCH\_EN]为 0,CSR: DC\_CTL[DV\_MATCH\_EN]为 1 时,只发生数据流数值匹配 DV\_MATCH。

## **3.4.17 DVA FORM**

DVA\_FORM 为数据流虚地址格式寄存器,只读,读出的内容来自 CSR: DVA 和 DS\_CTL, 目的是便于软件处理 DTB 脱靶。

表 3-48DVA\_FORM 寄存器域描述

| 名称                | 范围      | 类型 | 描述                   |
|-------------------|---------|----|----------------------|
| SEXT (DS_CTL[52]) | [63:53] | RO | 数据流虚页表基地址[52]位的符号扩展。 |
| DS_CTL[52:49]     | [52:49] | RO | 数据流虚页表基地址。           |
| SEXT(DVA[52])     | [48:43] | RO | 异常数据流地址虚页号[52]的符号扩展。 |
| DVA[52:13]        | [42:3]  | RO | 异常数据流地址虚页号。          |
| _                 | [2:0]   | _  | 保留。                  |

# **3.4.18 DV\_MATCH**

DV\_MATCH 为数据流数值匹配寄存器,可读写,复位时清"0"。该寄存器用于数据流调试,



当数据流 Store 类指令存储的数据与该寄存器内容匹配时产生数据流故障。数值匹配调试,支持包括锁写指令在内的 Store 类指令的匹配,但不含原子操作指令,不含预取指令。

表 3-49DV\_MATCH 寄存器域描述

| 名称         | 范围     | 类型   | 描述                  |
|------------|--------|------|---------------------|
| DATA[63:0] | [63:0] | RW,0 | 与数据流写数值进行相等比较的数据模板。 |

# **3.4.19 DV\_MASK**

DV\_MASK 为数据流数值匹配屏蔽寄存器,可读写。该寄存器用于数据流调试,屏蔽进行数据流数值比较的位数。复位时设置为全"1"。

表 3-50DV MASK 寄存器域描述

| 名称         | 范围     | 类型      | 描述                                       |
|------------|--------|---------|------------------------------------------|
| MASK[63:0] | [63:0] | RW,全"1" | 数据流数值相等匹配屏蔽位,与DV_MATCH[DATA]中的每一位对应,为"1" |
|            | ,      |         | 表示该位参与比较,详见10.2.2。                       |

# 3.5 二级 Cache 管理部件中的 CSR

# 3.5.1 SC\_CTL

SC\_CTL为二级Cache控制寄存器,可读写,用于二级Cache控制和错误处理,复位时为"0xFF"。

表 3-51SC\_CTL 寄存器域描述

| 名称           | 范围   | 类型   | 描述                      |
|--------------|------|------|-------------------------|
|              | 其它   |      | 保留。                     |
| _            | 位    | _    |                         |
|              |      |      | 硬件支持ICache一致性控制位。配置为"1" |
|              | [20] | RW,1 | 表示核心支持Icache一致性,此时要求核   |
|              |      |      | 外同时记录SCache和Icache中的副本情 |
| IC_COH_EN    |      |      | 况;配置为"0"表示核心不支持Icache一  |
|              |      |      | 致性,此时核外不需要记录Icache中的副   |
|              |      |      | 本情况                     |
| ICTAG_PAR_EN | [19] | RW,0 | 核心接收指令副本标记阵列发生偶校验错      |



|                  | ı     | 1       | 甲威 421 处埋器软件接口手册              |
|------------------|-------|---------|-------------------------------|
|                  |       |         | 的报错使能; "1"表示报错使能。             |
|                  |       |         | SBOX 监 测 到 控 制 错 后 登 记        |
|                  | 54.03 | DVV 0   | SC_STAT[CTL_ERR_*] 并报 MCHK 的使 |
| CTL_ERR_EN       | [18]  | RW,0    | 能位,具体控制错信息可以查看CSR:            |
|                  |       |         | SC_STAT[CTL_ERR_*]。           |
|                  |       |         | 核心接收到外部来的二次请求信息发生校            |
| SYSREQ_ERR_EN    | [17]  | RW,0    | 验错(包括单错和多错)的报错使能;"1"          |
|                  |       |         | 表示报错使能。                       |
|                  |       |         | 核心接收到外部来的读请求响应数据发生            |
| SYSDAT_ERR_EN    | [16]  | RW,0    | 不可纠多错的报错使能;"1"表示报错使           |
|                  |       |         | 能。                            |
|                  |       |         | 核心接收到外部来的读请求或写请求响应            |
| SYSACK_ERR_EN    | [15]  | RW,0    | 包头发生校验错(包括单错和多错)的报            |
|                  |       |         | 错使能;"1"表示报错使能。                |
| A CIV. CIVIV. Th | 51.43 | DIVO    | 收到读请求的控制错响应时的报错使能;            |
| ACK_CHK_EN       | [14]  | RW,0    | "1"表示报错使能。                    |
| WE EDD EN        | [13]  | RW,0    | 收到写请求的控制错响应或非法地址响应            |
| WR_ERR_EN        |       |         | 时的报错使能;"1"表示报错使能。             |
|                  | [12]  | RW,0    | 指令流数据装填控制,为"0"时,指令不           |
| IS_FILL_CTL      |       |         | 引起数据Cache淘汰时装填二级Cache,为       |
|                  |       |         | "1"时,指令总是不装填二级Cache。          |
|                  |       |         | 存储器栏栅控制,为"0"时,将MAF和           |
|                  |       |         | IOWB中所有悬挂请求发送到存储控制器           |
| MB_CTL           | [11]  | RW,0    | 或系统接口,为"1"时,将MAF、IOWB         |
|                  |       |         | 和VAF中所有悬挂请求发送到存储控制器           |
|                  |       |         | 或系统接口,但不包括VAF中的查询响应。          |
| CACHE_ST_ERR_EN  | [10]  | RW,0    | 二级Cache状态错检查使能。               |
|                  |       |         | 二级Cache数据和数据Cache淘汰数据的        |
| SCDAT_ERR_EN     | [9]   | RW,0    | ECC校验错使能。                     |
| SCTAG_ERR_EN     | [8]   | RW,0    | 二级Cache标记的ECC校验错使能。           |
|                  |       |         | 二级Cache组使能,对应二级Cache的8个       |
| SET_EN[7:0]      | [7:0] | RW,0xFF | 组,只允许全部被使能或只有一个组被使            |
|                  |       |         | 能,其它组合会产生不可预测的结果。             |
|                  |       |         |                               |



# 3.5.2 SC\_STAT

SC\_STAT为二级Cache的状态寄存器,可读写,写"1"清除。该寄存器用于记录二级Cache标记ECC错或数据ECC错,对于ECC单错,如果已纠正错中断使能,则可产生已纠正错中断请求;对于ECC多错等不可纠正错,如果机器检查错中断使能,则可产生机器检查错中断请求。

表 3-52SC\_STAT 寄存器域描述

|                 | 表 3-52SC_S | DIAI 奇仔語  | 命以油处                       |
|-----------------|------------|-----------|----------------------------|
| 名称              | 范围         | 类型        | 描述                         |
|                 | 其它位        | _         | 保留                         |
| ICTL C. D. D.   | 1201       | D. W.I.G. | 指示指令副本标记阵列发生了偶校验           |
| ICTAG_PAR       | [30]       | R,W1C     | 错。受SC_CTL[ICTAG_PAR_EN]控制。 |
|                 |            |           | 指示挤占SCache产生的被动淘汰请求        |
| WR_ECCERR_VIC   | [29]       | R,W1C     | 收到的响应带ECC多错标志,该错不可         |
|                 |            |           | 纠正。受SC_CTL[WR_ERR_EN]控制。   |
|                 |            |           | 指示挤占SCache时产生的被动淘汰请        |
| WR_CTLERR_VIC   | [28]       | R,W1C     | 求收到的响应带控制错标志。受             |
|                 |            |           | SC_CTL[WR_ERR_EN]控制。       |
|                 |            |           | 指示不可Cache写请求收到的响应带         |
| WR_ECCERR_NC    | [27]       | R,W1C     | ECC多错标志,该错不可纠正。受           |
|                 |            |           | SC_CTL[WR_ERR_EN]控制。       |
|                 |            |           | 指示不可Cache写请求收到的响应带控        |
| WR_CTLERR_NC    | [26]       | R,W1C     | 制错标志。受SC_CTL[WR_ERR_EN]    |
|                 |            |           | 控制。                        |
|                 |            |           | 指示I/O写请求收到的响应带ECC多错        |
| WR_ECCERR_IO    | [25]       | R,W1C     | 标志,该错不可纠正。受                |
|                 |            |           | SC_CTL[WR_ERR_EN]控制。       |
| WID CON FIDE TO | 50.43      | D WMG     | 指示I/O写请求收到的响应带控制错标         |
| WR_CTLERR_IO    | [24]       | R,W1C     | 志。受SC_CTL[WR_ERR_EN]控制。    |
|                 | [23]       | D W       | 指示IOWB内部状态错。受              |
| CTL_ERR_IOWB    |            | R,W1C     | SC_CTL[CTL_ERR_EN]控制。      |
|                 | [22]       |           | 指示SVAF2内部状态错。受             |
| CTL_ERR_SVAF2   |            | R,W1C     | SC_CTL[CTL_ERR_EN]。        |
|                 | [21]       |           | 指示SVAF1内部状态错。使能位为          |
| CTL_ERR_SVAF1   |            | R,W1C     | SC_CTL[CTL_ERR_EN]控制。      |



|                    |       |           | 甲威 421 处埋器软件接口手册            |
|--------------------|-------|-----------|-----------------------------|
| CTL_ERR_SMAF       | [20]  | R,W1C     | 指示SMAF内部状态错。受               |
| CIL_ERK_SMAI       |       | K, W IC   | SC_CTL[CTL_ERR_EN]控制。       |
| CTL ERR FTCH TYPE  | [19]  | R,W1C     | 指示取数二次请求类型错误。受              |
| CIL_ERR_FICH_TITE  |       | K, W IC   | SC_CTL[CTL_ERR_EN]控制。       |
| CTL_ERR_DVIC_STAT  | [18]  | R,W1C     | 指示Dcache淘汰与SCache状态不匹配。     |
| CTL_ERR_D VIC_STAT |       | IX, WIC   | 受SC_CTL[CTL_ERR_EN]控制。      |
| CTL_ERR_DS_SCSTAT  | [17]  | R,W1C     | 指示数据流请求与SCache状态不匹配。        |
| CTE_ERRC_DS_SCSTAT |       | 10, 11 10 | 受SC_CTL[CTL_ERR_EN]控制。      |
| CTL_ERR_ACK_SCSTAT | [16]  | R,W1C     | 指示响应与SCache状态不匹配。受          |
| CIL_ERR_ACR_SCSTAT | [10]  | K, W IC   | SC_CTL[CTL_ERR_EN]控制。       |
| CTL ERR RQ2 SCSTAT | [15]  | R,W1C     | 指示二次请求与SCache状态不匹配。受        |
| CIL_ERK_RQ2_SCS1AI | [13]  | K, W IC   | SC_CTL[CTL_ERR_EN]控制。       |
|                    |       |           | 指示主核收到的响应与发出的一次请            |
| CITI FDD DO1 ACK   | F1 43 | D WIIG    | 求类型不匹配,包括IO读、Evict类请求、      |
| CTL_ERR_RQ1_ACK    | [14]  | R,W1C     | 原子操作、置脏请求遇到非法地址响            |
|                    |       |           | 应。受SC_CTL[CTL_ERR_EN]控制。    |
|                    | [13]  |           | 核心接收到外部来的二次请求信息发            |
| SYSREQ_ERR         |       | R,W1C     | 生校验错(包括单错和多错)。受             |
|                    |       |           | SC_CTL[SYSREQ_ERR_EN]控制。    |
|                    | [12]  | R,W1C     | 核心接收到外部来的读响应数据时,产           |
| SYSDAT_MERR        |       |           | 生 ECC 不可纠正多错。受              |
|                    |       |           | SC_CTL[SYSDAT_ERR_EN]控制。    |
|                    |       |           | 核心接收到外部来的读响应数据时,产           |
| SYSDAT_SERR        | [11]  | R,W1C     | 生 ECC 可纠正单错。受               |
|                    |       |           | SC_CTL[SYSDAT_ERR_EN]控制。    |
|                    |       |           | 核心接收到外部来的读请求或写请求            |
| SYSACK_ERR         | [10]  | D W1C     | 响应包头信息发生校验错(包括单错和           |
|                    | [10]  | R,W1C     | 多错)。受 SC_CTL[SYSACK_ERR_EN] |
|                    |       |           | 控制。                         |
|                    |       |           | 指示挤占 SCache 时产生的被动淘汰请       |
| WR_ADDR_ERR_VIC    | [9]   | R,W1C     | 求,收到的非法地址响应,该错不可纠           |
|                    |       |           | 正。受 SC_CTL[WR_ERR_EN]控制。    |
| WD 1555 555 116    | FO3   | D W4C     | 指示共享不可 Cache 写请求收到的非        |
| WR_ADDR_ERR_NC     | [8]   | R,W1C     | 法地址响应,该错不可纠正。受              |



|                |      |        | SC_CTL[WR_ERR_EN]控制。       |
|----------------|------|--------|----------------------------|
|                |      |        |                            |
|                |      |        | 指示 I/O 写请求收到的非法地址响应,       |
| WR_ADDR_ERR_IO | [7]  | R,W1C  | 该 错 不 可 纠 正 。 受            |
|                |      |        | SC_CTL[WR_ERR_EN]控制。       |
|                |      |        | 指示 Cache 状态与相关请求之间存在       |
| CACHE_ST_ERR   | [6]  | R,W1C  | 不一致性, 该错不可纠正。受             |
|                |      |        | SC_CTL[CACHE_ST_ERR_EN]控制。 |
|                |      |        | 指示数据Cache中脏数据被替换或淘汰        |
| DVIC_MERR      | [5]  | R,W1C  | 时,产生ECC不可纠正多错。受            |
| D VIO_IVIDICE  | [5]  | 14, 11 | SC_CTL[SCDAT_ERR_EN]控制。    |
|                |      |        |                            |
|                | 5.13 |        | 指示数据Cache中脏数据被替换或淘汰        |
| DVIC_SERR      | [4]  | R,W1C  | 时,产生ECC可纠正单错。受             |
|                |      |        | SC_CTL[SCDAT_ERR_EN]控制。    |
|                |      |        | 指示在读二级Cache的数据存储器时,        |
| DAT_MERR       | [3]  | R,W1C  | 产生ECC不可纠正多错。受              |
|                |      |        | SC_CTL[SCDAT_ERR_EN]控制。    |
|                |      |        | 指示在读二级Cache的数据存储器时,        |
| DAT_SERR       | [2]  | R,W1C  | 产生ECC可纠正单错。受               |
|                |      |        | SC_CTL[SCDAT_ERR_EN]控制。    |
|                |      |        | 指示在查询二级Cache的标记存储器         |
| TAC MEDD       | [1]  | R,W1C  | 时,产生ECC不可纠正多错。受            |
| TAG_MERR       | [1]  | K,WIC  |                            |
|                |      |        | SC_CTL[SCTAG_ERR_EN]控制。    |
|                |      |        | 指示在查询二级Cache的标记存储器         |
| TAG_SERR       | [0]  | R,W1C  | 时,产生ECC可纠正单错。受             |
|                |      |        | SC_CTL[SCTAG_ERR_EN]控制。    |

# **3.5.3 INT\_REQ**

INT\_REQ为核间中断请求寄存器,软件写该寄存器,硬件将发出核间中断0、核间中断1、睡眠中断或者睡眠唤醒中断。为了避免不同类型的中断或不同源和目标之间的核间中断丢失,软件写该寄存器时,需要先读该寄存器,当该寄存器的有效位为"0"时,才执行写操作。复位时,全部清"0"。

表 3-53 INT REO 寄存器域描述

|      |            | • • • | _ C                                   |
|------|------------|-------|---------------------------------------|
|      |            |       |                                       |
| 名称   | <b>游</b> 国 | 光刑    | 描述                                    |
| 1 石柳 | 池田         | 安望    | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 |



| _            | 其它位     | _    | 保留                              |
|--------------|---------|------|---------------------------------|
|              |         |      | 中断请求有效位,当该位为"1"时,表示该中断请求有       |
| Valid        | [25]    | RW,0 | 效,且尚未发送出去。软件必须读到该位为"0"时,才       |
|              |         |      | 能写INT_REQ发中断,且要求写数据中Valid位为"1"。 |
|              |         |      | 中断发送类型:为"002"核间中断类型0,为"012"指    |
| IntType[1:0] | [24:23] | RW,0 | 示核间中断类型1,为"102"指示睡眠中断,为"112"    |
|              |         |      | 指示睡眠唤醒中断。                       |
| Target[15:0] | [15:0]  | RW,0 | 发送中断的目标核心,支持多播中断(多位为"1")。       |

# 3.5.4 CP\_CTL

一致性处理控制寄存器(CSR:CP\_CTL)控制一致性请求和响应的处理过程。该寄存器为只读属性,只能在芯片初始化复位的配置状态,通过串行扫入修改其内容,除上电复位和冷复位外,其它复位均对该寄存器不起作用。

表 3-54CP\_CTL 寄存器域描述

| 名称  | 范围  | 类型    | 描述                                                                                                                            |
|-----|-----|-------|-------------------------------------------------------------------------------------------------------------------------------|
| _   | 其它  | _     | 保留                                                                                                                            |
| ICD | [6] | RO,0  | 清洁置脏内部确认控制位。可Cache写请求命中Cache状态为清洁独占时,配置为"1"表示核心内部产生置脏成功响应;否则表示核心将根据CTD位的配置,选择向外部系统发送CleanToDirty或ShareToDirty请求。              |
| МВ  | [5] | RO, 0 | 存储器栏栅请求控制位。配置为"1"表示核心会发出存储器栏栅请求,由外部系统确认存储器栏栅是否完成;否则表示核心不会发出存储器栏栅请求,内部确认存储器栏栅是否完成,此时要求外部系统在响应中携带请求完成标志。                        |
| EGB | [4] | RO, 1 | 全局Cache淘汰控制位。配置为"1"表示核心会发出全局Cache 淘汰请求,要求外部系统支持全局的Cache内容淘汰(通过二次请求实现);否则表示核心不会发出此请求,使用EVICTDG 指令将产生非法指令异常。                    |
| ELB | [3] | RO, 1 | 本地Cache淘汰控制位。配置为"1"表示核心会发出本地Cache<br>淘汰请求,要求外部系统支持本核心Cache内容的淘汰(通过<br>二次请求实现); 否则表示核心不会发出此请求,使用<br>EVICTDL和FLUSHD指令将产生非法指令异常。 |
| CTD | [2] | RO, 1 | 清洁置脏控制位。可Cache写请求命中Cache状态为清洁独占时,配置为"1"表示核心将发出CleanToDirty请求,否则表                                                              |



|          |     |       | 示核心将发出ShareToDirty请求。                           |  |  |
|----------|-----|-------|-------------------------------------------------|--|--|
|          |     |       | 清洁淘汰控制位。Cache装填引起有效Cache清洁内容淘汰时,                |  |  |
| CVB      | [1] | RO, 0 | 配置为"1"表示核心需要通知外部系统;否则表示核心不需                     |  |  |
|          |     |       | 要通知外部系统。                                        |  |  |
|          |     |       | 淘汰请求顺序控制位。Cache装填引起有效Cache内容淘汰时,                |  |  |
|          |     |       | 配置为"1"表示核心先发出WrVictimBlk或CleanVictimBlk请        |  |  |
|          |     |       | 求,后发出ReadBlkI、ReadBlk、或ReadBlkModify请求;否        |  |  |
| VB_ORDER | [0] | RO, 0 | 则表示核心先发出ReadBlkICVic、ReadBlkIDVic、              |  |  |
|          |     |       | ReadBlkCVic 、 ReadBlkDVic 、 ReadBlkModifyCVic 或 |  |  |
|          |     |       | ReadBlkModifyDVic 请求,随后发出WrVictimBlk或           |  |  |
|          |     |       | CleanVictimBlk。                                 |  |  |

## 3.5.5 MERGE\_OVTIME

MERGE\_OVTIME为I/O空间写指令和存储器不可Cache空间写指令的合并窗口超时配置,可读写,复位为"0x100"。

 名称
 范围
 类型
 描述

 其它位
 保留。

 写合并窗口超时配置寄存器,为IO写和存储器不可Cache空间写共用的配置。当合并等待计数器等于本字段时,硬件自动关闭合并窗口,形成IO写情求或者不可Cache写请求,同时对超时计数器清0。
 特殊的,当本寄存器等于0时,表示所有IO写和不可Cache写请求不可合并。

表 3-55MERGE\_OVTIME 寄存器域描述

# 3.6 整数部件中的 CSR

### 3.6.1 IVA

IVA 为指令虚地址寄存器,只读,当跳转指令的目标指令地址出现符号扩展错时,该寄存器记



录出错的跳转目标指令虚地址; 当整数转移指令的目标地址匹配成功时, 该寄存器记录匹配成功的 转移目标虚地址。

表 3-56IVA 寄存器域描述

| 名称        | 范围     | 类型 | 描述    |
|-----------|--------|----|-------|
| IVA[63:0] | [63:0] | RO | 指令虚地址 |

### 3.6.2 TC

TC 为计时器,可读写,作为周期计数器。当计数使能时,每个时钟周期此计数器"+1"。复位时设置为全"0"。

表 3-57 TC 寄存器域描述

| 名称       | 范围     | 类型   | 描述       |
|----------|--------|------|----------|
| TC[63:0] | [63:0] | RW,0 | 计时器的计数值。 |

### 3.6.3 TC CTL

TC\_CTL 为计时器控制寄存器,可读写,用于控制 TC 计数器的计数使能。复位时设置为"0"。

表 3-58 TC\_CTL 寄存器域描述

| 名称    | 范围     | 类型   | 描述                    |
|-------|--------|------|-----------------------|
| _     | [63:1] | _    | 保留。                   |
| TC_EN | [0]    | RW,0 | 计时器计数使能,为"1"时计时器开始计数。 |

### 3.6.4 ICR

ICR 为整数控制寄存器,可读写,控制是否产生整数溢出自陷。复位时清"0"。

表 3-59 ICR 寄存器域描述

| 名称  | 范围     | 类型   | 描述                       |  |  |  |
|-----|--------|------|--------------------------|--|--|--|
| _   | [63:1] |      | 保留。                      |  |  |  |
| FD  | [0]    | DW 0 | 整数溢出屏蔽位。为"1"时,整数运算指令和原子操 |  |  |  |
| I'D | [0]    | RW,0 | 作指令不产生任何算术自陷。            |  |  |  |



### 3.6.5 CID

CID 为核心识别码寄存器。

表 3-60 CID 寄存器域描述

| 名称        | 范围     | 类型 | 描述                             |
|-----------|--------|----|--------------------------------|
| CID[63:8] | [63:8] | RW | 可以写入全"0",也可以写入系统中多核 CPU 的芯片编号。 |
| CID[3:0]  | [3:0]  | RO | 本核心在芯片内部的编号。                   |
| _         | 其它位    |    | 保留。                            |

# **3.6.6 IDA\_MATCH**

IDA\_MATCH 为指令流目标地址匹配寄存器,可读写,复位时清"0"。该寄存器用于指令流调试, 当整数转移指令的目标地址与该寄存器内容匹配时,产生指令流故障。

表 3-61IDA\_MATCH 寄存器域描述

| 名称                | 范围             | 类型          | 描述                             |  |  |  |  |
|-------------------|----------------|-------------|--------------------------------|--|--|--|--|
| EN                | [53]           | RW,0        | 匹配使能信号,为"1"表示匹配使能。             |  |  |  |  |
| ADDD[52.0]        | 5 <b>53</b> 01 | <b>DW</b> 0 | 需要匹配的整数转移目标指令虚地址,其中[1:0]位指定需要匹 |  |  |  |  |
| ADDR[52:0] [52:0] |                | RW,0        | 配的处理器模式。                       |  |  |  |  |
| _                 | 其它位            | _           | 保留。                            |  |  |  |  |

# **3.6.7 IDA\_MASK**

IDA\_MASK 为指令流目标地址屏蔽寄存器,可读写,复位时为"0x1F,FFFF,FFFF,FFFF"。该寄存器用于指令流调试,屏蔽进行整数转移目标地址比较的位数。

表 3-62IDA\_MASK 寄存器域描述

| 名称         | 范围      | 类型      | 描述                             |  |  |  |  |  |
|------------|---------|---------|--------------------------------|--|--|--|--|--|
| _          | [63:53] | _       | 保留。                            |  |  |  |  |  |
|            |         |         | 整数转移目标地址匹配屏蔽位,对应               |  |  |  |  |  |
| MASK[52:0] | [52:0]  | RW,全"1" | IDA_MATCH[ADDR]每位,为"1"表示该位参与相等 |  |  |  |  |  |
|            |         |         | 比较。                            |  |  |  |  |  |



### 3.6.8 TID

TID 为线程号寄存器。只在上电复位时清"0",其它复位时其内容不变。

表 3-63IDA\_MASK 寄存器域描述

| 名称        | 称      |          | 描述      |  |  |
|-----------|--------|----------|---------|--|--|
| TID[63:0] | [63:0] | RW,全 "0" | 线程号寄存器。 |  |  |

### 3.6.9 SOFTCSR0~47

SOFTCSR0~47 为软件读写寄存器。只在上电复位时清"0",其它复位时其内容不变。

表 3-64SOFTCSR 寄存器域描述

| 名称         | 范围     | 类型       | 描述                   |  |  |  |
|------------|--------|----------|----------------------|--|--|--|
| DATA[63:0] | [63:0] | RW,全 "0" | 软件读写寄存器,软件可作为自定义缓冲用。 |  |  |  |

# 3.7 浮点运算部件中的 FPCR

# 3.7.1 FPCR 描述

浮点运算部件内部设置了一个专门控制浮点指令执行和记录浮点指令执行状态的浮点控制寄存器 FPCR,该寄存器属于特殊的 CSR,只能通过非特权指令 RFPCR、WFPCR、SETFPEC0、SETFPEC1、SETFPEC2、SETFPEC3 进行读写访问,下表为 SW421 核心实现的 FPCR 的内容。

表 3-65FPCR 寄存器域描述

| 寄存器位 | 标识   | 含义                                                                     |
|------|------|------------------------------------------------------------------------|
| 63   | SUM  | 总算术异常标志: [57:52]、[41:36]、[25:20]、[9:4]等位中存在"1",则该位为"1"。                |
| 62   | INED | 非精确结果自陷屏蔽:屏蔽非精确结果自陷并将IEEE标准指定的结果写入目标寄存器。                               |
| 61   | UNFD | 下溢自陷屏蔽:屏蔽下溢自陷,该位设置为"1"且UNDZ位设置为"1"才能实现下溢自陷屏蔽。                          |
| 60   | UNDZ | 下溢为"0":该位与UNFD位共同控制下溢自陷屏蔽。不论该位设置为"0"还是"1",下溢时写入目标寄存器中的结果总是真零(64位全"0")。 |



|         |     | 动态舍入模式,指示指令的具体舍入模式,具体定义如下: 00 <sub>2</sub> :向"0"舍入 |
|---------|-----|----------------------------------------------------|
| [59:58] | DYN | 012: 向负无穷大舍入                                       |
|         |     | 102: 就近舍入                                          |
|         |     | 112: 向正无穷大舍入                                       |

[57:52]位为非SIMD浮点运算指令或者浮点SIMD运算指令中浮点向量第0个元素运算产生的六种浮点算术异常。

| 八件行品昇   | 小开市。                                        |                                                         |  |  |  |  |
|---------|---------------------------------------------|---------------------------------------------------------|--|--|--|--|
| 57      | OVI0                                        | 整数溢出: 浮点转换为整数的操作产生整数溢出。                                 |  |  |  |  |
| 56      | INE0                                        | 非精确结果: 浮点算术运算或转换操作的结果与精确结果不同。                           |  |  |  |  |
| 55      | UNF0                                        | 下溢: 浮点算术运算或转换操作结果的指数产生下溢。                               |  |  |  |  |
| 54      | OVF0                                        | 上溢: 浮点算术运算或转换操作结果的指数产生上溢。                               |  |  |  |  |
| 53      | DZE0                                        | 除数为"0": 浮点除法运算的除数为"0"。                                  |  |  |  |  |
| 52      | INV0                                        | 无效操作: 浮点算术、转换或比较运算中, 一个或多个操作数是非有限数, 或者对具体操作而言, 操作数是非法的。 |  |  |  |  |
| 51      | OVFD                                        | 上溢自陷屏蔽:禁止上溢自陷,并根据中间结果和舍入模式确定的结果写入目标寄存器。                 |  |  |  |  |
| 50      | DZED                                        | 除数为"0"自陷屏蔽:禁止除数为"0"自陷,并根据中间结果和舍入模式确定的结果写入目标寄存器。         |  |  |  |  |
| 49      | INVD                                        | 无效操作自陷屏蔽:禁止无效操作自陷,并根据中间结果和舍入模式确定的结果写入目标寄存器。             |  |  |  |  |
| 48      | DNZ                                         | 非规格化数为"0":将所有非规格化操作数当作符号相同的"0"值。                        |  |  |  |  |
| [47:42] | RAZ/IGN                                     | 保留位,读出为"0",写时忽略。                                        |  |  |  |  |
| [41:36] | 位为浮点SIMD运算                                  | ·<br>算指令中浮点向量第1个元素运算产生的六种浮点算术异常。                        |  |  |  |  |
| 41      | "0"                                         | 固定为"0"。                                                 |  |  |  |  |
| 40      | INE1                                        | 非精确结果: 浮点算术运算或转换操作的结果与精确结果不同。                           |  |  |  |  |
| 39      | UNF1                                        | 下溢: 浮点算术运算或转换操作结果的指数产生下溢。                               |  |  |  |  |
| 38      | OVF1                                        | 上溢: 浮点算术运算或转换操作结果的指数产生上溢。                               |  |  |  |  |
| 37      | DZE1                                        | 除数为"0": 浮点除法运算的除数为"0"。                                  |  |  |  |  |
| 36      | INV1                                        | 无效操作: 浮点算术、转换或比较运算中, 一个或多个操作数是非有限数, 或者对具体操作而言, 操作数是非法的。 |  |  |  |  |
| [35:26] | RAZ/IGN                                     | 保留位,读出为"0",写时忽略。                                        |  |  |  |  |
| [25:20] | [25:20]位为浮点SIMD运算指令中浮点向量第2个元素运算产生的六种浮点算术异常。 |                                                         |  |  |  |  |
|         |                                             |                                                         |  |  |  |  |



| 25      | "0"         |                                             |  |  |  |  |
|---------|-------------|---------------------------------------------|--|--|--|--|
| 24      | INE2        | 非精确结果: 浮点算术运算或转换操作的结果与精确结果不同。               |  |  |  |  |
| 23      | UNF2        | 下溢: 浮点算术运算或转换操作结果的指数产生下溢。                   |  |  |  |  |
| 22      | OVF2        | 上溢: 浮点算术运算或转换操作结果的指数产生上溢。                   |  |  |  |  |
| 21      | DZE2        | 除数为"0": 浮点除法运算的除数为"0"。                      |  |  |  |  |
| 20      | INV2        | 无效操作: 浮点算术、转换或比较运算中, 一个或多个操作数是非             |  |  |  |  |
|         |             | 有限数,或者对具体操作而言,操作数是非法的。                      |  |  |  |  |
| [19:10] | RAZ/IGN     | 保留位,读出为"0",写时忽略。                            |  |  |  |  |
| [9:4]位  | 为浮点SIMD运算指  | 台令中浮点向量第3个元素进行运算产生的六种浮点算术异常。                |  |  |  |  |
| 9       | "0"         | 固定为"0"。                                     |  |  |  |  |
| 8       | INE3        | 非精确结果: 浮点算术运算或转换操作的结果与精确结果不同。               |  |  |  |  |
| 7       | UNF3        | 下溢: 浮点算术运算或转换操作结果的指数产生下溢。                   |  |  |  |  |
| 6       | OVF3        | 上溢: 浮点算术运算或转换操作结果的指数产生上溢。                   |  |  |  |  |
| 5       | DZE3        | 除数为"0": 浮点除法运算的除数为"0"。                      |  |  |  |  |
|         | INV3        | 无效操作: 浮点算术、转换或比较运算中, 一个或多个操作数是非             |  |  |  |  |
| 4       |             | 有限数,或者对具体操作而言,操作数是非法的。                      |  |  |  |  |
| [3]     | RAZ/IGN     | 保留位,读出为"0",写时忽略。                            |  |  |  |  |
| [2]     | EXC_CTL_WEN | 保留位,读出为"0",写时忽略。                            |  |  |  |  |
|         |             | 控制浮点算术自陷(含浮点部件的整数溢出异常自陷)屏蔽模                 |  |  |  |  |
|         |             | 式,选择使用FPCR其它控制位的方式:                         |  |  |  |  |
|         |             | "00 <sub>2</sub> ":允许所有浮点算术异常自陷且受FPCR中控制位的控 |  |  |  |  |
|         |             | 制;                                          |  |  |  |  |
|         |             | "012": 允许除非精确结果之外的所有浮点算术异常自陷且               |  |  |  |  |
| [1:0]   | EXC_CTL     | 受FPCR中控制位的控制;                               |  |  |  |  |
|         |             | "102": 允许除非精确结果之外的所有浮点算术异常自陷且               |  |  |  |  |
|         |             | 不受FPCR中控制位的控制;                              |  |  |  |  |
|         |             | "112": 允许除浮点下溢、非精确结果和整数溢出之外的所               |  |  |  |  |
|         |             | 有浮点算术异常自陷且不受FPCR中控制位的控制。                    |  |  |  |  |

#### 说明:

- 1) 在 SW421 核心中,不支持非规格化数自陷屏蔽(DNOD: Denormal Operand Exception Disable),当设置 FPCR[48]为"1"时可屏蔽非规格化数自陷,此时非规格化操作数当作有符号的零处理;
- 2) 在 SW421 核心中,因浮点 SIMD 运算指令不包含转换指令,因此浮点 SIMD 运算不会产生整数溢出异常;



- 3) FPCR 中浮点算术异常标志的设置与自陷是否屏蔽无关,即使某些异常自陷被屏蔽,一旦产生浮点算术异常,仍要在 FPCR 中记录相应的异常标志,这些标志位记录为"1"后,只有在软件将"0"写入这些位,才能清除对应的异常标志位;
- 4)读 RFPCR 由 FPCR 指令完成,写 FPCR[63:2]由 WFPCR 指令完成,写 FPCR[1:0]则由 SETFPEC0、SETFPEC1、SETFPEC2、SETFPEC3 指令完成,分别将 FPCR[1:0]更新为 002、 012、102和 112。由于 FPCR 对浮点指令的影响,写 FPCR 时,必须保证其不影响写 FPCR 指令之前的浮点指令,并对写 FPCR 指令之后的浮点指令要确保产生作用。读 FPCR 时,为 了回收所有异常情况,也必须等读 FPCR 指令之前的浮点指令都完成,包括可能的异常处理,在读 FPCR 指令完成之前,保证不执行新的浮点指令:
- 5) 处理器初始化后,在使用浮点指令之前,必须对 FPCR 进行初始化。进程切换时,必须对 FPCR 进行保留与恢复;
- 6)RFPCR、WFPCR 、SETFPEC0、SETFPEC1、SETFPEC2 和 SETFPEC3 指令实现了 FPCR 与浮点寄存器之间的数据传送,因 FLDS 和 FSTS 指令会对浮点寄存器的[61:59]位进行处理, 因此不能用这两条指令来处理 FPCR 的值。

## 3.7.2 FPCR 访问机制

FPCR 只能通过 RFPCR、WFPCR 、SETFPEC0、SETFPEC1、SETFPEC2 和 SETFPEC3 指令进行显式读写操作,执行浮点指令时,硬件执行隐式读操作,根据 FPCR 中的控制位判断浮点异常处理方式和浮点运算结果,如果发生浮点算术异常,硬件自动对 FPCR 进行隐式写操作。对 FPCR 访问顺序有以下几种情况:

- 1) 对于 FPCR[62:58]、FPCR[51:48]、FPCR[2:0], 只存在显式读、显式写、隐式读操作, 因此 不存在同时隐式读和隐式写操作;
- 2) 对于其它位,除保留位外,只存在显式读、显式写、隐式写操作,因此也不存在同时隐式读和隐式写操作。

另外,指令部件设置一位专用的 FPCR 记分板来保证读写之间的顺序,具体如下:

- 1) WFPCR、SETFPEC0、SETFPEC1、SETFPEC2 和 SETFPEC3 指令准备发射时,必须要求 FPCR 记分板被清除;该指令发射以后,立即置 FPCR 记分板;该指令退出时,清除 FPCR 记分板;
- 2) RFPCR 指令准备发射时,必须要求 FPCR 记分板被清除,且前面所有的指令都已正常退出;
- 3) 浮点运算指令准备发射时,必须要求 FPCR 记分板被清除。

同时,浮点运算部件也提供特殊的写机制来协助保证读写之间的顺序。

1) WFPCR、SETFPEC0、SETFPEC1、SETFPEC2 和 SETFPEC3 指令退出时,根据写的值更新FPCR中的内容:



2) 浮点运算指令退出时,如果发生浮点算术异常,无论自陷是否屏蔽,将该指令的异常信息 登记到 FPCR 中。



# 4 存储管理和存储结构

# 4.1 存储空间

- 1) SW421 核心支持的虚拟地址空间为 53 位(VA[52:0]), 物理地址空间为 48 位(PA[47:0]);
- 2) 物理地址的最高位 PA[47]用于区分存储器空间(PA[47]位为"0")和 I/O 空间(PA[47]位为"1")。指令流总是访问存储器空间,即固定指令流访问的物理地址 PA[47]位为"0"。

## 4.1.1 存储器空间

- 1) 数据流和指令流都能对存储器空间进行访问,其中数据流访问的指令包括所有 Load 类型和 Store 类型的访存指令,另外还包括淘汰、刷新和数据装填等 Cache 控制指令;
- 2) SW421 核心支持两类访存指令,一类是普通访存指令,根据所访问的存储器空间属性来决定数据是否进入核心 Cache; 另一类是不可 Cache 访存指令,所访问的数据总是不进入核心 Cache:
- 3) 对于普通访存指令,物理地址 PA[46]位作为可 Cache 属性标志位,为"0"表示可 Cache,为"1"表示不可 Cache;对于不可 Cache 访存指令,物理地址 PA[46]无意义;
- 4) PA[45:0]位作为真正的存储器空间物理地址,用于访问核外存储器空间,核外可进行进一步的存储空间划分。

#### 由此推论:

- 1) PA[47]为"0", PA[45:0]相同, PA[46]不同时,认为是同一个物理地址;
- 2) 对一个 PA[45:0]确定的存储器空间物理地址, SW421 核心可以通过三种方式访问该地址: 普通访存指令进行可 Cache 访问(PA[46]拼接"0")、普通访存指令进行不可 Cache 访问(PA[46]拼接"1")、不可 Cache 访存指令进行不可 Cache 访问(PA[46]任意), 后两种访问方式的硬件处理流程相同。

# 4.1.1.1 可 Cache 特性

#### 1) 数据流访问特性

数据流进行共享可 Cache 读写访问时,此时读访问数据总是进入数据 Cache 和二级 Cache,写访问数据总是先进入数据 Cache 并在数据 Cache 中完成写操作,从数据 Cache 淘汰时才写入二级



Cache。SW421 核心保证数据 Cache 的内容为二级 Cache 的子集,二级 Cache 的标记中包含特殊的 状态,用来指示最新数据在数据 Cache 中还是在二级 Cache 中。SW421 核心基于二级 Cache 来保证数据流对可 Cache 空间访问的一致性问题。为提高性能,装填指令可以将可 Cache 空间上的数据提前预取到数据 Cache、二级 Cache、或核外三级 Cache 中。

#### 2) 指令流访问特性

指令流进行共享可 Cache 读访问时,读访问数据进入指令 Cache,可进入也可不进入二级 Cache,不保证指令 Cache 内容为二级 Cache 的子集。当核心选择支持指令 Cache 一致性的配置时,要求核外逻辑同时记录指令 Cache 内容为二级 Cache 中的副本状态;当核心选择不支持指令 Cache 一致性的配置时,要求软件来解决指令 Cache 一致性问题。为提高性能,C3 核心支持指令流预取,可以将可 Cache 空间上的指令提前预取到指令 Cache 中。

#### 3) 访问合并原则

处理对可 Cache 存储器空间访问时,新产生的请求与之前产生且未完成处理的请求进行地址比较,如果满足条件则可将请求合并。具体规则见下表。

|    |        | 已产生且未完成处理的请求 |     |        |        |        |     |  |
|----|--------|--------------|-----|--------|--------|--------|-----|--|
|    |        | LDx          | STx | FETCHD | FLUSHD | EVICTD | 指令流 |  |
|    | LDx    | 合并           | 合并  | 合并     | _      | _      | _   |  |
| 新产 | STx    | 合并           | 合并  | 合并     |        |        | _   |  |
| 生  | FETCHD | 合并           | 合并  | 合并     |        |        |     |  |
| 的  | FLUSHD | _            | _   | _      | _      |        |     |  |
| 请求 | EVICTD | _            | _   | _      | _      | _      | _   |  |
|    | 指令流    | _            | _   | _      | _      | _      | 合并  |  |

表 4-1 共享可 Cache 空间访问的合并规则

#### 说明:

- 1) 已有的请求相关的指令与新产生的请求相关的指令是按程序顺序定义的;
- 2) 表中指示"合并"的位置,表示两个请求可以合并;
- 3) 表中指示"一"的位置,表示不存在或不允许请求合并。

### 4.1.1.2 不可 Cache 特性

#### 1) 数据流访问特性

数据流对存储器空间进行共享不可 Cache 读写访问时,读访问数据不进入数据 Cache 和二级 Cache, SW421 核心保证数据流访问不可 Cache 空间时,总能获得最新数据副本。如果淘汰指令或 预取指令的访问地址是不可 Cache 存储器空间,则当空指令处理。

#### 2) 指令流访问特性



指令流对其它核组存储器空间只能进行共享不可 Cache 读访问,读访问数据进入指令 Cache,但不进入二级 Cache,SW421 核心保证指令流访问不可 Cache 空间时,总是获得最新数据副本。

#### 3) 访问合并原则

数据流访问不可 Cache 存储器空间时,也要与已产生且未完成的同类请求进行地址比较,判断是否可以合并。

对于读访问,如果新产生的请求地址与已产生的请求地址属于同一个 Cache 行、地址不重叠且该地址对应的合并窗口未关闭,则新请求可以合并到已有请求中。

对于写访问,下表给出了共享不可 Cache 空间 Store 指令的合并原则,其中行代表新放入合并缓冲的 Store 类指令,列代表已在合并缓冲中 Store 类指令的数据长度。

| 新指令              | 字节           | 半字指          | 字/单精         | 长字/双精         | 32 字节        | 64 字节         |
|------------------|--------------|--------------|--------------|---------------|--------------|---------------|
| 合并缓冲             | 指令           | <b>令</b>     | 度指令          | 度指令           | SIMD 指令      | SIMD 指令       |
| 字节               | 合并成 16<br>字节 | _            | _            | l             | _            | I             |
| 半字               | 1            | 合并成<br>32 字节 | _            | 1             | _            | 1             |
| 字<br>单精度浮点       | _            |              | 合并成 64<br>字节 | _             | _            | -             |
| 长字<br>双精度浮点      | 1            | _            | _            | 合并成<br>128 字节 | _            | 1             |
| 32 字节<br>SIMD 向量 | _            | _            | _            | _             | 合并成128字<br>节 | _             |
| 64 字节<br>SIMD 向量 | _            | _            | _            | _             | _            | 合并成 128<br>字节 |

表 4-2Store 指令访问共享不可 Cache 空间合并规则

对上表的规则总结如下:

- 1) 不同数据长度的 Store 指令不允许合并;
- 2) 按程序顺序,允许前后若干条访问数据长度为字节的 Store 指令在自然对界的 16 字节范围内进行合并;
- 3) 按程序顺序,允许前后若干条访问数据长度为半字的 Store 指令在自然对界的 32 字节范围内进行合并:
- 4) 按程序顺序,允许前后若干条访问数据长度为字整数或单精度浮点的 Store 指令在自然对界的 64 字节范围内进行合并;
- 5) 按程序顺序,允许前后若干条访问数据长度为长字整数或双精度浮点的 Store 指令在自然对界的 128 字节范围内进行合并;



- 6) 按程序顺序,允许前后若干条访问数据长度为单精度浮点向量的Store 指令在自然对界的128 字节范围内进行合并:
- 7) 按程序顺序,允许前后若干条访问数据长度为字整数向量或双精度浮点向量的 Store 指令在 自然对界的 128 字节范围内进行合并;
- 8) 按程序顺序,允许前后若干条不对界字向量或单精度浮点向量 Store 指令在自然对界的 64 字节范围内进行合并;
- 9) 按程序顺序,允许前后若干条不对界双精度浮点向量 Store 指令在自然对界的 128 字节范围内进行合并。

### 4.1.1.3 访问顺序

SW421 核心可以通过 MEMB 指令保证存储器访问的顺序性,在没有 MEMB 指令时,不同访存指令之间也要保持一种顺序关系,具体见下表。

|                 | TO I JIH |        | (IIX)C 11/3 | 111[10:0]H10:1 | 1,     |            |
|-----------------|----------|--------|-------------|----------------|--------|------------|
| 前一条指令           | Store    | Store  | NC_store    | Load           | Load   | NC_Load    |
| 后一条指令           | {0, A}   | {1, A} | $\{x, A\}$  | {0, A}         | {1, A} | $\{x, A\}$ |
| Store {0, A}    | 保序       | 不保序    | 不保序         | 保序             | 保序     | 保序         |
| Store {1, A}    | 保序       | 保序     | 保序          | 保序             | 保序     | 保序         |
| NC_store {x, A} | 保序       | 保序     | 保序          | 保序             | 保序     | 保序         |
| Load {0, A}     | 保序       | 不保序    | 不保序         | 保序             | 保序     | 保序         |
| Load {1, A}     | 保序       | 保序     | 保序          | 保序             | 保序     | 保序         |
| NC_Load {x, A}  | 保序       | 保序     | 保序          | 保序             | 保序     | 保序         |

表 4-3 存储器空间访问顺序(假定 A 为 PA[45:0]的取指)

#### 说明:

- 1) 上述表格主要描述普通访存指令访问可 Cache 空间和不可 Cache 空间,以及不可 Cache 访存指令访问 PA[37:0]相同的物理地址时,相互之间的硬件执行顺序;
- 2) 上述访问顺序都是就单个核心内部的程序顺序而言的,不同核心间的访问顺序必须由软件通过同步机制来保证:
- 3) 针对表中不保序的地方,则需要软件增加 MEMB 指令来强行保序;
- 4) 建议软件必要时对存储器空间分段划分为可 Cache 和不可 Cache 空间。这样,一个存储单元要么是可 Cache 的,要么是不可 Cache 空间。



# 4.1.2 I/O 空间

### 4.1.2.1 不可 Cache 特性

指令流不产生对 I/O 空间的访问。数据流对 I/O 空间只能执行不可 Cache 访问,不查询数据 Cache 和二级 Cache,也不会引起数据 Cache 和二级 Cache 装填。I/O 空间访问的指令包括所有 Load 类型的指令和 Store 类型的指令,但不包括淘汰、刷新和数据装填等 Cache 控制指令,这些指令访问的数据流地址为 I/O 空间时,都作为空指令。

### 4.1.2.2 合并特性

I/O 读指令不允许合并, I/O 写指令允许合并, 但合并是有限制的, 主要限制有:

- 1) 字节或半字的 I/O 写指令不允许合并,不同数据长度的 I/O 写指令不允许合并;
- 2) 按程序顺序,如果前后若干条字 I/O 写指令产生的数据流地址是升序且不重叠 (不一定连续),则允许这些指令在自然对界的 64 字节范围内进行合并;
- 3) 按程序顺序,如果前后若干条长字 I/O 写指令产生的数据流地址是升序且不重叠(不一定连续),则允许这些指令在自然对界的 128 字节范围内进行合并;
- 4) I/O 写地址达到可合并地址的最高端时(即无法再合并以后的 I/O 写指令),关闭合并窗口:
- 5) 遇到 MEMB 指令、I/O 读指令或不能合并的 I/O 写指令时,关闭合并窗口:
- 6) 等待合并超时时,关闭合并窗口。

关闭合并窗口后,即可将合并后的 I/O 写请求发出核心。

## 4.1.2.3 访问顺序

SW421 核心可以通过 MEMB 指令保证 I/O 空间访问的顺序性,没有 MEMB 指令时,不同访问指令之间,也保持一种顺序关系,具体见下表。

| 程序中较前面的访存指令     | 程序中较后面的访存指令     | 访问顺序      | 说明         |  |  |  |  |  |
|-----------------|-----------------|-----------|------------|--|--|--|--|--|
| 地址 X 的 Load 访问  | 地址 X 的 Load 访问  | 保证程序顺序    | SW421 核心向外 |  |  |  |  |  |
| 地址 X 的 Load 访问  | 地址 Y 的 Load 访问  | 有条件保证程序顺序 | 部          |  |  |  |  |  |
| 地址 X 的 Store 访问 | 地址 X 的 Store 访问 | 保证程序顺序    | 发出访问请求的    |  |  |  |  |  |
| 地址 X 的 Store 访问 | 地址 Y 的 Store 访问 | 有条件保证程序顺序 | 顺序与程序中指    |  |  |  |  |  |
| 地址 X 的 Load 访问  | 地址 X 的 Store 访问 | 保证程序顺序    | 令的顺序一致。    |  |  |  |  |  |

表 4-4I/O 空间访问顺序(假定 X 与 Y 是不同的地址)



| 地址 X 的 Load 访问  | 地址 Y 的 Store 访问 | 有条件保证程序顺序 |  |
|-----------------|-----------------|-----------|--|
| 地址 X 的 Store 访问 | 地址 X 的 Load 访问  | 保证程序顺序    |  |
| 地址 X 的 Store 访问 | 地址 Y 的 Load 访问  | 有条件保证程序顺序 |  |

#### 说明:

- 1) "有条件保证程序顺序"是指 I/O 空间访问物理地址[38:36]位相同的指令之间才保证程序顺序;
- 2) 上述访问顺序都是就单个核心内部的程序顺序而言的,不同核心间的访问顺序必须由软件通过同步机制来保证。

# 4.2 Cache 结构

SW421 核心包含两级 Cache,一级 Cache 将指令和数据分开,分别为指令 Cache(Icache)和数据 Cache(Dcache),二级 Cache 为指令和数据共用,称之为 SCache。

## 4.2.1 指令 Cache

SW421 核心中的指令 Cache 容量为 32KB,采用 4 路组相联结构、虚地址索引和虚地址标记,Cache 行大小为 128 字节。每个 Cache 行的内容包括:

- 1) 1120 位数据,包括 32 条指令以及这些指令的预译码信息,每条指令有 3 位预译码信息;
- 2) 32 位指令偶校验位,每位对应 1 条指令以及该指令的预译码信息;
- 3) 40 位虚地址标记(TAG), 即虚地址[52:13]位;
- 4) 2 位虚拟机号 VPN;
- 5) 8位用户进程号 UPN;
- 6) 1位系统空间标志 KS;
- 7) 2位处理器模式位 PM[1:0];
- 8) 1位有效位;
- 9) 1 位标记偶校验位,包括 TAG、VPN、UPN、PM、KS 在内的总校验位。

指令 Cache 采用轮转淘汰策略,对应每个 Cache 行,有 2 位淘汰指针,指示下次进行装填的组号。指令 Cache 的数据存储器和地址标记存储器(ITAG)都采用偶校验,出现偶校验错时,硬件自动按出错的索引号刷新 4 路指令 Cache,然后从二级 Cache 或存储器中重新取指令。软件写 CSR: IC\_FLUSH 时,也可将整个指令 Cache 刷新。

指令流水线取指令不命中指令 Cache 时,通过 ITB,将虚地址转换为物理地址,再访问二级 Cache 或存储器,同时可对后继指令进行预取。返回的指令装填指令 Cache 时,PM 位为引起指令 Cache 装填的指令 PC[1:0],具体处理如下:



- 1) 如果在 HM 模式下装填 Icache, KS 位固定为"1", VPN 来自 CSR: VPCR[VPN], UPN 来自 CSR: UPCR[UPN];
- 2) 如果在 VM 模式下装填且虚地址[52]为"0", KS 位固定为"1", VPN 来自 CSR: VPCR[VPN], UPN 来自 CSR: UPCR[UPN];
- 3) 如果在 VM 模式下装填且虚地址[52]为"1",或者在 KM 和 UM 下,则 KS、VPN 和 UPN 都来自命中的 ITB 条目。

## 4.2.2 数据 Cache

C3 核心中的数据 Cache 容量为 32KB,采用 4 路组相联结构、物理地址索引和物理地址标记, 并采用回写、读写都可装填 Cache 的策略, Cache 行大小为 128 字节。每个 Cache 行的内容包括:

- 1) 1024 位数据;
- 2) 128 位 ECC 校验码,每 64 位数据对应 8 位 ECC 校验码;
- 3) 33 位物理地址标记,即物理地址[45:13]位;
- 4) 3位状态位,即有效位(V)、可写位(W)和修改位(M);
- 5) 1 位标记偶校验位,包括物理地址标记和状态位在内的总校验位。

数据 Cache 采用 FIFO 淘汰策略,对应每个 Cache 行,有 2 位淘汰指针,指示下次进行装填的组号。淘汰指令、数据装填指令影响淘汰指针的修改,具体参考《SW421 核心结构手册》。

数据 Cache 的数据存储器采用 ECC 校验,可以纠正单错,检测双错和部分多错。数据 Cache 的标记存储器 (DTAG) 采用偶校验,大部分偶校验错可以通过数据流故障自陷和对应的特权程序进行纠错。

硬件不支持对数据 Cache 的自动刷新,但保证数据 Cache 中数据的一致性。

# 4.2.3 二级 Cache

SW421 核心中的 SCache 容量为 512KB,采用 8 路组相联结构、物理地址索引和物理地址标记,并采用回写、读写都可装填 Cache 的策略, Cache 行大小为 128B。SCache 既可以存放数据,也可以存放指令。每个 Cache 行内容包括:

- 1) 1024 位数据:
- 2) 128 位 ECC 校验码,每 64 位数据对应 8 位 ECC 校验码;
- 3) 30 位物理地址标记,即物理地址[45:16]位;
- 4) 5 位状态位,即有效位(V)、共享位(S)、脏状态位(D)、一级数据 Cache 副本有效位(F)和一级数据 Cache 副本修改位(M):
- 5) 2 位数据 Cache 组号,指示该 Cache 行在四路联想的数据 Cache 中的组号;



6) 7位标记 ECC 校验位,包括物理地址标记、状态位和数据 Cache 组号在内的总校验位。

SCache 采用 FIFO 淘汰策略,对应每个 Cache 行,有 3 位淘汰指针,用来指示下次进行装填的组号。淘汰指令、数据装填指令不影响淘汰指针的修改方法。

SCache 的数据存储器和标记存储器(STAG)都采用 ECC 校验,可以纠正单错,检测双错和部分多错。

硬件不支持对 SCache 的自动刷新,但保证 SCache 中数据的一致性,且保持数据 Cache 为 SCache 的子集,最新数据副本可能同时在数据 Cache 和 SCache 中,也可能只在数据 Cache 中,或只在 SCache 中。

## 4.2.4 指令副本标记

为支持指令 Cache 的一致性,核心设置了一级指令 Cache 的副本标记 ICTag 存储器(ICTag),采用物理地址索引和标记,4 路组相联结构,且与指令指令 Cache 中的副本记录——对应。每个 Cache 行对应的内容包括:

- 1) 1位有效位;
- 2) 33 位物理地址标记(TAG),即物理地址[45:13]位;
- 3) 1 位偶校验位, 只包括 33 位的物理地址标记的校验位。

软件指定对指令 Cache 的刷新,以及硬件因偶校验引起的 Icache 自动刷新都将引起 ICTag 存储器刷新。

# 4.3 地址转换缓冲

SW421 核心设置了虚实地址转换缓冲(TLB)来实现虚实地址转换和存储保护,指令流地址转换缓冲(ITB)和数据流地址转换缓冲(DTB)分开,有利于提高效率。

对特殊存储空间的指令流或数据流地址,还可以直接将虚地址作为物理地址来访问,将这种直接的地址映射模式称之为"超页"模式。在ITB和DTB中,设置有存储保护控制和大页机制,以实现存储空间保护和提高TLB的命中率。SW421核心还支持系统空间标志(KS)、虚拟机号(VPN)和用户进程号(UPN),实现对用户进程和系统进程的分别处理。

# 4.3.1 指令流地址转换缓冲(ITB)

指令流地址转换缓冲(ITB)由 32 个条目组成,全相联结构,采用轮转(Round-Robin)替换策略。由于指令 Cache 采用虚地址索引和虚地址标记,因此,仅当指令 Cache 不命中时才访问 ITB。ITB 的主要内容如下:



- 1) 40 位虚地址页号, 即虚地址[52:13]位;
- 2) 34 位物理页面号, 即物理地址[46:13]位;
- 3) 2位页面粒度 GH[1:0], 分别指示该 ITB 条目对应 1、32、1024 或 32768 个连续的 8KB 页;
- 4) 3 位访问控制位(UEE、KEE、VEE),对应用户模式、内核模式、虚拟模式的可执行控制位;
- 5) 2 位虚拟机号 VPN:
- 6) 8 位用户进程号 UPN;
- 7) 1位系统空间标志 KS:
- 8) 1位有效位。

SW421 核心指令流只允许访问存储器空间,因此不管写 CSR: ITB\_PTE[47]位的内容,指令流产生的存储访问请求的物理地址[47]位固定为"0"。

ITB 装填策略是,首先选择无效的条目,若没有无效的条目,则按轮转指针来选择装填的条目。 SW421 核心在 ITB 装填时,先要进行查询,如果要装填的条目因为粒度不同而命中多个条目,则将 新条目写入第一个命中的条目中,并将其它条目清除,以保证后续访问最多只命中一个 ITB 条目。

ITB 的刷新方式有五种,都是通过写以下相关 CSR 来实现的:

- 1) 对指定虚页面的 ITB 条目刷新:写 CSR: ITB\_IS 实现;
- 2) 对指定用户进程号的 ITB 条目刷新:写 CSR: ITB IU 实现;
- 3) 对指定虚拟机号的全部用户进程的 ITB 条目刷新:写 CSR: ITB IVP 实现:
- 4) 对指定虚拟机号的 ITB 条目刷新:写 CSR: ITB IV 实现;
- 5) 对所有 ITB 条目刷新:写 CSR: ITB IA 实现。

当操作系统需要更改指令空间虚实地址对应关系,在刷新 ITB 的同时,必须刷新指令 Cache,以保持指令 Cache 与 ITB 的一致性。

# 4.3.2 数据流地址转换缓冲(DTB)

数据流地址转换缓冲(DTB)由两级地址转化缓冲组成,一级数据地址转化缓冲(L1DTB)由 64 个条目组成,全相联结构,采用轮转替换策略。每个 DTB 条目的内容如下:

- 1) 40 位虚地址页号, 即虚地址[52:13]位;
- 2) 35 位物理页面号, 即物理地址[47:13]位;
- 3) 2 位页面粒度 GH[1:0], 分别指示该 DTB 条目对应 1、32、1024 或 32768 个连续的 8KB 页;
- 4) 4 位处理器模式读控制位 URE、KRE、VRE 和 HRE,指示该 DTB 条目对应的页中数据是 否允许在指定的处理器模式下进行读访问;
- 5) 4 位处理器模式写控制位 UWE、KWE、VWE 和 HWE,指示该 DTB 条目对应的页中数据 是否允许在指定的处理器模式下进行写访问:



- 6) 2 位访问权限控制位 FOR(读故障)和 FOW(写故障),指示对该 DTB 条目对应的页中数据进行读或写访问时,将产生故障;
- 7) 2 位虚拟机号 VPN;
- 8) 8位用户进程号 UPN;
- 9) 1位系统空间标志 KS;
- 10) 1位有效位。

L1DTB 装填策略是,首先选择无效的条目,若没有无效的条目,则按轮转淘汰指针来选择装填的条目。

二级数据地址转化缓冲(L2DTB)由两个地址表组成,一个是 512 条目的小页表(L2SDTB),一个是 32 条目的大页表(L2BDTB),两个表中的条目存放内容都与 L1DTB 相同。L2SDTB 为四路组相联结构,只存放 8KB 的页面对应的地址映射关系; L2BDTB 是全相联结构,用于存放大页(32、1024 或 32768 个连续的 8KB 页)对应的地址映射关系。

硬件保证一级 DTB 和二级 DTB 是互斥关系,当不命中一级 DTB,而命中二级 DTB 时,硬件自动将二级 DTB 中命中的条目读出,装填到一级 DTB 中,如果一级 DTB 中有条目淘汰,则将淘汰的条目写回二级 DTB;如果两级 DTB 都不命中,则需要软件装填,此时硬件将装填一级 DTB,如果一级 DTB 有条目淘汰,则同样需将淘汰的条目写回二级 DTB。

需要注意的是: 当装填的 DTB 条目的地址和粒度与两级 DTB 中已有条目的地址和粒度有重叠时,硬件不再保证将原 DTB 中的条目删除,因此软件必须保证: 当需要更改某个页面的粒度或虚实地址对应关系时,必须对 DTB 进行软件刷新,否则硬件在进行 DTB 访问时,可能因命中多个条目而出错。

对 DTB 条目的刷新方式有五种,可通过写以下 CSR 来实现的:

- 1) 对指定虚页面的 DTB 条目刷新:写 CSR: DTB IS 实现;
- 2) 对指定用户进程号的 DTB 条目刷新:写 CSR: DTB\_IU 实现;
- 3) 对指定虚拟机号的全部用户进程的 DTB 条目刷新:写 CSR: DTB\_IVP 实现;
- 4) 对指定虚拟机号的 DTB 条目刷新:写 CSR: DTB IV 实现;
- 5) 对所有 DTB 条目刷新:写 CSR: DTB IA 实现。

执行这些刷新指令时,硬件保证对两级 DTB 都进行刷新。

# 4.4 存储空间访问方式

## 4.4.1 虚空间

SW421 核心支持的虚拟地址为 53 位(VA[52:0]),并引入了 2 位虚拟机号(VPN)和 8 位用户进程号(UPN),将 53 位的虚地址空间延伸到 63 位,其中 VPN 用于区分 4 个不同的虚拟机,UPN



用于区分同一虚拟机下的 256 个不同的进程。对 43 位的虚地址空间也进行了划分,不同处理器模式下有不同的访问权限:

- 1) 用户模式 (UM): 只能访问 VA[52]为 "0"的空间,且必须采用虚地址访问,不支持超页方式访问:
- 2) 内核模式 (KM): 只能访问 VA[52]为"1"的空间,且必须采用虚地址访问,不支持超页方式访问;
- 3) 虚拟模式 (VM): 可访问 VA[52]为 "0" 空间,但只能采用超页方式访问;也可访问 VA[52] 为 "1" 空间,但只能采用虚地址访问;
- 4) 硬件模式 (HM): 可以访问所有虚空间,既可以使用虚地址访问,也可以直接使用物理地址访问。

注意:虚拟模式与用户模式的虚地址空间是重叠的,由操作系统进行管理,保证使用的虚地址不重叠。

每个虚拟机下的进程可以是用户进程(包含一些系统管理进程),也可以是内核(OS)进程,不同类型的进程应运行在不同模式下。在一个核心所运行的环境中,每个虚拟机同时只支持 256 个活动进程,但用户和系统进程数可以远远大于 256, 256 个活动进程以外的其它进程处于"挂起"状态。处于"挂起"状态的进程被"激活"时,必须从 256 个活动进程号中选择一个当前不用或者可以"挂起"的进程进行切换。实际进程号与核心内部的进程号不要求一一对应(除非不超过 256 个),在某个"活动"进程号释放给其它"挂起"的进程使用时,必须刷新指令 Cache、ITB 和 DTB 中与该进程相关的所有痕迹。同样,当 4 个虚拟机号不够用时,也可以类似处理。在 256 个活动的进程中进行切换时,则不需要刷新指令 Cache、ITB 和 DTB;在 4 个活动的虚拟机号中进行切换时,也不需要刷新指令 Cache(因为指令 Cache 是虚地址访问,在 C3A 中新增了 VPN)。

核心在硬件上是单进程控制的,通过 CSR 指示当前运行的虚拟机号 VPN 和进程号 UPN。为了使用方便,核心内部有 2 组 CSR 分别都含有 VPN 和 UPN,CSR: UPCR[UPN]和 CSR: VPCR[VPN]用于 Icache 访问以及 ITB 的查询、装填和刷新; CSR: DTB\_PCR[VPN、UPN]用于 DTB 的查询、装填和刷新。一般情况下,这两组必须完全相同。如果操作系统需要改变虚地址与物理地址的映射关系,在改变对应关系之前,需要刷新指令 Cache、ITB 和 DTB 中的相关内容。

操作系统(内核)程序是运行在内核模式下的系统管理程序(一种特殊的进程),为便于操作系统的存储空间管理,提高处理效率,设置了专门的 KS 标志。KS 标志为"1"的空间指示为内核程序访问空间,KS 标志为"0"的空间指示为用户程序访问空间。在 TLB 装填时,使用 KS 标志区分用户进程和内核进程,KS 为"1"时,指示内核进程,否则由 UPN 来指示不同的用户进程。



## 4.4.2 访问方式

### 4.4.2.1 物理地址访问

SW421 核心支持直接使用物理地址进行指令流和数据流访问,不进行虚实地址转换,也不进行存储保护以及访问权限检查。物理地址访问包括以下几种情况:

- 1) HM 模式下的指令流访问: 当 C3 核心处于 HM 模式下, 所有指令流访问的地址都当作物理地址处理,直接将 PC[46:2]位作为物理地址来进行指令流访问, 物理地址[47]位固定为"0";
- 2)HM 模式下的执行 PRI\_LDx/p、PRI\_LDx\_INC/p、PRI\_LDx\_DEC/p、PRI\_LDx\_SET/p 和 PRI\_STx/p 指令时,数据流访问的有效地址当作物理地址处理,不进行地址对界检查,直接 将 VA[47:0]位作为物理地址来进行访问;
- 3) VM 模式下的指令流超页访问: 当 SW421 核心处于 VM 模式下,指令流访问的虚地址[52] 位为"0"时,直接将虚地址[46:2]位当作物理地址使用,物理地址[47]位固定为"0";
- 4) VM 模式下的数据流超页访问: 当 SW421 核心处于 VM 模式下,数据流访问的虚地址[52] 位为"0"时,数据流访问的有效地址当作物理地址处理,直接将虚地址[47:0]位当作物理地址使用。

### 4.4.2.2 虚地址访问

虚地址访问包括以下情况:

- 1) HM 模式下,执行 PRI\_LDx/p、PRI\_LDx\_INC/p、PRI\_LDx\_DEC/p、PRI\_LDx\_SET/p 和 PRI\_STx/p 以外的其它访存指令;
- 2) VM 模式下,指令流和数据流访问的虚地址[52]位为"1";
- 3) KM 或 UM 模式下,任何指令流和数据流访问。

虚地址访问时,需要使用系统空间标志 KS、虚拟机号 VPN、用户进程号 UPN 与虚地址一起决定所访问的存储空间。KS 位用来区分系统空间和用户空间,当 KS 为"0"时,指示对应的空间为用户程序或数据,否则为系统程序或数据。VPN 用于区分不同的虚拟机,UPN 用来区别同一虚拟机上的不同进程。运行在同一虚拟机上的操作系统允许多个虚地址对应同一个物理地址,但某一时刻,如果 VPN 相同,且 KS=1 或者 UPN 相同,则对应的物理地址应是唯一的。

在 SW421 核心中, CSR: UPCR[UPN]和 CSR: VPCR[VPN]用于指令 Cache 访问以及 ITB 的查询、装填和刷新; CSR: DTB PCR[VPN、UPN]用于 DTB 的查询、装填和刷新。

由于指令 Cache 中有存放 VPN,如果切换虚拟机号,则不需要刷新指令 Cache。如果操作系统需要改变虚地址与物理地址的映射关系,在改变对应关系之前,需要刷新指令 Cache、ITB 和 DTB 中的相关内容。另外,修改这些状态位时,还要注意满足读写对应 CSR 的顺序限制,详见附录 A。



### 4.4.3 地址检查

对核心产生的指令流访问,只进行地址合法性检查。对数据流访问,需要进行地址合法性检查 和地址对界检查。具体的检查方法如下:

- 1) 如果指令流地址匹配使能,即 CSR: IA\_MATCH[EN]为"1",则指令经过指令流水线的译码站台时,检查指令流地址、处理器模式、虚拟进程号和用户进程号,若与 CSR: IA\_MATCH内容匹配(同时受 CSR: IA MSK 控制),则产生指令流故障;
- 2) 执行部件处理跳转指令时,检查转移指令的目标地址,若寄存器 Rb 中指示的跳转目标指令地址[63:53]位不是[52]位的符号扩展,表示符号扩展错,产生指令流故障;
- 3) 如果指令流目标地址匹配使能,即 CSR: IDA\_MATCH[EN]为"1",则在执行部件处理整数 转移类指令时,检查转移指令的目标地址和目标处理器模式,若与 CSR: IDA\_MATCH 内 容匹配(同时受 CSR: IDA MASK 控制),则产生指令流故障;
- 4) 执行部件处理访存指令时,检查计算出的访存虚地址,如果虚地址[63:53]位不是[52]位的符号扩展,表示符号扩展错,则产生数据流故障;
- 5)数据 Cache 管理部件对访存指令的数据流地址与 CSR: DA\_MATCH 内容进行匹配检查(同时受 CSR: DA\_MASK 和 CSR: DA\_MATCH\_MODE 控制),若 DA\_MATCH[EN]为非"00<sub>2</sub>"且地址匹配则产生数据流故障。地址比较时,如果 CSR: DA\_MATCH[PA]为"1",则只比较物理地址[47:0]位;否则比较虚地址[52:0]位。访存指令选择地址匹配比较的方式如下:
  - a. 如果 CSR: DA MATCH[EN(1:0)]为 "00<sub>2</sub>",则不进行匹配检查;
  - b. 如果 CSR: DA MATCH[EN(1:0)]为 "01<sub>2</sub>",则对读指令产生的地址进行比较;
  - c. 如果 CSR: DA\_MATCH[EN(1:0)]为"10<sub>2</sub>",则对写指令产生的地址进行比较;
  - d. 如果 CSR: DA\_MATCH[EN(1:0)]为 " $11_2$ ",则对所有访存指令产生的地址进行比较。
- 6) 整数部件处理访存指令时,对计算出的访存地址进行对界检查,即根据指令确定的数据访问粒度来检查访问地址,若地址不对界,在产生不对界故障。不对界的情况如下:
  - a. LDHU、STH 指令且数据流地址[0]位不为"0";
  - b. LDW、STW、FLDS、FSTS、LDSE、LDWE、LDW\_INC、LDW\_DEC、LDW\_SET 指令且数据流地址[1:0]位不为全"0";
  - c. LDL、LDL\_U、STL、FLDD、FSTD、 LDDE、LDL\_INC、LDL\_DEC、LDL\_SET 指令且数据流地址[2:0]位不为全"0";
  - d. VLDS、VSTS 指令且数据流地址[3:0]位不为全"0";
  - e. VLDD、VSTD 指令且数据流地址[4:0]位不为全"0";
  - f. VLDW U、VLDS U、VSTW Ux、VSTS Ux 指令且数据流地址[1:0]位不为全 "0";
  - g. VLDD\_U、VSTD\_Ux 指令且数据流地址[2:0]位不为全"0"。

Cache 刷新指令和数据装填指令都不进行地址对界检查,总是以一个 Cache 行为处理单位,即



将其数据流地址的最低 7 位[6:0]强制为全 "0"。对于特权指令 PRI\_LD 和 PRI\_ST,不管采用物理地址还是虚地址进行访问,均不进行地址对界检查。

- 7) 数据管理部件根据指令的类型和数据访问粒度对代换出的物理地址进行合法性检查,若地址非法,则产生数据流故障。地址非法的情况如下:
  - a. SIMD 扩展访存指令、原子操作指令、不可 Cache 访存指令的访存地址 PA[47]为"1" (表示访问 IO 空间)时;
  - b. 访存指令的访存地址 PA[47]为"1"(表示访问 IO 空间),且粒度是 128 位或 256 位时。
- 8) 存控、系统接口各设备处理数据流或指令流访问时,对地址进行合法性检查,读类地址非法,产生数据流故障,写类地址非法,产生机器检查错中断。地址非法的情况如下:
  - a. 访存地址超出芯片支持的主存容量时;
  - b. 访问不存在的 IO 寄存器时;
  - c. 对不可写的 IO 寄存器执行写操作时。

## 4.4.4 指令 Cache 访问

指令流访问指令 Cache 时,根据 PC 的[12:7]位访问指令 Cache 的标记存储器(ITAG),然后根据对应单元记录的 PM、KS、VPN 和 UPN 来判断是否命中指令 Cache。具体方法如下:

- 1) 如果 SW421 核心运行在 HM 模式下,指令流地址为物理地址,将 PC[46:13]位与指令 Cache 中的四路标记地址[46:13]位比较,若存在一路地址标记相同、PM 位为"00<sub>2</sub>"且有效位有效,则表示命中,否则表示不命中;
- 2) 如果 SW421 核心运行在 VM 模式下,将 PC[52:13]位与指令 Cache 中的四路标记地址[52:13] 位比较,若存在一路地址标记相同,VPN 与 CSR: VPCR[VPN]相同,PM 位为 "01<sub>2</sub>",且有效位有效,则表示命中,否则表示不命中:
- 3) 如果 SW421 核心运行在 KM 或 UM 模式下,将 PC[52:13]位与指令 Cache 中的四路标记地址[52:13]位比较,若存在一路地址标记相同,VPN 与 CSR: VPCR[VPN]相同,KS 为"1"或 UPN 与 CSR: UPCR[UPN]相同,PM 与当前处理器模式相同,且有效位有效,则表示命中,否则表示不命中。

# 4.4.5 ITB 访问

ITB 中包含 KS、VPN 和 UPN 位,在 ITB 装填时写入,其中 VPN 来自 CSR: VPCR[VPN],UPN 来自 CSR: UPCR[UPN]。当指令流不命中指令 Cache 时,查询 ITB,具体方法如下:

1) 若是 HM 模式下的指令流访问,或者 VM 模式下指令流访问且虚地址[52]位为"0",则不需要进行虚实地址代换,直接将虚地址[46:0]位作为物理地址(物理地址[47]位固定为"0"),



并结束。否则到 2);

- 2) 将指令流虚地址 IVA 与 ITB 中所有有效条目的地址标记进行比较,比较的位数根据 ITB 条目中的粒度 GH[1:0]来确定, GH 为 0、1、2 或 3,比较的虚地址分别为 IVA[52:13]、[52:18]、[52:23]或[52:28]位,如果没有匹配的 ITB 条目,则产生 ITB 脱靶,转 7)。否则到 3);
- 3) 如果条目中的 VPN 与 CSR: VPCR[VPN]不同,则产生 ITB 脱靶,转 7)。否则转 4);
- 4) 如果条目中的 VPN 与 CSR: VPCR[VPN]相同, KS 位为"0", 且 UPN 与 CSR: UPCR[UPN] 不同,则产生 ITB 脱靶,转 7)。否则到 5);
- 5) 进行访问权限检查,如果满足以下条件之一,则产生指令流故障,并结束。否则到6);
  - a. PC[1:0]为 "01<sub>2</sub>" 且命中的 ITB 条目中 VEE 为 "0";
  - b. PC[1:0]为"10<sub>2</sub>"且命中的 ITB 条目中 KEE 为"0";
  - c. PC[1:0]为"11<sub>2</sub>"且命中的 ITB 条目中 UEE 为"0"。
- 6) ITB 命中,根据命中条目的粒度 GH[1:0]来获得物理地址,并结束。具体方法如下:
  - a. 若 GH 为 "00<sub>2</sub>",则 IPA[46:0]由 ITB 中 PA[46:13]和 IVA[12:0]组成;
  - b. 若 GH 为 "01<sub>2</sub>",则 IPA[46:0]由 ITB 中 PA[46:18]和 IVA[17:0]组成;
  - c. 若 GH 为 "10<sub>2</sub>",则 IPA[46:0]由 ITB 中 PA[46:23]和 IVA[22:0]组成;
  - d. 若GH为"11<sub>2</sub>",则IPA[46:0]由ITB中PA[46:28]和IVA[27:0]组成。
- 7) ITB 脱靶,根据指令流访问虚地址[52]位进行判断,如果为"0",则产生 ITB 用户脱靶 (ITB\_MISS\_0) 故障;如果为"1",则产生 ITB 核心脱靶 (ITB\_MISS\_1) 故障。

## 4.4.6 DTB 访问

DTB 中包含了 KS、VPN 和 UPN 位,在 DTB 装填时写入,其中 VPN 来自 CSR: DTB\_PCR[VPN], UPN 来自 CSR: DTB\_PCR[UPN]。数据流先访问 DTB,得到物理地址后再访问数据 Cache,具体方法如下:

- 1) 若满足以下条件之一,则不需要进行虚实地址代换,直接将数据流虚地址 DVA[47:0]作为物理地址。否则到 2);
  - a. HM 模式下,数据流访问地址由 PRI\_LDx/p、PRI\_LDx\_INC/p、PRI\_LDx\_DEC/p、PRI\_LDx\_SET/p 和 PRI\_STx/p 指令产生;
  - b. VM 模式下,数据流访问虚地址[52]位为"0"。
- 2) 数据流访问虚地址 DVA 与 DTB 中所有有效条目的地址标记进行比较, 比较的位数根据 DTB 条目中的粒度 GH[1:0]来确定, GH 为 0、1、2 或 3, 比较的虚地址分别为 DVA[52:13]、[52:18]、[52:23]或[52:28]位, 如果没有匹配的 DTB 条目,则产生 DTB 脱靶,转到 7)。否则到 3);
- 3) 如果条目中的 VPN 与 CSR: DTB\_PCR[VPN]不同,则产生 DTB 脱靶,转到 7)。否则转 4);
- 4) 如果条目中的 VPN 与 CSR: DTB PCR[VPN]相同, KS 位为"0", 且 UPN 与 CSR: DTB PCR



[UPN]不同,则产生 DTB 脱靶,转到 7)。否则到 5);

- 5) 根据数据流访问指令的 PC[1:0]位,进行访问权限检查,如果满足以下条件之一,则产生数据流故障,并结束。否则到 6);
  - a. 对一般读访问类指令的读越权检查,读越权的条件是 PC[1:0]为 "00<sub>2</sub>" 且命中的 DTB 条目中 HRE 为 "0",或者 PC[1:0]为 "01<sub>2</sub>" 且命中的 DTB 条目中 VRE 为 "0",或者 PC[1:0]为 "10<sub>2</sub>" 且命中的 DTB 条目中 KRE 为 "0",或者 PC[1:0]为 "11<sub>2</sub>" 且命中的 DTB 条目中 URE 为 "0";
  - b. 对一般写访问类指令的写越权检查,写越权的条件是 PC[1:0]为 "00<sub>2</sub>" 且命中的 DTB 条目中 HWE 为 "0",或者 PC[1:0]为 "01<sub>2</sub>" 且命中的 DTB 条目中 VWE 为 "0",或者 PC[1:0]为 "10<sub>2</sub>" 且命中的 DTB 条目中 KWE 为 "0",或者 PC[1:0]为 "11<sub>2</sub>" 且命中的 DTB 条目中 UWE 为 "0";
  - c. 对 LDx\_INC、LDx\_DEC 和 LDx\_SET 等非特权原子操作指令,既要进行读越权检查,也要进行写越权检查:
  - d. 对 PRI\_LDx/v 或 PRI\_LDx/vpte 指令,类似于一般读访问指令进行读越权检查,并使用 CSR: DTB\_PCR[PM]代替 PC[1:0]进行权限检查;
  - e. 对 PRI\_STx/v,类似于一般写访问指令进行写越权检查,并使用 CSR: DTB\_PCR[PM] 代替 PC[1:0]进行权限检查;
  - f. 一般读访问指令、非特权原子操作指令和 PRI\_LDx/v 或 PRI\_LDx/vpte, 命中的 DTB 条目中 FOR 为"1",作为读故障;
  - g. 一般写访问指令、非特权原子操作指令和 PRI\_STx/v 指令,命中的 DTB 条目中 FOW 为"1",作为写故障:
- 6) DTB 命中,根据命中条目的粒度 GH[1:0]来获得物理地址,并结束。具体方法如下:
  - a. 若 GH 为 "00<sub>2</sub>",则 DPA[46:0]由 DTB 中 PA[46:13]和 DVA[12:0]组成;
  - b. 若 GH 为 "01<sub>2</sub>",则 DPA[46:0]由 DTB 中 PA[46:18]和 DVA[17:0]组成;
  - c. 若 GH 为 "10<sub>2</sub>",则 DPA[46:0]由 DTB 中 PA[46:23]和 DVA[22:0]组成;
  - d. 若 GH 为 "11<sub>2</sub>",则 DPA[46:0]由 DTB 中 PA[46:28]和 DVA[27:0]组成。
- 7) DTB 脱靶: 若是 PRI\_LDx/vpte 指令产生的数据流虚地址,则作为 DTB 二次脱靶故障 (DTBM\_DOUBLE),否则进入 DTB 一次脱靶故障,并根据数据流虚地址[52]位进行判断,如果为"0",则作为 DTB 用户脱靶故障 (DTBM\_SINGLE\_0);如果为"1",则作为 DTB 核心脱靶故障 (DTBM\_SINGLE\_1)。

# 4.4.7 存储器栏栅 (MEMB)

指令流水线发现存储器栏栅指令时,需要等前面所有访存指令都完成处理并退出后,才允许后



续指令进入指令流水线,因此软件在需要严格保证两条访存指令之间的顺序,或者一条访存指令与 后续其它指令的顺序时,可以在两条指令之间插入一条存储器栏栅指令。

### 4.4.8 指令栏栅 (IMEMB)

指令流水线发现指令栏栅指令时,需要等前面所有的指令都完成处理并退出后,才开始重新取后续指令进入指令流水线,因此软件在需要严格进行指令的生产者与消费者同步时,可结合使用存储器栏栅指令和指令栏栅指令来实现。

# 4.5 错误检测及错误处理

### 4.5.1 检错与报错

### 4.5.1.1 校验方法

在 SW421 核心中采用 2 种校验方法,一种是偶校验,另一种是 ECC 校验。偶校验是使被校验的数据和校验位中"1"的个数保持为偶数,否则发生偶校验错。偶校验只能发现被校验的数据和校验位中出现奇数个错误,但不能进行错误纠正。ECC 校验可实现纠正单位错,检测双位错和部分多位错。两种校验位的形成方法如下:

- 1)偶校验: P为校验位,D[i:0]为数据,则  $P=D0\oplus D1\oplus \cdots \oplus Di$ ,其中" $\oplus$ "为逻辑"异或",即将 i+1 位数据进行逻辑异或而获得校验位 P;
- 2) ECC 校验: P[n:0]为校验位, D[m:0]为数据, 根据实际需要, 确定 m 的大小, 从而确定 n 的大小, 保证能够纠正 "m+n+2" 位数据(包含 ECC 校验位在内)中存在的单位数据错, 检测其中的双位和部分多位数据错。

出现校验错,根据不同的错误现场与引起错误的指令是否已完成处理并退出等情况,可产生数据流故障、已纠正错中断请求或机器检查错中断请求。

SW421 核心内部的 Cache 存储器以及主存都采用校验保护,具体如下:

- 1)指令 Cache 的地址标记存储器 (ITAG): 采用偶校验,每个 Cache 行的每一组 ITAG 内容 (51位)增加 1位偶校验位;
- 2) 指令 Cache 的数据存储器:采用偶校验,每条指令(32位指令及3位预译码位)增加1位 偶校验位:
- 3) 数据 Cache 的地址标记存储器 (DTAG): 采用偶校验,每个 Cache 行的每一组 DTAG 内容 (34 位)增加 1 位偶校验位;



- 4) 数据 Cache 的数据存储器:采用 ECC 校验,每个对界的 64 位数据增加 8 位 ECC 校验位;
- 5) 二级 Cache 的地址标记存储器(STAG): 采用 ECC 校验,每个 Cache 行的每一组 STAG 内容(37 位)增加 7 位 ECC 校验位;
- 6) 二级 Cache 的数据存储器: 采用 ECC 校验,每个对界的 64 位数据增加 8 位 ECC 校验位;
- 7) 主存: 采用 ECC 校验,每个对界的 64 位数据增加 8 位 ECC 校验位。

SW421 核心与核外的主要数据通路也设置了校验,请求和数据通路都采用 ECC 校验,每个对界的 64 位数据增加 8 位 ECC 校验位。核心与核外一致性处理部件之间的接口:核心接收请求时,只检错和报错(包括单错和多错),不纠单错;核心接收数据时纠单错、检多错并进行单错预警和报多错;一致性处理部件接收请求时,只检错和报错(包括单错和多错),不纠单错;一致性处理部件接收数据时,只检错和报错(只包括多错),不纠单错。

#### 4.5.1.2 可纠正错预警机制

核心内设置了一套 CSR: HSERR\_CNT 和 HSERR\_TH,用于对核心内检查到的可纠正错统一进行加"1"计数。当在预设定的时间窗口内,核心内的可纠正单错发生的次数达到预设计的阈值,且已纠正错中断使能时,产生已纠正错中断,同时通知核外的维护接口部件。参与核心可纠正错预警计数的有如下情况:

- 1) 读 Icache, 检查到偶校验错;
- 2) 读 Itag, 检查到偶校验错;
- 3) 读 Dtag, 检查到偶校验错;
- 4) Dcache 在执行读修改写时,检查到 ECC 单错;
- 5) 数据从 Dcache 淘汰到 SCache 时, 检查到 ECC 单错:
- 6) 读 SCache, 检查到 ECC 单错;
- 7) 读 Stag, 检查到 ECC 单错;
- 8) 读 ICTag, 检查到偶校验错;
- 9) SCache 管理部件(SBOX)收到核心接口上的响应数据,检查到 ECC 单错。

#### 4.5.1.3 核心的报错类型

核心通过维护接口向外报告的错误类型如下:

- 1) 核心内检查到的硬件故障,包括:
  - a. IBOX 检查到 ROB 的头尾指针管理错误;
  - b. DBOX 检查到 CSR 指令发射错误;
  - c. SBOX 检查到 STAG 为非法状态;
  - d. SBOX 检查到核心接口上收到的二次请求与内部状态不一致;



- e. SBOX 检查到核心接口上收到的响应与内部状态不一致;
- f. SBOX 检查到核心接口上的响应包头和二次请求包头发生了 ECC 单错或多错;
- g. 软件自己检查到各种硬件故障,设置 CSR: HARD\_ERR 为"1"。
- 2) 核心内检查到的软件故障,包括:
  - a. 软件自己检查到各种软件故障,设置 CSR: SOFT\_ERR 为"1";
  - b. 写不可 Cache 空间或 I/O 空间或者 SCache 因挤占而产生的被动淘汰请求时,核心收到非法地址响应。
- 3) 核心内检查到的可纠错计数到达阈值,包括4.5.1.2中列举的所有情况;
- 4) 核心内检查到的 ECC 多错,包括:
  - a. Dcache 在执行读修改写时,检查到不可覆盖的 ECC 多错;
  - b. 数据从 Dcache 淘汰到 SCache 时,检查到 ECC 多错;
  - c. 读 SCache, 检查到 ECC 多错;
  - d. 读 Stag, 检查到 ECC 多错;
  - e. SBOX 从核心接口上收到响应数据,检查到 ECC 多错。

#### 4.5.2 指令 Cache 的错误检测与处理

指令 Cache 具有只读特性,其数据产生的偶校验错都是可纠正错。取指令时,如果发现指令 Cache 的标记或者数据出现偶校验错,硬件分别设置 CSR: IS\_STAT[TAG\_PAR]或者 CSR: IS\_STAT[DATA\_PAR],并自动将错误所在的4个同索引 Cache 行刷新,同时参与可纠正错预警计数。

#### 4.5.3 数据 Cache 的错误检测与处理

数据 Cache 的 DTAG 采用偶校验,当处理 Load/Store 类指令时,对从数据 Cache 中读出的 DTAG 进行偶校验,若产生偶校验错,则在 CSR: DC\_CTL[DCTAG\_PAR\_EN]为"1"时,设置 CSR: DS\_STAT[TAG\_PERR]为"1"。该错误硬件无法自动纠正,需要进入数据流故障自陷(DFAULT),由 DFAULT 特权程序来进行错误恢复。

特权程序先读 CSR: DS\_STAT,确定引起 DFAULT 的原因,如果不存在其它数据流故障且 DS\_STAT[TAG\_PERR]为"1",则可以确定是数据 Cache 的 DTAG 偶校验错,然后设置 CSR: DC\_CTL[DCTAG\_PAR\_EN]为"0",关闭数据 Cache 的 DTAG 校验使能,再从 CSR: DVA 中获得出现错误的数据流物理地址。以这个物理地址[12:7]位为基础,地址[15:13]从"0002"遍历至"1112",共 8个二级 Cache 索引,每个索引遍历 8个不同的组号,这样共形成 64个淘汰地址,使用 FLUSHD指令将出现故障的数据 Cache 内容淘汰到主存。由于出现 DTAG 偶校验错的数据 Cache 行被淘汰时,由 STAG 提供地址标记信息,因此数据 Cache 的 DTAG 偶校验错被清除,且对应的数据 Cache 内容



不会受到破坏。

数据 Cache 的数据采用 ECC 校验,当处理 Load 类指令时,对从数据 Cache 中读出的数据进行 ECC 校验,如果出现 ECC 错 (硬件不判断是单错还是多错),则在 CSR: DC\_CTL[DCDAT\_ERR\_EN] 为 "1"时,设置 CSR: DS\_STAT[DAT\_ERR]为 "1"。该错误硬件无法自动纠正,需要进入数据流 故障自陷 (DFAULT),由 DFAULT 特权程序来进行处理。

特权程序先读 CSR: DS\_STAT,确定引起 DFAULT 的原因,如果不存在其它数据流故障且 DS\_STAT[DAT\_ERR]为"1",则可以确定是数据 Cache 的数据 ECC 校验错,然后设置 CSR: DC\_CTL[DCDAT\_ERR\_EN]为"0",关闭数据 Cache 的数据校验使能,再从 CSR: DVA 中获得出现错误的数据流物理地址,使用 8 条普通的 load 指令,其访问地址的[12:7]与 DVA[12:7]相同,将出现故障的数据 Cache 内容通过挤占方式淘汰到 SCache。出现 ECC 校验错的数据 Cache 行被淘汰时,如果是脏数据,二级 Cache 管理部件会对数据进行 ECC 校验,纠正单错,报告多错,否则数据 Cache 会丢弃非脏的出错数据,实现纠正单错和报告多错。

数据 Cache 处理 Store 类指令时,对从数据 Cache 中读出的数据进行 ECC 校验,如果出现 ECC 单错,则进行纠错,并报告 ECC 单错;如果出现能被写数据完全覆盖的 ECC 多错,则直接用新数据覆盖,不报错;如果出现不能被写数据完全覆盖的 ECC 多错,则硬件无法纠正,在 CSR: DC\_CTL[DCDATA\_ERR\_EN]为"1"时,设置 CSR: DC\_STAT[DATA\_MERR]为"1",并报告 ECC 多错。

二级 Cache 对从数据 Cache 中淘汰的数据进行 ECC 校验,如果出现 ECC 单错,则进行纠错,在 SC\_CTL[SCDAT\_ERR\_EN]为"1"时,设置 CSR:SC\_STAT[DVIC\_SERR]为"1",并报告 ECC 单错;如果出现 ECC 多错,则硬件无法纠正,在 CSR: SC\_CTL[SCDAT\_ERR\_EN]为"1"时,设置 CSR: SC\_STAT[DVIC\_MERR]为"1",并报告 ECC 多错。

以上情况下,对于报出的 DTAG 偶校验错和 ECC 单错,同时参与可纠正错预警计数,对于报出的 ECC 多错,则在机器检查错使能的情况下,产生机器检查错中断请求。

## 4.5.4 二级 Cache 的错误检测与处理

二级 Cache 处理指令流访问、数据流访问以及一致性查询请求时,对从二级 Cache 中读出的 STAG 进行 ECC 校验,如果出现 ECC 单错,则进行纠正,在 CSR: SC\_CTL[SCTAG\_ERR\_EN]为"1"时,设置 CSR: SC\_STAT[TAG\_SERR]为"1",并报告 ECC 单错;如果产生 ECC 多错,则硬件无法纠正,在 CSR: SC\_CTL[SCTAG\_ERR\_EN]为"1"时,设置 CSR: SC\_STAT[TAG\_MERR]为"1",并报告 ECC 多错。

二级 Cache 处理指令流访问和一致性查询请求时,对从二级 Cache 中读出的数据进行 ECC 校验,如果出现 ECC 单错,则进行纠正,在 CSR: SC\_CTL[SCDAT\_ERR\_EN]为"1"时,设置 CSR: SC\_STAT[DAT\_SERR]为"1",并报告 ECC 单错;



二级 Cache 处理数据流请求时,对从二级 Cache 中读出的数据进行 ECC 校验,如果出现 ECC 单错,则进行纠正后写入 Dcache,但可能存在需要写寄存器文件的 Load 指令,此时其数据未进行纠错,硬件会重新执行这条指令,从而从 Dcache 读取正确的数据;同样的,二级 Cache 在 CSR: SC\_CTL[SCDAT\_ERR\_EN]为"1"时,设置 CSR: SC\_STAT[DAT\_SERR]为"1",并报告 ECC 单错;

如果出现 ECC 多错,则硬件无法纠正,在 CSR: SC\_CTL[SCDAT\_ERR\_EN]为"1"时,设置 CSR: SC\_STAT[DAT\_MERR]为"1",并报告 ECC 多错。

以上情况下,对于报出 ECC 单错,都参与可纠正错预警计数;对于报出 ECC 多错,则在机器检查错使能的情况下,产生机器检查错中断请求。

#### 4.5.5 指令副本标记的错误检测与处理

指令 Cache 具有只读特性,指令副本标记阵列产生的偶校验错也是可纠正错。正常访问过程中,如果发现指令副本标记阵列出现偶校验错,则硬件设置 CSR: SC\_STAT[ICTAG\_PAR],并自动将指令 Cache 和指令副本标记阵列中,四路对应的 Cache 行刷新,同时参与核心可纠正错预警计数。

#### 4.5.6 核心接口上的错误检测与处理

核心的二级 Cache 管理部件(SBOX)对核心收到的二次请求进行偶校验,如果发生偶校验错,且 CSR: SC\_CTL[SYSREQ\_ERR\_EN]为"1",则登记 CSR: SC\_STAT[SYSREQ\_ERR],且向 IBOX 报告错误报告,在机器检查错使能的情况下,产生机器检查错中断请求;如果 CSR:: SC\_CTL[SYSREQ\_ERR\_EN]为"0",则不登记任何信息,也不向 IBOX 报告错误。

SBOX 对核心收到的响应包头信息进行偶校验,如果发生偶校验错,且 CSR: SC\_CTL[SYSACK\_ERR\_EN]为"1",则登记 CSR: SC\_STAT[SYSACK\_ERR],且向 IBOX 报告错误,在机器检查错使能的情况下,产生机器检查错中断请求;如果 CSR: SC\_CTL[SYSACK\_ERR\_EN]为"0",则不登记任何信息,也不向 IBOX 报告错误。

SBOX 对核心收到的响应数据进行 ECC 校验,如果数据发生了单错,则进行纠错,如果 CSR:: SC\_CTL[SYSDAT\_ERR\_EN]为"1",则登记 CSR: SC\_STAT[SYSDAT\_SERR],并参与核心可纠正错预警计数;如果 CSR: SC\_CTL[SYSDAT\_ERR\_EN]为"0",则不登记任何信息,也不参与核心可纠正错预警计数。

SBOX 对核心收到的响应数据进行 ECC 校验,如果数据发生了多错,且 CSR:SC\_CTL[SYSDAT\_ERR\_EN]为"1",则登记 CSR:SC\_STAT[SYSDAT\_MERR],然后将错误报告给IBOX,在响应中携带 ECC 多错标志送 IBOX 或 DBOX,同时错误的数据重新生成校验码后装填SCache;如果 CSR:SC\_CTL[SYSDAT\_ERR\_EN]为"0",则不登记任何信息,也不在响应中携带ECC 多错标志。



如果 DBOX 收到带 ECC 多错标志的响应,且是非推测路径上的数据流访问请求,且产生访问请求的指令不是数据装填,则设置 CSR: DC\_STAT[MEM\_MERR]为"1",进入数据流故障处理入口执行,同时重新生成 ECC 码装填 Dcache。

如果 IBOX 收到带 ECC 多错标志的响应,且是非推测路径上的取指令请求,则设置 CSR: IS\_STAT[MEM\_MERR]为"1",如果机器检查错使能,则作为机器检查错中断处理,否则继续取指,此时执行的是特殊的 SYS\_CALL/b 指令(功能码为 0xBB),错误的数据不装填 Icache。

#### 4.5.7 核心响应中携带的错误

SW421 核心核心访问核外存储器空间或 I/O 空间,可能收到三种响应:

- 1) 非法地址响应;
- 2) 带控制错标志的响应;
- 3) 带 ECC 多错的响应。

#### 4.5.7.1 非法地址响应

核心向存储控制器发出数据读或指令读请求,存储控制器因请求包含的地址是不存在地址空间的地址(NXM),而产生非法地址响应返回核心。或者核心向存储控制器或系统接口发出 I/O 读请求,所访问的 I/O 地址不存在,则这些部件也产生非法地址响应返回核心。如果请求是指令推测执行产生的,则不产生任何影响,否则作为软件故障,根据请求类型作出不同处理:

- 1) 如果请求是取指令请求,则设置 CSR: IS\_STAT[ADDR\_ERR]为"1",如果机器检查错使能,则进入机器检查错中断处理入口,否则继续执行特殊的 SYS\_CALL/b 指令(功能码为 0xBB),最终处于停机状态;
- 2) 如果请求是数据流访问请求,则设置 CSR: DS\_STAT[ACV1]为"1",作为数据流故障处理。注意,产生非法地址响应错时,将不装填数据 Cache(数据流访问)、指令 Cache(指令流访问)和二级 Cache,且将数据 Cache 和二级 Cache 对应的 Cache 行状态置为无效。软件进入机器检查错中断处理程序或数据流故障处理程序后,检查是这种情况引起的故障,需要设置 CSR: SOFT\_ERR为"1",以便向核外报告本核心发生软件故障。

核心发出的 I/O 空间写请求、共享不可 Cache 空间写请求或者挤占 SCache 引起的淘汰请求,因请求包含的地址是不存在地址空间的地址(NXM),或所访问的 IOR 不可写,则产生非法地址响应返回核心。如果 CSR: SC\_CTL[WR\_ERR\_EN]为"1",则分别设置 CSR: SC\_STAT[WR\_ADDR\_ERR\_IO]、 CSR: SC\_STAT[WR\_ADDR\_ERR\_NC]或者 CSR: SC\_STAT[WR\_ADDR\_ERR\_VIC]为"1"。如果机器检查错使能,则作为机器检查错中断处理,否则继续执行。同时硬件向核外报告本核心发生了软件故障。



注 1: 每个存控对应的存储器空间范围与外接的存储器容量密切相关,一致性处理部件会根据 具体的容量配置判断所访问的地址是否非法;

注 2: 当核心或存控被配置为断连状态时,对应的存储器地址或 I/O 寄存器地址也可能变为不存在的空间,一致性处理器部件和各设备接口部件会根据断连配置判断所访问的地址是否非法。

#### 4.5.7.2 带控制错的响应

核心向存储控制器发出请求,存储控制器返回带控制错的响应,且 CSR: SC\_CTL[ACK\_CHK\_EN] 为"1",则作为非法响应,并根据请求源类型作出不同处理:

- 1) 如果请求是非推测路径上的取指令请求,则设置 CSR: IS\_STAT[ACK\_ERR]为"1",如果 机器检查错使能,则作为机器检查错中断处理,否则继续取指,此时执行的是特殊的 SYS CALL/b 指令(功能码为0xBB),最终处于停机状态;
- 2) 如果请求是非推测路径上的数据流访问请求,当 CSR: DC\_CTL[ACK\_ERR\_EN]为"1",且 产生访问请求的指令不是数据装填指令,则设置 CSR: DC\_STAT[ACK\_ERR]为"1"。如果 机器检查错使能,则进入机器检查错中断处理入口执行,否则正常执行。
- 3) 如果请求是 I/O 空间写请求、共享不可 Cache 空间写请求或者挤占 SCache 引起的淘汰请求,当 CSR: SC\_CTL[WR\_ERR\_EN]为"1",则分别设置 CSR: SC\_STAT[WR\_CTLERR\_IO]、CSR: SC\_STAT[WR\_CTLERR\_NC]或者 CSR: SC\_STAT[WR\_CTLERR\_VIC]为"1"。如果机器检查错使能,则作为机器检查错中断处理,否则继续执行。

收到带控制错的响应时,如果是带数据的响应,则装填 Dcache(数据流访问)和 SCache,但不 装填 Icache(指令流访问)。如果 CSR: SC\_CTL[ACK\_CHK\_EN]为 "0",则不进入任何异常,继 续执行。

#### 4.5.7.3 带 ECC 多错的响应

核心向存储控制器发出请求,存储控制器返回带 ECC 多错的响应,作为非法响应,并根据请求源类型作出不同处理:

- 1) 如果请求是非推测路径上的取指令请求,则将虚地址登记到 CSR: EXC\_PC,设置 CSR: IS\_STAT[MEM\_MERR]为"1",如果机器检查错使能,则进入机器检查错中断处理入口,否则继续执行特殊的 SYS CALL/b 指令(功能码为 0xBB),最终处于停机状态;
- 2) 如果请求是非推测路径上的数据流访问请求,则将指令的虚地址登记到 CSR: EXC\_PC 中,将访问的物理地址登记到 CSR: DVA 中,设置 CSR: DC\_STAT[MEM\_MERR]为"1",然后进入数据流故障处理流程。



## 4.5.8 核心内其它硬件故障的检测与处理

核心硬件出现故障可能产生多种控制错误,都当作机器检查错,如果机器检查错中断使能,则产生机器检测错中断请求。

#### 4.5.8.1 指令流控制错

核心进行指令流处理时,若重排序缓冲(ROB)中的头尾指针管理出现混乱时,则作为指令流控制错,设置 CSR: IS\_STAT[ROB\_ERR]为"1"。

#### 4.5.8.2 数据流控制错

核心的内部检测到以下几种情况时,产生数据流控制错:

- 1) 数据 Cache 管理部件(DBOX)接收到的一致性查询请求与内部保留的状态不一致,且 DC CTL[PROBE ERR EN]为"1",设置 CSR: DC STAT[PROBE ERR]为"1";
- 2) 二级 Cache 管理部件(SBOX)收到响应,检查到与一次请求的类型不匹配时,且 CSR: SC\_CTL[CTL\_ERR\_EN]为"1",设置 CSR:SC\_STAT [CTL\_ERR\_RQ1\_ACK]为"1";
- 3) 二级 Cache 管理部件(SBOX)收到二次请求、响应、数据流请求或数据流访问产生的淘汰请求时,检查到与内部状态不一致时,且 CSR: SC\_CTL[CTL\_ERR\_EN]为"1",分别设置 CSR:SC\_STAT [CTL\_ERR\_RQ2\_SCSTAT]、SC\_STAT [CTL\_ERR\_ACK\_SCSTAT]、SC STAT [CTL ERR DVIC SCSTAT]为"1";
- 4) 二级 Cache 管理部件(SBOX)收到二次取数请求,检查到取数请求的类型不正确,且 CSR: SC CTL[CTL ERR EN]为"1",设置 CSR:SC STAT [CTL ERR FTCH TYPE]为"1";
- 5) 二级 Cache 管理部件(SBOX)检查到 SMAF、SVAF1、SVAF2、SIOWB 的内部状态错,且 CSR: SC\_CTL[CTL\_ERR\_EN]为"1",分别设置 CSR:SC\_STAT [CTL\_ERR\_SMAF]、SC\_STAT [CTL\_ERR\_SVAF1]、SC\_STAT [CTL\_ERR\_SVAF2]、SC\_STAT [CTL\_ERR\_IOWB]为"1"。



# 5 中断

## 5.1 中断源

中断是指来自于正常指令流之外的、与指令流异步的、需要 SW421 核心进行干预和处理的事件。 在 SW421 核心中,设置四类中断,具体如下:

- 1) 核间中断:由本核心或外部其它发出的中断,用于实现核心之间的快速通信,可屏蔽;
- 2) 核心内部产生的核心中断:
  - a. 已纠正错中断:核心硬件发现已纠正错误而产生,可屏蔽:
  - b. 机器检查错中断:核心硬件发现故障时产生,可屏蔽;
  - c. 定时器中断:核内工作时钟计数产生,可屏蔽;
  - d. 事件计数中断:核内进行事件计数产生,可屏蔽;
- 3) 核心外部产生的核心中断:
  - a. 设备中断:由芯片连接的外设产生的中断,包括 PCI-E 设备中断和维护中断,可屏蔽;
  - b. 短时钟中断:核外维护时钟计数产生,可屏蔽;
  - c. 故障中断: 核外硬件发现故障时产生,可屏蔽;
- 4) 特殊中断:
  - a. 睡眠中断: 一种特殊中断,强制核心进入睡眠状态,可屏蔽;
  - b. 睡眠唤醒中断: 一种特殊中断, 使核心结束睡眠状态, 恢复运行, 不可屏蔽;
  - c. 复位:一种特殊中断,使处理器处于复位状态,不可屏蔽。

在SW421核心中,内部CSR:II0和II1中记录有本核心收到的核间中断请求,CSR:INT\_STAT0~3中记录核心内部和核心外部产生的中断请求,特殊中断请求不需要在内部CSR中记录(睡眠中断需要登记INT\_STAT0~3)。核心内部和外部产生的中断都采用向量方式管理,即各种中断在CSR:INT\_STAT0~3中的位置(称为中断向量号)可以由软件通过写对应的CSR或IOR来指定,核心内部产生的中断映射的向量号在CSR:INT\_VEC中定义,核心外部产生的中断请求映射的向量号由对应的IOR来定义。除复位为电平触发的中断外,其它中断都是边沿触发类型的中断。

注意 CSR: INT\_STAT0~3 显式读的特殊性,不论对应的中断使能(CSR: IER0~3 控制)是 否打开,产生核心中断请求总是在 CSR: INT\_STAT0~3 中进行记录(除复位、睡眠唤醒中断和核间中断),但显式读 CSR: INT STAT0~3,只能获得那些对应中断使能打开的核心中断请求信息。



### 5.1.1 核间中断

#### 5.1.1.1 核间中断 0/1

SW421 核心可以在任何模式下对一个或任意多个核心发出核间中断。当软件写 CSR: INT\_REQ时,如果指定中断类型为核间中断,则向系统接口部件发送核间中断请求,可以指定发送核间中断0请求或核间中断1请求。

系统接口部件接到核间中断请求后,检查指定的目标核心状态,如果可处理中断且中断使能(IOR: INTEN 为"1"),则向该核心发核间中断请求;如果核心睡眠或中断不使能(IOR: INTEN 为"0"),则将核间中断请求缓存在系统接口部件,等核心可以处理中断后再向该核心发中断请求;如果核心断连,则核间中断丢失,在 IOR: IINT\_MIS 中进行登记,同时通知维护接口发生了软件错,登记 IOR: SI\_FAULT\_STAT,可配置产生故障中断和向系统报错。

目标核心接到核间中断 0 请求后,根据源核心号置 CSR: IIO 中对应的 Valid 为"1",如果核间中断 0 使能(CSR: II\_ER[II0\_EN]为"1"),则进入一般中断处理的特权程序入口 0 (INTERRUPTO)进行处理。当核间中断服务程序处理结束后,软件写中断目标核心的 CSR: II\_CLR[II0\_CLR],清除核间中断 0。

同样目标核心接到核间中断 1 请求后,根据源核心号置 CSR: II1 中对应的 Valid 为"1",如果核间中断 1 使能(CSR: II\_ER[II1\_EN]为"1"),则进入一般中断处理的特权程序入口 0(INTERRUPT0)进行处理。当核间中断服务程序处理结束后,软件写中断目标核心的 CSR: II\_CLR[II1\_CLR],清除核间中断 1。

需要注意的是,SW421 核心可能将同一个源核心发向同一个目标核心的多次核间中断合并。另外,硬件保证,当核间中断到达核心时,如果对应的中断使能没有打开(即 CSR:II\_ER[II\_EN]为"0"),则 CSR: II0 和 II1 中一直保留中断,直到被软件清除或被新的核间中断请求覆盖为止。

#### 5.1.1.2 核间异步消息中断

SW421 核心可以在任何模式下对某个核心发异步消息,在系统接口的 IO 空间上,以本核心或其它核心为目标,定义了两个 IOR: MAIL\_BOX\_i 和 MAIL\_STAT\_i(i 为  $0\sim15$ )。当核心 n 想往核心 m 发异步消息时,可通过写 IOR: MAIL\_BOX\_m 发送一个 64 位的消息。

系统接口收到该消息后,先检查指定的目标核心状态,如果可处理中断且中断使能(IOR: INTEN为"1"),系统接口自动向核心 m 发一个核间异步消息中断请求;如果核心睡眠或中断不使能(IOR: INTEN为"0"),则将核间异步消息中断请求缓存在系统接口部件,等核心可以处理中断后再向该核心发中断请求;如果核心断连,则向源核心返回非法地址响应。前两种情况下,如果 IOR: MAIL STAT m[MAIL NUM]指示邮箱不满,则将消息保存。如果 IOR: MAIL STAT m[MAIL NUM]



指示邮箱满,则置 IOR: MAIL STAT m[FULL FLAG[n]]为 1,指示本次消息丢失。

核心 m 收到异步消息中断请求后,内部计数器(CSR: II\_MAIL[MAIL\_NUM])进行加"1"计数,如果 CSR: II\_MAIL[MAIL\_NUM]中的值大于"0",且 CSR:II\_ER[II\_MAIL\_EN]为"1",则申请进入一般中断处理的特权程序入口 0 (INTERRUPT0) 进行处理。在中断处理程序中,通过读 IOR: MAIL\_BOX\_m 获得消息信息;成功读走一个消息后,IOR: MAIL\_STAT\_m[MAIL\_NUM]自动减"1",CSR: II\_MAIL[MAIL\_NUM]也自动减"1"。当 IOR: MAIL\_STAT\_m[MAIL\_NUM]为"0"时,读不成功,返回一个全"0"的消息。

软件必须保证源核心每发一次消息,都要检查 IOR: MAIL\_STAT\_m[FULL\_FLAG[n]]是否为"1",如果为"1",则说明刚发出的消息不成功,需要重发。另外,核心只允许读本核心收到的异步消息,如果读其它核心收到的异步消息将产生错误响应。

#### 5.1.2 核内产生的中断

#### 5.1.2.1 已纠正错中断

SW421 核心对内部存储器中出现的可纠正错实现了一种带预警功能的已纠正错中断,核心设置 CSR: HSERR\_CNT、CSR: HSERR\_TH,记录对 Icache、Dcache、SCache 进行相关操作时产生可纠正错的情况。

当核心中的存储器在指定时间里发生可纠正错的次数超过指定阀值时,置 CSR: HSERR\_CNT[SERR\_OF]为"1",如果 CSR: IER0~3 中对应的已纠正错中断使能,则硬件自动在 CSR: INT\_STAT0~3 中登记,登记的位置由 CSR: INT\_VEC[CR\_VEC]决定,并进入一般中断处理 特权程序入口 1 (INTERRUPT1) 进行处理。当已纠正错中断服务程序处理结束后,软件可通过写 CSR: INT\_CLR0~3 中对应位来清除已纠正错中断,同时通过写 CSR: HSERR\_CNT,清除原来的溢 出标志。核心产生已纠正错的原因有以下几种:

- 1) 指令 Cache 的标记存储器出现偶校验错,此时 CSR: IS\_STAT[TAG\_PAR]为"1";
- 2) 指令 Cache 的数据存储器出现偶校验错,此时 CSR: IS\_STAT[DATA\_PAR]为"1";
- 3) 数据 Cache 的标记存储器出现偶校验错,此时 CSR: DS\_STAT[TAG\_PERR]为"1";
- 4) 处理 Store 指令时,读出的数据 Cache 数据出现 ECC 单错,此时不设置任何 CSR;
- 5) 数据 Cache 被淘汰或置换的数据出现 ECC 单错,此时 CSR:SC STAT[DVIC SERR]为"1";
- 6) 二级 Cache 的标记存储器出现 ECC 单错,此时 CSR: SC STAT[TAG SERR]为"1";
- 7) 二级 Cache 的数据存储器出现 ECC 单错,此时 CSR: SC\_STAT[DAT\_SERR]为"1";
- 8) 指令副本标记存储器出现偶校验错,此时 CSR: SC\_STAT[ICTAG\_PAR]为"1"。



#### 5.1.2.2 机器检查错中断

机器检查错是 C3 核心硬件产生各种控制错的总称,不同的机器检查错对 C3 核心的影响程度也不相同,轻者可恢复系统的运行,重者不可恢复,会导致系统崩溃。机器检查错中断分为精确中断和非精确中断,对应

当出现机器检查错时,硬件自动在相关的 CSR 中记录具体的错误标志,如果 CSR: IER0~3 中对应的机器检查错中断使能,则硬件自动在 CSR: INT\_STAT0~3 中登记机器检查错标志,登记的位置由 CSR: INT\_VEC[MCHK\_VEC]决定,并产生机器检查错中断请求,进入机器检查错中断处理特权程序入口(MCHK)执行。当中断服务程序处理结束时,可通过写 CSR: INT\_CLR0~3 中对应位,清除机器检查错中断。

产生机器检查错的原因有以下几种,可分为精确中断与非精确中断两种:

- 1) 指令部件中的指令重排序缓冲出现头尾指针管理错,此时 CSR: IS\_STAT[ROB\_ERR]为"1"; (非精确中断)
- 2) 指令流访问核外主存时,收到的响应中带控制错标志,此时 CSR: IS\_STAT[ACK\_ERR]为 "1"; (精确中断)
- 3) 指令流访问核外主存时,收到非法地址响应,此时 CSR: IS\_STAT[ADDR\_ERR]为"1";(精确中断)
- 4) 指令流访问核外主存时,收到的响应带 ECC 多错,此时 CSR: IS\_STAT[MEM\_MERR]为"1"; (精确中断)
- 5) 数据流读访问核外主存时,收到的响应中带控制错标志,此时 CSR: DC\_STAT[ACK\_ERR] 为"1": (精确中断)
- 6) 数据 Cache 管理部件处理 Store 指令时,从数据 Cache 中读出的数据出现不能被写数据完全 覆盖的 ECC 多错,此时 CSR: DC\_STAT[DAT\_MERR]为"1";(非精确中断)
- 7) 数据 Cache 管理部件(DBOX)接收到的一致性查询请求与内部保留的状态不一致,此时 CSR: DC\_STAT[PROBE\_ERR]为"1";(非精确中断)
- 8) 数据 Cache 淘汰的数据产生 ECC 多错,此时 CSR: SC\_STAT[DVIC\_MERR]为"1";(非精确中断)
- 9) 二级 Cache 的 STAG 产生 ECC 多错,此时 CSR: SC\_STAT[TAG\_MERR]为"1";(非精确中断)
- 10) 二级 Cache 的数据产生 ECC 多错,此时 CSR: SC\_STAT[DAT\_MERR]为"1";(非精确中断)
- 二级 Cache 从核外收到的二次请求发生偶校验错,此时 CSR: SC\_STAT[SYSREQ\_ERR] 为"1":(非精确中断)
- 12) 二级 Cache 从核外收到的响应包头发生偶校验错,此时 CSR:SC STAT[SYSACK ERR]



为"1";(非精确中断)

- 13) 二级 Cache 管理部件(SBOX)检查到从核外收到的响应或二次请求与内部寄存的状态不一致,此时 CSR: SC\_STAT[CTL\_ERR\_\*](详见 3.5.2 节描述)为"1";(非精确中断)
- 14) 二级 Cache 管理部件(SBOX)查询 STAG 发现状态非法,此时 SC\_STAT[CACHE\_ST\_ERR]为"1";(非精确中断)
- 15) 对 I/O 空间或者共享不可 Cache 执行写访问,或者二级 Cache 淘汰请求收到非法地址响应,此时 CSR: SC\_STAT[WR\_ADDR\_ERR\_\*](详见 3.5.2 节描述)为"1";(非精确中断)
- 16) 对 I/O 空间或者共享不可 Cache 执行写访问,或者二级 Cache 淘汰请求收到的响应带控制错标志,此时 CSR: SC\_STAT[WR\_CTLERR\_\*](详见 3.5.2 节描述)为"1";(非精确中断)
- 对 I/O 空间或者共享不可 Cache 执行写访问,或者二级 Cache 淘汰请求收到的响应带 ECC 多错标志,此时 CSR: SC\_STAT[WR\_ECCERR\_\*](详见 3.5.2 节描述)为"1"。(非精确中断)

#### 5.1.2.3 定时器中断

核心内部设置一个 64 位的计数器,当 CSR: TIMER\_CTL[TIMER\_EN]为"1"时,计数器就从 0 开始,每拍进行加"1"计数,当计数器达到或超过 CSR: TIMER\_TH 指定的初值时,便产生定时器中断,同时将 CSR: TIMER\_CTL[TIMER\_EN]设置为 0。

产生定时器中断时,如果 CSR: IER0~3 中对应的定时器中断使能,则硬件自动在 CSR: INT\_STAT0~3 中登记,登记的位置由 CSR: INT\_VEC[TIMER\_VEC]决定,并进入一般中断处理特权程序入口 1(INTERRUPT1)。当定时器中断服务程序处理结束后,软件可通过写 CSR: INT\_CLR0~3中对应位来清除定时器中断。

当核心处于睡眠状态时,定时器对应的 CSR 和计数器中的值都被清 0,如果需要重新启动定时器,则需要重新设置 TIMER\_CTL[TIMER\_EN]和 CSR: TIMER\_TH。

软件对定时器阈值 CSR: TIMER\_TH 的修改,应该遵循以下原则,即在 TIMER\_CTL[TIMER\_EN] 使能关闭的情况下,修改该阈值,否则可能会产生意想不到的后果。典型的流程如下:关闭使能->修改阈值->打开使能。

#### 5.1.2.4 事件计数中断

SW421 核心设置了两个事件计数中断,用于实现事件计数,具体参看第8章。当硬件对指定模式下的特殊事件进行事件计数并产生溢出时,产生事件计数0中断或事件计数1中断,如果 CSR: IER0~3中对应的事件计数中断使能,则硬件自动在 CSR: INT\_STAT0~3中登记,登记的位置由 CSR:



INT\_VEC[PC0\_VEC]或 CSR: INT\_VEC[PC1\_VEC]决定,并进入一般中断处理特权程序入口 1 (INTERRUPT1)。当事件计数中断服务程序处理结束后,软件可通过写 CSR: INT\_CLR0~3 中对应位来清除事件计数 0 或事件计数 1 中断。

#### 5.1.3 核外产生的中断

由核外定义。

### 5.1.4 特殊中断

#### 5.1.4.1 睡眠中断

睡眠中断是一种特殊中断,目的是为了在核心无工作负载时降低运行功耗。核心只能在非用户模式下向本核心或其它核心发出睡眠中断。维护命令也可以向指定核心发送睡眠中断。

软件可通过写核心 CSR: INT\_VEC[SLEEP\_VEC],指定睡眠中断对应的中断向量号。当软件写 CSR: INT\_REQ 时,如果指定的中断类型为睡眠中断,则源核心向系统接口部件发送一个或多个核 心睡眠中断。当维护接口接到一个对 IOR: MT\_INT 的维护写命令,并且中断类型是睡眠中断时,维护接口也向系统接口发起一个对指定核心的睡眠中断。

系统接口接到一个睡眠中断后,如果指定核心可处理中断状态且中断使能(IOR: INTEN 为"1"),则将睡眠中断发向该核心,否则该中断丢失,并在 IOR: INTLOS 中相应的位置进行登记。

目标核心接到睡眠中断请求后,如果 CSR: IERO~3 中对应的睡眠中断使能,则硬件自动在 CSR: INT\_STATO~3 中登记,登记的位置由 CSR: INT\_VEC[SLEEP\_VEC]决定,并进入睡眠中断处理特权程序入口(SLEEP)进行处理。当睡眠中断服务程序保留完现场后,通过写中断目标核心的 CSR: INT\_CLRO~3 中对应位,硬件将自动清除目标核心的 CSR: INT\_STATO~3 中的对应位。随后写 IOR: INTEN,关闭对该目标核心的中断使能。最后写 IOR: SLEEP\_DONEx,通知维护接口某个核心可以睡眠,以后中断目标核心的时钟被降为最低频率,并一直处于复位状态,不响应睡眠唤醒和复位以外的任何中断。

需要注意的是,SW421 核心可能将不同源核心发向同一个目标核心的睡眠中断合并。另外,硬件保证,当睡眠中断到达目标核心时,如果对应的中断使能没有打开(即 CSR:II\_ER[II\_EN]为"0"),则保留该中断,直到被软件清除为止。

#### 5.1.4.2 睡眠唤醒中断

睡眠唤醒中断是一种特殊中断,使得处于睡眠状态的核心恢复正常运行,核心只能在非用户模



式下发出对其它核心的睡眠唤醒中断,维护命令也可以对指定核心发送睡眠唤醒中断。

当软件写 CSR: INT\_REQ 时,如果指定的中断类型是睡眠唤醒中断,则硬件向系统接口发出一个或多个核心睡眠唤醒中断。系统接口部件收到睡眠唤醒中断后,直接将睡眠唤醒中断发向维护接口部件。

当维护接口收到一个对 IOR: MT\_INT 的维护 I/O 写命令,并且类型是睡眠唤醒中断时,如果该核心处于连接状态(IOR: CORE\_ONLINE 为"1")且已经在睡眠,则直接唤醒指定核心。

维护接口接到唤醒请求时,如果核心没有断开,则先将目标核心的工作时钟恢复,然后置目标核心的复位信号无效,并根据 IOR: INIT\_CTL[HOTRST\_CTL]选择进行存储器自测试的方式,随后让目标核心进入睡眠唤醒中断处理特权程序入口(WAKEUP)执行。目标核心响应睡眠唤醒中断后,在睡眠中断处理程序中,软件通过写 IOR: INTEN,打开该核心的使能位。

对没有睡眠的核心发送睡眠唤醒中断,不产生任何效果。需要注意的是,SW421 核心可能将不同源核心发向同一个目标核心的睡眠唤醒中断合并。

#### 5.1.4.3 复位

复位是一种特殊的中断,包括由引脚信号 DCOK\_H 引起的上电复位和由引脚信号 Reset\_L 引起的冷复位,都是电平触发的中断。当硬件监测到这两个信号有效时,对 SW421 核心进行完全复位。当硬件监测到这两个信号无效时,SW421 核心进入初始化流程,根据配置进行存储器自测试和指令 Cache 加载,最后进入复位特权程序入口(RESET)开始取指令运行。复位相关的处理参看第7章。

# 5.2 中断的优先级

各种中断特权程序的入口地址参看 2.2.2, 中断的优先级从低到高依次如下(当多个中断请求同时发生时,硬件先进入优先级高的中断特权程序入口):

- 1) 一般中断 0, 即核间中断;
- 2) 一般中断 1,包含定时器中断、事件计数中断、已纠正错中断、外部硬件中断;
- 3) 睡眠中断;
- 4) 机器检查错中断;
- 5) 复位和睡眠唤醒中断。

对于一般中断 1, SW421 核心硬件不设置具体的中断优先级,由软件根据需要设置中断优先级。 具体设置方法可通过设置对 CSR: INT\_STAT0~3 的检查顺序和设置 IER0~3 的值来实现。首先写 CSR: IER0~3 开放所有使能的中断,若某中断被响应并进入到中断特权程序入口,则保存当前的中断使能寄存器 CSR: IER0~3,并按定义的优先级从高到低依次查询 CSR: INT\_STAT0~3 中的相应位,若检测到某中断被置位,则不再查询 CSR: INT\_STAT0~3 中较低优先级的中断位,将指令流



转到该中断对应的处理程序。在进入到相应中断的处理程序之前,保留原中断使能寄存器 CSR: IER0~3,修改 IER0~3,关闭与当前处理的中断优先级相同或更低的中断使能,开放比本中断优先级更高的中断。在当前中断处理结束并退出之前,用保存的值恢复中断使能寄存器 CSR: IER0~3。

# 5.3 中断的嵌套

SW421 核心可通过 HM 模式来实现多级中断的嵌套。当核心响应中断请求时,先进入 HM 模式,由于 HM 模式下不响应复位以外的任何中断请求,因此可以确保中断现场不被破坏。软件可先读取当前中断源信息,并将与当前中断同级的中断或比当前中断级别更低的中断屏蔽,然后转入非 HM 模式,执行真正的中断处理程序。在中断处理过程中,允许更高级别的中断中止当前中断的处理,进入更高优先级的中断处理,从而实现中断的嵌套。

中断总是在指令的边界上被识别,且 SW421 核心的核心保证断点之前的指令都无异常完成并退出。当中断请求中断当前程序的处理时,硬件自动将断点处的指令地址保存到 CSR: EXC\_PC 中,以便中断处理结束后能正确返回到断点处继续执行。



# 6 异常

异常是指在指令处理的过程中产生的、与指令流同步的、由程序或软件原因而引起的问题,包括两种类型:

- 1) 故障(Fault):表示指令或指令的操作非法,在指令处理过程中产生,产生故障的指令并未正常退出,而是被中止(Abort);
- 2) 算术自陷(Arithmetic Trap):表示运算类指令在运算时,操作数或运算结果出现异常,产生算术自陷的指令都将处理完毕并正常退出。

SW421 核心为两种异常保留的断点都是精确的,并将发生异常的指令地址记录在 CSR: EXC\_PC中。

## 6.1 DTB 脱靶

当数据流访问 DTB 时,如果即不命中一级 DTB,也不命中二级 DTB,则产生 DTB 脱靶故障,判断 DTB 命中的方法参看 4.4.6。当产生 DTB 二次脱靶时,进入 DTBM\_DOUBLE 特权程序入口。 当发生 DTB 一次脱靶时,如果数据流访问虚地址的[52]位为"0",则进入 DTBM\_SINGLE\_0 特权程序入口,否则进入 DTBM\_SINGLE\_1 特权程序入口。

DTB 一次脱靶故障(DTBM\_SINGLE\_x)的处理一般需要装填 DTB,但首先要分析故障的数据流地址,确定地址指示的存储空间是否允许访问。当发生 DTB 一次脱靶时,硬件自动在 CSR: EXC\_PC 中存放异常指令的 PC 值,在 CSR: DVA 中存放异常指令访问的数据流虚地址,在 CSR: DS\_STAT[OPCODE(5:0)]中存放异常指令的操作码,在 CSR: DS\_STAT[WR]中存放异常指令的写标志,在 CSR: EXC\_SUM[REG(4:0)]中存放异常指令的 Ra 域。软件可通过读 CSR: DVA\_FORM 同时获得虚页表基址和虚页号等信息,提高处理效率。DTB 一次脱靶故障的处理过程中可能会引起 DTB 二次脱靶故障。

DTB 二次脱靶故障(DTBM\_DOUBLE)是在处理 ITB 脱靶或 DTB 一次脱靶时产生,指示需要操作系统按多级页表来获得正确的物理地址页面号,引起这种故障的指令必定是 PRI\_LDx/vpte,此时 CSR: DS\_STAT 和 CSR: DVA 内容维持不变,只在 CSR: EXC\_PC 中存放引起二次脱靶指令的PC 值,在 CSR: EXC\_SUM[REG(4:0)]中该指令的 Ra 域。



## 6.2 ITB 脱靶

当指令流访问 ITB 时,如果不命中 ITB,则产生 ITB 脱靶故障,判断 ITB 命中的方法参看 4.4.5。 当发生 ITB 脱靶时,如果指令流访问虚地址[52]位为"0",则进入 ITBM\_SINGLE\_0 特权程序入口, 否则进入 ITBM SINGLE 1 特权程序入口。

ITB 脱靶故障 (ITBM\_SINGLE\_x) 的处理一般需要装填 ITB, 但首先要分析故障的指令流地址,确定地址指示的存储空间是否允许访问。当发生 ITB 脱靶时,硬件自动在 CSR: EXC\_PC 中记录发生异常指令的 PC 值。

软件可通过读 CSR: IVA\_FORM 同时获得虚页表基址和虚页号等信息,提高处理效率。ITB 脱靶故障的处理过程中,可能会引起 DTB 二次脱靶故障。

## 6.3 浮点屏蔽故障

当核心在 CSR: UPCR[FPE]和 CSR: UPCR[FCE]中任意一位为"0"时执行浮点指令或 SIMD 扩展指令,或者在 CSR: UPCR[SCE]为"0"时执行 SIMD 扩展指令,都将产生浮点屏蔽故障 (FEN)。只有合法且非空指令才会产生浮点屏蔽故障,某些目标寄存器为 F31 的 FLDS 和 FLDD 指令不产生浮点屏蔽故障。当产生浮点屏蔽故障时,硬件自动在 CSR: EXC\_PC 中保存异常指令的 PC 值,在 CSR: IGL\_INST 中记录异常指令的 32 位信息,并进入 FEN 特权程序入口。

# 6.4 不对界故障

SW421 核心对访存类指令进行地址检查时,如果地址不对界,则产生不对界故障(UNALIGN),硬件自动在 CSR: EXC\_PC 中记录异常指令的 PC 值,在 CSR: DVA 中记录有效的数据流访问地址,在 CSR: DS\_STAT[OPCODE(5:0)]中存放异常指令的操作码,在 CSR: DS\_STAT[WR]中存放异常指令的写标志,在 CSR: EXC\_SUM[REG(4:0)]中存放异常指令的 Ra 域,然后进入 UNALIGN 特权程序入口。地址不对界检查的方法参看 4.4.3。

# 6.5 数据流故障

数据流故障(DFAULT)是对访存指令产生的数据流地址进行地址检查或进行虚实地址转换时产生,数据流故障的类型很多,参看 4.4.3、4.4.6、4.5.3。产生数据流故障时,硬件自动在 CSR: EXC\_PC 中记录该访存指令的 PC 值,在 CSR: DVA 中记录有效的数据流访问地址,在 CSR: DS STAT[OPCODE(5:0)]中存放异常指令的操作码,在 CSR: DS STAT[WR]中存放异常指令的写标



志,在 CSR: EXC\_SUM[REG(4:0)]中存放异常指令的 Ra 域,然后进入 DFAULT 特权程序入口。各种数据流故障类型与 CSR: DS\_STAT 中标志位的对应关系如下:

- 1) 数据流虚地址符号扩展错,此时 CSR: DS\_STAT[BAD\_DVA]为"1";
- 2) 数据流地址匹配故障,此时 CSR: DS\_STAT[DA\_MATCH]为"1";
- 3) 数据流数值匹配故障,此时 CSR: DS\_STAT[DV\_MATCH]为"1";
- 4)数据流地址和数值同时匹配故障,此时 CSR: DS\_STAT[DAV\_MATCH]、DS\_STAT[DA\_MATCH]和DS\_STAT[DV\_MATCH]同时为"1";
- 5) DTB 虚实地址转换时发生访问越权故障,此时 CSR: DS\_STAT[ACV0]为"1";
- 6) DTB 虚实地址转换时发生读访问故障,此时 CSR: DS\_STAT[FOR]为"1";
- 7) DTB 虚实地址转换时发生写访问故障,此时 CSR: DS\_STAT[FOW]为"1";
- 8) 读写访问可 Cache 空间时,或读访问不可 Cache 空间时,数据流访问地址超出 SW421 核心 主存容量,或读访问不存在的 IOR,此时 CSR: DS\_STAT[ACV1]为"1";
- 9) SIMD 扩展访存指令、原子操作指令、不可 Cache 访存指令访问 I/O 空间地址,或锁指令访问 I/O 空间或不可 Cache 空间,此时 CSR: DS STAT[ACV1]为"1";
- 10) 数据 Cache 发生 DTAG 偶校验错故障,此时 CSR: DS STAT[TAG PERR]为"1";
- 11) Load 指令访问数据 Cache, 发生数据 ECC 错故障,此时 CSR: DS\_STAT [DAT\_ERR] 为"1";
- 12) 对可 Cache 存储器空间的 Load 类及 Store 类访问,以及对不可 Cache 空间和 I/O 空间的 load 类访问时,返回给的响应中带 ECC 多错,此时 DS STAT[MEM MERR] 为"1"。

# 6.6 指令流故障

指令流故障(IACV)是指令流地址进行地址检查或进行虚实地址转换时产生的,产生指令流故障的类型很多,参看 4.4.3 和 4.4.5。产生指令流故障时,硬件自动在 CSR: EXC\_PC 中记录异常指令的 PC 值,然后进入 IACV 特权程序入口。各种指令流故障类型与 CSR 中登记的信息对应关系如下:

- 1)ITB 虚实地址转换时发生访问越权故障,此时以 CSR: EXC\_SUM[BAD\_IVA、IA\_MATCH、IDA\_MATCH]为全"0"来表示;
- 2) 指令流地址匹配成功,此时 CSR: EXC\_SUM[IA\_MATCH]为"1";
- 3) 跳转目标指令地址发生符号扩展错,此时 CSR: EXC\_SUM[BAD\_IVA]为"1",并在 CSR: IVA 中登记跳转的目标指令地址;
- 4) 整数转移目标指令地址匹配成功,此时 CSR: EXC\_SUM[IDA\_MATCH]为"1",并在 CSR: IVA 中登记跳转的目标指令地址。

当发生指令流地址匹配成功时,硬件自动在CSR: IGL INST 中记录异常指令的32位信息。



## 6.7 操作码非法

指令流水线的译码站台对指令的操作码和功能码进行检查,遇到以下情况时将产生操作码非法 故障 (POCDEC):

- 1) 指令的操作码为保留的操作码;
- 2) 指令的功能码为保留的功能码;
- 3) SYS\_CALL 或者 SYS\_CALL/b 指令的功能码非法,具体检查方法参看 2.2.1;
- 4) 在非 HM 模式下使用了特权指令;
- 5) CSR:CP CTL[EGB]配置为0时,译码出 EVICTDG 指令;
- 6) CSR:CP CTL[ELB]配置为0时,译码出 EVICTDL 和 FLUSHD 指令;
- 7) 在硬件模式下遇到 Halt 指令;
- 8) 在结构手册中已定义, 但在芯片中没有实现的指令:
- 9) 锁指令没有按要求成对出现在指定位置,具体为: 从 Icache 中取出对界的 4 条指令,如果 LSTx 指令不在指令 0 位置(或指令 2 位置),或者指令 1 位置上(或指令 3 位置)不是非 空的 RD\_F 指令,则 LSTx 指令报操作码非法故障;如果指令 1 位置上(或指令 3 位置)是 非空的 RD\_F 指令,但指令 0 位置(或指令 2 位置)上不是 LSTx 指令,或者非空的 RD\_F 指令不在指令 1 位置(或指令 3 位置),则 RD F 指令报操作码非法故障。

当发生操作码非法故障时,硬件自动在 CSR: EXC\_PC 中记录异常指令的 PC 值,在 CSR: IGL\_INST 中记录异常指令的 32 位信息,然后进入 OPCDEC 特权程序入口。当锁指令没有按要求成对出现在指定位置时,硬件自动置 CSR: IGL\_INST[LOCK\_IGL]为"1"。

## 6.8 算术自陷

整数和浮点运算(包括整数和浮点的数据转换)以及原子操作指令在执行过程中,如果产生了异常并且没有被屏蔽,则称之为算术自陷。共有7种算术自陷,其中整数溢出在整数运算和浮点到整数的转换中都可能产生,原子操作溢出只可能在原子操作指令执行时产生,其它5种算术自陷只可能在浮点运算中产生。

发生算术异常时,异常的指令总是可以完成处理并退出,如果对应的自陷使能,则硬件自动在 CSR: EXC\_PC 中存放异常指令的 PC 值,在 CSR: EXC\_SUM[REG(4:0)]中存放异常指令的目标寄存器域,并在 CSR: EXC\_SUM 中登记算术自陷类型,如果 FPCR[EXC\_CTL(1)]为"0",则要设置 CSR: EXC\_SUM[SWC]为"1",然后进入 ARITH 特权程序入口;若对应的自陷不使能则硬件继续执行。

发生浮点算术异常时,无论对应的自陷是否使能,硬件都要自动在 FPCR 中设置该异常对应的



状态信息。

#### 6.8.1 整数溢出

整数溢出(OVI)表示整数运算指令和浮点到整数的转换指令执行过程中,产生的结果超出了目标寄存器的最大表示范围。进入整数溢出算术自陷的情况如下:

- 1) 整数运算指令产生整数溢出且 CSR: ICR[FD]为 "0" 时,需设置 CSR: EXC\_SUM[OVI]为 "1",设置 CSR: EXC\_SUM[INT]为 "1";
- 2) 浮点转换指令产生整数溢出且 FPCR[EXC\_CTL(1:0)]为"00<sub>2</sub>"时,需设置 CSR: EXC\_SUM[OVI]为"1",设置 CSR: EXC\_SUM[INT]为"0";如果 FPCR[INED]为"0",则还要设置 CSR: EXC SUM[INE]为"1";
- 3) 浮点转换指令产生整数溢出且 FPCR[EXC\_CTL(1:0)]为 "01<sub>2</sub>"或 "10<sub>2</sub>"时,需设置 CSR: EXC\_SUM[OVI]为 "1",设置 CSR: EXC\_SUM[INT]为 "0";

当浮点指令发生整数溢出时,无论整数自陷是否屏蔽,都要设置 FPCR[OVI]为"1",设置 FPCR[INE]为"1"。

## 6.8.2 无效操作

执行浮点运算类指令时,如果当前操作的操作数存在非规格化数(Denormal)或对当前的操作而言是无效数据,则可能产生无效操作异常(INV)。产生无效操作算术自陷的各种情况如下:

- 1) FPCR[EXC\_CTL(1)]为"1"时产生无效操作异常,则设置 CSR: EXC\_SUM[INV]为"1";
- 2) FPCR[EXC\_CTL(1)]为"0",操作数含非规格化数(Denormal)且 DNZ 为"0",此时必定产生无效操作异常,设置 CSR: EXC\_SUM[INV]为"1";
- 3) FPCR[EXC\_CTL(1)]为 "0、INVD 为 "0" 且操作数不含非规格化数 (Denormal) 时产生了 无效操作异常,则设置 CSR: EXC\_SUM[INV]为 "1";
- 4) FPCR[EXC\_CTL(1)]为"0"、INVD 为"0"、操作数含非规格化数 (Denormal) 且 DNZ 为"1" 时,如果将 Denormal 数当"0"处理后仍然产生无效操作异常,则设置 CSR: EXC\_SUM[INV] 为"1"。

其中有两种情况被当作 Denormal 自陷,硬件不自动修改 FPCR,其它情况无论无效操作自陷是 否屏蔽都要设置 FPCR[INV]为"1"。作为 Denormal 自陷的情况如下:

- 1) FPCR[EXC\_CTL(1)]为"1" 且操作数含 Denormal 数;
- 2) FPCR[EXC\_CTL(1)]为"0"、操作数含 Denormal 数且 DNZ 为"0"。



#### 6.8.3 下溢

浮点运算指令执行过程中,如果舍入结果的幅值(绝对值)小于目标数据格式的最小有限值,则产生下溢(UNF)。产生下溢算术自陷的各种情况如下:

- 1) FPCR[EXC\_CTL(1:0)]为 "00<sub>2</sub>" 且 FPCR[UNFD]为 "0" 或 FPCR[UNDZ]为 "0" 时产生下溢异常,则设置 CSR: EXC\_SUM[UNF]为 "1";如果 FPCR[INED]为 "0",还要设置 CSR: EXC\_SUM[INE]为 "0";
- 2) FPCR[EXC\_CTL(1:0)]为 "01<sub>2</sub>" 且 FPCR[UNFD]为 "0" 或 FPCR[UNDZ]为 "0" 时产生下 溢异常,则设置 CSR: EXC\_SUM[UNF]为 "1";
- 3) FPCR[EXC\_CTL(1:0)]为"10<sub>2</sub>"时产生下溢异常,则设置 CSR: EXC\_SUM[UNF]为"1"。 无论下溢自陷是否屏蔽,都要设置 FPCR[UNF]为"1",设置 FPCR[INE]为"1"。

#### 6.8.4 上溢

浮点运算指令执行过程中,如果舍入结果的幅值(绝对值)超过目标格式的最大有限值时即产生上溢(OVF)。产生上溢算术自陷的各种情况如下:

- 1) FPCR[EXC\_CTL(1:0)]为 "00<sub>2</sub>" 且 FPCR[OVFD]为 "0" 时产生上溢异常,则设置 CSR: EXC\_SUM[OVF]为 "1";如果 FPCR[INED]为 "0",还要设置 CSR: EXC\_SUM [INED]为 "0":
- 2) FPCR[EXC\_CTL(1:0)]为"01<sub>2</sub>"且 FPCR[OVFD]为"0"时产生上溢异常,则设置 CSR: EXC\_SUM[OVF]为"1";
- 3) FPCR[EXC\_CTL(1:0)]为"10<sub>2</sub>"时产生上溢异常,则设置 CSR: EXC\_SUM[OVF]为"1"。 无论上溢自陷是否屏蔽,都要设置 FPCR[OVF]为"1",设置 FPCR[INE]为"1。

### 6.8.5 除数为零

浮点除法指令的除数为"0",而被除数为有限非"0"数,则产生除数为零异常(DZE)。产生除数为零算术自陷的各种情况如下:

- 1) FPCR[EXC\_CTL(1)]为"1",操作数不含非规格化数(Denormal),如果产生除数为零异常,则设置 CSR: EXC\_SUM[DZE]为"1";
- 2) FPCR[EXC\_CTL(1)]为"0"且 DZED 为"0",操作数不含非规格化数(Denormal),如果产生除数为零异常,则设置 CSR: EXC SUM[DZE]为"1";
- 3) FPCR[EXC\_CTL(1)]为 "0" 且 DZED 为 "0", 操作数含非规格化数 (Denormal) 且 DNZ 为 "1", 如果产生除数为零异常,则设置 CSR: EXC SUM[DZE]为 "1"。



发生非规格化数自陷(Denormal 自陷)时,硬件不自动修改 FPCR,其它情况无论自陷是否屏蔽都要设置 FPCR[DZE]为"1"。

#### 6.8.6 非精确结果

浮点运算指令执行过程中,发生下列任一情况,则产生非精确结果异常(INE):

- 1) 舍入后的结果与舍入前的真值不一致;
- 2) 发生整数溢出或舍入时产生上溢(不论上溢自陷是否屏蔽);
- 3) 舍入时产生下溢(不论下溢自陷是否屏蔽)。

舍入后的结果仍将保留到目标寄存器中。如果  $FPCR[EXC\_CTL(1:0)]$ 为 " $00_2$ ",且 FPCR[INED]为"0",则进入算术自陷,并设置  $CSR: EXC\_SUM[INE]$ 为"1"。无论自陷是否屏蔽,都要设置 FPCR[INE]为"1"。

## 6.8.7 原子操作溢出

非特权原子操作指令在执行过程中,运算结果超出了目标寄存器的最大表示范围,则产生原子操作溢出(INCO),如果 CSR: ICR[FD]为"0"且 CSR: DC\_CTL[ATOP\_OVF\_EN]为"1",则产生算术自陷,设置 CSR: EXC\_SUM[INCO]为"1"。



# 7 复位和初始化

# 7.1 复位的种类

SW421 核心支持多种复位,包括上电复位、冷复位和睡眠复位(或称为核心复位),不同的复位由不同的事件引起,SW421 核心内部的操作也不完全相同,但复位结束后都从复位的特权程序入口开始取指令运行。下表错误!未找到引用源。列出各种不同复位的主要差别。

表 7-1 各种复位的差别

|                   | 仪 / "1 宣作发展的是别 |              |                                     |  |
|-------------------|----------------|--------------|-------------------------------------|--|
| 复位类型              | 上电复位           | 冷复位          | 睡眠与唤醒                               |  |
| Ah 4P 吉 /H        | 外部触发           | 外部触发         | 开始复位: 写睡眠寄存器                        |  |
| 触发事件              | DCOK_H 信号无效    | Reset_L 信号有效 | 结束复位: 写睡眠唤醒寄存器                      |  |
| 范围                | SW421 核心       | SW421 核心     | 指定核心                                |  |
| 锁相环 PLL<br>时钟频率   | 上升             | 先下降,再上升      | 指定核心的时钟降频为维护时钟的8分频,核心唤醒后恢<br>复为正常频率 |  |
| BISR 自修复          | 根据配置           | 根据配置         | 根据配置                                |  |
| 777 4 MILL D      | 可选择其中一种        | 可选择其中一种      | 可选择其中一种                             |  |
| BIST 自测试          | 运行             | 运行           | 运行                                  |  |
| 指令 Cache<br>加载    | 加载初始化程序        | 加载初始化程序      | 不加载                                 |  |
| CSR:<br>PRI_BASE  | 清 "0"          | 清 "0"        | 保持不变                                |  |
| CSR:<br>EXC_PC    | 不变             | 不变           | 睡眠中断断点的 PC 值                        |  |
| CSR: INT_STAT0~ 3 | 清 "0"          | 清 "0"        | 保持不变                                |  |
| CSR: INT_VEC      | 设置初值           | 设置初值         | 保持不变                                |  |
| CSR: II0          | 清 "0"          | 清 "0"        | 保持不变                                |  |



| CSR: II1  | 清 "0"            | 清 "0"        | 保持不变    |
|-----------|------------------|--------------|---------|
| CSR:      | 清 "0"            | 清 "0"        | 保持不变    |
| II_MAIL   | <b>刊</b> 0       | <b>村</b> 0   | M1寸/1/又 |
| CSR:      | M III V o Transi | )            | /t_  -t |
| ISSUE_CTL | 设置为 0xF,FFFF     | 设置为 0xF,FFFF | 保持不变    |
| 复位后       | 手が川四             | 不变           | 不变      |
| 工作频率      | 重新设置             |              |         |

## 7.2 上电复位

上电复位从系统对 SW421 核心加电开始,并维持引脚信号 DCOK\_H 无效和 Reset\_L 有效,使 SW421 核心内部的所有状态被清除。待电源稳定、输入给 SW421 核心的时钟就绪之后,系统使 DCOK\_H 有效,SW421 核心内部的 PLL 开始升频。当 PLL 达到配置频率、处于稳定工作状态后,系统使 Reset\_L 无效,结束上电复位。复位结束后,等待系统通过维护接口配置 SW421 核心内部的 相关寄存器,并根据配置对内部存储器进行自修复(BISR)、自测试(BIST)或初始化(BISI),再根据配置将初始化程序加载到各核心的指令 Cache 或 SW421 核心控制的存储器中,最后启动各核心开始运行。

初始化程序主要包含以下内容:

- 1) 初始化 31 个整数寄存器、31 个浮点寄存器和 31 个向量寄存器;
- 2) 初始化核心内的控制与状态寄存器 (CSR);
- 3) 读 DDR3 存储器接口相关的 I/O 寄存器,判断是否需要通过软件进行 DDR3 存储器接口的数据训练(Data Training)来设置各类接口参数。如果需要进行数据训练,则选择一个核心进行数据训练,其它核心等待数据训练完成;
- 4) 所有核心参与进行存储器测试;
- 5) 存储器测试完成后,将全部存储器空间清"0",读取存储器中的标志确定进一步操作。

系统维护将操作系统需要的文件加载到 SW421 核心控制的存储器中,并在存储器中设置必要的标志,通知所有核心跳转到特权程序入口(RESET)开始取指令运行。

## 7.3 冷复位

冷复位是在DCOK\_H信号维持有效的前提下,由信号Reset\_L来实现的。Reset\_L有效,使SW421核心进入冷复位,清除内部状态,复位期间,不影响内部PLL的正常工作。Reset\_L无效后,结束冷复位,此后的处理与上电复位相同。



# 7.4 睡眠复位

睡眠复位是一种由 SW421 核心自身或外部其它核心触发的复位形式,可使核心经过睡眠复位进入睡眠状态,核心时钟可以降到很低的频率,从而降低核心的运行功耗。睡眠的核心被唤醒后,又自动返回到正常工作状态。进入睡眠状态和从睡眠状态唤醒,都需要操作系统和 SW421 核心外部系统的支持。

### 7.4.1 睡眠流程

SW421 核心接收到睡眠中断请求后,进入睡眠中断服务程序,开始核心睡眠前的准备工作,具体操作流程如下:

- 1) 操作系统根据需要,进行现场保留,保留的内容包括:
  - a. 将所有必要的 CSR 寄存器内容保存到主存;
  - b. 将所有整数与浮点寄存器内容保存到主存;
  - c. 将其它必要的信息保存到主存;
  - d. 刷新所有 Cache (包括指令 Cache、数据 Cache 和二级 Cache)。
- 2) 写 IOR: CPM\_CoreSleep(软件可以写任意值,硬件遇到此 IOR 的写请求时总是写入"1", 并在核心被唤醒时隐式清"0"),通知核外禁止向即将进入睡眠状态的核心发送查询请求;
- 3) 查询 IOR: CPM\_ProbeOK 是否为"1",确认先前发向对该核心的查询请求均已返回回答;
- 4) 最后写: SLEEP\_DONEx 为"1",表示对应核心可以进入睡眠模式。写该寄存器之前要保证 IRU 的 Lock 寄存器一定为零。
- 5)维护接口启动该核心进入睡眠状态并使其处于复位状态,且工作时钟频率降为最低频率。

#### 7.4.2 唤醒流程

SW421 核心的核心从睡眠状态唤醒的方式有以下几种:

- 1) 处于非睡眠状态的核心通过写 CSR: INT\_REQ, 且指定[IntType]为 3,即可向指定核心发送 睡眠唤醒中断请求:
- 2) 外部系统通过维护接口向指定核心发维护睡眠唤醒中断命令。

核心睡眠唤醒流程如下:

1) 睡眠唤醒中断由 SW421 核心内部的维护接口统一处理。维护接口接收到唤醒中断请求后, 检查中断的目标核心是否处于睡眠状态,如果是且处于非断连状态,则启动唤醒流程,将 睡眠核心的时钟恢复到正常工作状态;



- 2)被唤醒的核心结束复位状态,根据 IOR: INIT\_CTL[HOTRST\_CTL]可选择进行内部初始化 (BISI)或自修复(BISR),清除有关状态和各 Cache 内容,然后从睡眠唤醒的特权程序入口(由于睡眠复位不清除 CSR: PRI\_BASE 内容,可以与上电复位和冷复位区分开来)处取指令执行;
- 3) 复位的特权程序读取保存在主存中的现场信息,恢复 CSR、整数和浮点寄存器及其它现场信息,然后返回进入睡眠前的状态。

睡眠唤醒过程中对指令 Cache 进行了初始化处理,也没有向指令 Cache 加载初始化程序,因此会从主存直接取指执行。

# 7.5 复位后的 CSR

SW421 核心在复位时,大多数 CSR 内容没有进行初始化,保留复位前的状态,由复位的特权程序进行必要的处理,还有一部分则由硬件自动进行复位初始化。有些 CSR 的复位与具体的复位类型有关。三种复位对 CSR 初始设置相同的情况如下:

- 1) 指令部件中的 CSR:
  - a. CSR: IS\_CTL, 复位时置为"0x10088";
  - b. CSR: VPCR, 复位时置为全"0";
  - c. CSR: UPCR, 复位时置为"0x07":
  - d. CSR: IA\_MATCH, 复位时置为全"0";
  - e. CSR: IA\_MASK, 复位时置为 "0x7FFF,FFFF,FFFF,FFFF";
  - f. CSR: HSERR\_CNT, 复位时置为全"0";
  - g. CSR: HSERR\_TH, 复位时置为"0x1F";
  - h. CSR: IGL\_INST, 复位时置为全"0";
  - i. CSR: SOFT\_ERR, 复位时置为全"0";
  - j. CSR: TIMER\_CTL, 复位时置为全"0";
  - k. CSR: TIMER\_TH, 复位时置为全"0";
- 2) 数据 Cache 管理部件中的 CSR:
  - a. CSR: DS CTL, 复位时置为全"0";
  - b. CSR: DC\_CTL, 复位时置为 "0x9456,0000,0000,000F";
  - c. CSR: DA MATCH, 复位时置为全"0";
  - d. CSR: DA MASK, 复位时置为"0x1F,FFFF,FFFF,FFFF,";
  - e. CSR: DA\_MASK\_MODE, 复位时置为 "0x1F,FFFF,FFFF,FFFF";
  - f. CSR: DV MATCH, 复位时置为全"0";
  - g. CSR: DV MASK, 复位时置为全"1"。



- 3) 二级 Cache 管理部件中的 CSR:
  - a. CSR: SC\_CTL, 复位时置为 "0x10,00FF";
  - b. CSR: INT\_REQ, 复位时置为全"0";
  - c. CSR: CP CTL, 复位时置为"0x1C";
  - d. CSR: MERGE\_OVTIME, 复位时置为"0x100"。
- 4) 整数部件中的 CSR:
  - a. CSR: ICR, 复位时置为"0";
  - b. CSR: IDA\_MATCH, 复位时置为全"0";
  - c. CSR: IDA\_MASK, 复位时置为 "0x1F,FFFF,FFFF,FFFF";
  - d. CSR: TC, 复位时置为全"0";
  - e. CSR: TC\_CTL, 复位时置为"0"。

需要软件在复位的特权程序中进行初始化的 CSR 如下:

- 1)需要进行设置的 CSR 寄存器有: ITB\_IA、VPT\_BASE、IER0~3、II\_ER、DTB\_IA、DTB\_PCR、CID[63:8];
- 2) 需要清除的 CSR 寄存器有: IS\_STAT、PC0\_CR、PC1\_CR、DS\_STAT、DC\_STAT、SC\_STAT。



# 8 事件计数

事件计数是对程序运行过程中发生的特定事件进行统计,给用户提供程序运行信息,以达到调试、修改、优化程序,提高程序执行效率的目的。

SW421 核心设置 2 个事件计数器,在相关 CSR 的控制下,实现对 SW421 核心内部各种事件的 计数, 计数器溢出可产生事件计数中断。计数器的初值、计数使能控制、计数的事件选择都通过 CSR 来控制。系统通过事件计数中断服务程序,实现事件计数功能。

## 8.1 事件计数相关 CSR

下表是与事件计数相关的 CSR。

| 序号 | 名称          | 相关的域         | 含义              |
|----|-------------|--------------|-----------------|
| 1  | IER0∼3      | PCEN[1:0]    | 事件计数中断使能        |
| 2  | INT_STAT0~3 | PC[1:0]      | 事件计数中断请求        |
|    |             | PC_CM[1:0]   | 指定进行事件计数的处理器模式  |
|    |             | CM_PCE       | 在指定处理器模式下事件计数使能 |
| 3  | IS_CTL      | AM_PCE       | 在任何处理器模式下事件计数使能 |
|    |             | PC0_EN       | 事件计数器 0 使能      |
|    |             | PC1_EN       | 事件计数器 1 使能      |
|    |             | PC0_SEL[3:0] | 选择事件计数器 0 的计数事件 |
| 4  | PC0_CR      | PC0[57:0]    | 事件计数器 0,可设置初值   |
|    |             | PC1_SEL[5:0] | 选择事件计数器 1 的计数事件 |
| 5  | PC1_CR      | PC1[57:0]    | 事件计数器 1,可设置初值   |

表 8-1 与事件计数相关的 CSR

# 8.2 事件计数的模式

事件计数分成 2 类,一是所有处理器模式下的事件计数,即在任何模式下都对所选事件进行计数;二是指定处理器模式下的事件计数,即在指定处理器模式下对所选事件进行计数。两者的控制有所不同,前者的事件计数使能由 CSR: IS\_CTL[AM\_PCE]决定,后者则由 CSR: IS\_CTL[CM\_PCE]



决定。一般两类事件计数只允许一种事件计数使能,否则事件计数的结果不能正确反映程序运行的情况。

SW421 核心设置了两个事件计数器 (PC0 和 PC1),分别受各自的使能信号控制,可以单独计数,也可以同时计数。

当事件计数使能(即 IS\_CTL[PC0\_EN]或 IS\_CTL[PC1\_EN]有效,且 IS\_CTL[CM\_PCE]或 IS\_CTL[AM\_PCE]有效)时,事件计数器 0 或 1 即对所选择的事件进行计数。计数器的初值可通过 写 PC0\_CR 和 PC1\_CR 进行设置。当某事件计数器计数溢出时,若事件计数中断使能(即 CSR: IER0~3[PCEN(1:0)]有效),则中断摘要寄存器 INT\_STAT0~3 [PC(1:0)]的对应位为"1",触发对应的事件计数中断。事件计数器在溢出之后将从零开始继续计数,需要事件计数中断服务程序重新设置初值。计数器的具体数值可在中断服务程序中通过读 CSR: PC0 CR 和 PC1 CR 来获得。

事件计数器 0 的计数事件由 CSR: PC0 CR[PC0 SEL(3:0)]决定,具体定义如表 8-2。

事件计数器 0 的计数事件 PC0\_SEL[3:0] 完成处理并退出的指令计数(不包含空指令和 MEMB 指令)。 0x0完成处理并退出的访存指令计数(含EVICTDx、FETCHDx、FLUSHD等指令)。 0x1完成处理并退出的读访存指令计数(含 FETCHD 和 FETCHD\_E 指令)。 0x20x3执行站台执行的转移指令计数。 执行站台执行的条件转移指令计数。 0x40x5 执行站台执行的无条件转移指令计数。 执行站台执行的 CALL 和 JSR 指令计数。 0x6 0x7执行站台执行的 RET 指令计数。 处理器周期计数。 0x8 0x9ITB 访问次数计数。 DTB 访问次数计数。 0xA指令 Cache 读访问次数计数。 0xB0xC数据 Cache 读访问次数计数。 二级 Cache 访问次数计数(仅指指令流和数据流请求读 STAG 的次数)。 0xD主存访问次数计数(只包含指令流和数据流读主存的次数)。 0xECache 一致性请求次数计数(只包含多 Cache 一致性处理产生的请求)。 0xF

表 8-2 事件计数器 0 的计数事件

事件计数器 1 的计数事件由 CSR: PC1\_CR[PC1\_SEL(4:0)]决定,具体定义如表 8-3。

表 8-3 事件计数器 1 的计数事件

|              | No s fill will all was in        |
|--------------|----------------------------------|
| PC1_SEL[5:0] | 事件计数器 1 计数事件                     |
| 0x0          | 指令流水线空周期计数(流水线空含义是指令译码、寄存器重命名、发射 |



|      | 中                                             |
|------|-----------------------------------------------|
|      | 和退出站台都为空)。                                    |
| 0x1  | 重命名站台因整数重命名寄存器不足引起指令流水线停顿周期计数。                |
| 0x2  | 重命名站台因浮点重命名寄存器不足引起指令流水线停顿周期计数。                |
| 0x3  | 重命名站台因整数等待队列(IWQ)满引起指令流水线停顿周期计数。              |
| 0x4  | 重命名站台因浮点等待队列(FWQ)满引起指令流水线停顿周期计数。              |
| 0x5  | 重命名站台因重排序缓冲(ROB)满引起指令流水线停顿周期计数。               |
| 0x6  | 发射站台因装入队列(LQ)满引起指令发射停顿周期计数。                   |
| 0x7  | 发射站台因存储队列(SQ)满引起指令发射停顿周期计数。                   |
| 0x8  | 发射站台空的周期计数。                                   |
| 0x9  | 整数指令发射队列 IQO 有阻塞情况的周期计数。                      |
| 0xA  | ROB 头部为访存类指令,且无法退出的周期计数。                      |
| 0xB  | 执行站台判断出所有转移指令预测失败的次数。                         |
| 0xC  | 执行站台判断出条件转移指令预测失败的次数。                         |
| 0xD  | 执行站台判断出无条件转移指令预测失败的次数。                        |
| 0xE  | 执行站台判断出 CALL、JMP 指令预测失败的次数。                   |
| 0xF  | 执行站台判断出 RET 指令预测失败的次数。                        |
| 0x10 | 二级 Cache 脱靶次数计数,仅指指令流和数据流读 STAG 发生 Miss 的次数。  |
| 0x11 | 二级 Cache 管理部件记录访存请求直接命中存储器页次数计数,根据存储          |
|      | 控制器的响应 ReadDataDirty 和 ReadData 携带的信息计数。      |
| 0x12 | 二级 Cache 管理部件记录访存请求命中存储器页次数计数,根据存储控制          |
|      | 器的响应 ReadDataDirty 和 ReadData 携带的信息计数。        |
| 0x13 | 二级 Cache 管理部件记录访存请求不命中存储器页次数计数,根据存储控          |
|      | 制器的响应 ReadDataDirty 和 ReadData 携带的信息计数。       |
| 0x14 | Cache 一致性请求命中二级 Cache 次数(包括命中回写缓冲), 仅指多 Cache |
|      | 一致性处理产生的一致性请求。                                |
| 0x15 | BPU 误预测次数,即二级预测修复一级预测的次数。                     |
| 0x16 | 指令 Cache 读访问脱靶次数计数(即不命中 Icache,也不命中 Icache 装填 |
|      | 缓冲)。                                          |
| 0x17 | ITB 脱靶次数计数。                                   |
| 0x18 | L1DTB Miss, L2DTB 命中或 L2DTB 小页偶校验错的计数         |
| 0x19 | 保留                                            |
| 0x1A | 同站台旁路冲突计数                                     |
| 0x1B | MAF 满冲突计数                                     |
|      |                                               |



|      | 中威 421 处连箱扒什按口寸加                 |  |
|------|----------------------------------|--|
| 0x1C | 同站台索引冲突计数                        |  |
| 0x1D | Dcache 端口 0 冲突计数                 |  |
| 0x1E | Dcache 端口 1 冲突计数                 |  |
| 0x1F | 写寄存器端口冲突计数                       |  |
| 0x25 | 访存请求从其它核心的 Cache 读取数据的次数计数。      |  |
| 0x26 | 整数指令发射队列 IQ1 有阻塞情况的周期计数。         |  |
| 0x27 | 整数指令发射队列 IQ2 有阻塞情况的周期计数。         |  |
| 0x28 | 访存指令地址发射队列 AQ0 有阻塞情况的周期计数。       |  |
| 0x29 | 访存指令地址发射队列 AQ1 有阻塞情况的周期计数。       |  |
| 0x2a | 整数存储指令数据发射队列 ISQ 有阻塞情况的周期计数。     |  |
| 0x2b | 浮点存储指令数据指令发射队列 FSQ 有阻塞情况的周期计数。   |  |
| 0x2c | 浮点指令发射队列 FQ0 有阻塞情况的周期计数。         |  |
| 0x2d | 浮点指令发射队列 FQ1 有阻塞情况的周期计数。         |  |
| 0x2e | 重命名站台因访存等待队列(AWQ)满引起指令流水线停顿周期计数。 |  |
| 0x30 | DTB SingleMiss 计数                |  |
| 0x31 | DTB Double Miss 计数               |  |
| 0x32 | Dcache Miss 计数                   |  |
| 0x33 | Load-Load 乱序自陷计数                 |  |
| 0x34 | Load_Store 乱序自陷计数                |  |
| 0x35 | 保留                               |  |
| 0x36 | 总的自陷计数                           |  |
| 0x37 | 不含预取请求的访存指令发生 CacheMiss 的计数      |  |
| 其它   | 保留。                              |  |

选择处理器周期计数时,每个时钟周期计数器都"+1",选择其它周期计数时,指定的计数条件成立时,每个时钟周期计数器"+1"。选择次数计数时,指定的事件每发生一次,计数器"+1",需注意有些事件在一个周期里可能发生多次。

# 8.3 事件计数的流程

事件计数的一般流程如下:

1)配置相关的 CSR, 先通过写 CSR: PC0\_CR[PC0\_SEL]与 CSR: PC1\_CR[PC1\_SEL]选择事件 计数事件,写 CSR: PC0\_CR[PC0]与 CSR: PC1\_CR[PC0]设置事件计数器的初值,然后写 CSR: IS\_CTL[PC0\_EN]或 CSR: IS\_CTL[PC1\_EN]指定事件计数中断 0 或 1 使能,再写 CSR:



IS\_CTL[CM\_PCE]和 CSR: IS\_CTL[PC\_CM], 或只写 CSR: IS\_CTL[AM\_PCE]指定事件计数事件所在模式,最后写 CSR: IER0~3[PCEN],打开事件计数中断使能(注意:如果希望准确计数,则需要先将 CSR: IS\_CTL[PC0\_EN]或 CSR: IS\_CTL[PC1\_EN]关闭,配置好 CSR: C0 CR 和 CSR:PC1 CR 后再将计数使能打开);

- 2) 计数器计数:事件计数使能打开后,硬件就会根据相应 CSR 选择的计数事件,每发生一次对应事件, CSR: PC0\_CR[PC0]或 CSR: PC1\_CR[PC1] "+1";
- 3) 计数器溢出: 当 PC0\_CR 或 PC1\_CR 中的计数器溢出时,若事件计数中断使能,则产生事件计数中断请求,硬件置 INT\_STAT0~3 中 PC[1:0]对应位有效;
- 4) 硬件中断:核心响应事件计数中断,进入中断特权处理程序;
- 5) 中断处理: 事件计数器溢出后从 0 开始重新计数,中断服务程序需要重新设置事件计数器的初值,为以后的计数作准备。
- 一些常用的事件计数内容和对应的事件计数事件的选择方法详见附录 B。



# 9 功耗管理

SW421 核心提供的功耗管理机制,支持多种低功耗运行模式,软件可以根据当前程序的运行情况,执行某些特殊操作,协助硬件进入不同层次的低功耗运行模式。

# 9.1 核心深睡眠

当 SW421 核心没有可执行的任务时,可向该核心发送睡眠中断请求,使它进入深睡眠状态。睡眠的核心将不再运行任何程序,处于睡眠复位状态,并大幅度降低工作时钟频率,从而大大降低其运行功耗。当需要 SW421 核心恢复运行时,处于非睡眠状态的其他核心可向睡眠核心发送睡眠唤醒中断请求,或者外部系统通过维护接口向 SW421 核心发送唤醒请求,来启动指定核心恢复正常运行。

# 9.2 核心浅睡眠

在非 HM 模式下,核心执行停机指令(HALT),指令流水线将停止取指,此时该核心处于一种 浅睡眠状态,即不执行任何指令,也不访问核心内所有 Cache 和存储器,但仍然支持 Cache 一致性 操作,寄存器和 Cache 中的数据不会丢失。虽然浅睡眠状态时钟仍然运行在高频率状态,但配合硬 件实现的门控时钟技术,仍然可大大降低停机期间的核心运行功耗。通过任何未屏蔽的中断可将处 于浅睡眠状态的核心唤醒,恢复正常运行。

# 9.3 关闭浮点部件时钟

当软件判断出 SW421 核心上执行的程序中不出现扩展指令时,可通过写 CSR: UPCR[SCE]为 "0",强制关闭浮点部件中从流水线的时钟,从而降低核心运行功耗。

当软件判断出 SW421 核心上执行的程序中不出现扩展指令和浮点指令,可通过写 CSR: UPCR[FCE]为 "0",强制关闭整个浮点部件的时钟,从而降低核心运行功耗。

## 9.4 动态功耗调整

当软件判断出可以降低 SW421 核心上程序执行的速度时,可通过写 CSR: ISSUE\_CTL 寄存器,



降低当前核心发射指令的速度,从而减少整个核心的信号翻转率,配合硬件上实现的门控时钟技术,降低核心运行功耗。

SW421 核心支持基于指令流的调试,也支持基于数据流的调试。



# 10 调试支持

# 10.1 指令流调试支持

# 10.1.1 SYS\_CALL 和 SYS\_CALL/b 指令

SYS\_CALL 和 SYS\_CALL/b 指令的区别在于,前者不会中断指令流水线,而后者会中断指令流水线、并且在 ROB 空之后才会根据 SYS\_CALL/b 所指示的地址重新取指。软件在使用时,可以根据不同的需要,灵活使用 SYS\_CALL 或者 SYS\_CALL/b。下面仅以 SYS\_CALL 为例,说明这一类指令在调试中的作用。

SYS\_CALL 指令根据不同的功能码,可以分解为多种不同功能的指令,具体 SYS\_CALL 指令功能与软件特别是操作系统相关,但一般都有两个基本的非特权 SYS\_CALL 指令用于指令流的调试,分别是断点自陷 SYS CALL 和单步自陷 SYS CALL。

断点自陷 SYS\_CALL 功能是中止当前指令流处理,并将核心的控制权交给操作系统。使用时,在程序中需要设置断点的位置,用这条 SYS\_CALL 指令代替原有指令,并将原有指令保存起来。程序运行时,当指令流到达断点自陷 SYS\_CALL 指令时,将自陷到硬件模式(HM),通过 CSR: EXC\_PC 获得断点处的虚地址,保存此虚地址,并将此虚地址处的指令恢复为原有的指令,再转移到操作系统运行环境,进行进一步处理,从而实现指令流的断点调试。

单步自陷 SYS\_CALL 类似于断点自陷 SYS\_CALL 指令,不同在于单步自陷 SYS\_CALL 能自动设置下一个断点,该断点位置为当前断点指令执行后,将要执行的下一条指令(不一定是程序顺序的下一条指令,因为存在转移等改变程序运行轨迹的指令),从而实现指令一条一条依次单步执行。

## 10.1.2指令流地址匹配

指令流调试时,可能需要确定指令流是否会执行到某个虚地址或某段虚地址范围,此时可通过 CSR: IA\_MATCH 和 CSR: IA\_MASK 来匹配这个指令流地址或地址范围。CSR: IA\_MATCH 作为 指令流地址匹配寄存器,存放需要跟踪的处理器模式、指令流虚地址、虚拟机号和用户进程号,CSR: IA\_MASK 作为指令流地址匹配的屏蔽寄存器,可以实现模糊跟踪(只匹配部分虚地址信息)。当指令流虚地址及其相关信息和受 CSR: IA\_MASK 屏蔽后 CSR: IA\_MATCH 的内容匹配时,产生指令流故障。在相应的特权处理程序中,如果 CSR: EXC\_SUM[IA\_MATCH]为"1",则表示指令流地址



匹配成功,此时 CSR: EXC PC 存放的是匹配的指令流虚地址(也是被调试程序的断点虚地址)。

### 10.1.3指令流跳转目标地址匹配

指令流调试时,可能需要确定是哪条指令引起指令流跳转到某个目标虚地址或某段虚地址范围,此时可通过 CSR: IDA\_MATCH 和 CSR: IDA\_MASK 来匹配这个指令流的跳转目标地址或地址范围。CSR: IDA\_MATCH 作为指令流目标地址匹配寄存器,存放需要跟踪的处理器模式和指令流虚地址,CSR: IDA\_MASK 作为指令流目标地址匹配的屏蔽寄存器,可以实现模糊跟踪(只匹配部分虚地址信息)。当整数转移目标指令地址及其转移目标的处理器模式和受 CSR: IDA\_MASK 屏蔽后CSR: IDA\_MATCH 的内容匹配时,产生指令流故障。在相应的特权处理程序中,如果 CSR: EXC\_SUM[IDA\_MATCH]为"1",则表示指令流跳转目标地址匹配成功,此时 CSR: EXC\_PC 存放的是跳转指令的 PC 值,CSR: IVA 中存放的是这个跳转目标的虚地址。

# 10.2 数据流调试支持

SW421 核心支持数据流调试,但需要特权程序和操作系统环境的支持。

## 10.2.1 数据流地址匹配

SW421 核心提供数据流地址相等或不等匹配 DA\_MATCH 功能。SW421 核心设置了 CSR: DA\_MATCH 作为数据流地址匹配寄存器,CSR: DA\_MASK 作为地址匹配的屏蔽寄存器,当数据流地址满足这两个 CSR 确定的匹配要求时,产生数据流故障,进入相应的特权程序。相关流程如下:

- 1)设置 CSR: DA\_MATCH,最小地址比较的粒度为字节,有效的物理地址为 PA[47:0]位,有效的虚地址为 VA[52:0]位;
- 2) 设置 CSR: DA\_MASK,确定参与匹配比较的地址位,可以用于扩大地址比较的粒度(将屏蔽位的低位设置为"0")或实现部分地址位的比较(将不比较的地址位对应的屏蔽位设置为"0");
- 3) 设置 CSR: DA MATCH MODE, 确定数据流地址匹配模式;
- 4)核心对访存指令的数据流地址进行匹配判断,当数据流地址和受 CSR: DA\_MASK 屏蔽后 CSR: DA\_MATCH 的内容匹配或不匹配时(根据 CSR: DA\_MATCH\_MODE 确定),在相 关 CSR 中登记相关信息,作为数据流故障,进入特权处理程序;
- 5) 登记 CSR: DS\_STAT[DA\_MATCH]为"1", CSR: DVA 中存放匹配的数据流虚地址, CSR: EXC\_PC 中存放产生该数据流虚地址的访存指令 PC 值, CSR: EXC\_SUM[REG(4:0)]中存放 该指令的寄存器 Ra 域, CSR: DS\_STAT[OPCODE(5:0)]中存放该指令的操作码, CSR:



DS STAT[WR]指示该指令是读还是写访问;

6) 进入特权处理程序后,特权处理程序首先排除不是虚地址符号扩展错、访问越权、读访问 故障和写访问故障后,再进入数据流地址匹配的处理。

通过这种方式,在操作系统的支持下,可实现对数据流地址的跟踪,既可全地址跟踪,也可部分地址跟踪;既可物理地址跟踪,也可实现虚地址跟踪。需要注意以下问题:

- 1) 对于 PRI\_LDx/p、PRI\_LDx\_INC/p、PRI\_LDx\_DEC/p、PRI\_LDx\_SET/p 和 PRI\_STx/p 指令 产生的数据流地址直接当作物理地址,不进行 DTB 转换,因此只能进行物理地址匹配;
- 2) VM 模式下,数据流虚地址[52]位为"0"时,作为超页地址,既可进行物理地址匹配,也可进行虚地址匹配;
- 3) 除上述情况之外,将访存指令产生的数据流虚地址经过 DTB 转换后的地址作为数据流物理地址。

#### 10.2.2数据流数值匹配

SW421 核心提供数据流数值相等匹配 DV\_MATCH 功能,支持 8B 及以下任意宽度、连续或者不连续位的数值匹配功能,支持相等匹配,支持包括锁写指令在内的 Store 类指令的匹配,但不含原子操作指令,不含预取指令,也不支持 Load 类指令的数值匹配。SW421 核心设置了 CSR: DV\_MATCH作为数据流数值匹配寄存器, CSR: DV\_MASK 作为数值匹配的屏蔽寄存器,当数据流地址满足这两个 CSR 确定的匹配要求时,产生数据流故障,进入相应的特权程序。相关流程如下:

- 1) 设置 CSR: DV\_MATCH,确定数值相等比较的数据模板;
- 2) 设置 CSR: DV MASK,确定数值匹配屏蔽位;
- 3) 设置 CSR: DC CTLIDV MATCH ENI为"1":
- 4) 核心对访存指令的 Store 类指令的数值进行匹配判断,若匹配发生,在相关 CSR 中登记相 关信息,作为数据流故障,进入特权处理程序;
- 5)登记 CSR: DS\_STAT[DV\_MATCH]为"1",当 DC\_CTL[DAV\_MATCH\_EN]为"0"时且没有发生数据流地址匹配时,登记 CSR: DVA 中存放匹配的数据流物理地址,CSR: EXC\_PC中存放产生该数据流虚地址的访存指令 PC 值,CSR: EXC\_SUM[REG(4:0)]中存放该指令的寄存器 Ra 域,CSR: DS\_STAT[OPCODE(5:0)]中存放该指令的操作码,CSR: DS\_STAT[WR]指示该指令是写访问;
- 6) 进入特权处理程序后,特权处理程序首先排除不是虚地址符号扩展错、访问越权、读访问 故障和写访问故障后,再进入数据流数值匹配的处理。
- 7)需注意当 Store 类指令在存储空间上对应的有效数据段包含 CSR: DV\_MASK 定义的数据段时才能匹配上。如下图所示,着色部分表示有效的匹配数据部分。





图 10-1 匹配情况示例

#### 10.2.3 数据流地址和数值同时匹配

基于 10.2.1 节和 10.2.2 节的描述, SW421 可以分别提供地址匹配和数值匹配功能。当这两个功能独立设置时, 两者是"或"的关系, 即各自匹配, 先匹配者就先进入数据流故障处理。

为了方便调试, SW421 还提供了对数据流进行地址和数值同时匹配的功能, 即地址和数值匹配 两者是"与"的关系(仅可对 Store 类指令进行地址和数值同时匹配, 因 Load 类指令一定不会发生 数值匹配, 所以一定不会发生地址和数值同时匹配)。流程如下:

- 1) 设置 CSR: DA\_MATCH, 最小地址比较的粒度为字节, 有效的物理地址为 PA[47:0]位, 有效的虚地址为 VA[52:0]位, DA\_MATCH[EN(1)]为 "1";
- 2) 设置 CSR: DA MASK,确定参与匹配比较的地址屏蔽位;
- 3) 设置 CSR: DA\_MATCH\_MODE,确定数据流地址匹配模式;
- 4) 设置 CSR: DV\_MATCH,确定数值相等比较的数据模板;
- 5) 设置 CSR: DV MASK, 确定数值匹配屏蔽位;
- 6) 设置 CSR: DC CTL[DV MATCH EN]为"1", DC CTL[DAV MATCH EN]为"1";
- 7) 核心对访存指令的 Store 类指令的地址和数值同时进行匹配判断,若匹配发生,在相关 CSR 中登记相关信息,作为数据流故障,进入特权处理程序;
- 8)登记 CSR: DS\_STAT[DA\_MATCH]为"1", CSR: DS\_STAT[DV\_MATCH]为"1", CSR: DS\_STAT[DAV\_MATCH]为"1", CSR: DVA 中存放匹配的数据流物理地址, CSR: EXC\_PC 中存放产生该数据流虚地址的访存指令 PC 值, CSR: EXC\_SUM[REG(4:0)]中存放该指令的寄存器 Ra 域, CSR: DS\_STAT[OPCODE(5:0)]中存放该指令的操作码, CSR: DS\_STAT[WR]指示该指令是写访问;
- 9) 进入特权处理程序后,特权处理程序首先排除不是虚地址符号扩展错、访问越权、读访问 故障和写访问故障后,再进入数据流地址和数值同时匹配的处理。
- 当同时匹配关闭(CSR: DC\_CTL[DAV\_MATCH\_EN]为"0")时,地址匹配和数值匹配将分别独立判断。如果地址匹配和数值匹配都发生,登记 CSR: DS\_STAT[DA\_MATCH]为"1"和 CSR: DS\_STAT[DV\_MATCH]为"1"的时候,也会登记 CSR: DS\_STAT[DAV\_MATCH]为"1"。



### 10.2.4数据流匹配时相关 CSR 登记情况

在没有发生更高优先级异常的前提下,在设置 CSR: DC\_CTL[DV\_MATCH\_EN]为"1", DA\_MATCH[EN(1)]为"1"时,根据 CSR: DC\_CTL[DAV\_MATCH\_EN]的设置情况以及匹配的发生情况,登记 CSR: DVA 和 CSR: DS\_STAT 的情况汇总成下表:

| DC_CTL[DAV | 发生数值 | 发生地址 | 进数据 | DVA |        | DS_STAT |        |
|------------|------|------|-----|-----|--------|---------|--------|
| _MATCH_EN] | 匹配   | 匹配   | 流故障 |     | [DAV_  | [DV_MA  | [DA_MA |
|            |      |      | 异常  |     | MATCH] | TCH]    | TCH]   |
| 0          | 否    | 否    | 否   | 1   | -      | -       | -      |
| 0          | 是    | 否    | 是   | PA  | 0      | 1       | 0      |
| 0          | 否    | 是    | 是   | VA  | 0      | 0       | 1      |
| 0          | 是    | 是    | 是   | VA  | 1      | 1       | 1      |
| 1          | 否    | 否    | 否   | -   | -      | -       | -      |
| 1          | 是    | 否    | 否   | -   | -      | -       | -      |
| 1          | 否    | 是    | 否   | -   | -      | -       | -      |
| 1          | 是    | 是    | 是   | PA  | 1      | 1       | 1      |

表 10-1 数据流匹配登记情况

注: PA 指物理地址, VA 指虚地址, "-"表示无影响, 不记录。

注意:由于设计时考虑不周,在 SW421 新增数值匹配功能时,没有严格遵循"流水线先后发生异常时,先发生的异常屏蔽后发生的异常"的原则,在如下情况下,可能同时记录多种异常状态,包括:

- 1) 发生数值匹配之前发生符号扩展错/不对界错/DTag 偶校验错时,登记 DS\_STAT 时没有屏蔽数值匹配状态;
- 2) 同时开启 DAV\_MATCH\_EN、DV\_MATCH\_EN 和 DA\_MATCH\_EN 时,若发生地址匹配和数值匹配的情况下,之前还发生其他异常(比如说 DTBMiss、不对界错、符号扩展错、ACV0等等)时,登记 DS\_STAT 时不会记录数值匹配的状态,但是会记录地址匹配的状态。



## 11 编程优化

### 11.1 转移预测优化

SW421 核心包含转移预测器,采用两级预测的方式预测后续取指地址。

- 1) 一级预测在转移预测站台完成,通过转移目标地址缓存 BTAC,主要进行预测条件转移指令和无条件直接跳转指令的目标地址,其预测简单但访问速度快,当拍将预测结果反馈给取指部件 ICU;
- 2) 二级预测主要判断条件转移指令的跳转方向以及无条件间接跳转指令的目标地址,通过转移方向预测器 Hybird 以及间接转移目标地址缓存 iBTB 进行,精度较高,三拍后在转移分析站台将预测结果返回:
- 3) 对 RET 指令使用返回地址堆栈(RAS)来进行目标指令地址预测,也在转移分析站台进行。 SW421 核心中,指令组和指令槽的概念如下:
- 1) 指令组:在取指令时,一次取出地址自然对界的 4 条指令(即 128 位),将这地址对界的 4 条指令称之为指令组;
- 2) 指令槽:指令组的第一条指令位置称为指令槽 0,第二条指令位置称为指令槽 1,第三条指令位置称为指令槽 2,第四条指令位置称为指令槽 3。



图 11-1 指令组和指令槽



#### 11.1.1转移目标地址的约束

通常要求程序的起始地址以及转移指令(包括跳转指令、无条件转移指令和条件转移指令)的目标指令地址的PC[3:2]尽可能为全"0",即程序的起始指令或跳转的目标指令最好是一个指令组的第一条指令,可以通过插入空指令来达到这个目的。

空指令在 SW421 核心的指令流水线译码站台提前退出 (Retire), 所以空指令引起的主要开销是占用指令 Cache 的空间和取指令的带宽。

#### 11.1.2转移路径的选择

SW421 核心在初始化转移预测表时,会根据条件转移的方向初始化用于判断预测转移是否发生的饱和计数器初值。转移指令的偏移为正数时,饱和计数器初始化为"01",偏移为负数时,饱和计数器初始化为"10"。当饱和计数器的值是"10"或"11"时,转移预测器将预测转移发生,当饱和计数器的值是"00"或"01"时,转移预测器将预测转移不发生。通过代码重排,将第一次转移发生概率较大的转移指令安排为往回跳转(偏移为负数),将第一次转移发生概率较小的转移指令安排为往前跳转(偏移为正数),可提高转移预测的成功率。

SW421 核心在硬件上支持指令预取,即始终按程序的顺序地址进行预取,每次预取 32 条指令。 为了使指令预取能有效地提高指令 Cache 的命中率,可以通过重排代码,使顺序路径成为条件转移 指令的两条执行路径中经常选择的路径。由于 SW421 核心采用动态转移预测,重排代码不会影响转 移预测的性能。

#### 11.1.3转移指令位置的优化

iBTB 用于转移方向和转移目标地址的预测,iBTB 中每个条目对应一个指令组,而不是一条指令。如果一个指令组中只有一条转移指令,则 iBTB 条目中的转移历史信息更为准确;如果一个指令组中存在多条转移指令,则 iBTB 条目中的转移历史信息被多条转移指令更改和共用,将会导致转移预测成功率明显下降。因此,一个指令组中只出现一条转移指令,可使得 iBTB 的转移预测更为准确。(在 SW421 核心中,对转移预测机制进行了优化,即使一个指令组中出现多条转移指令,也不会影响转移预测的性能)

### 11.1.4 跳转指令使用的约束

RET 指令使用返回地址堆栈(RAS)来进行目标指令地址预测,当译码站台处理 BSR 和 CALL



指令时,将顺序指令地址压入 RAS,当译码站台处理 RET 指令时,就将 RAS 弹出的地址作为预测的目标指令地址,所以返回地址的压栈和弹出必须配对,才能保证 RAS 预测的正确性。

SW421 核心中设置了 16 个条目的 RAS, 若返回地址堆栈不满,指令地址压入 RAS 时,分配一个新条目来保留返回地址,作为返回地址堆栈的栈顶条目。如果返回地址堆栈满,则将条目中的内容依次向下移动,返回地址堆栈的底部条目被覆盖,新的入栈地址写入栈顶条目。对于一个子程序调用,如果在其匹配的指令返回之前嵌套了多于 16 次的子程序调用,则 RAS 中含返回地址的对应条目会被覆盖,当执行 RET 指令时,部分 RET 指令的返回指令地址将无法准确预测。因此,子程序调用的嵌套次数尽量不超过 16 次。

### 11.2 寄存器和指令的使用

#### 11.2.1 浮点寄存器的使用

在 SW421 核心中,向量寄存器(V0~V31)与浮点寄存器(F0~F31)共用,向量寄存器的低 64 位即是浮点寄存器。在汇编程序中,向量寄存器 Vi 采用对应的浮点寄存器 Fi 的命名来描述(i=0~31),由指令助记符来确定 Fi 为向量寄存器还是浮点寄存器。如图 11-2 中所示的扩展指令"VADDD F1,F2,F3"中,其向量寄存器描述符分别为 F1、F2 和 F3。



图 11-2 浮点寄存器和向量寄存器在使用中的差别

浮点寄存器既可以作为基本指令中浮点运算的源寄存器和目标寄存器,也可作为扩展指令的源寄存器和目标寄存器。浮点寄存器既可以用来保存基本指令和扩展指令与浮点运算相关的浮点数据,也可用来保存扩展指令与整数运算相关的整数数据。如图 11-2 所示,当浮点寄存器 F2 用于指令FADDD时,F2 为浮点寄存器,即寄存器 F2 的最低 64 位参与运算,当 F2 用于指令 VADDD时,全部 256 位都参与运算。注意图 11-2 中的 V2F1、V2F2、V2F3 只是为了描述方便使用的符号,在指令中不能直接读取向量寄存器 F2 中 V2F1、V2F2 或 V2F3 中数据,即 F2 中四个 64 位数据总是同时被读出。

在使用浮点寄存器时,软件必须保证寄存器中存放数据的类型与指令功能的一致性,硬件对其



中的数据不作区别和检查。软件也应确保对寄存器中数据所作的运算是有意义的,否则运算的结果 将不可预测。浮点寄存器文件中保存的整数数据不能直接与浮点数据进行运算,需要时,可通过浮 点与整数的转换指令进行处理后,才能进行运算。

例如:假设向量寄存器 F1 和 F2 均为浮点数据,F3 为整数数据。F1 和 F2 相乘,其结果保存到 F4。若将 F3 与 F4 进行运算,由于 F4 为浮点数据,而 F3 为整数数据,F3 与 F4 运算是没有意义的,运算的结果也是不可预测的。

另外,基本指令中的浮点运算只对浮点寄存器进行操作,即执行结果写入命名相同的向量寄存器的低 64 位,而该向量寄存器的高 192 位内容不可预测,后续任何处理不能依赖高 192 位内容。同样,扩展指令的运算结果为向量数据时,结果写入向量寄存器(256 位),命名相同的浮点寄存器(即此向量寄存器的低 64 位)原有内容也被覆盖。若需要保留该浮点寄存器内容,则需要程序显式将向量寄存器中低 64 位的浮点寄存器内容保存到其它寄存器或存储器中。

例如:两条指令"VADDD F1,F2,F3"和"FADDD F3,F4,F3"完成处理并退出后,第一条指令产生的结果中,只有向量寄存器F3的低64位内容参与第二条指令的计算,第二条指令因寄存器更名,使得原保留在向量寄存器中的V3F1、V3F2、V3F3内容丢失,第二条指令完成并退出后,V3F1、V3F2、V3F3中的内容将变得不可预测。

#### 11.2.2 扩展指令的数据

由于向量寄存器与浮点寄存器共用,一般将向量寄存器分成两个部分,其低 64 位称之为主浮点寄存器,高 192 位称之为浮点扩展寄存器。扩展指令同时读写主浮点寄存器和浮点扩展寄存器,而基本指令只使用主浮点寄存器,因此扩展指令涉及的寄存器与基本指令涉及的浮点寄存器不能混用,否则会使浮点扩展寄存器中的数据丢失,产生不可预测的结果。建议的使用方法如下:

- 1) 扩展指令之间可以任意使用浮点寄存器作为源操作数寄存器或目标寄存器,此时的浮点寄存器被当做向量寄存器来使用;
- 2) 使用基本指令中的浮点装入指令读入的数据或浮点运算指令产生的结果数据作为扩展指令的源操作数前,应使用 VINSF/VINSW/VCPYF 指令,将浮点寄存器中数据扩展为 256 位向量数据:
- 3)扩展指令产生的结果存放在主浮点寄存器和浮点扩展寄存器中,需要作为基本指令中的浮点运算的源操作数时,只有对应的主浮点寄存器内容可以直接使用,而浮点扩展寄存器的内容不能直接使用,应使用 VEXTF/VEXTW 指令,将浮点扩展寄存器内容传送到主浮点寄存器后再使用:
- 4) 如果扩展指令的目标寄存器又被作为基本指令的浮点运算目标寄存器,则这个目标寄存器 对应的浮点扩展寄存器内容是不可预测的,使得该目标寄存器原有的浮点扩展寄存器内容 丢失,如果这个内容是有意义的,必须在作为基本指令的浮点运算目标寄存器之前进行保



#### 11.2.3扩展存储装入指令

在 SW421 核心的扩展指令中,包含 9 条存储器装入指令(VLDS、VLDD、LDWE、LDSE、LDDE、VLDW\_U、VLDS\_U、VLDD\_U、VLDD\_NC)和 12 条存储器存储指令(VSTS、VSTD、VSTW\_UL、VSTW\_UH、VSTW\_U、VSTS\_UL、VSTS\_UH、VSTS\_U、VSTD\_UL、VSTD\_UL、VSTD\_UL、VSTD\_UL、VSTD\_NC),这些指令也称之为向量存储装入指令,这些指令都是对主浮点寄存器和浮点扩展寄存器同时进行写或读。

由于 SW421 核心不支持向量存储装入指令产生的对 I/O 空间的数据流访问请求,若扩展存储装入指令产生的数据流地址对应的物理地址为 I/O 空间(即物理地址[47]位为"1"),则作为存取越权而产生数据流故障。另外,SW421 核心也不支持大端(Big-endian)寻址模式,所有向量存储装入指令都只能按小端(Little-endian)模式寻址。

在使用扩展指令进行数据处理时,如果存储器中的向量数据存在地址不对界情况,可以使用不 对界向量存储装入指令来提高性能。

#### 11.2.4不可 Cache 访存指令

SW421 核心支持不可 Cache 访存指令,包括: LDW\_NC、LDL\_NC、LDD\_NC、STW\_NC、STL\_NC、STD\_NC、VLDD\_NC、VSTD\_NC,使用这些指令访问存储器空间时,数据不进入二级 Cache 和数据 Cache。

如果程序段中核心访问的数据没有时间局部性,即写入的数据很长时间内不会被用到,则比较适合使用不可 Cache 指令,一方面使用不可 Cache 指令可以避免将有时间局部性的数据从 Cache 中淘汰,另一方面也可以省掉处理可 Cache 写指令时先将数据装入到 Cache 中的开销。

图 11-3 中是不可 Cache 指令的一种典型应用,当 N 较大,两个数组的数据量超过二级 Cache 容量大小时,使用不可 Cache 存储指令可减少存储器访问次数,提高访存带宽,从而提升性能。

当需要对可 Cache 空间的相同存储器地址既使用可 Cache 指令进行访问又使用不可 Cache 指令进行访问时,对不可 Cache 访存指令的使用需要遵循一定的约束。由于硬件不保证对本核组的相同存储器空间可 Cache 访问与不可 Cache 访问之间的顺序,因此软件在对同一个存储器位置进行访问方式切换时,必须通过插入 MEMB 指令来保证两者之间的访问顺序。



```
void copy(double *a, double *c)
    register int i;
    for(i=0;i<N;i++)
        c[i]=a[i];
}
                   (a)
L_copy:
    VLDD F13,0(R5)
    VLDD F12,32(R5)
    VLDD F11,64(R5)
    VLDD F10,96(R5)
    ADDW R4,4,R4
    CMPEQ R4,R7,R17
    VSTD_NC F13,0(R6)
    VSTD NC F12,32(R6)
    VSTD_NC F11,64(R6)
    VSTD NC F10,96(R6)
    LDI R5,128(R5)
    LDI
         R6,128(R6)
          R17,.L_copy
    BEQ
                   (b)
```

图 11-3 不可 Cache 指令典型应用

#### 11.2.5整数乘法

对于有符号的 32 位整数乘法, MULW 指令给出不溢出时的 32 位结果。当指令处理产生溢出时, MULL 指令可以给出全部的 64 位结果。

对于有符号的 64 位整数乘法,MULL 指令给出不溢出时的 64 位结果。当指令处理产生溢出时,需要使用 UMULH 指令来计算完整的 128 位结果。UMULH 指令计算两个无符号的 64 位源操作数乘积的高 64 位结果。有符号数乘积的完整 128 位结果如下:

- 1) 高 64 位: 使用 UMULH 指令可得高 64 位结果;
- 2) 低 64 位: 使用 MULL 指令可得低 64 位结果。

#### 11.2.6原子操作指令

原子操作指令包括"取并加一"、"取并减一"、"取并置一"三种指令,可用于实现多核之间的同步互斥操作。例如操作系统核心中常用的 spinlock 可用图 11-4 的代码来实现。



spin\_lock:

LDI R0,lockvar //装入lockvar地址 LDW SET R0,0(R0) //对lockvar取并置1

NOP //空指令

BNE R0,spin\_lock //加锁不成功,跳回

unlock:

LDI R0,lockvar //装入lockvar地址 STW R31,0(R0) //存入0,解锁

#### 图 11-4 用原子操作实现的 spinlock

通过 spinlock 可以实现其它较复杂的临界区、信号灯等互斥机制,从而实现多个处理器核心之间对关键资源的互斥访问。基于 spinlock 还可实现多核间的各种同步机制。

另外,由于操作系统核心中大量的"计数器"也需要在多个处理器核心之间互斥进行,这些"计数器"的临界区内的代码只是简单的"加1"或"减1"的操作,如果全都通过临界区或 spinlock 锁操作实现,开销会比较大,使用原子操作指令可以大大简化这些操作。

#### 11.2.7锁指令

SW421 核心包含 6 条指令可用于实现软件中的各种锁操作。这 6 条指令分别是 LLDW、LLDL、LSTW、LSTL、WR\_F、RD\_F。

其中,锁装入指令(LLDW/LLDL)从指定存储器单元读取对应粒度的数据(字整数/长字整数)到目标寄存器中,再将锁地址(经TLB映射后的物理地址)及数据粒度写入锁寄存器,并设置锁有效位(lock valid)为"1"。

WR\_F指令用于将源寄存器中数据的最低位写入锁标志寄存器(lock\_flag)。

锁存储指令(LSTW/LSTL)判断锁有效位(lock\_valid)和锁标志位(lock\_flag)是否都为"1",并与锁寄存器中记录的锁地址和数据粒度是否匹配,还需用锁地址查询数据 Cache 判断是否命中数据 Cache 且状态为可写,这四个条件同时满足则完成写操作并置锁状态位(lock\_success)为"1",否则丢弃写操作并置 lock\_success 为"0"。无论是否加锁成功,锁存储指令总是清除 lock\_valid 和 lock flag。

RD F指令用于将锁状态位(lock success)读入目标寄存器中。

在操作系统中对共享资源的置位清零操作,如果都基于使用原子操作指令的 spinlock 实现,开销非常大,使用锁指令可大大减少这种开销,提升系统运行效率。图 11-5 中给出了使用锁指令实现置位操作的一个示例。



```
#对指定地址处的64位数据的某一位置"1"
#R16:指定地址
#R17:1<<n
#指令组: 16B对界
set_bit:
  LLDL
             R11.0x0(R16)
  LDI
             R12,1
  WR_F
             R12
  BIS
             R11.R17.R11
             R11,0x0(R16)
  LSTL
  RD_F
  NOP
             R11,set_bit
  BEQ
```

图 11-5 用锁指令实现的置位操作

在 SW421 核心中,为了简化硬件设计,对锁存储指令(LSTW/LSTL)和 RD\_F 指令的使用进行了约束:锁存储指令(LSTW/LSTL)和 RD\_F 必须配对使用,且锁存储指令(LSTW/LSTL)位于一个指令组中的指令槽 0 位置(或者 2 位置),RD\_F 位于指令槽 1 位置(或者 3 位置),如果在编程中违背了这种约束,将报非法指令异常。图 11-6 中列出了违反约束使用锁指令的情况。

```
#指令组n: 16B对界
BIS
      R0,R0,R0 #指令槽0
     R1,0x0(R2) #指令槽1:LSTW指令在指令槽1, LSTW报非法
LSTW
BIS
      R0,R0,R0 #指令槽2
BIS
      R0,R0,R0 #指令槽3
                       (a)
#指令组n: 16B对界
      R0,R0,R0 #指令槽0
BIS
BIS
      R0,R0,R0 #指令槽1
     R1.0x0(R2) #指令槽2:LSTL指令后跟的不是RD F, LSTL报非法
LSTL
BIS
     R0,R0,R0 #指令槽3
                       (b)
#指令组n: 16B对界
RD F
              #指令槽0:RD F指令在指令槽0, RD F报非法
     R2
      R0,R0,R0 #指令槽1
BIS
BIS
      R0,R0,R0 #指令槽2
      R0,R0,R0 #指令槽3
BIS
                       (c)
#指令组n: 16B对界
     R0,R0,R0 #指令槽0
BIS
      R0,R0,R0 #指令槽1
BIS
BIS
      R0,R0,R0 #指令槽2
RD_F
     R2
              #指令槽3;RD_F指令对应指令槽2不是锁存储指令,
              #RD F报非法
                       (d)
```

图 11-6 锁指令违反约束使用情况



锁指令的使用还有另一个约束:配对使用的锁装入指令(LLDW/LLDL)和锁存储指令(LSTW/LSTL)之间不能使用转移指令,否则将造成锁存储指令不成功。图 11-7(a)中将加锁不成功,正确的写法如图 11-7(b)所示。

| LLDW<br>BNE<br>LDI<br>WR_F | R11,0x0(R16)<br>R11,locktry<br>R11,0x1<br>R11 | LLDW<br>XOR<br>WR_F<br>LDI | R11,0x0(R16)<br>R11,1,R11<br>R11<br>R11,1 |
|----------------------------|-----------------------------------------------|----------------------------|-------------------------------------------|
| LSTW                       | R11,0x0(R16)                                  | LSTW                       | R11,0x0(R16)                              |
| RD_F                       | R11                                           | RD_F                       | R11                                       |
| BEQ                        | R11,locktry                                   | BEQ                        | R11,locktry                               |
| MEMB                       |                                               | MEMB                       |                                           |
|                            | (a)                                           |                            | (b)                                       |

图 11-7 锁指令使用约束

另外,下列情况下锁存储和锁装入指令会发生异常,从而导致锁存储指令写操作不成功:

- 1) 锁存储或锁装入指令发生存取越权;
- 2) 锁装入指令访问一个具有 FOR (Fault On Read) 属性的页面;
- 3) 锁存储指令访问一个具有 FOW (Fault On Write) 属性的页面;
- 4) 锁存储或锁装入指令在计算地址时发生符号扩展错;
- 5) 锁存储或锁装入指令访问地址不对界;
- 6) 锁存储或锁装入指令访问 I/O 空间或不可 Cache 空间(其它核组的存储器空间)。 因此,程序员使用锁指令时需要保证锁地址的合法性。

## 11.3 避免重发自陷或冲突重试

SW421 核心可以同时处理多达 48 条访存指令,由于访存指令的乱序执行,访存指令之间的顺序会因违反存储一致性(Memory consistency)而引起正确性问题,例如 Load-Load 乱序、Load-Store 乱序,此时发生乱序的指令以及后续指令会被重新取指执行,这就是重发自陷。重发自陷是一种硬件机制,与其它异常或自陷不同,不是一种真正的错误。重发自陷的主要开销是必须等待被中止指令之前的所有指令正常退出(Retire),然后才能继续执行发生自陷的指令以及后继的指令。重发自陷对性能的影响主要是:

- 1) 产生重发自陷的指令等待前面的指令都正常退出;
- 2) 流水线的重新启动存在一定的运行时间开销。

为避免重发自陷产生较大的开销,SW421核心有一种内部重试方式,称为冲突重试。该方式不需要重新取指令执行,只在核心的数据 Cache 控制部件内部重试,且重试请求的优先级低于正常的



访存请求,对性能影响较低,但仍然存在一定的影响。

避免重发自陷或冲突重试的方法有:

- 1) 避免重发自陷或冲突重试最根本的办法是尽可能地减少对相同地址或相同 Cache 索引地址 的连续读写访存。如存储的数据会马上被重新使用,应尽量避免使用访存指令,而是将数 据保存在寄存器中,如果出现寄存器不够用的情形,可以使用 FIMOVx 或 IFMOVx 指令, 在浮点寄存器和整数寄存器之间传输数据,从而避免这种重发自陷的发生;
- 2) 将两条可能引起重发自陷或冲突重试的指令分开可以直接避免重发自陷或冲突重试。如果数据在二级 Cache 中,则两条指令之间需要间隔至少 40 条指令才可以避免重发自陷,如果数据不在二级 Cache 而是在 DDR3 存储器中,需要间隔的指令条数则更多。

下面将介绍几种主要的重发自陷或冲突重试,说明其产生的原因与相关的影响,以便于进行程序优化。

#### 11.3.1写-读重发自陷

在程序中,访问相同地址的存储器写指令和读指令,写指令在前(年老),读指令在后(年轻),可能由于乱序发射导致年轻的存储器读指令比年老的写指令提早发射、执行,使得存储器读指令得到的数据不是最新数据,从而引起写-读重发自陷。在 SW421 核心中,产生写-读重发自陷的指令是年老的存储器写指令。

浮点存储器写指令需要特别注意,因为这类指令要求先在浮点指令队列中检查浮点源寄存器是 否准备好,如果准备好并被选中,则两拍后才可能从整数队列中真正发射到执行部件,因此后续相 同地址的存储器读指令(包括整数和浮点存储器读指令)更易被提早发射从而产生写-读重发自陷。

#### 11.3.2读-读重发自陷

为保证多核之间的存储一致性,需要保证最新的存储器读能够读到最新值。在程序中,对相同地址的两条存储器读指令,由于乱序发射会导致年轻的存储器读指令比年老的存储器读指令提早发射、执行,从而引起读-读重发自陷。在 SW421 核心中,产生读-读重发自陷的指令是年老的存储器读指令。

#### 11.3.3数据旁路产生的冲突重试

年老的存储器写指令先进入存储指令队列(SQ:Store Queue),后继年轻的相同地址的存储器读指令可以从 SQ 中旁路取得所需的数据,但是在某些情况下这种旁路获得的数据可能是错误的,为保证正确性,在发生这些情况时,硬件需要通过冲突重试拦住年轻的读指令,直到写数据写入数据



Cache 为止。

在下列情况下会发生冲突重试:

- 1) 存储器写指令的粒度小于存储器读指令的粒度,无法为读指令提供完整的数据,读指令产生冲突重试;
- 2) 有多条存储器写指令与存储器读指令地址相同,可旁路的存储器写指令有多条,读指令产生冲突重试。

在发生上述冲突重试时,只有与冲突重试相关的数据写入数据 Cache 后,冲突条件才会消失, 因此,数据旁路产生的冲突重试等待时间较长。

#### 11.3.4 读不命中产生的冲突重试

年轻的存储器读指令到达装入指令队列(LQ: Load Queue)时,发现年老的存储器读指令不命中数据 Cache,则年轻的存储器读指令产生冲突重试。一般类似石蕊测试的程序易发生这种冲突重试。

#### 11.3.5映射到同一 Cache 行的冲突重试

即使没有发生年轻指令超越年老指令提前发射的情况,为避免产生对相同索引 Cache 的装填和淘汰同时发生,存储器读写如果有如下情况,则年轻指令将产生冲突重试:

- 1) 读-读:两条存储器读指令的 Cache 索引地址相同,且年老的存储器读指令不命中数据 Cache:
- 2) 读-写: 年老的存储器读指令和年轻的存储器写指令的 Cache 索引地址相同,且年老的存储器读指令不命中数据 Cache;
- 3) 写-读: 年老的存储器写指令和年轻的存储器读指令的 Cache 索引地址相同,不论年老的存储器写地址是否命中数据 Cache;
- 4) 写-写: 两条存储器写指令 Cache 索引地址相同,不论年老的存储器写指令是否命中数据 Cache。

当上述两条指令访问同一个 Cache 行,且满足合并条件时,不会发生冲突重试。

#### 11.4 数据流访问

#### 11.4.1数据流访问的相关数据

SW421 核心中与数据流访问有关的结构及技术参数如下:



- 1) Load 类指令产生的数据流访问命中数据 Cache 时,与此 Load 类指令的目标寄存器真相关的下一条指令的最小发射间隔为 4 个时钟周期;
- 2) 数据 Cache 容量为 32KB, 相联度为 4, Cache 行大小为 128 字节;
- 3) Load 类指令产生的数据流访问命中二级 Cache 时,与此 Load 类指令的目标寄存器真相关的下一条指令的最小发射间隔为 11 个时钟周期;
- 4) 二级 Cache 容量为 512KB, 相联度为 8, Cache 行大小为 128 字节;
- 5) 数据流访问命中二级 Cache,读取数据要连续占用内部数据总线 4 个时钟周期,在占用数据总线期间,不允许其它存储器访问;
- 6) 装入指令队列(LQ)有32个条目,最多存放32个读请求,读请求可以在MAF中合并;
- 7) 存储指令队列(SQ)有16个条目,最多存放16个写请求,写请求也可以在MAF中合并;
- 8) 不命中请求地址缓冲(MAF: Miss Address File) 有 8 个条目,最多可以发出 8 个不同地址的存储器访问。

#### 11.4.2数据流访问合并

#### 11.4.2.1 可 Cache 空间的合并

SW421 核心可以对可 Cache 空间的读写指令进行合并,合并窗口是 MAF 条目的有效周期,即从 MAF 分配条目到响应返回并删除 MAF 条目,这期间如果新产生的请求地址与已产生的请求地址属于同一个 Cache 行、地址不重叠,则新请求可以合并到已有请求中。对可 Cache 空间的访问,不同数据长度、不同数据类型的可 Cache 读写指令都可以合并,可 Cache 读指令和可 Cache 写指令也可以合并。

对可 Cache 空间的不可 Cache 指令的合并规则与 11.4.2.2 节 "不可 Cache 空间的合并"中的规则相同。

#### 11.4.2.2 不可 Cache 空间的合并

SW421 核心可以对不可 Cache 读写指令进行合并。

不可 Cache 读指令的合并窗口是 MAF 条目的有效周期,即从 MAF 分配条目到响应返回并删除 MAF 条目,这期间如果新产生的请求地址与已产生的请求地址属于同一个 Cache 行、地址不重叠,则新请求可以合并到已有请求中。

不可 Cache 写指令的合并窗口可通过 CSR:MERGE\_OVTIME 配置, 缺省值为 256 个核心时钟周期, 最多可将对连续 128B 数据的写请求合并成一条写请求。不可 Cache 写的具体合并规则如下:

1) 不同数据长度、不同数据类型的 Store 指令不允许合并;



- 2) 按程序顺序,可以对前后若干条访问数据长度为字节的 Store 指令在自然对界的 16 字节范围内进行合并;
- 3) 按程序顺序,可以对前后若干条访问数据长度为半字的 Store 指令在自然对界的 32 字节范围内进行合并;
- 4) 按程序顺序,可以对前后若干条访问数据长度为字整数或单精度浮点的 Store 指令在自然对界的 64 字节范围内进行合并;
- 5) 按程序顺序,可以对前后若干条访问数据长度为长字整数或双精度浮点的 Store 指令在自然 对界的 128 字节范围内进行合并:
- 6) 按程序顺序,可以对前后若干条访问数据长度为单精度浮点向量的 Store 指令在自然对界的 128 字节范围内进行合并;
- 7) 按程序顺序,可以对前后若干条访问数据长度为字整数向量或双精度浮点向量的 Store 指令在自然对界的 128 字节范围内进行合并;
- 8) 按程序顺序,可以对前后若干条不对界字向量或单精度浮点向量 Store 指令在自然对界的 64 字节范围内进行合并:
- 9) 按程序顺序,可以对前后若干条不对界双精度浮点向量 Store 指令在自然对界的 128 字节范围内进行合并。

由于不可 Cache 读可以关闭不可 Cache 写的合并窗口,不可 Cache 写也可以关闭不可 Cache 读的合并窗口。因此,连续产生的不可 Cache 写可以合并,中间不要插入不可 Cache 读;不可 Cache 读也同样需要连续产生,中间不要插入不可 Cache 写,这样可以提高带宽利用率。

在编程中,对大块连续空间的访问,访存指令的访存地址应顺序改变,避免一个 Cache 行的合并窗口被另一个 Cache 行的访问关闭。如图 3-9 所列的两段代码中,每个循环的访存地址总是升序的,但在一个循环体内,图 11-8(a)中的 VSTD\_UH 和 VSTD\_UL 两条指令的访存地址是降序排列,图 11-8(b)中的 VSTD\_UH 和 VSTD\_UL 两条指令的访存地址是升序排列,当多个循环展开后,访存地址可能出现跨 Cache 行,此时图 11-8(a)不能合并,而图 11-8 (b) 一直可以合并,因此图 11-8(b)的实际性能要比图 11-8(a)的性能高。

| L0:             |                         | L0:             |                        |
|-----------------|-------------------------|-----------------|------------------------|
| ADDW<br>VSTD UH | R4,0x1,R4<br>F12,40(R3) | ADDW<br>VSTD UL | R4,0x1,R4<br>F12,8(R3) |
| VSTD_UL         | F12,8(R3)               | VSTD_UH         | F12,40(R3)             |
| LDI             | R3,32(R3)               | LDI             | R3,32(R3)              |
| CMPEQ           | R4,R5,R6                | CMPEQ           | R4,R5,R6               |
| BEQ             | R6,L0                   | BEQ             | R6,L0                  |
| (a)             |                         | (b)             |                        |

图 11-8 有效利用合并缓冲



#### 1.1.1.1 I/O 空间的合并

SW421 核心不支持对 I/O 空间读指令的合并。

SW421 核心支持对 I/O 空间写指令的合并,I/O 空间写指令的合并超时时间可通过 CSR:MERGE\_OVTIME 配置,缺省值为 256 个核心时钟周期。如果前后若干条长字 I/O 写指令产生的数据流地址是升序且不重叠 (不一定连续),则允许这些指令在自然对界的 128 字节范围内进行合并。具体合并规则如下:

- 1) 字节或半字的 I/O 写指令不允许合并,不同数据长度的 I/O 写指令不允许合并;
- 2) 按程序顺序,如果前后若干条字 I/O 写指令产生的数据流地址是升序且不重叠(不一定连续),则可以对这些指令在自然对界的 64 字节范围内进行合并;
- 3) 按程序顺序,如果前后若干条长字 I/O 写指令产生的数据流地址是升序且不重叠(不一定连续),则可以对这些指令在自然对界的 128 字节范围内进行合并;
- 4) MEMB 指令、I/O 读指令或不能合并的 I/O 写指令,将关闭 I/O 写指令的合并窗口。 对 I/O 空间的合并可用于提升处理器核心访问核外设备空间的性能。

## 11.5 低功耗优化

#### 11.5.1 浮点执行部件的功耗控制

SW421 核心的浮点执行部件中,包括四条运算流水线,其中主浮点运算流水线对应主浮点寄存器,三条从浮点运算流水线对应浮点扩展寄存器。由于浮点执行部件在核心中所占功耗比例较大,其中从浮点运算流水线在浮点执行部件中所占功耗最大,因此在执行基本指令中的浮点运算指令时,仅使用主浮点运算流水线,执行扩展指令的向量运算指令时,才使用主、从四条浮点运算流水线。

SW421 核心支持浮点执行部件的动态功耗管理,通过 CSR: UPCR 可以控制浮点执行部件以及 从浮点运算流水线的工作时钟。

针对不使用扩展指令中向量运算指令的程序,可以通过 CSR: UPCR 关闭从浮点运算流水线的时钟,降低核心的运行功耗。

针对不使用基本指令中浮点运算指令和扩展指令中向量运算指令的程序,可以通过 CSR: UPCR 关闭浮点执行部件的时钟,进一步降低核心的运行功耗。

即使程序中存在少量的浮点运算指令或者向量运算指令,在性能允许的前提下,也可以关闭浮点执行部件或者从浮点运算流水线时钟,此时执行这些指令将产生自陷,可以通过软件仿真方式完成这些指令的处理。



#### 11.5.2核心睡眠

SW421 核心支持浅睡眠和深睡眠功能,程序员可通过操作系统提供的相关功能进一步实施低功耗优化。

当核心短时间里没有可执行的任务时,可在非硬件模式下,通过执行 HALT 指令(硬件模式下 此指令被当作空指令),使核心进入浅睡眠状态。此状态下,核心的指令流水线不再进行取指令,也 不发射指令,可大大降低该核心的运行功耗。处于浅睡眠状态下的核心仍然支持 Cache 一致性操作, 核心内的寄存器和 Cache 中的数据不会丢失。通过任何中断可将核心浅睡眠状态唤醒。

当核心长时间里没有可执行的任务时,可由本核心或其它核心向该核心发送睡眠中断,使核心进入深睡眠状态。此状态下,核心处于复位状态,工作频率为维护时钟的八分频,可最大限度降低核心的运行功耗。处于深睡眠状态下的核心不能接收睡眠唤醒中断之外的其它中断,也不支持 Cache一致性操作,核心内的寄存器和 Cache 中的数据会丢失,因此系统软件必须在核心进入深睡眠之前,保留寄存器中的内容,刷新数据 Cache 和二级 Cache。当睡眠的核心需要恢复运行时,可以通过其它核心在硬件模式下向该核心发送睡眠唤醒中断,唤醒处于睡眠状态的核心,并恢复寄存器中的内容,然后进入正常的运行状态。



## 附录 A CSR 的限制

虽然在 SW421 核心硬件上通过 CSR 记分板和 CSR 写机制,保证大多数情况下 CSR 的隐式读写和显式读写之间的相互顺序,但还有些特殊情况,需要软件协助保证。另外,还有些 CSR 在硬件实现时存在一定关联,因此软件显式写这些 CSR 时有一定的限制。

1) 指令部件的 CSR 显式写和隐式读顺序

指令部件中CSR的隐式读产生在指令发射之前,这些CSR通过硬件上的CSR记分板机制无法保证显式写与隐式读之间的顺序,为确保这些CSR的修改对后续指令产生预期的效果,需要进行如下操作。

- a. 对于 CSR: IS\_CTL[F\_BAD\_DPAR]、IS\_CTL[F\_BAD\_TPAR]和 IC\_FLUSH,在 HM 模式或非 HM 模式下取指就存在隐式读,因此需特别小心,可将 PRI\_WCSR 指令、IMEMB 指令或者读 PRI\_RCSR 指令(PRI\_RCSR 读的源与 PRI\_WCSR 写的目标是同一个 CSR)和 PRI\_RET/b 指令放在一个指令组中(对界的 4 条指令),以保证再次取指令时,这些CSR 的值已经被更新;
- b. 对于 CSR: IS\_CTL[SRE],在 HM 模式下存在隐式读,需要在 PRI\_WCSR 指令之后, 在使用系统寄存器的指令之前,插入一条 IMEMB 指令;
- c. 对于 CSR: UPCR[UPN]、VPCR、ITB\_TAG、ITB\_PTE、ITB\_IA、ITB\_IV、ITB\_IVP、ITB\_IU、ITB\_IS, 只在非 HM 模式下取指才会存在隐式读,可在 PRI\_WCSR 指令后直接用 PRI\_RET/b 返回;
- d. 对于 CSR: IS\_CTL[16:10]、IA\_MATCH、IA\_MASK,如果要用于 HM 模式,则可采用 类似 b 的处理方法,如果用于非 HM 模式,则可在 PRI\_WCSR 指令和 PRI\_RET/b 之间,插入一条 IMEMB 指令或者 PRI\_RCSR 指令(PRI\_RCSR 读的源与 PRI\_WCSR 写的目标是同一个 CSR);
- e. 对于 CSR: INT\_CLR0~3、IER0~3、II\_CLR、II\_ER,如果在 HM 模式下进行了显式写操作,可在 PRI\_WCSR 指令和 PRI\_RET/b 之间,插入一条 IMEMB 指令或者PRI\_RCSR 指令 (PRI\_RCSR 读的源与 PRI\_WCSR 写的目标是同一个 CSR),避免已处理过的中断再次被处理或已屏蔽的中断被处理。
- 2) 数据 Cache 管理部件和二级 Cache 管理部件的 CSR 显式写和隐式读顺序

数据 Cache 管理部件和二级 Cache 管理部件的 CSR 隐式读主要由访存指令引起,硬件上已经保证了这些 CSR 的显式写和隐式读之间的顺序问题。



#### 3) 整数部件的 CSR 显式写和隐式读顺序

- a. 对于大多数访存指令,只对数据 Cache 管理部件的 CSR 进行隐式读,但对原子操作指令而言,还需要对整数部件的 CSR: ICR 进行隐式读,而硬件并没有对此进行控制,因此软件需要在写 CSR: ICR 之后和原子操作指令之前,增加一条 IMEMB 指令或者一条 PRI\_RCSR 读整数部件 CSR 的指令 (PRI\_RCSR 读的源与 PRI\_WCSR 写的目标是同一个 CSR):
- b. RTC 指令,需要隐式读 CSR: TC, RTC 指令读访问时受 CSR 记分板控制,但由于 TC 每个周期都在隐式写,而硬件可能出现乱序执行 RTC 指令的情况,因此 RTC 指令返回 的周期计数可能不准确,如果软件希望获得某条指令执行后准确的周期数,可以使得 RTC 指令中 Rb 域内容与前一条指令存在寄存器写后读相关性:
- c. 对于 CSR: CID, 既可通过 PRI\_RCSR 指令显式读, 也可通过 RCID 指令显式读, PRI\_RCSR 指令和 RCID 指令读访问时都受 CSR 记分板控制。另外, CSR: CID 中的 值不存在硬件隐式写和隐式读操作, 因此不存在显式读写与隐式读写之间的顺序问题;
- d. 对于 CSR: TID, 既可通过 PRI\_RCSR 指令显式读, 也可通过 RTID 指令显式读, PRI\_RCSR 指令和 RTID 指令读访问时都受 CSR 记分板控制。另外, CSR: TID 中的值不存在硬件隐式写和隐式读操作, 因此不存在显式读写与隐式读写之间的顺序问题;
- e. 在进行指令流整数转移指令目标地址匹配时,注意写 IDA\_MATCH 和 IDA\_MASK 的指令地址与真正要匹配的目标指令地址必须有一定的距离(避免 PC 值接近而引起错误操作)。

#### 4) CSR 显式写和隐式写顺序

一般情况下,CSR不存在同时显式写和隐式写,只有那些可写"1"清除或写清除的CSR会出现这种情况,如CSR: DC\_STAT、DS\_STAT、SC\_STAT等,这时需要软件保证正确性。一般可以在显式写这些CSR指令后,插入MEMB指令来避免同时产生显式写和隐式写的情况。

#### 5) 异常相关的 CSR

因异常自陷进入特权程序后,必须在特权程序的开始,立即读相关状态的CSR,否则因特权程序的运行,会影响到CSR的内容。这类CSR包括IVA、IVA\_FORM、INT\_STAT0~3、EXC\_SUM、DS STAT、DVA和DVA FORM等。

在异常或自陷特权程序中,对已处理的异常或自陷状态需要予以清除,否则这些状态会保持, 影响后继的异常或自陷处理。这类CSR包括IS\_STAT、DC\_STAT、DS\_STAT、SC\_STAT等。



## 附录 B事件计数内容与方法

SW421 核心设置了两个事件计数器(PC0 和 PC1),软件可根据需要,让 PC0 和 PC1 选择不同的事件同时计数,一个计数器的值作为分母,一个计数器的值作为分子,可计算出比值后用于衡量核心的相关性能。应尽可能使得需要的事件计数值在 SW421 核心上运行一次得到,以提高事件计数的准确性。下面列举了一些常用的事件计数内容及其计数事件的配置方法。

1) 转移预测事件计数的配置方法如表 B-1 所示。

性能测试事件 事件计数器 0 事件计数器1 PC1 SEL = 0xBPC0 SEL=0x3执行站台判断出所有转移指令预测 总转移预测失败率 执行站台执行的转移指令计数 失败的次数  $PC0\_SEL = 0x4$ PC1 SEL = 0xC条件转移指令的转移 执行站台执行的条件转移指令计 执行站台判断出条件转移指令预测 预测失败率 失败的次数  $PC0_SEL = 0x5$ PC1 SEL = 0xD无条件转移指令的转 执行站台执行的无条件转移指令 执行站台判断出无条件转移指令预 移预测失败率 测失败的次数 PC0 SEL=0x6PC1 SEL=0xEJMP、CALL 的转移预 执行站台执行的 JMP、CALL 指令 执行站台判断出 JMP、CALL 指令预 测失败率 测失败的次数 PC1 SEL = 0xFRET 的转移预测失败 PC0 SEL = 0x7执行站台判断出 RET 指令预测失败 执行站台执行的 RET 指令计数 的次数 条件转移指令占转移 PC0 SEL=0x3PC0 SEL = 0x4指令比例 执行站台执行的转移指令计数 执行站台执行的条件转移指令计数 PC0 SEL = 0x5无条件转移指令占转 PC0 SEL=0x3执行站台执行的无条件转移指令计 移指令比例 执行站台执行的转移指令计数 PC0 SEL = 0x6JMP、CALL 指令占转 PC0 SEL=0x3执行站台执行的 CALL 和 JMP 指令 移指令比例 执行站台执行的转移指令计数 计数 RET 指令占转移指令 PC0 SEL=0x3PC0 SEL = 0x7比例 执行站台执行的转移指令计数 执行站台执行的 RET 指令计数 一级转移预测的误预 PC0 SEL=0x3 $PC1\_SEL = 0x15$ 执行站台执行的转移指令计数 二级预测修复一级预测的次数。

表 B-1 转移预测事件计数的配置方法

表 B-2 指令流水线事件计数的配置方法

| 性能测试事件   | 事件计数器 0     | 事件计数器 1     |
|----------|-------------|-------------|
| CPU 空闲概率 | PC0_SEL=0x8 | PC1_SEL=0x0 |

<sup>2)</sup> 指令流水线事件计数的配置方法如表 B-2 所示。



|                                   |                     | 申威 421 处理器软件接口手册                                    |
|-----------------------------------|---------------------|-----------------------------------------------------|
|                                   | 周期计数                | 指令流水线空闲周期计数                                         |
| 整数寄存器不足引起的 指令流水线阻塞的比例             | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x1<br>重命名站台因整数重命名寄存器不足引起指<br>令流水线停顿周期计数    |
| 浮点寄存器不足引起的<br>指令流水线阻塞的比例          | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x2<br>重命名站台因浮点重命名寄存器不足引起指<br>令流水线停顿周期计数    |
| IWQ 容量不足引起的指令流水线阻塞的比例             | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x3<br>重命名站台因整数等待队列(IWQ)满引起指<br>令流水线停顿周期计数  |
| FWQ 容量不足引起的<br>指令流水线阻塞的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x4<br>重命名站台因浮点等待队列(FWQ)满引起<br>指令流水线停顿周期计数  |
| AWQ 容量不足引起的<br>指令流水线阻塞的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x2e<br>重命名站台因访存等待队列(AWQ)满引起<br>指令流水线停顿周期计数 |
| ROB 容量不足引起的<br>指令流水线阻塞的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x5<br>重命名站台因重排序缓冲(ROB)满引起指<br>令流水线停顿周期计数   |
| LQ 容量不足引起的指<br>令发射阻塞的比例           | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x6<br>发射站台因装入队列(LQ)满引起指令流水<br>线停顿的周期计数     |
| SQ 容量不足引起的指<br>令发射阻塞的比例           | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x7<br>发射站台因存储队列(SQ)满的周期计数停<br>顿的周期计数       |
| 取指和译码速度不足引<br>起指令流水线断流的比<br>例     | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x8<br>发射站台因缺少指令而无法发射的周期计数                  |
| 指令发射队列 IQ0 因各种原因无法全速发射的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x9<br>整数指令发射队列 IQ0 有阻塞情况的周期计<br>数          |
| 指令发射队列 IQ1 因各种原因无法全速发射的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x26<br>整数指令发射队列 IQ1 有阻塞情况的周期计<br>数。        |
| 指令发射队列 IQ2 因各种原因无法全速发射的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x27<br>整数指令发射队列 IQ2 有阻塞情况的周期计<br>数。        |
| 指令发射队列 AQ0 因<br>各种原因无法全速发射<br>的比例 | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x28<br>访存指令地址发射队列 AQ0 有阻塞情况的周<br>期计数。      |
| 指令发射队列 AQ1 因<br>各种原因无法全速发射<br>的比例 | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x29<br>访存指令地址发射队列 AQ1 有阻塞情况的周<br>期计数。      |
| 指令发射队列 ISQ 因各种原因无法全速发射的比例         | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x2a<br>整数存储指令数据发射队列 ISQ 有阻塞情况<br>的周期计数。    |
| 指令发射队列FSQ因各种原因无法全速发射的比例           | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x2b<br>浮点存储指令数据指令发射队列 FSQ 有阻塞<br>情况的周期计数。  |
| 指令发射队列FQ0因各                       | PC0_SEL=0x8         | PC1_SEL=0x2c                                        |



| 种原因无法全速发射的              | 周期计数                | 浮点指令发射队列 FQ0 有阻塞情况的周期计                       |
|-------------------------|---------------------|----------------------------------------------|
| 比例                      |                     | 数。                                           |
| 指令发射队列FQ1因各种原因无法全速发射的比例 | PC0_SEL=0x8<br>周期计数 | PC1_SEL=0x2d<br>浮点指令发射队列 FQ1 有阻塞情况的周期计<br>数。 |

3) 访存流水线事件计数的配置方法如表 B-3 所示。

表 B-3 监测访存流水线性能的配置方法

| 14 AL UNI 1 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  | 表 B-3 监测功仔流水线性                                    |                               |  |  |
|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------|-------------------------------|--|--|
| 性能测试事件                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         | 事件计数器 0                                           | 事件计数器 1                       |  |  |
| ITB 脱靶率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | $PC0\_SEL = 0x9$                                  | $PC1\_SEL = 0x17$             |  |  |
| 1110 加州中                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       | ITB 访问次数计数                                        | ITB 脱靶次数计数                    |  |  |
| DTD C:1. 附如玄                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | $PC0\_SEL = 0xA$                                  | $PC1\_SEL=0x30$               |  |  |
| DTB Single 脱靶率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | DTB 访问次数计数                                        | DTB SingleMiss 次数计数           |  |  |
| DED D 11 114 #m =>=                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | PC0_SEL=0xA                                       | PC1_SEL=0x31                  |  |  |
| DTB Double 脱靶率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | DTB 访问次数计数                                        | DTB Double Miss 次数计数          |  |  |
| LIC A CO A DIV thm ->                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          | PC0 SEL=0xB                                       | PC1 SEL=0x16                  |  |  |
| 指令 Cache 脱靶率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | 指令 Cache 访问次数计数                                   | 指令 Cache 脱靶次数计数               |  |  |
| Not the analysis of the Analys | PC0_SEL=0xC                                       | PC1_SEL=0x32                  |  |  |
| 数据 Cache 脱靶率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | 数据 Cache 访问次数计数                                   | 数据 Cache 脱靶次数计数               |  |  |
|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | $\begin{array}{c} \text{PC0 SEL=0xD} \end{array}$ | PC1 SEL=0x10                  |  |  |
| SCache 脱靶率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | 二级 Cache 访问次数计数                                   | SCache 脱靶次数计数                 |  |  |
| 核外一致性机制对副                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | PC0 SEL=0xF                                       | PC1 SEL=0x14                  |  |  |
| 本记录的精确率                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | Probe 请求次数计数                                      | Probe 请求查询命中 SCache 次数        |  |  |
| 读读重发自陷发生比                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | PC0_SEL=0x1                                       | PC1_SEL=0x33                  |  |  |
| 例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              | 退出的访存指令计数                                         | 读一读重发自陷次数计数                   |  |  |
| 写读重发自陷发生比                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | PC0 SEL=0x1                                       |                               |  |  |
|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | _                                                 | PC1_SEL=0x34<br>写             |  |  |
| 例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              | 退出的访存指令计数                                         | 写一读重发自陷次数计数                   |  |  |
| DBOX 重发自陷发生                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | $PC0\_SEL=0x1$                                    | PC1_SEL=0x36                  |  |  |
| 比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             | 退出的访存指令计数                                         | 数据 Cache 管理部件重发自陷总次数计         |  |  |
|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |                                                   | 数                             |  |  |
| 非预取指令发生                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        | PC0_SEL=0xC                                       | PC1_SEL=0x37                  |  |  |
| DcacheMiss 的次数                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 | 数据 Cache 访问次数计数                                   | 非预取指令发生 DcacheMiss 的次数        |  |  |
| L1DTBMiss, L2 DTB                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              | $PC0\_SEL=0x1$                                    | $PC1\_SEL = 0x18$             |  |  |
| 命中或偶校验导致的                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 退出的访存指令计数                                         | L1 DTB 命中,L2DTBmiss 或 L2DTB 小 |  |  |
| 自陷发生比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         |                                                   | 页偶校验错导致的自陷                    |  |  |
| 同站台旁路冲突发生                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | $PC0\_SEL=0x1$                                    | $PC1\_SEL=0x1a$               |  |  |
| 比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             | 退出的访存指令计数                                         | 同站台旁路冲突计数                     |  |  |
| MAF满冲突发生比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     | $PC0\_SEL = 0x1$                                  | $PC1\_SEL = 0x1b$             |  |  |
| WAIT例作大汉主比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    | 退出的访存指令计数                                         | MAF 满导致的冲突                    |  |  |
| 日志刊中郊先生小園                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | PC0_SEL=0x1                                       | PC1_SEL=0x1c                  |  |  |
| 同索引冲突发生比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | 退出的访存指令计数                                         | 同索引冲突                         |  |  |
|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | DG0 GD1 0 4                                       | $PC1\_SEL = 0x1d$             |  |  |
| Dcache 端口 0 冲突发                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | $PC0\_SEL = 0x1$                                  | 流水线 A 与 C 发生的 Dcache 端口 0 冲   |  |  |
| 生比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | 退出的访存指令计数                                         | 突                             |  |  |
| Mile                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |                                                   | PC1 SEL=0x1e                  |  |  |
| Dcache 端口 1 冲突发                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | $PC0\_SEL = 0x1$                                  | 流水线 B 与 D 发生的 Dcache 端口 1 冲   |  |  |
| 生比例                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            | 退出的访存指令计数                                         | 突                             |  |  |
| 流水线B与捎带响应                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      | PC0_SEL=0x1                                       | PC1_SEL=0x1f                  |  |  |
|                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                | _                                                 | 流水线 B 与捎带响应发生的写寄存器冲           |  |  |
| 写寄存器冲突发生比 退出的访存指令计数                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            |                                                   | がられるココロルで及上的一句行館件             |  |  |



| lee I         |          |
|---------------|----------|
| <i>\ta</i> il | <u>。</u> |
| ניע           | ·        |



# 附录 C CHIP\_ID 定义

- 1) 从 6A 芯片开始,将 CSR:IS\_CTL 中 CHIP\_ID 所占用的区段作为保留位,固定设置为"0x3F",指示具体的 ID 号在 MCU 中新设的寄存器 IOR: CHIP\_CORE 中。
- 2) 在芯片的维护部件(MCU)内增加专门的 IOR: CHIP\_CORE 寄存器,其定义如下:

#### 表 C-1CHIP\_COR 寄存器描述

| 名称          | 范围      | 类型 | 描述                                                                                                                                          |
|-------------|---------|----|---------------------------------------------------------------------------------------------------------------------------------------------|
| 芯片架构系列<br>号 | [3:0]   | RO | 架构序列号:区分不同系列,16个系列,可以使用30年;<br>0x00:申威1系列<br>0x01:申威2系列<br>                                                                                 |
| 芯片封装架构<br>号 | [7:4]   | RO | 区分不同封装或不同裁减的芯片:通过封装基板来设置,增加4根引脚!根据该系列芯片中不同架构类型顺序编号,对于一次流片多种不同封装形态(核心、存控、IO配置)的芯片,可以根据配置引脚或寄存器的值,由MCU自动译码得到芯片架构号。                            |
| 主核心系列号      | [15:8]  | RO | 高四位为大系列号,低四位为系列微调号: 0x0X 无通用核心 0x1X Core1 0x2X Core2 0x30 Core3 0X31 SW421                                                                  |
| 从核心系列号      | [23:16] | RO | 高四位为大序列号,低四位为系列微调号: 0x00 无从核心 0x1X Score1                                                                                                   |
| 流片序列号       | [31:24] | RO | 高四位为流片号(指示此工艺的使用次数以及工艺分支的区别,如G工艺还是LL工艺等),低四位为工艺代号:选择有0.35um、0.18um、0.13um、90nm、65nm、45/40nm、32/28nm、22/20nm、16/14nm、10nm、7nm、5nm、3nm、特殊工艺1、 |



|                    |       |    | 中國 121 及星間 机门及口 1 加           |  |
|--------------------|-------|----|-------------------------------|--|
|                    |       |    | 特殊工艺2                         |  |
|                    |       |    | 0x0 130nm                     |  |
|                    |       |    | 0x1 90nm                      |  |
|                    |       |    | 0x2 65nm                      |  |
|                    |       |    | 0x3 45nm                      |  |
|                    |       |    | 0x4 40nm                      |  |
|                    |       |    | 0x5 32nm                      |  |
|                    |       |    | 0x6 28nm                      |  |
|                    |       |    | 0x7 16nm                      |  |
|                    |       |    | 0x8 14nm                      |  |
|                    |       |    |                               |  |
| <i>&gt;</i> → 11 □ |       |    | 区分不同的流片,为"002"指示第一次流片,为"012"指 |  |
| 流片号                | [1:0] | RO | 示第二次流片,如此类推。                  |  |
|                    | 其它    | RO | 保留                            |  |



# 附录 D 各种中断的初始向量值

上电复位或冷复位结束后, CSR: INT\_STAT0~3 中的各种中断对应的向量位置如表 D-1 所示。

表 D-1INT\_STAT3 寄存器复位后对应的中断

| 次 5 III 1 5 III 1 II |        |    |            |  |
|----------------------|--------|----|------------|--|
| 名称                   | 范围     | 类型 | 描述         |  |
| SLEEP                | [63]   | RO | 睡眠中断请求。    |  |
| MCHK_INT             | [62]   | RO | 机器检查错中断请求。 |  |
| CR                   | [61]   | RO | 己纠正错中断请求。  |  |
| PC1                  | [60]   | RO | 事件计数1中断请求。 |  |
| PC0                  | [59]   | RO | 事件计数0中断请求。 |  |
| TIMER_INT            | [58]   | RO | 定时器中断请求。   |  |
| _                    | [57:0] | _  | 保留         |  |



# 附录 E修改记录

| 日期        | 修改人 | 版本  | 内容                                                                                                                                                                                    |
|-----------|-----|-----|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 2015-6-10 | 李俊  | 1.0 | 全面修订本手册: 1.地址扩展修改原则: 虚地址由 C3 的 43 位扩展为 C3A 的 53 位, 物理地址由 C3 的 40 位扩展为 C3A 的 48 位。C3A 指令虚地址 PC[52]位的作用等同于 C3 时 PC[42]的作用; C3A 物理地址的[48:47]位的作用等同于 C3 时物理地址的[39:38]位,C3A 物理地址中没有核组号的概念。 |
|           |     |     | 2.主要如下修改:                                                                                                                                                                             |
|           |     |     | 2.2.1: SYS_CALL 和 SYS_CALL/b 指令地址的拼接方式,由于 PRI_BASE 扩展引起; 2.2.2: DEFAULT: 数据流数值匹配、数据流地址和数值同时匹配也进入该入口                                                                                   |
|           |     |     | 3.1 CSR 编址:<br>增加 DV_MATCH,DV_MASK<br>TID,SOFTCSR0~47                                                                                                                                 |
|           |     |     | 3.2CSR 访问机制的改变                                                                                                                                                                        |
|           |     |     | 3.3 ITB_TAG, ITB_PTE, ITB_IS, EXC_PC, IVA_FORM, PTBR, PRI_BASE, VPT_BASE, IA_MATCH, IA_MASK,                                                                                          |
|           |     |     | 3.4<br>DTB_TAG, DTB_PTE, DTB_IS, DS_STAT, DS_CTL,<br>DC_CTL, DC_STAT, DA_MATCH, DA_MASK,<br>DA_MATCH_MODE, DVA (物理地址含义),<br>DVA_FORM, DV_MATCH, DV_MASK,                              |
|           |     |     | 3.5<br>SC_STAT                                                                                                                                                                        |
|           |     |     | 3.6<br>IDA_MATCH, IDA_MASK, TID, SOFTCSR0~47                                                                                                                                          |
|           |     |     | 新增数据流数值匹配使用见 6.5 节, 10.2 节                                                                                                                                                            |
|           |     |     | 附录 A 根据新的 CSR 机制也进行了修订。                                                                                                                                                               |



|            |     |     | 不然 121 发程部状计设计 7 加                      |
|------------|-----|-----|-----------------------------------------|
| 2015-6-25  | 何军  | 1.0 | 修改 3.4.11 节 DC_CTL 定义,增加硬件预取开关          |
| 2015-7-3   | 何军  | 1.0 | 修改 3.4.11 节 DC_CTL 定义,分别为三级 Cache 设置    |
|            |     |     | 硬件预取开关                                  |
| 2015-7-20  | 李俊  | 1.0 | 1.将原有的 SYS_CALL 指令,通过指令编码的[25]位,        |
|            |     |     | 区分为 SYS_CALL 和 SYS_CALL/b; 主要修改 2.1,    |
|            |     |     | 2.2, 10.1.1;                            |
|            |     |     | 2.在 ITAG 中增加 VPN 存储,修改 ITAG 记录和访问       |
|            |     |     | 方式,主要修改 4.2.1, 4.4.4。                   |
| 2015-8-17  | 张晓东 | 1.0 | 基于对 4C 软件兼容的要求,修改 3.1DV_MATCH 编         |
|            |     |     | 址以及 3.4.9DS_STAT 的[20:18]位的描述。          |
| 2015-9-10  | 巩玉坤 | 1.0 | 修改 3.3.23 关于 ISSUE 发射控制的说明。             |
| 2015-9-14  | 王雨雷 | 1.0 | 将 3.5.2 中表 3-52 中 CTL_ERR_RQ2_SCSTA 改为  |
|            |     |     | CTL_ERR_RQ2_SCSTAT                      |
| 2015-9-17  | 巩玉坤 | 1.0 | 修改文档描述错误: 3.3.17、3.3.34、3.4.19。         |
|            |     |     | 补充说明:                                   |
|            |     |     | 5.1 加入"睡眠中断需要登记 INT_STAT0~3"            |
|            |     |     | 5.2 加入"定时器中断"。                          |
| 2015-9-18  | 张晓东 | 1.0 | 修改 DC_CTL[12:14]位的描述。                   |
| 2015-11-13 | 李俊  | 1.0 | 修改 CHIP_ID 定义,附录 C                      |
| 2015-11-23 | 李俊  | 1.0 | 发生数据流数值匹配时,在 DVA 中记录的是物理地               |
|            |     |     | <b>址而不是虚地址,修改 3.4.16 和 10.2</b>         |
| 2015-12-8  | 张晓东 | 1.0 | 补充 10.2.3 登记 CSR: DS_STAT 的补充说明。        |
| 2015-12-8  | 张晓东 | 1.0 | 修改 3.4.16 DVA 登记物理地址的情况。                |
|            |     |     | 修改 10.2 在发生数据流匹配时登记 DVA 的描述;新           |
|            |     |     | 增 10.2.4 节描述数据流匹配的总体情况。                 |
| 2015-12-22 | 张晓东 | 1.0 | 修改 3.4.9、3.4.10、10.2 数据流数值匹配相关的描述,      |
|            |     |     | 补充说明使匹配功能更好理解。                          |
| 2016-1-19  | 张晓东 | 1.0 | 修改 3.4.19、10.2.2,补充对 DV_MASK 的使用说明。     |
| 2016-1-25  | 李俊  | 1.0 | 修改 3.3.39 和 5.1.2.3 明确对阈值 CSR: TIMER_TH |
|            |     |     | 的修改,只能在 TIMER_CTL[TIMER_EN]关闭的情         |
|            |     |     | 况下进行。                                   |
| 2016-3-18  | 何军  | 1.0 | 校对全文,修订描述不够准确的地方,比如 ICache              |
|            |     |     | 增加 VPN、数值匹配相关的内容。并根据发现的遗留               |
|            |     |     | 问题,补充修改了 10.2.4 节。                      |
| 2016-5-4   | 李俊  | 1.0 | SW421 相对于 Core3 进行了少量的指令集扩展和修           |
|            |     |     | 改,修改第1章的对应描述                            |