如何将程序分析与优化中的10指令级并行技术改写为一个长尾词?
- 内容介绍
- 文章标签
- 相关推荐
本文共计3218个文字,预计阅读时间需要13分钟。
本章为系列文章的第十章,主要介绍CPU流水线、超标量体系结构等硬件设计,以及编译器如何通过这些设计减少计算时间。内容来自DCC888的学习笔记或个人理解。
本章是系列文章的第十章,主要介绍CPU流水线、超标量体系架构等硬件设计,和编译器怎么使能这些功能来减少计算的时钟周期。
10.1概念本文中的所有内容来自学习DCC888的学习笔记或者自己理解的整理,如需转载请注明出处。周荣华@燧原科技
- 指令级并行是是让一个程序中的多个操作同时执行的方法
- 指令级并行对原生的顺序程序也能带来并行效果
- 使能指令级并行的方法:
- 指令流水线,一起触发一条指令,但多条指令的执行时间可以重叠
- 超标量体系架构执行:一条指令里面由多条标量指令打包而成触发的并行执行
对下面的c代码:
1 void swap(int v[], int k) { 2 int temp; 3 temp = v[k]; 4 v[k] = v[k + 1]; 5 v[k + 1] = temp; 6 }
有两种汇编编译结果。
本文共计3218个文字,预计阅读时间需要13分钟。
本章为系列文章的第十章,主要介绍CPU流水线、超标量体系结构等硬件设计,以及编译器如何通过这些设计减少计算时间。内容来自DCC888的学习笔记或个人理解。
本章是系列文章的第十章,主要介绍CPU流水线、超标量体系架构等硬件设计,和编译器怎么使能这些功能来减少计算的时钟周期。
10.1概念本文中的所有内容来自学习DCC888的学习笔记或者自己理解的整理,如需转载请注明出处。周荣华@燧原科技
- 指令级并行是是让一个程序中的多个操作同时执行的方法
- 指令级并行对原生的顺序程序也能带来并行效果
- 使能指令级并行的方法:
- 指令流水线,一起触发一条指令,但多条指令的执行时间可以重叠
- 超标量体系架构执行:一条指令里面由多条标量指令打包而成触发的并行执行
对下面的c代码:
1 void swap(int v[], int k) { 2 int temp; 3 temp = v[k]; 4 v[k] = v[k + 1]; 5 v[k + 1] = temp; 6 }
有两种汇编编译结果。

