ULSI架构主要描述ASIC的内部电路模块,是以怎样关联着的平面结构网络摆在管芯之中的,其形状类似于建筑物的平面图纸。
我们较早熟悉的是围绕单CPU(核)所构建的ASIC的内部平面网络。
我们应该熟悉的是ASIC内部网络必须是和谐的,包括数据流、控制流和关键存储体的良性互动。
未来将面临的是由二维架构升格为三维架构。
2DSP算法变换
各种DSP算法的本质是积和(SoP)公式变形,构造方法是系数缩放、变量扩增、变量平移、积和扩增、积和映射以及各种方法的组合等等。例如,自相关(麻省理工,1951年)基于变量平移和变量扩增。
林林点点的快速DSP算法,借助于公式和数学定理进行化简和逼近,分解要点是基于子运算、重复性、规律性和并行性,热衷于以和代积。例如,FFT算法(CooleyandTukey,1965年)巧妙利用了DFT变换中旋转因子W的.周期性和对称性。
揭示DSP算法锤炼设计和ULSI集成架构实现之间的关系,认真分析特定算法的内在特征(并行性、模块性和信号流机制),构造评价函数,灵巧尝试算法变换,寻优DSP算法使之并行化、模块化和层次化,降低其时间和空间复杂度,从而提速降耗。此间的典型数学技巧已概括入表1。
2。1坐标旋转
1956年至1971年,采用坐标旋转的算法得到开发和统一。该算法的基础是在直角坐标(1619年,笛卡尔)和极坐标(1691年,伯努利)中做坐标旋转,根据被计算函数的特点选取两种坐标系之一。来自坐标变换发明者本人的研究声音是:在变换过的坐标系中,某些特殊函数的运算得以强力简化。
坐标旋转算法对应的架构,只需加法、移位和迭代等基本操作,无需乘除运算。DSP算法基于坐标旋转易于组合出创新架构。
2。2分布计算
概念:分布计算(Croisier,1973年)是算法变换优化的经典范例,用于设计矢量乘法元架构。
方法:矢量经由二进制编码,内积重新排序与混合,基于查找表(LUT)实现与乘数无关,结果使乘法运算“分布”成读ROM且加权累加。
用途:卷积和DCT的实现。
如果说地位重要的DSP算法变换,其数学技巧具有发散的性质,那么,ULSI架构优化的变换技巧则有规律可循。
3ULSI架构优化
实际需求的DSP的吞吐率(采样率)与计算能力及性能之间存在两条鸿沟,基于架构(包括可重构)是重要解决方案。因此,DSP算法变形(逼近)优化在先,然后直接或组合映射ULSI架构。评价标准可参考ULSI架构全局模型的三要素:网络几何结构G,处理单元F,网络定时T。
优秀的DSP算法适配到合理的ULSI架构,是创新过程,通用法则急需总结。应特别注意:DSP算法得以ULSI实现的有效性,决定于算法内部数据流的复杂性。
已知DSP算法,基于DSP积、和的元架构,设计ULSI系列高层次架构的方法,可概论为以下8种,其特点列于表2。
3。1管线(流水线)
意义:缩短关键路径,提速降耗;管线即流水线。
本质:时间并行处理,方法是流水线锁存器插入SFG的前馈割集。
缺点:①对非递归网络,增加了锁存器数目和系统时延;②流水的多时钟风格因时钟歪斜而异化。
改进:一是采用波流水线,减少流水级数,但不增加锁存器数目;另一为异步流水,基于握手信号通信而无全局同步。
3。2并行
意义:缩短关键路径,提速降耗。
本质:空间并行处理方法,复制原始串行硬件,构造并入并出系统。
特点:其一,并行与流水线互为对偶,二者都挖掘计算的并发性,一为并行,另一为交替(同步或异步);其二,并行和流水的降耗思路:降低电源电压,以提高采样速度换取功耗降低。
4结论讨论
DSP算法起源于17世纪的有限差分、数值积分和数值差值等经典算法。
DSP算法一般是积和项的叠加繁衍。DSP算法是一种粘合剂,将“数字汇聚”粘合在一起。
从DSP算法映射到ULSI架构,是集成电路正向设计中极其重要的研究课题之一。
针对算法的计算核——积和项,分兵两路展开研究:一是通过编程,使算法适应冯诺伊曼结构或哈佛结构的既有CPU或DSP(数字信号处理器);另一是改变未知ULSI架构来使之适合算法——面向算法的专用处理器阵列设计,而ULSI(或3D—SOC)的规则布线要求,需要算法结构化对称化,以便分解为并行计算。