媒体数字信号处理器IP核微结构优化研究

媒体处理器论文 指令配置论文 数据转发论文 微结构论文 超标量论文
论文详情
随着集成电路技术和信息处理技术的发展,微处理器芯片设计已经成为当今的热点研究问题。工艺技术的进步和应用需求的增长对微处理器芯片的设计方法、体系结构等带来了重要的影响。特别是在嵌入式领域,高性能、低功耗、丰富的软件支持以及较短的设计验证时间对嵌入式处理器而言至关重要。本文作者参与了浙江大学信息与通信工程研究所SoC R&D小组承担的具有自主知识产权的媒体数字信号处理器IP核MediaDSP64的研发工作。作为部分研究成果,本文主要围绕处理器的功能设计与结构优化展开。在保持处理器核心指令集二进制兼容性的前提下,从面向应用的扩展指令集配置、流水线数据通道与控制通道优化、以及复杂DSP指令的乱序多发射特性等方面出发,对处理器的性能进行增强设计研究。指令集的配置任务分为两种类型进行实现,一是对应用领域进行整体特性评估并设计专用的指令集,二是对具体算法进行瓶颈分析并设计特殊的增强指令。以媒体处理核心算法为例,文中分别以并行度较高和串行度较高两个角度出发,对上述两种类型的配置任务分别进行论述。前者以SIMD指令集为例进行优化设计,除了扩展数据操作位宽之外,通过对访存单元与执行单元的协同优化,减少了SIMD操作对数据排列与数据位宽的要求。后者以码流处理算法为例,结合处理器流水线的结构特点,将循环体内的多个串行操作融和在单条指令内执行,不仅节省了代码空间,也提高了处理器在目标应用中的性能。通过对流水线数据通道与控制通道的复用,减少了指令配置过程的设计复杂度及其对处理器资源与延时的影响。流水线微结构优化包含数据通道与控制通道两个方面。文中建立通用的数据转发模型对复杂DSP指令的执行过程进行分析,通过集中转发源以及删减次要路径的方式实现了一种分布式部分转发结构。并针对转发网络中数据丢失问题,设计了自适应备份寄存器机制,通过对相关寄存器进行动态镜像的方式消除了数据丢失现象。采用提前写回策略减少了转发网络中的数据源,并针对由此造成的指令乱序执行问题,设计了影子寄存器机制保证了精确异常的实现。使用了提前判定算法代替了之前的即时判定算法,能够在本周期内判断出下一周期中流水线内的指令相关性,在处理器关键路径中隐藏了相关检测电路的延时。通过上述改进措施,在TSMC 130 nm (Generic and Worst Case)下,处理器可以达到400 MHz的工作频率。最后设计实现了一种硬件复杂度较低且具有乱序多发射特性的超标量处理器MD64SS.通过将复杂DSP指令拆分为多条微指令保证指令集的兼容性,使用着色法实现了复杂DSP指令的原子提交。通过指令二次编码与即时译码技术实现了指令信息的封装性,在增加子流水线与新指令时只需修改译码器和功能单元,而之间的指令调度器模块无需进行任何修改。通过结合寄存器广播与指令计数器两种方案将就绪逻辑的关键路径拆分为两个部分,减少了指令发射电路的延时,提高了处理器的工作频率。对典型应用的性能评估表明处理器的性能可以提高约50%-80%。TSMC 130 nm Generic工艺下处理器最高可以工作在约620MHz,在TSMC 90 nm Fast工艺下处理器最高可以工作在约1030 MHz。
致谢第5-6页
摘要第6-8页
Abstract第8-9页
1 绪论第12-36页
    1.1 RISC处理器与DSP处理器第13-16页
    1.2 微处理器的设计趋势第16-22页
    1.3 典型的嵌入式微处理器第22-29页
        1.3.1 单发射嵌入式处理器第22-24页
        1.3.2 VLIW结构嵌入式处理器第24-26页
        1.3.3 超标量嵌入式处理器第26-29页
    1.4 MediaDSP64处理器简介第29-31页
    1.5 本文的研究工作及内容安排第31-36页
2 媒体处理器指令增强设计研究第36-80页
    2.1 MD64的RISC/DSP构造第40-50页
        2.1.1 指令集构造第41-45页
        2.1.2 流水线结构第45-48页
        2.1.3 可配置性设计第48-50页
    2.2 并行操作的增强设计第50-64页
        2.2.1 算法分析第51-55页
        2.2.2 指令集功能设计第55-57页
        2.2.3 指令集编码设计第57-59页
        2.2.4 指令集硬件支持第59-63页
        2.2.5 MDE指令集性能评估第63-64页
    2.3 串行操作的增强设计第64-76页
        2.3.1 算法分析第65-68页
        2.3.2 指令设计第68-75页
        2.3.3 指令性能评估第75-76页
    2.4 指令可配置性设计第76-78页
    2.5 本章小结第78-80页
3 媒体处理器微结构的数据通道与控制通道优化研究第80-130页
    3.1 处理器微结构分析第81-91页
        3.1.1 处理器的微结构定义第81-82页
        3.1.2 处理器的流水线结构分析第82-87页
        3.1.3 流水线效率和流水线冲突第87-91页
    3.2 流水线数据转发网络设计第91-101页
        3.2.1 数据转发模型第91-95页
        3.2.2 转发模型分析第95-97页
        3.2.3 转发通道设计第97-101页
    3.3 MD64数据转发设计第101-112页
        3.3.1 流水线模型分析第101-104页
        3.3.2 转发网络设计第104-108页
        3.3.3 数据丢失问题第108-111页
        3.3.4 实验结果第111-112页
    3.4 MD64数据通道优化设计第112-119页
        3.4.1 分布式部分转发电路分析第113-114页
        3.4.2 提前写回策略与影子寄存器结构第114-117页
        3.4.3 实验结果第117-119页
    3.5 MD64控制通道优化设计第119-128页
        3.5.1 数据相关检测原理第121-123页
        3.5.2 提前判定算法第123-127页
        3.5.3 实验结果与分析第127-128页
    3.6 本章小结第128-130页
4 超标量媒体数字信号处理器的微结构设计研究第130-184页
    4.1 MD64SS的结构介绍与分析第132-139页
    4.2 寄存器重命名第139-157页
        4.2.1 算法分析第139-141页
        4.2.2 运行机制和实现方法第141-147页
        4.2.3 MD64SS的重命名方案第147-152页
        4.2.4 MD64SS重命名机制的DSP特性支持第152-156页
        4.2.5 资源占用与延时第156-157页
    4.3 指令调度器第157-181页
        4.3.1 整体结构分析第157-159页
        4.3.2 关键模块设计第159-172页
        4.3.3 MD64SS的优化策略第172-178页
        4.3.4 资源占用与延时第178-181页
    4.4 本章小结第181-184页
总结与展望第184-188页
参考文献第188-196页
作者简历第196页
    学习经历第196页
    作者攻读博士期间发表的论文第196页
    作者攻读博士期间参与的科研工作第196页
论文购买
论文编号ABS588101,这篇论文共196页
会员购买按0.30元/页下载,共需支付58.8
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付98
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656