1、“.....纳萨雷,子昂,等核心编程清华大学出版社,附录作者在攻读学位期间发表的论文目录王成平,曾理,张红加速图像重建算法计算机应用研究,王成平,邹永宁基于三维分割的工业数据缺陷可视化西南第十二届无损检测学术年会会议论文,机械杂志,这些核心也显得尤为重要,提供了网格来组织和管理这些核心进行计算。图展示了简单的线程组织结构。图线程组织结构将系列的线程组织在起形成个块,然后系列的块组织在起形成最终的网格,这样组织的目的,主要是根据核心设计的特点来的,如图所示,在中,处理核心分为两种,种是被称为流多处理器的,这是的大核心,而每个中又包含了个变量流处理器,被称为小核心......”。
2、“.....只是个具有执行能力的单元,在同个中的共同享有套取指与发射单元,也就意味着他们只能执行相同的命令。图计算单元简图由于处理器的特殊设计,在真正进行计算的时候,任务是按照块来分配的,同个块的所有线程在同个中进行发射,这样同个块里面的所有线程享有个共享存储器,由于的数量对于个特定的来说是固定的,所以在块数量超过数量的时候,个中就同时存在多个块的上下文,但是个时刻,只有个块被激活,图给出了个从块到的简单映射关系,中以块为单位进行运算,实际在中映射是根据中的数量来决定的,这种映射是由来完成的,作为编程人员,只需要安排好自己的任务给线程或者块。中的块的数量会受到定的限制......”。
3、“.....般上限为个或者个,并且在个中其共享存储器也是受到定限制的。图块与的映射关系在执行核函数的时候采用的是的执行模式,也就是在同个块里面的线程都执行相同的指令,这样是为了提高计算效率,由于中的数量般是固定的,而块中的线程数会根据任务的不同可能有不同的设计,当块中的线程数超过了的数量,就会进行多次执行命令,让所有线程都执行完,这也是为了充分利用同个中有多个的特点。假如每个线程都需要单独的指令,这样个就只能利用到个,其他的就浪费掉了,计算效率大打折扣,而在设计块中的线程数量时,应该尽量让线程的数量是的倍数,这样就不至于的浪费。在编程的时候,数据的存储也是个非常重要的部分......”。
4、“.....各自有不同的作用,合理利用这些存储器,是提高程序执行效率的重要手段,图给出了存储器的层次结构。图存储器层次结构主要是利用中存储器的访问速度存储量大小以及些具有特定功能的存储块来进行安排的,其中寄存器与共享存储器享有片上的高速缓冲器,在这里访问数据,可以享有最快的速度,当然,如此宝贵的资源,在数量上也受到了很大的限制,在数量的限制内,合理利用这些存储器,可以有效的提高程序的执行效率。共享存储器作为种特殊的存储器,是为了在个块中提供给各个线程间快速通信的空间,相对于在其他地方进行线程间通信,这里的速度是最快的。这里剩下的存储器都是在的板载显存中的......”。
5、“.....然而这些存储器确提供了数量上的优势。局部存储器,作为寄存器的候补,在线程中如果寄存器不够用了,就会将局部数据存储在局部存储器中,由于局部存储器相对寄存器有较大的访问延迟,所以应当尽量避免这样的情况,在核函数中控制好局部变量的空间,合理的利用已经申请过的空间。全局存储器常量存储器以及纹理存储器都可以接受从内存端传过来的数据,作为内的数据源,但是从端到端的数据传输,都只能交给全局存储器了,因为常量及纹理存储器的内容都不能在端被更改,而且,如果确实需要在各个块之间共享数据或者通信,全局存储器就是必不可少的,当然如果是需要共享些常量,常量存储器就派上用场了,由于是只读区域......”。
6、“.....而且常量存储器般被安排在中的只读区域,提供了友好的缓存机制,这里常量是相对的,因为是从端传过来的,所以端具有修改权,由于这样的特性,常量及纹理存储器可以用作特殊用途,提升程序的鲁棒性及效率。纹理存储器,作为中比较特殊的部分,具有些特殊的功能,包括地址映射数据滤波缓存等,而这些功能都是围绕纹理渲染的需求设计的,这也是早期图形处理专用的单元。纹理存储器作为中种特别的存储器,其使用大致分为几个过程首先设置传送数据的通道,通过通道在端申请存储空间,然后拷贝数据到中,最后通过设置纹理参数,并将之前申请的空间与纹理进行绑定......”。
7、“.....纹理存储器提供了浮点数拾取坐标,将范围限制在中。最为重要的是在纹理存储器中,提供了滤波功能,滤波包括最近邻点与线性插值滤波,线性滤波根据纹理的维度而定,可以对两个元素针对维纹理四个元素针对二维纹理及八个元素针对三维纹理来进行线性差值运算,此运算不占用可编程单元,并提供额外的浮点数处理能力。对于些需要进行插值处理的数据,这是个可供参考的选择。充分利用了的各项能力,提供个友好的接口,来改善的可编程性,下面将介绍本文利用对体绘制算法的加速。加速体绘制算法对于体绘制算法,其并行性是非常良好的,对于每条射线,都可以看做个独立的可并行元素来考虑......”。
8、“.....图成像平面像素与线程对应关系上图中给出了成像平面像素与线程的对应关系,由于的核函数是通过块来运行的,所以还需要将这些线程组织在系列块中,图中虚线框展示了块的组织结果。这里考虑到中的数量以及每个中的存储容量的限制,将块的大小设置为固定的大小。而成像平面大小和是作为参数传入核函数中的,通过公式的计算,可以得到整个网格中块的维度。通过这样的方式,将整个体绘制的计算任务合理划分给核函数去计算,而具体的核函数的实现,包括以下步骤根据当前线程在块中的位置以及块在网格中的位置,计算出其对应的成像平面的坐标,如果坐标超出成像平面范围,直接返回,否则,进入......”。
9、“.....确定视角坐标光源坐标以及射线的方向向量。根据包围盒参数以及旋转矩阵,确定最近与最远取样点坐标。根据最近取样点以及步长,进入沿射线方向的循环采样合成阶段根据当前的采样点位置,在三维纹理中进行拾取,得到梯度及物体的密度信息。根据物体的密度信息,在传递函数绑定的维纹理中取得颜色和不透明度信息。根据光照模型以及体绘制的递归公式进行颜色和不透明度合成。根据合成得到当前的累加不透明度,如果该值大于或等于规定的阈值,退出循环,进入否则,根据采样步长将采样点沿射线方向移动步,继续。将循环中得到的累加颜色及不透明度信息传给全局数组,以便核函数结束后将结果传入到中......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。