最近被Metal调试恶心的够呛。今天先抽空记录一下Metal的Command相关对象的关系,也就是commandBuffercommandEncoder还有commandQueue相关的一些概念。

Metal 命令组织和执行模型

       在Metal架构中,MTLDevice协议定义了表示单个GPU的接口。该MTLDevice协议支持查询设备属性,创建其他设备特定对象(如缓冲区和纹理),以及编码(encoding)和排队(queueing)将要提交给GPU执行的 渲染(render) 和 计算(compute) 命令的方法。

       一个 命令队列(command queue) 包含一个 命令缓冲区(command buffers) 队列 ,并且一个命令队列整理那些命令缓冲区的执行顺序。命令缓冲区包含用于在特定设备上执行的编码命令(encoded commands)。一个 命令编码器(command encoder) 附加(一个)渲染,计算,或者位图传送命令(blitting commands)到command buffer,并且command buffers最终被提交到设备上执行。

       MTLCommandQueue协议为命令队列定义了一个接口,提供创建命令缓冲区对象的方法。MTLCommandBuffer协议为命令缓冲区定义了一个接口,并提供了创建命令编码器,排队执行命令缓冲区,检查状态和其他操作的方法。该MTLCommandBuffer协议支持以下命令编码器类型,它们是用于将不同类型的GPU工作负载编码到命令缓冲区的接口:

       在任何时候,只有一个命令编码器可以处于活动状态(active),并将命令追加到命令缓冲区中。每个命令编码器必须先结束(endEncoding),然后才能创建另一个命令编码器用于同一个的命令缓冲区。“每个命令缓冲区只有一个活动状态的命令编码器”规则的一个例外是MTLParallelRenderCommandEncoder协议,详情参见文档Encoding a Single Rendering Pass Using Multiple Threads

       一旦所有编码完成,你就提交MTLCommandBuffer对象本身,这会将命令缓冲区标记为准备好供GPU执行。MTLCommandQueue协议控制MTLCommandBuffer执行对象中的命令何时执行,相对于已经在命令队列中的其他MTLCommandBuffer对象。

       下图显示了命令队列,命令缓冲区和命令编码器对象如何紧密相关。图表上部的每一列组件(缓冲区,纹理,采样器,深度和模板状态,流水线状态)表示特定命令编码器的的资源和状态。

Metal Object Relationships

设备(Device)对象表示一个GPU

       一个MTLDevice对象代表一个可以执行命令的GPU。MTLDevice协议具有创建新命令队列,从内存分配缓冲区,创建纹理以及查询设备功能的方法。要获得系统中的首选系统设备,请调用MTLCreateSystemDefaultDevice方法。

Metal中的瞬态(Transient)和非瞬态(Non-transient)对象

       Metal中的某些对象被设计为瞬态且非常轻量级,而其他对象则更昂贵并且可能持续很长时间,可能在应用程序的整个生命周期中都会持续。

       命令缓冲区和命令编码器对象是暂时的,并且被设计成用于一次性使用。它们分配和释放资源非常便宜,所以它们的创建方法返回自动释放对象。

       以下对象不是瞬态的。在性能敏感的代码中复用这些对象,并避免重复创建它们。

命令队列 Command Queue

       command queue接受GPU将执行的command buffers的有序列表。所有发送到单个command queue的command buffers都保证按照command buffers排队的顺序执行。通常,Command Queue是线程安全的,并允许同时对多个活动命令缓冲区(active command buffer)进行编码。

       要创建命令队列,请调用对象的newCommandQueue方法或MTLDevice对象的newCommandQueueWithMaxCommandBufferCount:方法。一般来说,命令队列预计会有很长的生命周期,所以不应该反复创建和销毁。

命令缓冲区 Command Buffer

       命令缓冲区存储编码的命令,直到缓冲区被提交给GPU执行。单个命令缓冲区可以包含许多不同类型的编码命令,具体取决于用于构建它的编码器的数量和类型。在通常的应用程序中,即使渲染该帧涉及多个渲染过程,计算处理函数或blit(位块传送)操作,整个渲染帧也会被编码到单个命令缓冲区中。

       命令缓冲区是瞬态的一次性对象,不支持重用。一旦命令缓冲区被提交执行,唯一有效的操作是等待命令缓冲区被调度或完成 - 通过同步调用或在命令缓冲区注册执行的处理程序块,并检查命令缓冲区执行状态。

       命令缓冲区也是应用程序唯一可独立跟踪的工作单元,它们定义了由Metal内存模型建立的一致性边界,详见文档Resource Objects: Buffers and Textures

创建一个命令缓冲区

       要创建一个MTLCommandBuffer对象,请调用MTLCommandQueue对象的commandBuffer方法。一个MTLCommandBuffer对象只能被提交到创建它的MTLCommandQueue对象中。

       makeCommandBuffer方法创建的命令缓冲区保留执行所需的数据。对于某些情况,如果在执行MTLCommandBuffer对象期间在其他地方保存了这些对象,则可以通过调用MTLCommandQueue对象的commandBufferWithUnretainedReferences方法来创建命令缓冲区。使用commandBufferWithUnretainedReferences方法仅适用于性能至关重要的应用程序,这些应用程序可以保证关键对象在应用程序的其他位置具有引用,直到命令缓冲区执行完成。否则,不再有其他引用的对象可能会过早释放,并且导致命令缓冲区执行的结果未定义。

执行命令

       MTLCommandBuffer协议使用以下方法建立命令队列中命令缓冲区的执行顺序。命令缓冲区在提交之前不会开始执行。一旦提交,命令缓冲区按照它们入队的顺序执行。

       有关使用enqueue多线程的示例,请参阅文档Multiple Threads, Command Buffers, and Command Encoders

为命令缓冲区执行注册处理程序块

       下面列出的MTLCommandBuffer方法用来监视命令的执行。预定和完成的处理程序在未定义的线程上按执行顺序调用。您在这些处理程序中执行的任何代码都应该快速完成; 如果有昂贵或阻塞工作需要完成,请将该工作推迟到另一个线程。

       presentDrawable:方法是completed handler的特例。这种便捷方法在调度命令缓冲区时呈现可显示资源(CAMetalDrawable对象)的内容。有关该presentDrawable:方法的详细信息,请参阅文档Integration with Core Animation: CAMetalLayer

监视命令缓冲区执行状态

       只读status属性包含Command Buffer Status Codes中列出的MTLCommandBufferStatus枚举值,该值反映此命令缓冲区生存期中的当前的调度阶段。

       如果执行成功,则只读error属性的值为nil。如果执行失败,则status设置为MTLCommandBufferStatusError,并且该error属性可能包含一个Command Buffer Error Codes列出的值,表示失败的原因。

命令编码器 Command Encoder

       命令编码器是一种瞬态对象,您只需使用该对象将命令和状态以GPU可执行的格式写入单个命令缓冲区。许多命令编码器对象方法将命令追加到命令缓冲区。当一个命令编码器处于活动状态时,它拥有为其命令缓冲区追加命令的专有权。一旦完成编码命令,请调用该endEncoding方法。要编写更多命令,请创建一个新的命令编码器。

创建一个命令编码器对象

       由于命令编码器将命令附加到特定的命令缓冲区,因此您可以通过向要使用的MTLCommandBuffer对象发送请求命令来创建命令编码器。使用以下MTLCommandBuffer方法创建不同类型的命令编码器:

渲染命令编码器 Render Command Encoder

       图形渲染可以用rendering pass来描述。一个MTLRenderCommandEncoder对象表示与单个rendering pass相关联的渲染状态和绘图命令。一个MTLRenderCommandEncoder需要关联一个MTLRenderPassDescriptor,其中包含用作渲染命令目标的color, depth, 以及 stencil attachments。MTLRenderCommandEncoder有以下功能:

有关MTLRenderCommandEncoder协议的详细信息,请参阅文档Graphics Rendering: Render Command Encoder

计算命令编码器 Compute Command Encoder

       对于数据并行计算,MTLComputeCommandEncoder协议提供了在命令缓冲区中编码命令的方法,该命令缓冲区可以指定计算函数及其参数(例如,纹理,缓冲区和采样器状态)并分派计算函数(kernel function)以供执行。要创建一个计算命令编码器对象,可使用MTLCommandBuffer对象的computeCommandEncoder方法。有关MTLComputeCommandEncoder方法和属性的详细信息,请参阅文档Data-Parallel Compute Processing: Compute Command Encoder

Blit命令编码器 Blit Command Encoder

       MTLBlitCommandEncoder协议具有在缓冲区(MTLBuffer)和纹理(MTLTexture)之间追加内存复制操作命令的方法。MTLBlitCommandEncoder协议还提供了用纯色填充纹理并生成mipmap的方法。要创建的blit命令编码器对象,可使用MTLCommandBuffer对象的blitCommandEncoder的方法。有关MTLBlitCommandEncoder方法和属性的详细信息,请参阅Buffer and Texture Operations: Blit Command Encoder

Multiple Threads, Command Buffers, and Command Encoders

       大多数应用程序使用单个线程在单个命令缓冲区中为单个帧编码渲染命令。在每个帧的末尾,你提交了命令缓冲区,既调度又开始执行命令。

       如果要并行化命令缓冲区编码,则可以同时创建多个命令缓冲区,并使用单独的线程对每个命令缓冲区进行编码。如果事先知道命令缓冲区应该执行的顺序,那么MTLCommandBuffer对象的enqueue方法可以在命令队列中声明执行顺序,而不需要等待命令被编码和提交。否则,当一个命令缓冲区被提交时,它会在所有之前排入队列的命令缓冲区之后。

       同时只有一个CPU线程可以访问特定command buffer。多线程应用程序可以使用每个线程一个command buffer来并行创建command buffer。

       下图显示了一个包含三个线程的示例。每个线程都有自己的command buffer。对于每个线程,同时只有一个command encoder可以访问其关联的command buffer。图中还显示了每个命令缓冲区接收来自不同命令编码器的命令。完成编码后,调用command encoder的endEncoding方法,然后新的command encoder对象可以开始将命令编码到command buffer。

Metal Command Buffers with Multiple Threads

MTLParallelRenderCommandEncoder对象允许将单个rendering pass分解到多个command encoder并分配给不同的线程。有关MTLParallelRenderCommandEncoder更多信息,请参阅文档Encoding a Single Rendering Pass Using Multiple Threads

小结