探索Metal 如何在GPU上执行命令
概述
要让GPU代表您执行工作,请向其发送命令。命令执行您的应用所需的绘图。并行计算或资源管理工作。Metal
应用程序与GPU之间的关系时客户端-服务器模式的关系:
您的Metal 应用是客户
GPU是服务器
您可以通过将命令发送到GPU来发出请求
处理完命令后,GPU可以在您准备好进行更多工作时通知您的应用程序。
图1使用Metal时的客户端-服务器使用模式
- 要将命令发送到GPU,请使用命令编码器对象将它们添加到命令缓冲区,
- 您可以将命令缓冲区添加到命令队列中,然后在准备好让metal执行命令缓冲区的命令时提交命令缓冲区。
- 将命令放置在命令缓冲区,排队和提交命令缓冲区中的顺序很重要,因为它会影响metal承若执行命令的顺序。
以下各节介绍了设置工作命令结构的步骤,这些命令按创建对象以与metal交互的方式进行了排序。
制作初始化时间对象
您可以在初始化时创建一些metal对象,并且通常可以无限期地保持它们。这些是命令队列和管道对象。您只需要创建一次即可创建它们,因为它们的设置成本很高,但是一旦初始化,它们就可以快速重用。
制作命令队列
要创建命令队列,请调用设备的功能:makeCommandQueue()
commandQueue = device.makeCommandQueue();
由于您通常会重用命令队列,因此请对其进行强有力的引用。您可以使用命令队列来保存命令缓冲区,如下所示
图2 您的应用程序的命令队列
制作一个或多个管道对象
一个管道对象告诉金属如何处理你的命令。管道对象封装了您使用“金属” 着色语言编写的函数,以下是管道适合您的Metal工作流程的方式:
您编写用于处理数据的metal 着色器函数
创建一个包含着色器的管道对象
准备使用它时,请启用管道
进行平局,计算或盲注。
metal 不会立即执行绘制,计算或blit 调用;而是使用编码器对象将这些调用封装到命令缓冲区的命令插入,提交命令缓冲区后,metal 将其发送到GPU,并使用活动的管道对象处理命令。
** 图3 GPU上的活动管道包含处理命令的自定义着色器代码。**
向GPU发出命令
设置好命令队列和管道之后,就该向GPU发出命令了,这是您遵循的过程:
创建一个命令缓冲区
用命令填充缓冲区
将命令缓冲区提交给GPU
如果要在渲染循环中执行动画,则对动画的每一帧都执行此操作,您还可以按照此过程执行一次性图像处理或机器学习任务。
以下小节将详细指导您完成这些步骤
创建命令缓冲区
通过调用命令队列来创建命令缓冲区: makeCommandBuffer()
清单2 创建一个命令缓冲区
guard let commandBuffer = commandQueue.makeCommandBuffer() else {
return
}
对于单线程应用程序,您将创建一个命令缓冲区。图4显示了命令以其命令缓冲区之间的关系:
** 命令缓冲区与其包含的命令的关系**
将命令添加到命令缓冲区
当您在编码器对象上调用特定与任务的函数时(例如绘图,计算或blit操作),编码器会将与这些调用相对应的命令放在命令缓冲区中。编码器对命令进行编码,以包括GPU在运行时处理任务所需的所有内容。图5显示了工作流程:
图5 命令编码器将绘制结果插入命令到命令缓冲区中。
您可以根据具体任务用的具体子类对实际命令进行编码:MTLCommandEncoder
使用到的问题渲染命令。MTLRenderCommandEncoder
使用发出并行计算命令。MTLComputeCommandEncoder
使用到问题的资源管理命令。MTLBlitCommandEncoder
有关完整的渲染示例,请参见使用渲染管道渲染基元。有关完整的并行处理示例,请参见在计算函数中处理纹理
提交命令缓冲区
为了使您的命令能够运行,您可以将命令缓冲区提交给GPU
commandBuffer.commit()
提交命令缓冲区不会立即运行其命令。相反,metal会调度缓冲区命令,使其仅在您提交在队列中等待的先前命令缓冲区后才运行。如果您尚未显示排队命令缓冲区,则在提交缓冲区后,metal 会为您完成。
提交缓冲区后,您不会使用它,但是您可以选择通过其调度,完成或查询其status。
metal承诺,执行命令的顺序与您订购命令的方式相同,虽然metal可能会在处理命令之前对其进行重新排序,但这通常仅在获得性能提升且没有其他可察觉影响的情况下发生。