微软为Xbox One开发人员解锁更多GPU能力

时间:2019-08-12 08:45   编辑:微变传奇   关键词:

Xbox One为Kinect和应用程序能预留了10%的图形资源,Digital Foundry可以确认,微软计划在未来为游戏开发开放这种额外的GPU能。在我们与Xbox One芯片背后的两位架构师进行了长时间的讨论时,我们发现了这个以及更多基于图形和能的信息。

“Xbox One在GPU上有一个保守的10%时间切片保留用于系统处理。这既用于Kinect的GPGPU处理,也用于渲染并发系统内容,如快照模式,”微软技术研究员安德鲁古森告诉我们。

“目前的预订提供了标题与系统之间的强大隔离,简化了游戏开发 - 强大的隔离意味着系统工作负载可变,不会影响游戏渲染的能。未来,我们计划为开发人员提供更多选项,以便在保持完整系统能的同时访问此GPU预留时间。“

一旦你克服了最初的意外,即后台系统首先占用了相当多的GPU时间,那么能够让开发人员访问这些资源而不影响能的想法可能听起来像是拥有你的蛋糕和吃它,但微软指出GPU硬件的特定方面使这种情况成为可能。

“除了异步计算队列,Xbox One硬件还支持两个并发渲染管道,”Goossen指出。 “两个渲染管道可以允许硬件以高优先级渲染标题内容,同时以低优先级渲染系统内容.GPU硬件调度程序旨在最大化吞吐量并自动填充高优先级处理中的”漏洞“。这可以允许例如,当标题同时在计算单元上进行同步计算作时,系统呈现以利用ROP进行填充。“

尝试全面解决有关架构的ESRAM和系统内存带宽的问题,与PlayStation 4相比,Xbox One的填充率和ROP缺陷问题现在正在显微镜下。 ROP是从像素,矢量和纹素信息中物理写入最终图像的GPU的元素:PlayStation 4的32个ROP通常被认为是1080p分辨率的过度杀戮(AMD的底层架构从未专门用于全高清,但是其他分辨率,如2560x1400 / 2560x1600),而Xbox One的16个ROP理论上可能被开发人员淹没。

在我们的采访中,微软公布了它所进行的研究表明,GPU时钟速度增加6.6%对系统的影响比两个额外的AMD Radeon Graphics Core Next计算单元更有利。我们的问题很简单 - 这些测试的结果是否因代使ROP饱和而产生偏差?

“我们选择让标题开发人员以最适合其游戏内容的方式对分辨率与每像素质量进行权衡。较低的分辨率通常意味着每个像素的质量可以更高。 “

画廊:第一方独家Killer Instinct以720p的原始分辨率运行的消息令许多游戏玩家感到惊讶 - 并没有给人留下深刻的印象。

“是的,帧的某些部分可能已经受ROP。但是,在我们更详细的分析中,我们发现在ROP上绑定但不受带宽的典型游戏内容帧的部分通常是相当的提高6.6%时钟速度是赢得额外CU的主要原因是因为它提升了管道的所有内部部分,如顶点速率,三角速率,绘制发布率等,“Goossen解释道。”

“'平衡'系统的目标是在任何一个区域都不会始终存在瓶颈。通常,在平衡系统中,任何给定框架的过程中都应该很少出现单一瓶颈 - 框架的一部分可以是填充率绑定,其他可以是ALU绑定,其他可以是获取绑定,其他可以是内存绑定,其他可以是波占用绑定,其他可以是绘制设置绑定,其他可以是状态更改绑定等。更复杂的是,GPU瓶颈可以在一次绘制调用过程中发生变化!“

显然,有理由认为有更多的ROP随叫随到是最好的情况,即使它们基本上没有使用 - 这就是PlayStation 4所提供的。微软的观点是它的硬件设置

Xbox One为Kinect和应用程序能预留了10%的图形资源,Digital Foundry可以确认,微软计划在未来为游戏开发开放这种额外的GPU能。在我们与Xbox One芯片背后的两位架构师进行了长时间的讨论时,我们发现了这个以及更多基于图形和能的信息。

“Xbox One在GPU上有一个保守的10%时间切片保留用于系统处理。这既用于Kinect的GPGPU处理,也用于渲染并发系统内容,如快照模式,”微软技术研究员安德鲁古森告诉我们。

“目前的预订提供了标题与系统之间的强大隔离,简化了游戏开发 - 强大的隔离意味着系统工作负载可变,不会影响游戏渲染的能。未来,我们计划为开发人员提供更多选项,以便在保持完整系统能的同时访问此GPU预留时间。“

一旦你克服了最初的意外,即后台系统首先占用了相当多的GPU时间,那么能够让开发人员访问这些资源而不影响能的想法可能听起来像是拥有你的蛋糕和吃它,但微软指出GPU硬件的特定方面使这种情况成为可能。

“除了异步计算队列,Xbox One硬件还支持两个并发渲染管道,”Goossen指出。 “两个渲染管道可以允许硬件以高优先级渲染标题内容,同时以低优先级渲染系统内容.GPU硬件调度程序旨在最大化吞吐量并自动填充高优先级处理中的”漏洞“。这可以允许例如,当标题同时在计算单元上进行同步计算作时,系统呈现以利用ROP进行填充。“

尝试全面解决有关架构的ESRAM和系统内存带宽的问题,与PlayStation 4相比,Xbox One的填充率和ROP缺陷问题现在正在显微镜下。 ROP是从像素,矢量和纹素信息中物理写入最终图像的GPU的元素:PlayStation 4的32个ROP通常被认为是1080p分辨率的过度杀戮(AMD的底层架构从未专门用于全高清,但是其他分辨率,如2560x1400 / 2560x1600),而Xbox One的16个ROP理论上可能被开发人员淹没。

在我们的采访中,微软公布了它所进行的研究表明,GPU时钟速度增加6.6%对系统的影响比两个额外的AMD Radeon Graphics Core Next计算单元更有利。我们的问题很简单 - 这些测试的结果是否因代使ROP饱和而产生偏差?

“我们选择让标题开发人员以最适合其游戏内容的方式对分辨率与每像素质量进行权衡。较低的分辨率通常意味着每个像素的质量可以更高。 “

画廊:第一方独家Killer Instinct以720p的原始分辨率运行的消息令许多游戏玩家感到惊讶 - 并没有给人留下深刻的印象。

“是的,帧的某些部分可能已经受ROP。但是,在我们更详细的分析中,我们发现在ROP上绑定但不受带宽的典型游戏内容帧的部分通常是相当的提高6.6%时钟速度是赢得额外CU的主要原因是因为它提升了管道的所有内部部分,如顶点速率,三角速率,绘制发布率等,“Goossen解释道。”

“'平衡'系统的目标是在任何一个区域都不会始终存在瓶颈。通常,在平衡系统中,任何给定框架的过程中都应该很少出现单一瓶颈 - 框架的一部分可以是填充率绑定,其他可以是ALU绑定,其他可以是获取绑定,其他可以是内存绑定,其他可以是波占用绑定,其他可以是绘制设置绑定,其他可以是状态更改绑定等。更复杂的是,GPU瓶颈可以在一次绘制调用过程中发生变化!“

显然,有理由认为有更多的ROP随叫随到是最好的情况,即使它们基本上没有使用 - 这就是PlayStation 4所提供的。微软的观点是它的硬件设置

Xbox One为Kinect和应用程序能预留了10%的图形资源,Digital Foundry可以确认,微软计划在未来为游戏开发开放这种额外的GPU能。在我们与Xbox One芯片背后的两位架构师进行了长时间的讨论时,我们发现了这个以及更多基于图形和能的信息。

“Xbox One在GPU上有一个保守的10%时间切片保留用于系统处理。这既用于Kinect的GPGPU处理,也用于渲染并发系统内容,如快照模式,”微软技术研究员安德鲁古森告诉我们。

“目前的预订提供了标题与系统之间的强大隔离,简化了游戏开发 - 强大的隔离意味着系统工作负载可变,不会影响游戏渲染的能。未来,我们计划为开发人员提供更多选项,以便在保持完整系统能的同时访问此GPU预留时间。“

一旦你克服了最初的意外,即后台系统首先占用了相当多的GPU时间,那么能够让开发人员访问这些资源而不影响能的想法可能听起来像是拥有你的蛋糕和吃它,但微软指出GPU硬件的特定方面使这种情况成为可能。

“除了异步计算队列,Xbox One硬件还支持两个并发渲染管道,”Goossen指出。 “两个渲染管道可以允许硬件以高优先级渲染标题内容,同时以低优先级渲染系统内容.GPU硬件调度程序旨在最大化吞吐量并自动填充高优先级处理中的”漏洞“。这可以允许例如,当标题同时在计算单元上进行同步计算作时,系统呈现以利用ROP进行填充。“

尝试全面解决有关架构的ESRAM和系统内存带宽的问题,与PlayStation 4相比,Xbox One的填充率和ROP缺陷问题现在正在显微镜下。 ROP是从像素,矢量和纹素信息中物理写入最终图像的GPU的元素:PlayStation 4的32个ROP通常被认为是1080p分辨率的过度杀戮(AMD的底层架构从未专门用于全高清,但是其他分辨率,如2560x1400 / 2560x1600),而Xbox One的16个ROP理论上可能被开发人员淹没。

在我们的采访中,微软公布了它所进行的研究表明,GPU时钟速度增加6.6%对系统的影响比两个额外的AMD Radeon Graphics Core Next计算单元更有利。我们的问题很简单 - 这些测试的结果是否因代使ROP饱和而产生偏差?

“我们选择让标题开发人员以最适合其游戏内容的方式对分辨率与每像素质量进行权衡。较低的分辨率通常意味着每个像素的质量可以更高。 “

画廊:第一方独家Killer Instinct以720p的原始分辨率运行的消息令许多游戏玩家感到惊讶 - 并没有给人留下深刻的印象。

“是的,帧的某些部分可能已经受ROP。但是,在我们更详细的分析中,我们发现在ROP上绑定但不受带宽的典型游戏内容帧的部分通常是相当的提高6.6%时钟速度是赢得额外CU的主要原因是因为它提升了管道的所有内部部分,如顶点速率,三角速率,绘制发布率等,“Goossen解释道。”

“'平衡'系统的目标是在任何一个区域都不会始终存在瓶颈。通常,在平衡系统中,任何给定框架的过程中都应该很少出现单一瓶颈 - 框架的一部分可以是填充率绑定,其他可以是ALU绑定,其他可以是获取绑定,其他可以是内存绑定,其他可以是波占用绑定,其他可以是绘制设置绑定,其他可以是状态更改绑定等。更复杂的是,GPU瓶颈可以在一次绘制调用过程中发生变化!“

显然,有理由认为有更多的ROP随叫随到是最好的情况,即使它们基本上没有使用 - 这就是PlayStation 4所提供的。微软的观点是它的硬件设置

分享至: