麦克雷

标题: 扒扒苹果GPU的皮,根本无法与安培比较! [打印本页]

作者: frederickng2    时间: 2024-6-14 11:52
标题: 扒扒苹果GPU的皮,根本无法与安培比较!
先上总体结论:M1Max的GPU特性与费米1.0相似,最多有GTX 470 50倍的水准——属于低水平下的高速度。
0.0缘起
新mbp携M1Max上市,英特尔挨了一记重拳,大家各种软件试得飞起,尤其是3Dmark和游戏测试下来,一时间“理论性能打平3080laptop版”、“游戏实测打平3060且功耗低很多”的论断纷至沓来。其他先不谈,3Dmark属于“行业标准”级测试,如此惊人的表现,独显两霸竟然不置一词。对我来说,同行评议是金法则,这引起了我对前述论断的怀疑。
3Dmark Wild Life系列是UL公司为跨平台比较推出的一套基于新世代API(包括DX12、Vulkan、Metal)的全新的测试。但偏偏,最新并非最强,压力更大测试的起码还有Time Spy系列(官网收录的最低等级的显卡成绩是费米2.0架构的GTX 550 Ti,则合理推测Time Spy所支持的特效等级高于Wild Life)及Port Royal。那么,前述论断严谨的说法是,M1Max在Wild Life Extreme Unlimited测试下的水平等效于3080laptop版。那问题首先就转换为,WLEU测试究竟有多大的代表性?
1.1线索
翻阅3dmark开发商UL公司的官网,可以发现采用苹果A9X的iPad Pro 12.9寸版Wild Life系列所有四项数据。这证明,Wild Life全系都未使用A9X这2015Q4上市芯片所不支持的特性:换句话说,A9X即支持Wild Life系列所使用的全部特效。
虚幻引擎是第二受欢迎的跨平台商业图形引擎。翻阅最新的虚幻引擎(4.27版)的文档,有如下资料:Android设备兼容性 | 虚幻引擎文档 (unrealengine.com)。文档显示,按针对安卓设备支持功能的完整性,UE4将所兼容的GPU分为3个级别,高级别(比如Adreno 610、Tegra K1)支持完整的功能。其中,PowerVR GT7xxx, PowerVR GT8xxx被列为中等级别。而A9X,正好就是GT7系列介于GT7800和7900之间的定制版。
2.1结论
wild life系列测试,基于这样的GPU:用于UE4针对安卓开发时、特性支持度为中,此时特性支持度还不如Adreno 610和Tegra K1(开普勒架构)。
3.1疑问
UL公司新出的这套图形测试使用特性支持度还不如开普勒架构的GPU构建,用于与安培架构的GPU对比,合适吗?(注:UL官网的对比栏目,号称跨平台的Wild Life系列测试仅收录手机及平板电脑上的分数,桌面及笔记本显卡包括核显仅收录Time Spy跑分)
1.2线索二
Unity3D是最受欢迎的跨平台商业图形引擎,于2005年诞生于Mac平台,并首先支持iPhone系列,至今仍是苹果各平台最流行的引擎,可谓苹果的“亲儿子”。翻阅最新的用户手册(2021.2版),有如下资料:Targeting shader models and GPU features in HLSL - Unity 手册。文档显示,Metal API不支持Geometry Shader、Hull and Domain Shaders这两类共三种DX11_0开始引入的曲面细分着色器,仅在不涉及上述三种着色器(2021.1的中文版本将三者统一称呼为“几何体”)时,渲染能力等效于自DX11.0引入的SM5.0。但,Metal整体上仍与DX11_0以上级别相当。
资料:计算着色器 - Unity 手册和渲染管线调试 (Render Pipeline Debug) | High Definition RP | 10.4.0 (unity3d.com)显示,Metal API不支持atomic operations on Textures(一种纹理特性),暂不支持Quad Overdraw和Vertex Density(这两者影响Level of Details:多细节层次),这三个都是与渲染有关的特性。
资料:Metal - Unity 手册显示,不支持几何着色器(英文版geometry shaders,应该包括Geometry Shader、Hull and Domain Shaders)为此API的缺点。意味着在Unity的工具集内,这三项特性的缺失只能规避,不能变通。
2.2结论二
鉴于M1系列SoC在API上的排他关系,我们完全可以认定,在Unity作业环境中,M1Max渲染、建模能力上有重要缺失,尚不如DX11_0(也就是DX12的11_0级别)。这影响某些游戏的移植,不能简单的映射,甚至不能代码重构,策略需要重做。显然,渲染、建模能力越弱,如果其他条件相当,那么硬件就越省电。
3.2疑问二
简单查阅后,已发现M1Max在渲染能力上的差距。这种差距还是与DX11.0相比得出的,带着这种差距与DX11.0诞生10年之后的安培架构GPU对比,合适吗?
1.3线索三
2021年10月27日,AMD发布超平均预期的财务报告。2021年11月18日,英伟达发布远超预期的财务报告。两家公司的报告显示,展望4季度的营收、毛利,同比环比均将增长,都未提及苹果M1系列对各自专业领域的“挑战”。
2.3结论三
独显两霸在多种场合、包括最正式的财务报告里都没提及苹果的图形能力。结论二所揭示的苹果GPU渲染、建模能力较差,也是影响其专业领域竞争力的重大不利因素。
3.3疑问三
最大规模的两家同行迟迟未表态,拿M1Max对比n、a两家在售的GPU是否合适?
1.4线索四
Rosetta2用于解决CPU兼容性问题,有性能损失,但无涉GPU。所有大型可比游戏在windows系统里都使用特有引擎而不是最流行的两大商业引擎构建,除光追版(苹果不支持)之外,这些引擎均基于DX11。最近的大作地铁离去的mac版还删去了Benchmark功能。这些游戏无一获得业内画质奖项。
2.4结论四
比较不以画质见长、且有性能损失、难以合理区分CPU和GPU贡献的游戏,得不出有效结论。
3.4疑问四
DX11自然是安培架构与其他架构之间的可比项。但仅仅对比使用这一层级的特性,就得出强或不强结论,合适吗?
4总结
苹果M1系列已经证明其在低水平下(这个水平低于开普勒架构(代表Tegra K1)能发挥的全部水平,也很可能低于能跑Time Spy的费米2.0架构GPU所代表的等级)的高速度。渲染能力缺失严重(并因此省电),甚至不如只支持DX11.0的显卡;游戏测评常客——《地铁:离去》的M1适配版删掉Benchmark无法进行有价值对比。跟安培架构的比较可谓无从谈起。
借用苹果亲密合作伙伴Unity的结论,合理推测,苹果的图形架构可以近似的看成先进API(比如DX12)支持的最早的架构——费米1.0架构的改进。因M1Max配备高达64GB的共享RAM,可以粗略判断,M1Max最多能有GTX470(配备1.25GB显存)的50倍(显存62.5GB)性能。
作者: 就栽在    时间: 2024-6-14 11:53
你在扯什么淡?
作者: frederickng2    时间: 2024-6-14 11:53
我再也看不惯拿苹果乱比的行为了。渲染、建模能力存在重大缺失,只能相当于十多年前的架构水平,比什么安培?还指望游戏开发商努努力,问问游戏开发商,unity文档里说的那一个缺点、那些不支持项和暂不支持项,他们有办法吗?木得办法!所以大搞移植、做大游戏生态就纯属做梦了!而且,这些不支持项正好凝聚着业内共识。跟业内共识对抗,那就自己一边玩去,不要嚷嚷了。
作者: UnlimPayCete    时间: 2024-6-14 11:53
不是。苹果为什么要支持dx11?那你为什么不说n卡不支持metal2?
作者: UnlimPayCete    时间: 2024-6-14 11:54
我感觉不懂装懂的人越来越多了。天天贩卖自己的无知就那么有意思?
作者: GeraldMut    时间: 2024-6-14 11:54
怎么可能有470  50倍的水平?
作者: Jeffreycor    时间: 2024-6-14 11:55
敲得字儿还挺多的,您受累了~~
作者: jet8119    时间: 2024-6-14 11:55
太长了不看直接加三
作者: Jeffreytok    时间: 2024-6-14 11:56
这不纯nt
作者: LesterWillniom    时间: 2024-6-14 11:57
50倍gtx470?你这m1max把3090给秒了啊,我觉得lz可以考虑去应聘个数码自媒体营销号的岗位
作者: WilburDymn    时间: 2024-6-14 11:57
楼主说的也没错,苹果就喜欢自定义一套东西,他认为几何着色器不高效于是不用,曲面细分也是完全不一样的流程,后面的新增特性和dx12类似却有不同,这一切造成了巨大的移植问题
作者: test110    时间: 2024-6-14 11:58
但是我用它剪视频确实快啊,还能不通电随身携带。我这种消费者不懂你们说的专业数据,体验好就行了😨
作者: Justinracy    时间: 2024-6-14 11:59
明年cycles支持metal就知道跟cuda比究竟怎样了,先不跟有硬件光追的optix比,缺失硬件光追才是苹果gpu真正的痛点,说那么多弯弯绕根本没用最终还是要看实际工作效果
作者: vbxai    时间: 2024-6-14 11:59
别的不说,光是压力方面Wild Life Extreme完全不虚TS之类的好吧?我自己3090猛禽刚刚跑了一轮直接显卡功耗跑到满的489W,全程也都是满占用Boost频率。

(, 下载次数: 0)

(, 下载次数: 0)
作者: 仙儿    时间: 2024-6-14 12:00
1.为什么用安卓的文档来引伸iOS?iOS明明有自己的文档。
2.api没有的特性会带来什么,是否对性能有影响,如有影响,是多少?是强还是弱?
3.rosseta2的损失还包括从假tbr 强制转换为imr 再在tbdr 里跑要强制Ztest 的损失,还无涉GPU,想太多。




欢迎光临 麦克雷 (https://mavom.cn/) Powered by Discuz! X3.5