找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

ARM处理器如何?

z1.jpg z2.jpg z3.jpg
回复

使用道具 举报

大神点评(1)

v44746795 2020-11-4 17:01:06 显示全部楼层
随着我们掌上具有强大计算功能的设备的出现,我们听到很多特别需要注意的术语是ARM。这些计算强大的设备的大脑正是基于这一点,在真正讨论它给未来的计算设备带来的好处之前,让我们来看看它究竟是什么,以及它如何与目前使用的其他替代形式的计算处理器不同。
ARM,以前称为高级 RISC 机器,是用于计算机处理器的 RISC(减少指令集计算)体系结构系列,可配置在各种环境中。Arm Holdings 开发该架构并将其许可给其他公司,如 Apple、Qualcomm 等,这些公司设计自己的产品,实现这些架构之一 , 包括芯片上的系统 (SoC) 和包含内存、接口、收音机等的模块系统上系统 (SoM)。
它还设计了实现此指令集的核心,并将这些设计授权给将这些核心设计整合到自己产品的许多公司。然后,这些产品与其他组件一起整合到设备中,形成我们作为消费者购买的最终用户设备。 z1.jpg
具有 RISC 架构的 ARM 处理器通常比具有复杂指令集计算 (CISC) 架构的处理器(如英特尔、AMD 等制造商的 x86 处理器)的晶体管需要更少的晶体管,从而提高了成本、功耗和散热能力。这些特性对于轻便、便携式、电池供电的设备(包括智能手机和平板电脑以及其他嵌入式系统)是可取的。即使对于耗电量大的超级计算机,ARM 也可以是一个可行的节能解决方案。
RISC 和 CISC 在当今世界的计算设备中应用广泛。需要更深入地研究它们,以便真正了解其中哪一个更适合我们的计算需求。一般来说,RISC 被许多人视为比 CISC 的改进。这是因为 CISC 是原始的 ISA(指令集体系结构),其中,RISC 是 20 世纪 80 年代初出现的重新设计的 ISA。
没有最好的体系结构,因为不同的体系结构在某些情况下可能更好,但在某些情况下则不太理想。基于 RISC 的计算机每个时钟周期执行一个指令。CISC 机器可以具有特殊说明以及需要多个周期才能执行的说明。这意味着在 CISC 体系结构上执行的相同指令可能需要多个指令才能在 RISC 计算机上执行。RISC 体系结构需要更多的工作 (RAM) 内存来保存值,因为它加载每个指令,对它执行操作,然后加载下一个指令。
CISC 体系结构可以直接在内存上执行一个(尽管更复杂的指令)执行相同的操作。因此,RISC 体系结构需要更多的 RAM,但每个时钟周期始终执行一个指令,以进行可预测的处理,这对于管道处理是好事。RISC 和 CISC 之间的主要区别之一是 RISC 强调每个指令的周期效率,CISC 强调每个程序指令的效率。
快速处理器取决于执行每个时钟周期所用的时间、执行指令的周期数以及每个程序中的指令数。RISC 强调较大的程序代码大小(由于指令集较小,因此连续执行多个步骤可能等同于 CISC 中的一个步骤)。这可以更好地可视化与以下性能方程,通常用于表达计算机的性能能力:
CISC 方法尝试最小化每个程序的指令数,牺牲每个指令的周期数。RISC 会执行相反的做法,以每个程序的指令数成本来减少每个指令的周期。
RISC ISA 强调软件而不是硬件。RISC 指令集需要用更少的指令编写更高效的软件(例如编译器或代码)。CISC ISA 在硬件中使用更多的晶体管来实现更多的指令和更复杂的指令。
RISC 需要更多的 RAM,而 CISC 强调代码大小更小,并且使用比 RISC 的 RAM 整体使用更少。然而,如今许多微处理器都包含 RISC 和 CISC 类属性的组合,例如一种像 CISC 一样使用 ISA 的 ISA,它将指令视为一串 RISC 类型的指令
ARM 及其实施的优势
简而言之,基于 RISC 的 ARM 架构不需要携带 CISC 处理器包含的大量行李来执行其复杂的指令。尽管像英特尔这样的公司已经投入巨资设计处理器,它们包括了先进的超高指令管道,但所有这些逻辑意味着芯片上的晶体管更多,更多的晶体管意味着更多的能源使用。高端英特尔芯片的性能非常出色,但高端处理器的最大 TDP(热设计功率)为 130 瓦。基于 ARM 的最高性能移动芯片消耗不到 4 瓦,通常更少。
z2.jpg
这种低功耗是 ARM 如此特殊的原因,它不会尝试创建 130W 处理器,甚至 60W 或 20W。该公司只对设计低功耗处理器感兴趣。多年来,ARM 通过改进微架构设计提高了处理器的性能,但目标功率预算基本保持不变。一般来说,您可以分解 ARM SoC 的 TDP(芯片上的系统,包括 CPU、GPU 和 MMU 等),如下所示:多核 CPU 群集的最大预算为 2 瓦,GPU 为 2 瓦,MMU 和 SoC 的其余部分可能为 0.5 瓦。如果 CPU 是多核设计,则每个内核可能使用 600 到 750 毫瓦。
这些都是非常通用的数字,因为 ARM 生产的每个设计都有不同的特征。ARM 的第一个 Cortex-A 处理器是 Cortex-A8。它只在单核配置中工作,但它依旧是一个流行的设计,可以在一些设备中找到。接下来是 Cortex-A9 处理器,它带来了速度改进和双核与四核配置的能力。然后是 Cortex-A5 内核,它实际上比 Cortex-A8 和 A9 慢(每个内核),但功耗更低,制造成本更低。它专为低端多核应用(如入门级智能手机)而设计。
在性能规模的另一端,Cortex-A15 处理器,它是 ARM 最快的 32 位设计。它的速度几乎是 Cortex-A9 处理器的两倍,但所有额外的性能也意味着它使用多一点功率。在实现 2Ghz 的时钟速率和超越许多 ARM 合作伙伴的竞赛中,Cortex-A15 核心设计被推到了极限。因此,Cortex-A15 处理器确实有点作为电池杀手的名声。但是,这或许有点不公平。然而,为了补偿 Cortex-A15 处理器的更高功率预算,ARM 发布了 Cortex-A7 内核。
Cortex-A7 处理器比 Cortex-A9 处理器慢,但比 Cortex-A5 处理器快。然而,它的权力预算类似于它的低端兄弟。制作-A7核心时,结合-A15核心在找一个平衡点。LITTLE 配置允许 SoC 在执行简单任务时使用低功耗 Cortex-A7 内核,并在需要重担时切换到 Cortex-A15 内核。结果是设计节省电池,但可以提供最佳的性能。
ARM 还拥有 64 位处理器设计。Cortex-A53 是 ARM 的节能 64 位设计。它不会有破纪录的性能,但它是ARM有史以来效率最大的应用程序处理器。它也是世界上最小的64位处理器。它更大的兄弟,Cortex-A57,是一个不同的野兽。它是 ARM 最先进的设计,具有 ARM 所有 Cortex 处理器中最高的单线程性能。ARM 的合作伙伴可能会发布基于 A53(只有 A57)的芯片,并将两者大为使用。
ARM 管理 从 32 位到 64 位迁移的一个方法是处理器具有不同的模式、32 位模式和 64 位模式。处理器可以在这两种模式之间快速切换,必要时运行 32 位代码,必要时运行 64 位代码。这意味着解码并开始执行 64 位代码的芯片与 32 位芯片是分开的(尽管有重用用以节省面积)。这意味着 64 位逻辑是隔离的、干净的和相对简单的。64 位逻辑不需要尝试和理解 32 位代码,并找出什么是最好的方法。这将需要一个更复杂的指令解码器。这些领域的复杂性通常意味着需要更多的能源。
ARM 64 位处理器的一个非常重要的方面是,它们没有比 32 位处理器使用更多的电源。ARM 已经成功地从 32 位到 64 位,但还停留在其自行实施的能源预算内。在某些情况下,新系列的 64 位处理器实际上将比上一代 32 位 ARM 处理器更节能。这主要是由于内部数据宽度(从 32 位到 64 位)的增加,以及 ARMv8 体系结构中增加了额外的内部寄存器。64 位内核可以更快地执行某些任务,这意味着它可以更快地断电,从而节省电池寿命。
最强大的使用模型大。LITTLE 架构是异构多处理 (HMP),它同时支持使用所有物理内核。在这种情况下,具有高优先级或计算强度的线程可以分配给"大"内核,而优先级较低或计算强度较低的线程(如后台任务)则可由"LITTLE"内核执行。此模型已实现在三星Exynos开始与Exynos 5 Octa系列和苹果移动应用程序处理器开始与苹果A11。
这也是软件的作用。大。LITTLE 处理技术依赖于操作系统的了解,即它是异构处理器。这意味着操作系统需要了解某些内核比其他内核慢。到现在,处理器设计通常情况并非如此。如果操作系统想要执行一项任务,它只会把它耕种到任何核心,因为它们都具有相同的性能级别。这和那个大并不大。LITTLE 使用特定的内核调度程序,它了解大的异构性质。小处理器配置,将决定每个进程/线程的执行。将来,此调度程序可以进一步优化,以考虑内核的当前运行温度或工作电压等。
传统计算中的 ARM
尽管ARM在移动设备中具有压倒性优势,但大多数笔记本电脑和计算机,即对于我们工作流程至关重要的设备,使用基于CISC的处理器。但最近,我们看到这种趋势正在发生变化,而基于ARM的个人电脑处理器也因此而大量涌入。2017 年底,高通和微软宣布了第一款基于 ARM 的处理器的 Windows 10 设备。惠普、和联想都推出了笔记本电脑,其中有高通的Snapdragon 835处理器。
z3.jpg
ARM 上的 Windows 10 是微软之前尝试将移动处理器与完全笔记本电脑体验结婚的重启。与迄今为止存在的基于 x86 Intel 的计算机相比,它有望提供更好的电源效率、可靠的性能和始终保持的连接。对于这些 ARM 设备,高通拥有长达 25 小时的电池续航时间,以及与英特尔计算机平起平坐的即时电源和性能。
它还说,内置的LTE连接将提供显著更快的速度比其他可用的LTE设备Windows 10计算机。此外,微软在过去几年中不断改进了对 ARM 芯片的 Windows 支持,其即将推出的与架构无关的精简版操作系统更证明了该公司对市场上拥有更多 ARM 支持的笔记本电脑是认真的。
最近,据报道苹果准备明年推出基于ARM的Macbook。彭博社报道说,苹果计划到2021年将iOS和macOS应用程序结合起来。有传言说苹果会将其MacBook笔记本电脑改用自己的ARM处理器。但是,以前,ARM 芯片没有运行更成熟的桌面应用程序所需的性能。彭博社的这份报告重申,在ARM上运行的Mac可能在2020年到达。Axios的报告似乎证实了这一说法。
然而,除了这些报告,随着iPad Pro在2015年发布,苹果显示,其ARM芯片现在可以处理"PC级"应用程序。自 2015 年以来,与英特尔的 CPU 代相比,Apple 的芯片变得越来越强大,每代芯片的性能都大得多。苹果传统上更喜欢对它设备的核心组件拥有更多的控制权,如果能够负担得起的话,所以苹果最终希望MacBook由为iOS设备供电的相同(或升级的)芯片提供动力,这是有道理的。
谜题的最后一部分是将 x86 macOS 程序过渡到 ARM 指令集体系结构。自去年以来,我们听说苹果正在实施一个名为"Marzipan"的项目,该项目将允许开发人员一次编写他们的应用程序代码,并在 iOS 设备和 macOS 计算机上工作。
几天前,苹果在其年度开发者大会上宣布发布第一版必要的软件套件。首先,苹果将允许开发者只将iPad应用移植到Mac上,因为iPad应用在功能和用户体验上都更接近macOS应用。最初,开发人员仍必须提交两个不同版本的应用,这些应用已针对每个平台优化了用户界面,但基础代码将保持不变。
2020年,苹果的Marzipan软件套件也有望允许开发者将他们的iPhone应用程序移植到Mac上。Apple 的工程师发现,将专为小型屏幕设计的应用程序移植到桌面是具有挑战性的,因此,进行这种过渡需要更长的时间。到 2021 年,第三方应用开发人员将能够创建跨 iOS 设备和 macOS 计算机工作的"单二进制文件"。据推测,它们在每个外形上仍有不同的用户界面,但它们要么更流畅地适应屏幕大小,要么开发人员必须在每个二进制文件中包含不同的用户界面。
ARM 及其合作伙伴也为服务器市场做出了重大公告,他们打算针对更强大的 Neoverse N1 和该芯片的其他变体。最大的公共云服务提供商亚马逊甚至已经开始设计自己的ARM CPU,它也可能很快就会升级到基于N1的处理器。就连谷歌(Google)也从未在Chrome操作系统中缺乏ARM支持,尽管操作系统从第一天起就与架构无关,但谷歌似乎也在努力将Snapdragon平台引入一些Chromebook,而这反过来又应该能够更好地实现Chromebook上原生Android应用的功能和可用性。
但是,最初只有 Snapdragon 845 得到支持,因为该公司希望将更便宜的 Chromebook 推向市场。另一个问题似乎是,高通宁愿把Snapdragon 8cx放在售价500美元或更高的Chromebook中,因为这意味着OEM公司能够为8cx支付更高的价格。这将导致市场上有高端 的Chromebook 。
总之,随着 ARM 架构的进步和半导体行业改进的 7nm 光刻工艺,以及投资于基于 ARM 的设备开发的主要制造商,我们可以期待一系列令人振奋的新产品进入市场。有了这个预期的发展道路,作为消费者,我们只能希望未来的计算设备能为我们提供卓越的性能和高效率,并让我们把时间投入我们最擅长的:创造力和创新。
回复 支持 反对

使用道具 举报

说点什么

您需要登录后才可以回帖 登录 | 立即注册
HOT • 推荐