A11 bionic с 64 битной архитектурой

Faq 26.02.2019
Faq

Выпущенный без громких анонсов процессор Apple A10X стал первой в индустрии коммерческой микросхемой, изготовленной по технологии 10 нм (CLN10FF) компанией Taiwan Semiconductor Manufacturing Co. Данная система на кристалле (system-on-chip, SoC) стала самым маленьким процессором X-серии для планшетов iPad за всю историю их создания (и одним из самых маленьких SoC Apple вообще), что может говорить о том, что данный SoC создавался в том числе с целью опробовать технологию CLN10FF перед массовым внедрением. Это не помешало компании наделить A10X существенной вычислительной мощностью и применить некоторые новые технические решения. Компания TechInsights произвела предварительный анализ A10X и поделилась некоторыми открытиями с общественностью.

Передовые техпроцессы

Использование передовых норм производства даёт возможность разработчикам микросхем увеличить количество транзисторов при неизменной себестоимости, тактовую частоту при неизменной сложности и энергопотреблении, или же уменьшить последнее при аналогичной сложности и тактовой частоте. В действительности разработчики комбинируют преимущества различных техпроцессов в зависимости от поставленной задачи, а также от реальных возможностей оборудования, производственных линий и др.

Следует помнить, что каждый новый технологический процесс имеет особенности — преимущества и недостатки — которые проявляются исключительно при начале массового производства микросхем. Таким образом, для их выявления компании начинают изготовление небольших чипов (с потенциально высоким уровнем годных). Подобные микросхемы зачастую называют pipecleaners — щётками для прочистки труб — и хотя они продаются и часто становятся коммерчески успешными, они также выполняют ещё одну важную задачу.

Став крупнейшим в мире производителем бытовой электроники, в последние годы Apple стала одним из лидеров в области создания SoC для мобильных устройств. Кроме того, учитывая объёмы производства микросхем, необходимых Apple, компания стала главным клиентом для TSMC и одним из основных для Samsung Foundry и некоторых других производителей чипов. Неудивительно, что Apple получила возможность не только оказывать влияние на характеристики технологических процессов, но и приоритетный доступ к передовым PDK (process development kit) и производству. Так, Apple стала первой компанией, задействовавшей техпроцессы CLN20SOC, CLN16FF+, CLN16FFC и CLN10FF. При этом процессоры для iPhone всегда первыми использовали передовой техпроцесс, и лишь затем Apple применяла его для производства более крупных SoC для iPad и iPad Pro (это не значит, что SoC для iPhone служили pipecleaner для процессоров для планшетов).

Для того чтобы представить iPad Pro на базе A10X в начале июня, Apple следовало получить готовые микросхемы примерно в апреле. Судя по маркировке на одной из микросхем A10X, она была упакована на десятой неделе 2017 года, что соответствует второй неделе марта. Учитывая время производственного цикла продвинутых FinFET-техпроцессов, а также время на упаковку и тестирование, можно предполагать, что изготовление A10X началось в ноябре 2016 года. Таким образом, можно констатировать, что Apple получила доступ к CLN10FF на три-шесть месяцев раньше всех конкурентов.

Говоря о конкурентах, не следует думать, что TSMC имеет много клиентов на технологический процесс CLN10FF. Данная технология будет использована исключительно разработчиками мобильных SoC в ближайший год, после чего последние перейдут на техпроцесс CLN7FF. По заявлениям самой TSMC, по сравнению с CLN16FF+, CLN10FF даёт возможность уменьшить площадь микросхем на более чем 50 %, увеличить частоту на 20 % (при неизменной сложности и энергопотреблении) или же уменьшить потребление на 40 % (при аналогичной сложности и частоте). Как видно, TSMC не ожидает от 10-нм чипов большого частотного потенциала или же очень существенного уменьшения потребления. Главная ставка делается на увеличение плотности транзисторов, что даст возможность увеличить количество исполнительных блоков в SoC. Последнее, впрочем, ограничивается предполагаемым энергопотреблением микросхем.

Apple A10X: 96,4 мм 2

Согласно данным TechInsights, площадь ядра Apple A10X составила 96,4 мм 2 , что делает данный SoC не только самым маленьким процессором для iPad (если, конечно, не брать в расчёт A4 из iPad первого поколения и A9, который является процессором для iPhone 6S), но и одной из самых малых систем на кристалле Apple вообще.

Если сравнивать A10X с другими микросхемами Apple, то новинка на 24 % меньше, чем A10 (CLN16FFС, 125 мм 2), на 34 % меньше A9X (CLN16FF+, 147 мм 2) и даже на 9 % меньше Apple A6X (32 нм, 123 мм 2), самого маленького X-чипа разработки компании до последнего времени. Малая площадь ядра A10X позволяют Apple максимизировать выход годных при использовании новейшего техпроцесса. Она же означает довольно консервативный подход Apple к созданию микросхемы. К сожалению, сложно сказать, является ли такой подход следствием того, что A10X — пробный шар Apple в области 10-нм техпроцесса, или консерватизм будет характерен для SoC Apple, производимых по техпроцессу CLN10FF и следствием особенностей данной технологии.

По оценкам TechInsights, Apple удалость добиться 45-процентного увеличения плотности размещения транзисторов от использования CLN10FF по сравнению с технологией CLN16FF+. Это примерно согласуется с ожиданиями самой TSMC и подтверждает тот факт, что компания не использует для CLN10FF межблочные соединения от 20-нм техпроцесса, которые были использованы для CLN20SOC, CLN16FF и CLN16FF+.

Сравнение Apple A10X и Apple A9X. Качество публично доступного снимка столь низко, что едва ли позволяет различить разные блоки. Единственно, что можно сказать, так это то, что в A10X имеется огромный GPU (слева), а также относительно скромный массив CPU-ядер (справа). Кроме того, слева и сверху располагаются 64-разрядные интерфейсы работы с памятью.

Компания Apple планирует использовать CLN10FF для производства процессора для следующего iPhone (назовём его условно A11). Получение изготовленного на коммерческих линиях процессора A10X в начале марта дало Apple и TSMC несколько месяцев на отладку технологического процесса и проекта A11 для максимизации производительности и выхода годных данной SoC. Поскольку iPhone является ключевым продуктом для Apple, его SoC всегда использует наиболее продвинутую технологию производства для максимизации производительности и функциональных возможностей при минимальном энергопотреблении. В этот раз передовые нормы производства была использованы для iPad Pro (который вряд ли можно назвать самым популярным продуктом Apple), что может говорить о том, что A10X является pipecleaner. Тем интереснее взглянуть под крышку новинки!

Apple A10X: три пары ядер Fusion, 12-кластерный GPU, 8 Мбайт кеша

Как и следует из названия, Apple A10X является улучшенной версией A10 — c тремя парами ядер Fusion (высокопроизводительным Hurricane и экономичным Zephyr), графическим процессором с 12 кластерами (судя по всему, речь идёт о сильно доработанной архитектуре Imagination Technologies PowerVR Series7), 128-разрядным контроллером памяти и большим (по меркам мобильных устройств) кешем второго уровня (L2) объёмом 8 Мбайт.

Если сравнивать Apple A10X с A9X, то мы видим заметные улучшения в области вычислений общего назначения: новая микроархитектура (+40 % скорости), дополнительная пара ядер и увеличенный на 166 % L2 должны дать очень существенный прирост производительности. Большой вопрос, зачем мобильному SoC понадобился 8-Мбайт кеш L2, но, судя по всему, таковы были запросы разработчиков программного обеспечения для Apple iPad Pro. При этом тактовые частоты CPU не были увеличены ни по сравнению с A9X, ни по сравнению с A10, что, вероятно, является особенностью CLN10FF.

Что касается графического процессора, то Apple решила не вносить количественных изменений в конфигурацию GPU по сравнению с непосредственным предшественником: A10X по-прежнему использует 12-кластерный дизайн. Подобный консервативный подход говорит о том, что в Apple решили не увеличивать площадь ядра, устанавливая дополнительные графические кластеры. Согласно документации Apple для разработчиков, данная графическая подсистема принадлежит к семейству iOS GPU Family 3, которое включает в себя GPU процессоров A9, A9X и A10. Таким образом, графический процессор A10X базируется на доработанной Apple архитектуре PowerVR GT7600, которая также используется в A10. В этой связи от него логично ожидать некоторого прироста производительности по сравнению с A9X как вследствие архитектурных улучшений, так и роста тактовой частоты (наблюдавшейся при переходе от A9 к A10).

Если же сравнить A10X c A9, который используется для планшета Apple iPad 2017 года, то можно констатировать, что новинка может предложить три вычислительных ядра общего назначения вместо двух, которые работают на 28 % более высокой тактовой частоте. При этом ядра Hurricane в типичных задачах (по данным Apple). Если же учитывать гигантский кеш второго уровня, то от A10X можно ожидать ещё более впечатляющего прироста производительности, особенно в приложениях, требующих высокой пропускной способности и низкой латентности памяти. Кроме того, благодаря наличию в паре Fusion энергоэффективных ядер Zephyr A10X может оказаться ещё и экономичней предшественника в режиме простоя и низких нагрузок. Что касается скорости графической подсистемы, то у A10X она как минимум вдвое более быстрая по сравнению с GPU у A9.

К сожалению, Apple редко говорит об энергоэффективности своих SoC по сравнению с предшественниками. Учитывая тонкий техпроцесс, малые размеры микросхемы (по меркам Apple), минимальный рост тактовой частоты CPU и наличие ядер Zephyr, можно с некоторой долей уверенности говорить о том, что A10X потребляет меньше любого процессора Apple X-серии (уж точно меньше A9X). Являлось ли это целью Apple при проектировании чипа, или стало следствием консервативного подхода к площади ядра по причине необходимости опробовать новый техпроцесс — неизвестно. В любом случае, ориентированный на профессиональных и бизнес пользователей Apple iPad Pro на базе мощнейшего SoC, чей размер не превышает типичных размеров микросхем для смартфонов компании уже видится серьёзным достижением.

Краткие выводы, или чего ждать от Apple A11?

Использование технологии CLN10FF позволило Apple уменьшить площадь микросхемы A10X как по сравнению с A9X, так и по сравнению с A10. При этом компания подняла производительность SoC, увеличив количество вычислительных ядер общего назначения (как по сравнению с A10, так и по сравнению с А9X), а также ускорив графическую подсистему за счёт дополнительных кластеров (по сравнению с A10) или более высокой тактовой частоты (по сравнению с A9X). Судя по всему, Apple не смогла или намеренно не увеличивала тактовые частоты CPU-ядер.

Принимая во внимание особенности CLN10FF на примере Apple A10X, можно предположить, что Apple A11 не получит существенно более высокой тактовой частоты по сравнению с Apple A10 (впрочем, инженеры Apple совершали чудеса в прошлом, потому нельзя исключать ничего). Что он может получить, так это дополнительную производительность за счёт более «широких» ядер общего назначения нового поколения, а также за счёт увеличения количества исполнительных устройств. Поскольку разрешение экрана следующего Apple iPhone неизвестно (равно как и частота обновления), сложно делать догадки касательно количества кластеров/потоковых процессоров графической подсистемы A11. Что очевидно, так это то, что даже при применении GPU от iPad микросхема Apple останется в рамках 100 мм 2 , что соответствует SoC для iPhone. Впрочем, пока не ясно, что вообще за графическая подсистема будет использована в A11, поскольку существует вероятность, что Apple может задействовать GPU собственной разработки.

Впрочем, основной загадкой, как и всегда, является то, что будет встроено в A11 помимо новых CPU и GPU и будет ли вообще. Ответ на эту загадку даст лишь время.

Здесь все, что вам нужно знать о новом процессоре Apple A11 Bionic, который устанавливается в смартфоны в iPhone 8, 8 Plus и iPhone X. Galagram расскажет об основных характеристиках нового чипа, о его возможностях, улучшения и новых функциях.

Характеристики Apple A11 Bionic

С каждой презентацией нового iPhone, компания Apple выпускает одновременно и новый, либо слегка обновленный мобильный процессор. У чипа, который установлен в iPhone 8/8 Plus и iPhone X есть новое имя: прощай A10 Fusion, и поприветствуем Apple A11 Bionic.

Почему A11 получил приставку Bionic в названии? В большей степени это всего лишь маркетинговый ход, который намекает на то, что процессор стал более «человечным», но доля правды в названии все же есть. Этот чип помогает ускорить распознавание изображений, в том числе биометрию. Apple говорит, что это «самый мощный и самый умный чип в смартфоне», тонко намекая, что Qualcomm Snapdragon 835 сдает позиции.

Сколько ядер у A11 Bionic и как они работают

Во-первых, A11 Bionic — это шестиядерный процессор. В конструкции чипа есть 4 «высокоэффективных ядра» для подведенных задач и 2 мощных для тяжелых приложений и обработки 4K видео с высоким фреймрейтом. Эти ядра объеденные в 2 вычислительные кластера, а архитектура процессора похожа на big. LITTLE от компании ARM. В процессоре применяются гетерогенные вычисления, что позволяет устройствам работать эффективно с ядрами разной мощности.

  • Сколько набирает в AnTuTu: более 110.000 баллов
  • Сколько набирает в GeekBench 4: 4061 single-core и 9959 multi-core

Сравнение A11 Bionic и A10 Fusion

По сравнению с прошлогодним A10 Fusion, Apple утверждает, что новый процессор получил на 25% выше производительность для кластера из 2 мощных ядер, в то время как четыре высокоэффективные ядра будут на 70% быстрее справляться с фоновыми задачами.

Что еще более интересно, так это то, что контроллер, который решает, какие ядра получают какие задачи, теперь позволяет всем шести ядрам работать над одной и той же задачей, обеспечивая 70-процентную скорость многопоточных рабочих нагрузок.

С точки зрения производительности графики, система GPU стал 30% быстрее, чем в прошлом году, потребляя половину мощности при работе с той же скоростью, что и A10 Fusion. Это впечатляет и теоретически поможет увеличить время автономной работы iPhone во время игр с требовательной графикой.

A11 Bionic включает в себя более быстрый процессор сигналов изображения (ISP) для лучшей производительности камеры, лучшей обработки пикселей и лучшего снижения шума на итоговых снимках и видео. Также, по словам Apple, ISP теперь быстрее обрабатывает изображения с двойных камер iPhone 8 Plus и iPhone X.

Выводы

Модель Big.LITTLE не уникальна для дизайна чипов Apple, ведь такие процессоры как Samsung Exynos 8895, MediaTek X30 и Qualcomm Snapdragon 835, уже давно используют подобную архитектуру. Но вот что нового в A11 Bionic — так это удвоение количества ядер с более низкой мощностью, чего еще никто до Apple не делал.

Будет интересно узнать, сможет ли Apple серьезно улучшить время автономной работы, сокращая количество задач для выполнения на более мощных ядрах? Многие пользователи жаловались на неутешительное время автономной работы iPhone 7, возможно, с приходом iPhone 8 и процессора A11 Bionic все измениться.

Была не столько говорящая какашка, сколько однокристальная система нового поколения с 4,3 млрд транзисторов — A11 Bionic, — с помощью которой такая передовая технология стала возможной. Ну а если серьёзно, то в беседе с журналистами Mashable главный маркетолог Apple Фил Шиллер (Phil Schiller) отметил, что в настоящее время основным новшеством каждого нового поколения продуктов компании являются чипы.

A11 Bionic стал следующим важным шагом Apple по пути вертикальной интеграции продуктов для полного контроля над всеми аспектами своих устройств. Старший вице-президент подразделения аппаратных технологий Apple Джони Сруджи (Johny Srouji) отметил: «Проектирование наших собственных кристаллов началось примерно десять лет назад, потому что это наилучший способ создать по-настоящему оптимизированные с аппаратной и программной сторон продукты Apple ».

Он также подчеркнул, что на разработку новых чипов у Apple уходит порядка трёх лет, так что A11 Bionic начал создаваться ещё во времена выхода на рынок смартфона iPhone 6 и чипа A8. Во время этого цикла планы могут несколько корректироваться в соответствии с запросами команды разработчиков продуктов под руководством Джонатана Айва (Jonathan Ive). Но именно три года назад было сделано решение о добавлении на кристалл нейронного движка для ускорения вычислений в области искусственного интеллекта.

Разумеется, каждое поколение чипов Apple разрабатывается на основе предыдущих наработок, но некоторые блоки перерабатываются полностью. Например, два высокопроизводительных ядра CPU от A10 Fusion получили небольшое обновление, а количество энергоэффективных ядер было удвоено (в A11 их стало четыре), появилась возможность задействовать от одного до всех шести ядер одновременно. Благодаря этим оптимизациям и новому 10-нм техпроцессу блок CPU в A11 Bionic стал потреблять меньше энергии, чем аналогичный в A10, несмотря на то, что высокопроизводительные ядра теперь на 25 % мощнее, а энергоэффективные — на 70 %.

Другим важным новшеством стал существенно более мощный специализированный процессор обработки изображений, который позволяет добиться более качественной цветопередачи камеры, улучшенного шумоподавления при недостатке света, а также ускорить различные эффекты вроде студийного освещения в новом портретном режиме. Благодаря этому новому блоку ISP впервые на рынке смартфонов стала возможна запись видео в разрешении 4K при 60 кадрах/с или 1080p при 240 кадрах/с.

Многие годы Apple использовала в своих однокристальных системах графику Imagination Tecnologies — последним примером стал 6-ядерный ускоритель PowerVR GT7600. Но в A11 компания приняла решение интегрировать спроектированный собственными силами блок GPU. Этот трёхъядерный GPU, по словам Apple, на 30 % мощнее использовавшегося в A10 Fusion блока от Imagination, а при прежней производительности потребляет вдвое меньше энергии. Ускоритель оптимизирован для наилучшей работы с низкоуровневым графическим API Metal 2 и, по словам Apple, позволяет создавать игры консольного класса.

Джони Сруджи отметил, что компания уже 30 лет придерживается принципа, согласно которому в тех областях, где она считает возможным внедрить новации, она старается создавать собственные решения: однокристальная система, CPU, ISP, дисплей и так далее. Следующим шагом в этом направлении стал GPU, благодаря чему Apple теперь может полностью контролировать графику на своих iOS-платформах: начиная от аппаратной части до компиляторов, языков программирования, библиотек и операционной системы. Всё это создаётся, чтобы работать в единой оптимальной связке.

Совершенно новым блоком для ускорения специфических задач стал двухъядерный нейронный движок с производительностью 600 млрд операций в секунду. Он эффективно справляется с задачами матричного умножения и вычислений с плавающей запятой и используется для ускорения специфических алгоритмов, связанных с машинным обучением, вроде Face ID, Animoji, дополненной реальности, студийного освещения при портретной съёмке и многого другого. Создан он для эффективной работы с ИИ-библиотекой Apple Core ML.

Такие ускорители — относительное новшество индустрии. Например, Google лишь в прошлом году представила специальные аппаратные серверные ускорители TPU (Tensor Processor Unit) для вычислений, использующих её ИИ-библиотеку TensorFlow. В этом году она выпустила второе поколение TPU , а также оптимизированную для мобильных устройств версию библиотеки машинного обучения . Другие компании тоже двигаются в аналогичном направлении. Например, у Facebook подобная технология называется Caffe2Go — она была представлена в ноябре прошлого года и позволила создать фильтры для фото и видео на основе нейронных сетей, работающих прямо на устройстве пользователя в реальном времени.

Google наверняка планирует реализовать и аппаратные блоки TPU для мобильных устройств, но Apple на этом фронте оказалась впереди и первой интегрировала такой ускоритель в свой чип для смартфонов. До сих пор большинство ИИ-расчётов производились в облаке, но исполнение таких алгоритмов прямо на устройстве позволяет сократить задержки, не требует интернет-соединения и обеспечивает более высокий уровень приватности (ведь данные не покидают устройство).

A11 Bionic включает и массу других блоков вроде цифрового сигнального процессора для качественной обработки звука, различных контроллеров ввода-вывода, специализированных алгоритмов корректирующего кода (ECC) и других блоков, повышающих безопасность и надёжность устройства. За 10 лет команда Apple проделала впечатляющую работу в полупроводниковой области, пройдя путь от 65-нм чипов со 100 млн транзисторов до 10-нм с 4,31 млрд.



Рекомендуем почитать

Наверх