Неизбежное замедление действия закона Мура подтолкнуло компьютерную индустрию к переходу парадигмы от традиционных однородных вычислений только с центральным процессором к гетерогенным вычислениям. С этим изменением ЦП дополняются специализированными вычислительными матрицами, ориентированными на конкретную предметную область. Как мы видели с течением времени, это хорошо отражается в огромном росте гибридных вычислений на базе CPU / GPU, значительных инвестициях в процессоры AI / ML, широкомасштабном развертывании SmartNIC и, в последнее время, появлении вычислительных накопителей.

Неудивительно, что как новичок в сфере вычислительной техники, вычислительный накопитель для хранения данных звучит довольно непривычно для большинства людей, и естественно возникает множество вопросов. Что такое вычислительный накопитель? Где следует использовать вычислительный накопитель? Какие вычислительные функции или возможности должен обеспечивать вычислительный накопитель?

Возрождение простой и многолетней идеи

Суть вычислительной памяти заключается в предоставлении устройствам хранения данных дополнительной обработки данных или вычислительных возможностей. Грубо говоря, любое устройство хранения данных – построенное на любой технологии хранения, такой как флэш-память и магнитная запись – которое может выполнять любые задачи обработки данных, выходящие за рамки его основной функции хранения данных, можно назвать вычислительный накопитель.

Простая идея наделить устройства хранения данных дополнительными вычислительными возможностями, конечно, не нова. Его можно проследить более чем 20 лет назад по статьям об интеллектуальной памяти (IRAM) и интеллектуальных дисках (IDISK), подготовленным группой профессора Дэвида Паттерсона из Калифорнийского университета в Беркли в 1997 году. По сути, вычислительная память дополняет центральные процессоры, образуя гетерогенную вычислительную платформу.

Вычислительная память даже восходит к тому времени, когда ранние академические исследования показали, что такая гетерогенная вычислительная платформа может значительно улучшить производительность или энергоэффективность для различных приложений, таких как базы данных, обработка графиков и научные вычисления. Однако отрасль предпочла не применять эту идею для реальных приложений просто потому, что предыдущие специалисты по хранению данных не могли оправдать вложения в такую ​​разрушительную концепцию при постоянном развитии ЦП. В результате за последние два десятилетия эта тема в значительной степени стала бездействующей.

К счастью, эта идея недавно вызвала значительный всплеск интереса как в академических кругах, так и в промышленности. Это обусловлено двумя крупными промышленными тенденциями:

  1. Растет согласие с тем, что гетерогенные вычисления должны играть все более важную роль, поскольку масштабирование технологии CMOS замедляется.
  2. Значительный прогресс в технологиях высокоскоростного твердотельного хранения данных устраняет узкое место системы от хранения данных до вычислений.

Концепция вычислительного хранилища изначально соответствует этим двум основным тенденциям. Неудивительно, что за последние несколько лет мы стали свидетелями возрождения интереса к этой теме не только со стороны академических кругов, но также, что, возможно, более важно, со стороны промышленности. Импульс в этой области был отмечен, когда комитет по стандартизации NVMe недавно поручил рабочей группе расширить NVMe для поддержки вычислительных накопителей, а SNIA (Storage Networking Industry Association) сформировала рабочую группу по определению модели программирования для вычислительных накопителей.

Вычислительная память в реальном мире

Поскольку центры обработки данных стали краеугольным камнем современной инфраструктуры информационных технологий и несут ответственность за хранение и обработку постоянно растущих объемов данных, они, безусловно, являются лучшим местом для вычислительных накопителей, чтобы начать путь к реальному применению. Однако ключевой вопрос здесь заключается в том, как вычислительные накопители могут наилучшим образом удовлетворить потребности центров обработки данных.

Центры обработки данных уделяют приоритетное внимание экономии средств, и их совокупная стоимость владения оборудованием может быть снижена только двумя путями: более дешевое производство оборудования и более высокое использование оборудования. Замедление масштабирования технологий вынудило центры обработки данных все больше полагаться на второй путь, что, естественно, приводит к нынешней тенденции к дезагрегации вычислений и хранилищ. Несмотря на отсутствие термина «вычисление» в их должностных инструкциях, узлы хранения в дезагрегированной инфраструктуре могут отвечать за широкий спектр сложных вычислительных задач:

  1. Вычисления, ориентированные на хранение: Снижение затрат требует повсеместного использования сжатия данных в состоянии покоя в узлах хранения. Сжатие данных без потерь хорошо известно своими значительными накладными расходами на ЦП, в основном из-за высокой частоты пропусков кеш-памяти ЦП, вызванной случайностью потока данных сжатия. Между тем узлы хранения также должны обеспечивать шифрование данных в состоянии покоя. Более того, дедупликация данных и кодирование RAID или стирание также могут быть в списке задач узлов хранения. Все эти задачи, связанные с хранением данных, требуют значительных вычислительных мощностей.
  2. Вычисления, снижающие сетевой трафик: Дезагрегированная инфраструктура накладывает множество вычислительных задач на уровне приложений на узлы хранения, чтобы значительно снизить нагрузку на межузловые сети. В частности, вычислительные узлы могут разгружать определенные низкоуровневые функции обработки данных, такие как проекция, выбор, фильтрация и агрегация, на узлы хранения, чтобы значительно уменьшить объем данных, которые должны быть переданы обратно на вычислительные узлы.

Чтобы снизить стоимость узла хранения, необходимо снять большую вычислительную нагрузку с ЦП. По сравнению с переносом вычислений на отдельные автономные ускорители PCIe для традиционной практики проектирования, перенос вычислений напрямую на каждый накопитель является гораздо более масштабируемым решением. Кроме того, он минимизирует трафик данных по каналам памяти / PCIe и позволяет избежать вычислений данных и точек доступа для передачи данных.

Необходимость разгрузки процессора, естественно, требует вычислительных накопителей. По-видимому, вычислительные задачи, ориентированные на хранение (в частности, сжатие и шифрование), являются наиболее удобным выбором или низко висящим плодом для вычислительных накопителей. Их ресурсоемкие вычисления и фиксированные функции делают сжатие или шифрование идеально подходящими для реализации в виде настраиваемых аппаратных механизмов внутри вычислительных накопителей.

Выходя за рамки вычислений, ориентированных на хранение, вычислительные накопители могут дополнительно помогать узлам хранения выполнять вычислительные задачи, направленные на облегчение межузлового сетевого трафика данных. Вычислительные задачи в этой категории зависят от приложения и, следовательно, требуют программируемой вычислительной фабрики (например, ядер ARM / RISC-V или даже FPGA) внутри вычислительных накопителей.

Ясно, что вычисления и хранение внутри вычислительных накопителей должны согласованно и без проблем работать вместе, чтобы обеспечить наилучшую возможную сквозную услугу хранения вычислений. При постоянном улучшении PCIe на стороне хоста и пропускной способности памяти тесная интеграция вычислений и хранения становится еще более важной для вычислительных накопителей. Следовательно, необходимо объединить вычислительную матрицу и структуру управления носителями в одном чипе.

Архитектура вычислительных накопителей

На первый взгляд, коммерчески жизнеспособный вычислительный накопитель должен иметь архитектуру, показанную на рисунке 1 ниже. Одна микросхема объединяет в себе структуры управления флэш-памятью и вычислительные структуры, которые подключены через широкополосную шину на кристалле, а структура управления флэш-памятью может обслуживать запросы доступа к флэш-памяти как от хоста, так и от вычислительной структуры.

Учитывая универсальное сжатие и шифрование в состоянии покоя в центрах обработки данных, вычислительные накопители должны иметь собственное сжатие и шифрование, чтобы в дальнейшем облегчить выполнение любых вычислительных задач на уровне приложений. Следовательно, вычислительные накопители должны стремиться обеспечивать лучшую в своем классе поддержку сжатия и шифрования, в идеале как в оперативном, так и в автономном режимах, как показано на рисунке 1.

вычислительный накопитель ScaleFlux

Рисунок 1: Архитектура вычислительных накопителей для центров обработки данных.

Для встроенного сжатия / шифрования вычислительные накопители реализуют сжатие и шифрование непосредственно по пути ввода-вывода хранилища, будучи прозрачными для хоста. Для каждого запроса ввода-вывода на запись данные проходят конвейерное сжатие → шифрование → запись во флэш-память; для каждого запроса ввода-вывода чтения данные проходят конвейерный путь чтения из флэш-памяти → дешифрование → распаковка. Такая оперативная обработка данных сводит к минимуму накладные расходы на задержку, вызванные сжатием / шифрованием, что очень желательно для чувствительных к задержкам приложений, таких как реляционные базы данных.

Более того, вычислительные накопители могут включать в себя дополнительные аппаратные механизмы сжатия и безопасности для предоставления услуги разгрузки через четко определенные API. Механизмы безопасности могут включать в себя различные модули, такие как доверенный корень, генератор случайных чисел и многорежимные шифры с частным / открытым ключом. Встроенные процессоры отвечают за помощь центральным процессорам в реализации различных функций уменьшения сетевого трафика.

Наконец, важно помнить, что хороший вычислительный накопитель сначала должен быть хорошим запоминающим устройством. Его производительность ввода-вывода должна быть, по крайней мере, сопоставима с производительностью обычного накопителя. Без прочной основы хранения вычисления становятся практически неактуальными и бессмысленными.

Следуя вышеприведенным интуитивным рассуждениям и естественной архитектуре, ScaleFlux (стартап из Кремниевой долины) успешно выпустила первые в мире вычислительные накопители для хранения данных для центров обработки данных. Ее продукты развертываются в гипермасштабируемых и веб-центрах обработки данных по всему миру, помогая операторам центров обработки данных снизить совокупную стоимость владения системой двумя способами:

  1. Снижение стоимости узла хранения: Снижение нагрузки на ЦП, обеспечиваемое вычислительными дисками ScaleFlux, позволяет узлам хранения снизить стоимость ЦП. Следовательно, без изменения нагрузки вычислений / хранилища на каждом узле хранения, можно напрямую развернуть вычислительные накопители, чтобы снизить затраты на ЦП и хранилище для каждого узла.
  2. Консолидация узлов хранения: Можно использовать снижение нагрузки на ЦП и уменьшение трафика данных внутри узла для консолидации рабочих нагрузок нескольких узлов хранения в один узел хранения. Между тем снижение стоимости хранения, обеспечиваемое вычислительными дисками хранения, в значительной степени увеличивает плотность / емкость хранения на каждом диске, что дополнительно поддерживает консолидацию узлов хранения.

Заглядывая в будущее

Неизбежный сдвиг парадигмы в сторону гетерогенных и предметно-ориентированных вычислений открывает широкие двери для возможностей и инноваций. Исходно повторяя мудрость переноса вычислений ближе к данным, вычислительные накопители призваны стать незаменимым компонентом вычислительной инфраструктуры будущего. Благодаря усилиям по стандартизации в масштабах всей отрасли (например, NVMe и SNIA) эта развивающаяся область активно используется все большим количеством компаний. Будет интересно увидеть, как эта новая революционная технология будет развиваться и развиваться в течение следующих нескольких лет.

Тонг Чжан – соучредитель и главный научный сотрудник ScaleFlux.

Форум новых технологий предоставляет площадку для изучения и обсуждения новых корпоративных технологий с беспрецедентной глубины и широты. Выбор носит субъективный характер и основан на нашем выборе технологий, которые мы считаем важными и представляющими наибольший интерес для читателей InfoWorld. InfoWorld не принимает маркетинговые материалы для публикации и оставляет за собой право редактировать весь предоставленный контент. Все запросы отправляйте по адресу newtechforum@infoworld.com.

Авторские права © 2021 IDG Communications, Inc.


#Что #такое #вычислительный #накопитель #Очень #необходимая #помощь #для #процессоров

Source link