В Optimacros для большинства операций доступна параллелизация вычислений, что делает количество ядер одним из ключевых параметров. Это особенно важно для одновременной работы большого числа Пользователей.
Частота процессора определяет скорость обработки операций, что особенно важно для вычислительных операций.
Для большинства параллелизуемых операций важны оба параметра: количество ядер и частота процессора. Например, комбинация 64 ядра x 2,00 GHz даст тот же результат, что и 32 ядра x 4,00 GHz. Эти сочетания были проверены на различных моделях и показали сравнимое время выполнения большинства операций.
Однако есть операции, которые слабо поддаются параллелизации или вообще выполняются на одном ядре или потоке (например, вычисление формулы сложения текстовых комментариев TEXTSUM). В таких случаях производительность будет выше на устройстве с более высокой частотой ядра или потока.
При прочих равных условиях, рекомендуется выбирать процессор с большей частотой. Это связано с тем, что для некоторых операций параллелизация недоступна (например, функция TEXTSUM) или не требуется, поэтому максимальная скорость работы одного ядра становится особенно важной. В таких случаях ключевое значение имеет частота одного процессора.
Очень важным параметром является количество каналов памяти, которое позволяет процессору быстрее получать доступ к RAM (влияет на скорость обработки данных In-Memory), что является очень важным для работы In-Memory расчетов больших объемов.
Количество каналов памяти — это один из самых значимых параметров, поскольку он влияет на скорость доступа процессора к RAM. Это, в свою очередь, существенно сказывается на скорости обработки больших объемов данных In-Memory.
В настоящее время рекомендуется использовать как минимум 8+ каналов памяти, а для современных процессоров это число должно быть 12 или более.
Важно, чтобы материнская плата поддерживала выбранное число каналов памяти.
Для оптимальной работы Optimacros особенно важны два параметра: объем кэша L1 (мы рекомендуем не менее 3 Мб в сумме на все ядра) и общий объем кэша L3, желательно от 256 Мб (это особенно актуально, если используется много ядер).
L1 отражает собственный кэш ядра и влияет на непараллельные операции, а L3 — общедоступный кэш, который влияет на параллельные операции.
Сам по себе техпроцесс (в нанометрах (нм) напрямую не влияет на производительность, однако он определяет современность процессора.
Под современным оборудованием подразумевается процессоры изготовленные по технологическому процессу 4 нм для AMD и 5 нм для Intel.
Этот параметр, как и количество каналов памяти, влияет на производительность: чем больше, тем лучше. Рекомендуемый тип RAM: DDR5 4800+.
Для некоторых процессоров может потребоваться снижение частоты оперативной памяти, чтобы она была кратна частоте процессоров.
Для корректной работы системы мы строго рекомендуем использовать SSD-накопители, поскольку некоторые компоненты архитектуры (базы данных) весьма чувствительны к операциям с жесткими дисками.
Скоростные характеристики SSD уже не так сильно влияют на работу системы.
Операции, на которых отражается HDD/SSD в большей степени: бэкапирование, импорт и экспорт, выполнение операций записи аудита и иногда определенные реализации интеграционных скриптов, где данные промежуточным образом записываются на жесткий диск.
Накопитель должен быть специально предназначен для использования в серверных системах.
При выборе SSD-накопителей следует обратить внимание на следующие параметры надежности:
1. IOPS
Один из ключевых параметров при измерении производительности систем хранения является IOPS (аббр. от англ. input/output operations per second «количество операций ввода-вывода в секунду»).
Для работы с ПО Optimacros рекомендуется:
2. Тип памяти NAND (для NVMe):
SLC – самый надежный, но дорогой (1 бит на ячейку).
MLC – средняя надежность (2 бита на ячейку).
TLC – распространенный вариант (3 бита на ячейку), требует больше коррекции ошибок.
QLC – высокая плотность, но низкая выносливость (4 бита на ячейку).
3. Запасные области (Over-Provisioning, OP):
Дополнительная память, недоступная Пользователю, используется для замены изношенных блоков.
Чем больше OP (например, 7%, 28%, 50%), тем дольше срок службы.
4. Контроллер и алгоритмы коррекции ошибок:
ECC (Error Correction Code) – исправляет ошибки чтения/записи.
LDPC (Low-Density Parity-Check) – улучшенный алгоритм коррекции для TLC/QLC.
Wear Leveling (выравнивание износа) – равномерное распределение записи по блокам.
5. Параметры TBW (Total Bytes Written):
Указывает, сколько данных можно записать до износа (например, 600 TBW для 1 ТБ).
Чем выше TBW, тем долговечнее накопитель.
6. MTBF (Mean Time Between Failures):
Среднее время наработки на отказ (например, 1.5–2 млн часов).
На данный момент Optimacros (OLAP-DB) оптимизирован для работы 1-сокетного варианта материнской платы. При запуске Optimacros на 2-сокетной материнской плате фактическая производительность будет нелинейно ниже, чем при увеличении количества ядер и частоты процессора.
Например, если вы замените 1-сокетную конфигурацию с 64 ядрами и частотой 2.00 GHz на 2-сокетную конфигурацию со 128 ядрами и частотой 2.00 GHz, то производительность вырастет лишь на 20–50%.
При использовании 2-сокетной материнской платы существует экспериментальный способ настройки работы WS, позволяющий OLAP-DB использовать только один процессор, а остальные компоненты — на втором или обоих.
Однако мы пока не можем рекомендовать этот подход. В последних тестах мы не обнаружили подтверждения этому старому багу, возможно, он проявлялся только на старых версиях WS.
При первом запуске системы (обычно первый вход после ночного бездействия) некоторые операции могут занимать больше времени, так как требуется "прогрев" (наполнение кэша и его оптимизация). Однако уже со второй и последующих попыток эти операции будут проходить значительно быстрее.
Ниже вы можете увидеть сравнение платформ в рамках реального тестирования скорости работы моделей (пункт 2.3). При сравнении операций в сопоставимых платформах чипы AMD показывали несколько большую производительность. Именно эту платформу Optimacros чаще использует в своих мощностях.
Ниже приведены примеры моделей процессоров, используемых в Optimacros, с их основными техническими характеристиками (Таблица 1).
Таблица 1 - Примеры моделей процессора
Модель | Ядра | Потоки | Максимальная частота работы процессора (Turboboost) | Базовая частота процессора | Количество каналов памяти | Объём кэша | Техпроцесс |
---|---|---|---|---|---|---|---|
AMD EPYC 9755 2.7 GHz | 128 | 256 | 4.1 GHz | 2.7 GHz | 16x DDR5 ECC REG 6000Mhz | L3: 512MB | 4 нм |
AMD EPYC 9474F 3.6-4.1GHz | 48 | 96 | 3.95 GHz | 3.6 GHz | 12x DDR5 ECC REG 6000Mhz | L3: 256 MB | 4 нм |
Intel Xeon 6972P 2.4 GHz | 96 | 192 | 3.9 GHz | 2.4 GHz | 12x DDR5 ECC REG 6400Mhz | L3: 480 MB | 5 нм |
RAM: DDR5 Samsung с ECC
Накопитель: Intel SSD NVMe (RAID 1/10)
Сеть: LAN 2x10G
ОС: Debian 12
Здесь зафиксированы результаты тестирования моделей на различных конфигурациях инфраструктуры.
При тестировании соблюдаются ключевые принципы, обеспечивающие более точные результаты. Ниже приведены основные из них:
Ниже приведены правила для правильной интерпретации времени выполнения операций в разных моделях:
Время выполнения сценариев в рамках каждой модели в первой строке таблицы принято за 1 (100%). Таким образом, все остальные строки рассматриваются относительно первой.
больше 1
, то время выполнения операции в данной строке больше, чем в первой строке. И наоборот, если значение меньше 1
, то время работы меньше, чем в первой строке.Ниже представлены протестированные модели с указанием их параметров (Таблица 2).
Таблица 2 - Параметры моделей
ОЗУ, ГБ | Размер бэкапа, ГБ | Количество кубов | Количество ячеек кубов | Количество справочников | Количество элементов справочников | |
---|---|---|---|---|---|---|
Модель_1 | 64 | 0.159 | 1024 | 7 788 530 348 | 75 | 202 926 |
Модель_2 | 121 | 0.576 | 4399 | 15 650 834 404 | 144 | 240 855 |
Модель_3 | 74 | 0.202 | 3205 | 9 327 075 409 | 89 | 528 186 |
Модель_4 | 35 | 1.531 | 1273 | 4 495 517 398 | 62 | 562 564 |
Модель_5 | 60 | 0.221 | 9130 | 8 118 889 935 | 100 | 418 122 |
Модель_6 | 101 | 0.263 | 28236 | 18 808 714 255 | 266 | 526 667 |
Модель_7 | 9 | 0.175 | 341 | 962 702 919 | 45 | 604 186 |
Модель_8 | 46 | 0.596 | 2413 | 6 968 335 540 | 76 | 228 037 |
Ниже приведены характеристики процессоров, оперативной памяти и дисков, использовавшихся в процессе тестирования. В первой таблице указаны ключевые параметры процессоров, такие как количество ядер, размер кэша и частота (Таблица 3). Во второй таблице у моделей оперативной памяти представлен их тип (Таблица 4). В третьей таблице приведены параметры дисков с указанием их скорости записи и чтения (Таблица 5).
Таблица 3 - Характеристики моделей процессоров
Модель | Количество сокетов | Количество ядер | Год выпуска | Размер кэша L3, МБ | Техпроцесс, НМ | Частота, ГГц |
---|---|---|---|---|---|---|
AMD EPYC 9274F | 2 | 24 | 2022 | 256 | 5 | 4.05 |
Intel(R) Xeon(R) Gold 6342 | 2 | 24 | 2021 | 36 | 10 | 2.80 |
AMD EPYC 7502P | 1 | 32 | 2019 | 128 | 7 | 2.50 |
AMD EPYC 7502P | 1 | 32 | 2019 | 128 | 7 | 2.50 |
AMD EPYC 9554 | 2 | 64 | 2022 | 256 | 5 | 3.10 |
AMD EPYC 7763 | 2 | 64 | 2021 | 256 | 7 | 2.45 |
Таблица 4 - Характеристики моделей оперативной памяти
Модель | Тип |
---|---|
Samsung M321R8GA0BB0-CQKZJ | DDR 5 |
Samsung M393A8G40AB2-CWE | DDR 4 |
Samsung M393A4K40DB3-CWE | DDR 4 |
NANYA NT32GA72D4NBX3P-IX | DDR 4 |
Samsung M321RAGA0B20-CWKZJ | DDR 5 |
Samsung M321R8GA0BB0-CQKDS | DDR 5 |
Таблица 5 - характеристики моделей дисков
Модель | Скорость записи, IOPS | Скорость чтения, IOPS |
---|---|---|
INTEL SSDPF2KX038T1 | 100 000 | 110 000 |
INTEL_SSDSC2KB019T8 | 35 500 | 97 000 |
Samsung MZQLB1T9HAJR-00007 | 55 000 | 540 000 |
Samsung MZQL23T8HCLS-00A07 | 180 000 | 1 000 000 |
INTEL SSDPF2KX038T1 | 100 000 | 110 000 |
INTEL SSDPE2KX020T8 | 81 500 | 637 000 |
Ниже приведены результаты тестирования импорта моделей с указанием всех параметров, а также данные для всех протестированных моделей (Таблица 6).
Таблица 6 - Результаты тестирования импорта моделей
Модель_1 | Модель_2 | Модель_3 | Модель_4 | Модель_5 | Модель_6 | Модель_7 | Модель_8 | |
---|---|---|---|---|---|---|---|---|
CPU: AMD EPYC 9274F RAM: Samsung M321R8GA0BB0-CQKZJ DISK: INTEL SSDPF2KX038T1 |
1,00 (Рисунок 1) |
1,00 (Рисунок 2) |
1,00 (Рисунок 3) |
1,00 (Рисунок 4) |
1,00 (Рисунок 5) |
1,00 (Рисунок 6) |
1,00 (Рисунок 7) |
1,00 (Рисунок 8) |
CPU: Intel(R) Xeon(R) Gold 6342 RAM: Samsung M393A8G40AB2-CWE DISK: INTEL SSDSC2KB019T8 | 1,43 | 1,42 | 1,59 | 1,30 | 1,54 | 1,61 | 1,35 | 1,45 |
CPU: AMD EPYC 7502P RAM: Samsung M393A4K40DB3-CWE DISK: Samsung MZQLB1T9HAJR-00007 | 2,89 | 1,82 | 2,28 | 1,58 | 1,62 | 1,98 | 1,70 | 1,85 |
CPU: AMD EPYC 7502P RAM: NANYA NT32GA72D4NBX3P-IX DISK: Samsung MZQL23T8HCLS-00A07 | 1,99 | 1,23 | 1,65 | 1,26 | 1,53 | 1,72 | 1,54 | 1,45 |
CPU: AMD EPYC 9554 RAM: Samsung M321RAGA0B20-CWKZJ DISK: INTEL SSDPF2KX038T1 | 0,66 | 0,98 | 1,11 | 1,01 | 1,17 | 1,23 | 1,16 | 1,13 |
CPU: AMD EPYC 7763 RAM: Samsung M321R8GA0BB0-CQKDS DISK: INTEL SSDPE2KX020T8 | 0,77 | 1,30 | 1,67 | 1,39 | 1,43 | 1,63 | 1,66 | 1,53 |
Также ниже вы можете увидеть результаты тестирования создания бэкапов моделей с указанием всех параметров, а также данные для всех протестированных моделей (Таблица 7).
Таблица 7 - Результаты тестирования создания бэкапов моделей
Модель_1 | Модель_2 | Модель_3 | Модель_4 | Модель_5 | Модель_6 | Модель_7 | Модель_8 | |
---|---|---|---|---|---|---|---|---|
CPU: AMD EPYC 9274F RAM: Samsung M321R8GA0BB0-CQKZJ DISK: INTEL SSDPF2KX038T1 | 1,00 |
1,00
|
1,00
|
1,00
|
1,00
|
1,00
|
1,00
|
1,00 |
CPU: Intel(R) Xeon(R) Gold 6342 RAM: Samsung M393A8G40AB2-CWE DISK: INTEL SSDSC2KB019T8 | 1,48 | 1,37 | 1,31 | 1,36 | 1,63 | 1,45 | 1,26 | 1,38 |
CPU: AMD EPYC 7502P RAM: Samsung M393A4K40DB3-CWE DISK: Samsung MZQLB1T9HAJR-00007 | 1,84 | 1,77 | 1,79 | 1,58 | 1,82 | 1,82 | 1,51 | 1,59 |
CPU: AMD EPYC 7502P RAM: NANYA NT32GA72D4NBX3P-IX DISK: 2x Samsung MZQL23T8HCLS-00A07 | 1,68 | 1,58 | 1,57 | 1,53 | 1,68 | 1,68 | 1,44 | 1,54 |
CPU: AMD EPYC 9554 RAM: Samsung M321RAGA0B20-CWKZJ DISK: INTEL SSDPF2KX038T1 | 1,14 | 1,13 | 1,14 | 1,14 | 1,13 | 1,14 | 1,12 | 1,13 |
CPU: AMD EPYC 7763 RAM: Samsung M321R8GA0BB0-CQKDS DISK: INTEL SSDPE2KX020T8 | 1,46 | 1,39 | 1,44 | 1,40 | 1,48 | 1,47 | 2,19 | 1,40 |
Ниже приведены изображения с графиками, которые отображают состояние CPU и использование памяти в процессе импорта моделей на примере процессора AMD EPYC 9274F, а также демонстрируют динамику загрузки в различных временных интервалах.
Рисунок 1 – Модель_1
Рисунок 2 – Модель_2
Рисунок 3 – Модель_3
Рисунок 4 – Модель_4
Рисунок 5 – Модель_5
Рисунок 6 – Модель_6
Рисунок 7 – Модель_7
Рисунок 8 – Модель_8