CompMechLab®-исследования. Тестирование производительности рабочих станций Intel для решения широкого круга задач с помощью CAE-систем компьютерного инжиниринга ANSYS и LS-DYNA
В лаборатории "Вычислительная механика" (CompMechLab) СПбГПУ совместно со специалистами компании Нево-Д, имеющей статус Intel Premier Provider, протестирован ряд конфигураций рабочих станций Intel путем решения benchmark-тестов - широкого круга задач в CAE-системах - программных системах конечно-элементного анализа ANSYS и LS-DYNA.
Для специалистов и инженеров, активно использующих программные системы компьютерного инжиниринга (CAE), чрезвычайно актуальным является вопрос выбора конфигурации рабочей станции, максимально эффективной для решения задач в кратчайшие сроки. Данный вопрос не теряет свою насущность никогда, поскольку быстродействие процессоров, объемы оперативной памяти и жестких дисков постоянно растут, что, в свою очередь, ведет к увеличению размерности конечно-элементных моделей, используемых при расчетах.
Использование высокопроизводительных кластеров для проведения ежедневных конечно-элементных расчетов не всегда экономически оправдано и не практикуется большинством предприятий в России. Кластеры достаточно дороги в приобретении, сложны в настройке, критичны к обслуживанию и имеют обыкновение быстро устаревать. Гораздо более эффективным представляется использование мощных персональных рабочих станций с возможностью запуска задач на решение "в ночь", с тем, чтобы к утру получить результат.
Очевидно, невозможно подобрать универсальную конфигурацию мощной рабочей станции для CAE-приложений (software), поскольку существует множество классов задач, каждый из которых определяет свои требования к hardware.
Так, при решении линейной статической задачи большой размерности итерационным методом, наиболее критичным фактором является объем оперативной памяти. А при решении сильнонелинейной динамической задачи с контактным взаимодействием с помощью явной схемы интегрирования во времени (например, моделирование краш-теста), более важно быстродействие процессора. Кроме таких параметров конфигурации как тип процессора и объем оперативной памяти, огромное значение могут иметь не столь традиционно обсуждаемые и анализируемые, но от этого не менее влияющие на общее быстродействие системы, как, например, частота системной шины и ее соответствие частоте оперативной памяти, многоканальный доступ к оперативной памяти и т.д.
С целью отслеживания текущего состояния на рынке доступных, но мощных рабочих станций, которые могут быть использованы предприятиями для выполнения ежедневных МКЭ расчетов, в лаборатории "Вычислительная механика" совместно со специалистами компании Нево-Д, многолетнего партнера и поставщика вычислительной техники для CompMechLab, имеющего статус Intel Premier Provider, был собран и протестирован ряд конфигураций рабочих станций Intel, путем решения benchmark-тестов - широкого круга задач с помощью программных систем конечно-элементного анализа ANSYS и LS-DYNA.
Для исследования были выбраны три конфигурации на базе различных процессоров Intel: Xeon, Core Quad и i7. При проведении тестов сравнивались не только три различных системы, но и ускорение на каждой из систем, при использовании различного числа ядер.
Результаты тестов на основе ANSYS 11 SP1 x64
Для тестирования производительности рабочих станций при проведении расчетов в программной системе КЭ анализа ANSYS был выбран стандартный набор тестов ANSYS SP1 BENCH110 Benchmark Suite. Данный набор тестов содержит 8 задач различной размерности и относящихся к различным классам. Присутствуют как линейные/нелинейные, стационарные/нестационарные задачи теории упругости теории колебаний, теплопроводности, магнитостатики.
1. Статическая задача теории упругости, 850 тыс. степеней свободы, sparse-решатель.
Данная задача средней размерности и должна полностью помещаться в оперативной памяти.
2. Задача теории колебаний, 760 тыс. степеней свободы, Block Lanczos-решатель.
В ходе решения задачи производится расчет 200 частот и форм собственных колебаний. Задача показывает сбалансированность работы процессора и жесткого диска. На времени решения задачи положительно сказывается большой объем оперативной памяти. Выигрыш от ускорения расчета при параллелизации может теряться на фоне длительного процесса факторизации матриц.
3. Нелинейная контактная задача, 200 тыс. степеней свободы, sparse-решатель.
Задача показывает сбалансированность работы процессора и жесткого диска.
4. Нелинейная задача магнитостатики, 90 тыс. степеней свободы, sparse-решатель.
Задача малой размерности, которая должна помещаться в оперативной памяти любой машины. Показывает быстродействие подсистемы памяти.
5. Нестационарная задача теплопроводности, 700 тыс. степеней свободы, JCG-решатель.
Еще одна небольшая задача, которая должна хорошо решаться на любой машине. Узким местом для итеративного решателя, используемого в данной задаче, является пропускная способность памяти.
6. Статическая задача теории упругости, 250 тыс. степеней свободы, sparse-решатель.
Тест показывает баланс CPU и I/O подсистемы. Задача из этого теста решается в памяти любой Win32 машины (размерность задачи автоматически подстраивается) . Подпрограммы Sparse - решателя по перемножения матриц с двойной точностью создают основную вычислительную нагрузку.
7. Cтатическая задача теории упругости, 750 тыс. степеней свободы, sparse-решатель.
Тест показывает баланс CPU и I/O подсистемы. На скорости счета хорошо сказывается размер оперативной памяти. Задача требует 16 Гб свободной оперативной памяти.
8. Статическая задача теории упругости, 5 млн. степеней свободы, PCG-решатель.
Самая "тяжелая" задача из данного набора тестов. Лучший тест для пропускной способности подсистемы памяти.
Результаты тестов на основе LS-DYNA 971
Для измерения производительности компьютеров при вычислениях в КЭ пакете LS-DYNA выбран набор тестов Top Crunch. В тесте моделируется прямой удар автомобиля Plymouth Neon 1996 года выпуска на скорости 51 км/ч в недеформируемый барьер. КЭ модель содержит 535 тысяч элементов. Продолжительность процесса составляет 30 мс. КЭ модель была создана в Национальном центре моделирования краш-тестов (National Crash Analysis Center, NCAC) Университета имени Джорджа Вашингтона (George Washington University).
Решатель с одиночной точностью (single precision)
Решатель с двойной точностью (double precision)
Выводы
Как показали результаты проведенных тестов, система на базе Intel Core i7 оставляет далеко позади Core Quad и Xeon, будучи быстрее в 1,5 - 2 раза в зависимости от теста.
В свою очередь, Core Quad опережает Xeon на 5-15% практически на всех задачах, за исключением теста 7, где определяющим для быстродействия является объем оперативной памяти, которой в системе на базе Xeon 16 Гб, в отличие от 8 Гб у системы на Core Quad. Фактически, на системе Core Quad задача полностью не поместилась в память, что обусловило более длительное время счета. Однако, на системе i7 даже несмотря на наличие лишь 8 Гб памяти, показаны наилучшие результаты. Этот факт может быть обусловлен не только быстродействием процессора i7, но и гораздо более эффективной работой с памятью DDR3, контроллер которой в конфигурации i7 перенесен с материнской платы на процессор.
Интересным является также тот факт, что использование второго процессора (дополнительных 4 ядер) на системе Xeon дало ускорение по сравнию с одним процессором лишь на 10-20% и только в половине тестов. Таким образом, для данной системы использование второго процессора для проведения расчетов не совсем эффективно, вследствие архитектуры логики материнской платы. Гораздо целесообразнее использовать в данной системе один процессор для расчетов, а второй - для текущей работы, что позволит ставить задачи на счет не только "в ночь", но и днем, параллельно с работой в других приложениях.
Контакты
По вопросу консультаций и подбора конфигураций рабочих станций для МКЭ расчетов и тестирования производительности систем, вы можете обращаться по электронной почте Research(at)CompMechLab.com или к Дмитрию Михалюку по тел. +7 (812) 534-5761.