Цифровая платформа по разработке и применению цифровых двойников CML-Bench®
Уникальный онлайн-курс «Цифровые двойники изделий»
CompMechLab Новости 13 Июля 2010 года
Данная новость была прочитана 9195 раз

CompMechLab®-исследования. Второй этап тестирование производительности рабочих станций Intel с помощью CAE-систем компьютерного инжиниринга ANSYS и LS-DYNA

 В лаборатории  "Вычислительная механика" (CompMechLab®)  НИУ СПбГПУ совместно со специалистами компании Нево-Д, имеющей статус Intel Premier Provider, проведен очередной этап исследования производительности рабочих станций на базе центральных процессоров Intel. Исследование проводилось с использованием открытых наборов тестов для программных систем конечно-элементного анализа ANSYS и LS-DYNA.

   

 Для специалистов и инженеров, активно использующих программные системы компьютерного инжиниринга (CAE),  чрезвычайно актуальным является вопрос выбора конфигурации рабочей станции, максимально эффективной для решения задач в кратчайшие сроки. Данный вопрос не теряет своей актуальности поскольку быстродействие процессоров, объемы оперативной памяти и жестких дисков постоянно растут, что, в свою очередь, сопровождается решением все более сложных задач на основе применения конечно-элементных моделей с большим числом степеней свободы, чем ранее.

Несмотря на достаточно быстрое развитие высокопроизводительных вычислений на основе дорогостоящих кластеров, многие предприятия и вузы России для проведения ежедневных конечно-элементных расчетов применяют высокопроизводительные рабочие станции, т.к. кластеры, безусловно, являются дорогостоящей техникой, требуют тонкой настройки ("тюнинга"), критичны к обслуживанию и имеют обыкновение достаточно быстро устаревать, "зачастую не успев себя окупить".

Другим широко распространненым подходом является использование семейства мощных рабочих станций с возможностью решения ресурсоемких задач  "ночью", "на выходных", посредством "выделения рабочей станции под решение задачи или проекта", с тем, чтобы своевременно получать результаты.

Очевидно, невозможно подобрать универсальную конфигурацию мощной рабочей станции для CAE-приложений (Software), поскольку существует множество классов задач, каждый из которых определяет свои требования к Hardware.

Так, при решении линейной статической задачи большой размерности итерационным методом, наиболее критичным фактором является объем оперативной памяти. А при решении сильнонелинейной динамической задачи с множественными контактными взаимодействиями с помощью явной схемы интегрирования во времени (например, моделирование drop-теста или crash-теста), более важно быстродействие процессора.

Кроме таких параметров конфигурации как тип процессора и объем оперативной памяти, огромное значение могут иметь характеристики, не столь традиционно обсуждаемые и анализируемые, но не менее влияющие на общее быстродействие системы, как, например, частота системной шины и ее соответствие частоте оперативной памяти, многоканальный  доступ к оперативной памяти и т.д.

С целью CAE-мониторинга рынка доступных мощных рабочих станций, которые могут быть использованы предприятиями для выполнения ежедневных FEA/CAE-расчетов, в  лаборатории "Вычислительная механика" (CompMechLab) СПбГПУ совместно со специалистами компании Нево-Д, многолетнего партнера и поставщика вычислительной техники для CompMechLab, имеющего статус Intel Premier Provider, был собран и протестирован ряд конфигураций рабочих станций Intel.

Для исследования были выбраны 2 персональные рабочие станции, и а также 2 специализированные машины, собранные для решения специфических задач. Персональные рабочие станции, уже принимавшые участие в предыдущем тестировании, построены на базе процессоров Intel Core Quad Q6600 и Intel Core i7 920 c 8 Гб оперативной памяти. 

Компьютер на базе Intel Core i7 Extreme Edition 975 с 12 Гб оперативной памяти собран специалистами Нево-Д специально для моделирования процессов обработки металлов давлением, термической и механической обработки в программной системе DEFORM, а также для решения задач с помощью бессрочных коммерческих лицензий ANSYS Mechanical, ANSYS CFX, LS-DYNA, MSC.Marc, SIMULIA Abaqus.Так как подобный класс задач плохо подвергается распараллеливанию, то основой для компьютера послужил четырехядерный процессор Intel с самой высокой, на тот момент, тактовой частотой.

Для решения хорошо распараллеливаемых динамических задач большей размерности ( до 100 млн. дифференциальных уравнений) был собран высокопроизводительный компьютер на базе двух процессоров Intel Xeon E5520, обладающий 72 Гб оперативной памяти. 

При проведении тестов сравнивались не только различные системы, но и ускорение на каждой из систем, при использовании различного числа ядер. На всех компьютерах, проходивших тестирование, была установлена операционная система Microsoft Windows 7 x64.

 

Результаты тестов на основе ANSYS 11 SP1 x64

Для тестирования производительности рабочих станций при проведении расчетов в программной системе КЭ анализа ANSYS был выбран стандартный набор тестов ANSYS SP1 BENCH110 Benchmark Suite. Данный набор тестов содержит множество задач различной размерности, относящихся к различным классам. Присутствуют как линейные / нелинейные, стационарные / нестационарные задачи теории упругости, теории колебаний, теплопроводности и магнитостатики.

1. Статическая задача теории упругости, 850 тыс. степеней свободы, Sparse-решатель.

Данная задача средней размерности и должна полностью помещаться в оперативной памяти.

2. Задача теории колебаний, 760 тыс. степеней свободы, Block Lanczos-решатель.

В ходе решения задачи проводится расчет 200 частот и форм собственных колебаний. Задача показывает сбалансированность работы процессора и жесткого диска. На времени решения задачи положительно сказывается большой объем оперативной памяти. Выигрыш от ускорения расчета при параллелизации может теряться на фоне длительного процесса факторизации матриц.

 

3. Нелинейная контактная задача, 200 тыс. степеней свободы, Sparse-решатель.

Задача демонстрирует сбалансированность работы процессора и жесткого диска.

 

4. Нестационарная задача теплопроводности, 700 тыс. степеней свободы, JCG-решатель.

Еще одна небольшая задача, которая должна хорошо решаться на любой машине. Узким местом для итерационного решателя, используемого в данной задаче, является пропускная способность памяти.

 

5. Статическая задача теории упругости, 250 тыс. степеней свободы, Sparse-решатель.

Тест показывает баланс CPU и I/O подсистемы. Задача из этого теста решается в памяти любой Win32 машины (размерность задачи автоматически подстраивается).  Подпрограммы Sparse-решателя с двойной точностью создают основную вычислительную нагрузку.

 

6. Cтатическая задача теории упругости, 750 тыс. степеней свободы, Sparse-решатель.

Тест показывает баланс CPU и I/O подсистемы. На скорости счета положительно сказывается размер оперативной памяти. Задача требует 16 Гб свободной оперативной памяти.

 

7. Статическая задача теории упругости, 5 млн. степеней свободы, PCG-решатель.

Самая "тяжелая" задача из данного набора тестов. Лучший тест для пропускной способности подсистемы памяти.

8. Результаты тестов на основе LS-DYNA 971

Для измерения производительности компьютеров при вычислениях в программной системе КЭ анализа LS-DYNA выбран набор тестов Top Crunch. В тесте моделируется прямой удар автомобиля Plymouth Neon 1996 года выпуска на скорости 51 км/ч в недеформируемый барьер. КЭ модель содержит 535 тысяч элементов. Продолжительность процесса составляет 30 мс. КЭ модель была создана в Национальном центре моделирования краш-тестов (National Crash Analysis Center, NCAC) Университета имени Джорджа Вашингтона (George Washington University).

8.1. Решатель с одинарной точностью (Single Precision)

8.2. Решатель с двойной точностью (Double Precision)

9. Результаты тестов на основании Linpack 10.2 x64

Тестирование компьютеров с использованием  программной библиотеки решения систем линейных алгебраических уравнений Linpack 10.2 х64 .  Данный синтетический тест позволяет оценить скорость выполнения операций с плавающей точкой (Floating point Operations Per Second, FLOPS). Тестирование  проводится для систем линейных уравнений 23118 порядка, что соответствует 4 Гб занимаемой для расчетов оперативной памяти. В силу очень хорошей параллелизации (распараллеливаемости) теста его результаты позволяют косвенно оценить максимально возможную производительность компьютера.

 

Выводы 

Как показали результаты проведенных тестов, системы на базе архитектуры Intel Nehalem заметно опережают своих предшественников Kentsfield.

 

Результаты стандартного набора задач ANSYS SP1 BENCH110 Benchmark Suite на машинах с размером оперативной памяти менее 8 Гб, как и ожидалось, оказываются неудовлетворительными на задачах, требовательных к объему оперативной памяти. Причиной падения производительности может быть как слабая совместимость постепенно устаревающей версии ANSYS 11 SP1 с недавно вышедшей  Windows 7, так и неполная оптимизация ядра Windows 7 для работы со ресурсоемкими приложениями. Возможно, в текущей версии ядро Windows 7 каким-то образом потребляет больше оперативной памяти по сравнению с Windows Vista SP2, в результате чего наиболее ресурсоемкие задачи, не помещаясь в оперативной памяти машины, начинают использовать файл подкачки, что приводит к резкому падению производительности.

 

В ближайшее время на нашем сайте будет опубликован отдельный материал, посвященный сравнению производительности Windows Vista SP2 x64 и Windows 7 x64. Мы будем следить за производительностью более новой системы и обязательно проверим, как повлияет на ее работу скорое появление первого ServiePack.

 

Новые компьютеры, принимающие участие в тестировании, хорошо показали себя. Для Intel Xeon E5520 X2 наблюдается рост производительности при распараллеливании на 6-8 потоков. Для процессоров Intel Xeon E55XX, построенных на архитектуре Nehalem со встроенным трехканальным контроллером памяти, уже не актуальны былые проблемы Kentsfield эффективного использования оперативной памяти в многопроцессорных системах. Класс задач, для которых был собран этот компьютер, не представлен в рамках открытых наборов тестов, и машина не может полностью раскрыть весь свой потенциал. Косвенно преимущество двухпроцессорной машины можно оценить по результатам теста Linpack, в котором она превосходит конкурентов в 1,5 - 2 раза.

 

Intel Core i7 975 EE отлично справляется с любыми задачами из теста, оставляя позади все другие четырехядерные машины. Сказывается высокая тактовая частота процессора и завышенная пропускная способность системной шины QPI.

 

Контакты - Research (at) CompMechLab.com

 

Сссылки по теме на нашем сайте:

Тестирование производительности рабочих станций Intel для решения широкого круга задач с помощью CAE-систем компьютерного инжиниринга ANSYS и LS-DYNA (1 этап)