SIMULIA 最新發(fā)布的 Abaqus 6.11 中加入了 GPU 加速 Abaqus/Standard 求解模塊的功能,從而使用戶在面臨規(guī)模日益增長的計算模型時,Abaqus 能夠在并行計算的基礎(chǔ)上,發(fā)揮 GPU 浮點計算的特長,進一步提高問題的求解效率。本文在上海超級計算中心“魔方”平臺上通過 Abaqus 6.11 求解典型結(jié)構(gòu)力學問題,針對 Abaqus/Standard 求解模塊的 GPU 加速性能進行了測試分析。
結(jié)果表明,在 CPU 并行規(guī)模小于 16 的情況下開啟 GPU 加速后,多種類型結(jié)構(gòu)問題的求解效率均有不同程度的提高,并且結(jié)構(gòu)靜力學與非滑移接觸問題的加速效果最為明顯,個別單元類型問題 GPU加速無法得以體現(xiàn)。隨著 CPU與 GPU異構(gòu)協(xié)同處理技術(shù)的不斷發(fā)展,GPU 加速在 Abaqus軟件中必將發(fā)揮越來越重要的作用。
一、Abaqus 與 GPU 通用計算簡介
Abaqus是DS SIMULIA旗下一套功能強大的工程模擬有限元分析軟件,可以分析復雜的固體力學結(jié)構(gòu)力學系統(tǒng),特別是能夠駕馭非常龐大復雜的問題和模擬高度非線性問題,在大量的高科技產(chǎn)品研究中發(fā)揮著巨大的作用。Abaqus中包含Abaqus/Standard 和Abaqus/Explicit兩個主求解器模塊,Abaqus/Standard提供并行稀疏矩陣求解器,對各種大規(guī)模計算問題都能十分可靠地快速求解。在解決實際問題時,計算規(guī)模往往非常龐大,除了強大的并行功能外,Abaqus/Standard還包含許多新穎的求解技巧來提高求解速度。Dassault Systèmes于 2011 年 5 月發(fā)布了最新版本Abaqus 6.11,在最新版本中增加了GPU加速求解功能,能夠利用英偉達。
目前,通用科學與工程計算正由CPU中央處理向CPU與GPU協(xié)同處理的方向發(fā)展。在Abaqus/Standard 6.11 中,CPU負責控制作業(yè)的啟動和終止,GPU負責求解繁重的計算任務(wù),并將結(jié)果通過PCIE×16 接口返回給CPU。根據(jù)官方數(shù)據(jù)的Quadro或Tesla系列GPU,實現(xiàn)由GPU加速的CAE計算。
二、測試工況
本文選取結(jié)構(gòu)靜力學、材料非線性以及狀態(tài)非線性(接觸)三類典型結(jié)構(gòu)問題,其中靜力學
問題采用兩種不同單元類型,設(shè)計四個測試工況,工況設(shè)置如表 1 所示。
表 1 測試工況表
典型的計算模型示意圖如圖 1 所示。
圖 1 測試模型(Case a)
在靜力學問題求解過程中增量步與迭代步數(shù)目均為 1,非線性問題求解時的最大增量步長為0.2,在 20 個增量步之內(nèi)完成。對每個模型首先在不同的并行規(guī)模下進行求解(CPU核心數(shù)分別為 2、4、8、16),記錄下CPU求解所需時間TCPU,然后在Abaqus/Standard求解器中開啟GPU加速選項,再針對同一問題進行求解,記錄下帶有GPU加速下的計算耗時TCPU+GPU,并進行統(tǒng)計處理。
三、軟硬件測試環(huán)境
Abaqus/Standard求解器模塊的GPU加速性能測試在上海超級計算中心“魔方”超級計算機上完成。“魔方”(曙光 5000A)共包含 1450 個刀片節(jié)點、82 個胖節(jié)點、32 個普通接入節(jié)點以及8 個圖形接入節(jié)點,內(nèi)存總?cè)萘?95TB,磁盤總?cè)萘?500TB,采用Infiniband互聯(lián)方式。本次測試工作在GPU胖節(jié)點上進行。節(jié)點主要硬件配置如表 2 所示。
表 2 魔方 GPU 節(jié)點配置
四、測試結(jié)果分析
4.1、CPU 并行規(guī)模對 GPU 加速性能的影響
不同并行規(guī)模下Abaqus/Standard計算耗時典型測試結(jié)果如圖 2 所示。通過對比可以發(fā)現(xiàn),在Case a中,GPU加速功能的開啟能夠明顯提高求解效率,并且CPU并行規(guī)模越小,GPU加速的效果越理想,如在雙核計算時,GPU加速能夠?qū)⑶蠼馑俣忍岣叩?2.5 倍以上,加速效果相當可觀,而當CPU并行規(guī)模增加至 16 核后,GPU參與求解與否對計算耗時的作用幾乎可以忽略。出現(xiàn)這一現(xiàn)象的原因可能在于,隨著并行規(guī)模的提高,單個CPU核心被分配的計算量迅速減少,從而令TCPU處于較低的水平,此時開啟GPU加速功能后, CPU與GPU的計算量的分配工作本身亦需要消耗一定的資源,因此GPU的加速性能并不能得到很好的體現(xiàn)。類似的變化規(guī)律同樣符合Case c,并且在相同的并行規(guī)模下,GPU加速效果在Case c中的作用相對而言有限得多,即使在最小的雙核并行規(guī)模下,開啟GPU加速也僅僅將計算耗時降低了 24%。
Case a Case c
圖 2 典型工況計算耗時對比
4.2、結(jié)構(gòu)問題類型對 GPU 加速性能的影響
圖 3 為在并行規(guī)模為雙核、4 核、8 核以及 16 核時,四組工況的GPU加速性能對比,圖中以CPU計算耗時TCPU為基準,對GPU加速后的計算耗時TCPU+GPU進行歸一化處理,所占百分比在圖中以數(shù)字標識。
CPU×8 CPU×16
圖 3 不同結(jié)構(gòu)問題的 GPU 加速效果
從圖 3 中可以看出,除Case b外,其余三組工況中,無論是結(jié)構(gòu)靜力學問題(Case a),還是材料非線性問題(Case c),或者是狀態(tài)非線性問題(Case d),GPU對Abaqus/Standard求解器模塊均有不同程度的加速作用,問題的求解時間均有不同程度的下降。其中,結(jié)構(gòu)靜力學問題與接觸問題中的GPU加速性能體現(xiàn)得最為明顯,如Case d在 8 核并行規(guī)模下開啟GPU加速能夠減少計算耗時 30%以上。GPU對材料非線性問題的加速性能一般,求解時間至少為TCPU值得注意的是,在Case b中,無論CPU并行規(guī)模大小,T的 75%以上。
CPU+GPU全部高于TCPU,這就意味著,在Abaqus/Standard求解器中開啟GPU加速選項,結(jié)果卻使得最終求解時間不減反增。需要指出的是,Case b與Case a同屬于結(jié)構(gòu)靜力學問題,計算量也相當,兩者的差別主要在于單元類型不同,Case a為實體單元,而Case b則為軸對稱平面單元,其結(jié)果卻是GPU加速性能相差很大,由此推測,GPU對采用個別單元類型的結(jié)構(gòu)靜力學問題的加速作用并不能很好地得以體現(xiàn),甚至將引起計算時間變長,但需要進一步的測試工作來驗證。
五、結(jié)論
本文介紹了 Abaqus 6.11 中新增的 GPU 加速功能,利用上海超級計算中心“魔方”超級計算機的 GPU 節(jié)點平臺,通過典型結(jié)構(gòu)問題的求解,分析結(jié)果表明:
(1)開啟 Abaqus/Standard 6.11 中 GPU 加速功能,典型的一般靜力學、材料非線性、接觸類型問題的求解效率均有不同程度的提高,測試中最高能減少相同并行規(guī)模下的 CPU 求解時間的 68%,加速性能相當可觀;
(2)隨著 CPU 并行規(guī)模的增加,GPU 加速效應(yīng)逐漸減弱;
(3)GPU 加速對結(jié)構(gòu)靜力學問題與接觸問題效果最為明顯,對材料非線性問題的加速性能一般,對個別單元類型問題 GPU 的加速性能有可能無法得以體現(xiàn)。
作為第一個支持 GPU 加速的版本,GPU 對 Abaqus/Standard 求解器模塊的加速效果是有目共睹的。根據(jù) SIMULIA 規(guī)劃,在 Abaqus 未來版本中,更多模塊的計算會遷移到 GPU 上運行,并進一步提供多 GPU 加速的支持,GPU 加速在 Abaqus 中將起到舉足輕重的作用。
資料來源:達索官方
[ABAQUS] Abaqus在鈑金沖壓中的應(yīng)用
2024-11-26
2024-11-26
[ABAQUS] 利用GPU加速Abaqus求解結(jié)構(gòu)問題
2024-11-26
2024-11-25
[ABAQUS] 基于Abaqus的光學膠動態(tài)力學行為分析
2024-11-25
[ABAQUS] CATIA和ABAQUS:風機葉片復材設(shè)計和分析
2024-11-25
[CST] 如何在CST仿真中消除反射型一比特超表面的主波束
2024-11-22
2024-11-22
2024-11-22
[行業(yè)資訊] SIMULIA 執(zhí)行角:建模和仿真趨勢
2024-11-21
2023-08-24
[ABAQUS] ABAQUS如何建模?ABAQUS有限元分析教程
2023-07-07
[ABAQUS] abaqus單位設(shè)置【使用教程】
2023-08-29
[ABAQUS] 有限元分析軟件abaqus單位在哪設(shè)置?【操作教程】
2023-09-05
[ABAQUS] Abaqus單位對應(yīng)關(guān)系及參數(shù)介紹-Abaqus軟件
2023-11-20
[ABAQUS] abaqus里面s11、s12和u1、u2是什么意思?s和
2023-08-30
[ABAQUS] 如何準確的評估真實行駛工況條件下的空氣動力學性能
2020-11-19
[ABAQUS] ABAQUS軟件教程|場變量輸出歷史變量輸出
2023-07-18
[ABAQUS] ABAQUS軟件中Interaction功能模塊中的綁定接
2023-07-19
2023-07-26
[行業(yè)資訊] 數(shù)字建模與仿真技術(shù)加速推進心血管醫(yī)療器械研發(fā)研討會
2024-11-20
[行業(yè)資訊] 通用汽車公司把春季與辛普森公司聯(lián)合起來
2024-11-18
[行業(yè)資訊] 達索系統(tǒng) SIMULIA Abaqus/Standard接
2024-11-19
[行業(yè)資訊] SIMULIA 執(zhí)行角:建模和仿真趨勢
2024-11-21
2024-11-18
[有限元知識] 利用CFD和機器學習快速發(fā)展空氣動力學
2024-11-15
[有限元知識] 網(wǎng)球運動中馬格納斯效應(yīng)的模擬仿真
2024-11-14
[行業(yè)資訊] DELMIA Robotics 在ABI Research
2024-11-14
[行業(yè)資訊] 達索系統(tǒng)MODSIM解決方案高級技術(shù)日
2024-11-13
[行業(yè)資訊] 通過革新質(zhì)量管理策略,有效規(guī)避FDA警告
2024-11-13