亚洲成人午夜激情_影音先锋影AV色资源站_国产经典自拍视频在线观看_免费看无码特级毛片_91热这里只有精品国产_日本高清无卡码一区二区久久_亚洲国产日本综合a_最新永久免费a∨无码网站_在线观看日韩视频_av在线呻吟网站

 
18620856065
索 取 報 價
資   訊   中   心?

利用GPU加速Abaqus求解結(jié)構(gòu)問題

來源: | 作者:thinks | 發(fā)布時間: 2024-11-26 | 10 次瀏覽 | 分享到:

SIMULIA 最新發(fā)布的 Abaqus 6.11 中加入了 GPU 加速 Abaqus/Standard 求解模塊的功能,從而使用戶在面臨規(guī)模日益增長的計算模型時,Abaqus 能夠在并行計算的基礎(chǔ)上,發(fā)揮 GPU 浮點計算的特長,進一步提高問題的求解效率。本文在上海超級計算中心“魔方”平臺上通過 Abaqus 6.11 求解典型結(jié)構(gòu)力學問題,針對 Abaqus/Standard 求解模塊的 GPU 加速性能進行了測試分析。

 

結(jié)果表明,在 CPU 并行規(guī)模小于 16 的情況下開啟 GPU 加速后,多種類型結(jié)構(gòu)問題的求解效率均有不同程度的提高,并且結(jié)構(gòu)靜力學與非滑移接觸問題的加速效果最為明顯,個別單元類型問題 GPU加速無法得以體現(xiàn)。隨著 CPU與 GPU異構(gòu)協(xié)同處理技術(shù)的不斷發(fā)展,GPU 加速在 Abaqus軟件中必將發(fā)揮越來越重要的作用。

 

一、Abaqus 與 GPU 通用計算簡介

Abaqus是DS SIMULIA旗下一套功能強大的工程模擬有限元分析軟件,可以分析復雜的固體力學結(jié)構(gòu)力學系統(tǒng),特別是能夠駕馭非常龐大復雜的問題和模擬高度非線性問題,在大量的高科技產(chǎn)品研究中發(fā)揮著巨大的作用。Abaqus中包含Abaqus/Standard 和Abaqus/Explicit兩個主求解器模塊,Abaqus/Standard提供并行稀疏矩陣求解器,對各種大規(guī)模計算問題都能十分可靠地快速求解。在解決實際問題時,計算規(guī)模往往非常龐大,除了強大的并行功能外,Abaqus/Standard還包含許多新穎的求解技巧來提高求解速度。Dassault Systèmes于 2011 年 5 月發(fā)布了最新版本Abaqus 6.11,在最新版本中增加了GPU加速求解功能,能夠利用英偉達。

 

目前,通用科學與工程計算正由CPU中央處理向CPU與GPU協(xié)同處理的方向發(fā)展。在Abaqus/Standard 6.11 中,CPU負責控制作業(yè)的啟動和終止,GPU負責求解繁重的計算任務(wù),并將結(jié)果通過PCIE×16 接口返回給CPU。根據(jù)官方數(shù)據(jù)的Quadro或Tesla系列GPU,實現(xiàn)由GPU加速的CAE計算。

 

二、測試工況

本文選取結(jié)構(gòu)靜力學、材料非線性以及狀態(tài)非線性(接觸)三類典型結(jié)構(gòu)問題,其中靜力學

問題采用兩種不同單元類型,設(shè)計四個測試工況,工況設(shè)置如表 1 所示。

 

1 測試工況表

表 1 測試工況表 

 

典型的計算模型示意圖如圖 1 所示。

 

圖 1 測試模型(Case a) 

1 測試模型(Case a)

 

在靜力學問題求解過程中增量步與迭代步數(shù)目均為 1,非線性問題求解時的最大增量步長為0.2,在 20 個增量步之內(nèi)完成。對每個模型首先在不同的并行規(guī)模下進行求解(CPU核心數(shù)分別為 2、4、8、16),記錄下CPU求解所需時間TCPU,然后在Abaqus/Standard求解器中開啟GPU加速選項,再針對同一問題進行求解,記錄下帶有GPU加速下的計算耗時TCPU+GPU,并進行統(tǒng)計處理。

 

三、軟硬件測試環(huán)境

Abaqus/Standard求解器模塊的GPU加速性能測試在上海超級計算中心“魔方”超級計算機上完成。“魔方”(曙光 5000A)共包含 1450 個刀片節(jié)點、82 個胖節(jié)點、32 個普通接入節(jié)點以及8 個圖形接入節(jié)點,內(nèi)存總?cè)萘?95TB,磁盤總?cè)萘?500TB,采用Infiniband互聯(lián)方式。本次測試工作在GPU胖節(jié)點上進行。節(jié)點主要硬件配置如表 2 所示。

 

2 魔方 GPU 節(jié)點配置

表 2 魔方 GPU 節(jié)點配置 

 

四、測試結(jié)果分析

4.1、CPU 并行規(guī)模對 GPU 加速性能的影響

不同并行規(guī)模下Abaqus/Standard計算耗時典型測試結(jié)果如圖 2 所示。通過對比可以發(fā)現(xiàn),在Case a中,GPU加速功能的開啟能夠明顯提高求解效率,并且CPU并行規(guī)模越小,GPU加速的效果越理想,如在雙核計算時,GPU加速能夠?qū)⑶蠼馑俣忍岣叩?2.5 倍以上,加速效果相當可觀,而當CPU并行規(guī)模增加至 16 核后,GPU參與求解與否對計算耗時的作用幾乎可以忽略。出現(xiàn)這一現(xiàn)象的原因可能在于,隨著并行規(guī)模的提高,單個CPU核心被分配的計算量迅速減少,從而令TCPU處于較低的水平,此時開啟GPU加速功能后, CPU與GPU的計算量的分配工作本身亦需要消耗一定的資源,因此GPU的加速性能并不能得到很好的體現(xiàn)。類似的變化規(guī)律同樣符合Case c,并且在相同的并行規(guī)模下,GPU加速效果在Case c中的作用相對而言有限得多,即使在最小的雙核并行規(guī)模下,開啟GPU加速也僅僅將計算耗時降低了 24%。

 

圖 2 典型工況計算耗時對比 

Case a                                              Case c

2 典型工況計算耗時對比

 

4.2、結(jié)構(gòu)問題類型對 GPU 加速性能的影響

3 為在并行規(guī)模為雙核、4 核、8 核以及 16 核時,四組工況的GPU加速性能對比,圖中以CPU計算耗時TCPU為基準,對GPU加速后的計算耗時TCPU+GPU進行歸一化處理,所占百分比在圖中以數(shù)字標識。

 

圖 3 不同結(jié)構(gòu)問題的 GPU 加速效果 

CPU×8                 CPU×16

3 不同結(jié)構(gòu)問題的 GPU 加速效果

 

從圖 3 中可以看出,除Case b外,其余三組工況中,無論是結(jié)構(gòu)靜力學問題(Case a),還是材料非線性問題(Case c),或者是狀態(tài)非線性問題(Case d),GPU對Abaqus/Standard求解器模塊均有不同程度的加速作用,問題的求解時間均有不同程度的下降。其中,結(jié)構(gòu)靜力學問題與接觸問題中的GPU加速性能體現(xiàn)得最為明顯,如Case d在 8 核并行規(guī)模下開啟GPU加速能夠減少計算耗時 30%以上。GPU對材料非線性問題的加速性能一般,求解時間至少為TCPU值得注意的是,在Case b中,無論CPU并行規(guī)模大小,T的 75%以上。

 

CPU+GPU全部高于TCPU,這就意味著,在Abaqus/Standard求解器中開啟GPU加速選項,結(jié)果卻使得最終求解時間不減反增。需要指出的是,Case b與Case a同屬于結(jié)構(gòu)靜力學問題,計算量也相當,兩者的差別主要在于單元類型不同,Case a為實體單元,而Case b則為軸對稱平面單元,其結(jié)果卻是GPU加速性能相差很大,由此推測,GPU對采用個別單元類型的結(jié)構(gòu)靜力學問題的加速作用并不能很好地得以體現(xiàn),甚至將引起計算時間變長,但需要進一步的測試工作來驗證。

 

五、結(jié)論

本文介紹了 Abaqus 6.11 中新增的 GPU 加速功能,利用上海超級計算中心“魔方”超級計算機的 GPU 節(jié)點平臺,通過典型結(jié)構(gòu)問題的求解,分析結(jié)果表明:

 

1)開啟 Abaqus/Standard 6.11 中 GPU 加速功能,典型的一般靜力學、材料非線性、接觸類型問題的求解效率均有不同程度的提高,測試中最高能減少相同并行規(guī)模下的 CPU 求解時間的 68%,加速性能相當可觀;

2)隨著 CPU 并行規(guī)模的增加,GPU 加速效應(yīng)逐漸減弱;

3)GPU 加速對結(jié)構(gòu)靜力學問題與接觸問題效果最為明顯,對材料非線性問題的加速性能一般,對個別單元類型問題 GPU 的加速性能有可能無法得以體現(xiàn)。

 

作為第一個支持 GPU 加速的版本,GPU 對 Abaqus/Standard 求解器模塊的加速效果是有目共睹的。根據(jù) SIMULIA 規(guī)劃,在 Abaqus 未來版本中,更多模塊的計算會遷移到 GPU 上運行,并進一步提供多 GPU 加速的支持,GPU 加速在 Abaqus 中將起到舉足輕重的作用。

 

資料來源:達索官方

 主 營 產(chǎn) 品
cst
Abaqus
Powerflow
Xflow
simpack
CATIA
最 新 內(nèi) 容
熱 門 文 章
知 識 科 普
方 案 解 析
  • 汽車交通
  • 風能電源
  • 船舶機械
  • 生物醫(yī)療
  • 土木建筑
  • 新能源
  • 高科技