用 CUDA 來解 All Pair Shortest Path (APSP) 問題 (更新)

2010年發表的文章『用 CUDA 來解 All Pair Shortest Path (APSP) 問題』,經過這麼多年,終於有了一台新工作站及一張新顯卡(GeForce 1060, 6GB) (嘆氣…)。裝了 Ubuntu 16.04 及 Cuda 8.0 (因為還要測試 Tensorflow,所以沒裝 Cuda 9.0,裝的過程也是不順利,那又是另一回事了)。

當年會將矩陣拆成以小 block來算APSP,主要是因為舊卡只有512MB的memory,無法把整個Matrix放進去。所以只好照 paper上的演算法把一個大的矩陣拆成小小 block然後再計算。

而現在GeForce 1060上有6GB的RAM,就想再來測試performance如何。測試很簡單,直接用之前文章裡的APSP_kernel。改也不用改。

計算時間:~150 sec

相較之前用 block_APSP,需要約500秒,程式開發也花了很多時間。現在用新卡有大memory來硬算實在是太簡單了。smiley

 

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *