nVIDIA 在五月的時候,就推出新版的 CUDA 5 的預覽版(介紹)了,不過當時應該是要是有註冊的開發者才可以下載。而現在,nVIDIA 再進一步、針對所有使用者推出了 CUDA 5 Release Candidate、讓所有有需要的開發者都可以使用了!
CUDA 5 的主要變化,應該還是:RDMA for GPUDirect、GPU Library Object Linking、Dynamic Parallelism 這三項了~這部分和之前的 Preview 版基本上都是相同的。而版本編號是從 Preview 的 5.0.7 變成了 5.0.27,裡面還整合了新的專用版的顯示卡驅動程式(Windows 是 305.60),不用另外下載;不過從官方的 release note 裡(連結),似乎沒有看到和之前的 Preview 版差在哪裡。
下面,則是官方的 Introduction to CUDA5 影片(不過以日期來看,應該是 Preview 版時就有的):
其中,Heresy 覺得比較重要的,是「Dynamic Parallelism」這個基本上應該是針對還沒上市的 Kepler GK110 GPU(目前 nVIDIA 市面上最新的 GPU 都是弱化 double 計算的 Kepler GK104/GK107)、也就是預計第四季會推出的 Tesla K20(官網、PDF)的專用技術了~
另外,Heresy 個人覺得比較可惜的,就是 CUDA 5 RC 目前也還不支援最新的 Visual Studio 2012 就是了。
而除了 CUDA 5 和 Tesla K20 之外,nVIDAI 日前也正式發布了新一代、同樣採用 Kepler 架構 GPU 的專業繪圖卡、nVIDIA Quadro;目前只有一張定位在「High End」的、搭配 4GB 記憶體的 Quadro K5000(官網),採用的應該也是和 GeForce GTX 680 相同的 GK104 核心設計。
而如果根據官方的比較表(PDF、下圖)來看的話,也可以看的出來,和 Tesla 的狀況類似,如果以同等級的卡(對應到上一代的 Quadro 5000)來比的話,雖然雙精度浮點樹的計算能力是大幅提升了三倍(718→2150),但是雙經度浮點數的部分,則是大概只剩下 1/4(359→90),連降一級的 Quadro 4000 都比不上了…
基本上,Heresy 個人是認為 nVIDIA 一方面應該是要做市場區隔,把高速計算和 3D 繪圖的產品線給分開;另一方面,應該也是由於在 3D 繪圖方面其實用不太到 double 計算,所以改把 double 計算的硬體資源,拿來做別的事、以獲取更好的效能。
而實務上來看,這樣的區隔應該算是成功的,目前的 Kepler GK104 在 3D 效能、耗電量上,都有相當不錯的表現~但是代價,就是要使用雙精度浮點數來做高速計算的人,反而不適合使用這款新的 GPU 了…某方面來說,或許也意味著,以後要做 CUDA(或 OpenCL)來進行高速計算的話,可能就不能買便宜的 GeForce 來玩,而還是得買 Tesla 這種專用卡了~
不過另一方面,Quadro 最高階的「Ultra High End」(之前的 Quadro 6000)目前還沒有新的卡出來,到時候新的卡(應該會叫 Quadro K6000?)有沒有機會採用 Tesla K20 的 GK110 這顆算是完整版的 Kepler?還是一樣是會採用 GK10x 系列的 GPU?這點就不得而知了。