支援 ARM 和 VIsualStudio 2012:CUDA 5.5 Production Release

| | 4 Comments| 09:58
Categories:

這應該是幾天前的消息了,nVIDIA 的 CUDA 這個使用顯示卡來做平行計算的開發套件,又推出新的版本了~這次的版本是 5.5 正式的 Production Release 版(之前有推出過 Release Candidate,這次版本編號是 5.5.20),下載頁面是:

https://developer.nvidia.com/cuda-downloads

而他比較重要的更新,可以參考 CUDA Toolkit 的頁面,主要包括了:

  • Optimized for MPI Applications
    • Enhanced Hyper-Q support for multiple MPI processes via the new Multi-Process Service (MPS) on Linux systems
    • MPI Workload Prioritization enabled by CUDA stream prioritization
    • Multi-process MPI debugging & profiling
  • Guided Performance Analysis
    • Step-by-step guidance helps you identify performance bottlenecks and apply optimizations in the NVIDIA Visual Profile and Nsight, Eclipse Edition
  • Support for ARM Platforms
    • Native compilation, for easy application porting
    • Fast cross-compile on x86 for large applications
  • More Highlights
    • Single GPU debugging for Linux
    • Static CUDA runtime library
    • RPM/DEB packaging & new NVIDIA repo

而更完整的更新說明,則可以參考 release note

在 Heresy 來看,最重要的一點,應該算是 nVIDIA CUDA 開始正式支援 ARM 的平台(Linux ARMv7)吧~在使用 CUDA 這種 GPGPU 的計算環境時,由於主要的計算都是放在 GPU 上,所以其實有不少狀況,都是不需要很強的 CPU 效能的;而如果使用較為省電的 ARM 來作主系統的話,其實應該是可以降低成本、並減少耗電量的。
(參考:《CUDA for ARM Platforms is Now Available》)

而另外,由於下一代的 Tegra 行動處理器上面也會直接搭載 Kepler 的 GPU,所以之後應該也有機會,可以直接在行動裝置(平板、手機)上面,執行 CUDA 的計算了~

另外,其實 nVIDIA CUDA 對於 Visual Sutio 的更新其實反映一直都不算快;而現在,CUDA 5.5 終於正式支援 Visual Studio 2012 了!這也代表,Heresy 這邊終於可以把開發環境整個升級到 Visual Studio 2012 了~

4 thoughts on “支援 ARM 和 VIsualStudio 2012:CUDA 5.5 Production Release”

  1. heresy您好,我的研究方向是機器人視覺的方面,主要是運用KINECT的影像來做3D MODEL RETRIEVAL,看了一些資料以及PAPER,覺得可以運用OPENCV與CUDA來進行。當然首先是購買一張顯示卡,看了規格後同價位的QUADRO K2000與GTX760,是GTX760的CUDA CORE較多,但QUADRO是專業的繪圖卡,支援度較好,若以在GPU上做像SURF這類的計算,應該選擇哪種卡較好
    謝謝您的指教

  2. to QOO

    除非有特別需求,不然個人會建議,買 GeForce 就夠了。
    但是如果你是需要 double 計算的話,可能得考慮去找舊的 GeForce 500 系列,或是 GeForce Tiatan 這類的卡,才會有比較好的 double 計算能力。

  3. heresy您好,我後來買了張麗台GTX660來使用,環境是WIN7、VS 2012、OPENCV2.4.6、CUDA5.5。參考很多網路上的文章,但每篇都講得不太一樣,也都試不出來實在讓我很困惑,我用一個官方的SAMPLE去執行如下
    int main() {
    int num_device= cv::gpu::getCudaEnabledDeviceCount();
    std::cout

Leave a Reply

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *