CUDA 1.1 Release

恩…之前已經寫了一些還沒完全寫玩的 nVidia CUDA 文件(勉強算是吧?),而前一陣子才忽然發現,CUDA 的 1.1 版已經悄悄正式發布了!而在 nVidia 的網站,也出現了「CUDA Zone」;不過,內容和以前的 CUDA 官網還是差不多就是了。

而 1.1 版和之前的 1.0 的差異在哪呢?1.1 正式版的 release 文件 Heresy 沒找到詳細的相關資料,只有 SDK 的更新紀錄:

  • Updated to the 1.1 CUDA Toolkit
  • Removed isInteropSupported() from cutil: graphics interoperability now works on multi-GPU systems
  • MonteCarlo sample: Improved performance. Previously it was very fast for large numbers of paths and options, now it is also very fast for small- and medium-sized runs.
  • Transpose sample: updated kernel to use a 2D shared memory array for clarity, and optimized bank conflicts.
  • 13 new code samples: asyncAPI, cudaOpenMP, eigenvalues, fastWalshTransform, histogram256, Mandelbrot, MonteCarloMultiGPU, nbody, oceanFFT, particles, reduction, simpleAtomics, and simpleStreams

感覺上,除了 graphics interoperability 開始支援多 GPU 系統外,好像都是 SDK 範例程式上的修改?而如果參考官方論壇發布 1.1 Beta 版的文章《beta CUDA 1.1》,倒是可以獲得比較多的資料;Heresy 大概整理了一下:

  1. 將 CUDA 的動態函式庫 CUDA.dll 放入新版驅動程式。(應該是 169 開始的版本,如此可以減少發布 CUDA 程式時所需的檔案)
  2. 支援 Windows XP 64
  3. More signals in profiler
  4. Graphics interoperability 支援多 GPU 系統
  5. async management 和 stream management 的新的 event management 功能
    • Asynchronous execution
      new memory copy calls with Async suffix return control to the application without waiting for completion (see new asyncAPI SDK example and 1.1 Programming Guide)
    • Alpha feature for supporting overlapped memory copies concurrent with kernel execution using new stream management interface.
      There are specific limitations to this and it will only do overlap on 1.1 architectures (g84/g86/g92), though it will revert to serial operation on 1.0 architectures. (See new simpleStreams SDK example and 1.1 Programming Guide).
  6. SDK 新增範例程式

由於有的東西 Heresy 還沒研究完,所以也不好亂翻譯了…

而目前,CUDA 還是不支援 Vista 這套作業系統。此外,雖然他有提供 XP64 的 SDK,但是 Heresy 卻發現裝了 64bit 的 SDK 並沒有 32bit 的檔案,而且兩者還不能一起裝,這點實在有點討人厭…

總之,先記錄一下,有玩出心得再說吧∼


原始發表於《CUDA 1.1 Release

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *