距離之前《nVidia CUDA 2.3 Beta 封測》一個月,nVidia 現在把 CUDA SDK、Toolkit 2.3 正式發布了∼官方發布文章是《CUDA Toolkit and SDK 2.3 released》。2.3 的更新功能如下:
- CUFFT 加入了對 double-precision transforms 的支援,並對 single-precision transforms 的效能有顯著的改進。
- CUDA-GDB hardware debugger 和 CUDA Visual Profiler 被整合進 CUDA Toolkit。CUDA-GDB debugger 現在可以在所有支援的 Linux 上使用。
- SLI 裡個別的 GPU 現在可以個別列舉(?enumerated ),所以即使是在開啟 SLI 的模式下,程式也可以發揮多 GPU 的效能。
- 64bit 的 CUDA Toolkit 可以編譯 32bit 的程式。(終於可以了…)
- 支援 fp16、fp32 的轉換指令,允許 fp16 的資料用 fp32 來計算。
- CUDA SDK 更新加入:
- 範例程式 pitchLinearTexure,示範如何使用 pitch linear memory 的 texture。
- 新的 PTXJIT 範例程式。示範如何用 cuModuleLoadDataEx() 讀取記憶體內的 PTX source。
- 新的 Windows 範例程式,示範如何用 NVCUVID 來對 MPEG-2、VC-1、H.264 的影片解碼,並將畫面傳給 OpenGL 或 Direct3D。
- 更新程式範例,示範如何正確地排列 CUDA kernel 的參數,讓同一個程式可以同時在 x32 和 x64 上運作。(本來不行嗎?)
- Visual Profiler 加強
- MacOS 的 CUDA 驅動程式現在被由 Toolkit 中獨立出來包裝
檔案下載: