昨天才介紹完 nVIDIA 最新的旗艦級繪圖卡、完整 GK110 的 Quadro K6000,現在 nVIDIA 則又把 Kepler 做了另外的應用,那就是行動處理器的 GPU!
首先,官方的部落格文章是《NVIDIA Brings Kepler, World’s Most Advanced Graphics Architecture, to Mobile Devices》。nVIDIA 這次展示的,是代號名為「Logan」的下一代 ARM 架構的 Tegra SoC 晶片(官網);相較於這一代的 Tegra 4 採用的 GPU 核心是使用古老的 G70 架構(GeForce 8000 的 G80 以前的產品),這次 nVIDIA 直接把最新的 Kepler 架構的 GPU、搬上了行動裝置!
在 Heresy 來看,這應該算是一個重大的突破了~以往的行動裝置的 GPU,由於架構不像桌上型電腦的 GPU 那麼先進,所以都僅只能提供功能較少的 OpenGL ES 的 API;而 nVIDIA 這次直接把最新架構的 GPU 核心拿來用,也就代表它除了可以支援最新的 OpenGL ES 3.0 外,在硬體上更可以支援功能更強大的 OpenGL 4.4、Direct X 11,不但有最新的 Geometry Shader、Tessellation 等功能,也支援通用計算(nVIDIA CUDA 5.0,理論上應該 OpenCL 也支援),可以用來做物理計算與模擬!如此一來,真的讓行動裝置的 GPU 功能大幅地提高了~
而實際上的效能呢,他基本上會是一組 Kepler 的 SMX、也就是 192 顆 CUDA Core(應該會是 FP64 被閹割的 GK10x 吧?),nVIDIA 號稱是行動版的 Kepler 將會擁有超越 GeForce 8800 GTX、PlayStation 3 的效能~在下圖可以看到,nVIDIA 預期 mobile Kepler 的效能會是 2009 年的 200x 以上~
根據 AnandTech 的評估(文章),nVIDIA 預期 mobile Kepler 的效能大約會是 iPad 4 的 5.2 倍左右;而由於 iPad 4 的 PowerVR SGX 554MP4 的 FP32 計算能力是 76.8 GFLOPS,所以就可以估算出,mobile Kepler 的 FP32 計算能力應該在 400 GFLOPS 左右。如果繼續推算的話,mobile Kepler 應該得要有 1GHz 的時脈,才有可能到達這個計算量?不過,這些都是 nVIDIA 尚無公告的細節資料了。
nVIDIA 在 SIGGRAPH 2013,也展示了之前在 GeForce GTX Titan 上運行的人臉及時動畫、Ira,看來效果的確很讚啊!
另外,下面則是另一個 demo、Island:
在這樣大幅度的效能增進下,耗電量會變怎樣呢?nVIDIA 是說他的最大耗電量和現有的行動處理器 GPU 不會差太多,一樣是 2W在 SIGGRAPH 展場的展示,是把 Mobile Kepler 的時脈降低、讓他的效能和 iPad 4 大致一樣,這時候 iPad 4 的耗電量大約是 2.6w,而 Mobile Kepler 則只要約 900mW。也就是說,看來 mobile Kepler 應該有可能可以透過調整效能,來控制耗電量,甚至讓他的耗電量在 1W 以下~
不過 Tegra 5 預計是要到 2014 上半才會推出,考慮到 Tegra 4 都還不多的狀況…還真不知道他會不會延後啊。
另外,值得一提的是,nVIDIA 現在也開始接受「將 GPU 授權給其他廠商」的經營模式了!所以,以後或許也可以看到 Tegra 以外的處理器,會搭載 nVIDIA Kepler 的 GPU~
最後,如果參考之前 AnandTech 針對各平台、使用的 GL/DXBenchmark 2.7 進行繪圖效能測試的結果(參考)的話,可以看到這邊的比較標的、也就是 iPad 4 的 PowerVR SGX 554MP4,大部分的效能都還是遠遠比不上現在的顯示卡,不只是輸 Razer Edge 的 GeForce GT 640M LE,連和 Microsoft’s Surface Pro 的 Intel HD 4000,都還有相當大的落差。以「T-Rex HD (Onscreen)」的測試來說,GeForce GT 640M LE 是 iPad 4 的 4.75 倍,Intel HD 4000 則也有 3 倍。
而 Razer Edge 的 GeForce GT 640M LE 是採用較低階 Kepler 的 GK107 的核心(維基百科、官網),有 384 顆 CUDA Core(兩組 SMX),理論計算能力是 384 GFLOPS;所以理論上,Moble Kepler 要以一半的 SMX/CUDA Core 數量,來做到更高的效能!?而且,640M LE 的 TDP 可還是有 20W 呢!
假設以這邊和 GeForce GT 640M LE 相比的 4.75 倍來算好了,這個數字基本上算是比 Mobile Kepler 的 5.2 倍略低,所以這代表 Mobile Kepler 的效能,大約會在 GeForce GT 640M 這個等級左右吧~假設明年真的可以用 2W 的功耗到達這樣的等級,那真的是一個大躍進啊!
其他參考: