掛上雲端、AI 之名復活的 Azure Kinect

| | 0 Comments| 11:17
Categories:

在 2010 年正式推出的 Kinect 基本上應該可以算是第一款消費級的深度感應器;而當時透過深度感應器,可以快速地進行去背、追蹤人體骨架、甚至進行空間的 3D 掃描,對於很多開發者來說,是很有吸引力的~

到了 2013 年,微軟也有再推出第二代的 Kinect 感應器,提供更強大的功能來搭配 Xbox One 使用。

不過很遺憾的是,這塊市場看來始終沒有能真正地玩起來,所以到 2017 年,微軟也放棄繼續生產了;而用來在 Windows PC 上開發的工具、Kinect for Windows SDK 也在更早就沒有繼續維護了…

雖然消費級的版本算是被放棄了,但是去年微軟還是在 Build 大會上,發表了「Project Kinect for Azure」(參考),希望能把相關技術應用在雲端 AI 上。

而今年的 MWC,微軟則是推出了這個計劃的成果、「Azure Kinect」了!

不過,目前微軟提供的是要價 399 美元的開發版本、Azure Kinect Developer Kit (DK),而且僅提供美國和中國預購,預計 6/27 才會開始出貨。

官方的新聞稿是《Microsoft at MWC Barcelona: Introducing Microsoft HoloLens 2》,官方網站則是:http://Azure.com/Kinect


這款 Azure Kinect DK 到底和之前的 Kinect 有什麼差別呢?在硬體的部分,官網雖然沒有提供完整的規格表,但是可以找到內部結構的說明:

可以看到,他在硬體上,提供了:

  • 1-MP 的深度感應器(ToF),有廣視角和窄視角兩種模式,可以根據應用需求做選擇
  • 七個麥克風組成的圓形配置麥克風陣列
  • 12-MP 的 RGB 攝影機,有和深度影像對位
  • 加速度感應器與陀螺儀(IMU),可用來做感應器的方向、位置追蹤
  • 外部同步訊號(3.5mm),可以讓多台 Kinect 做資料流的同步

而在官方的文件(PDF)中,則有更詳細的功能、規格說明。

首先,下圖是他的硬體外觀說明:

可以看到,他使用 USB Type-C(USB 3.1 Gen 1)作為介面,所以也可以省去一條電源線(耗電約 5.9W);而大小是 103 x 39 x 126 mm,重 440g。

在深度感應器的部分,其規格如下表:

看來這次的深度感應器原生解析度應該是 1024 x 1024 @ 30FPS、運作的距離最遠是 5.46M;而透過 SDK 取得的資料流則會因為 FOV 的模式(N/W),會有不同解析度、以及深度範圍。

彩色攝影機的影像最高解析度應該是 4096 x 3072 @ 15FPS 或是 3840 x 2160 @ 30FPS,基本上應該就是 4K 的規格了。

而由於彩色攝影機是使用 USB Video Class 相容的介面,所以可以相容於一般的軟體,不一定要使用專用 SDK。

如果是要和 Kinect V2 比較的話,官方也已經整理好下面的表格可以參考了。

在軟體上,微軟將會提供下列的 SDK:

  • Sensor SDK(尚未推出)
    • 直接讀取 Kinect 的各項感應器原始資料的 SDK
    • 支援 Windows、Linux,C API、會在 GitHub 上開放原始碼
  • Body Tracking SDK(尚未推出)
    • 切割出身體、以及身體骨架追蹤
    • 支援 Windows、Linux
  • Azure Cognitive Services(官網
    • Vision API(官網):可以用來作人臉偵測、物件偵測、分類、OCR 等等
    • Speech Service SDK(官網):可以用來進行語音辨識、翻譯

也就是說,如果在沒有要使用到 Azure 的進階功能的情況下,Azure Kinect 是可以單機運作的。

而雖然大多的功能也都可以和 Kinect for WIndows SDK 對應,不過微軟應該還是選擇整個砍掉重練了,所以如果真的要使用,應該也是要重新學習了。

不過,反正一來台灣大概不會正式販售,二來 Heresy 這邊可能也不會繼續做相關研究,所以這邊大概也就只會看看而已了。

參考:微軟正式帶來 Azure Kinect

Leave a Reply

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *