NVIDIA GTC 2017 ---- AI symposium
1. NVIDIA新技術: Volta 處理器和 Volta 架構人工智慧超級電腦, TensorRT 和 Tensor , CoreNVIDIA GPU Cloud 平台, Xavier DLA 開放源碼 DLA 深度學習加速器, Isaac 機器人模擬器
當頭開講的就是NVIDIA執行長黃仁勳開始介紹他們公司的新技術和新藍圖,首先就是他們Build出一個超級電腦,主打採用Volta 架構的GPU,專門拿來進行深度學習運算,可以算得很快、很小、很省電
(Volta 跟往年GPU架構的比較)
(今年的Volta架構跟去年的Pascal架構比一比 {皆出自NVIDIA})
不過新推出的GPU架構是以優化tensor的運算設計的,不同於以往GPU重視電腦畫面體驗的展現。GPU往後的路會走向輔助大量計算的用途,而與之抗衡的TPU是一個莫大的競爭對手。Tensor Process Unit(TPU) 是Google提出,Intel拿來嗆NVIDIA的一個為了深度學習而生的傑作,我對運算單元的了解不深,但我還是相信NVIDIA的GPU終究還是會佔有無法取代的地位(AI軍火商)。
接下來是TensorRT 機器學習加速器,是將深度學習程式部屬到各個小機器中的輔助程式,目標是可以藉由減少運算,加強平行化的方式讓每個深度學習的Prediction可以更即時,然後他們說再搭配上述的Volta GPU架構,可以變成一個很好的軟體開發工具(SDK),簡單來說就是軟(GPU)硬(tensorRT)的整合造成別人難以抄襲它的門檻。雖然說tensorRT是開源的,可以免費下載,但使用的知識與技巧可以開班授課,這也是NVIDIA的業務之一。
接下來是CoreNVIDIA GPU Cloud平台,平台推出的意義通常是說,一般年輕有抱負的創業家如果要進行軟體服務,透過平台可以省去自己架設硬體耗的很多苦工,例如大公司如google平台可以一鍵把前端、資料庫、後端都架設好,這方面的服務現在轉移到機器學習上,不過這樣的服務通常是以運算量(或者運行時間)去算價錢的,如果對機器學習不熟悉,將會難以估算其中的計算成本,但平台確實可以幫你省下大把大把時間(硬體架設、除錯),讓你不失去在市場上競爭的時機。平台一旦做大就會是一個獨佔的狀況,而平台的競爭力,在於平台底下的軟硬體設備配合上的計算強度,因此軟體要從硬體的角度去設計,硬體架構也要為了軟體最大效能發揮而設計。
(CoreNVIDIA GPU Cloud 使用介面,什麼樣的語言都囊括)
接著黃仁勳再推銷全台灣最AI的SOC:
首先題一下System On Chip是說我可以把一個電腦系統就做在一個晶片上,效能可能沒這麼好,但重點是輕薄短小,走到哪裡都是一台電腦。這邊的Xavier DLA(DLA stands for Deep Learning Acceleration) 本身是可以進行機器學習的(to be specific 可以做CNN RNN DNN),當初SOC熱賣最典型的就是Arduino出來的時候,很多maker團體或是Hackathon都喜歡拿來做產品的雛型,主要在於可編寫程式的機器能夠執行我們指定的動作,如今搭載人工智慧的SOC能夠進行辨識、推論,將會帶來一種科技新革新。
產品行銷的最後一個主題是Isaac 機器人模擬器,黃仁勳講到這個主題的時候一直像是在教育大家設計AI機器人該有的思維以及解析會碰到的困難,因此我猜在這邊應該是想賣一個AI模擬器,可以把給機器人的學習環境建立出來,遵守世界的物理定律,並且讓機器人恣意的場是錯誤和訂正,我覺得有點像是future work的感覺,儘管在會議上他們已展現不錯的訓練成果,可是沒見他提到要賣的是什麼東西(下圖為ISAAC的面貌)
2. 與科技部長對話
科技部長陳良基獲邀參加2017 NVIDIA台灣年度會議,黃仁勳對於部長對台灣對AI研究發展的規劃上幫在座的我們問了幾個問題,整體歸納出的結果就是,政府會撥100億在這項AI前瞻計畫上
,計畫分成兩塊: AI 主機計畫、AI 創新研究中心計畫。這兩個計畫分別提供AI研究的兩項骨幹,發展AI的硬實力和軟實力。也就是科技公司,包括IC設計、半導體製造、韌體設計、作業系統都可以朝著AI專門電腦的方向來申請計畫;創業者們可以想想怎麼搭配利用現有的技術搭建出一套能將AI智能變成獲利的一套運作模式(也就是AI創業)。 AI 主機計畫有一個願景就是建立一個國家中心訓練平台,有點像google doc那樣,人人都可以從網站上就進行機器學習,將精煉過的機器大腦直接下載下來,這麼做的用意是讓創業者(也就是AI 創新研究中心計畫下的人)可以免去硬體裝設的時間,能夠快速達成技術上的目標,馬上在市場上測試。沒錯前面提到的CoreNVIDIA GPU Cloud就有這個概念。AI 創新研究中心計畫下,號召 300 位專家學者投入,並培育 3,000 名 AI 相關人才,這個出發點蠻好的,如何運用資料讓機器能夠“學習”,其中都沒有魔法,而只是一些單純的數學。但讓機器能學習也不是空有資料讓它學這麼簡單,也不是說只要演算法的課上一上,程式會打就能夠入行,事實是這們資料科學領域(或這說是AI),是靠著很多邏輯上的辯證和不斷的實驗才能駕馭的遊戲。黃仁勳對時事發展的重視,提出的問題,很多都跟我們一介小民相關,如果NVIDIA要能夠永續長遠的發展,關鍵點就來自社會上對AI的認知增長與技術的開發。
3. 新創AI公司
台大人類學教授曾說:「資料科學不是新的學問,我們一直以來都在做資料科學」,資料科學其實跟AI密不可分,甚至說AI其實就是資料科學美其名。台大教授說的沒錯,不管文組理組,只要做實驗,處理數據的當下就在用統計工具做資料科學,機器學習不過是新的統計工具而已。只是到了資料取得方便(能記錄下來的都是資料),資料處理速度快(比方前面講的NVIDIA的GPU)還有現在學界業界跨領域的主流,人事後才用AI來包裝這整個資料處理的內容。因為AI的精髓在於資料、計算、跨領域,因此AI的新創可以無遠弗屆,所以科技部長的AI 創新研究中心計畫才會想號招各領域的學者加強對數據的掌握能力。舉幾個例子:
Athelas (San Francisco) – 設計儀器監控你的免疫系統
Datalogue (New York) – (對公司)幫你資料挖礦
Deepgram (San Francisco) – 自動幫你生成逐字稿(對人社系是一大福音)
Focal Systems (Menlo Park, Calif.) – (對零售業)幫你分析怎麼進貨和商品怎麼擺放有助於獲利
Cape Analytics (Mountain View, Calif.) – (對公司)房屋土地財產監控和風險評估
Deep Instinct (Tel Aviv) – 深度學習阻擋網路攻擊
DigitalGenius (San Francisco) – AI客服
KONUX (Munich) – AI自動化鐵路狀況監控維護
Smartvid.io (Cambridge, Mass.) – 利用圖像辨識輔助工業工程資料紀錄
Bay Labs (San Francisco) – 心血管疾病自動檢測系統
Genetesis (Cincinnati) – 胸腔自動檢傷系統
Insilico Medicine (Baltimore) – AI輔助製藥研發
Lunit (Seoul) – 多媒體資料(影片、音樂)細節分析
SigTuple (Bangalore) – 縮短血液篩檢需要的繁複流程和醫療知識
有人憧憬AI,有人畏懼AI,有人問我AI能達到什麼樣的效益,以上的新創公司給了我們答案,資料可以是各式各樣,醫療不僅限於要腦波、血液、心跳,有時光是用影片就足以做好分析。
4. 語音辨識源遠流長 -- 李琳山
5. AL LAB -- 徐宏民
AI的內行跟外行可以從他的見解來判斷,有人說把任何東西都拿來train,就是個外行的行為,內行人則會繼續問:train完之後,下一步是什麼?