top of page

Inter speech conference


Interspeech me

這篇報告紀錄小金博前進Interspeech的種種,也很感謝我的老師,幫我們前面鋪陳的一切,還有指導我寫出這麼高深有力的文章,另外感謝我的partner,我們經歷過收資料,寫程式,最後有機會參加這場世界前瞻知識的盛宴。

Interspeech 是由ISCA 語音協會舉辦年度大型語音訊號處理研討會,Core將此會議評為rank A每年都有超過千人的學者與廠商參加。地點選在斯德哥爾摩大學,贊助廠商除了微軟和谷歌等大廠外,還有滴滴打車等中國互聯網公司。另外今年首次安排了Furhat和Tobii公司參訪的活動, Furhat是仿真機器人的製造商(圖一),而Tobii是專門開發眼動技術的公司(圖二)

(圖二: Furhat應用在機器人上的情感辨識)

Face to face interaction是今年interspeech的熱門題目,有賴Shrikanth Narayanan帶領的BSP的以及各方研究室在進行的人類行為計算。我報告的主題被安排在Social signal的session裡。在這幾日的keynote中可以看出往後人類語音的發展開始往人類互動中展現的各種語言(除了各國語言外還包括肢體語言)分析計算著手,科技的推動也會讓機器人與人類的互動更加真實,能夠解決更複雜的問題,比方說他們定義「人」和「機」合作該遵循三個階段:question prompt, question justification, 和Solution evaluating. 除了一直以來都被當作是神物的deep learning(並把所有deep learning的session都放在華麗的大禮堂),真正crucial 的人人互動溝通問題其實還沒被解答,科技也都在朝著回答這種複雜問題在精進(我認為對這些學者來說科技精進的原動力不僅是為錢),因此協會也鼓勵更多創新特殊的研究課題加入,並用優惠的方式鼓勵各國的學生踏入這門領域,研發能力是highly demanding in the world。

(圖二、tobii)

會場上活生生在走動的人都是可以攀談的,很多來自各國的公司,負責語音辨識、語音助手,軟體開發和硬體實踐都有。另外就是來會場參展的AI公司,除了挖掘潛在員工外,還有資料庫的販賣及資料搜集儀器的行銷,資料可以拿來賣?那賣的是什麼資料?誰會買?這些都是在我在國內少見的,就拿我參加的就業博覽會好了,60%硬體,80%做軟體的都在做軟韌體或是APP or WEB,這種模型訓練和資料處理型態的工作卻要踏出去才知道原來有這麼多(就我去年資訊有些銀行pay 月薪三萬在養資料工程師,很多資料公司還沒興櫃),這也是台灣未來AI科技方面會走上的方向。

(圖三: Poster Peter)

Conference主要分oral presenting session, poster, show and tell, tutorial,總共四天半,

最早由keynote開始,keynote通常在八點半就有了,內容則是當天研討會主要的方向,由該領域德高望重的學者開始這個新領域的方向與未來。拿我報告那天的keynote做例子,講的就是人類互動的社交訊號。主講者帶出社交信號可能來自哪裡,從哪裡搜集,如何分析等...。因此當日的議會各session的主題就會圍繞在有關處理社交訊號技術上(但是ASR佔了大多數的時間)。在觀看過許多人分享的學術著作,我觀察到許多社交訊號都會跟醫療有關係,醫療是直接影響人類福祉的一項應用,所以影響力極高,就如我研究主題,目標就是在為自閉症的偵測上有些貢獻;另外就是情緒辨識的主題也佔了很大一部分,很多人藉由探討社交訊號如:笑(Laughter)、插話(interrupt)、手勢(gesture)等等的,在人類溝通上很基本,技術上也容易被偵測到的事件進而用來探討人類情緒。

值得一提的是,我參加的一場student meet expert的學生活動,圖片裡面的都是往年interspeech的chair且happened to have been in Bell lab,討論的話題大多是他們的心路歷程,從PHD生活開始build up他們人生的高度,中間有種種挫折,有人做到了(這幾位都有畢業),有人無法撐過去(據說是distraction太多的關係),這remind我Jeremy跟我說的PHD只是一個過程,將我們的目標提升一個層次,PHD是個life long career path的鋪陳,不是說我以後想當教職所以讀了PHD(這點我被問過萬次了)

(圖四、student meet expert)

再來講社交,以往的我看到這麼多的外國人,這麼好的機會一定就是要上前說兩句,好訓練我的膽與智。但現在的我認為,我寧願等了解了前面這個人與我有共同研究興趣,聊天可以超出: What’s your name, Where are you from, I’m an engineer in NTHU we are working on emotion recognition… bla bla bla最後也不會停在:Yeah, cool, We are both engineer and nothing to talk about… 。我就會期望著,這場conversation能夠帶給我一些知識,一些啟發,不然只會空耗腦力。

(圖五: 巧遇Jsalt 的朋友)

依靠著老師的光芒,我才有機會認識同時間一起去發表的優秀人才們,像台大李琳山的Lab,Jeremy以前的 Sail Lab,deep learning的大導師李宏毅中研院的老師。

很巧的是Jsalt的朋友在動態上發現我也去參展,看了他的work真覺得印度人真TMD厲害(還開放github下載他的code)。

(圖六: 報告當日)

最後,我很感謝我能拿到資助參加研討會,光報名費就要一萬,來回機票就三萬五,在沒有資助的情況下學生絕對會卻步(對有錢小孩來說,四萬五會拿去投資把錢翻倍也不會想特地來參加這個研討會)也感謝interspeech 聚集學者和老師的帶領,終級的教育絕不會是單人單方面的知識流通,而是將一堆強者聚集,讓知識如病毒般的散播。參加研討會不單純只是出國跳脫舒適圈,我想知識的投資除了錢以外,還有大量的時間跟一堆一般人不會想要的辛苦, 就如老師說的」將自己position在更高的位置,但我也還說不準是對是錯,是合適還是不合適。


Featured Posts
請稍後再來
文章發佈後將於此處顯示。
Recent Posts
Archive
Search By Tags
尚無標記。
Follow Us
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page