深入剖析:機器學習問答篇

對許多人來說,機器學習是未來的技術。不過近來在日常生活中,機器學習的應用陸續崛起,包括 Google 電腦在圍棋比賽中的精湛表現,以及 Inbox by Gmail 自動填寫回覆內容的功能,都是很好的例子。這一切固然令人振奮,但有些人仍不明白機器學習是什麼,也不清楚其重要性,更難以理解為什麼辨識出相片中的小狗比想像中困難許多。因此,我們特別邀請在 Google 負責機器學習的研究員 Maya Gupta 為我們解惑。

從基本概念開始說起吧!到底什麼是機器學習?

機器學習技術會收集大量範例,找出其中的模式來解讀這些範例,然後再根據這些模式對新的範例做出預測。

以電影推薦為例,假設有十億名觀眾各自提出最喜愛的十部電影,這樣一來就有大量範例可供電腦參考,進而掌握人們喜愛的電影有哪些共通點。電腦接著會歸納出一些模式來解讀這些範例,例如:「喜歡恐怖電影的人,通常不喜歡愛情電影,但如果兩種電影中有相同的演員就能吸引他們。」之後,如果你告訴電腦你喜歡傑克尼柯遜主演的《鬼店》,電腦將推測你是否會喜歡同樣由傑克尼柯遜演出的愛情喜劇《愛您在心眼難開》,並挑選要推薦給你的 YouTube 影片。

瞭解了。那麼,這項技術實際上是怎麼運作的呢?

實際上,機器學到的模式可能非常複雜,難以透過文字解釋。以 Google 相簿來說,這項服務能夠讓你在自己的相簿中尋找有小狗出現的相片。Google 是怎麼辦到的?首先,我們收集到大量設有「狗」標籤的範例 (拜網際網路之賜)。同時我們也收集到大量設有「貓」標籤以及上百萬種其他標籤的相片,就不在這裡一一列出了 :)

接著,電腦會找出像素模式和色彩模式,以便推測圖片中是貓、狗還是其他東西。一開始,電腦只會任意猜測哪些模式可用來辨識狗,再藉由比對一張狗的範例圖片來確認目前模式是否準確。如果目前模式誤將貓認成狗,電腦就會做出微調。接下來,電腦會比對一張貓的圖片,並視需要再一次調整模式來提高準確度。這些步驟會重複大約十億次:比對範例,如果有誤就調整目前使用的模式,針對該範例提高辨識準確度。

到了最後,這些模式會形成機器學習模組,就像是深層神經網路,能夠大致正確地辨識狗、貓和消防員,以及許許多多其他事物。

聽起來未來感十足。目前還有哪些 Google 產品採用機器學習技術呢?

Google 利用機器學習技術展開了各式各樣的新嘗試,比方說 Google 翻譯;這項服務能夠拍攝擷取某種語言的招牌或菜單,認出相片中的字詞和語言,然後神奇地將內容即時翻譯成你的慣用語言。

你也可以對 Google 翻譯說出任何內容,以機器學習技術為基礎的語音辨識功能隨即會發揮妙用。語音辨識功能目前還用於多項其他產品,例如在 Google app 中辨識語音查詢內容,或是簡化 YouTube 影片搜尋流程。

機器學習技術等同於人工智慧嗎?

其實這些詞所代表的含義可能會因人而異,但基本上,人工智慧 (AI) 是個定義寬鬆的用語;如果某個電腦程式會試圖解決對人類來說易如反掌的問題 (例如看圖說故事),就可以稱為人工智慧。另外還有一件人類能輕鬆辦到的事,那就是從範例中學習。而這也就是機器學習程式在做的事:訓練電腦從範例中學習。

有意思的是,當我們找出打造這類電腦程式的方法後,有時還能提升其效能,讓電腦程式高速處理大量資料。這樣一來,我們就能解決真正的難題,例如精通圍棋、同時為每個人安排交通路線、改善全國能源使用情形。當然,還有一項我最喜歡的功能,那就是透過 Google 搜尋提供最貼近個人需求的結果。

那麼,Google 現在為何如此重視機器學習技術?

機器學習並不是一項全新的技術,而是奠基於 18 世紀的統計學。但你說的沒錯,近年來我們的確積極發展這項技術,原因有三個。

首先,我們需要大量的範例,才能訓練電腦準確做出預測,即使是你我都能輕鬆辦到的事也一樣 (像是在相片中找出狗)。拜興盛的網際網路活動所賜,我們現在有豐富的範例來源可供電腦學習。舉例來說,現在全世界各種語言的網站上,都有數百萬張設有「狗」標籤的相片。

不過,有了大量範例還不夠。你不能只是把一大堆跟狗有關的相片擺在網路攝影機前面,就期望電腦從中學到什麼。電腦還需要一套學習程式。而不久前,這個領域 (以及 Google 本身) 才取得重大突破,讓機器學習程式更臻複雜,效能更出眾。

然而,我們的程式仍不完美,電腦也還很遲鈍,因此我們得不斷觀看大量範例並反覆進行微調,才能改善程式的效能。這整個過程需要大量的運算能力,以及精細的平行處理技術才能辦到。不過,新的軟體和硬體技術,讓我們得以完成這項挑戰。

有沒有什麼電腦目前仍無法辦到,但因為機器學習技術而即將成為可能的事?

還記得當你透過電話讀出信用卡號碼時,語音辨識功能必須費盡千辛萬苦才能辨識出十個不同的數字嗎?這彷彿是昨天還在發生的事。然而,就在最近五年,語音辨識功能透過精密的機器學習技術有了突破性進展,現在你已經可以透過語音在 Google 上搜尋資料,而且這項功能日後還會變得更好用、更快速。

我認為機器學習技術甚至可以改善我們的服裝儀容。我不知道你怎麼想,但我實在很討厭試穿衣服!只要找到一家合適的牛仔褲品牌,我就會連買五件。但機器學習技術能把我們適合的品牌當做範例,推薦其他可能也適合我們的品牌。這問題有點超出 Google 的服務範圍,但我真希望有人可以研發這項功能!

接下來的十年內,機器學習技術會發展到什麼程度?

目前整個領域的目標,就是想辦法提升機器的學習速度,以及減少學習時所需的範例數量。其中一個方法 (也是 Google 致力發展的部分) 就是為機器提供更多基本常識,在這個領域中我們稱之為「正規化」。

對於機器而言,什麼叫基本常識?基本上,這指的是範例的細微變化不會改變機器的認知。舉例來說,即使相片中的狗戴了牛仔帽,機器也仍然知道這是狗。

我們降低機器學習程式對於枝微末節變化 (像是牛仔帽) 的敏感度,藉此灌輸這類基本常識。聽起來很簡單,但實際上只要稍有差錯,就會導致機器無法對重大變化產生反應。因此,我們仍在摸索如何找到平衡點。

機器學習技術最讓你期待的是什麼?讓你持續投注心力的動力為何?

我成長於西雅圖,在那裡聽到很多像是 Lewis 和 Clark 這些早期美國西部探險家的事蹟。機器學習研究也充滿著這種探險精神。我們在探索全新的事物,試著為了遠大的未來開疆闢土。

假如你有機會為 Google 的機器學習技術設計一個簡單又有意思的標語,那句話會是什麼?

如果一開始沒成功,那就再試個十億次。

查看更多案例

返回頁首