【認識DataRobot前的必修課】人工智慧AI vs. 機器學習ML ? 這一年你絕對很熟悉的buzzword

回想一下,2018上半年,已經參加過幾場跟AI相關的活動、看過多少篇國內外企業導入AI應用初嚐果實的報導?

人工智慧確實已經不只是一個空泛的流行語,從Google Trend 的關鍵字搜尋趨勢來看,2004年到今年7月全球搜尋Machine learning的熱度在近幾年已大幅超過Artificial intelligence,這也意味著大家已從What is AI 到How to make AI happen 的階段了。

Google Trend_keyword comparision _worldwide https://goo.gl/MS6jWk (數字代表在特定時間點的熱門程度,100 分代表該字詞的熱門程度在該時間點達到最高峰)

本文重點

  1. 回顧一下 人工智慧AI 和 機器學習ML 之間的關係(目標vs.手段)
  2. 訓練機器學習有哪三種方式?
  3. AI應用時代,以全球角度來看,哪些產業衝最快?哪些部門最會用?

一、人工智慧AI vs. 機器學習ML

source: A.T.Kearney analysis

AI (Artificial Intellgence) 人工智慧是一個涵蓋多面向學科的領域,包含電腦科學、統計學、數學等,主要透過電腦系統去執行一般只有人類才能處理的認知型問題,例如:視覺感知、聲音辨別、推測判斷、思考規劃、語言轉譯等。

而 ML (Machine Learning) 機器學習是一種技術,是實現 AI人工智慧的一種手段。

簡單來說…

AI是一個透過電腦系統去模擬人類的智能表現、也是人類想透過電腦系統去達到的一個目標 。

而 ML 機器學習就是「讓機器具有學習的能力」,突破了傳統程式設計、手刻規則(Hand-crafted rule) 的方式下,無法考慮到所有可能的限制。

AI 是我們想要機器達成的目標,而 ML 是達成目標的手段。

不管機器學習應用在何處,現階段大部分企業發展AI的目標都落在同一個大範圍內:就是以人類的思維邏輯當作一個初始指引,利用電腦系統去打造一個更好、更穩定的服務、產品或流程,而不是嘗試去複製一個人腦。

二、訓練機器學習有哪三種主要方式?

既然機器學習就是「讓機器具有學習的能力」,那該怎麼教呢?

回想一下,我們人類如何學習?基本上是從各種經驗中學習,可以是正規的學校教育、無師自通、生活挫敗、成功等歷練,然後歸納成自己的人生智慧、行為依據。

而機器要如何學習?跟人類很像,只是機器是從大量資料中找出規律、從中學習,在下次面對類似狀況時,就能做出判斷。機器靠演算法分析及歸納,效果可遠遠超過人類。

接下來就是How to 的問題,怎麼像教一個小孩一樣,慢慢「訓練」或是「教」機器學習呢?主要有三種訓練方式:

  1. 監督式Supervised learning (類似 正規學校教育):會告訴機器正確答案是什麼,有人類當家教老師手把手調教,讓機器從標準答案、已存在的模式中學習。 → 主要回答 Regression & Classification 類型的問題
  2. 非監督式Unsupervised learning (類似 無師自通): 沒有告訴正確答案是什麼,讓機器自己從資料中發現模式 → 主要回答 Clustering & Reduction of Dimensionality 類型的問題。
  3. 強化式Reinforcement Learning (類似 社會大學): 沒有告訴機器正確的答案為何,機器會得到的只有好或不好的反饋,機器會不斷的從結果反饋去學習、逐步自我精進 → 比較符合人類真正學習的情境。(一般來說,當沒有data做監督式學習時,才會做強化式學習)

經典的 Alpha Go 就是監督式+強化式學習的結果,先從學棋譜開始,再到跟另一個機器對弈,進行強化式學習,讓他學得更好。

三、比演算法更重要的事 — 想解決什麼問題?

如果想要進行「預測」,可以運用「監督式學習」的演算法,希望演算法根據已經存在的模式進行下一步的預測。

以「監督式學習」最適合回答的問題來舉例,

  1. 這筆汽車保險未來可能會理賠「多少金額」?
  2. 這個機器手臂「多久之後」會故障?
  3. 這位棒球打者將會在這場比賽中有「幾次全壘打」?
  4. 明天的油價將會是「多少」?
  5. 下一季的營收將會是「多少」?
  1. 這筆貸款申請「是否會是壞帳」?
  2. 這筆信用卡交易「是否會是盜刷」?
  3. 這支廣告上線後「會被點擊嗎」?
  4. 這位員工今年「會離職嗎」?
  5. 這個零組件的X個部位「是否有瑕疵」?
  6. 「哪一種產品」是這位客戶比較有可能購買?

四、 各產業&各部門都可實現AI應用,速覽哪些產業衝最快?

先從產業別來看,根據 McKinsey 在2017年的一份研究報告Artificial Intelligence, The Next Digital Frontier,調查橫跨10個國家、14個產業別、3,000位對AI應用認真看待的CxO們後,發現 20% 的 Early AI adopters 主要集中在3個產業:

  1. 高科技 High-tech/電信業 telecom
  2. 汽車製造 Automotive/ 設備製造 Assembly
  3. 金融服務業 Financial services

且這些先行企業之所以能夠先跳上AI應用列車,共同原因包含:

  1. 有高層的遠見與支持 Senior management support for AI initiatives
  2. 願意為企業成長目標而投資 Focus on growth over savings
  3. 知道應該優先解決什麼問題,才能在自身產業優先拔得頭籌 Adopt AI in core activities.
Source from McKinsey Global Institute Study_Adoption patterns illustrate a growing gap between digitized early AI adopters and others.

從 Function 部門角度來看,還是以 IT 資訊單位為主要AI應用的採用者。

用來做什麼?

除了用來監測與預防駭客行動外,更大一部分是用來解決來自業務單位的技術支持需求、自動化工作流程等,降低 IT 近幾年暴增的工作量,提高工作效率。

畢竟,在這個數據就是原油的時代,現在哪個部門擁有最大量、最重要的數據,就有相對爆增的期待跟需求。

這時候,內部處理數據的速度、深度就是拉開對外競爭差距的關鍵了。 Speed and Productivity Matter.

Source:HBR_How companies are already using AI

With the help of our Kaggle-top-ranked data scientists, DataRobot built a comprehensive, best-in-class machine learning framework to help anyone develop and deploy great models regardless of data science skill level.

DataRobot 來歷&現況小檔案

Companies that start preparing today will position themselves to thrive in an environment redefined by AI.

全台最資深Tableau合作夥伴,我們的使命是幫助大中華區企業打造最省力的數據決策模式。From Data to Insight. Easier & Faster!歡迎拜訪我們全新官網https://www.perform-global.com

全台最資深Tableau合作夥伴,我們的使命是幫助大中華區企業打造最省力的數據決策模式。From Data to Insight. Easier & Faster!歡迎拜訪我們全新官網https://www.perform-global.com