【認識DataRobot前的必修課】人工智慧AI vs. 機器學習ML ? 這一年你絕對很熟悉的buzzword
回想一下,2018上半年,已經參加過幾場跟AI相關的活動、看過多少篇國內外企業導入AI應用初嚐果實的報導?
人工智慧確實已經不只是一個空泛的流行語,從Google Trend 的關鍵字搜尋趨勢來看,2004年到今年7月全球搜尋Machine learning的熱度在近幾年已大幅超過Artificial intelligence,這也意味著大家已從What is AI 到How to make AI happen 的階段了。
本文重點
- 回顧一下 人工智慧AI 和 機器學習ML 之間的關係(目標vs.手段)
- 訓練機器學習有哪三種方式?
- AI應用時代,以全球角度來看,哪些產業衝最快?哪些部門最會用?
一、人工智慧AI vs. 機器學習ML
AI (Artificial Intellgence) 人工智慧是一個涵蓋多面向學科的領域,包含電腦科學、統計學、數學等,主要透過電腦系統去執行一般只有人類才能處理的認知型問題,例如:視覺感知、聲音辨別、推測判斷、思考規劃、語言轉譯等。
而 ML (Machine Learning) 機器學習是一種技術,是實現 AI人工智慧的一種手段。
簡單來說…
AI是一個透過電腦系統去模擬人類的智能表現、也是人類想透過電腦系統去達到的一個目標 。
而 ML 機器學習就是「讓機器具有學習的能力」,突破了傳統程式設計、手刻規則(Hand-crafted rule) 的方式下,無法考慮到所有可能的限制。
AI 是我們想要機器達成的目標,而 ML 是達成目標的手段。
不管機器學習應用在何處,現階段大部分企業發展AI的目標都落在同一個大範圍內:就是以人類的思維邏輯當作一個初始指引,利用電腦系統去打造一個更好、更穩定的服務、產品或流程,而不是嘗試去複製一個人腦。
二、訓練機器學習有哪三種主要方式?
既然機器學習就是「讓機器具有學習的能力」,那該怎麼教呢?
回想一下,我們人類如何學習?基本上是從各種經驗中學習,可以是正規的學校教育、無師自通、生活挫敗、成功等歷練,然後歸納成自己的人生智慧、行為依據。
而機器要如何學習?跟人類很像,只是機器是從大量資料中找出規律、從中學習,在下次面對類似狀況時,就能做出判斷。機器靠演算法分析及歸納,效果可遠遠超過人類。
接下來就是How to 的問題,怎麼像教一個小孩一樣,慢慢「訓練」或是「教」機器學習呢?主要有三種訓練方式:
- 監督式Supervised learning (類似 正規學校教育):會告訴機器正確答案是什麼,有人類當家教老師手把手調教,讓機器從標準答案、已存在的模式中學習。 → 主要回答 Regression & Classification 類型的問題。
- 非監督式Unsupervised learning (類似 無師自通): 沒有告訴正確答案是什麼,讓機器自己從資料中發現模式 → 主要回答 Clustering & Reduction of Dimensionality 類型的問題。
- 強化式Reinforcement Learning (類似 社會大學): 沒有告訴機器正確的答案為何,機器會得到的只有好或不好的反饋,機器會不斷的從結果反饋去學習、逐步自我精進 → 比較符合人類真正學習的情境。(一般來說,當沒有data做監督式學習時,才會做強化式學習)
經典的 Alpha Go 就是監督式+強化式學習的結果,先從學棋譜開始,再到跟另一個機器對弈,進行強化式學習,讓他學得更好。
三、比演算法更重要的事 — 想解決什麼問題?
如果想要進行「預測」,可以運用「監督式學習」的演算法,希望演算法根據已經存在的模式進行下一步的預測。
以「監督式學習」最適合回答的問題來舉例,
期待機器回答一個 [數值] → Regression類型的演算法
- 這筆汽車保險未來可能會理賠「多少金額」?
- 這個機器手臂「多久之後」會故障?
- 這位棒球打者將會在這場比賽中有「幾次全壘打」?
- 明天的油價將會是「多少」?
- 下一季的營收將會是「多少」?
期待機器回答 [是或否] or [類別選擇] → Classification類型的演算法
- 這筆貸款申請「是否會是壞帳」?
- 這筆信用卡交易「是否會是盜刷」?
- 這支廣告上線後「會被點擊嗎」?
- 這位員工今年「會離職嗎」?
- 這個零組件的X個部位「是否有瑕疵」?
- 「哪一種產品」是這位客戶比較有可能購買?
四、 各產業&各部門都可實現AI應用,速覽哪些產業衝最快?
先從產業別來看,根據 McKinsey 在2017年的一份研究報告Artificial Intelligence, The Next Digital Frontier,調查橫跨10個國家、14個產業別、3,000位對AI應用認真看待的CxO們後,發現 20% 的 Early AI adopters 主要集中在3個產業:
- 高科技 High-tech/電信業 telecom
- 汽車製造 Automotive/ 設備製造 Assembly
- 金融服務業 Financial services
且這些先行企業之所以能夠先跳上AI應用列車,共同原因包含:
- 有高層的遠見與支持 Senior management support for AI initiatives
- 願意為企業成長目標而投資 Focus on growth over savings
- 知道應該優先解決什麼問題,才能在自身產業優先拔得頭籌 Adopt AI in core activities.
從 Function 部門角度來看,還是以 IT 資訊單位為主要AI應用的採用者。
用來做什麼?
除了用來監測與預防駭客行動外,更大一部分是用來解決來自業務單位的技術支持需求、自動化工作流程等,降低 IT 近幾年暴增的工作量,提高工作效率。
畢竟,在這個數據就是原油的時代,現在哪個部門擁有最大量、最重要的數據,就有相對爆增的期待跟需求。
這時候,內部處理數據的速度、深度就是拉開對外競爭差距的關鍵了。 Speed and Productivity Matter.
With the help of our Kaggle-top-ranked data scientists, DataRobot built a comprehensive, best-in-class machine learning framework to help anyone develop and deploy great models regardless of data science skill level.
Companies that start preparing today will position themselves to thrive in an environment redefined by AI.