資訊科學及統計學已經發展出相當先進的技術可以從大量的數據資料中觀察到一些現象。資料因為來源不同或品質不一而會有不同的型態,透過學習來識別圖像和發展自然語言 (Natural languages) 來分析這些資料,這種用來取代過去傳統人力思考的工作就是「人工智慧」。其實這個領域已經存在甚久,但隨著電腦運算能力的提高,以及數據可用性與數量的提升,導致人們對人工智慧的潛在應用重燃興趣,這些應用已被使用在診斷疾病、翻譯語言和自動駕駛上,而金融領域也有愈來愈多的應用。以下參考 FSB ( Financial Stability Board ) 在 2017 年發布的研究報告「 Artificial intelligence and machine learning in financial services Market developments and financial stability implications 」簡介何謂「人工智慧」與「機器人學習」。
「大數據」 (Big data) 其實並沒有一致的定義,舉凡各種技術 ( 包括人工智慧 ) 在對大量且複雜資料進行分析及儲存時,所進行分析的工作稱為「大數據分析」。所謂「人工智慧」是指能夠執行過去只有人類智能 (Human intelligence) 所能處理的電腦系統及理論。「人工智慧」涉及的領域很廣,「機器人學習」是其中一個類別,機器可以被定義為在無人干預或人為低度干預的情形下,自動找出最適合來解決問題的演算法 (Algorithms) ,這些技術可用於從日益多樣化和創新的大量資料中找出固定模式。
許多「機器人學習」工具建立在耳熟能詳的統計方法上,包括擴展線性回歸模型 (Extending linear regression models) 、使用統計工具摘要大數據內容做出「視覺化 (Visualization) 」效果。然而機器學習的架構在本質上非常有彈性,「機器人學習」所探勘出來的資料模式並不限於主導經濟與財務分析 (Dominate economic and financial analysis) 的線性關係。一般來說,「機器人學習」用於處理最佳化 (Optimisation) 、預測 (Prediction) 及分類 (Categorisation) ,而非因果推論 (Causal inference) ,比方說,「機器人學習」可以預測某公司的債務評級在 1 年後會是投資等級還是高收益等級 ( 或稱垃圾等級 ) 的機率,然而決定哪些因子可以影響債券的殖利率水準,並不是機器學習所能辦到的。
下列有幾種不同類別的「機器人學習演算法」 (Machine learning algorithms) :
• 監督式學習 (Supervised learning) :對訓練資料 (training data) 的觀察點貼上識別標籤,以交易資料為例,對已知的詐欺交易貼上識別標籤,演算法可以透過學習這些過去資料,找出分類規則,再對測試資料 ( 非屬訓練資料的樣本 ) 貼上預測標籤 (Predict the label) 。
• 非監督式學習 (Unsupervised learning) :提供給演算法的資料不含標籤,演算法必須自己找出資料的模式及特徵,並且透過辨識特徵進行資料分群 (Clustering) ,舉例來說,演算法可以找到與流動性差、且不易定價有價證券類似特徵的證券,若是分群是適當的,則可以利用流動性好、易於定價的有價證券來協助流動性差的有價證券進行定價。
• 強化學習 (Reinforcement learning) :介於監督式與非監督式學習之間,此種演算法使用的是不含標籤的資料,對於不同的樣本資料,電腦可以採取不同的動作,在不同的環境下會有不同的回饋,不斷的透過逐步修正來幫助機器學習,這類的學習方法用於像是博弈、對弈、自動駕駛等領域。
• 深層學習 (Deep learning) :又稱為人工神經網路 (Artificial neural networks) ,深層指的是許多隱藏的層 (Hidden layers) ,每一層( Layer )都有很多神經元( Neuron ),上一層產出 (Output) 就是下一層的輸入 (Input) ,最終得出一組最終產出 (Final output) ,深層學習可用於前三者的學習方法。
「機器人學習」可以應用在不同類型的問題,比方說分類 (Classification) 或是回歸分析 (Regression analysis) ,分類演算法的基礎是機率,所得的分類結果是在正確機率最高的情形下所完成的,比方說自動閱讀研究報告後,自動判別該報告是偏多 (Bullish) 或偏空 (Bearish) ,回歸分析演算法可以算是分類 (classification) 的其中一個中間步驟。
重要的是要注意「機器人學習」無法確知事件的因果關係,機器學習從大數據中所發現的行為模型僅僅是一種相關性,這種相關性是無法用人眼輕易發現,所以當經濟學家想找出複雜的關係時,人工智慧與機器人學習則變成了十分有用的分析工具。
- 面授課程:高普考
- 雲端課程:經濟學、公共經濟學、財政學、租稅各論
- 考試用書:經濟學(概要)、經濟學測驗題完全制霸、財政學大意歷屆試題分章題解