《金融領(lǐng)域人工智能的應(yīng)用》由會員分享,可在線閱讀,更多相關(guān)《金融領(lǐng)域人工智能的應(yīng)用(5頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、金融領(lǐng)域人工智能的應(yīng)用
金融領(lǐng)域人工智能的應(yīng)用
2019/08/19
摘要:人工智能有朝一日必定會在金融策略的制定上發(fā)揮重要作用,但就目前來說技術(shù)上還存在一些難點問題,在本文當中重點基于現(xiàn)有的技術(shù)條件,探討了人工智能在金融領(lǐng)域當中的應(yīng)用,突出了人工智能在股票走勢預測上的一些內(nèi)容,僅供參考。
關(guān)鍵詞:人工智能;金融;應(yīng)用;股票
伴隨人工智能、云計算、大數(shù)據(jù)等技術(shù)的崛起,金融行業(yè)正在智慧金融的大道上大步前進,這是金融與科技結(jié)合的必然趨勢。
2、股市在金融領(lǐng)域是重要一環(huán),投資股市的目的當然是為了盈利,這其中有很多的影響因素導致風險非常大,在技術(shù)層面上就考慮用人工智能技術(shù)來預測股市的漲跌,理論上這種方式是可行的,為此本文則重點討論人工智能在股市預測上的應(yīng)用。
一、關(guān)于人工智能與股市漲跌
隨著計算機性能不斷提升,大數(shù)據(jù)技術(shù)的不斷進步,人工智能在近些年來發(fā)展非常迅猛,深度學習神經(jīng)網(wǎng)絡(luò)階段發(fā)生了三大具有突破性的事件,將人工智能推上了風口浪尖。具有代表性的事件包括2012年Google無人駕駛汽車上路,2013年深度學習算法在語音和視覺識別上有重大突破,2016年AlphaGo戰(zhàn)勝圍棋冠軍。隨著數(shù)據(jù)量不斷增大,計
3、算能力不斷增強,深度學習的影響力也越來越大,從目前的形勢來看,所接觸到的人工智能,可以簡單理解為通過歷史數(shù)據(jù)結(jié)果,生成復雜多元的公式,然后根據(jù)公式擬合所有數(shù)據(jù),并套用公式得到實際場景的結(jié)果。從技術(shù)層面上來講,只要存在規(guī)律的事物,基本都能夠通過學習相關(guān)的特征數(shù)據(jù)來做決策。股市的變化也是有特征的,具體來說,股市價格的變化,實質(zhì)是一個隨時間變化的序列。在金融領(lǐng)域有專門的時間序列分析方法,該方法是通過歷史數(shù)據(jù)的處理,尋找前后數(shù)據(jù)之間的關(guān)系并建立關(guān)系模型,然后基于歷史數(shù)據(jù)和模型來預測時間序列的未來值。因此用人工智能來預測股市漲跌成為可能?,F(xiàn)在也有一些實踐和探索,比如投顧問,是人工智能股票預測引擎,其基于
4、大數(shù)據(jù)提取多股票特征,應(yīng)用于tensorflow、LSTM預測股票未來五日開盤價、收盤價、最高價、最低價,并使用RecursiveFeatureElimination和Pearson相關(guān)系數(shù)等進行多輪訓練,移除若干權(quán)值系數(shù)特征,再基于新的特征集進行下一輪訓練,保證穩(wěn)定上升的準確性?,F(xiàn)在股市標注清晰、數(shù)據(jù)量龐大,應(yīng)用簡單、直接變現(xiàn),股市AI已經(jīng)具備人工智能應(yīng)用爆發(fā)的要素。
二、關(guān)于人工智能在金融領(lǐng)域的應(yīng)用
對于股市而言雖然有特征,但是股市確實一個非線性,混沌行的復雜非線性系統(tǒng)。影響股市漲跌的并不僅僅只有歷史數(shù)據(jù),還有更多的因素,包括公司的近況,股民對股票的態(tài)度,政
5、策方面的影響等等,而這些因素存在相互聯(lián)系相互影響的關(guān)系,牽一發(fā)而動全身,這就是所謂的混沌現(xiàn)象,雖然混沌現(xiàn)象目前不可預知,但是理論上用人工智能來預測股市漲跌是可行的,不過僅僅簡單地將歷史數(shù)據(jù)納入到關(guān)聯(lián)模型當中來預測漲跌,往往效果不太好,但不意味著人工智能就不能預測股票漲跌,大概率是技術(shù)條件還不具備。為此我們從一個深度學習的練習項目來探討人工智能在股票市場上的應(yīng)用問題。
(一)項目的概況本項目是為了實現(xiàn)人工智能股市價格預測的一個深度學習練習項目,旨在通過機器學習算法,結(jié)合過去幾年以及某只股票相關(guān)的K線圖走勢,公司的相關(guān)報道來作為數(shù)據(jù)集,通過訓練來得到可預測的股市價格機器學習模型,并
6、用這個模型來預測股市價格的漲跌。項目擬使用線性回歸,神經(jīng)網(wǎng)絡(luò)以及隨機森林來進行預測,并對三種算法的預測效果進行比較。項目使用Python編程。
(二)自然人如何投資股市在編寫人工智能程序之前,需要考慮自然人是如何投資股市的,這是一個關(guān)鍵點,因為股市時一個復雜非線性系統(tǒng),即混沌系統(tǒng),影響股市價格走向的因素很多。在投資股市時,往往會在決定購買哪只股票之前,會查詢與股票相關(guān)公司的信息,如果查到的信息以正面信息為主,那么投資這只股票的回報率就可能會高一些,當然還需要看K線圖??偨Y(jié)起來則可以確定機器學習模型需要股價數(shù)據(jù)和對股票的情感數(shù)據(jù)。
(三)數(shù)據(jù)獲取機器學習模型需要數(shù)
7、據(jù),沒有數(shù)據(jù)就沒辦法訓練機器學習模型。所以在數(shù)據(jù)獲取方面股價數(shù)據(jù)使用Pandas進行分析,對于情感數(shù)據(jù)則使用NLTK來進行處理。具體來說讀取往年股價數(shù)據(jù),并對其進行簡單處理后生成Pandas的DataFrame格式,構(gòu)成系列化,并成為文件的Python對象。通過print(df-stocks)來查看df-stocksDataFrame對象并輸出可得到股票的股價以及相關(guān)文章內(nèi)容,進一步開始分析股票的情感數(shù)據(jù)與股價數(shù)據(jù)。先將priceSeries從df-stocks中獨立出來,成為單獨的DataFrame對象,然后添加幾個新的Series,隨后使用NLTK對文章進行情感分析。使用NLTK的情感強度
8、分析器對文章情感進行分析,并將情感強度寫入新獨立出來的DataFrame中,其中的negSeries存放文章的負面指數(shù),neuSeries存放中立指數(shù),posSeries存放正面指數(shù),Compound存放合成指數(shù),然后將數(shù)據(jù)輸出,得到相應(yīng)的情感分析數(shù)據(jù)。
(四)劃分數(shù)據(jù)集根據(jù)輸出的情感分析數(shù)據(jù),開始時間為2007年1月1日,結(jié)束時間是2016年12月31日,再8:2的比例來劃分訓練集和測試集。劃分完df后,新建一個對每個時間點情感評分的list,將訓練集和測試集的數(shù)據(jù)加入其中。因為要預測股票漲跌,也就是預測股價的走勢,那么定義一個y標簽作為股價。
(五)股市漲跌
9、預測1.隨機森林算法預測使用Scikitlearn,其中封裝好了隨機森林算法。在控制臺輸入rf=RandomForestRegressor)rf.fit(numpy_df_train,y_train)#print(rf.feature_inportances)prediction,bias,contributions=ti.predict(rf,numpy_df_test)print(preditcion)當看到控制臺有輸出以后,輸出正確那么可以證明隨機森林預測成功,為了可視化分析因此使用Matplotlip來繪圖。繪制出沒有平滑的股價走勢,并且保存為RF-noSmoothing.png。輸出
10、到桌面,就可以得到一個預測股價走勢和真實股票走勢的對比圖,按照走勢圖來看,預測的數(shù)據(jù)和實際的股價走勢存在比較大偏差,因此還需要進一步對數(shù)據(jù)進行處理,通過添加一個常數(shù)來表示測試階段的閉市股價。然后再次通過Matplotlip繪制走勢圖,修正以后預測走勢曲線與實際的股價走勢曲線接近,但是預測走勢曲線抖動比較明顯,需要進行平滑。而平滑處理方法可以使用Pandas的EWMA來實現(xiàn)。但平滑后發(fā)現(xiàn)預測走勢與最后部分真實的股票價格走勢出現(xiàn)了相反的情況,進一步處理,只繪制平滑后的實際故事走勢與預測股價走勢的折現(xiàn),結(jié)果還是表面預測效果并不是很理想。2.線性回歸算法預測因為隨機森林預測效果不佳,為此使用基于Ten
11、sorFlow的線性回歸算法,基本上的思路與上文的思路相當,只是TensorFlow的操作不一樣。實際上線性回歸模型在機器學習和統(tǒng)計領(lǐng)域,是非常簡單的模型,但也是應(yīng)用最廣泛的模型。在具體的使用當中基于TensorFlow先導入需要的Python包,然后設(shè)置Pandas與TensorFlow的關(guān)聯(lián),然后加載上文建立的數(shù)據(jù)集,使用numpy隨機方法對數(shù)據(jù)進行處理,隨后通過Pandas提供的describe()函數(shù)來進行數(shù)據(jù)預覽。在tensorFlow中用特征列來表示特征的數(shù)據(jù)類型,為此先定義輸入特征,并配置素質(zhì)特征,同時定義標簽。配置一個線性回歸模型,然后用GradientAescentOptim
12、izer訓練這個模型。按照同樣的方式輸出圖形后進行分析,根據(jù)預測結(jié)果來看,效果要比隨機森林算法要好一些,但是參考的價值并不大。3.神經(jīng)網(wǎng)絡(luò)算法預測同樣結(jié)合ScikitLearn的MLP來對股價進行預測分析,思路同上,加載數(shù)據(jù)集,分隔出數(shù)據(jù)集和測試集,并計算情感分數(shù),創(chuàng)建一個MLP模型,按照上文的方式繪制出走勢圖,看情況進行修正,輸出走勢圖,最后再進行平滑?;谶@種方法的預測相對來說效果要好很多,至少對比前兩者來看效果最好。
三、關(guān)于金融時間序列中的人工智能
在金融時間序列分析當中早期使用的是時間序列的分析方法,表現(xiàn)為基于統(tǒng)計和線性的方法,比如移動平均算法,指數(shù)平
13、滑算法,自回歸移動平均算法等。一定程度上來說基于統(tǒng)計和線性假設(shè)前提下的模型在一定程度上滿足了性能指標需求,可以在特定領(lǐng)域取得比較理想的預測效果,但金融領(lǐng)域具有非線性、混沌性特征,時間序列分析方法并不能直接應(yīng)用在金融時間序列分析當中,從上文的分析中可知線性回歸模型這種方式并不能很好地解決非線性環(huán)境下的噪聲干擾。所以最好的方式還是結(jié)合人工智能的方法來進行金融時間序列分析,其中涉及了計算智能、遺傳算法、模糊分析方法、智能體、神經(jīng)網(wǎng)絡(luò)等。基于前文的分析來說神經(jīng)網(wǎng)絡(luò)算法是比較理想的算法,實際在人工智能應(yīng)用與金融領(lǐng)域的實踐當中更多的還是使用的神經(jīng)網(wǎng)絡(luò)。不過不可靠性會比較大。所以人工智能理論上在預測股票上是
14、非常可行的,人工智能有朝一日會主導金融策略的制定,但目前來說還需要技術(shù)層面上的進一步探索。結(jié)束語:綜上所述,人工智能在金融領(lǐng)域的應(yīng)用理論上是可行的,以目前的技術(shù)條件來說,存在一定的技術(shù)難題,解決了這些問題人工智能在金融領(lǐng)域必定會發(fā)揮出非常顯著的作用,在本文當中基于現(xiàn)有的技術(shù)條件分析了人工智能在股票市場上的應(yīng)用問題,希望能夠提供一定的參考價值。
參考文獻:
[1]中國人民銀行武漢分行辦公室課題組.人工智能在金融領(lǐng)域的應(yīng)用及應(yīng)對[J].武漢金融,2016,(07):46-47,50.
[2]楊卓越.人工智能在金融領(lǐng)域的應(yīng)用現(xiàn)狀及安全風險分析[J].金融經(jīng)濟(理論版),2017,(01):147-148.
[3]張書樂.人工智能+金融的幾道“坎”[J].金融博覽,2017,(04):50-52.