《金融領(lǐng)域人工智能的應(yīng)用》由會(huì)員分享,可在線閱讀,更多相關(guān)《金融領(lǐng)域人工智能的應(yīng)用(5頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、金融領(lǐng)域人工智能的應(yīng)用
金融領(lǐng)域人工智能的應(yīng)用
2019/08/19
摘要:人工智能有朝一日必定會(huì)在金融策略的制定上發(fā)揮重要作用,但就目前來(lái)說(shuō)技術(shù)上還存在一些難點(diǎn)問(wèn)題,在本文當(dāng)中重點(diǎn)基于現(xiàn)有的技術(shù)條件,探討了人工智能在金融領(lǐng)域當(dāng)中的應(yīng)用,突出了人工智能在股票走勢(shì)預(yù)測(cè)上的一些內(nèi)容,僅供參考。
關(guān)鍵詞:人工智能;金融;應(yīng)用;股票
伴隨人工智能、云計(jì)算、大數(shù)據(jù)等技術(shù)的崛起,金融行業(yè)正在智慧金融的大道上大步前進(jìn),這是金融與科技結(jié)合的必然趨勢(shì)。
2、股市在金融領(lǐng)域是重要一環(huán),投資股市的目的當(dāng)然是為了盈利,這其中有很多的影響因素導(dǎo)致風(fēng)險(xiǎn)非常大,在技術(shù)層面上就考慮用人工智能技術(shù)來(lái)預(yù)測(cè)股市的漲跌,理論上這種方式是可行的,為此本文則重點(diǎn)討論人工智能在股市預(yù)測(cè)上的應(yīng)用。
一、關(guān)于人工智能與股市漲跌
隨著計(jì)算機(jī)性能不斷提升,大數(shù)據(jù)技術(shù)的不斷進(jìn)步,人工智能在近些年來(lái)發(fā)展非常迅猛,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)階段發(fā)生了三大具有突破性的事件,將人工智能推上了風(fēng)口浪尖。具有代表性的事件包括2012年Google無(wú)人駕駛汽車上路,2013年深度學(xué)習(xí)算法在語(yǔ)音和視覺識(shí)別上有重大突破,2016年AlphaGo戰(zhàn)勝圍棋冠軍。隨著數(shù)據(jù)量不斷增大,計(jì)
3、算能力不斷增強(qiáng),深度學(xué)習(xí)的影響力也越來(lái)越大,從目前的形勢(shì)來(lái)看,所接觸到的人工智能,可以簡(jiǎn)單理解為通過(guò)歷史數(shù)據(jù)結(jié)果,生成復(fù)雜多元的公式,然后根據(jù)公式擬合所有數(shù)據(jù),并套用公式得到實(shí)際場(chǎng)景的結(jié)果。從技術(shù)層面上來(lái)講,只要存在規(guī)律的事物,基本都能夠通過(guò)學(xué)習(xí)相關(guān)的特征數(shù)據(jù)來(lái)做決策。股市的變化也是有特征的,具體來(lái)說(shuō),股市價(jià)格的變化,實(shí)質(zhì)是一個(gè)隨時(shí)間變化的序列。在金融領(lǐng)域有專門的時(shí)間序列分析方法,該方法是通過(guò)歷史數(shù)據(jù)的處理,尋找前后數(shù)據(jù)之間的關(guān)系并建立關(guān)系模型,然后基于歷史數(shù)據(jù)和模型來(lái)預(yù)測(cè)時(shí)間序列的未來(lái)值。因此用人工智能來(lái)預(yù)測(cè)股市漲跌成為可能?,F(xiàn)在也有一些實(shí)踐和探索,比如投顧問(wèn),是人工智能股票預(yù)測(cè)引擎,其基于
4、大數(shù)據(jù)提取多股票特征,應(yīng)用于tensorflow、LSTM預(yù)測(cè)股票未來(lái)五日開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià),并使用RecursiveFeatureElimination和Pearson相關(guān)系數(shù)等進(jìn)行多輪訓(xùn)練,移除若干權(quán)值系數(shù)特征,再基于新的特征集進(jìn)行下一輪訓(xùn)練,保證穩(wěn)定上升的準(zhǔn)確性?,F(xiàn)在股市標(biāo)注清晰、數(shù)據(jù)量龐大,應(yīng)用簡(jiǎn)單、直接變現(xiàn),股市AI已經(jīng)具備人工智能應(yīng)用爆發(fā)的要素。
二、關(guān)于人工智能在金融領(lǐng)域的應(yīng)用
對(duì)于股市而言雖然有特征,但是股市確實(shí)一個(gè)非線性,混沌行的復(fù)雜非線性系統(tǒng)。影響股市漲跌的并不僅僅只有歷史數(shù)據(jù),還有更多的因素,包括公司的近況,股民對(duì)股票的態(tài)度,政
5、策方面的影響等等,而這些因素存在相互聯(lián)系相互影響的關(guān)系,牽一發(fā)而動(dòng)全身,這就是所謂的混沌現(xiàn)象,雖然混沌現(xiàn)象目前不可預(yù)知,但是理論上用人工智能來(lái)預(yù)測(cè)股市漲跌是可行的,不過(guò)僅僅簡(jiǎn)單地將歷史數(shù)據(jù)納入到關(guān)聯(lián)模型當(dāng)中來(lái)預(yù)測(cè)漲跌,往往效果不太好,但不意味著人工智能就不能預(yù)測(cè)股票漲跌,大概率是技術(shù)條件還不具備。為此我們從一個(gè)深度學(xué)習(xí)的練習(xí)項(xiàng)目來(lái)探討人工智能在股票市場(chǎng)上的應(yīng)用問(wèn)題。
(一)項(xiàng)目的概況本項(xiàng)目是為了實(shí)現(xiàn)人工智能股市價(jià)格預(yù)測(cè)的一個(gè)深度學(xué)習(xí)練習(xí)項(xiàng)目,旨在通過(guò)機(jī)器學(xué)習(xí)算法,結(jié)合過(guò)去幾年以及某只股票相關(guān)的K線圖走勢(shì),公司的相關(guān)報(bào)道來(lái)作為數(shù)據(jù)集,通過(guò)訓(xùn)練來(lái)得到可預(yù)測(cè)的股市價(jià)格機(jī)器學(xué)習(xí)模型,并
6、用這個(gè)模型來(lái)預(yù)測(cè)股市價(jià)格的漲跌。項(xiàng)目擬使用線性回歸,神經(jīng)網(wǎng)絡(luò)以及隨機(jī)森林來(lái)進(jìn)行預(yù)測(cè),并對(duì)三種算法的預(yù)測(cè)效果進(jìn)行比較。項(xiàng)目使用Python編程。
(二)自然人如何投資股市在編寫人工智能程序之前,需要考慮自然人是如何投資股市的,這是一個(gè)關(guān)鍵點(diǎn),因?yàn)楣墒袝r(shí)一個(gè)復(fù)雜非線性系統(tǒng),即混沌系統(tǒng),影響股市價(jià)格走向的因素很多。在投資股市時(shí),往往會(huì)在決定購(gòu)買哪只股票之前,會(huì)查詢與股票相關(guān)公司的信息,如果查到的信息以正面信息為主,那么投資這只股票的回報(bào)率就可能會(huì)高一些,當(dāng)然還需要看K線圖??偨Y(jié)起來(lái)則可以確定機(jī)器學(xué)習(xí)模型需要股價(jià)數(shù)據(jù)和對(duì)股票的情感數(shù)據(jù)。
(三)數(shù)據(jù)獲取機(jī)器學(xué)習(xí)模型需要數(shù)
7、據(jù),沒有數(shù)據(jù)就沒辦法訓(xùn)練機(jī)器學(xué)習(xí)模型。所以在數(shù)據(jù)獲取方面股價(jià)數(shù)據(jù)使用Pandas進(jìn)行分析,對(duì)于情感數(shù)據(jù)則使用NLTK來(lái)進(jìn)行處理。具體來(lái)說(shuō)讀取往年股價(jià)數(shù)據(jù),并對(duì)其進(jìn)行簡(jiǎn)單處理后生成Pandas的DataFrame格式,構(gòu)成系列化,并成為文件的Python對(duì)象。通過(guò)print(df-stocks)來(lái)查看df-stocksDataFrame對(duì)象并輸出可得到股票的股價(jià)以及相關(guān)文章內(nèi)容,進(jìn)一步開始分析股票的情感數(shù)據(jù)與股價(jià)數(shù)據(jù)。先將priceSeries從df-stocks中獨(dú)立出來(lái),成為單獨(dú)的DataFrame對(duì)象,然后添加幾個(gè)新的Series,隨后使用NLTK對(duì)文章進(jìn)行情感分析。使用NLTK的情感強(qiáng)度
8、分析器對(duì)文章情感進(jìn)行分析,并將情感強(qiáng)度寫入新獨(dú)立出來(lái)的DataFrame中,其中的negSeries存放文章的負(fù)面指數(shù),neuSeries存放中立指數(shù),posSeries存放正面指數(shù),Compound存放合成指數(shù),然后將數(shù)據(jù)輸出,得到相應(yīng)的情感分析數(shù)據(jù)。
(四)劃分?jǐn)?shù)據(jù)集根據(jù)輸出的情感分析數(shù)據(jù),開始時(shí)間為2007年1月1日,結(jié)束時(shí)間是2016年12月31日,再8:2的比例來(lái)劃分訓(xùn)練集和測(cè)試集。劃分完df后,新建一個(gè)對(duì)每個(gè)時(shí)間點(diǎn)情感評(píng)分的list,將訓(xùn)練集和測(cè)試集的數(shù)據(jù)加入其中。因?yàn)橐A(yù)測(cè)股票漲跌,也就是預(yù)測(cè)股價(jià)的走勢(shì),那么定義一個(gè)y標(biāo)簽作為股價(jià)。
(五)股市漲跌
9、預(yù)測(cè)1.隨機(jī)森林算法預(yù)測(cè)使用Scikitlearn,其中封裝好了隨機(jī)森林算法。在控制臺(tái)輸入rf=RandomForestRegressor)rf.fit(numpy_df_train,y_train)#print(rf.feature_inportances)prediction,bias,contributions=ti.predict(rf,numpy_df_test)print(preditcion)當(dāng)看到控制臺(tái)有輸出以后,輸出正確那么可以證明隨機(jī)森林預(yù)測(cè)成功,為了可視化分析因此使用Matplotlip來(lái)繪圖。繪制出沒有平滑的股價(jià)走勢(shì),并且保存為RF-noSmoothing.png。輸出
10、到桌面,就可以得到一個(gè)預(yù)測(cè)股價(jià)走勢(shì)和真實(shí)股票走勢(shì)的對(duì)比圖,按照走勢(shì)圖來(lái)看,預(yù)測(cè)的數(shù)據(jù)和實(shí)際的股價(jià)走勢(shì)存在比較大偏差,因此還需要進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行處理,通過(guò)添加一個(gè)常數(shù)來(lái)表示測(cè)試階段的閉市股價(jià)。然后再次通過(guò)Matplotlip繪制走勢(shì)圖,修正以后預(yù)測(cè)走勢(shì)曲線與實(shí)際的股價(jià)走勢(shì)曲線接近,但是預(yù)測(cè)走勢(shì)曲線抖動(dòng)比較明顯,需要進(jìn)行平滑。而平滑處理方法可以使用Pandas的EWMA來(lái)實(shí)現(xiàn)。但平滑后發(fā)現(xiàn)預(yù)測(cè)走勢(shì)與最后部分真實(shí)的股票價(jià)格走勢(shì)出現(xiàn)了相反的情況,進(jìn)一步處理,只繪制平滑后的實(shí)際故事走勢(shì)與預(yù)測(cè)股價(jià)走勢(shì)的折現(xiàn),結(jié)果還是表面預(yù)測(cè)效果并不是很理想。2.線性回歸算法預(yù)測(cè)因?yàn)殡S機(jī)森林預(yù)測(cè)效果不佳,為此使用基于Ten
11、sorFlow的線性回歸算法,基本上的思路與上文的思路相當(dāng),只是TensorFlow的操作不一樣。實(shí)際上線性回歸模型在機(jī)器學(xué)習(xí)和統(tǒng)計(jì)領(lǐng)域,是非常簡(jiǎn)單的模型,但也是應(yīng)用最廣泛的模型。在具體的使用當(dāng)中基于TensorFlow先導(dǎo)入需要的Python包,然后設(shè)置Pandas與TensorFlow的關(guān)聯(lián),然后加載上文建立的數(shù)據(jù)集,使用numpy隨機(jī)方法對(duì)數(shù)據(jù)進(jìn)行處理,隨后通過(guò)Pandas提供的describe()函數(shù)來(lái)進(jìn)行數(shù)據(jù)預(yù)覽。在tensorFlow中用特征列來(lái)表示特征的數(shù)據(jù)類型,為此先定義輸入特征,并配置素質(zhì)特征,同時(shí)定義標(biāo)簽。配置一個(gè)線性回歸模型,然后用GradientAescentOptim
12、izer訓(xùn)練這個(gè)模型。按照同樣的方式輸出圖形后進(jìn)行分析,根據(jù)預(yù)測(cè)結(jié)果來(lái)看,效果要比隨機(jī)森林算法要好一些,但是參考的價(jià)值并不大。3.神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)同樣結(jié)合ScikitLearn的MLP來(lái)對(duì)股價(jià)進(jìn)行預(yù)測(cè)分析,思路同上,加載數(shù)據(jù)集,分隔出數(shù)據(jù)集和測(cè)試集,并計(jì)算情感分?jǐn)?shù),創(chuàng)建一個(gè)MLP模型,按照上文的方式繪制出走勢(shì)圖,看情況進(jìn)行修正,輸出走勢(shì)圖,最后再進(jìn)行平滑?;谶@種方法的預(yù)測(cè)相對(duì)來(lái)說(shuō)效果要好很多,至少對(duì)比前兩者來(lái)看效果最好。
三、關(guān)于金融時(shí)間序列中的人工智能
在金融時(shí)間序列分析當(dāng)中早期使用的是時(shí)間序列的分析方法,表現(xiàn)為基于統(tǒng)計(jì)和線性的方法,比如移動(dòng)平均算法,指數(shù)平
13、滑算法,自回歸移動(dòng)平均算法等。一定程度上來(lái)說(shuō)基于統(tǒng)計(jì)和線性假設(shè)前提下的模型在一定程度上滿足了性能指標(biāo)需求,可以在特定領(lǐng)域取得比較理想的預(yù)測(cè)效果,但金融領(lǐng)域具有非線性、混沌性特征,時(shí)間序列分析方法并不能直接應(yīng)用在金融時(shí)間序列分析當(dāng)中,從上文的分析中可知線性回歸模型這種方式并不能很好地解決非線性環(huán)境下的噪聲干擾。所以最好的方式還是結(jié)合人工智能的方法來(lái)進(jìn)行金融時(shí)間序列分析,其中涉及了計(jì)算智能、遺傳算法、模糊分析方法、智能體、神經(jīng)網(wǎng)絡(luò)等?;谇拔牡姆治鰜?lái)說(shuō)神經(jīng)網(wǎng)絡(luò)算法是比較理想的算法,實(shí)際在人工智能應(yīng)用與金融領(lǐng)域的實(shí)踐當(dāng)中更多的還是使用的神經(jīng)網(wǎng)絡(luò)。不過(guò)不可靠性會(huì)比較大。所以人工智能理論上在預(yù)測(cè)股票上是
14、非??尚械模斯ぶ悄苡谐蝗諘?huì)主導(dǎo)金融策略的制定,但目前來(lái)說(shuō)還需要技術(shù)層面上的進(jìn)一步探索。結(jié)束語(yǔ):綜上所述,人工智能在金融領(lǐng)域的應(yīng)用理論上是可行的,以目前的技術(shù)條件來(lái)說(shuō),存在一定的技術(shù)難題,解決了這些問(wèn)題人工智能在金融領(lǐng)域必定會(huì)發(fā)揮出非常顯著的作用,在本文當(dāng)中基于現(xiàn)有的技術(shù)條件分析了人工智能在股票市場(chǎng)上的應(yīng)用問(wèn)題,希望能夠提供一定的參考價(jià)值。
參考文獻(xiàn):
[1]中國(guó)人民銀行武漢分行辦公室課題組.人工智能在金融領(lǐng)域的應(yīng)用及應(yīng)對(duì)[J].武漢金融,2016,(07):46-47,50.
[2]楊卓越.人工智能在金融領(lǐng)域的應(yīng)用現(xiàn)狀及安全風(fēng)險(xiǎn)分析[J].金融經(jīng)濟(jì)(理論版),2017,(01):147-148.
[3]張書樂(lè).人工智能+金融的幾道“坎”[J].金融博覽,2017,(04):50-52.