“人工智能“( Artificial Intelligence;簡稱AI)曾經以一場堪稱圍棋人機大戰(zhàn)而轟動了全世界。在本次對戰(zhàn)當中,阿爾法圍棋(AlphaGo)與李世石九段之間的較量也隨之引來了各界的廣泛關注。在這之后,人工智能技術也開始被各個領域中備受矚目。從金融相關的服務及保險領域,到生命科學與教育研究領域也在積極地使用該技術。不僅如此,人工智能技術還被使用在政府、國防、制造業(yè)、能源、運輸、醫(yī)療等領域中,還逐漸擴展到了銷售、通信、傳媒、娛樂、體育等生活領域。
實際上,隨著人們開始對智能型商務模式的實際需求不斷變大,對于傳達到消費者群體所接受的經驗值也不斷被推陳出新。為了能滿足這一變化,谷歌(Google)、微軟(Microsoft)、IBM, 亞馬遜AWS, 英特爾(Intel)、FICO(Fair Isaac Corporation)、Salesforce、百度、SAS等全球知名企業(yè)也開始致力于把人工智能技術與商務應用兩者進行相結合。
根據全球知名市場研究機構 Research and Markets的發(fā)布的報告顯示,從 2018年7月到2023年截止,有關人工智能市場規(guī)模預期每年平均增長48%以上。機構能夠獲得該相關數據,主要原因在于有關加強智能型商務程序的必要性,物聯網(IoT)、連接設備(Connected Device)的增加等情況而導致的大規(guī)模數據生成,以及后附加的運營費用削減的必然趨勢等起到了重要作用。不僅如此,對于提高基礎設施及數字城市相關項目的水平,全世界的各個政府,企業(yè),以及地方自治團體等相關組織與機構也正在不斷努力,并促進了人工智能以及相關服務市場的快速發(fā)展。該機構還將預測相關市場的發(fā)展將會持續(xù)一段時間。
人工智能技術是通過可持續(xù)發(fā)展,能夠生成高附加值的一項產業(yè)。同時,它也是能夠創(chuàng)造出實際收益的一個巨大市場。但是,對于該市場向外部所呈現出的發(fā)展趨勢以及發(fā)展?jié)摿ο啾?,對于該技術能夠解決市場上所發(fā)生的問題處理能力,現還處于初步的階段。
對此,我們AIPE以人工智能預測(AI Prediction)為一個核心點來搭建一項人工智能模型。我們可以通過相關數據來進行測試,并將此技術實際應用到商業(yè)化當中的人工智能研究人員提供相關服務。不僅如此,我們也將根據人工智能模型所呈現出的數據,對加密貨幣進行投資的投資者之間提供可聯系的一項平臺。我們將利用人工智能開發(fā)者以及該團體所積攢的相關人力資來研發(fā)出一項以區(qū)塊鏈技術為主的平臺。該平臺能夠向需要獲得人工智能數據的企業(yè)提供聯系與服務。最后,我們將通過該項目,希望能夠建立一個研究者與投資者以及企業(yè),三者之間的緊密且互利的循環(huán)模式關系。
對于該平臺內所產出的并共享的所有信息,我們將通過區(qū)塊鏈技術來進行安全管理。人工智能研究人員對于所開發(fā)出的相關內容持有版權與管理權限。對于使用人工智能模型的投資者而言,個人信息以及通過該模型進行參考并進行投資等也將獲得保護。不僅如此,所有的參與者與企業(yè)將通過該平臺的共享而起到積極的作用,均可獲得相應數額的獎勵。
所有的參與者以及企業(yè)將由AI預測平臺所提供的應用程序編程接口(API),在此平臺內構建多樣化的點播服務(On Demand Service)。我們的AIPX團隊是通過人工智能預測平臺(AI Prediction Platform),由人工智能研究人員所開發(fā)的預測模型(Prediction Model)與實際用戶們所擁有的所有權與管理權限等進行有效再分配,給予相應的獎勵。我們希望以此來創(chuàng)造價值,并形成一條良性循環(huán)的閉合。并且,以此作為基礎而實現人工智能產業(yè)的創(chuàng)新,且對相關領域給予貢獻。
服務項目
3PIKS
結合人工智能與區(qū)塊鏈兩項技術的全新的獎勵平臺
我們?yōu)榱四軌蛳蚴袌鎏峁┮浴叭斯ぶ悄堋迸c“人為因素”(Human Factor)兩者相結合的加密貨幣預測服務,專門開發(fā)了通過人工智能來預測加密貨幣市場的一項3PIKS服務平臺。
對于加密貨幣市場的參與者而言,3PIKS服務中所提供的人工智能模型的價格預測結果以及3PIKS用戶們所預測的結果均可作為其參考的主要數據指標。用戶們將根據由我公司所開發(fā)出的人工智能模型一起預測加密貨幣的實際價格,以此作為獎勵來獲得AI Token。對于AI Token,未來可以與AIPE Token進行相互兌換。不僅如此,AI Token還對即將要建立的戰(zhàn)略伙伴公司所推出的通證及加密貨幣可以進行兌換。我們所構建的生態(tài)體系也是通過可在多處不同地點使用相關加密貨幣等來不斷得到完善。
AI比特蜂 (AIBitBip)
以人工智能為基礎的加密貨幣價格變動預測信號服務
該服務的設計是以人工智能模型專門對實際的交易提供相應的幫助為主要目標。對于交易時可能會出現需要關注的情況(價格的上升與下降)下,該人工智能將提前收集相關數據,以發(fā)送信號的方式來進行相關的通知服務。為了能夠使用戶能夠更加方便地使用到該技術,我們將以手機軟件(APP)的形式來開發(fā)樣機,并計劃在2019年第二季度正式發(fā)布。在初期,我們將優(yōu)先使用由我公司自行開發(fā)的數十個人工智能模型,并進行該服務的提供。之后,我們打算通過AI預測平臺中所開發(fā)出的諸多人工智能模型當中進行篩選以后,在此基礎上對相應的模型進行內容追加與技術的擴張,并正式公之于世。
AI比特蜂(AIBitBip)所擁有的價值不僅限于提供加密貨幣交易的相關信息。不同的群體通過該技術所提供到的信號而進行相關交易,將會形成一個巨大的價格主流群體。如果在同一時間段內,投入大量資本,將會形成一個總體價格的重要趨勢。這也在一定程度上可以大幅度地降低相關投資的風險。因此,用戶可以對該數據及價格趨勢作為投資的相關參考資料,我們也很期待用戶的實際投資風險也隨之降低。手機軟件的特點是方便,靈活性強,易于推薦給其他更多的用戶。這有利于在軟件市場內進行各種形式的廣告發(fā)布與推廣。
AI自動型交易模式
以人工智能預測信號(AI Prediction Signal)為基礎的自動交易模型(Auto-Trading Bot)
即使,以AI比特蜂(AIBitBip)提前收到了預測信號,不是每一個人都可以在交易當中受益。在24小時內不停地進行大規(guī)模同步交易的加密貨幣市場當中,憑借以提前收到的信號為來實際地進行交易是一件相當困難的事情。為了解決這一問題,我們將通過各個交易所的API來提供AI自動交易模型的相關服務。為了實現該項目的成功落地,我們已通過人工智能預測信號(AI Prediction Signal)來進行了實際的交易。雖然,在這期間我們也曾出現過多次錯誤與失敗。但是,與此同時,我們也發(fā)現人工智能不斷對相關過程進行學習后,對其預測的準確率及回報率開始回升并顯示出上升趨勢。
我們的服務是能夠向所有的用戶提供可以在正確的時間點上及時進行交易,且從而獲得相應收入。對于使用該服務的用戶須持有一定數額以上的AIPE,對于自動型交易模式中所獲取的一部分收益也將與研究人員一同共享,以此來構建并維持整個生態(tài)體系。
而且,我公司所推出的自動型交易模式(Auto Trading)不僅限于只獲取收益,而是能夠通過該平臺與交易所建立緊密的合作關系。有關進行該自動型交易模式所提供到的服務內容,我們需要不斷的重復以進行出價登錄以及成交的整個流程。通過該流程,我們可以確保交易所的更多交易量與加密貨幣的流通性。而且,對于在形成相應的市場,該服務平臺將會起到重要的作用。我們期待通過B2B的商務模式,能夠形成以用戶,交易所,預測平臺這三者之間的相互發(fā)展,并形成一個完整的生態(tài)體系。
AI預測平臺
與可確保已驗證完畢的數據進行確認的人工智能預測平臺(AI Prediction Platform)
現階段,對于人工智能研究中最大的技術瓶頸無非是對于大規(guī)模數據的提煉與計算能力的提升。以個人來對整體環(huán)境的設定與安排幾乎無法實現,對于需要獲取人工智能模型的相關數據的企業(yè)也仍然面臨著嚴峻的考驗。
AIPE是為了能夠解決這一問題,并提高改善人工智能研發(fā)環(huán)境而推出的AI預測平臺。在該平臺內,人工智能研究人員們可在開源圖書管理系統(tǒng)環(huán)境下輕松便捷地使用該服務,同時企業(yè)也可以確保相應的使用人數(Traffic)以及模型數據的獲取。在這種環(huán)境下,如果諸多人工智能研究人員可通過平臺所提供的數據工具來搭建多樣化的人工智能模型,這將對于提供云端的相關企業(yè)在進入到市場內部時所碰到的壁壘也將可大幅度降低。如使用該模式及平臺,對于AI模型的管理以及數據的共享將會變得更加容易。不僅如此,對于減少使用服務器的費用,增加多樣化的交易模型或算法,以及增加對于用戶的方便使用等優(yōu)勢可將帶動對于新型資產運營模式的主流趨勢。
綜合以上內容,AIPX所提供的基礎架構平臺(Platform Infra)不單單只提供對AI研究人員與投資者,以及對企業(yè)的方便服務。而是,對于能夠帶來人工智能產業(yè)當中的整體價值鏈(value chain)以及賦予全新理念的新思潮有著重大意義。
交易所解決方案
現有很多企業(yè)不斷地向相關加密貨幣交易所研發(fā)以及提供其相關服務等,作為目標進軍到該市場當中。但是,礙于時間與實際投入到的費用,加上專業(yè)技術的不足,加上營銷戰(zhàn)略的缺乏等,從而出現了導致諸多方面問題及阻礙。
AIPE為了解決這一問題,我們已計劃提供由我公司所開發(fā)的加密貨幣交易所與解決方案。以往的傳統(tǒng)概念的中心化交易所出現的問題,我們也可以提供相應的服務。不僅如此,我們正在開發(fā)以加密貨幣為中心的,可進行保證金以及杠桿交易的保證金交易所(Margin Exchange)。我公司所開發(fā)的該交易所與BitMEX一樣,是可以提供期貨保證金的交易,在此還計劃增加對于保證金的期貨交易。
現階段,可以提供有關加密貨幣交易所相應解決方案的企業(yè)數不勝數,但卻僅限于以中心化交易所模式來提供相應的解決方案。AIPE是可以提供以保證金交易為主的交易所,還可提供作為衍生產品的期貨交易,加上以提供期權交易為主,同時也可以追加保證金交易的保證金期貨交易。不僅如此,我們還計劃提供可支持保證金期權交易的加密貨幣投資解決方案。
AI預測生態(tài)系統(tǒng)
AIPE所展望的是以人工智能為基礎的,由各項服務所構成的生態(tài)體系。
AIPE所追求的目標是能夠使各項服務的價值體現形成一個有機的加密貨幣生態(tài)體系。
作為獎勵平臺的3PIKS與提前發(fā)出加密貨幣價格變動信號服務的AI比特蜂,通過使用這兩項服務,用戶就可以對加密貨幣或通證進行空投,也可以作為以交易所內的特定加密貨幣的營銷渠道來使用。
不僅如此,現3PIKS內正在進行作為獎勵而獲得的AI Token(暫定),并且能與簽約合作方的通證或加密貨幣可進行兌換(Swap)的活動。對已進行兌換(Swap)完畢的加密貨幣,用戶可以通過由我公司提供營銷服務的相關交易所進行提款,并確保交易所的參與用戶人數與流動性。
AIPE的經濟系統(tǒng)不僅限于獲得優(yōu)秀的人工智能模型,也不僅限于只提供在開發(fā)交易所時需獲得的解決方案。各項服務都互相保持一定的關系并構建有機的價值體系。同時,它也將形成加密貨幣價格預測,貨幣的流動性,宣傳,參與人數以及可以保持市場穩(wěn)定性等諸多因素結合在一起的一個整體的循環(huán)機制。
概述
人工智能的研發(fā)對于我們整個項目當中最為核心且重要,因此我公司正在運營人工智能開發(fā)研究室(AIResearch Lab)。起初,對于開發(fā)人工智能預測模型的時候,我們所采用的方式是深度學習(Deep Learning)。而且,以此為基礎,我們也不斷將領域擴大到機器學習(Machine Learning),且與深度學習進行整合與統(tǒng)一,并開發(fā)出新的模型。
對于我們以往所采納的深度學習方式進行一個簡單的概述,其主要內容是利用循環(huán)神經網絡(RNN)與卷積神經網絡(CNN)方法論來搭建模型系統(tǒng)。為了將該時間序列數據能夠投入到模型,其預處理過程很重要。在RNN所投入的數據預處理重點是有效地去除噪聲(Noise)。而且,對于投入到CNN的數據預處理重點有效地顯示出模式(pattern)。我們不僅單一地采用了對RNN與CNN兩種方式,同時也對這兩種方式采用了相互互補的方式來嘗試搭建該模型。對于在機器學習當中,為了能夠完善決策樹(Decision Tree)的不穩(wěn)定性,通常使用到的方法之一,就是采用梯度提升( Gradient Boosting )的方法來搭建相關的預測模型。
我們將從2017年7月開始到至今為止的約有100,000個加密貨幣時間序列數據用于訓練機器學習模型。對于時間序列數據,我們以最高價、最低價、開盤價、收盤價、交易量等五個基本特征為基礎來進行了對其數據的分析研究。近期,有關對研究的不斷深化,上述的五個基本特征以外,我們還使用了以技術指標為主的特征工程(Feature Engineering)等多個種類的特征點來進行了研發(fā)。
有關機器學習模型,對其帶入的數據越多,其準確率也會顯示出更高。但是,每一個模型都有屬于自己的特點。而且,對于時間序列數據的特征而言,其不穩(wěn)定因素也是不可避免。因此,我們得出的結論是,一味的帶入大量的數據,使模型進行學習,未必能夠達到預期的效果。實際上,每個模型用不同量數據學習功能將會提高其性能。例如,對于一些CNN模型,在近期以18,000個時間序列數據使讓它進行學習時,其模型所列舉出的分類準確率是最高的。而且,其中幾個長短期記憶網絡(LSTM)類型的模型,以全部的數據來使進行學習時,其顯示的結果也是達到了最高水平。
我們所使用的模型結構如下。如以RNN的方法來進行搭建模型,多層LSTM(長短期記憶網絡)或以多層GRU(門控循環(huán)單位)而堆疊LSTM 或堆疊GRU(Stacked LSTM/GRU)的功能更佳。而且,通過小波轉換的RNN類的模型也顯示出了較為滿意的結果。我們發(fā)現對于CNN模型,卷積層(Convolutionallayer)的數量與激活函數(Activation Function)良好的配合模式將能夠提高模型功能。層數越多,有可能出現過擬合(overfitting)現象。因此,我們適當地安排Dropout層與正則化。對于LSTM細胞與卷積層,并列的方式層疊出了混合型模型,其顯示出了較為滿意的功能。對于梯度提升,我們所借用的是XGBoost(Extrme Gradient Boosting),LightGBM,Catboost等梯度提升的框架及算法。
對于Boosting系列的機器學習模型,大部分都比較以依賴特征(Feature)的選擇及數據的規(guī)模。
主要技術介紹
概述
我公司擁有專門的人工智能研究團隊,其團隊人數是10名。我公司也通過該研究團隊進行相關人工智能技術的所有開發(fā)與研究。我們所采取的主要研究方法及流程如下。第一,對英文、中文以及韓國語圈內的主要研究論進行分析后,實地進行測試與重現。我們從2018年8月開始到2018年12月為止,共參考了約有500篇的論文。實地進行測試的模型當中,出現與我們所預期相符合的模型,我們將其重新進行反復地學習,進一步提高性能 。對于有參考價值的研究論文 ,您可通過我公司的官方網站cosmicbc.com的R&D Blog(研究內容博客)進行相關內容的閱覽。有關我公司所積累的研究成果,一直以來都已對外開放,以后也將持續(xù)開放。2018年12月開始,我們已經將100篇研究內容應用在實際的服務當中。
對于已搭建的模型,我公司通過亞馬遜AWS(Amazon web service),Naver Cloud Platform(NCP),阿里云(Alibaba Cloud)的人工智能云計算服務器(A.I. Cloud computing server)來正在進行研發(fā)。
首先,大部分已完成的模型用過去的數據進行學習后,再進行2周~3周的活數據(Live data)學習,最后確認模型的準確率百分比。以此作為參考,我們對顯示出較高特定數值以上的模型為重點,用多樣化的處理方法,對其模型進行1個月以上的學習。
RNN
對于循環(huán)神經網絡(RNN)模型的最大特點是節(jié)點定向連接的人工神經網絡。 與卷積神經網絡(CNN)進行對比,該機器學習RNN還擁有CNN不具備的記憶。它的特征是可以有效解決序列數據的預測分類問題的解答。所謂序列數據是,按照順序排列的組合來構成的時間序列數據,通常是以語音、視頻或文本為主??赏ㄟ^以下序列來表示。
在這里,對于時間序列的長度t=1,2,3,。..,T,通??梢钥醋骺勺兊男蛄?。以序列時間數據舉例,就可被推斷出來。有一個文章有第t位單詞,我們就可以推斷出第t+1位單詞。各個單詞是受到前一位單詞的影響。RNN抓住對于單詞與單詞之間的依賴關系,特別是能夠對文章的邏輯進行學習后,可預測出較高的準確率。例如,像加密貨幣一樣的時間序列數據,大部分的情下現存在的數據都是很容易受到之前數據的影響。同樣,RNN模型是擁有像上面所敘述的記憶結構。因此,該結構模型可以臨時記住相關信息,并以此信息來表現出不同的反饋。之所以可以把RNN適用于解決加密貨幣價格的預測分類問題,是因為模型可以根據時間序列數據來獲取文章內容的邏輯性,從而進行分類。
進行RNN學習時,需要用到像全連接神經網絡一樣的梯度下降法(Gradient Descent)。我們需要對誤差進行微分計算,從而計算各層權值。這里可采取兩種方法。一是實時遞歸學習算法RTRL(Realtime Recurrent Learning),另外則個是基于時間的反向傳播算法BPTT(Back Propagation Through Time)。前者是對記憶的使用效率較高,后者則是計算速度較快。
BPTT是把RNN以時間方向進行展開,構成類似全連接神經網絡一樣的結構,之后進行反向傳播計算。如同上圖所畫出的結構圖,將每一時刻RNN的整個結構中的環(huán)路展開成為時間連續(xù)的中間層連接單位。對于中間層的反向傳播,是以連續(xù)的時間點的中間層單元來進行結合。以這種方式來展開的神經網絡,將成為全連接神經網絡模樣。根據以此來進行反向傳播,從而通過計算梯度而可進行反向傳播計算。
根據上述的內容,RNN可以抓住時間數據的內容,可以進行推斷。但是,對于文章的長度很敏感。理論上,對時間節(jié)點t開始至以前的所有時間步驟的信息均可保存。但是,對于長時間的信息是無法進行學習。RNN能夠反映出的輸出時間最長也就10小時。
這種局限性是因為,對于層數較多的神經網絡,通過反向傳播計算梯度時,隨著經歷的層數增多,梯度值很容易發(fā)散并消失。所以,RNN很難應對長序列的問題。換句話說,對于短期性的記憶是可以實現,但是相反對長期性的記憶是無法得到實現。
LSTM and GRU
1990年代初,Sepp Hochreiter, Jürgen Schmidhuber,Youshua Bengio等為了能夠解決對于上述內容當中所發(fā)生的問題,通過理論性考察而推出了各種方法。其中,最為成功的方法就是長短期記憶網絡(Long Short Term Memory; LSTM)。LSTM與最基本的RNN相比,中間層的各個單元是由記憶單元組成。除此以外的所有的結構都與之前的RNN完全相同。
對于LSTM將單元連接理解為傳送帶(Conveyotr Belt)的形式更容易。簡單來說,是添加了把信息裝載到各個時間步驟來進行傳輸的方法。在時間序列的某一個時間點上,對于已輸出的信息將上傳到傳送帶,并且在必要的時間點的時間步驟下再移動至下來。把重要的信息進行存儲,從而防止對那些已經過了一段時間的信號有可能會逐漸消失的問題。
有關對LSTM細胞,以公式來表示如下。在這里,⊙是表示乘機-哈達馬積(Hadamardproduct)矩陣乘法。
在上圖中,我們可以看到GRU的結構比LSTM的結構更為簡單。在細節(jié)上,GRU也與LSRM一樣是通過門來調整信息的數量,對于這一點兩者是相同的。但是,特別是對門的控制方式會有一些不同。
公式表示如下。
CNN
CNN主要是適用于圖像認知方面所運用到的神經網絡模型算法。其算法是成功地解決了計算機中一直以來的大難題(對于物體的分類認知等)。對于以往的全連接神經網絡所面臨的問題是,即使識別較小的字體而計算權值與偏向的個數會暴爆發(fā)性增加。例如,為了能夠辨別出16x16大小的字體,我們可以設想一下在利用一個擁有100個神經元的隱含層的全連接神經網絡。這個網絡需要的權值和偏向的數量達到28,326個。如果在該神經網絡在增加新的隱含層,對于需要學習的參數數量將會變得更多。而且,對于字體的圖像如發(fā)生豎直或水平的移動,回轉,變形等變化,則需要重新輸入新的學習數據。
為了能夠解決此問題而誕生的CNN是與全連接神經網絡是完全不同的。該算法是把層和層之間特定的單元結合的特殊層。該特殊層進行卷積(Convolution)與池化(Pooling)兩種對于圖像處理相關的計算。
CNN的誕生,是通過動物大腦的視覺皮質(Visual cortex)的相關神經科學中獲得了靈感。更準確來說,是對于視覺皮質的神經細胞感受野(Receptive field)的局部性與簡單細胞與復雜細胞中獲得了靈感。同樣一個神經,對于在水平圖像產生激活,或者是在不同角度的圖像產生激活所表現出的模樣是不一樣的。而且,其他神經也擁有較寬闊的感官領域,因此會對低水準的模式(Pattern)之間相結合的較為復雜的模式產生激活。通過該規(guī)律,塑造了以下卷積神經網絡。如LeNet, AlexNet, VGG, GoogLeNet等都是最具有代表性的CNN模型。這些模型均在圖像分類方面展現了比人類高出一等的性能。
CNN的基本構造如下。對于輸入圖像的第一個卷積層的神經不是連接到已輸入的整個圖像的像素當中。而是,只連接在卷積層神經網絡的感官領域內的像素當中。但是,卷積通過線性運算。因此,為了使模型能夠學習更加復雜的非線性關系,把代表性的非線性激活函數Relu(線性整流函數; Rectified Linear Unit)連接在卷積層內。之后,為了降低對于池化層的運算量與內存使用量,以及減少參數的使用數量,對輸入圖像做類似下采樣處理。根據不同的數據特征,將卷積層+激活函數+池化層進行不同的組合,來進行層的堆疊。通常,CNN的輸出層連接一層以上的連接層,有助于高維度圖像最后一層做maping圖像分類。
綜合以上內容,在CNN中最為重要的構成因素是卷積層。如有WXW大小的黑白圖像,各個像素標注為(i,j)。然后,這里還有一個HXH大小過濾器的像素標注是(p,q),p,q=0,…,H-1。在這里,H《W。嚴格來說,卷積層的表示公式如下。
在卷積層之后的池化層計算如下。假定,在大小為WXWXK圖像中,像素(i,j)點為中心有一個大小為HXH正四邊形的框,做Padding計算處理圖像邊緣都包括的Pij可以求出來。對于該Pij內的像素,每一頻道K都會單獨地利用H2個的像素值來獲得一個像素值uijk。代表性的求這個像素值的方法為最大池化(Max Pooling), 平均池化等。
最大池化是在H2個的像素值當中選擇最大值的方式,該計算方法如下。
我們從該公式中不難看出,P=1就是平均池化,P=∞就是最大池化。
對于價格預測分類問題中,我們可以將時間序列數據的變化模式化。我們得出結論,根據卷積神經網絡(CNN)而搭建的模型是擁有強大的預測能力。
梯度提升(Gradient Boosting)
有關梯度提升是對于梯度下降(Gradient Descent)與Boosting相結合的合成詞。Boosting是相對來說只是把單一決策樹進行構建,一步步進行學習?;诖私Y果再建一個決策樹培。梯度提升方法是適用于所有損失函數可微分的函數。
梯度提升算法如下。
首先對學習機(h)進行初始化:
以梯度提升方法而搭建的模型中,最具有代表性的就是XGBoost,LightGBM,Catboost等。
首先是XGBoost。以并列處理的方式,能夠快速地進行學習與預測。能夠提供多樣化的定制型選項內容。根據Greedy算法來自動剪枝防止過擬合(Overfitting)。對于其他算法之間連接性較好。
與XGBoost相比,LightGBM的最大優(yōu)勢就是學習時間很短,內存使用量也相對較少。LightGBM是在XGBoost出現兩年后才開發(fā)出來的。該模型是繼承了XGBoost的優(yōu)勢,也彌補了諸多缺陷。LightGBM是采用了葉明智策略分裂方式,不考慮葉子的均衡,在損失值的最大的葉子節(jié)點上持續(xù)性的分裂,從而發(fā)展下去,所以會出現樹的非對稱現象。但是,相對于均衡樹分割方法,可將誤差損失最小化。
最后是Catboost。在該模型所引入的Ordering Principle概念解決了對以往的因目標泄露(target or data leakage)而導致的位移預測現象(prediction shift)與分類變量(Categorical Variable)的預處理問題。換句話說,在計算leaf value的過程中,所采用到的方法就是Ordered Boosting。以往的梯度提升是在搭建新樹的時候,將根據現有的模型中所使用到的數據進行再利用,因此存在著過擬合。該模型與以往的模型所不同。該過程是先求出逆向的leaf value,之后定出樹結構的。
通證經濟體系
加密貨幣介紹
總發(fā)行量 12億枚
單位價格 1 AIPE = 約 0.02 USD
名稱 AIPE Token
Coin Symbol AIPE
標準 ERC-20
Decimal類型 類型: 18
Hard Cap 412,500,000 AIPE
Soft Cap 137,500,000 AIPE
分配內容
AIPE幣是針對以平臺的開發(fā)與AI預測為基礎,搭建相關生態(tài)體系為目的而進行發(fā)行。對于參加ICO及IEO的用戶,可獲得整體發(fā)行量的40%的流通數量。除了加密貨幣銷售(Coin Sale)之外的剩余貨物量的30%,是用于構建初期的生態(tài)體系。例如,AI預測平臺的搭建,營銷等方面。對于APIE Foundation部分的12%的貨物量,將會使用在對于擴展平臺以及后期開發(fā)而需要的基礎設施的搭建等。Foundation貨物量的12%與團隊的分配貨物量的10%將按照順序而進行具體的分配。
款項運營
評論
查看更多