摘 ?要:伴隨著互聯(lián)網(wǎng)技術(shù)的應(yīng)用,連續(xù)雙向拍賣(mài)機(jī)制在商業(yè)世界廣泛運(yùn)用,引發(fā)諸多學(xué)者對(duì)該機(jī)制的研究與探索。本文詳細(xì)介紹了連續(xù)雙向拍賣(mài)機(jī)制的研究方法、在連續(xù)雙向拍賣(mài)機(jī)制下的算法策略以及人工交互實(shí)驗(yàn)方法,分析了競(jìng)價(jià)策略研究的發(fā)展前景。
關(guān)鍵詞:連續(xù)雙向拍賣(mài);算法;人機(jī)交互
拍賣(mài)機(jī)制是指根據(jù)一系列規(guī)則競(jìng)價(jià)決定的價(jià)格來(lái)決定資源配置的市場(chǎng)機(jī)制。經(jīng)典的拍賣(mài)機(jī)制多為單向拍賣(mài)。近年來(lái)隨著互聯(lián)網(wǎng)的發(fā)展,雙向拍賣(mài)制度引起了學(xué)術(shù)界的廣泛關(guān)注。相較于“1對(duì)多”的單向拍賣(mài)而言,雙向拍賣(mài)為“多對(duì)多”形式,競(jìng)價(jià)雙方均存在多位參與者,買(mǎi)賣(mài)雙方是平等的供給與需求關(guān)系。傳統(tǒng)雙向拍賣(mài)分為連續(xù)雙向拍賣(mài)與集和競(jìng)價(jià)。連續(xù)雙向拍賣(mài)市場(chǎng)中,買(mǎi)賣(mài)雙方根據(jù)市場(chǎng)規(guī)則提交報(bào)價(jià),一旦市場(chǎng)中出現(xiàn)可成交價(jià)格,便立即達(dá)成交易,若未達(dá)成交易,買(mǎi)賣(mài)雙方可調(diào)整報(bào)價(jià);集和競(jìng)價(jià)市場(chǎng)中,買(mǎi)賣(mài)雙方在開(kāi)放期內(nèi)根據(jù)市場(chǎng)規(guī)則自由競(jìng)價(jià),開(kāi)放期結(jié)束后,使得市場(chǎng)成交數(shù)量達(dá)到最大的報(bào)價(jià)成為市場(chǎng)價(jià)。兩種機(jī)制各有利弊,互為補(bǔ)充,在現(xiàn)實(shí)經(jīng)濟(jì)中經(jīng)常聯(lián)合使用,如股票市場(chǎng),便采用集和競(jìng)價(jià)啟動(dòng)市場(chǎng),連續(xù)雙方拍賣(mài)運(yùn)行市場(chǎng)。由于連續(xù)雙向拍賣(mài)機(jī)制的動(dòng)態(tài)性和隨機(jī)性,連續(xù)雙向拍賣(mài)市場(chǎng)的競(jìng)價(jià)策略相較于單向拍賣(mài)、集和競(jìng)價(jià)更為復(fù)雜,受到學(xué)術(shù)界更加廣泛的關(guān)注。
一、連續(xù)雙向拍賣(mài)市場(chǎng)最優(yōu)策略的研究方法
(1)納什均衡求解
Chatterjee和Samuelson將博弈論方法運(yùn)用于雙向拍賣(mài)市場(chǎng)中的均衡競(jìng)價(jià)策略研究中,得到了只包含一個(gè)買(mǎi)方、一個(gè)賣(mài)方和一件商品的簡(jiǎn)化雙向拍賣(mài)市場(chǎng)中的貝葉斯納什均衡策略。Satterthwaite和Williams等人擴(kuò)展到多個(gè)買(mǎi)賣(mài)雙方的情形,并證明隨著買(mǎi)賣(mài)雙方參與者人數(shù)的不斷增加,市場(chǎng)效率逐步提升,雙方報(bào)價(jià)更加趨近真實(shí)報(bào)價(jià)。Friedman提出雙向拍賣(mài)市場(chǎng)的價(jià)格形成模型,將雙向拍賣(mài)簡(jiǎn)化成貝葉斯更新過(guò)程,證明了買(mǎi)賣(mài)雙方存在最優(yōu)簡(jiǎn)單策略。
(2)實(shí)驗(yàn)經(jīng)濟(jì)學(xué)方法
實(shí)驗(yàn)經(jīng)濟(jì)學(xué)在連續(xù)雙向拍賣(mài)市場(chǎng)中的競(jìng)價(jià)策略研究分為兩種:一是計(jì)算機(jī)仿真實(shí)驗(yàn),利用計(jì)算機(jī)對(duì)所設(shè)計(jì)策略進(jìn)行模擬實(shí)驗(yàn),通過(guò)不同策略的實(shí)驗(yàn)結(jié)果對(duì)比,分析策略?xún)?yōu)劣。二是人機(jī)交互實(shí)驗(yàn),用算法機(jī)器人替代部分人類(lèi)參與者,觀(guān)察人類(lèi)交易者與算法交易者身處同一市場(chǎng)的交易結(jié)果。伴隨人工智能的發(fā)展,人機(jī)交互實(shí)驗(yàn)為連續(xù)雙向拍賣(mài)的競(jìng)價(jià)策略研究提供了更為契合真實(shí)世界的研究方法。
二、經(jīng)典算法策略簡(jiǎn)介
(1)連續(xù)雙向拍賣(mài)機(jī)制設(shè)計(jì)
大多數(shù)連續(xù)雙向拍賣(mài)市場(chǎng)的研究圍繞Smith的市場(chǎng)協(xié)議開(kāi)展:假定市場(chǎng)中只存在一類(lèi)同質(zhì)商品,交易期內(nèi),買(mǎi)賣(mài)雙方可對(duì)商品進(jìn)行報(bào)價(jià),但每次報(bào)價(jià)只能指定唯一商品。只要市場(chǎng)上的賣(mài)方報(bào)價(jià)與買(mǎi)方報(bào)價(jià)相互匹配,立即達(dá)成交易,交易價(jià)格為達(dá)成交易的買(mǎi)賣(mài)方報(bào)價(jià)的平均值,交易期間允許雙方修改報(bào)價(jià),市場(chǎng)存在多個(gè)交易日,每個(gè)交易日有多個(gè)交易期,每個(gè)交易期期初更新商品保留價(jià)格。市場(chǎng)出清或?qū)嶒?yàn)預(yù)定時(shí)間達(dá)到即交易結(jié)束。同時(shí),Smith開(kāi)創(chuàng)性的設(shè)計(jì)了誘導(dǎo)序列以控制實(shí)驗(yàn)環(huán)境:在交易期開(kāi)始階段,分配給買(mǎi)家和賣(mài)家一個(gè)保留價(jià)格序列。買(mǎi)家序列為逐漸降低的價(jià)值序列以控制市場(chǎng)的需求曲線(xiàn);賣(mài)家序列為逐漸上升的成本序列以控制賣(mài)家的供給曲線(xiàn)。在此假定買(mǎi)方價(jià)值為w,賣(mài)方成本為c,成交價(jià)格為p。那么對(duì)應(yīng)的買(mǎi)方剩余為w-p,賣(mài)方剩余為p-c。基于Smith的研究,定義市場(chǎng)分配效率為所有的買(mǎi)方剩余與賣(mài)方剩余之和和理論剩余值的比值。
(2)零智能算法
Gode和Sunder提出了兩種零智能算法,分別為ZIU算法和ZIC算法。假設(shè)市場(chǎng)允許的最高報(bào)價(jià)為x,最高報(bào)價(jià)為z,Vi為第i個(gè)算法買(mǎi)方交易員保留價(jià)值,Cj為第j個(gè)算法賣(mài)方交易員保留成本。ZIU算法中買(mǎi)賣(mài)雙方策略均為[x,z]的均勻分布隨機(jī)值。ZIC算法:買(mǎi)方策略為[x,Vi]的均勻分布隨機(jī)值;賣(mài)方策略為[Cj,z]的均勻分布隨機(jī)值。實(shí)驗(yàn)結(jié)果表明:即使是零智能算法策略機(jī)器人參與連續(xù)雙向拍賣(mài),也能達(dá)到資源配置的有效性。證明了連續(xù)雙向拍賣(mài)機(jī)制的有效性依賴(lài)其市場(chǎng)規(guī)則,與交易者的動(dòng)機(jī)、市場(chǎng)信息和自我學(xué)習(xí)無(wú)關(guān)。
(3)增強(qiáng)零智能算法
Cliff和Bruten發(fā)現(xiàn)在非對(duì)稱(chēng)市場(chǎng)結(jié)構(gòu)下ZI算法并不能達(dá)到高市場(chǎng)效率,并提出增強(qiáng)零智能算法(ZIP算法)。ZIP算法引入自我學(xué)習(xí)機(jī)制,根據(jù)市場(chǎng)信息進(jìn)行簡(jiǎn)單的自學(xué)習(xí)。ZIP算法根據(jù)四類(lèi)市場(chǎng)信息調(diào)整利潤(rùn)率進(jìn)而修改自身報(bào)價(jià):自己的上期報(bào)價(jià)p是否成交;市場(chǎng)最新報(bào)價(jià)q;q是買(mǎi)方報(bào)價(jià)還是賣(mài)方報(bào)價(jià);報(bào)價(jià)q是否達(dá)成交易。如果自身報(bào)價(jià)p在市場(chǎng)中達(dá)成交易,算法交易員不會(huì)降低自身利潤(rùn);如果市場(chǎng)中有新的交易達(dá)成,那么報(bào)價(jià)高于等于成交價(jià)的買(mǎi)方交易員將提高利潤(rùn)率,報(bào)價(jià)低于等于成交價(jià)的賣(mài)方交易員將提高利潤(rùn)率;當(dāng)市場(chǎng)中出現(xiàn)新的買(mǎi)方報(bào)價(jià),報(bào)價(jià)低于最新報(bào)價(jià)的買(mǎi)方交易員降低利潤(rùn)率;當(dāng)市場(chǎng)中出現(xiàn)新的賣(mài)方報(bào)價(jià),報(bào)價(jià)高于最新報(bào)價(jià)的賣(mài)方交易員降低利潤(rùn)率。利用以上擁有簡(jiǎn)單自學(xué)習(xí)能力的ZIP算法交易員進(jìn)行仿真實(shí)驗(yàn)發(fā)現(xiàn),在更一般的市場(chǎng)供需結(jié)構(gòu)下,ZIP算法相較ZI算法更接近人類(lèi)在連續(xù)雙向拍賣(mài)機(jī)制下的市場(chǎng)表現(xiàn)。
(4)GD算法
GD算法是Gjerstad和Dickhaut基于啟發(fā)式信念學(xué)習(xí)模型的一種算法,該算法主要包括以下三個(gè)核心元素:?jiǎn)l(fā)式信念函數(shù),通過(guò)收集市場(chǎng)數(shù)據(jù),將過(guò)去n期市場(chǎng)所有交易者的出價(jià)信息和成交情況整合為歷史數(shù)據(jù)集,利用數(shù)據(jù)集求解價(jià)格p達(dá)成交易的概率;基于信念的期望剩余價(jià)值最大化,根據(jù)啟發(fā)式信念函數(shù),計(jì)算以?xún)r(jià)格p出價(jià)的期望剩余價(jià)值,根據(jù)最大化結(jié)果決定出價(jià);決定提交報(bào)價(jià)的時(shí)間。該算法的特點(diǎn)是接近于理性人的決策思維。
(5)AA算法
Vytelingum提出了自主交易代理策略(AA策略),該策略基于長(zhǎng)期和短期學(xué)習(xí),使得算法可以調(diào)整自己的出價(jià),并在各個(gè)環(huán)境下保持高效。短期學(xué)習(xí)將根據(jù)市場(chǎng)波動(dòng)調(diào)整其“侵略度”,高侵略度意味著其追求更高的成交概率而會(huì)主動(dòng)放棄一些收益。低侵略度則追求更高的收益而損失一些成交的概率。長(zhǎng)期學(xué)習(xí)則基于每次交易后的市場(chǎng)信息調(diào)整決定侵略度影響出價(jià)的參數(shù)。短期學(xué)習(xí)的核心是對(duì)市場(chǎng)波動(dòng)的即刻反應(yīng),長(zhǎng)期學(xué)習(xí)的核心則是適應(yīng)市場(chǎng)供需變化的長(zhǎng)期趨勢(shì)。分析AA算法與ZIP算法、GD算法的仿真實(shí)驗(yàn)結(jié)果可知:無(wú)論是靜態(tài)還是動(dòng)態(tài)實(shí)驗(yàn)環(huán)境,AA算法均表現(xiàn)更優(yōu)。
[6]Gjerstad,S.,Dickhaut,J.Price Formation in Double Auctions[J]Games and Econimic Behavior,1998.22:1-29
[7]Vytelingum P,Cliff D,Jennings N R.Strategic bidding in continuous double auctions.Artificial Intelligence,2008.172(14):1700~1729
[8]Yue C,Mabu S,Hirasawa K.A bidding strategy using genetic network programming with adjusting parameters for large-scale continuous double auction.In:2012 IEEE International Conference on Systems,Man,and Cybern etics(SMC),New York: IEEE Press,2012:1896~1902.
[9]Zhan W,Zhang J,Yang J,etal.K-ZI: A general zero-intelligence model in continuous double auction.International Journal of Information Technology & Decision Marketing,2002.1(4):673~691
[10]詹文杰,楊潔.連續(xù)雙向拍賣(mài)市場(chǎng)中基于馬爾科夫鏈的交易策略研究。中國(guó)管理科學(xué),2008.16(1):111~116
[11]詹文杰,白延濤.基于動(dòng)態(tài) Hurwicz 準(zhǔn)則的連續(xù)雙向拍賣(mài)報(bào)價(jià)策略研究.管理學(xué)報(bào),2014.11(3):
[12]欒海軍,董紅斌,周陽(yáng).連續(xù)雙向拍賣(mài)市場(chǎng)中的一種自適應(yīng)競(jìng)價(jià)策略研究[J].南京大學(xué)學(xué)報(bào),2015.51(2)
[13]RAJARSHI DAS,JAMES E HANSON,JEFFREY O KEPHART,et al.Agent-human interactions in the continuous double auction[C]//International Joint Conference on Artificial Intelligence.2001.17:1169–1178.
[14]MARCO DE LUCA,DAVE CLIFF.Human-agent auction interactions: Adaptive-aggressive agents do Minate[C]//Proceedings of the Twenty-Second international joint conference on Artificial Intelligence.2011.1:178–185.
[15]M DE LUCA,C SZOSTEK,J CARTLIDGE,et al.Studies on interactions between human traders and Algorithmic Trading Systems[J].UK Government Foresight Project,2011.
[16]JOHN CARTLIDGE,CHARLOTTE SZOSTEK,MARCO DE LUCA,et al.Too Fast Too Furious Faster Financial-market Trading Agents Can Give Less Efficient Markets[C]//ICAART,(2)2012:126–135.
[17]VERNON L SMITH.An experimental study of competitive market behavior[J].The Journal of Political Economy,1962.70(2):111–137.
[18]VERNON L SMITH.Experimental economics: Induced value theory[J].The American Economic Review,1976.66(2):274–279.
[19]M.He,H.F.Leung,N.R.Jennings,A fuzzy logic based bidding strategy for autonomous agents in continuous double auctions,IEEE Transactions on Knowledge and Data Engineering 15(6)(2003)1345–1363.
[20]J.Nicolaisen,V.Petrov,L.Tesfatsion,Market power and efficiency in a computational electricity market with discriminatory double-auction pricing,IEEE Transactions on Evolutionary Computation 5(5)(2001) 504–523.
[21]S.Phelps,S.Parsons,P.McBurney,An evolutionary game-theoretic comparision of two double auction market designs,in:Proc.Sixth Workshop on Agent Mediated Electronic Commerce,2004,pp.192–198
作者簡(jiǎn)介:曹陽(yáng),1995,男,漢,四川,碩士,武漢大學(xué),實(shí)驗(yàn)經(jīng)濟(jì)學(xué) 4430072。