吳瓊 趙春生

摘 要:風險投資,又可以理解為創業投資,是初創企業開始發展并進入正軌的一種重要融資方式。風險投資的成功與否與企業環境、財務、管理、市場、技術等密切相關。在此背景下,本文講述了如何利用線性Logistic回歸方法和非線性粒子群神經網絡算法分析影響投資成敗的一系列因素,并對其進行評估。
關鍵詞:風險投資;主成分分析;Logistic回歸神經網絡;粒子群
1 緒論
風險投資,或稱為風險資本、創業資本,是指以股權、準股權或具有附帶條件的債權形式投資于新穎、未經試用技術項目或未來具有高度不確定性的項目,并愿意為所投資的項目或企業提供管理或經營服務,期望通過項目的高成長率并最終以某種方式出售產權以取得高額中長期收益的一種投資方式[1]。
相比于國外,國內的風險投資起步相對較晚。在20世紀40年代,風險投資開始于美國硅谷[2]。與根深蒂固的交易方式不同,風險投資不是類似于各種財產的抵押交換,而是直接將資金與所投資公司的股權交易,即資金多少直接與企業股權占有量成比,所以,投資人在進行投資時,會對投資公司的背景文化、運營方式、效益等多方面進行考察選擇,最終確定投資。可見,投資是具有一定風險的,綜合評估投資企業對投資成功具有重要意義。風險投資具有高風險、高收益的特點,所以,只有少部分精通投資的人會涉足這一領域,而且風險投資對象大多是涉及通信、半導體等的新興高科技企業。
當代社會,科技迅猛發展,隨之而來的,是企業的發展與社會的進步。對于企業來講,只有將技術和創新擺在首位,才能為企業的長遠發展提供保障。同樣的,長久利益是企業吸引風險投資的必備優勢,所以,風險投資的產生與運營將會帶動企業的創新和發展,從而促進經濟發展和社會進步。可見,風險投資對于整個社會的進步有一定的推動作用。
2 理論基礎
2.1 粒子群算法理論
群體活動往往表現出智能性,而且智能仿生技術在解決實際問題中越來越受到青睞。粒子群算法(PSO)是一種典型的群體智能優化算法,由Eberhart博士和Kennedy博士在1995年提出,并受到了很大關注。粒子群算法來源于鳥群的捕食行為,利用群體中個體之間信息的共享,從而實現群體的無序到有序的行為轉變,并最終完成整個問題。
在利用粒子群算法進行求解問題時,首先對定義的一群粒子進行初始化,包括位置、速度和適應度值三個量,在求解過程中,每一個粒子都是潛在的最優解,設定適應度值函數用來計算每個粒子的適應度值,其大小代表了粒子的優劣。在粒子運動過程中,通過比較每個粒子或其本身所經歷的適應度值,尋找粒子群的個體極值和群體極值,即個體所經歷的最大適應度函數的位置為個體極值,所有粒子中的最大適應度值個體為群體極值。再通過不斷更新粒子的位置和適應度值,來尋找最優解。
2.2 BP神經網絡算法理論
前饋神經網絡的算法中,反向傳播(BP)算法是最基本的算法,也是應用較為普遍的算法。所謂反向傳播,是指將神經網絡訓練中的誤差從輸出層反向推導至隱含層、輸入層,以使誤差逐漸減小為原則,調整網絡各層的連接權值和閾值。
BP算法的缺點是在學習過程中采用的是非線性梯度優化算法,存在局部極小問題,學習算法收斂速度慢,迭代次數多,學習步長的選取造成穩定性變化。因此,我們通常會用到改進的BP算法,如用粒子群算法來優化BP算法。
傳統的BP神經網絡采用誤差反向傳播來調整網絡連接權值,該方法容易陷入局部最優解,而PSO算法可以在更大的空間內搜索,在一定程度上避免了以上問題。所以,將PSO算法應用于BP神經網絡的網絡權值優化。從而更好實現全局尋優問題。
將神經網絡各層的連接權值編碼成粒子,適應度值則為使用該組權值時的網絡輸出均方誤差,利用之前描述的粒子群算法,在預設的迭代次數內搜索最優的網絡權值。
3 投資風險評估
風險投資公司在對風險進行識別的過程中更多地是利用在以往的項目開發中的經驗,以及累積和整理的風險投資行業的經驗和教訓對風險進行識別,在這一過程中,風險投資公司會首先查看風險企業的歷史資料,如,索賠記錄、其他風險信息等,對企業信譽進行考察;其次查看風險企業近期財務報表,對企業近幾年的銷售收入、利潤增長率、凈利潤、凈資產收益率進行了解;再次對企業進行實地考察,對風險企業進行全面考察,最后由參與項目的人員進行討論。
風險投資公司目前在對風險進行識別時重點對環境、技術、財務、市場和管理等6個風險因素進行了關注,具體如下表所示。
3.1 樣本選擇與數據處理
首先對各個公司收集的以上歷史數據進行處理,如果數據量太小,而且多列數據存在不同程度的缺失,如果因為某個數據缺失而刪除整行會導致大量重要信息丟失,所以在原始數據較少的情況下,不能剔除缺失值所在行,所以需要進行缺失值處理。所以,首先對整體數據進行分析,然后用SPSS軟件對缺失值進行填補,最后利用EXCEL對每列數據進行歸一化標準處理,從而可以進行建模分析。
3.2 相關性分析
首先運用SPSS軟件進行主成分分析,可以得到各個指標的相關性排序,并能得到相關性排名靠前的指標,例如:市場需求強度、市場推廣和擴張能力主流化、凈利率預估、管理類別好1中2差3、目前收入可持續程度、樣品準備時間、發展路線圖的詳細度、資產需求指數、輕資產0為真位于前9位,然后對這9個主變量進行線性Logistic回歸分析和非線性粒子群神經網絡處理,從而建立風險評估的線性和非線性模型。
3.3 風險評估模型
3.3.1 線性logistic回歸
在logistic回歸分析中,回歸系數的估計方法通常是最大似然法。最大似然法就是選取使得總體真參數落在樣本觀察值領域里的概率達到最大的參數值作為真參數的估計值。為了得到一個非偏估計,需采用重遞推的方法,將最大似然估計值不斷修正。軟件系統使用的是重復加權最小二乘遞推法來估計回歸系數。對這9個主變量進行線性Logistic回歸分析,結合分析結果可以建立一種線性關系:z=a0+a1x1+a2x2+…+a9x9,并將此關系式代入p(y)=11+e-z,從而可以對因變量的發生概率進行預測,即p(y)值越大,代表投資成功率越大。
3.3.2 非線性粒子群神經網絡
粒子群BP神經網絡分為三層,分別是輸入層、隱含層和輸出層。其中輸入層的數據為前面選取的排名前9的指標,分別是市場需求強度、凈利率預估、資產需求指數、對市場的細分程度、市場發育、市場推廣和擴張能力、發展路線圖的詳細程度、樣品準備時間、制度化管理能力。
設定隱含層個數,輸出為合并的結果,也就是1代表投資成功,0代表投資失敗。通過訓練收集的歷史數據來訓練粒子群神經網絡模型,建立各項指標與輸出的一種非線性映射關系,從而根據最新數據,利用優化的非線性模型得到企業投資成功的概率。從中分析得出企業獲得成功投資的概率越高,投資風險也就越小。
線性logistic回歸和粒子群神經網絡是對數據進行擬合的線性和非線性方法,在數據處理和預測中具有重要作用,兩者都可以對數據進行擬合,適用于不同的數據類型,各有千秋,需要根據實際數據和場景進行選擇和比較。
4 結論
本文從線性系統角度構建了基于Logistic回歸的風險評估模型,從非線性角度構建了基于粒子群優化的BP神經網絡模型,從而可以評估各企業的投資風險。線性Logistic回歸模型,易受極端變量影響,需要建立長期的報告,檢測機制操作較為復雜,但是易于理解和實行。非線性的粒子群優化的BP神經網絡模型同樣也容易受到極端變量的影響,并且對訓練樣本有著嚴格的要求,對于訓練樣本和測試樣本的分類個數也會影響模型的準確度。但是它的計算精度比較高,只要定期更新訓練數據,就可以構建穩健的評估模型。
綜上所述,通過線性和非線性兩種方法對收集的數據進行處理,可以對投資風險進行全面的評估,有利于投資人基于公司歷史表現數據評估投資風險,具有非常重要的現實應用意義。
參考文獻:
[1]郭占力.中國風險投資發展研究[D].黑龍江:哈爾濱工程大學,2015.5.
[2]成思危.科技風險投資論文集.北京:民主與建設出版,1997.
[3]施祖麟,韓岱峰.美國風險投資業發展及促進高技術產業化的啟示.科技導報,1988(11).