
當(dāng)大數(shù)據(jù)與人工智能時代即將到來之際,我們該如何擁抱時代?
6月11日,曾與屠呦呦等人一同當(dāng)選“2015年度中國十大科技創(chuàng)新人物”的電子科技大學(xué)周濤教授,在西南財經(jīng)大學(xué)召開了主題為“大數(shù)據(jù)與人工智能創(chuàng)新實(shí)踐”的公開論壇。周濤教授以實(shí)操的大數(shù)據(jù)項目為例,為聽眾講述了最前沿的大數(shù)據(jù)創(chuàng)新實(shí)踐情況。以下內(nèi)容經(jīng)《商界評論》現(xiàn)場實(shí)錄整理及其歷史演講補(bǔ)充。
在開始前,我想問大家的一個問題:什么是數(shù)據(jù)?
多數(shù)人認(rèn)為,有了計算機(jī)之后才有數(shù)據(jù),其實(shí)早在計算機(jī)之前我們就有了數(shù)據(jù)。
我們認(rèn)為,數(shù)據(jù)就是將來可以為我們做定量分析的記錄。它是事實(shí)或觀察的結(jié)果,是對客觀事物的邏輯歸納,是用于表示客觀事物的未經(jīng)加工的原始素材。
在淘寶上,有大量的售賣記錄,通過這些售賣記錄我們能夠知道,生活在成都的30歲左右的女性用什么化妝品,成都獨(dú)特的天氣情況使她所用的化妝品和其他省市的不一樣,這是挖掘到的數(shù)據(jù)。
但是,有了這些數(shù)據(jù)不等于就具有價值,我們還要通過數(shù)字廣告、個性化推薦等方式,幫助用戶更快找到喜愛的商品,同時也幫助商家提高廣告點(diǎn)擊量和商品購買量,減少庫存壓力,這樣才能產(chǎn)生價值。
現(xiàn)在我們已經(jīng)站在了大數(shù)據(jù)時代的門口,其中一只腳已經(jīng)跨了進(jìn)去,并且有3種趨勢在推動我們的發(fā)展:
一是數(shù)據(jù)總量的增長。
現(xiàn)在全世界數(shù)據(jù)存儲量是20個ZB,再過8年這個數(shù)據(jù)量可能要增加10倍。
2018年底,淘寶的單品數(shù)首次超過了中國的人口數(shù),單品數(shù)量達(dá)到了15億之多。面對這15億個單品,別說用戶想逐個挑選,僅僅只是看一遍都很難,這種數(shù)據(jù)爆炸和普通人分辨數(shù)據(jù)能力的矛盾是大數(shù)據(jù)時代的第一個挑戰(zhàn)。
因此,現(xiàn)在大量的商業(yè)模式都是為了解決這個矛盾,比如當(dāng)當(dāng)網(wǎng)推薦一本書,網(wǎng)易云音樂推薦一首歌,或者珍愛網(wǎng)推薦一個相親對象。
二是數(shù)據(jù)形態(tài)發(fā)生了巨大變化。
以前我們處理的絕大部分?jǐn)?shù)據(jù)都是表格類數(shù)據(jù),現(xiàn)在絕大部分新增數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),包括認(rèn)知、時間、序列、語音、文本、圖像、空間軌跡、人與人之間的社交網(wǎng)絡(luò),這些數(shù)據(jù)背后蘊(yùn)藏著巨大的價值。
手機(jī)是最大的個人傳感器,僅僅利用手機(jī)的GPS軌跡數(shù)據(jù),就可以定位用戶具體位置,甚至鎖定不超3立方米的空間范圍。憑借這點(diǎn),我們可以知道一個陌生人的家住在哪里,其是否在政府工作,經(jīng)常在哪里吃飯,有沒有去過高級會所等。
這些數(shù)據(jù)的保護(hù)在很多地方都不嚴(yán)密,除了手機(jī)運(yùn)營商和通管局之外,許多手機(jī)應(yīng)用上都有用戶的全量軌跡數(shù)據(jù),這帶來了第二個挑戰(zhàn),就是在安全隱私可控的前提下如何挖掘這些非結(jié)構(gòu)數(shù)據(jù)的價值。
三是數(shù)據(jù)的組織結(jié)構(gòu)發(fā)生變化。
原來的數(shù)據(jù)都是孤島,淘寶知道我買了什么貨,新浪微博知道我說了什么話,門診知道我得了什么病,公安部門知道我犯了什么罪,但是這些主體相互之間卻不知道,淘寶不知道我得了什么病,新浪微博不知道我犯了什么罪。
把數(shù)據(jù)流動,從而圍繞個人、企業(yè)、產(chǎn)品、終端、痛點(diǎn)全方位畫像,這也帶來了第三個挑戰(zhàn),就是如何發(fā)揮大數(shù)據(jù)1+1遠(yuǎn)大于2的價值。
當(dāng)有一天我們真正進(jìn)入到大數(shù)據(jù)時代,可以明顯體會到數(shù)據(jù)的3大特征:
一是數(shù)據(jù)的外部化。數(shù)據(jù)有一個天然的共性,就是它能夠流通共享,容易被拷貝,且?guī)缀醪恍枰渌杀尽N覀冊贏處產(chǎn)生的數(shù)據(jù)不僅能在A處發(fā)揮作用,還能在BCD處發(fā)揮作用。
二是人工智能。我們能夠用到人工智能的關(guān)鍵技術(shù),比如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等,去得到簡單統(tǒng)計分析所得不到的洞見,再用這種深刻洞見來指導(dǎo)我們進(jìn)行高效準(zhǔn)確的決策。

三是價值。采集數(shù)據(jù)、存儲管理、安全隱私控制都需要成本,大數(shù)據(jù)時代中,每花費(fèi)100元就要產(chǎn)生200元以上的數(shù)據(jù)價值。
其中數(shù)據(jù)能夠產(chǎn)生4個價值:支撐決策、優(yōu)化生產(chǎn)、提升銷售和改善生活。
接下來我們通過2個大數(shù)據(jù)應(yīng)用的實(shí)踐案例,來看看目前數(shù)據(jù)能為我們產(chǎn)生哪些價值。
第一,基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)在餐飲業(yè)的應(yīng)用。
現(xiàn)在的網(wǎng)絡(luò)餐飲服務(wù)存在大量的食品安全問題,比如用戶在某網(wǎng)絡(luò)訂餐平臺的餐飲店A訂餐,而實(shí)際制作食物的并不是A店,而是一家黑作坊,沒有店面,更沒有證照,存在嚴(yán)重的食品安全問題。
為了解決這個問題,我們用機(jī)器學(xué)習(xí)的方式,制定了網(wǎng)絡(luò)餐飲服務(wù)的監(jiān)管辦法,主要解決兩大問題。
1. 我們要對網(wǎng)絡(luò)餐飲店的證照進(jìn)行分析,針對這個問題首先要判斷餐飲店有沒有上傳證照,隨時監(jiān)控哪些餐飲店是沒有上傳的,并把它清理出來。
然后,識別證照不清晰、假證、一證多用、證件和工商注冊不匹配、跨范圍經(jīng)營的餐飲店。通過機(jī)器學(xué)習(xí),計算機(jī)能夠自動迅速、準(zhǔn)確地識別出這些有問題的餐飲店。
基于這一步,我們發(fā)現(xiàn)成都市不合格的網(wǎng)絡(luò)餐飲店大概占70%,通過持續(xù)監(jiān)測和整改,把不合格率降到了30%。
2. 我們要解決的根本問題是要老百姓吃到放心安全的食品。
我們獲取餐飲店的消費(fèi)者評論的數(shù)據(jù),并且把當(dāng)中和食品安全強(qiáng)相關(guān)的數(shù)據(jù)來指導(dǎo)機(jī)器學(xué)習(xí),進(jìn)而對餐飲店進(jìn)行監(jiān)測。
如果監(jiān)測到某餐飲店有大量的有關(guān)食品安全的評價,比如有蟑螂、老鼠、吃了拉肚子等,那么這家店就肯定有問題。
第二,大數(shù)據(jù)在工業(yè)領(lǐng)域的應(yīng)用。
全球工業(yè)4.0大概經(jīng)歷4個階段,從機(jī)械化到自動化到信息化再到智能化。在未來會形成智能工廠,就等于一個智能中臺,可以分成可視化層、執(zhí)行層、工業(yè)大數(shù)據(jù)層、設(shè)備局連接層。
刀具加工工藝(如銑、削、鉆)在汽車、飛機(jī)和模具制造中應(yīng)用廣泛。如富士康,每年用在刀具上大概150億元。這種背景下,刀具何時失效,如何判定成為降低企業(yè)成本的大問題。
刀具在加工過程中隨著加工時間的增加,自身的磨損程度也隨之增加。當(dāng)磨損量達(dá)到一定程度時,甚至還會出現(xiàn)斷刀、崩邊等嚴(yán)重磨損現(xiàn)象,進(jìn)而導(dǎo)致刀具失效。在缺乏有效的刀具磨損監(jiān)控、預(yù)測方法時,刀具磨損不但會增加生產(chǎn)產(chǎn)品的次品率,同時也會給安全生產(chǎn)造成隱患。
目前大多數(shù)刀具供應(yīng)商對生產(chǎn)出的刀具壽命進(jìn)行如下估計:對刀具進(jìn)行壓力測試,測出刀具平均極限壽命,在此極限壽命基礎(chǔ)之上,一般按照80%比例折算成刀具壽命。
如果使用單位依照刀具供應(yīng)商提供的建議進(jìn)行刀具管理,每把刀將損失約20%的壽命。
再加上測試環(huán)境的不同,刀具供應(yīng)商提供的刀具壽命還會進(jìn)一步受到實(shí)際工況的影響,其參考性進(jìn)一步降低。
我們在數(shù)控機(jī)床的電纜上加一個霍爾傳感器,利用霍爾效率來測微電流,電流信號經(jīng)數(shù)據(jù)采集器(DAQ)傳送至工控機(jī)。
有條件的情況下,可以通過高速攝像頭采集刀具的圖像信號;通過數(shù)控機(jī)床自帶或侵入式的傳感設(shè)備,采集壓力、振動、熱度、聲音等其他信息。
工控機(jī)持續(xù)不斷地接收來自數(shù)據(jù)采集器的電流信號,能夠?qū)Σ煌瑱C(jī)床的實(shí)時信號進(jìn)行監(jiān)控、分析和預(yù)測,并在必要時發(fā)出報警信號或其他輔助信號,如向自動換刀系統(tǒng)發(fā)送換刀信號。
以常州某科技公司為例,其近千臺機(jī)床制造手機(jī)殼,每臺機(jī)床每年消耗5 000把銑削刀具,每年累計消耗近500萬把。我們通過檢測銑削電流的稀疏貝葉斯學(xué)習(xí),對每把銑刀的壽命進(jìn)行預(yù)測,每年可為其節(jié)省約1億元。
未來許多崗位或許會被機(jī)器人取代,比如法務(wù)工作人員、會計師、檢驗科醫(yī)生等。
這些工作理論上都可借助機(jī)器的深度學(xué)習(xí)算法完成,但要完全實(shí)現(xiàn)卻沒有理論上這么簡單。
現(xiàn)在大家看到很多工業(yè)大數(shù)據(jù),實(shí)際上只是做了一些信息化的統(tǒng)計展示,并不是真正意義上的數(shù)據(jù)化。我們現(xiàn)在很多數(shù)據(jù)工廠項目都沒有太大的實(shí)際價值,無法為工業(yè)、生產(chǎn)提供實(shí)際性效率提升,還處于初級階段。未來下一步就是怎么再往前走一步,提高生產(chǎn)效率,把產(chǎn)品做好。
對于金融行業(yè)來說也是如此,我們要深化金融改革,加強(qiáng)金融監(jiān)管,科學(xué)防范風(fēng)險,管理好3大系統(tǒng):
1. 信用。首先,建立信用體系。沒有信用記錄的企業(yè)和項目,用自動化大數(shù)據(jù)的方式建立可靠的金融記錄。
其次,交叉驗證。有信用記錄的企業(yè)和項目,利用智能化的建模方式進(jìn)行交叉驗證、自動化、非人工地驗證信用質(zhì)量。
2. 風(fēng)險。傳統(tǒng)風(fēng)控的痛點(diǎn)是:成本高、靜態(tài)化、主觀判斷。
金融的核心風(fēng)險是:信用風(fēng)險、市場風(fēng)險、操作風(fēng)險。
而信用風(fēng)險管理能力、信用風(fēng)險成本是影響資產(chǎn)價格和利率的基礎(chǔ)。
3. 共識。金融風(fēng)險的管理框架未來可以視作一種基礎(chǔ)設(shè)施,形成國際化的信用共識。我們要做到自動化的信息采集與資產(chǎn)質(zhì)量評估、全息化的企業(yè)和項目畫像、動態(tài)的企業(yè)信用評價。
比如我們跟貴陽銀行合作項目——貴煙貸,在掌握市場進(jìn)銷存數(shù)據(jù)的基礎(chǔ)上,對供應(yīng)鏈做整體把控,通過風(fēng)險控制降低壞賬率,更是一年之內(nèi)讓貴陽本地經(jīng)銷商的拿貨量提高9%。
并且金融機(jī)構(gòu)還可以通過數(shù)據(jù)檢測來評估企業(yè)的經(jīng)營狀況。
假如申請信貸的企業(yè)是一家設(shè)備廠商,單純看市占率、營收規(guī)模無法全面評估信貸風(fēng)險。我們可以通過招聘網(wǎng)站上企業(yè)的招聘規(guī)模縮減,公司員工是否大規(guī)模更新簡歷,是否有行政處罰,招投標(biāo)成功率等企業(yè)行為數(shù)據(jù)分析,政府?dāng)?shù)據(jù)分析,銀行征信數(shù)據(jù)分析等,進(jìn)行綜合考量。