王元元
主動(dòng)刪除的疑似侵權(quán)鏈接中,97%一上線即被封殺;24萬(wàn)個(gè)淘寶疑似侵權(quán)店鋪被關(guān);協(xié)助司法機(jī)關(guān)抓捕制假售假涉案人員1606名,搗毀窩點(diǎn)1328個(gè);全平臺(tái)的知識(shí)產(chǎn)權(quán)侵權(quán)投訴量下降了42%。
這是2017年阿里巴巴集團(tuán)在知識(shí)產(chǎn)權(quán)保護(hù)方面交出的成績(jī)單。
“假貨及侵權(quán)處罰時(shí)間縮短、權(quán)利人投訴量下降、網(wǎng)絡(luò)售假問(wèn)題得到顯著遏制。”阿里巴巴集團(tuán)首席平臺(tái)治理官鄭俊芳在接受《瞭望東方周刊》采訪時(shí)說(shuō)。

“借助數(shù)據(jù)技術(shù),阿里巴巴既能對(duì)疑似假貨或者侵權(quán)鏈接、售假人員及團(tuán)伙進(jìn)行識(shí)別,又能在售假者開(kāi)店、商品發(fā)布等環(huán)節(jié)實(shí)施攔截,還能對(duì)每天發(fā)布在平臺(tái)上的大量商品作風(fēng)險(xiǎn)判定并由此作出相應(yīng)處理。”鄭俊芳告訴本刊記者。
而這背后是數(shù)年來(lái)阿里巴巴在技術(shù)方面的持續(xù)投入。
“我剛來(lái)的時(shí)候,負(fù)責(zé)打假技術(shù)研發(fā)的工程師還比較少,現(xiàn)在這個(gè)團(tuán)隊(duì)已有數(shù)百人。”阿里巴巴集團(tuán)(以下簡(jiǎn)稱阿里巴巴)平臺(tái)治理部總監(jiān)徐駿對(duì)《瞭望東方周刊》說(shuō)。
“眾所周知,阿里巴巴是一家技術(shù)驅(qū)動(dòng)型公司,一直都非常注重技術(shù)研發(fā),我們?cè)诖蚣僦袘?yīng)用的很多技術(shù)就是來(lái)源于本身的技術(shù)積累,并非獨(dú)創(chuàng)。”鄭俊芳告訴本刊記者,最具代表性的就是圖像識(shí)別技術(shù)。
起初,圖像識(shí)別技術(shù)多用在“同款聚合”功能上,即通過(guò)識(shí)別圖片信息的相似度為用戶推薦同類型的消費(fèi)商品,定制個(gè)性化的消費(fèi)頁(yè)面。
但一些售假者卻通過(guò)盜用品牌商的圖片給自己的假貨作宣傳,吸引消費(fèi)者。于是,阿里巴巴平臺(tái)治理部的技術(shù)團(tuán)隊(duì)開(kāi)始針對(duì)打假的特定場(chǎng)景對(duì)原有的圖像識(shí)別技術(shù)進(jìn)行改造,讓后者具備辨別真假的能力。
從2013年起,阿里巴巴逐步建立起了全球最專業(yè)的圖片侵權(quán)假貨識(shí)別系統(tǒng),通過(guò)檢測(cè)圖片中的局部logo,來(lái)識(shí)別圖片中商品的品牌,進(jìn)而判斷該商品是否為假貨,識(shí)別能力甚至超過(guò)了國(guó)外同類圖片偵測(cè)軟件Google Goggles。
然而,售假者為了躲避平臺(tái)的偵測(cè),不再在商品描述中植入品牌信息,而把一些違法信息或聯(lián)系方式在圖片上進(jìn)行標(biāo)注。
如此一來(lái),僅靠識(shí)別logo的技術(shù)就不夠了。技術(shù)團(tuán)隊(duì)的解決方案是,引入OCR光學(xué)字符識(shí)別技術(shù),進(jìn)一步擴(kuò)大圖像識(shí)別涵蓋的范圍。
OCR的最大特點(diǎn)是能夠?qū)崟r(shí)讀取圖片中包含的文字信息,每秒可掃描2354萬(wàn)多個(gè)圖片文字,相當(dāng)于501本《康熙字典》的字量,且能保證高達(dá)97.6%的識(shí)別準(zhǔn)確率。
“即便售假者故意將圖片中的文字模糊化處理,OCR技術(shù)也能精準(zhǔn)識(shí)別。”徐駿告訴本刊記者。
目前OCR已廣泛應(yīng)用到打假中,而其背后的圖像識(shí)別技術(shù)更因每日識(shí)別約6億張商品圖片被視為阿里巴巴的“火眼金睛”。
不過(guò),認(rèn)出圖片中的文字只是第一步,還需讓后臺(tái)的監(jiān)控系統(tǒng)知道這些文字所代表的含義,以此來(lái)判斷產(chǎn)品是否真的侵權(quán),這便催生了語(yǔ)義識(shí)別算法。語(yǔ)義識(shí)別算法是在OCR識(shí)別文字的基礎(chǔ)之上,對(duì)文字進(jìn)行語(yǔ)法和詞法分析,提取出語(yǔ)義要點(diǎn),讀出文字代表的真正含義。
以手機(jī)為例,一些手機(jī)經(jīng)銷商會(huì)刻意在圖片中打出“運(yùn)行速度堪比蘋果”“待機(jī)時(shí)間遠(yuǎn)超蘋果”等字樣吸引用戶,語(yǔ)義識(shí)別算法通過(guò)復(fù)雜的語(yǔ)言比對(duì),能辨別出這些詞句并不代表產(chǎn)品造假,只是一種宣傳用語(yǔ)。
“這就起到了過(guò)濾作用,排除了無(wú)關(guān)商品的造假嫌疑,極大地降低了系統(tǒng)的誤判率,使我們能夠更為精準(zhǔn)地找到并攔截售假者。”徐駿說(shuō)。
但在阿里巴巴平臺(tái)治理部資深總監(jiān)錢磊看來(lái),這還遠(yuǎn)遠(yuǎn)不夠,“無(wú)論圖像識(shí)別還是語(yǔ)義識(shí)別,針對(duì)的僅僅是平臺(tái)商品的某一特征,阿里巴巴需要在更廣、更深的緯度實(shí)現(xiàn)對(duì)售假店鋪以及假貨的全面管控。”

因此,在圖像識(shí)別技術(shù)和語(yǔ)義識(shí)別算法的基礎(chǔ)上,建立一個(gè)類似人腦運(yùn)作模式的高度智能化“商品大腦”成為技術(shù)團(tuán)隊(duì)的最終選擇。在錢磊的構(gòu)想中,這個(gè)“商品大腦”會(huì)囊括多種單項(xiàng)技術(shù)、覆蓋盡可能豐富的產(chǎn)品信息,作出自主判斷。
“人類大腦是基于長(zhǎng)期的知識(shí)積累形成經(jīng)驗(yàn)和認(rèn)知后,據(jù)此對(duì)不同事物作出不同的反應(yīng)。‘商品大腦也是如此,首先要具備豐富的知識(shí)儲(chǔ)備,才能對(duì)商品進(jìn)行真假識(shí)別。”錢磊告訴《瞭望東方周刊》。
自成立起,阿里巴巴便通過(guò)后臺(tái)復(fù)雜、嚴(yán)密的管理系統(tǒng)掌握了店鋪和商品的信息,經(jīng)過(guò)18年的沉淀,已形成了體量龐大的商品數(shù)據(jù)庫(kù)。
即便如此,“商品大腦”要準(zhǔn)確記住數(shù)以億計(jì)的繁雜信息也并非易事。
阿里巴巴找到的突破口是分類記憶——先讓機(jī)器掌握結(jié)構(gòu)化的知識(shí)點(diǎn),如商品的類目、條碼、品牌、價(jià)格等,然后再嘗試補(bǔ)充用戶的使用評(píng)價(jià)、社交媒體的評(píng)論等非結(jié)構(gòu)化信息。
“商品大腦”還需記憶商品的關(guān)聯(lián)信息。比如LV,“商品大腦”在知道正確的商品名稱外,還要牢記售假者慣用的“綠牌”“驢牌”等品牌名稱的同音詞或同義詞。
“如果‘商品大腦只記憶了單一的商品信息是很難識(shí)破這種騙術(shù)的,必須掌握更多的關(guān)聯(lián)信息才能作出正確判斷。”徐駿說(shuō),單個(gè)知識(shí)點(diǎn)只有相互聯(lián)系起來(lái)才能為商品的真假判別提供更大借鑒意義。
這樣一來(lái),“商品大腦”便能由淺入深,更為快速、高效地掌握盡可能全面的商品信息,并且具備一定的學(xué)習(xí)能力,源源不斷地吸收新知識(shí),保證不被售假者超越。
目前阿里巴巴“商品大腦”內(nèi)容的豐富度已達(dá)到百萬(wàn)億條實(shí)體信息加上百萬(wàn)億條關(guān)聯(lián)信息。這些多維度的產(chǎn)品信息搭配上圖像識(shí)別、語(yǔ)義識(shí)別等前端科技,“商品大腦”便可像人腦一樣自動(dòng)對(duì)阿里巴巴平臺(tái)上近20億件商品進(jìn)行全天候、無(wú)死角的掃描,一旦發(fā)現(xiàn)售假就會(huì)即時(shí)對(duì)店鋪?zhàn)鞒鲫P(guān)店、下架產(chǎn)品等處理。
“‘商品大腦構(gòu)筑了一面強(qiáng)大的防護(hù)網(wǎng),讓那些售假者進(jìn)入不了阿里巴巴的平臺(tái),只要露面就會(huì)被一網(wǎng)打盡。”錢磊說(shuō)。
“其實(shí),圖片識(shí)別、語(yǔ)義識(shí)別乃至于‘商品大腦都只代表了科技打假的一部分,并非全部。”錢磊說(shuō),阿里巴巴每年都要投入數(shù)百名工程師,數(shù)億元資金用于打假技術(shù)的研發(fā),目前已構(gòu)建了多種技術(shù)手段相結(jié)合的打假技術(shù)體系。
這個(gè)體系除了上述三種打假“黑科技”外,還包括生物實(shí)人認(rèn)證、政企數(shù)據(jù)協(xié)同平臺(tái)、大數(shù)據(jù)抽檢模型等,管控范圍覆蓋商品上架、售賣、下架的全過(guò)程,可做到實(shí)時(shí)掃描每一件新發(fā)布的商品。
嚴(yán)密的防控讓品牌商們松了一口氣。康寶萊(中國(guó))保健品有限公司合規(guī)部高級(jí)總監(jiān)舒亞杰告訴《瞭望東方周刊》,康寶萊在阿里巴巴的幫助下,借助其打假科技,僅用一個(gè)月便完成了兩個(gè)省的打假行動(dòng),協(xié)助警方抓捕了26人。
對(duì)身處打假第一線的警務(wù)人員來(lái)說(shuō),阿里巴巴打假技術(shù)帶來(lái)的影響更大。
“以往警方收集制假售假線索只能一條條收集,耗時(shí)費(fèi)力,現(xiàn)在一個(gè)月之內(nèi),通過(guò)技術(shù)研判就可批量產(chǎn)出幾百條線索,還能對(duì)涉假行業(yè)的網(wǎng)店實(shí)行數(shù)據(jù)溯源。” 浙江省公安廳經(jīng)偵總隊(duì)知識(shí)產(chǎn)權(quán)保護(hù)副支隊(duì)長(zhǎng)陳競(jìng)凱對(duì)本刊記者說(shuō)。
不過(guò),無(wú)論徐駿還是錢磊都坦承,技術(shù)打假并非萬(wàn)無(wú)一失,也存在些許誤差,“技術(shù)手段多通過(guò)大量的數(shù)據(jù)對(duì)比來(lái)找出并攔截假貨,但對(duì)比結(jié)果不可能保證100%準(zhǔn)確。”
阿里巴巴為此在技術(shù)后端設(shè)計(jì)了二次審核。對(duì)那些疑似售假的店鋪,打假團(tuán)隊(duì)會(huì)立刻進(jìn)行更為細(xì)致的審查,接受賣家的申述,如果審查后發(fā)現(xiàn)店鋪并未涉假,便會(huì)解除其店鋪屏蔽。
“我們的原則是不放過(guò)任何一個(gè)售假的店鋪,也不冤枉任何一個(gè)守法的店鋪。”徐駿說(shuō),這就要求阿里巴巴必須根據(jù)自身掌握的售假信息對(duì)打假技術(shù)進(jìn)行動(dòng)態(tài)調(diào)整。
實(shí)際上,阿里巴巴對(duì)技術(shù)的調(diào)整時(shí)刻都在進(jìn)行,不僅要打磨適用于不同場(chǎng)景的通用技術(shù),還要集合執(zhí)法機(jī)關(guān)的研判知識(shí)和消費(fèi)者的反饋,深耕專有打假場(chǎng)景,作特有技術(shù)的優(yōu)化。
據(jù)了解,阿里巴巴未來(lái)會(huì)將資源投入到更具前瞻性的領(lǐng)域,例如構(gòu)建假貨風(fēng)險(xiǎn)預(yù)警系統(tǒng),提前預(yù)知哪些品牌、商品會(huì)被假冒,然后制定相應(yīng)的攔截策略。
“阿里巴巴在打假上的終極目標(biāo)是無(wú)假可打,這就代表著打假科技的演進(jìn)也將相伴而行,直到假貨無(wú)跡可尋。”鄭俊芳表示。