999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

群智創新社區領先用戶識別方法與應用研究*

2021-08-09 06:14:58單曉紅何強劉曉燕楊娟
科技促進發展 2021年3期
關鍵詞:用戶

■ 單曉紅 何強 劉曉燕 楊娟

北京工業大學經濟與管理學院 北京 100124

0 引言

開放式創新環境下,企業開展創新活動不僅依靠企業自身,也受外部環境影響[1],因而企業逐漸重視用戶體驗[2],將用戶作為其重要的外部創新來源[3]。領先用戶是在特定領域處于重要市場前沿地位(領先市場趨勢),并期望從滿足需求的解決方案中獲得高收益(高期望收益)的個人、群體或組織[4]。企業與領先用戶展開合作,可以了解市場的發展趨勢和需求變化,有助于企業完善產品的原型設計、縮短產品的開發周期,加速實現突破式創新,提升企業的核心競爭力[5-6]。

近年來,信息技術的快速發展為用戶參與企業創新提供了廣闊的平臺[7],國內外許多企業,如華為、小米、寶潔和戴爾等,通過構建群智創新社區[8]使用戶廣泛地參與企業創新。群智創新社區是基于互聯網和通信技術的網絡平臺,旨在將原本孤立、分散的用戶聚集起來,用戶之間通過分享和討論技術經驗、創意設計方案,可以加速知識的傳播,幫助企業解決技術或創新難題[9]。然而,不同用戶知識水平和技術經驗的不同使其創新能力存在較大差異,這便增加了企業開展社區用戶管理、選擇創新合作對象的難度[8]。相比于普通用戶,領先用戶擁有更強的市場預見性[10],他們的需求和偏好能夠引領市場,并且更熱衷于為產品創新提供幫助[11],可為開展企業創新活動提供決策支持。因此,如何準確地識別出群智創新社區中的領先用戶,確定領先用戶間的領先性差異,對于企業了解領先用戶特征、篩選合作對象意義重大。現有識別指標體系無法完整地反映出領先用戶特征,識別方法難以體現領先用戶差異,極大影響了企業對領先用戶的有效利用。國家基金委將有效利用領先用戶等外部資源視為技術供需對接需要解決的關鍵問題,本文是國家自科面上項目“異構信息網絡下技術供需匹配模型與對接路徑研究”的部分成果,給出了基于群智創新社區用戶行為數據和內容數據的識別領先用戶的方法,有效促進了技術供需匹配與對接。

1 相關研究

1.1 群智創新社區中領先用戶特征研究

領先市場趨勢和高期望收益是領先用戶的基本特征[10],近年來眾多學者對領先用戶的特征進行了深入研究和拓展,如表1所示,Lüthje、Belz 和Schreier 等學者認為領先用戶比普通用戶對產品的設計和開發更為了解,因而擁有豐富的專業知識和經驗。Lüthje、Füller 和Pajo等學者認為領先用戶能夠積極地參與產品體驗,并且與自己的期望作對比,提出相應的修改建議,因而擁有較高的創新積極性,此外,Jeppesen、Marchi 和Hau 等學者認為領先用戶能夠積極發表自己的創新建議并與其他用戶進行探討,表現出了較高的共享性。Franke、Morri‐son、Belz 和Kratzer 等學者認為領先用戶擁有著較強的創新能力,在相關的領域中,他們的社會威望較高,其觀點和建議能夠得到其他人的認可,極有可能成為群體中的意見領袖。

表1 領先用戶特征

1.2 群智創新社區中領先用戶識別研究

傳統的領先用戶識別方法包括群體篩選法和金字塔法[23]等,但這些方法多以問卷調查或者訪談法形式開展,需耗費較多的時間和成本,不適用于線上社區環境中,網絡志法[20]和眾包法[24]雖可用于線上創新社區中領先用戶識別,但仍是基于人工分析用戶數據,也存在著效率低、用戶識別準確性不高等問題。近幾年,國內外一些學者嘗試使用數據挖掘技術識別創新社區中的領先用戶,Sanjin Pajo[25]等提出了FLUID (Fast Lead User Identification)法,并以Twitter 中的用戶數據驗證了方法的有效性。葉三龍[26]通過構造屬性矩陣并利用加權平均法求出用戶的創新能力值,識別出了網上品牌社區中的領先用戶。王磊等[8]使用聚類算法劃分創新社區中的用戶,并對不同類別用戶的創新能力進行分析。李楠[27]提出一種基于改進的PROMETHEE 法進行創新社區中的領先用戶識別。付軾輝和焦媛媛等[28]從用戶語言風格的角度出發,探索使用成就需求、積極情緒、集體主義和未來導向等語言風格識別領先用戶的可行性。趙曉煜和孫福權[29]研究了樸素貝葉斯分類算法在識別創新社區中領先用戶上的應用。原欣偉和楊少華等[30]分析創新社區中用戶的特征,并結合網絡志法和隨機森林算法探索領先用戶識別。

現有研究為企業識別領先用戶提供了基礎,但仍存在以下不足:第一,現有研究多以領先市場趨勢和高收益期望兩項特征作為領先用戶的識別依據,沒有充分結合創新社區中用戶的行為數據和內容數據,使得識別指標體系構建不完整,影響了領先用戶識別效果。第二,多數識別方法都是基于分類算法,但分類過程中預先標注用戶類別易受人為因素干擾,進而影響識別結果的合理性。第三,識別出的領先用戶無法區分其領先性的差異,難以給企業提供更加有針對性的決策。

近年來,用戶排序研究在其他領域已經有了一定的基礎[31-34],這為分析群智創新社區中領先用戶的領先性差異提供了技術支持。因此,本文結合用戶行為數據和內容數據構建領先用戶識別指標體系,使用聚類算法識別出領先用戶并通過灰色關聯分析確定領先用戶的領先性排名,不僅完善了領先用戶識別指標體系,有助于提高領先用戶識別的準確率,也可以通過領先用戶排名更好地體現用戶領先性差異,從而為企業提供更加有意義的決策支持。

2 群智創新社區領先用戶識別指標體系構建及度量

2.1 群智創新社區領先用戶識別指標體系的構建

領先用戶識別指標是識別領先用戶的關鍵所在。群智創新社區中的用戶數據分為兩類,即表現用戶行為的行為數據和用戶發表主題帖子的內容數據。行為數據既包括發表帖子數量、評論帖子數量、在線時長、好友數等,也包括社區對用戶的獎勵回饋記錄,如積分、金幣數、等級數和貢獻值等數據,反映了用戶在社區中的活躍性、共享性和影響力。內容數據包括用戶發表的創新帖子、產品設計、話題討論和技術分享等,其內容包含文字、圖片和鏈接等,反映了用戶的創新性。本文在已有研究的基礎上,結合群智創新社區中用戶的特征,提出了基于活躍性、創新性、共享性和影響力4個維度的領先用戶識別指標體系,如表2所示。

表2 群智創新社區領先用戶識別指標

2.2 群智創新社區領先用戶識別指標體的度量

活躍性:總發帖量、簽到天數、在線時長等指標反映了參與用戶創新活動的活躍性水平。在線時間越長,發表帖子數量越多,表明用戶越愿意參與創新社區的活動,積極性越高。

創新性:精華帖子數量、熱門帖子數量、平均帖子質量系數、平均帖子內容得分等指標反映了用戶發表帖子內容的創新水平和專業水平,能夠表現出社區和用戶對帖子的認可程度,從而表現出用戶的創新能力、經驗和技術水平。

為了更好地反映用戶創新性,本文使用“平均帖子質量系數”和“平均帖子內容得分”兩項指標從行為數據和文本內容兩方面來綜合衡量用戶在一段時間內發表帖子所含創新性和專業性的整體水平,計算方法如公式(1-2)所示:

其中:Content_Scoreavg代表平均帖子內容得分,content_scorei代表用戶第i篇帖子的得分,Post_Qualityavg代表平均帖子質量系數,post_qualityi代表用戶第i篇帖子的質量系數,num_published代表用戶發表帖子總數。

帖子質量系數用于衡量帖子質量的好壞。創新社區中也存在內容質量一般但瀏覽量卻極高的帖子,如社區中的通知、公告等,瀏覽量高但回復數卻很少,原因是用戶的“從眾心理”使得他們去閱讀瀏覽量高的帖子,但瀏覽后卻發現帖子內容一般便很少對帖子進行評論,這類帖子有著極高的瀏覽量但內容質量卻很低,缺乏創新性和專業性。其計算方式如公式(3)所示:

其中,num_browsed代表帖子被瀏覽量,num_replied代表帖子被回復數量。

帖子內容得分反映了帖子價值的高低,得分越高表明帖子的價值越高。本文使用熵權法[30]分衡量帖子內容得分,首先將帖子文本進行分詞和去除停用詞處理,得到分詞列表,再從中篩選出能夠代表專業領域或知識的特征詞,計算特征詞的信息熵和權重,最終計算得到每篇帖子的得分,帖子內容得分具體計算過程如下:

從m篇處理后的用戶帖子中共篩選出n個特征詞,若第j個特征詞在第i篇用戶帖子中出現的頻率為xij,特征詞詞頻矩陣可表示為X=[xij]對詞頻矩陣進行無量綱化處理,處理過程如公式(4)所示:

其中:max(xj)為m篇用戶帖子中第j個特證詞的最大詞頻,min(xj)為m篇用戶帖子中第j個特證詞的最小詞頻。

其次,計算標準化后的詞頻矩陣中的每一項在每一列中的比重,計算方法如公式(5)所示:

計算每個特征詞的信息熵,計算方法如公式(6)所示:

計算每個特征詞的權重,計算方法如公式(7)所示:

最后,計算每篇帖子內容信息得分,計算方法如公式(8)所示:

共享性:好友數、發起討論次數量和總回帖量等指標能夠反映出用戶積極與其他用戶互動和交流的程度,衡量用戶是否積極與其他用戶進行知識共享及推動創新的能力。

影響力:用戶頭銜、總貢獻值和積分等指標能反映出用戶在群智創新社區中的個人威望和認可度,體現了用戶在社區中的影響力。

3 基于聚類算法的群智創新社區領先用戶識別方法

3.1 基于變異系數法的指標權重確定

根據上述指標構建過程可知,領先用戶和普通用戶在創新能力、專業知識等方面存在較大差異,因此在識別領先用戶前應賦予各項指標不同的權重,以進一步體現用戶間的差異,本文使用變異系數法[35],確定各項指標的權重,變異系數法是一種客觀賦權法,可充分利用數據的客觀信息對評價指標賦權,其基本思想為在評價指標體系中取值差異越大的指標,該指標的重要性就越高,越應該被重點關注,通過計算各項指標的變異系數來衡量各項指標取值的差異程度[36],具體計算過程如公式(9-10):

其中,Vi是第i項指標的變異系數,σi是第i項指標的標準差,是第i項指標的平均值,Wi是第i項指標的權重。

3.2 領先用戶識別

聚類算法屬于無監督學習算法,學習過程中無需標注數據,因而可以避免有監督學習算法在人為標注數據時所帶來的誤差。本文使用聚類算法識別群智創新社區中的領先用戶,聚類過程中根據用戶的不同特征對用戶類別進行判斷,將特征相似的用戶劃分到同一個群體中,而不同群體間的用戶特征差異較大,對比和分析不同用戶群體的用戶特征,以確定領先用戶所在群體。

凝聚層次聚類算法[37]實現較為簡單,并且無需預先設定聚類個數,可以發現類之間的層次關系,因此本文使用凝聚層次聚類算法識別領先用戶,算法的主要思想是將每個數據點作為一個初始聚類簇,每次迭代都尋找相似度最高的2 個類別進行合并,并不斷迭代合并的過程,直至分類數目達到預期設定的值,計算簇之間相似度有3 種方式,即最小相似度、最大相似度和平均相似度,計算方式如公式(11-13)所示[38-39],

其中,dmin(Ci,Cj)、dmax(Ci,Cj)、davg(Ci,Cj)分別為聚類簇Ci和Cj之間的最小相似度、最大相似度和平均相似度,ni和nj分別是聚類簇Ci和Cj中數據點的數量。

4 基于灰色關聯分析的領先用戶排名

灰色關聯分析是一種多因素分析方法,可用以分析和確定多因素之間的影響程度以及各因子對主體行為的貢獻程度[40],本文使用灰色關聯分析法計算領先用戶各項指標的平均灰色關聯值作為其領先值,領先值越高,則該用戶的領先性就越強,具體計算過程如下:

n位用戶和m個指標形成的指標矩陣公式(14):

首先,確定參考數據序列,本文將各項指標數據的最大值作為參考數據序列,記作:

使用min-max 法(公式(4))對指標數據無量綱化處理,結果如下:

計算每個比較序列與參考序列對應元素的關聯系數,計算過程如下:

對各項指標關聯系數加權求均值后得到最終關聯系數r:

其中,Wk為各項指標權重,ζi(k)為比較序列與參考序列對應的關聯系數。根據各領先用戶的關聯度值大小進行排名,即可得到用戶領先性排名。

5 華為產品定義社區領先用戶識別與排名

5.1 數據采集和預處理

本文以華為產品定義社區“AI 大數據”圈中的用戶數據為例進行領先用戶識別與排名,使用Python 編寫爬蟲程序采集社區中2018年3月至2019年3月之間的用戶數據,具體數據包括:用戶ID、用戶頭銜、積分、總發帖量、帖子總瀏覽量、帖子總回復數、累計簽到天數和帖子文本等字段,預處理時刪除包含缺失值和無實際意義帖子的數據,得到包含226 名用戶和1843 條帖子的用戶數據,按照上述章節中的方法構建領先用戶識別指標,分別為勛章數、好友數、頭銜、總帖子數、帖子平均瀏覽量、帖子平均被回復數、用戶總回復數、積分、總貢獻值、累計簽到天數、平均帖子質量系數和帖子平均得分等12項指標。

5.2 華為產品定義社區領先用戶識別

5.2.1 確定指標權重

使用變異系數法計算得到12 項指標的權重分布如表3所示。

表3 各項指標權重

5.2.2 領先用戶識別

本文使用Python 的機器學習庫sickie-learn(簡稱sklearn)中的AgglomerativeClustering算法構建領先用戶聚類模型,并使用Silhouette Coefficient(輪廓系數)作為衡量聚類效果的指標,輪廓系數在[-1,1]內,值越大代表聚類效果越好,反之則越差。

AgglomerativeClustering 算法聚類結果由圖1所示,用戶被劃分為3 個類別,當輪廓系數得分為0.806(圖2)時,聚類效果最優,聚類結果如下表4所示。

圖1 AgglomerativeClustering算法聚類結果

表4 用戶聚類結果

圖2 聚類個數及其輪廓系數

由表4可知,聚類后社區中的3 類用戶人數分別為6、2和218人,3類用戶各項指標均值對比如表5所示,可以發現,第1類用戶大多數指標都要優于另外兩類用戶,他們在社區中的發帖量和帖子回復量最高,并且帖子得分最高,對社區的貢獻值最大,說明其積極參與社區中的主題討論和話題互動有著極高的人氣和社區認可度,因此,他們是華為產品定義社區中的領先用戶。相比于領先用戶,第2類用戶大部分指標都較低,他們在創新能力和社區影響力等方面和領先用戶存在一定的差距,但此類用戶在創新社區中表現活躍,積極參與創新話題討論,也愿意主動評論創新內容,提出自己的創新意見,他們在創新社區中具有一定的影響力,也為創新社區的發展做出了一定的貢獻,他們在將來極有可能成為領先用戶,因此,本文將其稱之為積極創新型用戶。相比于前兩類用戶,第3類各項指標值最低,他們在社區中人數占比最大,但大多數活躍性不高,很少積極參與創新社區中的活動,發表創新帖子數量很少并且內容質量不高,對社區發展的貢獻度最小,因此,本文將其稱之為創新社區中的普通用戶。

表5 三類用戶各項指標均值對比

5.2.3 領先用戶排序

計算6名領先用戶的加權平均灰色關聯度作為其領先值,并進行排名,結果如下表6所示,6名領先用戶之間的領先性也存在一定的差異,分析領先用戶的詳細信息(表7)可以發現,領先用戶在活躍性、創新性、共享性及影響力等方面都具有明顯的優勢,他們發表帖子的平均帖子質量系數和平均帖子質量得分都較高,說明其發表帖子的內容具有很強的創新性和專業性,具有很高的信息價值,反映出他們極強的創新能力和專業水平。此外,排名靠前的領先用戶其對于創新社區的貢獻值更大,個人的社區積分值也更高,他們的總發帖量最多,并且都有著極高的回復量,表明其在社區中的活躍程度和開展創新活動的積極性非常高,排名靠前的領先用戶擁有更多的好友數,表明他們有著極強的社區影響力,他們的相關意見能夠得到社區和其他用戶的充分認可,他們的創意可以引導創新社區主題的發展方向,從而推動創新社區中知識的傳遞。

表6 領先用戶排名

表7 領先用戶的具體信息

6 結論與建議

6.1 結論

本文提出了一種基于聚類算法和灰色關聯分析的領先用戶識別及排名方法,對于識別群智創新社區中的領先用戶,分析領先用戶的領先性差異有著較好的效果,具體研究結論如下:

(1)基于用戶內容數據和行為數據構建的領先用戶指標體系,更完整地反映了群智創新社區中用戶活躍性、創新性、共享性和影響力四個維度的特征,提高了領先用戶識別的有效性和準確性。

(2)基于凝聚層次聚類算法的領先用戶識別方法無需預先設定用戶聚類個數,同時也能避免分類算法在訓練過程中人工標注用戶類別的問題,可以有效提升領先用戶識別的合理性和準確性。

(3)基于灰色關聯分析的領先用戶排名方法可通過計算各特征指標間的關聯度以及對用戶的貢獻程度,反映出領先用戶間領先性的差異,進而為企業掌握領先用戶特征、有針對性地選擇合作對象提供了參考。

6.2 建議

(1)華為產品定義社區實例研究結果表明,社區中的領先用戶和創新積極型僅占少數,而數量最多的是普通用戶,并且在活躍性、創新性、共享性和影響力方面存在較大差異。因此,企業應針對不同類型的用戶給予不同的管理措施,進而提升社區的創新產出效率。具體而言,企業可以通過構建外部用戶人才庫,與領先用戶建立長期創新合作關系,使他們能夠持續為企業創新提供支持。其次,企業應加大對創新積極型用戶的關注力度,應增加相應的激勵措施,鼓勵他們參與創新社區創意活動,積極發表創新方案,幫助企業解決創新過程中的瓶頸問題。再者,針對大量的普通用戶,企業應適當減少在普通用戶上的關注力度。

(2)通過深入分析華為產品定義社區中的用戶帖子,一些關注度較高的帖子,如社區公告和通知等,其內容一般且缺乏創意,對企業創新發展作用也不大;相反,一些關注度不高的帖子內容極具創意,卻容易被忽略。因此,企業不僅應重視領先用戶的發帖,也應重視這些高質量的帖子,可通過自然語言處理、文本挖掘等技術識別出這些帖子,挖掘并利用其中的價值。

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 国产成+人+综合+亚洲欧美| 亚洲精品桃花岛av在线| 高清久久精品亚洲日韩Av| 成年人国产视频| 国产网站免费看| a毛片免费观看| 久久男人资源站| 蝌蚪国产精品视频第一页| 亚洲最大福利网站| 麻豆国产精品一二三在线观看| 亚洲精品国产精品乱码不卞| 国产精品yjizz视频网一二区| 午夜国产精品视频黄| 国产sm重味一区二区三区| 亚洲人在线| 偷拍久久网| 亚洲一级毛片免费看| 日韩专区第一页| 亚洲浓毛av| 青青青国产免费线在| 亚洲日韩精品综合在线一区二区| 久久久久久久久18禁秘| 97视频在线观看免费视频| 熟妇丰满人妻av无码区| 毛片免费在线视频| 88av在线看| 91美女视频在线| 久久一本日韩精品中文字幕屁孩| 亚洲美女久久| 99热这里只有精品5| 素人激情视频福利| 动漫精品啪啪一区二区三区| 亚洲系列中文字幕一区二区| 国产精品国产三级国产专业不 | 久草视频福利在线观看| 亚洲欧洲日产国码无码av喷潮| 在线中文字幕网| 亚洲一区二区三区麻豆| 亚洲无码精品在线播放| 久青草国产高清在线视频| 久久青草免费91线频观看不卡| 91国内外精品自在线播放| 国产黄网永久免费| 欧美日韩在线第一页| 女人爽到高潮免费视频大全| 伊人久久婷婷五月综合97色| 97久久人人超碰国产精品| 精品一区二区三区水蜜桃| 免费Aⅴ片在线观看蜜芽Tⅴ | 91成人在线观看视频| 国产精品永久在线| 五月激情婷婷综合| 自偷自拍三级全三级视频| 99精品这里只有精品高清视频 | 亚洲色无码专线精品观看| 伊人成人在线| 亚洲av成人无码网站在线观看| 久久久久国产精品嫩草影院| 视频二区国产精品职场同事| 国产99精品视频| 亚洲精品桃花岛av在线| 特级aaaaaaaaa毛片免费视频| 在线免费a视频| 最新国产你懂的在线网址| 不卡无码h在线观看| 亚洲视频免| 伊人激情久久综合中文字幕| 91亚瑟视频| 啪啪啪亚洲无码| 亚洲视频影院| 亚洲天堂视频网| 欧洲精品视频在线观看| 国产又粗又猛又爽视频| 亚洲中文字幕久久无码精品A| 国产97视频在线| 不卡无码网| 97青青青国产在线播放| 91视频首页| 高潮毛片免费观看| 无码AV日韩一二三区| 3D动漫精品啪啪一区二区下载| 国产欧美又粗又猛又爽老|