999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在線技術社區用戶研究綜述

2020-11-25 20:15:44張凱強倪亞晨
現代計算機 2020年10期
關鍵詞:用戶研究

張凱強,倪亞晨

(四川大學計算機學院,成都610065)

0 引言

互聯網誕生不久,用戶便可以在網絡中生產和傳播資源,根據資源主題,用戶群體和和使用方式的不同,分為各種網絡社區,如社交網絡社區Facebook、QQ、微信等,主要是以在網絡上進行社交活動的社區;問答社區[1],如Google Answer、百度知道和知乎等,這類社區允許用戶提問并且回答他人的問題。在線技術社區,如 GitHub、StackOverflow、CSDN 等,這類社區主要是供技術愛好者或者從業者們使用[2],來分享和提高自己的技術。

在線技術社區主要有兩種形式,一種是以代碼為核心,代表網站是:2008年上線的GitHub,其是現在全球最大的開源代碼托管平臺,以及2014年上線的碼云Gitee,面向國內技術開發者的代碼托管平臺等,這類平臺主要是供在線技術社區用戶管理和學習代碼;另外一種是以技術問答為中心,代表網站是:2008年由兩位技術博主創建的技術知識問答社區StackOverflow,以及1999年創立的中國專業IT社區CSDN,這類在線技術社區主要以用戶提問,其他用戶來回答的形式來提供服務。

作為一種集成化的知識資源共享和信息資源傳播平臺,在線技術社區為用戶提供了技術交流、技術咨詢和共享空間,深受技術相關從業者和愛好者的青睞。用戶可以在社區發表博客或帖子來記錄分享自己對某一問題的經驗看法,或者在自己的代碼倉庫上傳自己的項目代碼用以管理代碼,也可以瀏覽或收藏自己感興趣的內容或者拉取自己感興趣的別人上傳的代碼倉庫,還可以針對自己遇到的技術難題或者疑問提出咨詢,以及參與自己感興趣的話題的討論等。例如,全球最大的開源技術社區StackOverflow,擁有超過800萬的用戶以及3800萬帖子[3],每天還有新用戶的加入和產生大量的博客和帖子,以及瀏覽、點贊、評論、收藏等行為,還有現今全球最大的代碼托管平臺GitHub,現已擁有超過4000萬開發人員以及超過1億的代碼倉庫[4],每天有上千萬的用戶上傳他們自己的代碼,或者對感興趣的項目進行收藏、拉取等。

做好在線技術社區的用戶研究對于社區運營者來說十分重要,有助于他們了解用戶行為,管控用戶內容,并更好地了解用戶需求,從而為用戶提供更加精準的推薦和個性化服務,從而增加用戶粘性和社區活躍度。

本文概括了當前當前最流行的在線技術社區GitHub和StackOverflow的用戶研究,根據研究內容的不同分為用戶本身研究和用戶內容研究兩類,分別進行了研究論述,并且對下一步的研究工作進行了討論。

1 在線技術社區用戶內容研究

在線技術社區的用戶會在平臺上托管自己的代碼,寫帖子進行技術交流,或者回答別人的問題,提出自己的疑問等,這些用戶在社區中所產生的文檔、代碼等都是用戶產生的內容,是用戶研究中的重要部分,很多研究者都對此進行了研究。

Baltes S.和 Kiefer R.等人[5,6]研究了在 GitHub 數據倉庫中的代碼對于StackOverflow上的代碼引用問題,他們提出了一個實證研究設計并得出結果,分析了在GitHub項目中StackOverflow代碼片段的標明引用和未標明引用的現象,研究表明,平均而言,在所有倉庫中平均3.22%標明了對StackOverflow代碼片段的引用,在受歡迎的倉庫中為7.33%,此外,研究還發現開發人員更傾向于在整個StackOverflow引用而不是特定的答案。對于Java倉庫,至少有三分之二的復制代碼片段未標明引用。

Baltes S.、Dumani L.和 Treude C 等人[7]研究了StackOverflow上帖子的演變與其他平臺的關系,他們構建了SOTorrent,一個開放的基于官方SO數據轉儲的數據集。SOTorrent提供對整個帖子和單個文本或代碼塊級別的SO內容的版本歷史的訪問。它通過聚合來自文本塊的URL和通過收構建了SOTorrent,一個開放的基于官方SO數據轉儲的數據集。SOTorrent提供對整個帖子和單個文本或代碼塊級別的SO內容的版本歷史的訪問。它通過聚合來自文本塊的URL和通過收集引用將SO帖子連接到其他平臺表單從GitHub文件到SO帖子。在研究提供了對SO帖子演變的見解,例如,帖子編輯通常很小,在帖子初始創建后不久發生,而且代碼很少,此外,我們的分析揭示了后期編輯和評論之間的密切關系。

Treude C.和Wagner M.[8]則使用GH和SO的文本數據來對主題模型的配置參數進行了研究,他們發現:①主題建模參數配置的常用經驗法則不適用于實驗中使用的GH和SO語料庫;②從GitHub和Stack Over?flow抽取的語料庫具有不同的特征,需要不同的配置才能實現良好的模型擬合;③他們的模型可以可靠地預測看不見的語料庫的良好配置。這些發現支持研究人員和從業人員在分析軟件存儲庫中包含的文本數據時有效地確定適合主題建模的配置。

Cai X.、Zhu J.、Shen B.等人[9]提出了 GRETA,一種基于圖形的新方法,用于在GitHub上為存儲庫分配標簽。GRETA的核心見解是:①使用StackOverflow中的領域知識為GitHub構建實體標簽圖(ETG);②通過采用隨機游走算法為存儲庫分配標簽。他們已經實現了GRETA,并使用GRETA的標簽分配結果為GitHub開發了一個存儲庫搜索引擎。并且針對幾種基線方法評估了GRETA,以研究其標記GitHub存儲庫的有效性。結果顯示,GRETA的F-Measure達到了35%,優于基線方法。此外,基于GRETA的搜索引擎獲得比GitHub提供的搜索引擎更高的NDCG值,表明帶有標記存儲庫顯著增強了GitHub上的搜索能力。

Liu X.、Shen B.、Zhong H.[10]等人提出了一種名為EXPSOL的方法,該方法使用支持向量機訓練的模型推薦在線資源作為新報告的異常相關錯誤的解決方案。他們對來自StackOverflow的數千個問題和來自GitHub的固定問題進行了兩次評估,并取得了很好的效果。

2 在線技術社區用戶本身研究

除了上述的用戶內容,如代碼、文檔等的研究之外,關于用戶研究的另外一個重要部分便是關于用戶本身的研究,如用戶興趣、用戶社交、用戶行為等。

Lee K.W.和Lo D.[11]研究了GH和SO中開發人員的跨平臺興趣,研究發現開發人員在GitHub和Stack?Overflow中有共同的興趣;平均而言,39%的開發人員在GitHub倉庫和StackOverflow的問題屬于相同的興趣。此外,開發人員與其他共同參與兩個平臺活動的開發人員有著類似的興趣。特別是,與共同參與其他平臺活動的其他開發人員相比,共同提交和共同請求同一GitHub倉庫并共同回答StackOverflow同一問題的開發人員有著更加相似興趣。

Venkataramani R.、Gupta A.、Asadullah A.等人[12]開發了一個模型,通過挖掘開發人員在不同開源項目中的活動來對開發人員在目標領域的專業知識進行排名,并且為StackOverflow開發了一個推薦系統,使用了從GitHub提取的數據。

Badashian A.S.[13]提出了一個更現實的錯誤分配任務。首先,開發了一個開發人員專業知識的新模型,考慮了他們的代碼開發的貢獻,以及他們對相關問答(Q&A)平臺的貢獻。其次,采用經濟學的角度來進行任務分配,并且建議將任務從“將一個bug或者問題分配給最佳開發人員”到“為一組合格且可用的開發人員分配多個未解決的bug或者問題”。

Vasilescu B.、Filkov V.、Serebrenik A.[14]研 究 了StackOverflow活動與開發過程之間的相互作用,并通過最大社交編碼庫GitHub的代碼更改來驗證。他們的研究表明,活躍的GitHub提交者會向其他人提出更少的問題并提供更多的問題答案。此外,活躍的Stack?Overflow提問者以比不提問題的開發人員的開發行為更加分散。最后,研究表明StackOverflow活動率與GitHub中的代碼更改活動相關。

Wu Y.、Kropczynski J.、Shih P.C.等人[15]研究發現對GitHub上類似的代碼倉庫的貢獻會導致用戶在GitHub上相互跟隨,并且互聯網上有一個軟件開發者的生態系統,包括很多平臺,如Forrst、Twitter和Hack?er News等。開發人員在這些平臺上進行社交介紹和其他交互,并與GitHub上的代碼倉庫進行交流,他們將GitHub描述為更大的開發人員交互生態系統的一部分用來研究用戶的社交活動。

Y.Xiong、Z.Meng、B.Shen、W.Yin[16]提出了一種在GitHub和StackOverflow中挖掘開發人員行為的新方法。這種方法使用CART決策樹鏈接來自兩個社區的帳戶,利用來自用戶名,用戶行為和寫作方式的特征。然后,通過T圖分析,基于LDA的主題聚類和跨站點標記迭代遍歷站點開發人員行為。并進行了幾次實驗來評估這種方法。結果表明,他們的身份聯系方法的精度和F-Score高于以往的方法。特別是,他們發現:①活躍的issue提交者也是積極的問題提問者;②對于大多數開發人員來說,他們在GitHub中的內容主題與他們在StackOverflow中的問題和答案的主題相似;③開發人員對StackOverflow的關注隨著他們當前參與GitHub的項目發生變化;④開發人員對GitHub的關注與他們的答案相關,而不是StackOverflow中的問題和評論。

3 討論及未來工作

隨著在線技術社區的發展,用戶和用戶產生的內容越來越多,做好在線技術社區用戶的研究對于在線技術社區的高質量發展有著重要作用,本文上述羅列了典型的在線技術社區GitHub和StackOverflow的用戶研究概況,我們可以看出現有的研究大多是關于用戶的某個方面的研究,如興趣或者技術特長或者社交等,缺少對于用戶更加全面的研究,而現在火熱的用戶畫像技術便是解決之道。

我們下一步的研究工作便是使用GitHub和Stack?Overflow數據來對用戶進行更加全面準確的畫像,從用戶自然屬性,用戶擅長領域、用戶興趣等多個方面來刻畫,并將我們的畫像應用于推薦系統中。

猜你喜歡
用戶研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 毛片视频网址| 青草娱乐极品免费视频| 色婷婷久久| 亚洲一区二区成人| 国产精品lululu在线观看| 国产精品分类视频分类一区| 欧美精品亚洲日韩a| 亚洲视频二| 91视频日本| 色偷偷av男人的天堂不卡| 国产在线拍偷自揄拍精品| 日韩天堂在线观看| 国产欧美日韩va另类在线播放| 国产精品女熟高潮视频| 最新国产网站| 性激烈欧美三级在线播放| 亚洲国产日韩欧美在线| 亚洲天堂.com| 99视频在线观看免费| 国产成人高清精品免费| 丁香六月综合网| 99热这里都是国产精品| 日韩精品久久久久久久电影蜜臀| аv天堂最新中文在线| 黄色网站在线观看无码| av在线5g无码天天| 国精品91人妻无码一区二区三区| 九九热视频精品在线| 亚洲一级无毛片无码在线免费视频| 久久这里只有精品2| P尤物久久99国产综合精品| 国产91丝袜在线播放动漫| 青青久视频| 久久精品中文字幕免费| 免费全部高H视频无码无遮掩| 91久久青青草原精品国产| 国产又色又爽又黄| 成人精品在线观看| 国产高清不卡视频| 永久在线精品免费视频观看| 久久久久青草线综合超碰| 亚洲欧美日韩中文字幕一区二区三区 | 日韩国产高清无码| 日韩精品一区二区三区swag| a毛片免费观看| 乱色熟女综合一区二区| 亚洲视频二| 永久天堂网Av| 中文成人在线视频| 一级不卡毛片| 国产极品粉嫩小泬免费看| 麻豆精品国产自产在线| a免费毛片在线播放| 天天做天天爱天天爽综合区| 永久免费精品视频| 中文字幕调教一区二区视频| 国产国语一级毛片| 狠狠色丁婷婷综合久久| 欲色天天综合网| 夜夜操天天摸| 国产亚洲欧美日韩在线一区| 亚洲色偷偷偷鲁综合| 国产无码性爱一区二区三区| 在线五月婷婷| 国产成人三级| 亚洲一级色| 久久黄色免费电影| 手机在线免费毛片| 亚洲av无码专区久久蜜芽| 一级毛片免费的| аⅴ资源中文在线天堂| 精品人妻无码中字系列| 国产91全国探花系列在线播放 | 欧美一级在线播放| 免费观看无遮挡www的小视频| 欧美日韩第二页| 欧美日韩北条麻妃一区二区| 欧美日韩在线观看一区二区三区| 欧美国产在线精品17p| 国产丝袜一区二区三区视频免下载| 99热这里只有精品国产99| 欧美一级黄色影院|