999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于Java Web的敏感詞過濾方法研究與實現

2017-09-18 23:45:53傅明建
智能計算機與應用 2017年4期
關鍵詞:內容系統

摘要: 本文研究一種基于Java Web的敏感詞過濾系統,能夠識別敏感詞,在客戶端用戶發送數據時,系統能夠自動阻斷聊天內容,并且將敏感詞替換為指定特殊符號關鍵詞的敏感詞。該系統基于 B /S 結構的Java Web分層框架結構進行架構設計,能夠在對用戶透明的情況下,自動阻斷含有敏感詞的聊天內容提交,并且將敏感詞替換為指定特殊符號關鍵詞。 實驗結果表明該系統能夠有效阻止含有敏感關鍵詞的聊天內容提交。

關鍵詞: 敏感詞過濾; Java Web; 聊天系統; 關鍵詞替換

中圖分類號:TP393.08

文獻標志碼:A

文章編號:2095-2163(2017)04-0021-03

0引言

隨著互聯網與移動應用的飛速發展和普及,在互聯網上的信息量呈現爆炸式增長,這給信息內容質量的監測和過濾帶來嚴峻的考驗。目前已有的絕大部分網絡監控系統主要針對己經生效的網絡信息,不良信息有時候仍然在網上傳播。針對網絡不良信息過濾中存在的這些問題,基于文本的過濾模式可以依據任何關鍵詞進行搜索并確定其內容性質,具有高度的靈活性,而圖片過濾主要是針對色情圖片而言,在技術手段和分級上目前仍然呈現可觀難度,畢竟如何區分藝術和色情在時下的生活進程中也還有待直接確切的現實爭議定論。即使解決了藝術與色情的領域劃定,卻仍然存在著準確率不高的問題。基于此,本文則依據應用場景的需求,設計研發了一種在信息源頭實現敏感詞過濾的敏感詞過濾系統,提高了在關鍵詞過濾中的時間效率。

[BT4]1B/S體系結構

B/S是Brower/Server的縮寫,即瀏覽器/服務器結構。在這種結構中,客戶端不需要開發任何用戶界面,而統一采用如IE和火狐等瀏覽器,通過Web瀏覽器向Web服務器發送請求,由Web服務器進行處理,并將處理結果逐級傳回客戶端,綜上過程直觀表述可如圖1所示。這種結構利用不斷成熟和普及的瀏覽器技術來獲取原需運行復雜專用軟件才能提供輸出的強大功能,從而節約了開發成本,是一種全新的軟件體系結構,因而已然成為當今應用軟件的首選體系結構。

[PS傅明建1.EPS;S*2;X*2,BP#]

2Servlet

Servlet即Java服務小程序,是使用應用程序設計接口以及相關類和方法的Java程序。同時,還可以作為一種插件,嵌入到Web服務器中運行,并可呈現強大功能,Servlet在服務器上運行主要用于支持展開和客戶之間的通信,當客戶端傳來一個Http請求時,通過調用Servlet方法來向客戶端發送一個響應。不但可以處理Http請求中的業務邏輯,而且還可以輸出HTML代碼來顯示指定頁面。

[BT5]2.1Servlet過濾器

Servlet過濾器與Servlet十分相似,但卻具有攔截客戶端(瀏覽器)請求的功能,Servlet過濾器可以改變請求中的內容,來滿足設計開發中的實際需要。對于程序開發人員而言,過濾器實質就是在Web應用服務器上的一個Web應用組件,用于攔截客戶端(瀏覽器)與目標資源的請求,并對這些請求引入一定過濾處理再發送給目標資源,過濾器的處理方式如圖2所示。

2.2基于Servlet過濾器的敏感詞過濾

Servlet過濾器能夠對Servlet容器的請求和響應對象進行檢查和修改。過濾器本身并不產生請求和響應對象,而只是提供過濾功能?;谶@個特點,本文采用基于Servlet過濾器的方法來研究敏感詞過濾,并以聊天系統應用為例(可以適應任何基于Web的系統)來實現敏感詞過濾。該方法的步驟設計內容可詳述如下。

1)先設計一個簡單的聊天室客戶端界面,如圖3所示,用于通過Http請求提交聊天內容。

2)然后,編寫一個Servlet,并部署配置Servlet,用來獲得聊天時提交的聊天內容,并輔以后續延展處理,進一步添加到request中。目前,部署Servlet有2種方式:

① 在Web.xml中進行部署Servlet,只要用戶請求的URL和的子標記指定的模式匹配,Web服務器就會自動調用該Filter的doFilter()方法;

② 基于注解的方式部署配置Servlet,在Servlet3.0中提供了注解@WebFilter,使得可以不再需要在Web.xml文件中呈現Filter的部署描述。

如果設計了多個過濾器,且過濾器攔截路徑相同時,系統將首先按照標記在Web.xml中出現的先后順序執行過濾器,然后再按照過濾器類名的字典順序執行注解的過濾器。但在實際的Web工程中,不需要大量開發Filter,因此,采用哪種方式都可快速成熟地部署過濾器。這里為論述簡明清晰起見,本文中采用在Web.xml中部署Servlet,部署代碼如下:

<!-- Servlet配置 -->

MessageServlet

com.MessageServlet

MessageServlet

/MessageServlet

Servlet設計代碼如下:

public class MessageServlet extends HttpServlet {

private static final long serialVersionUID=65368123622 07677194L;

public void doPost(HttpServletRequest request, Http ServletResponse response)

throws ServletException, IOException {

// 獲取標題

String title = request.getParameter("title");

// 獲取內容

String content = request.getParameter("content");

// 將標題放置到request中

request.setAttribute("title", title);

// 將內容放置到request中

request.setAttribute("content", content);

// 轉發到result.jsp頁面

[JP3]request.getRequestDispatcher("index.jsp").forward(request, response);[JP]

}

}

3)最后編寫一個Servlet過濾器,并部署配置,將聊天內容中涉及到的敏感字過濾,并將所有敏感字內容替換成“*”。與Servlet一樣,部署過濾器目前也有2種方式:一是在Web.xml中部署Filter;一是基于注解的方式部署Filter。為設計高效起見,這里同樣采用Web.xml中部署Servlet Filter,Web.xml文件中部署代碼如下:

<!-- 過濾器配置 -->

ff_WordFilter

com.ff_WordFilter

encodingGBK

ff_WordFilter

/*

過濾器代碼設計如下:

public class ff_WordFilter implements Filter {

// 非法字符數組

private String ff_words[];

// 字符編碼

private String encoding;

// 實現Filter接口init()方法

public void init(FilterConfig filterConfig) throws ServletException {

// 獲取字符編碼

[JP3]encoding = filterConfig.getInitParameter("encoding");[JP]

// 初始化非法字符數組,該字符數組即是需要過濾并替換的非法關鍵詞

ff_words = new String[]{"他媽的","赤裸"};

}

// 實現Filter接口doFilter()方法

public void doFilter(ServletRequest request, Servlet Response response, FilterChain chain) throws IOException, ServletException {

// 判斷字符編碼是否有效

if (encoding != null) {

// 設置request字符編碼

request.setCharacterEncoding(encoding);

// [JP3]將request轉換為重寫后的Request對象[JP]

[JP4]request = new Request((HttpServletRequest) request);[JP]

// 設置response字符編碼

[JP2]response.setContentType("text/html; charset="+encoding);[JP]

}

chain.doFilter(request, response);

}

// 實現Filter接口destroy()方法

public void destroy() {

this.words = null;

this.encoding = null;

}

/* 內部類重寫HttpServletRequestWrapper*/

class Request extends HttpServletRequestWrapper{endprint

// 構造方法

public Request(HttpServletRequest request) {

super(request);

}

// 重寫getParameter()方法

@Override

public String getParameter(String name) {

// 返回過濾后的參數值

[JP5]return filter(super.getRequest().getParameter(name)); }[JP]

// 重寫getParameterValues()方法

@Override

public String[] getParameterValues(String name) {

// 獲取所有參數值

String[] values = super.getRequest().getParameter Values(name);

// 通過循環對所有參數值進行過濾

for (int i = 0; i < values.length; i++) {

values[i] = filter(values[i]);

}

// 返回過濾后的參數值

return values;

}

}

/** 過濾非法字符

* @param param 參數值

* @return 過濾后的參數值

*/

public String filter(String param){

try {

// 判斷非法字符是否被初始化

if(words != null && ff_words.length > 0){

// 循環替換非法字符

for (int i = 0; i

// 判斷是否包含非法字符

if(param.indexOf(ff_words[i]) != -1){

// 將非法字符替換為"****"

param = [WB]param.replaceAll(ff_words[i],

[DW]"****");

} } }

} catch (Exception e) {

e.printStackTrace(); }

return param;

}

[BT4]3結束語

本次研究設計中提出了一種基于Java Web的敏感詞過濾系統,能夠識別敏感詞,在客戶端用戶發送數據時,系統能夠自動阻斷聊天內容,并且將敏感詞替換為指定特殊符號關鍵詞的敏感詞,該系統基于 B /S 結構的Java Web分層框架結構進行架構設計。 實驗結果表明該系統能夠有效阻止含有敏感關鍵詞的聊天內容提交。

參考文獻:

[WTBZ][ST6BZ][HT6SS][1] [ZK(#〗

DUAN Lei, TANG Changjie, ZUO Jie, et al. Selfstudy algorithm for filtering Chinese text content through two layers in Web realtime environment[J]. Journal of Frontiers of Computer Science and Technology, 2011, 5(8):695-706.

[2] 張穎江, 陳馳. WEB 內容過濾方法的研究與應用[J]. 武漢科技學院學報, 2005, 18(4):49-51.

[3] 程衛華 , 尤晉元. 基于內容過濾的反垃圾郵件系統的設計與實現[J]. 安徽大學學報 (自然科學版),2007,31(3):30-33.

[4] 鄧一貴, 伍玉英. 基于文本內容的敏感詞決策樹信息過濾算法[J]. 計算機工程,2014,40(9):300-304.

[5] 薛海偉,田崢,田建偉,等. 郵件敏感字過濾系統研究與實現[J]. 湖南電力,2015,35(2):13-16.

[6] 曹靜,劉潔. JSP與servlet開發技術與典型應用教程[M]. 2版. 大連:大連理工大學出版社,2014.

[7] 明日科技. JAVA WEB從入門到精通[M]. 北京:清華大學出版社,2012.[ZK)][FL)]

猜你喜歡
內容系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
內容回顧 溫故知新
科學大眾(2021年21期)2022-01-18 05:53:48
內容回顧溫故知新
科學大眾(2021年17期)2021-10-14 08:34:02
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
主站蜘蛛池模板: 丁香综合在线| 国产一在线| 亚洲天堂.com| 妇女自拍偷自拍亚洲精品| 影音先锋亚洲无码| 午夜国产大片免费观看| 亚洲综合天堂网| 亚洲综合色婷婷中文字幕| 精品国产网| 欧美成人h精品网站| 国产成人成人一区二区| 欧美色亚洲| 国产成人久久777777| 亚洲精品无码成人片在线观看| 色精品视频| 人人妻人人澡人人爽欧美一区| 亚洲精品无码人妻无码| 中文国产成人精品久久一| 91精品综合| 亚洲人成影院在线观看| 国产99欧美精品久久精品久久| 国产免费观看av大片的网站| 国产精品亚洲一区二区三区在线观看| 国产真实自在自线免费精品| 超清无码熟妇人妻AV在线绿巨人| 亚洲精品国偷自产在线91正片| 成人91在线| a亚洲视频| 高清不卡毛片| 亚洲日韩精品伊甸| 激情無極限的亚洲一区免费| 色噜噜综合网| 国产69囗曝护士吞精在线视频| 婷婷色丁香综合激情| 色哟哟国产精品| 亚洲AV电影不卡在线观看| 婷婷在线网站| 免费视频在线2021入口| 中文字幕不卡免费高清视频| 无码日韩精品91超碰| 日韩高清一区 | 久久综合伊人 六十路| 欧美中文字幕一区| 欧美亚洲国产一区| 精品国产香蕉伊思人在线| 成人国产一区二区三区| 午夜福利视频一区| 国产精品美女网站| 亚洲人成人伊人成综合网无码| 91丨九色丨首页在线播放| 呦女亚洲一区精品| 免费毛片a| 97久久超碰极品视觉盛宴| 久久亚洲AⅤ无码精品午夜麻豆| 99国产精品免费观看视频| 五月婷婷欧美| 久久人午夜亚洲精品无码区| 精品视频在线观看你懂的一区| 蝴蝶伊人久久中文娱乐网| 中文字幕 91| 99这里只有精品免费视频| 日韩欧美在线观看| 亚洲高清国产拍精品26u| 中文字幕亚洲精品2页| 91国内在线视频| a级毛片在线免费| 欧美日韩第三页| 波多野结衣一二三| 97成人在线视频| 在线不卡免费视频| 国产新AV天堂| 黄色网页在线播放| 在线一级毛片| 精品无码视频在线观看| 一区二区三区国产精品视频| 美女高潮全身流白浆福利区| 久久精品无码一区二区国产区 | av天堂最新版在线| 国产网友愉拍精品视频| 亚洲精品va| 久久香蕉国产线| 青青久在线视频免费观看|