999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網絡爬蟲的單詞翻譯器設計與研究

2021-09-13 08:52:16周游宇孫洪波梅良才
科技資訊 2021年16期

周游宇 孫洪波 梅良才

摘? 要:該文基于機器學習中的網絡爬蟲技術提出了一種單詞翻譯器的設計與研究流程。首先,該文對Iciba網站進行爬蟲,經過前期url分析,編寫定向頁面requests爬蟲,得到單詞釋義和例句。其次,通過一個查詢單詞的通用程序框架,編寫requests定向爬蟲,實時獲得最新的詞語解釋和例句。最后,該文設計了一個GUI窗體界面,用于展示相關結果,具有較好的實用性和有效性。該文提出的研究方法是機器學習相關研究領域的一個擴充,且該研究結果給教育相關領域提供了一個有效的應用產品。

關鍵詞:requests框架? 網絡爬蟲? GUI界面編程? Python

中圖分類號:TP391? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A文章編號:1672-3791(2021)06(a)-0004-03

Design and Research of Word Translator Based on Web Crawler

ZHOU Youyu? SUN Hongbo? MEI Liangcai*

(Beijing Institute of Technology, Zhuhai, Zhuhai, Guangdong Province, 519088? China)

Absrtact: This paper presents the design and research flow of a word translator based on the web crawler technology in machine learning. Firstly, this paper crawled Iciba website, compiled directional page requests crawler through early url analysis, compiled the directed page requests crawler, got the word definition and example sentences. Secondly, through a general program framework for querying words, write requests directional crawler to obtain the latest word interpretation and example sentences in real time. Finally, a GUI form interface is designed to show the relevant results, which has good practicability and effectiveness. The research method proposed in this paper is an extension of the research field related to machine learning, and the research results provide an effective application product for the field related to education.

Key Words: Requests framework; Web crawler; GUI interface programming; Python

網絡爬蟲是從互聯網搜集數據的一種工具,眾多學者利用網絡爬蟲獲取研究數據[1]。機器學習是一種從現有數據中找到數據特征之間變化規律的一門科學,學者們在翻譯器設計、數據預測等多種交叉領域都用到了機器學習方法[2-4]。另外,市場上大多數查詢單詞App的桌面版功能都不夠方便快捷,基于此現狀,該文主要基于以下任務來設計單詞查詢App。

(1)對于網頁架構的前期url分析,找到相應的單詞釋義和例句。

(2)對于html框架中的具體label中的內容進行編程設計爬取。

(3)設計GUI界面進行單詞釋義和例句的展示。

1? 包的安裝與描述

因為要GUI界面編程和網絡爬蟲,因此需要下列包。

from PyQt5 import QtCore, QtGui, QtWidgets

from bs4 import BeautifulSoup

from PyQt5.QtCore import QRect

import requests

from PyQt5.QtWidgets.

import QApplication,QWidget

import sys

import trans

2? 爬蟲解決過程

Iciba的域名為http://www.iciba.com/,在域名后加word?w=,再加入所要搜索的單詞,如book。顯示出如下網址:http://www.iciba.com/word?w=book,即可完成搜索,url見圖1。

由圖1可知,單詞釋義都在class=Mean_part_1RA2V的ul標簽下,每一個li標簽里帶有一行釋義;li標簽下的i標簽帶有此行釋義的詞性,span標簽為漢語解釋。同理,例句在 class = NormalSentence_sentence_3q5Wk的div標簽下。三個p標簽分別為英語例句、漢語翻譯、出處。

至此,筆者寫出爬蟲的主要框架具體如下所示。

r = requests.get(url)

try:

soup = BeautifulSoup(r.text,'html.parser')

meaning = soup.find('ul',class_='Mean_part_1RA2V').children

for li in meaning:

text += li.i.string

text+=' '

for span in li.div.children:

text+=span.text

text+=' '

text+='\n'

text+='\n例句:\n'

for div in soup.findAll('div',class_='NormalSentence_sentence_3q5Wk')[:9]:

ps = div.children

i=0

for p in ps:

if i == 2:

break

text += p.text

text+='\n'

i+=1

text+='\n'

self.label.setText(text)

except:

self.label.setText('搜索失敗')

利用try-except語句用一些亂七八糟搜索的過濾。

3? GUI界面解決過程

GUI界面能很直觀地展示搜集結果,是展示網絡爬蟲數據的好工具[5-6]。利用類的定義和使用的方法,筆者根據官網例子寫出的GUI如下所示。

from PyQt5 import QtCore, QtGui, QtWidgets

from bs4 import BeautifulSoup

from PyQt5.QtCore import QRect

import requests

class Ui_Form(object):

def setupUi(self, Form):

Form.setObjectName("Form")

Form.resize(412, 800)

self.Buttons = QtWidgets.QPushButton(Form)

self.Buttons.setGeometry(QtCore.QRect(300, 10, 93, 28))

self.Buttons.setObjectName("Buttons")

self.lineEdit = QtWidgets.QLineEdit(Form)

self.lineEdit.setGeometry(QtCore.QRect(10, 10, 271, 31))

self.lineEdit.setObjectName("lineEdit")

self.label = QtWidgets.QLabel(Form)

self.label.setGeometry(QtCore.QRect(10, 50, 381, 711))

self.label.setText("")

self.label.setObjectName("label")

self.label.setGeometry(QRect(10, 50, 381, 711))

self.label.setWordWrap(True)

self.label.setAlignment(QtCore.Qt.AlignTop)

self.Buttons.clicked.connect(self.sOnClicked)

self.retranslateUi(Form)

QtCore.QMetaObject.connectSlotsByName(Form)

def sOnClicked(self):

text = '釋義:\n'

url_root = 'http://www.iciba.com/word?w='

url = url_root+self.lineEdit.text()

r = requests.get(url)

try:

soup = BeautifulSoup(r.text,'html.parser')

meaning = soup.find('ul',class_='Mean_part_1RA2V').children

for li in meaning:

text += li.i.string

text+=' '

for span in li.div.children:

text+=span.text

text+=' '

text+='\n'

text+='\n例句:\n'

for div in soup.findAll('div',class_='NormalSentence_sentence_3q5Wk')[:9]:

ps = div.children

i=0

for p in ps:

if i == 2:

break

text += p.text

text+='\n'

i+=1

text+='\n'

self.label.setText(text)

except:

self.label.setText('搜索失敗')

def retranslateUi(self, Form):

_translate = QtCore.QCoreApplication.translate

Form.setWindowTitle(_translate("Form", "Form"))

self.Buttons.setText(_translate("Form", "搜詞"))

4? 總結與評價

(1)創新點。運用的GUI界面編程,程序有了界面可以和用戶互動;根據網絡爬蟲可快速制作出編譯器,無需自己的詞典庫;界面自適應,長出界面的詞句會自動換行;詞性、釋義、例句,一應俱全。

(2)不足和改進。查詢需要聯網,沒有自己的數據備份。

該款App可以用于日常英語學習,隨時查詢,沒有多余功能,程序小巧,查詢到的釋義例句齊全。

參考文獻

[1] 朱策,徐宏,林新,等.基于網絡爬蟲的能源政策監測[J].科技創新導報,2019,16(35):141-142.

[2] 楊浩波.神經機器翻譯關鍵技術研究與應用[D].成都:電子科技大學,2020.

[3] 梁娟.英語翻譯器語音識別系統的設計及功能實現[J].微型電腦應用,2018,34(12):46-48.

[4] 季春元,熊澤金,侯艷芳,等.基于人機交互的網絡化智能翻譯系統設計[J].自動化與儀器儀表,2019(8):25-28.

[5] 劉江,劉國璽,張雁,等.基于多線程和翻譯的網絡爬蟲鳥類音頻數據采集系統設計與實現[J].現代計算機,2018(30):85-88,92.

[6] 明日科技.Python從入門到精通[M].北京:清華大學出版社,2018.

主站蜘蛛池模板: 免费观看国产小粉嫩喷水| 尤物国产在线| 不卡国产视频第一页| 黄色在线不卡| 婷婷六月天激情| 免费人成在线观看成人片 | 伊人蕉久影院| 先锋资源久久| 国产视频自拍一区| 国产喷水视频| 日韩无码黄色网站| 青青青草国产| 全部无卡免费的毛片在线看| 日韩久草视频| 久久国产精品娇妻素人| 久久久黄色片| 国产精品大尺度尺度视频| 激情在线网| 亚洲va在线∨a天堂va欧美va| 欧美福利在线观看| 国产精品99在线观看| 一级看片免费视频| 亚洲自偷自拍另类小说| 国内精品免费| 久99久热只有精品国产15| 激情视频综合网| 国产在线观看一区精品| 91精品免费高清在线| 99热这里只有精品国产99| www.精品视频| 亚洲综合片| 精品成人免费自拍视频| 亚洲天堂.com| 久久综合九九亚洲一区| 日本国产精品一区久久久| 人人澡人人爽欧美一区| 女人爽到高潮免费视频大全| 成人福利在线看| 亚洲二区视频| 欧美综合中文字幕久久| 四虎永久免费在线| 9cao视频精品| 亚洲中文字幕久久无码精品A| 国产精品太粉嫩高中在线观看| 久久这里只精品国产99热8| 欧美亚洲激情| 精品视频91| 在线播放国产99re| 午夜无码一区二区三区| 国产99视频在线| 亚洲丝袜第一页| 91福利国产成人精品导航| 欧美激情福利| www.91在线播放| 欧美h在线观看| 色综合久久88| 天天躁夜夜躁狠狠躁躁88| 国产精品人莉莉成在线播放| 国产小视频免费观看| 国产小视频a在线观看| 国产黑丝视频在线观看| 91热爆在线| 亚洲一区二区三区麻豆| 欧美精品亚洲精品日韩专| 国产偷国产偷在线高清| 亚洲成年人片| 欧美亚洲欧美| 国产导航在线| 中文字幕色站| 色婷婷成人网| 亚洲欧美精品一中文字幕| av色爱 天堂网| 9cao视频精品| 久久这里只精品国产99热8| 九九久久99精品| 国内精品自在欧美一区| 国产在线观看91精品| 国内老司机精品视频在线播出| 国产簧片免费在线播放| 久久综合国产乱子免费| 国产在线小视频| 精品91在线|