999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹算法的電視收視率預測研究?

2017-12-18 06:22:40周蕩蕩
計算機與數字工程 2017年11期
關鍵詞:分類研究

周蕩蕩 蘇 勇

(江蘇科技大學計算機科學與工程學院 鎮江 212003)

基于決策樹算法的電視收視率預測研究?

周蕩蕩 蘇 勇

(江蘇科技大學計算機科學與工程學院 鎮江 212003)

論文經過很多的研究工作,對于各種電視頻道收視率猜測策略的特色,提出了對于電視臺收視率猜測軟件體系的規劃,并給出基于面向對象思維的軟件模型及有關模塊的交互規劃和完成,這個軟件體系是強健,牢靠,可拓展且有用的。

預測模型;收視率;決策樹算法;電視節目

1 引言

收視查詢得到的數據作為一種主要的商場信息獲取來源,其效果也是愈來愈主要。因而,對數據收集到數據剖析變成樹立收視率查詢系統的一個主要環節。收視率查詢數據通常具有較強的時效性和復雜性,因而在對數據進行處理時通常對處理的及時性和產生規則的多樣性有較高的要求[1~2]。傳統的數據處理方式通常是以統計剖析的辦法為主,盡管這類辦法在以往的許多問題中具有較好的處理效果。但是,隨著信息時代的到來,這種傳統的數據剖析方式現已不能極好地滿足收視率查詢中的信息處理需求。在某些情況下,程序采納相似神經元的網絡模型,使用神經網絡學習在很大程度可能會樹立一個學習模型精度低,收視率的猜測辦法也是有許多,并表現出共同的適用性[3~8]。以非常好地滿足電視媒體廣告收視率的查詢服務行業的需要,查詢收視率常用的播送電視節目收視率的電視渠道來滿足的各類需要,以便進行猜測與計算。

2 決策樹分類算法在收視率預測中的應用

2.1 收視率數據處理

在圖1里已經給出了本文研究的收視率數據形式,收視率數據的選擇原則是基于觀眾觀看電視比較頻繁的時間段,本文的收視率取自每天晚上從19:00到22:10的平均收視率。如圖3展示了部分數據。

首要對收視率數據值進行處理,由于要思考運用決策樹對電視臺頻道收視率進行猜測,所以需求對剖析的特色進行離散化。關于收視率值的離散化,能夠直接靠人工進行挑選,由人工指定一個或幾個閾值,然后按這些閾值進行歸類,這么能夠很迅速地得到成果,可是需求耗費人力,并且人為因素影響比較大;另外能夠思考屢次核算挑選的辦法,給出最終的類型總數,然后由核算機剖析各個數據點的方位,給出最終的分類成果;還能夠思考選用聚類的辦法,經過聚類算法自行挑選合理的分類規范,這么的優勢在于能夠不必人工干預進行分類,節省時刻,缺陷也是很明顯的,關于一些數值跨度比較大的數據,選用這種辦法也許導致最終得到的類型格外多,這樣不利于后邊決策樹剖析,假如遇到這種狀況,能夠思考先對數據進行預處理,如取原始數據值的平方根,或是取對數等操作來提早集合數據。經過有關的數學辦法處理后,數據將會變得會集起來,然后經過聚類算法進行聚類,則能夠得到比較好的成果。收視率數值是接連的數據。這里需求思考的收視率特色包含如下:

圖1 19:00到22:10的平均收視率部分數據

1)收視率丈量值,這篇文章收集的收視率是接連的數值。

2)收視率時刻特色,首要指的是收視率丈量當天是工作日或非工作日。

3)收視率時刻所屬規模,指的是收視率丈量當天歸于上旬,中旬或是下旬。

4)前一天或前一星期或有關前幾周的收視率值。

表中數據已經按照時間先后排序如表1所示。

表1 部分數據編碼

2.2 應用決策樹分類算法預測收視率

對收視率數據進行相應的處理并編碼,在保證了每條收視率記錄的唯一性之后,則可以構建決策樹來學習建模并預測了[9]。對于電視臺收視率預測問題,最終需要預測的是電視臺收視率值,而經過數據處理后,實際只需要預測收視率的類型即可。對于最終要預測的分類屬性為電視臺收視率離散值,它有三個不同的值,其中L有27個樣本,M有17個樣本,H有16個樣本,這里需要計算每個屬性的信息增益,首先給定電視臺收視率離散值樣本分類的期望信息:

接下來計算每個屬性的信息熵,首先從時間屬性開始,檢查時間屬性的每個樣本值的分布。對于時間屬性Time=1的情況,有18個的收視率離散值Rate=L,有10個收視率離散值Rate=M ,有16個收視率離散值Rate=H;對于時間屬性Time=0的情況,有9個的收視率離散值Rate=L,有7個收視率離散值Rate=M,有0個收視率離散值Rate=H。所以對于每個分布計算期望信息:

對Time=1:

對Time=0:

因此若原樣本按照時間屬性進行劃分,按照式(2),式(3)計算出對一個給定的樣本的分類對應的信息熵:由式(1),式(3)計算這種劃分的信息增益是:Gain(Time)=I(s1,s2,s3)-E(Time)=0.2664 (5)對于月位置屬性的信息增益計算如下:對Position=F:

類似的,可以計算:

對Prev_Rate=L:

對Prev_Rate=M:

對Prev_Rate=H:

根據計算出的信息增益,對比式(5),式(6)和式(7)可見屬性Prev_Rate具有最高的信息增益,所以它首先被選作測試屬性。并以此創建一個結點,用Prev_Rate標示,并對于每個屬性值,引出一個分支,如圖2所示。

圖2 Prev_Rate結點及其分支

然后對每個分支繼續遞歸計算其相應屬性的信息增益,根據信息增益值來進行劃分[10]。根據選擇的這些屬性進行分類建模,最后得到的分類規則如圖3所示。

圖3 ID3算法產生的決策樹

選用以上得到的決策樹對電視臺的收視率數據進行分類猜測,成果猜測精度在65%擺布,這也是能夠預料到的,由于原數據中供給的信息量有限,不能最大度的對收視率進行分類,致使猜測差錯是不免的[11]。

從通常狀況來看,對這篇文章研究的電視臺收視率數據方式,選用決策樹算法進行分猜測,不能得到準確的收視率值,只能區別收視率的類型,是一個含糊的猜測成果。關于這么的收視率數據方式,額定剖析的特色較少,所以選用決策樹算法進行分類猜測得到的效果并不抱負,為了改進猜測精度,具體使用時電視臺能夠依據相應的評估規范進行分類,然后進行猜測,也能夠選用聚類算法讓數據依據本身特色進行分類。然后依據這些類型來區分收視率[12]。總的來說決策樹分類原則在收視率猜測使用疑問上有很大的實用性,能夠在大規模雜亂猜測運算履行前作為分類預處理履行,對根本原始數據進行分類并過濾,有助于大規模雜亂猜測核算的并行履行,關于終究迅速得到猜測成果有很好的啟示效果。

3 結語

在現代電視媒體經營中,由于市場經濟體系機制的越來越完善,政府撥款扶持的情況已經越來越少,因而如何依靠其自身特有的資源創建收益,對電視媒體至關重要,其研究和應用具有很好的意義。本文主要研究如何更加有效地預測電視頻道收視率。頻道收視率是評價電視媒體經營效益的最好標準,電視媒體的一切目標的根基就是獲得更高的收視率,只有在這個前提下,其它經營活動,諸如廣告時間銷售,節目時間安排等才能正常有效地進行下去。

本文首先介紹了關于電視臺頻道收視率預測的當前狀況,然后提出了本文研究的收視率數據形式。針對收視率數據記錄形式,本文提出了基于決策樹分類學習方法,并針對實際數據,建立模型進行了預測。本研究課題提出了相應的軟件體系,并對該體系首要框架、首要模塊、首要接口以及相互間的交互行為進行了設計來解決頻道的收視率的猜測的疑問,該體系模塊根據現在的需要和潛在的不知道的需要范疇,依照軟件工程的基本原則,利用面向對象的思維進行的設計,減小了模塊之間的耦合性,使體系具有極好的可擴展性并留有將來的晉級接口。

[1]李善慶.基于數據挖掘的收視分析與決策系統的設計與實現[D].沈陽:東北大學,2007.LI Shanqing.Design and implementation of audience analysis and decision system based on data mining[D].Shengyang:Dongbei Univerisy,2007.

[2]俞晨潔.中國零售業的發展演變及投資機會[D].上海:上海交通大學,2006.YU Chenjie.Evolution and investment opportunities of China's retail industry[D].Shanghai:Shanghai Jiaotong University,2006.

[3]張凌.ID3算法的研究以及在成績統計輔助決策系統中的應用[D].廈門:廈門大學,2007.ZHANG Ling.The research of ID3 algorithm and the application in the assistant decision making system[D].Xiamen:Xiamen Unviersity,2007.

[4]柳學錚.多維數據關聯規則挖掘研究[D].長春:長春工業大學,2006.LIU Xuezheng.Research on association rule mining of multidimensional data[D].Changchun:Changchun Unviersity of Technology,2006.

[5]趙紅艷.決策樹技術在學生成績分析中的應用研究[D].濟南:山東師范大學,2007.ZHAO Hongyan.Application of decision tree technology in student performance analysis[D].Jinan:Shangdong Normal Unviersity,2007.

[6]云玉屏.基于C4.5算法的數據挖掘應用研究[D].哈爾濱:哈爾濱理工大學,2008.YUN Yuping.Application Research of data mining based on C4.5 algorithm[D].Harbin:Harbin University of Science and Technology,2008.

[7]何銘鋒.關于品牌識別、傳播與體驗的工作方法研究[D].長沙:湖南大學,2008.HE Mingfeng.Research on the methods of brand recognition,communication and experience[D].Changsha:Hunan University,2008.

[8]徐鵬,林森.基于C4.5決策樹的流量分類方法[J].軟件學報,2009,20(10)XU Peng,LIN Sen.Traffic classification method of C4.5 decision tree based on[J].Journal of software,2009,20(10).

[9]胡海斌,邱明,姜青山,等.一種基于數據繼承關系的C4.5分類優化算法[J].計算機研究與發展,2009,46(z2).HU Haibin,QIU Ming,JIANG Qingshan,et al.A C4.5 classification optimization algorithm based on data inheritance relationship[J].Computer research and development,2009,46(z2).

[10]黃愛輝.決策樹C4.5算法的改進及應用[J].科學技術與工程,2009,9(1).Huang Aihui.The improvement of decision tree C4.5 algorithm and its application[J].Science and technology and engineering,2009,9(1).

[11]劉鵬,姚正,尹俊杰,等.一種有效的C 4.5改進模型[J].清華大學學(自然科學版),2006,46(z1).LIU Peng,YAO Zheng,YIN Junjie,et al.An effective C 4.5 improved model[J].Tsinghua University(NATURAL SCIENCE EDITION),2006,46(z1).

[12]羅華,劉萍,韋有華.數據挖掘與數據倉庫技術及其在保險業中的應用[J].微計算機信息,2004(4).LUO Hua,LIU Ping,WEI Youhua.data mining and data warehouse technology and its application in the insurance industry[J].micro computer information,2004(4).

Television Ratings Prediction Research Based on Decision Tree Algorithm

SU YongZHOU Dangdang
(School of Computer Science and Engineering,Jiangsu University of Science and Technology,Zhengjian 212003)

This article after a lot of research work,for a variety of television ratings guess characteristic strategy proposed for television ratings guess planning and complete software system,and gives interactive object-oriented software model and thinking about the module planning and completion,the software system is a robust,reliable,scalable and useful.

prediction model,ratings,decision tree algorithms,TV programs

TP391

10.3969/j.issn.1672-9722.2017.11.009

Class Number TP391

2017年5月9日,

2017年6月25日

周蕩蕩,男,碩士研究生,研究方向:數據挖掘。蘇勇,男,博士,教授,研究方向:數據挖掘。

猜你喜歡
分類研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 国产精品网曝门免费视频| 在线欧美一区| 免费看黄片一区二区三区| 久久精品免费看一| 日本亚洲成高清一区二区三区| 国产永久在线观看| 女人爽到高潮免费视频大全| yjizz国产在线视频网| 在线观看国产精品一区| 国产欧美日韩精品第二区| 啪啪啪亚洲无码| 天堂中文在线资源| 四虎影视国产精品| 国产成人精品综合| 久久久黄色片| 欧美伊人色综合久久天天 | 欧美α片免费观看| 尤物成AV人片在线观看| 青青操视频在线| 国产v精品成人免费视频71pao| 超清人妻系列无码专区| 国产拍揄自揄精品视频网站| 毛片在线播放网址| 免费a在线观看播放| 国产成人精品18| 成人一区专区在线观看| 人妻一区二区三区无码精品一区 | 国产对白刺激真实精品91| 日韩av手机在线| 久久成人国产精品免费软件| 国产精品免费入口视频| 日本午夜在线视频| 日韩在线1| 久久夜夜视频| 99人妻碰碰碰久久久久禁片| 精品久久久久久中文字幕女| 任我操在线视频| 四虎影视无码永久免费观看| 亚洲欧洲自拍拍偷午夜色| 久久精品亚洲热综合一区二区| 国产精品19p| 日韩国产欧美精品在线| 国产精品成人免费视频99| 国精品91人妻无码一区二区三区| 人妻一本久道久久综合久久鬼色| 九九热精品视频在线| 午夜在线不卡| 91福利免费| 思思热精品在线8| 一本大道视频精品人妻| 免费看a毛片| 综合色亚洲| 97se亚洲综合在线天天| 久久亚洲精少妇毛片午夜无码| 美女高潮全身流白浆福利区| 久久精品无码一区二区日韩免费| 波多野结衣一区二区三视频| 亚洲精品制服丝袜二区| 老色鬼欧美精品| 伊人久久大香线蕉综合影视| 宅男噜噜噜66国产在线观看| 精品国产电影久久九九| 中文无码伦av中文字幕| 日韩av无码精品专区| 无码福利视频| 亚洲资源站av无码网址| 国产在线日本| 成人在线观看不卡| 五月婷婷精品| 成人午夜视频网站| 亚洲成网站| 污网站在线观看视频| 性色生活片在线观看| 精品自窥自偷在线看| 婷婷丁香色| 国产一区二区三区精品欧美日韩| 97影院午夜在线观看视频| 91在线免费公开视频| 首页亚洲国产丝袜长腿综合| 国产a v无码专区亚洲av| 久无码久无码av无码| 日韩A∨精品日韩精品无码|