999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于稀疏表示的數(shù)據(jù)無失真壓縮模型構(gòu)建

2023-12-09 02:55:30孫壯
電子設(shè)計工程 2023年23期
關(guān)鍵詞:實驗模型

孫壯

(曲阜師范大學,山東濟寧 272000)

在數(shù)據(jù)分析研究過程中,數(shù)據(jù)壓縮是一個基礎(chǔ)問題。一方面,數(shù)據(jù)壓縮能夠減小存儲空間,降低傳輸成本;另一方面,數(shù)據(jù)壓縮可以降低數(shù)據(jù)挖掘復(fù)雜度,并且可以保障數(shù)據(jù)內(nèi)容的完整性與精確性。在常規(guī)的數(shù)據(jù)應(yīng)用場景中,通信傳輸容量存在限制,對原始數(shù)據(jù)進行壓縮是保障有效傳輸?shù)年P(guān)鍵手段之一[1-2]。數(shù)據(jù)壓縮需要滿足下述需求:一是保留原始數(shù)據(jù)局部、全局特征,并可以通過某種手段還原原始數(shù)據(jù);二是數(shù)據(jù)壓縮運算不能夠過于繁瑣、復(fù)雜,保障壓縮、解壓與隨機訪問速度。就現(xiàn)有研究成果來看,已有數(shù)據(jù)壓縮模型由于應(yīng)用方法自身缺陷,致使壓縮后數(shù)據(jù)容易出現(xiàn)失真現(xiàn)象,影響原始數(shù)據(jù)的精確性,故提出基于稀疏表示的數(shù)據(jù)無失真壓縮模型構(gòu)建方法。

1 數(shù)據(jù)無失真壓縮模型構(gòu)建研究

1.1 數(shù)據(jù)稀疏表示

為了避免數(shù)據(jù)壓縮出現(xiàn)失真現(xiàn)象,基于超完備字典學習方法稀疏表示數(shù)據(jù),簡化數(shù)據(jù)的結(jié)構(gòu),為后續(xù)數(shù)據(jù)缺失填補奠定堅實的基礎(chǔ)。

超完備字典學習方法主要應(yīng)用于數(shù)據(jù)稀疏表示基函數(shù)獲取階段,通過系數(shù)與稀疏表示基函數(shù)使得原始數(shù)據(jù)特征不改變[3]。設(shè)定超完備字典為L∈Rm×n,數(shù)據(jù)樣本集合為,其對應(yīng)的稀疏表示系數(shù)向量集合為。其中,m為數(shù)據(jù)樣本總數(shù)量,n為稀疏表示系數(shù)總數(shù)量,則超完備字典學習原理表達式為:

以式(1)確定的超完備字典學習過程為基礎(chǔ),制定超完備字典學習[4-5]具體步驟,具體如下所示:

步驟1:超完備字典初始化。基于給定的過完備字典或者數(shù)據(jù)樣本對字典進行初始化處理;

步驟2:稀疏編碼。以步驟1 初始化后的字典L為基礎(chǔ),基于正交匹配追蹤算法求解每一個數(shù)據(jù)樣本ai對應(yīng)的稀疏系數(shù)向量bi。

步驟3:超完備字典更新。以步驟2 計算的稀疏系數(shù)向量bi為依據(jù),對超完備字典L進行更新處理。依據(jù)上述步驟對L中所有原子進行逐列更新,從而產(chǎn)生新的超完備字典。

步驟4:數(shù)據(jù)稀疏表示。將采集的數(shù)據(jù)y輸入至更新后的超完備字典中,獲取稀疏系數(shù)[6]向量{b1,b2,…,bi,…,bn},則數(shù)據(jù)稀疏表示為:

根據(jù)上述過程完成數(shù)據(jù)的稀疏表示,并制定超完備字典的更新方式,以此來保障稀疏系數(shù)向量獲取的精準度,為最終數(shù)據(jù)壓縮的實現(xiàn)提供便利。

1.2 數(shù)據(jù)聚類處理

以稀疏表示后的數(shù)據(jù)為基礎(chǔ),計算數(shù)據(jù)之間的相似度,應(yīng)用譜聚類算法[7-8]聚類數(shù)據(jù),以此降低數(shù)據(jù)壓縮的運算量。

采用自身乘以自身轉(zhuǎn)置的方式,將數(shù)據(jù)稀疏系數(shù)向量轉(zhuǎn)化為n×n方陣,以此為基礎(chǔ),計算任意兩個數(shù)據(jù)yi與yj之間的相似度函數(shù),表達式為:

式中,ηij為數(shù)據(jù)yi與yj之間的相似度函數(shù);為稀疏系數(shù)方陣的相似權(quán)重。

以譜聚類算法為手段,獲取ηij對應(yīng)的對角矩陣U與拉普拉斯矩陣V[9-10],對拉普拉斯矩陣V進行求解,獲取多個特征向量,并對其進行降序排列,通過標準化處理,獲得向量S=[s1,s2,…,sk],sk代表第k個拉普拉斯矩陣V特征向量[11-12]。以向量S的行向量si為聚類中心,以數(shù)據(jù)與聚類中心si之間的歐氏距離為依據(jù),劃分數(shù)據(jù)類別,具體規(guī)則如下式所示:

式中,dij為聚類中心si與數(shù)據(jù)yj的歐氏距離;γ′為歐氏距離的輔助計算參數(shù);ε0為誤差項;d*為聚類歐氏距離閾值。當dij≤d*時,將數(shù)據(jù)歸到ci類;當dij>d*時,將數(shù)據(jù)歸到其他類。

依據(jù)上述規(guī)則遍歷全部數(shù)據(jù),直至聚類結(jié)束為止,獲得數(shù)據(jù)聚類結(jié)果為{c1,c2,…,cp},為最終的數(shù)據(jù)壓縮提供依據(jù)。

1.3 數(shù)據(jù)缺失填補

在數(shù)據(jù)稀疏表示與聚類處理過程中,容易出現(xiàn)數(shù)據(jù)丟失現(xiàn)象,造成數(shù)據(jù)缺失,影響數(shù)據(jù)的最終壓縮與應(yīng)用。因此,此研究應(yīng)用SoftImpute 算法[13]填補缺失數(shù)據(jù),為后續(xù)無失真壓縮的實現(xiàn)做好準備。

數(shù)據(jù)缺失填補程序如圖1 所示。

如圖1 所示,采用Lasso 優(yōu)化求解來估計缺失數(shù)據(jù),表達式為:

將式(5)估計的缺失數(shù)據(jù)填補到數(shù)據(jù)缺失位置,即可完成數(shù)據(jù)的缺失填補,為數(shù)據(jù)的完整性提供保障。

1.4 數(shù)據(jù)無失真壓縮

以缺失填補后的數(shù)據(jù)聚類集合C={c1,c2,…,cp}為基礎(chǔ),應(yīng)用k-means 算法[16]對數(shù)據(jù)進行無失真壓縮,為數(shù)據(jù)的應(yīng)用提供便利。

基于PredZip 算法的數(shù)據(jù)無失真壓縮框架如圖2所示。

圖2 數(shù)據(jù)無失真壓縮框架圖

數(shù)據(jù)無失真壓縮主要劃分為兩個階段,分別為算術(shù)編碼階段與概率預(yù)測階段。對數(shù)據(jù)進行獨立編碼,編碼后數(shù)據(jù)向量只有一個維度的值為1,其余值均為0,例如00000001、01000000 等。概率預(yù)測階段主要是對數(shù)據(jù)概率分布數(shù)值進行預(yù)測,以此來保障壓縮數(shù)據(jù)的準確性。

上述過程實現(xiàn)了數(shù)據(jù)的無失真壓縮,節(jié)省了存儲空間,為管理人員提供更簡便的數(shù)據(jù)支撐。

2 實驗與結(jié)果分析

選取基于分布式壓縮感知和邊緣計算的配電網(wǎng)電能質(zhì)量數(shù)據(jù)壓縮存儲方法與基于變形場測量數(shù)據(jù)主元壓縮的模型參量反求方法作為對比模型,設(shè)計數(shù)據(jù)無失真壓縮對比實驗,以此來驗證構(gòu)建模型數(shù)據(jù)壓縮性能。

2.1 實驗數(shù)據(jù)準備

選取某公司財務(wù)管理系統(tǒng)財務(wù)數(shù)據(jù)作為實驗對象,由于財務(wù)數(shù)據(jù)體量較大,若直接對其進行應(yīng)用,會造成實驗過程較長,運算量過大等缺陷,也會導致實驗結(jié)論的偏差。因此,在公司財務(wù)管理系統(tǒng)中隨機選取1 100 MB 財務(wù)數(shù)據(jù)作為實驗數(shù)據(jù),將其隨機劃分為10 個實驗組別,為后續(xù)實驗的進行提供便利。實驗組別如表1 所示。

表1 實驗組別

如表1 所示,劃分的10 個實驗組別中,財務(wù)數(shù)據(jù)量與財務(wù)數(shù)據(jù)類別具有較大的差別,表明每個組別的實驗工況存在一定的差異,符合數(shù)據(jù)壓縮模型應(yīng)用性能測試需求。

2.2 評價指標選取

為了直觀顯示構(gòu)建模型的應(yīng)用性能,選取壓縮增益、壓縮比與壓縮失真率作為評價指標進行測試。常規(guī)情況下,壓縮增益數(shù)值越大,壓縮比與壓縮失真率數(shù)值越小,表明數(shù)據(jù)壓縮性能越好;反之,壓縮增益數(shù)值越小,壓縮比與壓縮失真率數(shù)值越大,表明數(shù)據(jù)壓縮性能越差。

2.3 實驗結(jié)果分析

以上述準備的實驗數(shù)據(jù)選取的評價指標為基礎(chǔ),進行財務(wù)數(shù)據(jù)壓縮實驗,記錄實驗數(shù)據(jù),計算評價指標數(shù)值,具體如圖3 所示。

圖3 評價指標數(shù)據(jù)圖

如圖3(a)數(shù)據(jù)所示,相較于兩種對比模型,應(yīng)用構(gòu)建模型獲得的財務(wù)數(shù)據(jù)壓縮增益數(shù)值更大,最大值為18.8;如圖3(b)數(shù)據(jù)所示,相較于兩種對比模型,應(yīng)用構(gòu)建模型獲得的財務(wù)數(shù)據(jù)壓縮比數(shù)值更小,最小值為0.1;如圖3(c)數(shù)據(jù)所示,相較于兩種對比模型,應(yīng)用構(gòu)建模型獲得的財務(wù)數(shù)據(jù)壓縮失真率數(shù)值更小,最小值為0.5%,充分證實了構(gòu)建模型數(shù)據(jù)壓縮性能更佳。

3 結(jié)束語

財務(wù)數(shù)據(jù)是企業(yè)運營管理的主要依據(jù),也是重要決策制定的關(guān)鍵因素。但是,隨著信息化水平的提升,企業(yè)財務(wù)數(shù)據(jù)數(shù)量呈現(xiàn)暴增趨勢,為財務(wù)數(shù)據(jù)存儲、應(yīng)用帶來了極大的挑戰(zhàn)。很多企業(yè)由于存儲空間不足,刪除較為久遠的財務(wù)數(shù)據(jù),待需要時無從取證。由此可見,如何對財務(wù)數(shù)據(jù)進行無失真壓縮處理是保障企業(yè)可持續(xù)發(fā)展的關(guān)鍵手段,故提出基于稀疏表示的數(shù)據(jù)無失真壓縮模型構(gòu)建研究。實驗數(shù)據(jù)表明,構(gòu)建模型大幅度提升了數(shù)據(jù)壓縮增益,降低了數(shù)據(jù)壓縮比與壓縮失真率,能夠為財務(wù)數(shù)據(jù)處理提供更有效的模型支撐,也為相關(guān)研究提供一定的借鑒。

猜你喜歡
實驗模型
一半模型
記一次有趣的實驗
微型實驗里看“燃燒”
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
做個怪怪長實驗
3D打印中的模型分割與打包
NO與NO2相互轉(zhuǎn)化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 97精品久久久大香线焦| 在线观看91精品国产剧情免费| 国产96在线 | 成人中文字幕在线| 久久精品无码一区二区日韩免费| 美女毛片在线| 欧美日韩免费观看| 午夜限制老子影院888| 日本妇乱子伦视频| 国产美女视频黄a视频全免费网站| 2024av在线无码中文最新| 无码一区中文字幕| 日韩免费毛片视频| 日本手机在线视频| 国产精品片在线观看手机版 | 狠狠色丁香婷婷| yjizz国产在线视频网| 54pao国产成人免费视频| 青青青国产精品国产精品美女| 日本人真淫视频一区二区三区| 国产亚洲现在一区二区中文| 国产精品视频观看裸模| 亚洲天堂首页| 9丨情侣偷在线精品国产| 91精品国产无线乱码在线| 久久国产乱子| 91视频免费观看网站| 九九热视频精品在线| 激情六月丁香婷婷四房播| 露脸一二三区国语对白| 伊人中文网| 重口调教一区二区视频| 国产黑丝一区| 色婷婷久久| 亚洲综合极品香蕉久久网| 国产精品va免费视频| 国产激情无码一区二区免费| 国产青榴视频在线观看网站| www.91在线播放| h视频在线观看网站| 亚洲视频在线网| 亚洲欧美成人在线视频| 欧美激情第一区| 欧美一级片在线| 国产导航在线| 亚洲h视频在线| 亚洲男人天堂久久| 激情六月丁香婷婷| 亚洲无线视频| 久久人与动人物A级毛片| 在线色国产| 91精品最新国内在线播放| 亚洲欧美在线看片AI| 欧美中文字幕一区| 欧美日韩国产综合视频在线观看| AV无码无在线观看免费| 欧美激情视频一区| 亚洲欧美色中文字幕| 亚洲男人在线| 国产精品亚洲综合久久小说| 青草娱乐极品免费视频| 欧美日韩第二页| 欧美日本在线一区二区三区| 亚洲无线观看| 波多野结衣无码AV在线| 91精品视频网站| 国产色伊人| 欧美一级一级做性视频| 99精品久久精品| 国产福利一区在线| 色综合久久无码网| 国产精品久久自在自线观看| 青草视频免费在线观看| 国产成人精品三级| 美女无遮挡免费视频网站| 91香蕉视频下载网站| 亚洲免费黄色网| 成人午夜在线播放| 一本色道久久88综合日韩精品| 99久久精品无码专区免费| 欧美国产日韩在线观看| 色噜噜久久|