999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據項目的成本度量

2021-11-05 18:49:00黃小強吳小慶韓珊
中國新通信 2021年18期
關鍵詞:大數據成本

黃小強 吳小慶 韓珊

【摘要】? ? 大數據技術在近年不斷快速發展,由于其不同于一般業務系統軟件的個性化特點,在數據采集、處理、分發、分析以及呈現等關鍵步驟上和傳統業務系統有較大差異。因此在對大數據項目進行成本度量時,需在通用的成本度量方法上,定制設計針對性的補充規則,從而指導大數據項目的成本度量實踐。

【關鍵詞】? ? 大數據? ? 軟件? ? 成本? ? 功能點? ? ?度量

一、大數據項目成本度量

2018年國家發布了國家標準《軟件工程 軟件開發成本度量規范》。但由于大數據項目的開發與傳統流程型項目的開發有較大區別,因此在使用國家標準進行軟件成本度量的過程中,遇到較多的問題。廣東電網針對大數據歷史項目數據的造價特點進行分析,在國家標準的基礎上對度量方法進行研究,致力于研究出適合大數據項目的度量方法。

二、數據項目成本度量規則

本文對收集到的真實發生的大數據歷史項目數據進行分析研究,開發費用基于軟件開發成本度量規范中推薦的NESMA功能點方法,設計出更清晰、更易操作的大數據項目成本度量規則,實施費用則基于實踐經驗,總結分析后得出。設計出具體的度量規則如下。

2.1數據預處理

大數據項目其中一個特點是數據源的多樣性,可以包含各種類型各種版本的數據庫、文本文件、網頁、日志,甚至包含圖片、視頻信息,也可能包括傳感器、軟硬件接口等信息來源。為確保后續工作能夠有一個高質量的數據集,在數據采集時往往會進行必要的預處理。針對數據預處理的相關成本度量規則如下:

開發費:由于預處理工作本身涉及格式轉換、協議解析、圖形識別等計算過程,因此這些功能應該識別為外部輸出EO;每一個預處理場景識別一個外部輸出,而不可依據抓取數據的字段進行識別;從結構化數據中獲取數據,如從數據庫、確定格式的excel、列表文件中獲取數據,不認可預處理功能項;針對一個數據源的同一數據對象,如存在多處需要進行預處理的信息,僅識別一次外部輸出;針對文本、網頁數據預處理調整因子取值1.2;針對圖形、音頻、視頻預處理調整因子取值1.3。

實施費:預處理的相關數據文件每增加一個,增加0.5人天工作量;預處理的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;預處理的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;預處理的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算;如預處理與數據采集同時進行,不單獨計算處理預處理的工作量,在數據采集時進行計算。

2.2數據采集

數據采集時如屬于使用非實時方式進行采集,往往使用ETL工具或程序腳本定期采集數據。而流式采集主要用在實時處理的業務場景,數據采集后就像一個水壩一般將上游源源不斷的數據攔截住,然后根據業務場景作對應處理,之后再寫入到對應的數據存儲中。針對數據采集的相關成本度量規則如下:

開發費:采集數據應識別為外部輸入EI;針對不同的數據對象來確定外部輸入;從不同的數據源頭,采集到相同的數據對象,如果數據源頭的數據格式相同,則不重復識別外部輸入;若不相同,則識別為不同的外部輸入;使用工具,通過配置方式進行數據采集時,調整因子取0.5;使用程序腳本進行數據采集時,調整因子取0.8。

實施費:采集的數據文件每增加一個,增加0.5人天工作量;采集的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;采集的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;采集的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算;如預處理與數據采集同時進行,不單獨計算處理預處理工作量,在數據采集時進行計算;流式采集數據實時處理完成,不計算額外采集所產生工作量。

2.3數據處理

常見的數據處理包括對數據存儲的常規管理,以及數據清洗、數據歸集、數據轉換、數據規約等過程。 針對數據處理的相關成本度量規則如下:

開發費:用于記錄數據對象的文件信息,如元數據、數據源頭等文件應識別為內部邏輯文件ILF;針對數據對象記錄文件的新增、刪除、修改等改變記錄信息的功能應識別為外部輸入EI;針對數據對象記錄的查詢應識別為外部輸出EO;針對數據對象或元數據的詳情查看應識別為外部查詢EQ;數據的清洗過程,包括缺省值、錯誤值檢測、去重、不一致檢查等,應識別為外部輸入EI;數據歸集的各類方法,包括同名異義、異名同義、單位不統一、容易屬性識別等,應識別為外部輸入EI;對同一數據對象的多種方法處理,不應識別多個外部輸入EI。

實施費:需要處理的數據文件每增加一個,增加0.5人天工作量;處理的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;處理的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;處理的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算;實施費用,不可因為分成多次處理,重復多次計費。

2.4數據分發

數據分發主要指數據通過網絡傳遞到不同節點的過程。針對數據分發的相關成本度量規則如下:

開發費:為完成數據分發目的,專門創建的對外發送文件可以識別為內部邏輯文件ILF;為完成數據分發目的,專門開發的程序接口可以識別為EO;通過ETL工具完成數據的分發,識別為EO,調整因子取0.5;如果是用開放數據權限,讓獲取方直接使用數據對象,則在當前應用的角度無需對功能點進行計數,而是應在主動獲取的應用角度計數相關開發功能。

實施費:分發的數據目的地每增加一處,增加0.5人天工作量;分發的數據數量級在1000萬條以下時,按每百萬行數據0.1人天實施工作量計算;分發的數據數量級在1000-5000萬條數據是,按百萬行數據0.05人天實施工作量計算;分發的數據數量級在5000萬條以上時,按百萬行數據0.025人天實施工作量計算。

2.5數據分析挖掘

數據分析挖掘是大數據應用體系中的關鍵支撐環節,是指從大數據中發現潛在未知的信息和模型的分析計算過程。針對數據分析挖掘的相關成本度量規則如下:

開發費:分析建立的模型記錄信息,識別為內部邏輯文件ILF;各類數據分析挖掘算法,包括決策樹分類、K均值聚類、支持向量機分類等算法,使用到每一種算法可以識別為一個外部輸出EO;多個數據對象進行同一個算法分析,不可重復填報算法分析EO。

實施費:數據分析屬于計算機進行的工作,程序調試好后,無需人工參與,不額外計算實施費。

2.6數據呈現

數據呈現類工作,以獲取并處理好的大數據為基礎,通過智能報表、專題報告、BI展示、平臺接口等方式展示應用數據。針對數據呈現的相關成本度量規則如下:

開發費:各類智能報表、專題報告、BI展示、平臺接口等均應該識別為外部輸出EO;針對多個數據對象進行同類的數據呈現,不可重復填報外部輸出EO。

實施費:針對呈現的頂層功能如何使用展開的操作培訓,可根據系統大小及培訓網點數量,按每次培訓0.5`2人天計算實施工作量。

三、驗證結果

基于以上規則的設計,選取本單位3個已發生的大數據歷史項目進行驗證。按照原規則(國家標準《軟件工程 軟件開發成本度量規范》)以及按照新規則(本文新設計的度量規則)評估出的工作量統計,與歷史項目的實際工作量進行比對分析(表1),單位均為人日。

可以看出,按原規則進行評估,其偏差率在-35%~-20%左右。按照本文設計的規則進行評估,更接近實際工作量的數值,偏差率優化為-5%~5%。依據驗證結果可得,本文設計的方法與原規則相比,優化了現有大數據項目成本度量的評估結果,更好地實現大數據項目的項目管理,提升管理的準確性。

四、結語

本文以《軟件工程 軟件開發成本度量規范》為基礎,結合大數據項目特點,設計了大數據項目各主要過程的開發費用、實施費用度量規則,提升了大數據項目成本度量的準確性和有效性,使大數據項目成本度量結果更加符合實際需求。

參? 考? 文? 獻

[1]王元卓, 靳小龍, 程學旗. 網絡大數據:現狀與展望[J]. 計算機學報, 2013(06):3-16.

[2]程學旗,靳小龍,王元卓等. 大數據系統和分析技術綜述[J]. 軟件學報,2014,25(9):1889-1908.

[3]GB/T 36964-2018.軟件過程 軟件開發成本度量規范[S].北京:中國標準出版社.2018.

[4]中國電子技術標準化研究院.2020年中國軟件行業基準數據[R].北京,2020.

[5]李華北. 軟件成本度量及造價分析[M]. 電子工業出版社,2018.

[6]張旸旸.軟件成本度量國家標準實施指南:理論.方法與實踐[M].電子工業出版社,2020.

黃小強(1988.06),男,漢族,廣東廣州,碩士,廣東電網有限責任公司,數字化部主管,高級工程師,研究方向:數字化項目造價管理。

吳小慶(1977.06),男,漢族,廣東廣州,碩士,廣州賽寶認證中心服務有限公司,軟件質量部主任,高級工程師,研究方向:信息化領域成本造價評估、軟件研發成本度量標準等。

韓珊(1991.05),女,漢族,廣東廣州,碩士,廣州賽寶認證中心服務有限公司,軟件質量部技術經理,研究方向:信息化領域成本造價評估。

猜你喜歡
大數據成本
2021年最新酒駕成本清單
河南電力(2021年5期)2021-05-29 02:10:00
溫子仁,你還是適合拍小成本
電影(2018年12期)2018-12-23 02:18:48
鄉愁的成本
特別健康(2018年2期)2018-06-29 06:13:42
“二孩補貼”難抵養娃成本
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
獨聯體各國的勞動力成本
揪出“潛伏”的打印成本
主站蜘蛛池模板: 久久semm亚洲国产| 亚洲欧美日本国产专区一区| 九色视频线上播放| 亚洲人视频在线观看| 伊大人香蕉久久网欧美| 久青草免费视频| 人妻丰满熟妇αv无码| 伊人精品视频免费在线| 中文字幕天无码久久精品视频免费 | 毛片免费在线| 亚洲国产欧美国产综合久久| av手机版在线播放| 亚洲一区二区精品无码久久久| 亚洲人成影视在线观看| 国产91色在线| 欧美日韩国产系列在线观看| 国产成人精品视频一区二区电影 | аⅴ资源中文在线天堂| 亚洲精品无码AⅤ片青青在线观看| 色综合天天综合中文网| 久热re国产手机在线观看| 国产成人精品视频一区视频二区| 成人小视频在线观看免费| 久久成人免费| 在线视频一区二区三区不卡| 日韩天堂视频| 国产91麻豆视频| 亚洲精选高清无码| 性欧美久久| 成人亚洲视频| 欧美午夜小视频| 欧美三级视频网站| 一级毛片免费观看久| 无套av在线| 国产好痛疼轻点好爽的视频| 91福利在线看| 五月婷婷综合网| 欧美亚洲第一页| 在线免费a视频| 欧美激情网址| 天天操天天噜| 国产探花在线视频| 欧美高清三区| 国产精品无码一二三视频| 影音先锋亚洲无码| 四虎永久在线精品影院| 无码在线激情片| 伦伦影院精品一区| 精品国产免费观看一区| 青青青国产免费线在| 中文字幕1区2区| 国产精品视频免费网站| 婷婷五月在线视频| 尤物在线观看乱码| 97视频精品全国在线观看| 男女男免费视频网站国产| 国产麻豆另类AV| 天天操精品| 亚洲国产精品VA在线看黑人| 69av在线| 91最新精品视频发布页| 国产日韩欧美一区二区三区在线| 亚洲欧美日本国产综合在线| 色综合五月| 日本免费高清一区| 奇米影视狠狠精品7777| 亚洲成人在线免费| 狠狠躁天天躁夜夜躁婷婷| 99视频免费观看| 久草视频福利在线观看| 91在线精品免费免费播放| h视频在线观看网站| 亚洲三级影院| 国产黑丝视频在线观看| 国产精品视频导航| 国产在线91在线电影| 国产无遮挡裸体免费视频| 久久人搡人人玩人妻精品| 久久77777| 天天综合网在线| 亚洲人成网站观看在线观看| 中文字幕天无码久久精品视频免费 |