周 紅,黃 文,黃 文 路
(廈門大學 建筑與土木工程學院,福建 廈門 361005)
建設工程施工合同是承包人與發包人從事施工活動所需遵循的行為準則,對雙方權利義務關系的界定起到至關重要的作用,承包商往往面臨著大量的合同風險審查工作[1-3]。為了盡量避免建設工程施工合同履行過程中可能出現的法律風險,審核人員往往需要在非常短的時間內檢查出所有施工合同條款內不合理的約定[4-6]。然而,這種完全依賴經驗判斷的人工審查方式不僅效率低下,而且還受審核人員主觀認識因素的嚴重影響。
隨著信息技術的發展,合同風險的客觀性評價方法開始受到國內外學者的關注。國外研究方面,Lee等[7]將國際工程承包合同中常見的11種不利于承包人的文字表述方式轉化為語義規則,開發了一種基于自然語言處理的風險條款自動抽取模型,該模型能夠自動從業主提供的施工合同條件中識別出符合上述規則的風險條款。在此基礎上,Lee等[8]還提出了一種施工合同風險主動評估模型,通過與FIDIC合同條件進行規則比較,該模型能夠對業主提供的施工合同進行語義推理,從中發現被故意省略的、本應有利于承包商的條款部分。國內研究方面,盛越[9]提出了一種基于本體推理的技術合同風險評估方法,根據預先在技術合同本體中確立的語義規則,該方法使用Jena推理機對輸入的合同文本進行規則推理,從而判斷其中的邏輯風險。然而上述研究均未能發掘施工合同條款中所存在的豐富的語義知識,這是導致合同風險客觀性評價方法的研究成果尚不深入的重要原因之一。例如在Lee等[7-8]的研究中,針對條款文本的語法規則分析僅停留在并列語句拆分的層面,導致風險條款自動抽取模型很容易受語句中其他修飾成分的影響而出錯。而本體作為一種知識描述模型,能夠存儲施工合同中各類關鍵概念的含義及其相關關系,從而為自然語言的認識和理解提供重要幫助。
針對上述研究的不足,本文以七步法的主要步驟為基礎框架,結合五步循環法和骨架法的優點,提出了適合建設工程合同特點的領域本體開發方法——八步循環法,以滿足施工合同知識專業性、綜合性的特點,并使用Protégé本體編輯工具,進行了施工合同領域本體的開發和語義網絡關系的構建。本文所構建的施工合同領域本體,實現了施工合同條款的語義知識建模,可以在施工合同基于規則的結構化處理中提供關鍵知識,從而為合同風險的智能識別和診斷提供重要基礎。
本體開發的目的是為了盡可能詳細、準確地描述某一特殊領域的概念知識框架,從而方便知識的表示、組織和管理[10]。盡管近年來各種不同領域的本體及開發方法相繼提出,然而現行的本體開發依舊沒有完整的方法論來支撐,因此,構建一個科學、完整的本體,往往需要結合多種本體開發方法來進行構建。本文梳理現有的本體開發方法的優缺點,結合七步法、五步循環法與骨架法,并依據施工合同知識,提出一種適用于建設工程合同領域的本體開發方法。
隨著計算機技術的發展,本體論和本體技術逐步應用于信息集成、知識管理等領域,在實踐中產生了一些頗具影響力的本體開發方法,例如骨架法、五步循環法以及七步法等。
骨架法[11],也稱為EO工程法,由愛丁堡大學的人工智能應用研究所構建企業本體的經驗總結而來,包括確定本體應用目的和范圍、本體分析、本體表示、本體評價及本體建立5個步驟。該方法提供了本體開發的指導方針,具有指導意義,但缺少本體開發過程中的具體技術及方法。
五步循環法[12]適用于語義網本體的構建,重視本體構建過程中的循環迭代,包括本體導入、本體抽取、本體修剪、本體精細及本體評價5個循環往復的步驟。然而該方法對整個循環的初始步驟不夠重視,不利于大規模語義網本體的建設。
七步法[13]是斯坦福大學所提出的適用于領域本體開發的方法,其步驟如圖1所示。七步法已得到國內外眾多學者的廣泛使用,具有開發流程清晰、操作步驟簡單、通用性強等特點,但缺少檢查和評估以及用戶反饋的環節。
合同是一種具有法律效力的書面文本語言,語法規則和文本詞匯與日常生活用語存在著明顯區別[14],術語專業性高,因此對其進行本體開發時需要注意術語的準確性;且施工合同知識綜合性強[15],需要在本體的構建過程中不斷修改、補充和細化,以保證所構建的本體具有完整的層次結構。然而現有的本體開發方法難以滿足上述施工合同領域本體構建的要求。七步法缺少必要的評估和反饋機制,在構建過程中無法實現施工合同領域本體的更新和完善;五步循環法在初始化階段存在準確性不足的問題,未能明確定義施工合同領域知識;骨架法只提出了本體構建的指導方針,對于包含大量概念與關系的施工合同領域本體來說,可操作性較低。
為解決上述問題,本文綜合七步法、五步循環法和骨架法的優點,提出了適用于建設工程合同領域的本體開發方法,主要思路如下:
(1) 由于七步法經過長期的研究實踐已經趨于成熟,因此新的方法以七步法的主要步驟為基本框架;
(2) 為實現本體開發時的修改、補充和細化,在枚舉本體的重要術語時吸收五步循環法中本體修剪的優點,去除知識相關度低的術語,在定義類的特性時引入五步循環法中本體精細的步驟,以調整類及類的特性的概念粒度;
(3) 為克服七步法單向、一次性開發方式的弊端,使本體在循環迭代的構建過程中不斷完善,在知識框架搭建完成之后,加入骨架法的本體評價環節,評價結果作為反饋重新進入知識框架的搭建環節。
由于該開發方法主要由八大步驟組成,且中間存在循環往復的過程,可稱之為“八步循環法”,主要步驟包括:確定本體的領域和范圍、考慮現有本體的復用、枚舉本體的重要術語與本體修剪、定義類和類層次、定義類的特性與本體精細、定義特性的約束、本體評價與檢驗、生成實例,具體方法如圖2所示。
就目前而言,Protégé是國內外最常用的本體開發工具,七步法的步驟便是斯坦福大學醫學院基于Protégé所提出,本文所歸納的八步循環法以七步法為主要框架,同樣可以在Protégé平臺上進行領域本體的實現,可應用于建設工程合同領域本體的構建。
領域本體的開發應遵循5條基本原則[16]:清晰性(Clarity)、一致性(Coherence)、可擴展性(Extendibility)、最小編碼傾向(Minimal Encoding Bias)、最小本體化承諾(Minimal Ontological Commitment)。清晰性原則要求所構建的本體能有效表達施工合同領域術語概念的內在含義;一致性原則要求本體能在聲明和內部規則內進行推理;可擴展性原則要求施工合同領域本體具有嚴密的分類邏輯和層次結構,可以后續添加新的合同領域術語;最小編碼傾向原則要求施工合同領域本體可在其他系統環境中復用,以完成后續的語義理解及規則推理任務,并具有最小編碼成本;在滿足上述原則的基礎上,本體的建模對象應是施工合同領域的核心概念,保證最大化精簡,滿足最小本體化承諾原則。
遵循上述原則,按照八步循環法的具體步驟,結合施工合同領域知識,進行施工合同領域本體的構建。
對于建設工程施工合同,本體構建的目標是以形式化語言描述施工合同中的關鍵概念及其相關關系。由于施工合同管理與項目管理理論、建設法律法規具有很高的關聯性,因此選取《中華人民共和國建筑法》作為概念補充,并在本體構建的過程中結合項目管理理論對本體的科學性進行分析論證。該本體的領域為施工合同管理,范圍則以建設工程施工合同文本為主,相關法律法規和項目管理理論為輔。
盡管近年來國際工程承包領域的施工合同本體開發[7,17]已經取得了一定的進展,但目前尚未發現針對我國建設工程施工合同領域本體構建的相關研究。
由于《建設工程施工合同(示范文本)》(GF-2017-0201)(以下簡稱《示范文本》)是諸多國內建筑企業簽訂施工合同所采用的標準文本或重要參照,因此選取《示范文本》中合同協議書和通用合同條款的部分章節進行術語枚舉:① 合同協議書。合同協議書是對項目基本情況的概括約定,抽取出其中的核心概念;② 第一節“一般約定”。“一般約定”對通用文本內的常用詞語進行了定義和解釋,而從定義中延伸出的術語也可以作為領域本體知識框架的一部分;③ 第二節“發包人”和第三節“承包人”。簽訂施工合同的主要目的之一就是明確合同當事人的權利義務關系,因此對這兩個章節進行抽取,能夠很好地覆蓋當事人行動以及這些行動所涉及的其他事物;④ 各個章節條款的小標題。小標題一般以高度概括條款內容的名詞短語形式出現,從中抽取到的術語可以有效提高本體知識框架的廣度和深度。同時,對《中華人民共和國建筑法》全文中的重要術語進行枚舉,以作為概念補充。
通過實驗,從《示范文本》中提取術語374個,例如開工日期、永久工程、暫停施工等;從《中華人民共和國建筑法》中提取術語225個,例如建設單位、施工許可證、拆遷、資質審查等,總計599個。隨后對術語列表進行修剪,通過合并同義概念、刪除不相干術語等操作,最終得到施工合同領域詞表,如圖3所示,共包含術語408個。
分類學(Taxonomy)是一門講述分類方法的科學,由于能夠判斷不同術語單位之間的上下位關系,在國內外本體開發研究中起到了重要作用,是進行類的層次定義和知識結構組織的重要理論依據。
本文以分類學為基礎,首先確定了行為人、產品、約定、環境與條件、資源、行為、環節7個大類,再以此為基礎采用從上至下的方法定義類和類的層次,最終構建出7個大類及其層次圖(見圖3)。
(1) 行為人。行為人是在施工合同法律關系中行使權利并承擔義務的主體,可能是自然人、法人或非法人組織等。
(2) 產品。產品是指行為人通過消耗一定量的資源而創造的,能夠促進合同目的實現的客觀事物或智力、勞動成果。
美國法中涉外專利之訴的法律適用與執行——基于管轄與禁令執行的分析 ......................趙 雷 02.90
(3) 約定。約定是指雙方當事人在合同中協商確定的,應當發生在行為人之間的某些聯系,這種聯系在合同管理理論中又被稱作合同法律關系的內容。
(4) 環境與條件。環境與條件特指那些能夠對當事人權利義務的設立、變更和消滅產生重要影響的客觀事物。當合同條款中出現這些術語時,常常表示行為必須在某種情況(環境)下做出,或只有某種情況(條件)成立后才會被允許。
(5) 資源。資源是指那些行為人為從事某項行為或創造某項產品而必須消耗的、具有一定價值的事物。這些事物的價值既可能是一次性的,使用完畢后會自動消滅;也可能是重復性的,只不過在使用過程中會發生大幅折減。
(6) 行為。根據施加主體是行為人還是客觀事物,可以劃分為人稱行為與非人稱行為兩個下屬類。
(7) 環節。環節是指從簽訂施工合同開始到合同履行完畢,即雙方當事人權利義務終止這段時間內施工活動的關鍵節點。
類的特性包括類的關系和類的屬性。定義類的屬性,首先需要從領域詞表中去除類的集合,接著從其中篩選出屬于屬性名稱的術語,再根據經驗將其與每個類一一對應。定義類的關系,需要根據社會經驗構建類的關系集合,再從集合中選取一個最能描繪兩者之間相互作用的元素。在該步驟中,需不斷調整本體的概念粒度,注重知識框架層次的劃分。
現以項目經理和承包人的關系為例來說明類的關系的定義與應用。項目經理是承包人正式聘用的員工,能夠繼承其父類概念的類的關系“承包人人員-受雇于-承包人”。同時,項目經理又是工程項目管理的主要負責人,能夠代表承包人行動,因此兩者之間還存在一種特殊的雇傭關系——代表關系,即“項目經理-代表了-承包人”,其中“代表了”是“受雇于”的子類,并與“有職工”的子類“有代表”互逆。此時,項目經理滿足“承包人人員”“受雇于-承包人”“代表了-承包人”3個必要條件。但相應地,如果某個自然人同時具備“承包人人員”“受雇于-承包人”“代表了-承包人”這3個條件,根據一般社會經驗則可以判斷出他的職業應當是項目經理,因此,還需要將必要條件轉化為充要條件,才能最終科學、完整地表現項目經理與承包人的相關關系。
在施工合同領域本體開發中,還可以通過設定不同的約束,如域和范圍(Domain and Range)等,對特性作出更加明確的定義。域是指特性的定義域,用于聲明何種類才能具有這一特性;范圍是指特性的值域,用于聲明這一特性的值應當屬于何種類。
根據《注冊建造師管理規定》第二十一條和第二十六條規定,任何一個注冊建造師都不得同時擔任兩個工程項目的負責人或同時在兩家建筑企業執業。因此在一個建設工程施工合同中,一個項目經理只能代表唯一的一個承包人,它們存在普遍性限制,此時,類的關系“代表了”的域是“項目經理”類,范圍是“承包人”類。
原型本體構建完成后,應當邀請領域專家結合清晰性、可擴展性等指標對本體是否具備合理性、是否滿足使用需求等問題進行綜合判斷。如果在上述過程中發現問題,則說明原型本體還需進一步修改完善,開發流程回轉到2.4節定義類和類層次。
實例是類的具體目標對象,是類在現實世界的具象表達,因此能夠繼承類的屬性;同時實例又是一個具有原型的實體,因此應當具有確切的屬性值。生成類的實例步驟較為簡單,只需先選擇所屬類,再根據實際填充屬性值即可。
按照施工合同領域本體構建的流程(見圖2),使用Protégé進行本體的開發與實現,并對所構建的施工合同領域本體進行了一致性與完整性檢驗,驗證了該開發方法的可行性。
Protégé開發本體通常包括建立實體類、建立對象屬性及數據屬性、設定域與范圍和創建實體對象4個步驟,依次對應八步循環法中定義類和類層次、定義類的特性與本體精細、定義特性的約束及生成實例4個步驟。由于施工合同本體涉及概念較多,且行為人知識框架的復雜程度較高,不同概念之間的實際聯系也比較豐富,現以行為人及其下屬類的關系集合與語義關系網絡圖的Protégé實現來進行說明。
(1) 建立實體類。根據在“定義類和類層次”中所定義的行為人下屬類及其層次,在Protégé中依次添加實體類及其節點,最終得到行為人下屬類及其層次結構圖,可視化結果如圖4所示。
(2) 建立對象屬性。在Protégé中分別通過對象屬性(Object Properties)和數據屬性(Data Properties)對類的關系和類的屬性進行表示。根據項目管理經驗,首先構建行為人及其下屬類的關系集合,結果如圖5所示。
項目經理繼承了其父類概念的對象屬性“承包人人員-受雇于-承包人”,同時又與承包人存在雇傭關系,即“項目經理-代表了-承包人”,因此,某個具備“承包人人員”“受雇于-承包人”“代表了-承包人”這3個條件的自然人與項目經理互為充分必要條件,可以在Protégé中通過設定“項目經理”的對象屬性“Equivalent To”(等同于)及“Subclass Of”(子類)描述此類關系,如圖6所示。
施工合同的語義理解和推理,只需要定義到類和類的層次即可實現,所以在施工合同領域本體的構建中暫不考慮域與范圍的設定和實例的信息建模。
最終構建成功的行為人及其下屬類語義關系網絡如圖7所示,不同顏色、虛實與指向的線代表不同的類的關系,例如承包人屬于合同當事人的下屬類,以藍色實線表示,箭頭由合同當事人指向承包人,同時承包人與檢測機構存在提供實驗服務關系,以紅色虛線表示,箭頭由檢測機構指向承包人。
經過多次循環評價與檢驗,最終完成施工合同領域本體的開發工作。本文在Protégé中啟用Pellet推>理機檢查了本體的一致性,未發現內部聲明矛盾。為進一步體現本文所開發的建設工程施工合同領域本體的適用性,隨機選取了《示范文本》的部分條款及某房地產企業已應用于工程實踐的施工合同的部分條款,對本體知識的完整性進行驗證,結果如圖8,9所示。總體來看,施工合同領域本體能夠涵蓋合同文本內的絕大多數核心概念,符合最小本體化承諾原則的要求。由于本研究所構建的本體只針對建設工程合同領域,諸如代詞“其”、形容詞“詳細的”、介詞“除”以及不表達專業含義的“具體內容”等詞語無需構成本體內容,因此僅少量非核心字或詞組未被標注,且不影響本體知識完整性。
目前本體技術在合同管理中已開展了一些研究,但尚未有建設工程合同領域本體的開發方法及其構建的研究。本文以建設工程施工合同文本為主,相關法律法規和項目管理理論為輔,提出了建設工程合同領域本體的開發方法,并構建了施工合同領域本體。
(1) 綜合七步法、骨架法和五步循環法的特點,提出適用于建設工程合同領域的本體開發方法——八步循環法,該方法以七步法的步驟為主要框架,引入了五步循環法中本體修剪與本體精細兩個步驟及骨架法的評價環節,能夠在開發過程中對本體知識框架不斷精細化,保證了施工合同領域本體的構建質量。
(2) 運用該方法完成了施工合同領域本體的開發,所開發的施工合同領域本體包括行為人、產品、約定、環境與條件、資源、行為和環節7個術語大類,總計408個術語概念及其相關關系。
(3) 按照八步循環法所構建的施工合同領域本體,依托Protégé實現了領域本體的開發,所保存的本體文件可導出并應用于后續建設工程領域合同風險智能化審查研究,最后采用《示范文本》片段與某工程施工合同實例完成了本體一致性與完整性的檢驗,驗證了該開發方法的可行性與準確性。
建設工程施工合同中不同類別的條款具有不同的表意方式和語法規則特征,通過本文所構建的施工合同領域本體,它們能夠轉化為形式語言而被計算機所理解。本文的研究為基于規則的合同風險智能化審查算法奠定了基礎,在此基礎上可進一步完成施工合同風險條款的識別。