《中國人工智能學會:2016中國人工智能系列白皮書——可拓學(73頁).pdf》由會員分享,可在線閱讀,更多相關《中國人工智能學會:2016中國人工智能系列白皮書——可拓學(73頁).pdf(73頁珍藏版)》請在三個皮匠報告上搜索。
1、 中國中國人工智能系列人工智能系列白皮書白皮書 -可拓學可拓學 中國中國人工智能學會人工智能學會 二二一一六六年年九九月月 中國人工智能系列白皮書可拓學 2 目 錄 第 1 章 可拓學概述 . 1 1.1 可拓學的學科體系 . 1 1.1.1 可拓學的定義和定位 . 1 1.1.2 可拓學的理論體系可拓論. 1 1.2 可拓學的方法體系可拓創新方法 . 3 1.2.1 拓展分析方法 . 5 1.2.2 共軛分析方法 . 5 1.2.3 可拓變換方法 . 5 1.2.4 可拓集方法 . 5 1.2.5 優度評價方法 . 6 1.3 可拓工程 . 6 1.3.1 可拓學在人工智能領域的應用. 6
2、1.3.2 可拓學在工程技術領域的應用. 9 1.3.3 管理可拓工程 . 10 1.3.4 可拓學與其他領域的交叉融合. 10 第 2 章 可拓策略生成方法與系統 . 11 2.1 引言 . 11 2.2 可拓策略生成的一般方法 . 12 2.2.1 問題的形式化界定方法 . 12 2.2.2 問題相容性的判斷方法 . 13 2.2.3 問題相關度的計算方法 . 13 2.2.4 拓展分析方法與共軛分析方法. 13 2.2.5 可拓變換及其篩選方法 . 14 2.2.6 可拓策略的優度評價方法 . 15 中國人工智能系列白皮書可拓學 3 2.3 可拓策略生成系統 . 15 2.3.1 ESG
3、S 的主要功能模塊 . 15 2.3.2 應用 ESGS 求解不相容問題的一般步驟 . 18 2.3.3 ESGS 的軟件架構 . 19 2.4 ESGS 軟件研制情況 . 19 2.5 結束語 . 20 第 3 章 基于可拓學的數據挖掘研究與應用 . 21 3.1 引言 . 21 3.2 可拓分類知識獲取 . 22 3.3 傳導知識獲取. 24 3.4 基于知識庫的可拓知識獲取 . 24 3.4.1 拓展型可拓知識獲取 . 24 3.4.2 從知識庫中獲取可拓知識的理論基礎 . 25 3.4.3 基于決策樹知識的可拓知識獲取 . 25 3.5 智能知識的挖掘算法、技術與管理 . 26 3.5
4、.1 轉化規則挖掘方法 . 26 3.5.2 基于多目標線性規劃的二次挖掘方法 . 27 3.5.3 智能知識管理系統設計技術 . 27 3.5.4 知識可拓優化技術 . 27 3.6 可拓模式識別 . 28 3.7 可拓神經網絡 . 29 3.7.1 可拓神經網絡的基本思想 . 30 3.7.2 可拓神經網絡的類型與算法分析 . 30 3.8 應用研究成果. 34 3.8.1 基于可拓數據挖掘的客戶價值獲取 . 34 3.8.2 產品銷售問題可拓分類知識挖掘 . 34 3.8.3 基于變換選擇策略的可拓知識挖掘系統 . 35 中國人工智能系列白皮書可拓學 4 3.8.4 客戶流失預防與轉化策
5、略獲取系統 . 35 3.8.5 可拓建筑策劃與設計數據挖掘. 36 3.8.6 基于多目標線性規劃的二次挖掘方法的應用 . 37 3.8.7 雙權連接可拓神經網絡的應用. 37 3.9 結束語 . 38 第 4 章 可拓設計 . 39 4.1 引言 . 39 4.2 機械產品的可拓設計理論與方法. 40 4.2.1 可拓概念設計 . 40 4.2.2 可拓配置設計 . 41 4.2.3 可拓低碳設計 . 43 4.2.4 可拓綠色設計 . 45 4.2.5 可拓設計的計算機實現 . 47 4.3 可拓建筑策劃與設計的理論與方法 . 47 4.3.1 可拓建筑策劃的理論與方法 . 47 4.3
6、.2 可拓建筑設計的理論與方法 . 48 4.3.3 計算機輔助可拓建筑策劃與設計 . 50 4.4 結束語 . 50 第 5 章 可拓控制 . 51 5.1 可拓控制的研究背景和意義 . 51 5.2 可拓控制理論 . 52 5.2.1 可拓控制的基本概念 . 52 5.2.2 可拓控制的原理 . 55 5.2.3 可拓控制器的結構與設計 . 55 5.3 可拓控制的應用 . 57 參考文獻 . 60 中國人工智能系列白皮書可拓學 1 第 1 章 可拓學概述 1.1 可拓學的學科體系 1.1.1 可拓學的定義和定位可拓學的定義和定位 可拓學(Extenics)是以形式化的模型, 探討事物拓展
7、的可能性以及開拓創新的規律與方法,并用于解決矛盾問題的科學。它的研究對象是矛盾問題,即在現有條件下無法實現人們要達到的目標的問題。 可拓學就是要通過探討古往今來人們處理矛盾問題的規律1,建立一套程序化的方法,使人能夠按照程序處理矛盾問題,利用計算機和網絡幫助人們生成解決矛盾問題的創意和新產品構思的創意2。 可拓學的基本理論是可拓論3,方法體系是可拓創新方法4,它們的應用稱為可拓工程??赏卣?、可拓創新方法和可拓工程構成可拓學。 1.1.2 可拓學的理論體系可拓學的理論體系可拓論可拓論 可拓論由基元理論、可拓集理論和可拓邏輯構成其理論體系,如圖 1-1 所示。 1. 基元理論 物元、事元和關系元(
8、統稱為基元)是可拓學的邏輯細胞,利用它們可以描述萬事、萬物和問題,描述信息、知識和策略。通過研究基元的拓展性和變換、變換運算的規律,建立了把數學模型拓廣的可拓模型,去表示矛盾問題及其解決過程,作為處理矛盾問題的形式化工具;研究了基元的拓展分析理論和物的共軛分析理論;探討了可拓變換的類型和性質,形成可拓變換理論;它們合稱為基元理論。 2. 可拓集與關聯函數 經典數學以康托集為基礎,康托集是對確定性事物的分類。扎德提出的模糊集描述了模糊性的事物,是模糊數學的基礎??低屑湍:ㄐ缘乇磉_了事物的性質及其分類。 為了表示矛盾問題通過變換變為不矛盾問題, 必須建立描述變換中國人工智能系列白皮書可拓學
9、2 下事物性質變化的集合概念。 1983 年, “可拓集合和不相容問題”一文提出了可拓集的概念,使靜態的集合論發展為描述變換(包括動態)下的集合論,作為解決矛盾問題的集合論基礎。 為了定量地刻畫事物性質的變化, 可拓集以關聯函數作為定量化工具。 發散分析相關分析拓展分析理論蘊含分析可擴分析虛實共軛分析軟硬共軛分析基元理論 共軛分析理論潛顯共軛分析負正共軛分析基本可拓變換傳導變換與共軛變換可拓變換理論可拓變換的運算可拓論可拓變換的性質基元可拓集可拓集 復合元可拓集質變域(可拓域)與量變域(穩定域)可拓集理論關聯函數的定義與計算公式關聯函數關聯函數的類型及其變換可拓模型基元可拓推理可拓邏輯 可拓推
10、理 傳導推理共軛推理解決矛盾問題的推理 圖圖 1-1 可拓論框架可拓論框架 3. 可拓邏輯 要使計算機能利用可拓模型處理矛盾問題, 生成解決矛盾問題的策略,必須研究帶有矛盾前提的邏輯。 在解決矛盾問題的研究中, 不僅要涉及數量關系, 還要涉及事物、事物的特征和量值。不僅考慮靜態的事物和關系,還要考慮事物和關系在變換下(包括動態)的變化。不僅要進行推理,還要涉及創造性思維的過程,不僅需要不矛盾的傳統邏輯,還需要允許一定矛盾前提中國人工智能系列白皮書可拓學 3 的邏輯。因此,在可拓學中,研究了它特有的邏輯可拓邏輯,它 是異于形式邏輯和辯證邏輯的邏輯,有如下幾個特點: (1) 研究使矛盾問題轉化的邏
11、輯。數理邏輯研究經典數學中推理的規律,模糊邏輯研究模糊數學中推理的規律。人們天天要與矛盾問題打交道,要處理各種各樣的矛盾問題。因此,必須研究如何在矛盾前提下,通過某些變換,使矛盾問題轉化為不矛盾問題的可拓邏輯。 (2) 邏輯值隨變換而改變。在經典邏輯和模糊邏輯中,事物是否具有某種性質, 命題為“真”或為“假”是相對固定的。 但在可拓邏輯中,由于引入了變換(包括時空的改變) ,事物具有某種性質的程度和命題 “真假” 的程度隨變換而改變。 可以說, 經典邏輯和模糊邏輯從“靜態”的角度研究事物的性質和命題的真假;可拓邏輯則從變換(包括“動態”)的角度討論事物具有某種性質的程度和命題真假的變化。同樣,
12、推理的正確性也是可變的,可拓邏輯也研究在變換下推理正確度的變化。 (3) 形式邏輯的形式和辯證邏輯的思想??赏剡壿媽φZ句或命題真假程度的描述成為描述事物矛盾程度的依據, 可拓邏輯要研究“變”的推理規律,就必須符合自然辯證法的基本規律。因此,可拓邏輯也進行了哲學原理形式化的嘗試。通過用符號表達某些哲學原理,可以對這些哲學規律進行操作和運算, 使辯證邏輯不僅僅停留于自然語言的描述。 可拓邏輯汲取了形式邏輯形式化的做法,采用了辯證邏輯的思想,結合并發展出描述可拓思維形式, 以解決矛盾問題的變換和推理為核心的可拓邏輯,為用計算機和網絡處理矛盾問題建立了邏輯工具。 1.2 可拓學的方法體系可拓創新方法
13、可拓學研究了描述現實世界中的事、物和關系,信息和知識以及中國人工智能系列白皮書可拓學 4 問題的形式化體系。建立了以基元為邏輯細胞的可拓模型; 研究了事物拓展的可能性可拓展性以及用形式化表示可拓展性的方法拓展分析方法;研究了從物質性、系統性、動態性和對立性分析物的結構的共軛性, 建立了基元的拓展分析理論與方法以及物的共軛分析理論與方法,提出了矛盾問題轉化的基本方法,包括化不相容問題為相容問題的可拓策略生成方法、 處理對立問題的轉換橋方法和從整體出發,考慮處理復雜問題的關鍵策略與協調方法。 可拓學從新的角度為人們認識和分析現實世界、 解決現實世界中的矛盾問題,提出了一種新的方法體系可拓創新方法體
14、系,如圖1-2 所示。 共軛思維模式傳導思維模式逆向思維模式菱形思維模式可拓思維模式法從缺點出發的第三創造創造法從已有產品出發的第二法從需要出發的第一創造新產品構思方法轉換橋方法可拓策略生成方法處理矛盾問題的方法創意生成方法可拓識別方法可拓聚類方法可拓分類方法可拓集方法優度評價方法論域的變換關聯準則的變換基元的變換共軛變換方法傳導變換方法變換的運算方法基本變換方法可拓變換方法負正共軛分析方法潛顯共軛分析方法軟硬共軛分析方法虛實共軛分析方法共軛分析方法分合鏈方法蘊含系方法相關網方法發散樹方法拓展分析方法可拓模型建立方法基本方法可拓創新方法 圖圖 1-2 可拓創新方法體系可拓創新方法體系 中國人工
15、智能系列白皮書可拓學 5 1.2.1 拓展分析方法拓展分析方法 拓展分析方法是根據基元的拓展分析原理對事、物、關系等進行拓展,以獲得解決矛盾問題的多種可能途徑的方法。拓展分析方法包括發散樹方法、相關網方法、蘊含系方法和分合鏈方法。 1.2.2 共軛分析方法共軛分析方法 對物的結構的研究, 有助于我們利用物的各個部分及各部分間的相互關系去解決矛盾問題。 物具有物質性、 系統性、 動態性和對立性,統稱為物的共軛性。根據物的共軛性,利用物元和關系元作為形式化工具,對物的虛部、實部與虛實中介部、軟部、硬部與軟硬中介部、潛部、顯部與潛顯中介部、負部、正部與負正中介部進行的形式化分析方法,稱為共軛分析方法
16、。通過對物的各共軛部及其相互關系和相互轉化的分析,可以得到解決矛盾問題的多種策略。共軛分析方法為人們全面分析物的結構提供了新的視角。 1.2.3 可拓變換方法可拓變換方法 使矛盾問題轉化的工具是變換。 通過對人們處理矛盾問題的變換方法的研究,抽象出五種基本變換和四種運算方式。任何一個解決矛盾問題的創意,都是由五種基本變換通過四種運算或復合而成。 由于事物的相關性和蘊含性, 對一事物或關系的變換會導致他事物或關系的改變, 這是傳導變換, 人們常常利用傳導變換去處理問題。 1.2.4 可拓集方法可拓集方法 可拓集方法是從動態的、轉化的角度對研究對象進行分類、 識別和聚類等的方法??赏丶且钥赏刈儞Q
17、和關聯函數為基礎的集合。針對不同的變換, 可拓集有不同的質變域和量變域, 從而有不同的分類、聚類和識別形式, 它形式化和定量化地揭示了矛盾問題的轉化過程和結果,更貼切地描述了分類、聚類和識別等的動態性和可轉化性。 在可拓學中,建立了描述距離的新概念“距”和“側距”,以突破經典數學中區間內的點與區間之距離均為零的規定。 以此為基礎建立的中國人工智能系列白皮書可拓學 6 關聯函數,就可以定量地描述“類內也有異”的客觀現實,進而描述量變和質變的過程, 建立了能表達在某種變換下事物性質的量變和質變的定量計算公式。 1.2.5 優度評價方法優度評價方法 優度評價方法是綜合多種衡量條件對某一對象、方案、策
18、略等的優劣程度進行綜合評價的實用方法。 對一個對象的評價往往不能只考慮有利的一面,還要考慮不利的一面。此外,在評價時,往往要考慮到動態性和可變性,對潛在的利弊進行考慮。該方法用關聯函數來計算各衡量條件符合要求的程度,由于關聯函數的值可正可負,這樣建立的優度可以反映一個對象利弊的程度,使得評價更符合實際。 1.3 可拓工程 可拓論和可拓創新方法在各個具體領域的應用統稱為可拓工程。 1.3.1 可拓學在人工智能領域的應用可拓學在人工智能領域的應用 可拓論剛剛誕生不久,不少專家就明確指出,可拓論“帶有很濃厚的人工智能色彩”3, “必將滲透到人工智能及其相關學科中”4,從可拓學和人工智能的發展過程可見
19、,它們有著密切的聯系5。 1. 可拓論與人工智能的基礎問題 (1)問題處理:不少學者認為,用計算機進行“問題處理”是人工智能的核心,人工智能研究解決問題的思維規律及其計算機模擬。實際上,很多智能活動的過程,甚至所有智能活動的過程,都可以看作或抽象為“問題求解”的過程??赏貙W研究的矛盾問題是問題的難點,解決矛盾問題是重要的智能活動,也是人工智能水平的體現,它比一般解題更富創造性,更強調智能的發揮,對解決矛盾問題的深入研究有助于人工智能水平的提高。同時,把可拓學對問題的形式化描述、可拓變換和可拓推理解決矛盾問題的方法應用于人工智能中,使計算機學會用可拓創新方法解決矛盾問題, 這對人工智能技術水平的
20、中國人工智能系列白皮書可拓學 7 提高有十分重要的意義,對促進人工智能的發展有重要的價值。 (2)可拓模型和信息、知識的形式化表示:可拓學建立的以基元為邏輯細胞的形式化體系,容易為計算機所接受而進行操作??赏啬P蜑槿斯ぶ悄芴峁┮环N簡潔而逐步規范的知識表示方法。 信息和知識用可拓模型描述以后,可以利用基元的可拓展性,開拓出新的信息和知識,進而建立可拓信息-知識-策略形式化體系,為人工智能的策略生成技術提供依據, 為信息的拓展和可拓知識的獲取與挖掘提供新的理論和方法。 (3)可拓集與分類、識別:解決矛盾問題的集合論基礎是可拓集論,其本質是“非變為是”、“不行變行”、“不屬于變屬于”等的形式化描述,
21、這是計算機進行矛盾問題處理的理論基礎之一??赏丶谋举|體現在質變域、零界和可拓變換中。計算機利用它們處理事物性質的動態變化,進行創造性思維和生成策略,并利用關聯函數作為定量化工具,進行定性和定量相結合的操作,將大大提高計算機的智能水平。 分類,是人工智能進行識別、檢索、決策和控制的前提??赏胤诸惙椒閯討B事物和動態過程的模式識別注入新的方法。因此,把可拓變換的思想引入識別中, 把可拓創新方法應用于識別研究將提高計算機的分類和識別能力。 (4)可拓推理與人工智能的推理技術:推理技術是人工智能的重要技術, 它研究前提和結論之間的邏輯關系及真度或置信度的傳遞規律等。對推理的研究往往涉及對邏輯的研究,
22、邏輯是人腦思維的規律,也是推理的理論基礎,人腦的大部分思維活動都是在知識不完全的情況下,在不斷探索中完成的。因此,可拓推理在形式化和模擬人類思維的變通性方面將是一種具有創造能力的推理方法。 可拓推理包括基元拓展推理、傳導推理、共軛推理和處理矛盾問題的推理等??赏赝评淼暮诵氖亲儞Q,這與傳統推理以蘊含和匹配為中國人工智能系列白皮書可拓學 8 核心的機制不同,它的目的是生成、選擇恰當的基元去變換原有的基元, 從而使矛盾問題得到解決。 可拓推理應用的重點在如下兩個方面: 在策略生成方面, 以可拓展性為基礎, 分析生成策略的推理過程,提出生成解決矛盾問題的可拓策略的方法,并在計算機上實現。 把可拓推理演
23、繹成可拓算子,編制成算法和軟件,運用于生成可拓信息或可拓知識,這在搜索技術和數據挖掘中有重要的價值。 (5)基于可拓模型與可拓推理的知識表示與推理:知識表示、知識獲取和知識處理是知識工程的重要內容,而其核心是知識表示??赏啬P蛯τ诿枋隹陀^世界的物、事和關系具有簡潔、統一和使用方便的特點,利用它們來描述信息和知識,便于計算機操作。其次,基元的可拓展性系統地描述了事物拓展的多種可能性, 為提高計算機的創造性思維能力和發展策略生成新技術提供了新的理論和方法。第三,利用基元的可拓展性為知識獲取提供新的方法??赏貙W從定性和定量的角度,研究解決矛盾問題的規律和方法,為解決深層知識獲取提供了新的工具。 知識
24、推理把深藏著的知識開發出來,它包括隱性知識顯化和數據挖掘兩個部分。 可拓創新方法簡單明了, 便于不同領域的學者使用,為潛在知識的顯化提供了思維方法和可操作的工具:首先,用可拓模型表達知識所涉及的基本概念和基本思想,然后,利用基元的可拓展性不斷擴充,逐步完善,形成思路清晰、模式規范的顯式知識,使潛在知識顯化的過程形式化和規范化,將會帶來知識推理的新進展。 2. 可拓學與人工智能結合的重點研究方向 可拓學與人工智能相結合的研究方向是矛盾問題的智能化處理7。以問題處理為核心,用可拓模型描述信息和知識,建立可拓推理和可拓算法,以探索人工智能的理論體系和應用方法,將是今后可拓學研究者與人工智能工作者相結
25、合的重要方向。 可拓推理 8、 可拓算法、可拓分類、可拓策略生成、可拓數據挖掘、可拓模式識別、可拓中國人工智能系列白皮書可拓學 9 神經網絡等理論、方法和技術的進一步深入研究,將為實現各領域矛盾問題的智能化處理打下堅實的基礎。 隨著科學技術的發展,各領域都要涉及矛盾問題的智能化處理。研究如何使計算機能生成解決矛盾問題的策略, 以提高計算機的智能化水平已顯得十分迫切。 由于網絡和計算機已滲透到人們生活和工作的各個層面,因此,充分利用能處理矛盾問題的智能系統將是今后國民經濟很多領域現代化的重要任務。面向未來,沒有處理矛盾問題的軟件和網絡、沒有從幫助用戶解決矛盾問題的角度出發的信息平臺,就無法實現真
26、正意義上的智能化。 為了解決具體的矛盾問題, 必須研究能處理一般矛盾問題和領域中矛盾問題所需要的形式化模型、定量化工具、推理規則和特有的方法。 因此, 研究利用計算機幫助處理各部門所遇到矛盾問題, 是經濟、社會和國家安全所需要解決的重要課題。通過近年的研究, 有望在如下幾方面取得突破性的成果:研制各個行業的可拓策略生成軟件;研制各領域的可拓數據挖掘軟件;研制各行各業的可拓策略(創意)生成平臺。 1.3.2 可拓學在工程技術領域的應用可拓學在工程技術領域的應用 可拓設計是利用可拓論和可拓創新方法研究設計過程中矛盾問題的處理(包括形式化表示、建模、變換、推理、評價與決策) ,以尋求較優設計方案的一
27、種新的設計理論與方法。 它與其它設計理論和方法的最大區別在于它的形式化和定性與定量相結合。 它所建立的模型是可拓模型,避免了數學建模中常常舍去問題的一些實際內容,也避免了目前已有設計方法中形式化和定量化不足的缺陷。 它是對現代設計理論與方法的補充、完善和進一步發展。有關可拓設計的最初研究,始于可拓學應用研究的初期,首先涉足于新產品構思領域,研究了產品創新的三種創造法,并初步應用于產品設計。 控制與檢測領域中存在大量的矛盾問題,如控制中準確性、穩中國人工智能系列白皮書可拓學 10 定性和快速性的對立,檢測中檢測參數與檢測儀器不能檢測的矛盾,檢測儀器的要求與檢測環境的矛盾等等。 不可控制和不可檢測
28、的問題影響了自動化的水平。另一方面,機器在運轉過程中,經常要產生各種各樣的矛盾問題, 我們能否在機器中裝上能處理該領域矛盾問題的智能系統。當機器遇到不能解決的盾問題時,這個系統能提出處理的策略,并指揮機器把該矛盾問題轉化為不矛盾問題,是一項具有前瞻性的重要課題,其目標是創制高水平的智能系統。 將可拓論和可拓創新方法應用于控制領域去處理控制中的矛盾問題。稱為可拓控制方法。它為解決控制領域中存在的矛盾問題提供了一條值得探索的路徑??赏貦z測以可拓論為依據,利用可拓變換的方法,建立一種以可拓模型為基礎的檢測理論與方法,對傳統方法無法檢測或難以檢測的物理量實現有效的檢測。 1.3.3 管理可拓工程管理可
29、拓工程 管理可拓工程從處理矛盾問題的角度去審視管理的過程,建立一套新的管理工程理論與方法,包括可拓策劃、可拓營銷、可拓決策等理論和方法。 1.3.4 可拓學與其他領域的交叉融合可拓學與其他領域的交叉融合 凡是有矛盾問題的地方,可拓學就有其用武之地??赏貙W的基本理論與方法和各領域的知識相結合,拓廣了該領域的理論,也產生了處理該領域矛盾問題的可拓工程方法。 中國人工智能系列白皮書可拓學 11 第 2 章 可拓策略生成方法與系統 2.1 引言 隨著社會經濟的發展和網絡信息技術的不斷進步, 信息和知識越來越多,各種系統越來越復雜,要考慮的參數不計其數,矛盾層出不窮。如何利用計算機和網絡存儲量大、計算快
30、的特點生成和搜索各領域解決矛盾問題的策略,已成為提高計算機智能化水平的關鍵。雖然人們已經能將大量工作交給計算機處理, 并在許多方面得到了滿意的結果,但在問題求解、特別是不相容問題求解方面的研究還很不夠。人工智能領域確實花了很長時間考慮問題求解, 但對于解決不相容問題的策略生成并沒有解決, 主要原因在于系統沒有自動生成解決不相容問題的策略的功能。 可拓策略生成方法是一套以可拓學理論1為基礎,采用形式化模型和可拓推理技術研究不相容問題求解的方法。 它根據信息知識提取和拓展的規律性,通過建立由對象、特征和量值構成的基元及其復合元,將非結構化的不相容問題轉化為可形式化、定量化處理的可拓模型,并利用可拓
31、推理和可拓變換來獲取化解問題的策略。近年來,在廣大學者的不懈努力下,在多項國家自然科學基金項目“可拓策略生成系統的基礎理論與基本方法研究(70271060)”“基于可拓學和HowNet 的策略生成方法與系統研究(61273306)”“基于 GEP 的可拓策略自組織生成理論與方法研究(61503085)”等的支持下, 可拓策略生成的理論與方法體系日益完善,目前已建立了可拓信息-知識-策略形式化體系9,以及解決不相容問題的集合論基礎可拓集合7和邏輯基礎可拓邏輯8。在上述理論和方法研究的基礎上,很多學者也相繼開展了可拓策略生成系統的研究, 建立了可拓策略生成系統的一般框架與功能模塊10, 并開發了一
32、些應用于具體領域的策略生成系統軟件11-14。 中國人工智能系列白皮書可拓學 12 近年來, 針對前期對可拓策略生成系統研究中存在的一些瓶頸問題,我們分別探索了結合 HowNet 和基因表達式編程(GEP)的可拓策略生成方法與系統。 前者利用 HowNet 的知識庫可以輔助解決現有策略生成系統由于知識存儲模塊中知識不足致使生成策略困難的問題,提高了策略生成的智能化水平15; 后者著力于構建一種高效的可拓變換運算式的自組織生成機制, 從而有效避免在可拓策略生成的過程中因可拓變換的類型和數量繁多而引起的計算量的組合爆炸, 提高可拓策略生成的效率和智能化水平16。 本章將簡要介紹可拓策略生成方法和可
33、拓策略生成系統 (ESGS)的研究概況。 2.2 可拓策略生成的一般方法 要用形式化定量化的方法解決不相容問題,必須研究從建模、判斷、拓展、變換、評價,直至獲得解決問題的策略的方法,綜合形成解決不相容問題的可拓策略生成方法6,17。簡要介紹如下: 2.2.1 問題的形式化界定方法問題的形式化界定方法 任何問題都是由目標和條件構成的。根據基元理論,可以將問題的目標 G 和條件 L 用多維基元(對象,特征列,量值列)形式化表示為 并建立原問題的可拓模型為 P=G*L。復雜問題的目標有時需要用復合元(基元的復合)形式化表示。 根據具體問題的要求,選取原問題的評價特征 c0i, 并設 c0si為問題所
34、涉及的任一對象 Z 需要的特征,c0ti為問題所涉及的原對象 Z0提供的特征,量值為 v0i,記 1122,GGGGGGmGmcvOcvGcv,1122,LLLLLLnLncvOcvLcv,中國人工智能系列白皮書可拓學 13 0 1010 202000,sssrrcVZcVGcV,0 10100 202000,tttrrcvZcvLcv, 從而建立原問題的核問題的可拓模型 P0=G0*L0。 2.2.2 問題相容性的判斷方法問題相容性的判斷方法 針對核問題中的評價特征,若是單評價特征問題,則直接根據評價特征的性質選擇利用相應的關聯函數建立相容度函數00,K G L, 判斷問題的相容性;若是多評
35、價特征問題,則需要根據評價特征之間的關系,選擇利用多維關聯函數或綜合關聯函數建立相容度函數00,K G L,進而判斷問題的相容性。 若00,0K G L,則說明原問題是相容問題;若00,0K G L,則說明原問題是不相容問題; 若00,0K G L, 則說明原問題是臨界問題。 2.2.3 問題相關度的計算方法問題相關度的計算方法 對于不相容問題,再利用 HowNet(知網)中的詞語相似度的計算方法,改進詞語相關度、建立基元相關度、進而建立目標相關度和條件相關度,形成問題相關度的計算方法,用于判斷不相容問題與問題庫中已解決的不相容問題的相關程度18。若相關度達到規定的閾值,則直接采取已解決問題的
36、策略解決該不相容問題,認為找到解決不相容問題的策略;若相關度達不到規定的閾值,則認為未找到解決不相容問題的策略,需要繼續對問題利用下面的方法獲得策略。 2.2.4 拓展分析方法與共軛分析方法拓展分析方法與共軛分析方法 拓展分析方法與共軛分析方法都是提供解決不相容問題的多種思路的形式化方法。首先根據實際問題,判斷目標基元和條件基元哪個不能改變,然后對可以改變的基元進行分析,以獲得解決不相容問題的多種途徑。 (1)若目標基元不能改變,則選擇對條件基元進行拓展分析或中國人工智能系列白皮書可拓學 14 共軛分析,從而形成相關樹、發散樹或共軛對。依次進行如下步驟: 選擇相關分析,建立條件基元的相關樹(網
37、); 對條件相關樹(網)的葉基元進行發散分析,獲得發散樹;如果是物元,還可進行共軛分析,即從虛實、軟硬、潛顯、負正等方面對物元進行分析。 (2)若條件基元不能變,則選對目標基元進行拓展分析或共軛分析,從而形成蘊含系、相關樹或共軛對。 此外, 也可先對目標進行發散分析, 通過可拓變換形成新的目標,若新目標蘊含原目標,且新目標與原條件相容,則問題解決。 (3)若目標和條件都需進行分析,則先執行(1)再執行(2) ,合并建立問題的相關-蘊含樹。 2.2.5 可拓變換及其篩選方法可拓變換及其篩選方法 可拓變換方法是化解不相容問題的工具,包括基本可拓變換方法、可拓變換的運算方法、傳導變換方法等。 在上述
38、拓展分析或共軛分析所獲得的葉基元集中, 選擇實施可拓變換或可拓變換的運算。以對條件的拓展分析為例,對問題的條件相關樹的樹葉實施可拓變換后, 會形成可拓變換蘊含系。 通過傳導變換,會使原問題的相容度發生變化。使問題的相容度從 K0(P0) =K(G0,L0) 0 的可拓變換或可拓變換的運算式,即為解決原不相容問題的可拓策略。 對問題的目標蘊含系的最下位目標, 首先要考慮在原條件下這些目標是否能實現,若能,則問題解決;否則,還要對條件進行拓展分析與可拓變換,考慮在新條件下這些目標是否能實現。 由于可拓變換的方式有很多,而且其中很多不是可拓策略, 這一過程可能會發生計算量的組合爆炸, 因此必須研究可
39、拓變換的篩選問題。 文獻16提出了采用 GEP 方法, 以啟發式迭代的方式來實現可拓變換運算式的自組織構建。 為了使 GEP 方法與上述應用需求相匹配,中國人工智能系列白皮書可拓學 15 文獻16對 GEP 的染色體結構、 解碼方式、 個體選擇機制和收斂準則重新進行了研究。該方法能夠有效避免組合爆炸的發生,提升可拓策略生成的效率,在復雜不相容問題求解方面具有很大潛力。 2.2.6 可拓策略的優度評價方法可拓策略的優度評價方法 利用上述方法,可以獲得很多解決不相容問題的可拓策略, 需要根據原問題的要求選取衡量指標, 建立衡量指標體系及各衡量指標的關聯函數, 然后選擇相應的優度評價方法對所有的可拓
40、策略進行評價選優,從而獲得解決該不相容問題的較優可拓策略。 根據衡量指標體系的不同, 優度評價方法包括一級優度評價方法和多級優度評價方法7。 2.3 可拓策略生成系統 可拓策略生成系統(ESGS)是把可拓策略生成方法和現有的人工智能技術、數據庫技術、可視化技術、面向對象技術等相結合,用計算機模仿人類發現問題-分析問題-生成解決問題的策略的過程,以幫助人們獲得解決不相容問題的可拓策略的軟件系統, 是可拓策略生成方法的軟件化。 2.3.1 ESGS 的主要功能模塊的主要功能模塊 ESGS 的結構主要包括如下模塊:基礎數據庫、問題可拓模型模塊、問題相關度計算與判斷模塊、不相容問題模塊、知識存儲模塊、
41、可拓變換及其篩選模塊、優度評價模塊、可拓策略庫等。其框架結構如圖 2-2 所示。 1. 基礎數據庫 基礎數據庫是實現策略生成的基礎,存放各種物、事、關系等原始數據和語料數據,以及按照“可拓信息-知識-策略形式化體系”的規范,經過預處理后的各種信息元,需要根據不相容問題所涉及的領域分類進行構建。 中國人工智能系列白皮書可拓學 16 2. 問題可拓模型模塊 該模塊包括用戶需求語句處理模塊19、 原問題的可拓模型模塊和核問題的可拓模型模塊。 要有效地解決不相容問題, 必須根據實際問題準確地建立其可拓模型。建立問題可拓模型有如下 3 種方法: (1) 早期研究的 ESGS 一般靠用戶在固定界面輸入參數
42、來建立可拓模型,減少自然語言理解困難。但當參數較多時,系統界面的設計難以重復利用。 (2) 針對需要解決的實際問題,首先根據“可拓信息-知識-策略形式化體系”的規范,結合人機交互和 HowNet 的 KDML,形式化表示原問題的目標和條件,建立原問題的可拓模型,根據原問題目標的要求和條件的限制,再通過人機交互抽象出核問題的可拓模型20。 (3) 在智能 Agent 引導技術基礎上,利用信息抽取技術,從用戶輸入的需求語句出發,通過對用戶需求語句的預處理、組塊分析、分類、量值提取、模型填充,從而自動建立原問題的可拓模型,再通過人機交互選取評價特征,進而建立核問題的可拓模型21。 3. 問題的相關度
43、計算與判斷模塊 該模塊用于對需要解決的問題進行問題的相關度計算, 并判斷與不相容問題庫中已解決的不相容問題的相關程度。 4. 不相容問題模塊 該模塊用于對需要解決的問題的相容度進行計算與判斷, 并存儲已有求解策略的不相容問題。 中國人工智能系列白皮書可拓學 17 圖圖 2-1 可拓策略生成系統框架結構圖可拓策略生成系統框架結構圖 5. 知識存儲模塊 該模塊是實現策略生成的重要部分,主要包括:拓展型知識、共軛型知識、關聯函數、可拓知識、常識知識、其它領域知識等模塊。 拓展型知識和共軛型知識都源于領域知識,需要針對不同的領域,根據“可拓信息-知識-策略的形式化體系”構建;關聯函數模塊中存儲著各種類
44、型的關聯函數及各種綜合關聯函數, 建立問題相容度函數時可以調用其中的關聯函數;基于可拓變換的各種可拓知識,都存儲在可拓知識模塊中。 常識知識和部分領域知識除了來源于問題所涉及的領域,還可以從 HowNet 的知識庫中獲取,HowNet 本身就是一個具有語義的通識知識庫, 可以借助其中義原及其語義關系的表達方式,對基元的結構進行重新構造,利用 KDML 語言(知識系統描述語言)和基元、復合元的對應關系,轉化為基元、復合元形式及它們的運算式形式,從而作為解決不相容問題的知識基礎。還有一些其他類型的可拓知識,需要利用基于知識庫的可拓數據挖掘方法獲取。這就為解決不相容問題提供了多種路徑。 中國人工智能
45、系列白皮書可拓學 18 6. 可拓變換及其篩選模塊 該模塊中有很多類型的變換,包括基本可拓變換、可拓變換的運算及傳導變換,變換的選擇和篩選決定了策略生成的有效性和效率。目前主要有兩種處理方法: (1) 根據不相容問題的目標和條件中產生不相容的特征的相應量值的差異,選擇變換的類型,且實施變換后馬上利用相容度函數度量是否是有效變換;還要根據具體問題預設閾值、相關度、評價特征及其評價函數,以便在可拓變換模塊中選擇變換時,既能保證生成的解決不相容問題的有效策略足夠多,又能避免組合爆炸問題的發生。 (2) 對于復雜不相容問題,可拓變換的實施與變換的結果之間可能呈現一定的黑箱性,導致難以采用 1)中的方式
46、選擇變換的類型。在此種情況下,利用 GEP 方法,以由變換的對象拓展出的基元和基本可拓變換及其運算分別建立終點符號集合和函數符號集合, 通過啟發式迭代的方式來實現可拓變換運算式的自組織構建。 7. 優度評價模塊 優度評價模塊中存儲著各種評價特征及其量值域, 針對要解決的實際問題的不同評價特征, 可以調用關聯函數模塊中的關聯函數和綜合關聯函數,計算綜合優度。 8. 可拓策略庫 可拓策略庫中存放各種已解決的不相容問題的解決策略, 當以后再遇到不相容問題時,可以首先利用文獻18建立的問題相關度計算方法,與問題模塊中的已解決的問題進行比對,如果有相關度達到一定閾值的問題, 則可直接到可拓策略庫查詢對應
47、的問題所采取的解決策略,如果可用,則獲得解決該不相容問題的可拓策略,否則,再進行策略生成的全過程,并把獲得的可拓策略存入其中。 2.3.2 應用應用 ESGS 求解不相容問題的一般步驟求解不相容問題的一般步驟 應用 ESGS 求解不相容問題的一般步驟如圖 2-3 所示?;谥袊斯ぶ悄芟盗邪灼赏貙W 19 HowNet 的 ESGS 的一般步驟參見文獻15。 原始問題原問題和核問題建模判斷目標和條件哪一個不能改變相容度判定相關度判定進入知識存儲模塊,對可以變的目標或條件,選取其拓展型知識或共軛型知識形成不相容問題樹進入可拓變換與篩選模塊,選取可拓變換獲得變換后的問題樹相容度判定獲得可拓策略進
48、入知識存儲模塊,選取評價特征和關聯函數進入優度評價模塊評價選優,獲得優度較高的策略可拓策略庫說明原問題為偽不相容問題,結束進入可拓策略庫搜索選取相應的策略是否是否否是 圖圖 2-3 應用應用 ESGS 求解不相容問題的一般步驟求解不相容問題的一般步驟 2.3.3 ESGS 的軟件架構的軟件架構 目前已有的對 ESGS 軟件架構的研究,主要有基于構件的 ESGS實現方法、策略生成系統正交軟件體系結構、利用面向方面軟件開發改善開發過程、不相容問題策略生成的通用框架、結合 HowNet 的ESGS 研制、基于 WebService 架構的 ESGS 等方法20。 2.4 ESGS 軟件研制情況 通過
49、近年對可拓策略生成系統的基礎理論和方法的系統研究, 已中國人工智能系列白皮書可拓學 20 逐步摸索到進行可拓策略生成系統研究的基本思路, 開發了多個解決具體領域不相容問題的可拓策略生成系統。 針對不同領域的矛盾問題,研究人員實現了不同的策略生成系統。目前實現的 ESGS 有:房地產營銷優化系統、防治空氣污染系統、提高畢業生就業率系統、游客停車問題系統、自助游 ESGS、大壩安全的 ESGS、租房 ESGS、求職問題 ESGS、防止企業人才流失系統、提高客戶價值的 ESGS、圖像識別 ESGS 等,詳見文獻21。 2.5 結束語 本研究基于可拓學的基本理論與方法3,給人們提供了形式化定量化解決不
50、相容問題的可操作的有效方法和步驟,ESGE 的研究與開發,可以輔助人們解決領域不相容問題。該研究可為將來進一步研制矛盾問題智能化處理系統打下堅實的基礎22,必將有廣闊的應用前景,且具有鮮明的自主知識產權。 中國人工智能系列白皮書可拓學 21 第 3 章 基于可拓學的數據挖掘研究與應用 3.1 引言 數據挖掘自 20 世紀 80 年代中期提出以來,得到了迅速的發展,它能夠在海量的數據中快速地尋找到一些十分有價值、 有意義的數據間的特定關系并產生新的知識。然而,現有的數據挖掘技術沒有充分考慮從變換的角度挖掘有關變換的作用的知識。在各個領域中,要真正實現智能化, 必須研究處理矛盾問題的理論與方法及其