神經網絡文本分類8篇

時間:2023-06-13 09:27:15

緒論:在尋找寫作靈感嗎?愛發表網為您精選了8篇神經網絡文本分類,愿這些內容能夠啟迪您的思維,激發您的創作熱情,歡迎您的閱讀與分享!

神經網絡文本分類

篇1

法,并介紹了在TMS320C540

>> 一種新的基于改進的ADALINE神經網絡的DTHF解碼器方案 AVS解碼器流水線控制機制的一種改進設計 一種SoC架構的AVS硬件解碼器設計方案 一種基于BP神經網絡整定的PID控制器的算法改進 一種基于改進的BP神經網絡的入侵檢測方法 基于一種改進BP神經網絡算法的教學質量評價研究 一種基于ART2神經網絡的算法改進 一種基于改進BP神經網絡預測T/R組件溫度的方法 一種基于改進神經網絡的高效模糊聚類算法 一種基于模糊神經網絡的印刷品字符識別器 一種基于遺傳神經網絡文本分類器的研究 一種新的基于灰色關聯分析的BP神經網絡剪枝算法 一種新的基于神經網絡的IRT項目參數估計模型 一種基于短語統計機器翻譯的高效柱搜索解碼器 一種基于SOM神經網絡的污水處理工藝方案比選方法 一種基于BP神經網絡的數控機床伺服系統控制器 一種改進的BP神經網絡算法在入侵檢測中的應用 一種改進的BP神經網絡車牌識別算法的研究 一種改進的BP神經網絡算法分析 一種ART2神經網絡的改進算法 常見問題解答 當前所在位置:中國 > 科技 > 一種新的基于改進的ADALINE神經網絡的DTHF解碼器方案 一種新的基于改進的ADALINE神經網絡的DTHF解碼器方案 雜志之家、寫作服務和雜志訂閱支持對公帳戶付款!安全又可靠! document.write("作者:未知 如您是作者,請告知我們")

申明:本網站內容僅用于學術交流,如有侵犯您的權益,請及時告知我們,本站將立即刪除有關內容。 摘 要:本文提出了一種新的基于改進的AD址INE神經網絡DTMF信號檢測算

法,并介紹了在TMS320C5402和TLV320AICl0上采用此算法的DTMF

篇2

關鍵詞:極限學習機;稀疏自動編碼器;集成學習;文本分類

1 概述

隨著現代社會的發展,互聯網成為了人們獲取文本信息的重要手段。然而網上的信息雜亂無章,使得人們很難快速而準確的獲得所需要的文本信息。因此如何有效的對文本進行分類,幫助用戶找到所需的信息成為當代信息技術領域的一個重要課題[1]。

本文提出利用深度學習中的稀疏自動編碼器自動選取文本的特征,然后利用極限學習機作為基分類器進行文本的分類,最后結合Adaboost集成學習方法將極限學習機作為基分類器組合成一個效果更好的分類器。實驗結果表明,該算法在文本分類方面,可以有效地提高文本分類的準確性。

2 相關理論基礎

2.1 稀疏自動編碼器

稀疏自動編碼器(sparse auto encoder,SAE)是利用人工神經網絡的特點構造而成的網絡。稀疏自動編碼器的訓練過程分為兩個步:第一步是預訓練,即先利用無監督的方法將SAE的輸入層和隱含層全部初始化,然后再利用逐層貪心訓練算法確定網絡的參數。第二步是微調,其思想是整個網絡視為一個整體,用有監督學習的方法優化整個網絡的參數,由于SAE訓練過程的復雜性,具體過程可參考文獻[2]。

2.2 極限學習機

針對傳統神經網絡訓練過程時間漫長,優化困難等缺點,新加坡南洋理工大學的黃廣斌教授提出了一種全新的單隱層前饋神經網絡-極限學習機(Extreme Learning Machine,ELM)[3],該網絡能夠以極快的學習速度達到較好的泛化性能,從而解決了傳統神經網絡學習速度緩慢的限制。該網絡主要由輸入層,隱藏層和輸出層組成,其中隱藏層的神經元通過激活函數把輸入的數據進行變換,然后把變換后的數據輸出到輸出層,在網絡中輸入層和隱藏層的權值是隨機設置的,只有隱藏層到輸出層的權值需要求解,因此加快了網絡的學習速度。

2.3 Adaboost分類器

由于單個分類器通常無法滿足分類任務的要求,因此需要通過集成學習來構建并結合多個分類器來完成分類任務,這其中最著名的是在1995年由Freund等提出的Adaboost[4]算法。該算法的核心思想是先從初始訓練集訓練出一個基學習器,再根據基學習器的變現對訓練樣本分布進行調整,使得先前基學習器做錯的訓練樣本在后續收到更多關注,然后基于調整后的樣本分布來訓練下一個基學習器;如此重復進行,直到基學習器數目達到指定的值,最終將這幾個基學習器進行加權結合。Adaboost是一種迭代算法,具體訓練過程可參考南京大學周志華教授編寫的機器學習課本中關于Adaboost算法的章節。

3 SEA文本分類算法

在本文中,結合稀疏編碼器,極限學習機與Adaboost這三種機器學習方法提出SEA文本分類算法,該算法的工作流程如圖1所示。

該分類算法的第一步為輸入,輸入的是經過了向量化表示的文本,但沒有經過任何的手工特征提取。第二步是利用SAE算法對數據的重建能力自動選擇文本的特征,用SAE算法選擇的文本特征可以有效地復原原始文本信息。第三步是利用ELM分類器作為該算法的基分類器,ELM作為第四步中的基分類器參與訓練,最后一步是輸出該文本屬于哪一類。

4 實驗結果與分析

4.1 實驗數據集與評價指標

本文選用的分類文本數據來源于新聞數據集[5],該數據集復旦大學計算機信息與技術系李榮陸提供,數據集標注比較規范,規模適中,適合于進行文本分類的仿真實驗。

在文本分類中常用的評價指標有準確率P(Precision)和召回率R(Recall),公式如下:

P=M/(M+N),R=M/(M+T)

其中,M為正確分類到該類的文本數,N為錯分到該類中的文本數,T為屬于該類確誤分為別類的文本數。

4.2 實驗結果

為驗證本文提出的SEA文本分類模型,需要將文本數據集進行預處理,對于SEA模型來說,就是進行文本分詞。本實驗文本分詞采用的是NLPIR漢語分詞系統,其主要功能包括中文分詞,詞性標注,命名實體識別,用戶字典功能等,是國內比較成熟,用戶較多的中文文本分詞系統。經過文本預處理后,按照本文提出的SEA文本分模型進行實驗,并和幾種經典的分類算法做對比。在本實驗中Adaboost集成學習算法中基分類器的個數設置為10個,基分類器ELM中隱藏層的個數設置為輸入層的0.75倍,稀疏自動編碼器中隱藏層數設置為4,實驗結果如表1和表2所示。

從表1和表2可以看出隨著文本數量的增加,SEA模型的分類準確率和召回率逐漸提高,這是由于在訓練數據集較小時,稀疏編碼器對自動提取的文本特征變現地不是很理想,容易造成SEA分類模型產生過擬合現象,從而影響分類準確率和召回率。SVM算法在訓練數據集比較小時,變現良好,這是由于在訓練數據較少時,可以較容易地找到分類超平面,在數據量變大時,由于計算量的增大,使得計算量變大,導致計算得到的超平面效果不好,使得分類準確率和召回率不斷下降。BP和ELM算法都隨著訓練數據的增大,其分類準確率和召回率在不斷變大,這是由于隨著訓練數據的增大,BP和ELM可以更有效的提取輸入數據的特征,但ELM算法相比BP算法變現得更好,這是由于BP算法可能無法收斂到最優值,導致分類算法的準確率下降。

綜上所述,本文提出的SEA文本分類模型可以有效的提高文本分類的準確率和召回率,尤其是隨著訓練數據集的不斷增大。

5 結束語

文本分類在文本處理中占據著重要的地位,其分類的好壞直接影響著后續的文本處理,如何有效地對文本分類是一個重要的研究課題。本文結合稀疏自動編碼器,極限學習機與Adaboost集成學習方法提出SEA文本分類方法,實驗結果表明該分類方法可以有效將文本分類過程中的特征提取和分類器結合在一起,從而提高了分類結果的準確性。

參考文獻

[1]秦勝君,盧志平.稀疏自動編碼器在文本分類中的應用研究[J].科學技術與工程,2013,13(31):9422-9426.

[2]Baldi P, Guyon G, Dror V, et al. Autoencoders, Unsupervised Learning, and Deep Architectures Editor: I[J].Journal of Machine Learning Research,2012.

[3]Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006,70(1-3):489-501.

[4]Freund, Yoav, Schapire, Robert E. A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting[J]. Journal of Computer & System Sciences, 1999,55(1):119-139.

篇3

關鍵詞:卷積神經網絡;語言模型;分析

1 卷積神經網絡語言模型

CNN語言模型基本結構包括輸入層、卷積層、池化層及后續的分類層。輸入層是表示語言的矩陣,該矩陣可以是通過Google word2vec或GloVe預訓練得到的詞嵌入表示,也可以是從原始數據重新訓練的語言的向量表示。輸入層之后是通過線性濾波器對輸入矩陣進行卷積操作的卷積層。在NLP問題中,輸入矩陣總是帶有固定順序的結構,因為矩陣的每一行都表示離散的符號,例如單詞或者詞組等。因此,使用等寬的濾波器是非常合理的設置。在這種設置下,僅需要考慮濾波器的高度既可以實現不同尺寸的濾波器做卷積操作。由此可知,在處理NLP問題時,卷積神經網絡的濾波器尺寸一般都是指濾波器的高度。

然后,將卷積層輸出的特征映射輸入池化層,通過池化函數為特征映射進行降維并且減少了待估計參數規模。一般的,CNN池化操作采用1-max池化函數。該函數能夠將輸入的特征映射統一生成維度相同的新映射。通過池化操作,可以將卷積層生成的特征連接成更抽象的高級特征,所得到的高級特征尺寸與輸入的句子不再存在直接關系。

最后,將得到的高級特征輸入softmax分類層進行分類操作。在softmax層,可以選擇應用dropout策略作為正則化手段,該方法是隨機地將向量中的一些值設置為0。另外還可以選擇增加l2范數約束,l2范數約束是指當它超過該值時,將向量的l2范數縮放到指定閾值。在訓練期間,要最小化的目標是分類的交叉熵損失,要估計的參數包括濾波器的權重向量,激活函數中的偏置項以及softmax函數的權重向量。

2 卷積神經網絡語言模型應用分析

CNN語言模型已經廣泛應用于諸如文本分類,關系挖掘以及個性化推薦等NLP任務,下面將對這些應用進行具體的介紹與分析。

2.1 CNN在文本分類中的應用分析

kim提出了利用CNN進行句子分類的方法。該方法涉及了較小規模的參數,并采用靜態通道的CNN實現了效果很優異的句子分類方法。通過對輸入向量的調整,進一步提高了性能實現了包括情感極性分析以及話題分類的任務。在其基礎上為輸入的詞嵌入設計了兩種通道,一種是靜態通道,另一種是動態通道。在卷積層每一個濾波器都通過靜態與動態兩種通道進行計算,然后將計算結果進行拼接。在池化層采用dropout正則化策略,并對權值向量進行l2約束。最后將該算法應用于MR、SST-1與SST-2、Subj、TREC、CR以及MPQA等數據集。MR數據集為電影評論數據集,內容為一句話的電影評論,其分類包括積極情感極性與消極情感極性兩類。SST-1與SST-2數據集為斯坦福情感樹庫是MR數據集的擴展,但該數據集已經劃分好了訓練集、驗證集及測試集并給出了細粒度的標記,標記包括非常積極、積極、中性、消極、非常消極等情感極性。Subj數據集為主觀性數據集,其分類任務是將句子分為主觀句與客觀句兩類。TREC數據集為問題數據集,其分類任務是將所有問題分為六類,例如關于數字、人物或位置等信息的問題。CR數據集為評論數據集,包括客戶對MP3、照相機等數碼產品的評論,其分類任務是將其分為積極評價與消極評價兩類。MPQA數據集是意見極性檢測任務數據集。通過實驗證明,該方法在這幾個典型數據集上都能取得非常優異的效果。

2.2 CNN在關系挖掘中的應用分析

Shen等人提出了一種新的潛在語義模型,以詞序列作為輸入,利用卷積-池化結構為搜索查詢和Web文檔學習低維語義向量表示。為了在網絡查詢或網絡文本中捕捉上下文結構,通過輸入單詞序列上下文時間窗口中的每個單詞來獲取詞匯級的n-gram語法特征,將這些特征聚合成句子級特征向量。最后,應用非線性變換來提取高級語義信息以生成用于全文字符串的連續向量表示。該模型的不同之處在于,輸入層與卷積層之間加入了word-n-gram層與letter-trigram層,它們能夠將輸入的詞序列轉變為letter-trigram表示向量。在卷積層通過上下文特征窗口發現相鄰單詞的位置特征,并變現為n-gram形式。然后通過max池化將word-n-gram特征合并為句子級的高級特征。在池化層之后增加了語義層來提取更高級的語義表示向量。

2.3 CNN在個性化推薦中的應用分析

Weston等人提出了一種能夠利用標簽(hashtag)有監督的學習網絡帖子短文本特征表示的卷e嵌入模型(Convolutional Embedding Model)。該方法利用提出的CNN模型在55億詞的大數據文本上通過預標注的100,000標簽進行訓練。該方法除了標簽預測任務本身能取得好的效果外,學習到的特征對于其它的文本表示任務也能起到非常有效的作用。該模型與其它的詞嵌入模型類似,輸入層為表示文本的矩陣,但是,在用查找表表示輸入文本的同時將標簽也使用查找表來表示。對于給定的文檔利用10萬條最頻繁出現的標簽通過評分函數對任何給定的主題標簽進行排序。

其中,econv(w)表示CNN的輸入文檔,elt(t)是候選標簽t的詞嵌入表示。因此,通過對分數f(w,t)進行排序可以獲取所有候選主題標簽中排序第一的話題進行推薦。實驗數據集采用了兩個大規模語料集,均來自流行的社交網絡文本并帶有標簽。第一個數據集稱作people數據集,包括搜集自社交網絡的2億1000萬條文本,共含有55億單詞。第二個數據集被稱作pages,包括3530萬條社交網絡文本,共含有16億單詞,內容包括企業、名人、品牌或產品。

3 結束語

卷積神經網絡應用于語言模型已經取得了非常大的發展,對于自然語言處理中的各項任務均取得了優異的結果。本文通過對幾項典型工作的分析,探討了不同卷積神經網絡模型結構在不同任務中的表現。通過綜合分析可以得出以下結論。首先,CNN的輸入采用原始數據訓練的向量表示一般效果會優于預訓練的詞嵌入表示;其次,在卷積層濾波器的尺寸一般采用寬度與輸入矩陣寬度相等的設置;最后,為了優化結果可以采用dropout正則化處理。

篇4

關鍵詞:模糊神經網絡;蔬菜;病害;診斷

中圖分類號:TP182;S435 文獻標識碼:A 文章編號:0439-8114(2013)17-4224-04

Research on vegetables Disease Diagnosis Model Based on Fuzzy Neural Network

WEI Qing-feng,LUO Chang-shou,CAO Cheng-zhong,GUO Qiang

(Institute of Agriculture Science and Technology Information, Beijing Academy of Agriculture and Forestry Sciences, Beijing, 100097)

Abstract: To explore the effective method for the diagnosis of vegetables diseases, through reasonable division of symptoms, using input vector construction method which contained characteristics of symptoms and membership grade, a vegetables disease diagnosis of fuzzy neural network model was constructed. The experimental results showed that the input vector construction method had effectively expressed the disease diagnosis rule, the model had strong fault tolerant ability, and the average diagnostic accuracy was 85.5%.

Key words: fuzzy neural network; vegetable; disease; diagnosis

收稿日期:2013-01-30

基金項目:國家現代農業科技城綜合信息“三農”服務平臺建設項目(PT01);北京市自然科學基金項目(9093019);北京農業科學院信息所

創新基金項目(SJJ201203)

作者簡介:魏清鳳(1983-),女,湖北武漢人,助理研究員,碩士,主要從事農業信息技術的研究工作,(電話)13439026360(電子信箱)

;通訊作者,羅長壽,副研究員,(電話)010-51503387(電子信箱)。

病害是影響蔬菜優質生產的重要制約因素之一。我國農村基層還相對缺乏有經驗的病害診斷專家,對蔬菜病害不能正確判斷,不但延誤了防治最佳時機,還嚴重降低了蔬菜品質。

當前農業病害診斷技術方法主要有圖像分析診斷[1-4]、專家系統診斷[5-7]以及人工神經網絡診斷[8]等。基于圖像分析的病害診斷方法其圖像的獲取受環境光照的影響較大,且需要專業人員在室內進行數據分析和識別,時效性差,無法實時滿足具體生產實踐的要求。基于專家系統的診斷方法,采用 IF-THEN產生式推理,存在診斷知識獲取有瓶頸、推理規則更新難、容錯能力差、串行搜索運行效率低等不足。近年基于人工神經網絡的方法無需建立推理規則,具有自學習及并行處理能力,較引人注目,但存在對病害癥狀的典型性、非典型性模糊特點無法區分度量,樣本診斷規律學習不充分等問題。模糊神經網絡可以將不確定的癥狀信息通過模糊隸屬集來表示,能解決診斷系統中的不確定性知識表示、并行推理等問題,對具有模糊性復雜性的蔬菜病害診斷非常適用。此文利用模糊系統和神經網絡相結合的方法,在對病害特征模糊量化方法研究的基礎上,建立能夠實際應用的蔬菜病害模糊神經網絡診斷模型,為蔬菜病蟲害防治提供依據。

1 蔬菜病害診斷知識整理

一般研究中,將植株的發病部位劃分為根、莖、葉、花、果5個部分[9]。由于部分蔬菜病害(如猝倒病)在苗期即表現出典型癥狀,因此,為提高診斷的全面性和準確性,將蔬菜植株發病表現最終劃分為根、莖蔓、葉、花、果、苗6個部分。表示如下:

S={Si | i=1,2,3,4,5,6}

式中,Si表示根、莖蔓、葉、花、果、苗6個部分中的1個。

以“北京農業數字資源中心”中蔬菜病害數據庫的知識為基礎,結合文獻資料、植保專家咨詢及案例分析,對病害特征知識根據根、莖蔓、葉、花、果、苗6個部分進行分別提取,建立二維知識表。

2 病害癥狀重要性劃分及隸屬函數

不同癥狀對病害診斷的貢獻程度不同,一些特征明顯的癥狀表現往往是確定某種病害的重要依據。通常用模糊的自然語言來描述癥狀對于病害識別的重要程度,這里將其劃分為典型癥狀、主要癥狀、一般癥狀3個層次(表1)。

將癥狀重要性隸屬函數定義為模糊語言值,根據專家經驗法,確定不同層次的隸屬度如下:

L(Si)=1.0 Si∈a0.7 Si∈b0.4 Si∈c i={1,2,3,4,5,6}

L為Si的隸屬度,a、b、c為癥狀類型。

3 基于術語統一描述的病害癥狀向量構建

一般方法中,直接利用診斷資料的原始文本,以癥狀表現部位為單元賦權值(或隸屬度)作為樣本分量構建輸入向量[10],不僅存在向量攜帶信息量少、向量模長短不一、診斷規律體現不明顯等問題,還容易產生相同的樣本向量對應不同病害種類的錯誤情況,不能較好地對病害原因進行區分,這也勢必影響到診斷的準確性。對此,本方法將原始資料的自然語言樣本映射到共同語義空間中,統一利用病狀病癥的相關術語對癥狀資料的原始文本進行描述,并根據術語的定義值以及癥狀重要性隸屬度來確定語義樣本的樣本值,從而構建輸入向量,能有效豐富向量信息承載量,充分表達診斷規律,具體如下。

3.1 自然語言癥狀的術語映射

本環節即是對原始自然語言病害癥狀資料在共同語義空間中利用相關術語進行統一描述。根據植物學知識,感病植株的外觀病態表現可分為病狀和病征兩大類。共同語義空間的病害癥狀術語如表2所示。

根據病害癥狀表,癥狀的自然語言描述轉化為術語描述。如辣椒枯萎病莖蔓部自然語言癥狀={水浸狀腐爛,后全株枯萎,病部白色霉狀物},經語義空間映射后,S2={濕腐,枯死,霉狀物},其樣本定義值D(S2)為{0,0,2,2,0,1}。

3.2 輸入向量的構建

綜合樣本定義值和癥狀重要性隸屬度,形成具有癥狀特征和癥狀重要性信息的向量。為了降低輸入向量維度,對矩陣中同列均為0值的列進行簡約,形成最終輸入向量矩陣。輸入向量表示為:

Xi={D(S1)×L(S1),D(S2)×L(S2),……,D(Si)×L(Si)}

其中,D(Si)為Si癥狀的樣本定義值,L(Si)為Si癥狀的重要性隸屬度。

4 蔬菜病害診斷模型建立

蔬菜病害診斷神經網絡模型采用模糊BP神經網絡構建(圖1)。模糊系統和神經網絡按串聯方式連接,用模糊系統對原始知識進行前處理,用神經網絡進行病害診斷。

第一層為輸入層,其每一個節點代表一個輸入變量,它將樣本定義值傳遞到模糊層。

第二層為模糊層,基于癥狀樣本定義值和癥狀隸屬度構建輸入向量。

第三層為隱含層,實現輸入變量模糊值到輸出變量模糊值映射。隱含層節點數確定方法如下:

l=■+a 0

式中,l為隱含層神經元個數,n為輸入層神經元個數,m為輸出層神經元個數,a為取值0~10之間的常數。

第四層為輸出層,輸出向量采用“n中取1”的二進制編碼法。其中n為編碼長度,即病害總數。每組編碼中僅有1位為1,其余n-1位為0,表示某一種病害。診斷過程中,最大向元值對應著可疑病害。該最大值若接近0, 則表示發生相對應病害的可能性很小;若接近1,則表明發生相對應病害的可能性極大。

5 診斷測試分析

以番茄白絹病、番茄猝倒病、番茄根霉果腐病、番茄青枯病等19種病害為例,經上文方法構建20維輸入向量(部分輸入如表3),19維輸出向量(部分輸出向量如表4)。設隱層單元15個,目標誤差0.000 1,循環1 000次,采用Levenberg-Marquardt 算法進行訓練,并開發系統界面,對訓練好的模型從診斷容錯性和診斷準確性兩個角度進行分析。

5.1 模型診斷容錯性測試

在實際應用過程中,用戶提供的病害癥狀無法與樣本完全一致,病害典型癥狀被選的可能性最大,但部分主要癥狀和一般癥狀存在A-誤選(提供癥狀與樣本癥狀不一致)、B-多選(提供癥狀多于樣本癥狀)、C-少選(提供癥狀少于樣本癥狀)、A+B-多選及誤選、A+C-少選及誤選的情況,據此選取用戶5組具有代表性測試數據(表5),以番茄潰瘍病為例來檢驗模型的容錯性,輸出結果如表6。

樣本輸出向量中第17位為向元最大值,則表明該輸出結果為番茄潰瘍病。在5組具有代表性的用戶測試數據中,輸出向量的向元最大值始終在第17位,說明診斷模型具有較強的容錯能力。同時,當用戶“誤選”、“多選”,以及“多選+誤選”時,輸出向量第17位向元值分別為0.999 9、0.987 6、0.921 6,接近樣本模擬值1;當用戶“少選”以及“少選+誤選”時,輸出向量第17位向元值分別為0.778 6、0.594 6,較之其他組測試數據,較遠離樣本模擬值1,說明用戶提供的病害癥狀信息越多,進行正確診斷的可能性越大。

5.2 模型診斷準確性測試

將本研究與一般方法中直接利用癥狀權值作為輸入向量的一般神經網絡診斷模型進行準確性比較。測試數據包括兩類,即實驗室根據田間數據資料生成的數據,以及涉農用戶根據實際生產情況進行癥狀選擇操作生成的數據。經植保專家驗證,獲得測試結果平均值見表7。

統計結果顯示,室內室外測試中,基于模糊神經網絡的診斷方法較一般神經網絡在正確率方面均有所提高,說明本研究的思路方案是有效的。其中,實驗室所利用的田間數據資料測試結果好于農戶實際應用。其原因在于,實驗室所使用的田間數據資料較接近文獻資料中的診斷知識,且基于模糊神經網絡的蔬菜病害模型具有較好的容錯性,因此診斷正確率較高。外部基層農戶則完全按照自己在生產中見到的癥狀表現進行選擇操作而形成測試數據,更為真實地反映了模型的實際應用情況。由于實際生產中存在多個病害夾雜同時表現的復雜情況,這一定程度上影響了診斷正確率,因此也說明在該方面努力能進一步提高模型的實用性。

6 小結

利用基于術語統一描述的病害癥狀量化方法,能構建既能描述癥狀特征又能反映癥狀重要性的輸入向量,更能有效地體現病害診斷規律。經過誤選、多選、少選、多選+誤選、少選+誤選的5組測試中,診斷結果仍然能指向正確的病害,模型容錯推理能力較強。將模糊數學方法引入神經網絡中,結合基于術語統一描述的病害癥狀量化方法,建立基于模糊神經網絡的蔬菜病害診斷模型,較之一般基于神經網絡的病害模型,診斷準確性得到了有效提高。

由于農業生產中病害作用的復雜性,今后將在多個病害同時作用的診斷方面進一步努力探索,以提高模型的生產實用性。同時,隨著移動網絡技術的迅猛發展以及移動設備終端的日益普及,將進行蔬菜病害診斷系統的研究,以期為蔬菜病蟲害防治咨詢提供更加便捷、靈活、有效的服務。

參考文獻:

[1] LAI J C, MING B, LI S K, et al. An image-based diagnostic expert system for corn diseases[J]. Agricultural Sciences in China,2010(8):1221-1229.

[2] 李 旺,唐少先.基于圖像處理的農作物病害識別研究現狀[J].湖南農機(學術版),2012,39(1):176-178.

[3] 劉連忠,張 武,朱 誠. 基于改進顏色特征的小麥病害圖像識別技術研究[J]. 安徽農業科學,2010,40(26):12877-12879.

[4] 鄒修國. 基于計算機視覺的農作物病蟲害識別研究現狀[J]. 計算機系統應用,2011,20(6):238-242.

[5] MANSINGH G, REICHGELT H, BRYSON K O. CPEST: An expert system for the management of pests and diseases in the Jamaican coffee industry[J]. Expert Systems with Applications,2007,32(1):184-192.

[6] 林 瀟,李紹穩,張友華,等.基于本體的水稻病害診斷專家系統研究[J].數字技術與應用,2010(11):109-111.

[7] GHOSH I, SAMANTA R K. Teapest:An expert system for insect pest management in tea[J].Applied Engineering in Agriculture,2003,19(5):619-625.

[8] 王軍英.基于BP神經網絡的葡萄病害診斷方法研究[J].農業網絡信息,2010(6):21-23,36.

篇5

自動鍛壓機封閉高度調整改進設計

基于Matlab的三相電壓型PWM整流器的仿真研究

基于多傳感器數據融合的火災報警系統設計

模擬氫冷汽輪機轉子節能改進

基于VB的大學物理實驗數據處理系統的設計與實現

用激光光源測量凸透鏡焦距實驗探究

項目反應理論在計算機自適應題庫建設中的應用

基于遺傳算法的排課設計

AutoCAD的三維造型與工程圖轉換技術研究

論“云計算輔助教學”CCAI及教學資源組織

基于SOA的數字化校園應用模式的研究

模板法制備納米復合光催化材料HPA/TiO_2

YK73400L數控成形磨齒機工藝設計

環保透水磚的制備與性能研究

混凝土在雙向受壓下力學性質的試驗研究

自動鍛壓機凸模推出機構改進設計

樹麻雀的體溫調節

扎龍濕地面積動態變化趨勢數學模型及因素分析

基于ARIMA的居民消費價格指數建模與預測

用矩陣實現模糊本體映射

激光跟蹤儀在主軸箱體檢測上的應用

一種BP神經網絡改進算法的研究

傳感式智能家用煤氣表的研制

基于對象方向方位的連續方向查詢算法

一種有效檢索和更新移動對象的混合索引結構

較長銷孔加工方案分析

移動對象流量查詢方法研究

空間數據庫R-tree連接方法研究

關聯規則挖掘在臨床診斷中的應用研究

基于距離和的數據挖掘技術在中考成績處理中的應用

燃氣爐供熱改善大氣環境的方法

三層C/S通用試題庫系統的需求分析和總體設計

外凸輪輪廓曲線加工誤差分析

基于單片機的步進電機控制系統的研制

基于組合核支持向量機的圖像邊緣檢測

衣康酰化降解殼聚糖在亞麻織物無甲醛防皺整理中的應用

二氧化硅-氧化鋅溶膠凝膠法制備固相微萃取涂層的研究

燃硫爐出口溫度與三氧化硫氣體濃度的關系

基于網格和XML的異構數據庫集成模型

Excel表格計算工程預算的工程量方法

BP神經網絡在蜜網系統中的應用

改進BP神經網絡在個人信用評估系統的應用

GIS系統在城市燃氣管網中的應用

基于USB接口的便攜式溫濕度記錄儀的設計

基于OracleWebServer的管理信息系統開發

Liu-Liu-Liu-Liu系統的混沌同步

企業實施SPC核心工具——控制圖方法研究

PL/SQL在求解最短路徑問題中的應用

城市燃氣用戶軟管的安裝問題研究

基于廣播模式的錄井儀實時數據傳輸系統的設計與實現

垂直井筒兩相流溫度場的模擬計算

基于固定網絡的移動對象軌跡查詢

壓縮天然氣管道輸送應用研究

CISC與RISC結構CPU間軟件移植技術問題分析

液化石油氣管道供氣方式的應用研究

篇6

關鍵詞:主題模型;特征表達;多示例多標記學習;場景分類;文本分類

中圖分類號: TP181

文獻標志碼:A

Multiinstance multilabel learning method based on topic model

YAN Kaobi1, LI Zhixin1,2*, ZHANG Canlong1,2

1.Guangxi Key Laboratory of MultiSource Information Mining and Security, Guangxi Normal University, Guilin Guangxi 541004, China

2.Guangxi Experiment Center of Information Science, Guilin Guangxi 541004, China

Abstract: Concerning that most of the current methods for MultiInstance MultiLabel (MIML) problem do not consider how to represent features of objects in an even better way, a new MIML approach combined with Probabilistic Latent Semantic Analysis (PLSA) model and Neural Network (NN) was proposed based on topic model. The proposed algorithm learned the latent topic allocation of all the training examples by using the PLSA model. The above process was equivalent to the feature learning for getting a better feature expression. Then it utilized the latent topic allocation of each training example to train the neural network. When a test example was given, the proposed algorithm learned its latent topic distribution, then regarded the learned latent topic allocation of the test example as an input of the trained neural network to get the multiple labels of the test example. The experimental results on comparison with two classical algorithms based on decomposition strategy show that the proposed method has superior performance on two realworld MIML tasks.

英文關鍵詞Key words:

topic model; feature expression; multiinstance multilabel learning; scene classification; text categorization

0引言

傳統的監督學習問題通常定義為單示例單標記學習問題,一個對象用一個示例來表示,同時關聯一個標記。定義X為示例空間,Y為標記集合。單示例單標記學習的目的是從一個給定的數據集{(xi,yi)|1≤i≤N}中學習一個函數f:xy,其中:xi∈X是一個示例,yi∈Y是示例xi的一個標記。在機器學習技術[1]日益成熟的條件下,傳統的單示例單標記學習方法已經取得了很大的成功。

然而,在現實世界中,一個對象通常是多義性的復雜對象,如果仍用傳統的單示例單標記學習方法,不但不能很好地表達出對象豐富的內容信息,而且不能得到對象準確的語義標記集合,因此對于這種多義性對象,可以采用多標記學習方法來處理。在多標記學習[2]方法下,一個對象用一個示例來表示,但是關聯多個標記。多標記學習的目的是從一個給定的數據集{(xi,yi)|1≤i≤N}中學習一個函數f:x2y,其中:xi∈X是一個示例,yiY是示例xi的一個標記集合{(yi1,yi2,…,yili)},li是標記集合yi中標記的個數。雖然多標記學習已經取得了很大的成就,但是只用一個示例來表示多義性對象不能有效地表達出多義性對象的復雜內容。

事實上,在多標記學習中,一個標記對應著對象不同的區域,如果能夠對一個確定的區域(不是一個整體的對象)和一個特定的標記直接建立對應的模型,將會有效地減少噪聲對分類準確性的影響,因此可以采用多示例學習的方法來表示多義性對象的復雜內容。多示例學習[3]的任務是從一個給定的數據集{(xi,yi)|1≤i≤N}中學習一個函數f:2xy,其中:xiX是一個包的示例集合{(xi1,xi2,…,xini)},ni是包xi中示例的個數,yi∈Y是包xi上的一個標記。然而,多示例學習主要用于單標記問題,對于多標記問題需要分解為多個單標記問題進行處理。

為了克服多標記學習和多示例學習方法的缺點,將二者結合起來形成一種多示例多標記學習方法[4],來處理帶有復雜內容的多義性對象將會更加合理和有效。多示例多標記學習的目的是從一個給定的數據集{(xi,yi)|1≤i≤N}中學習一個函數f:2x2y,其中,xiX是一個包的示例集合{(xi1,xi2,…,xini)},ni是示例集合xi中示例的個數,yiY是包xi的一個標記集合{(yi1,yi2,…,yili)},li是標記集合Yi中標記的個數。

近年來,多示例多標記學習已經取得了很大的進展,同時也面臨著三個主要的難題。首先,由于圖像分割技術[5]的限制,很難劃分出具有完整語義標記的示例;其次,在劃分示例后,傳統的做法是提取示例的底層特征,然后建立特征向量和語義標記之間的映射模型,由于特征提取[5]和機器學習技術[1]的限制,如何自動提取示例的高層特征及建立映射模型也是一個難點;最后,由于標記之間復雜的相關性[6],如何建立能夠捕獲標記之間相關性的模型[7]也是一個難點,同時文獻[8]指出了大數據問題也是多示例多標記學習面臨的一個新問題。如果能夠克服這些主要難題,可以建立一個完美的多示例多標記模型,該模型可以直接學習示例和標記之間的映射關系,同時可以捕獲到標記之間的相關性。

1相關研究

1.1多示例學習

多示例學習中,一個樣本被看成是一個包含多個示例的包,當需要對一個包進行標記的時候,如果包中至少有一個示例具有對應的標記含義,則將這個包標記為正包,否則標記為負包。雖然多示例學習框架被限制在單標記問題上,但是多示例學習方法已經取得了很多研究成果,針對不同的問題提出了不同的多示例學習方法,此外多示例學習還可以用于圖像檢索。

1.2多標記學習

對于多義性對象,可以采用多標記學習的方法來處理。文獻[6]對多標記學習作了一個全面的綜述報告;文獻[9]提出了一種基于神經網絡的多標記學習方法。從現有的多標記算法可以看出,可以采用兩個策略來處理多標記學習問題:一是將多標記問題分解為多個單標記問題。但是在很多情況下標記之間是有相關性的,例如天空和海洋可能會同時出現在同一個場景中,如果仍然用這個策略來處理多標記學習問題,將會丟失這種對提升多分類性能很有幫助的信息。二是直接對示例和標記集合之間建立模型。在一些復雜的模型中,不但可以直接建立示例和標記集合的對應關系,同時也可以得到標記之間的一些相關性。

1.3多示例多標記學習

對于多示例多標記學習,文獻[4]中對多示例多標記學習作了一個全面的介紹,并且提出了MIMLBOOST和MIMLSVM算法。MIMLBOOST算法首先將多示例多標記問題轉化為多示例問題,然后再采用MIBOOST[10]來處理多示例問題;MIMLSVM算法首先將多示例多標記學習問題轉化為多標記問題,然后采用MLSVM[11]算法來處理多標記問題。傳統的監督學習方法、多示例學習方法和多標記學習方法都可以通過分解策略從多示例多標記學習中得到,但是采用這種分解策略會丟失很多蘊藏在訓練樣本中的信息,同時也不能考慮到標記之間存在關聯性的問題。后來,文獻[12]提出了一種直接學習示例和標記之間映射關系的MIMLRBF算法;文獻[7]提出了一種聯合多示例和多標記的新穎算法,該算法不但可以直接對示例集合和標記集合之間進行建模,同時還可以捕獲到標記之間的關聯性;文獻[8]則提出了一種針對大數據問題的快速多示例多標記算法。然而,上述文獻中提到的方法都沒有考慮如何來更好地表示對象的特征這一因素。針對這一問題,本文考慮將特征學習模型融入多示例多標記學習中,以學習到一個更好的特征表達方式,從根源上提升分類算法的準確性。概率潛在語義分析模型可以學習到樣本中潛在的主題這一高層特征,本文結合這一特性提出一種新的多示例多標記學習方法PLSANNMIML,以解決多示多標記學習中如何更好地表示對象特征這一問題。

2PLSANNMIML方法

2.1概率潛在語義分析

Hofmann[13]首次提出用概率潛在語義模型對文本進行建模的方法。當用概率潛在語義分析模型處理圖像數據時,可以把圖像看成是文檔,用概率潛在語義分析模型對圖像進行建模來發現圖像潛在的主題分布。

假設D={d1,d2,…,di}代表一個圖像數據集,W={w1,w2,…,wj}代表一個視覺詞匯表,這種用概率潛在語義分析模型對圖像進行建模的模型是一個發現共現矩陣隱變量的模型,而該共現矩陣的值由nij=(wj,di)組成,其中nij=(wj,di)是一個視覺詞wj出現在圖像di中的數量。設Z={z1,z2,…,zk}代表沒有觀測到的潛在主題變量, P(di)代表觀測到一張具體圖像的概率, P(zk|di)代表一張特定圖像在潛在主題空間下的概率分布, P(wj|zk)代表一個視覺詞出現在一個確定主題變量下的條件概率。這種生成模型可以用如下步驟表示:

1)以一定的概率P(di)選擇一張圖像di;

2)以一定的概率P(zk|di)選擇一個主題zk;

3)以一定的概率P(wj|zk)生成一個詞wj。

經過上面的過程,當得到一個觀測點(wj,di)時,潛在的主題變量zk被忽略,產生下面的聯合概率模型:

L=logP(wj,di)=∑d∈D∑w∈Wn(wj,di)logP(wj,di)

(1)

在遵循似然原則的條件下,采用期望最大化算法[12]最大化似然函數的對數,從而得到P(wj|zk)和P(zk|di),似然函數的對數表現形式如式(2)所示:

L=logP(wj,di)=∑d∈D∑w∈Wn(wj,di)logP(wj,di)

(2)

2.2神經網絡

神經網絡[14]由于其在信息處理中具有非線性的自適應能力,已經在人工智能領域中取得了廣泛的應用。算法通過具有三層結構的前向神經網絡模型[15]來得到樣本的標記集合,每層由不同的神經元組成,第一層叫輸入層,中間層叫隱藏層,最后一層叫輸出層。在每一層中的每個神經元都連接著下一層的所有神經元,但在同一層中的神經之間是沒有連接的,當信息從一層傳到下一層時,前層中的每個神經元都會有一個激活函數對信息進行變換,該函數選擇的是S型的激活函數,其定義是:f(x)=1-ex1+ex。在訓練神經網絡時,采用的是反向傳播學習算法[15]來學習神經網絡中神經元的權值。

2.3PLSANNMIML方法

算法主要包括訓練和測試兩個階段,流程如圖1所示。

2.3.1訓練階段

訓練過程包括兩個步驟:首先通過概率潛在語義分析模型從所有的訓練樣本中學習到每個樣本的特定主題分布P(zk|di)和每個主題的特定詞分布P(wj|zk),每個樣本就可以用P(zk|di)來表示;其次再用每個樣本的特定主題分布來訓練神經網絡,具體細節如下所示:

式(3)描述的是神經網絡在樣本xi上的誤差函數。訓練過程中算法采用概率潛在語義分析模型將xi轉化為主題向量zk。假定標記空間Y有Q個標記,神經網絡具有與主題向量zk維數相同的輸入和Q個輸出,其中Q個輸出對應著Q個標記,向量w是在神經網絡中需要學習的權值向量。

Ei(w)=∑Qq(ciq-diq)2

(3)

其中:ciq是訓練時樣本xi在第q個類上的實際輸出;而diq是樣本xi在第q個類上的目標輸出,如果q∈yi則diq的值為1,否則其值為-1。通過結合誤差反向傳播策略[14],采用隨機梯度下降法來最小化式(3)中的誤差函數,其過程如下:

假定xji是單元j的第i個輸入, wji是關聯輸入xji的權值大小,netj=∑iwjixji是單元j的網絡輸出,oj=f(netj)是單元j的實際輸出,tj是單元j的目標輸出,根據隨機梯度下降算法可以得到每個權值的更新公式如下:

wji=wji-ηEiwji

(4)

其中η是學習速率的大小。計算式Eiwji的值時,分兩種情況討論:

當j是輸出層的單元時,推導出式(5):

Eiwji=-(tj-oj)oj(1-oj)

(5)

當j是隱藏層的單元時,推導出式(6):

Eiwji=-oj(1-oj)xji∑k∈S[(tj-oj)oj(1-oj)]wkj

(6)

其中S是單元j的輸出所能連接到的單元的集合。

2.3.2測試階段

給定一個測試樣本pX,算法首先利用在訓練階段得到的每個主題的特定詞分布P(wj|zk)來學習到測試樣本的特定主題分布P(zk|dt),然后將學習到的主題分布輸入到已經訓練好的神經網絡,神經網絡將會有Q個輸出,采用文獻[9]介紹的方法選擇閾值,通過選擇合適的閾值,得到標記的相關集合。

3實驗結果與分析

3.1實驗步驟

根據選擇的模型,算法涉及到三個需要確定的參數變量,分別是詞的數量、主題的數量和神經網絡中隱層神經元的數量,分別用Words、Topics、Neurons來表示。由于這三個參數對算法的性能有很重要的作用,因此首先需要確定這三個參數的最優值。在確定參數的最優值時,采用漢明損失(Hamming loss)和1錯誤率(oneerror)這兩個評價指標來評估參數對算法性能的影響。確定算法的最優參數后,算法對現實世界中的兩種多示例多標記學習任務進行實驗,并與現有的多示例多標記算法MIMLBOOST和MIMLSVM進行比較。

實驗涉及到兩個數據集,每個數據集都有2000個樣本。實驗時先把每個數據集劃分為三部分:1000個樣本的訓練集合、500個樣本的驗證集和500個樣本的測試集。

其中500個樣本的驗證集用于確定算法的最優參數。當確定算法的最優參數后,再將1000個樣本的訓練集和500個樣本的驗證集合并形成一個1500個樣本的訓練集,最終每個數據集對應著一個1500個樣本的訓練集和一個500個樣本的測試集。表1是對實驗中所用數據集的具體描述。

【答:文本數據集每個包劃分出的示例都不相同,一個平均值表示的是一次實驗時每個包的示例的平均數,表格中平均數有個范圍是對數據集進行不同的劃分,進行多次實驗時的一個平均值范圍,所以是3.56±2.71,也與后面表中的實驗數據一致。上面場景數據集,每幅圖片都劃分成9個示例,所以平均數不變,也可以寫成9.00±0.00;

3.1.1場景數據集

實驗使用的場景數據集包含2000幅自然場景圖像,整個數據集包含的類標記有沙漠、山、海洋、日落、樹。數據集中每幅圖像的標記都是人工標記的,數據集中超過22%的圖像具有多個標記,平均每幅圖像的標記數量是1.24±0.44。對圖像劃分示例后,通過提取每個示例的顏色和紋理特征將其中的每個示例表示為一個18維的向量,并用這個特征向量代表這個示例。

3.1.2文本數據集

實驗使用的文本數據集又名為Reuters21578數據集。實驗時先對這個數據集進行預處理,形成一個具有2000個文檔的數據集。整個文檔數據集包含7個類標記,大約15%的文檔具有多個標記,平均每個文檔的標記數量是1.15±044。當進行示例劃分時,采用滑動窗口的技術[16]來形成文檔的示例,每個示例對應著一個被大小為50的滑動窗口所覆蓋的文本段,最后采用基于詞頻[17]的詞袋模型表示方法來表示生成的示例。

3.2實驗結果

圖2是采用部分場景數據集作為實驗數據,觀測不同參數值配置對算法性能的影響。圖2(a)~(f)中參數變量的取值范圍為[3,21],并且參數變量取整數值;

算法中,學習速率η的值設置為0.1。通過改變參數的配置,采用漢明損失和1錯誤率來評估參數對算法性能影響,進行了多組實驗來確定算法的最優參數值。

實驗開始時,如圖2(a)和(b)中顯示,先確定Neurons和Topics這兩個參數的值,其值設置為Neurons=3,Topics=3,Words的變化范圍為[3,21]。從圖2(a)和(b)中可以看到,當Words取值為7時,漢明損失和1錯誤率指標取得最小值,算法的分類性能最好。

在圖2(c)和(d)中,參數Neurons的值與圖2(a)和(b)中的值相同,但是Words的值設置為7,Topics的變化范圍為[3,21]。從圖2(c)和(d)中可以看出,當Topics取值為9時,漢明損失和1錯誤率指標取得最小值,算法的分類性能最好。

在圖2(e)和(f)中,根據前面的實驗結果,參數Words的值設置為7,Topics的值設置為9,Neurons變化范圍為[3,21]。從圖2(e)和(f)中可以看出,當Neurons取值為9時,漢明損失和1錯誤率指標取得最小值,算法的分類性能最好。確定算法的最優參數值后,算法對現實世界中的兩種多示例多標記學習任務進行實驗,并和MIMLBOOST和MIMLSVM進行比較,采用文獻[12]中提到的五種多標記學習評價指標來評估算法的性能。表2和表3分別是各個算法在場景數據集和文本數據集上進行實驗的結果,同時表4還給出了各個算法在這兩個數據集進行實驗時所需要的時間。在表2和表3中,表示數值越小算法性能越好,而表示數值越大算法性能越好。

從表2、3中的數據可以看出,對于表中的所有評價指標,PLSANNMIML算法在場景數據集和文本數據集上具有更好的性能。

從表4中可以看出,PLSANNMIML方法在時間上也具有更好的性能,在訓練和測試階段,算法需要的時間都比MIMLSVM算法稍微少些,而且遠遠要少于MIMLBOOST算法所需要的時間。從所有的實驗結果可以看出,PLSANNMIML方法在現實世界中的兩種多示例多標記學習任務中具有更優越的性能。

4結語

現有的大部分多示例多標記學習算法都沒有考慮怎么樣更好地表示對象的特征這一因素,因此提出了一種結合概率潛在語義分析和神經網絡的多示例多標記學習方法。概率潛在語義分析模型可以學習到樣本中的潛在語義這一高層特征,而神經網絡在多標記問題中具有良好的分類性能。對現實世界中的兩種多示例多標記學習任務進行實驗表明,PLSANNMIML算法對其他的多示例多標記學習算法而言具有很強的競爭力,解決了在多示例多標記學習算法中怎么更好地表示對象的特征這一問題;同時也存在著不足之處,算法依然采用的是分解策略來處理多示例多標記學習問題,同時還忽略了標記之間的相關性。下一步將在融入特性學習模型的基礎上尋找其他策略來處理多示例多標記問題,同時也要考慮標記之間的相關性。

參考文獻:

[1]

BISHOP C M. Pattern recognition and machine learning: information science and statistics [M]. New York: Springer, 2006: 67-459.

[2]

ZHOU Z, ZHANG M,ZHANG S, et al. Multiinstance multilabel learning [J]. Artificial Intelligence, 2012, 176(1): 2291-2320.

[3]

ZHOU Z. Multiinstance learning: a survey [R/OL]. Nanjing: Nanjing University, National Laboratory for Novel Software Technology, 2004 [20150206]. http:///zhouzh/zhouzh.files/publication/techrep04.pdf.Nanjing, China, Mar. 2004.

[4]

ZHOU Z, ZHANG M, HUANG S, et al. Multiinstance multilabel learning [J]. Artificial Intelligence, 2012, 176(1): 2291-2320.

[5]

PRATT W K. Digital image processing [M]. DENG L, ZHANG Y, translated. Beijing: China Machine Press, 2005:345-398. (PRATT W K. 數字圖像處理[M].鄧魯華,張延恒,譯. 北京:機械工業出版社,2005:345-398.)

[6]

LI Z, ZHUO Y, ZHANG C, et al. Survey on multilabel learning [J]. Application Research of Computers, 2014, 31(6): 1601-1605. (李志欣,卓亞琦,張燦龍,等.多標記學習研究綜述[J].計算機應用研究,2014,31(6):1601-1605.)

[7]

ZHA Z, HUA X, MEI T, et al. Joint multilabel multiinstance learning for image classification [C]// CVPR 2008: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2008: 1-8.

[8]

HUANG S, ZHOU Z. Fast multiinstance multilabel learning [C]// AAAI 2014: Proceedings of the 28th AAAI Conference on Artificial Intelligence. Menlo Park: AAAI Press, 2014: 1868-1874.

[9]

ZHANG M, ZHOU Z. Multilabel neural networks with applications to functional genomics and text categorization [J]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(10): 1338-1351.

[10]

XU X, FRANK E. Logistic regression and boosting for labeled bags of instances [C]// PAKDD 2004: Proceedings of the 8th PacificAsia Conference on Knowledge Discovery and Data Mining, LNCS 3056. Berlin: Springer, 2004: 272-281.

[11]

BOUTELL M R, LUO J, SHEN X, et al. Learning multilabel scene classification [J]. Pattern Recognition, 2004, 37(9): 1757-1771.

[12]

ZHANG M, WANG Z. MIMLRBF: RBF neural networks for multiinstance multilabel learning [J]. Neurocomputing, 2009, 72(16/17/18):3951-3956.

[13]

HOFMANN T. Unsupervised learning by probabilistic latent semanticanalysis [J]. Machine Learning, 2001, 42(1/2): 177-196.

[14]

SCHMIDHUBER J. Deep learning in neural networks: an overview [J]. Neural Networks, 2015, 61: 85-117.

[15]

HAYKIN S. Neural networks [M]. YE S, SHI Z, translated. 2nd ed. Beijing: China Machine Press, 2004: 109-176. (HAYKIN S. 神經網絡原理[M].葉世偉,史忠植,譯.2版.北京:機械工業出版社,2004:109-176.)

[16]

SEBASTIANI F. Machine learning in automated text categorization [J]. ACM Computing Surveys, 2001, 34(1): 1-47.

篇7

1、首先打開趣頭條APP,切換到“任務”頁面。

2、然后向下滑動屏幕,即可看到“走路賺金幣”選項。用戶點擊該選項后,頁面就會顯示當天的行走步數。一般情況下,50步數等于1金幣,連續兌換7天就會有500金幣。

“趣頭條”是一款上海基分文化傳播有限公司開發的APP。團隊致力通過大數據算法和云計算等技術,為用戶提供內容及服務。趣頭條致力于打造一款新形式的資訊閱讀軟件,以平臺、媒體和共贏的方式。以移動應用為載體進行內容創造、資訊閱讀,提供更多有用、有趣、有益的內容給大家。

篇8

獅子關庫區植物群落喬木層優勢種及群落分類

獅子關庫區森林群落演替過程和結構動態

日本落葉松人工林單木模型的研究

論生態林業的理論與實踐途徑

鄂西南地區松褐天牛生物學特性及發生規律研究

應用M99-1引誘劑監測馬尾松病蟲害的研究

松材線蟲在受害馬尾松樹體內的分布及取樣部位研究

湖北恩施松材線蟲病的防治現狀及對策

胡蘿卜板栗糕的試制

丁草胺對水稻根系活力和C/N的影響

TGF-β_1對不同肺癌細胞生物學行為的影響

動物中天然抗癌產物研究

聚合物固體酸催化合成丙烯酸雙酯——固體酸的合成

三溴偶氮氯磷-溴代十六烷基吡啶-釤-乙醇顯色體系的分析研究

化學修飾電極及其測定痕量Pb2+、Cd2+、Hg2+的應用

光度法測定魚腥草中有效成分的質量分數

以β-環糊精衍生物為柱層析固定相拆分氨基酸對映體

化學工業的可持續發展之路——綠色化學

模糊度量空間中的不動點及應用

祝賀生物資源保護與利用湖北省重點實驗室順利通過驗收評估以評促建以評促改以評促發展

奇素數方冪中的孤立數

一類具混合功能反應函數的三種群捕食鏈模型分析

脈沖時滯Cohen-grossberg神經網絡的指數穩定性

一類成批服務排隊模型的時間依賴解的存在唯一性

基于模糊綜合評判的學生綜合素質評價體系

內積H-Z-空間及其性質

關于integralfromx=ato+∞(f(x)dx)的收斂性與limfrom(x+∞)(f(x))=0的關系

復平面上多項式的零點問題

平面復合材料熱傳導問題的一個新的多尺度漸近展開式

對牛頓迭代法條件的一個改進

基于MATLAB的血管三維重建

基于信息熵的TFIDF文本分類特征選擇算法研究

一種基于勢場的威脅模型及其應用

基于協同模式的一站式服務系統的設計與實現

基于ArcGISServer的企業級WEBGIS的設計與開發

整周模糊度的一種半參數解算方法

GPS高程測量精度分析

優質油菜栽培與養分管理智能決策系統的設計與實現

恩施州煙葉生產區域劃分及配套栽培技術措施研究

祝賀生物資源保護與利用湖北省重點實驗室順利通過驗收評估以評促建以評促改以評促發展

奇素數方冪中的孤立數

一類具混合功能反應函數的三種群捕食鏈模型分析

脈沖時滯Cohen-grossberg神經網絡的指數穩定性

一類成批服務排隊模型的時間依賴解的存在唯一性

基于模糊綜合評判的學生綜合素質評價體系

內積H-Z-空間及其性質

關于integralfromx=ato+∞(f(x)dx)的收斂性與limfrom(x+∞)(f(x))=0的關系

復平面上多項式的零點問題

平面復合材料熱傳導問題的一個新的多尺度漸近展開式

對牛頓迭代法條件的一個改進

基于MATLAB的血管三維重建

基于信息熵的TFIDF文本分類特征選擇算法研究

一種基于勢場的威脅模型及其應用

基于協同模式的一站式服務系統的設計與實現

基于ArcGISServer的企業級WEBGIS的設計與開發

整周模糊度的一種半參數解算方法

GPS高程測量精度分析

推薦期刊
九九热国产视频精品,免费国产不卡一级αⅴ片,欧美日韩蜜桃在线播放,精品国内自产拍99在线观看
亚洲中文字幕2020无线码 | 亚洲国产另类在线观看 | 制服丝袜国产激情在线 | 亚洲午夜成人Av电影 | 午夜au在线网站 | 色婷婷久综合久久一本国产AV |