基于雙語LDA的跨語言文本相似度計(jì)算方法
大小:0.57 MB 人氣: 2017-11-21 需要積分:0
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
標(biāo)簽:LDA(10554)相似度(2673)
基于雙語主題模型思想分析雙語文本相似性,提出基于雙語LDA跨語言文本相似度計(jì)算方法。先利用雙語平行語料集訓(xùn)練雙語LDA模型,再利用該模型預(yù)測(cè)新語料集主題分布,將新語料集的雙語文檔映射到同一個(gè)主題向量空間,結(jié)合主題分布使用余弦相似度方法計(jì)算新語料集雙語文檔的相似度,使用從類別間和類別內(nèi)的主題分布離散度的角度改進(jìn)的主題頻率逆文檔頻率方法計(jì)算特征主題權(quán)重。實(shí)驗(yàn)表明,改進(jìn)后的權(quán)重計(jì)算對(duì)于基于雙語LDA相似度算法的召回率有較大提高,算法對(duì)類別不受限且有較好的可靠性。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于雙語LDA的跨語言文本相似度計(jì)算方法下載
相關(guān)電子資料下載
- QCC5181QCC3086QCC3084QCC3083 USB Audio 96K/24bit LDAC 738
- QCC5181藍(lán)牙音頻發(fā)射LDAC APTX 549
- 華為5G移動(dòng)核心網(wǎng)在GlobalData連續(xù)六年摘得桂冠 305
- 華為5G移動(dòng)核心網(wǎng)在GlobalData連續(xù)六年排名第一 363
- QCC5181QCC3083QCC3084支持LDAC APTX LOSSLESS 3429
- 帶分區(qū)的大規(guī)模LDAP介紹 312
- 圖像相似度分析——相似度算法 1212
- SLDA副會(huì)長(zhǎng)單位旭宇光電獲“國(guó)家知識(shí)產(chǎn)權(quán)示范企業(yè)” 786
- java 8的日期用法 285
- Java時(shí)間類轉(zhuǎn)換方案 326