中文(多語種) 信息檢索與文本分類系統(tǒng)
項(xiàng)目持有者:曾慶輝 聯(lián)系方式:E-mail:zqhmail@yahoo.com 項(xiàng)目介紹: 信息檢索和文本分類在通信和信息處理領(lǐng)域具有極廣泛的應(yīng)用。Xtramind技術(shù)有限公司綜合機(jī)器學(xué)習(xí)和自然語言處理技術(shù),提供基於主題和內(nèi)容的文本智能處理。 大型模塊集XM-MindSet集成了多項(xiàng)核心智能技術(shù),包括超級文本分類(XM-XtraClass), 文本聚類(XM-Clustering) ,搜索引擎(XM-Finder), 索引導(dǎo)航(XM-IndexNavigator), 冗余識別(XM-DuplicateRecognition), 語種識別 (XM-LanguageIdentificaton),信息抽取(XM-InfoXtract),自動文本摘要(XM-Summary),文本格式轉(zhuǎn)換 (XM-FormatConversion), 文本自動生成(XM-XtraGen)等功能模塊。模塊之間能各自獨(dú)立,也能根據(jù)用戶需要靈活地組合拼裝。各模塊在模塊精度(查準(zhǔn)查全) ,時(shí)間效率,廣義化,魯棒性,動態(tài)移植性等方面都表現(xiàn)卓越。 Xtramind技術(shù)有限公司在致力XM-MindSet的研究與開發(fā)同時(shí),也在產(chǎn)品實(shí)際運(yùn)營上積累了豐富經(jīng)驗(yàn)。 如本分類方面,在為DIZ慕尼黑信息中心提供的分類解決方案中,XM-MindSet能成功高效地對文本進(jìn)行多級和海量類別(單級最高達(dá)到14000類)的分類,Xtramind在眾多的的項(xiàng)目競投者中遙遙領(lǐng)先。如在信息檢索方面,美國“911”事件之后,各國要求加強(qiáng)信息監(jiān)控的力度。為此,Xtramind聯(lián)合Thales公司開發(fā)了Web監(jiān)控系統(tǒng),Xtramind負(fù)責(zé)提供其智能處理核心模塊。此監(jiān)控系統(tǒng)能有效識別如阿拉伯人名、相關(guān)電話號碼等敏感信息。目前,德國政府已將該軟件用于信息安全部門,用來監(jiān)控和尋找大量電子及網(wǎng)絡(luò)信息中危害國家利益的信息源。德國情報(bào)部門將其用于“反恐”,特別是對非本國語言的“反恐”信息監(jiān)控。 中國的信息化日益發(fā)達(dá),各種文本數(shù)據(jù),電子信息日益增多。如中國的手機(jī)持有者每年發(fā)出2200億條短信,占全世界發(fā)出短信總數(shù)的一半。如何更好地對信息進(jìn)行更好地處理分析,將在很多程度上影響到中國現(xiàn)代化的進(jìn)程和社會的安全穩(wěn)定。建議:XM-MindSet可用于各類信息中心作電子信息的分類和檢索,用于公司、政府單位對競爭或敵對勢力的信息自動監(jiān)控,如國家信息安全部門,電信信息中心。 關(guān)于XM-MailMinder的詳細(xì)介紹和成功案例請瀏覽Xtramind公司的網(wǎng)頁:www.xtramind.com
|