詞條
詞條說明
漢語分詞(Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程。中文分詞是其他中文信息處理的基礎,搜索引擎只是中文分詞的一個應用。其他的比如機器翻譯(MT)、語音合成、自動分類、自動摘要、自動校對等等,都需要用到分詞。 漢語自動分詞是目前中文信息處理領域公認的一大難題,也是自然語言理解研究領域
近年來,隨著移動互聯網和自媒體的興起與發展,互聯網空間日益豐富、熱鬧,人人享有“麥克風”的時代逐漸成為現實,網絡空間一度成為眾聲喧嘩之地。然而,在拓展人們生活空間的同時,互聯網中的不實信息、不良行為等“負能量”和“噪音”也開始滋生傳播,不僅侵害個人隱私和財產安全,也威脅著從虛擬空間到現實空間的秩序。 信息網絡以激濁揚清為**要義。網絡化生活已成為人們的基本生活形態,對于廣大群眾來說,信息網絡絕不
進入21世紀,面對網絡時代信息的爆炸式增長,中文信息處理作為一項基礎性、普適特性的信息技術,面臨著挑戰和再次發展的機遇,在互聯網時代則顯示出其優勢。它的開發利用關系到我國今后信息產業乃至社會經濟的發展和安全,具有巨大的經濟**和社會**。 中文信息處理包括了有關中文信息的采集、存儲、傳輸和利用,是指利用電子計算機和現代通信、照明、排版、等自動化技術對漢字信息進行輸入輸出整理、加工、轉換、傳輸、復
全文索引用于處理大文本集合,利用它人們可以在海量文本中快速獲取需要的信息。全文檢索系統是按照全文檢索理論建立起來的用于提供全文檢索服務的軟件系統。一般來說,全文檢索需要具備建立索引和提供查詢的基本功能,此外現代的全文檢索系統還需要具有方便的用戶接口、面向WWW的開發接口、二次應用開發接口等等。功能上,全文檢索系統**具有建立索引、處理查詢返回結果集、增加索引、優化索引結構等等功能,外圍則由各種不
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: