弘文高中

Elasticsearch實踐(二):搜尋

本文以 Elasticsearch 6.2.4為例。 經過前面的基礎入門,我們對ES的基本操作也會了。現在來學習ES最強大的部分:全文檢索。 準備工作 批量匯入資料 先需要準備點資料,然後匯入:

【NLP】分詞演算法綜述

之前總是在看前沿文章,真正落實到工業級任務還是需要實打實的硬核基礎,我司選用了HANLP作為分片語件,在使用的過程中才感受到自己基礎的薄弱,決定最近好好把分詞的底層演算法梳理一下。 1. 簡介 NLP的

7個優秀的開源中文分詞庫推薦,實用性強!

縱觀整個開源領域,陸陸續續做中文分詞的也有不少,不過目前仍在維護的且質量較高的並不多。下面整理了一些個人認為比較優秀的中文分詞庫,以供大家參考使用。 1、jieba —— Python

隱馬爾可夫分詞

雖然目前 nlp 很多工已經發展到了使用深度學習的迴圈神經網路模型和注意力模型,但傳統的模型咱們也一樣要了解。這裡看下如何使用隱馬爾科夫模型(HMM)進行分詞。 隱馬爾科夫模型 隱馬爾科夫模型是一種有向

Elasticsearch 搜尋片語,如何更準?

更好的閱讀體驗,開啟【閱讀原文】,在PC上瀏覽 Lucene用了很久,其版本更新也很快。在ES出來之後,直接使用Lucene的時候就比較少了,更多的就在ES框架下一站式完成,ES目前在專案中幾乎佔據了半壁江

es簡單打造站內搜尋

最近挺忙的,在外出差,又同時幹兩個專案。白天一個晚上一個,特別是白天做的專案,馬上就要上線了,在客戶這裡 三天兩頭開會,問題很多真的很想好好靜下來懟程式碼,半夜做夢都能fix bugs~ 和客戶交流真的是門技術

1715099117.3737