中影文化城

58同城全鏈條升級:市場下沉,智慧連線資訊化

服務這個賽道很寬,美團解決了吃喝玩樂,58同城、安居客、趕集網則聚焦在找工作、找房子、買車、家政等同城資訊服務上。相較之下,找房和買車雖然比吃喝玩樂更低頻,但卻是中國人的絕對剛需。 也正因房子和車子在中國

Elasticsearch 搜尋片語,如何更準?

更好的閱讀體驗,開啟【閱讀原文】,在PC上瀏覽 Lucene用了很久,其版本更新也很快。在ES出來之後,直接使用Lucene的時候就比較少了,更多的就在ES框架下一站式完成,ES目前在專案中幾乎佔據了半壁江

es簡單打造站內搜尋

最近挺忙的,在外出差,又同時幹兩個專案。白天一個晚上一個,特別是白天做的專案,馬上就要上線了,在客戶這裡 三天兩頭開會,問題很多真的很想好好靜下來懟程式碼,半夜做夢都能fix bugs~ 和客戶交流真的是門技術

開放搜尋(Opensearch)之下拉提示

下拉提示是搜尋引擎的標配功能,它能起到減少使用者輸入的作用,自動補全搜尋關鍵字,提升使用者使用搜索引擎的體驗,好的下拉提示還可以引導使用者輸入質量高的 query ,這些高質量  query 最終能輸出使用者

sharding jdbc之解析引擎

1. 解析引擎 解析過程分為 詞法解析 和 語法解析 。 解析引擎在  parsing 包下,包含兩大元件: Lexer:詞法解析器。 Parser:SQL解析器。

elasticsearch實戰---中文拼音A-Z排序(完美解決)

公司目前業務系統偏向後臺系統,目前包含500W+資料,在許多列表中支援各種條件查詢,含有大量的模糊搜尋條件。由於在mysql中模糊查詢效率低下,目前公司已使用es搜尋引擎進行條件搜尋。es版本如下: ela

文章相似度計算

演算法思路 首先看個簡單的例子: 句子A: 我喜歡看電視,不喜歡看電影 句子B: 我不喜歡看電影,也不喜歡看電視 基本思路 如果兩句話的用詞越相似,它們的內容越相似。因此,可以從詞頻入手,計

Go 高效能分詞 Gse v0.20.0 釋出, 優化效能

Go 語言高效分詞, 支援英文、中文、日文等 詞典用雙陣列trie(Double-Array Trie)實現, 分詞器演算法為基於詞頻的最短路徑加動態規劃。 支援普通和搜尋引擎兩種分詞模式,支援使用者詞

資料處理-招聘資訊-中文分詞與詞頻統計

智慧決策上手系列教程索引 通過前面的幾篇文章,相信大家都嘗試抓取了一些網站上招聘資訊的資料,並存儲到自己的檔案裡面了,可能是一堆 .json 或 .csv 檔案。 如果你還沒有抓到資料,請看這

Lucene 全文檢索

Lucene 全文檢索 Field域 Field是文件中的域,包括Field名和Field值兩部分,一個文件可以包括多個Field,Document只是Field的一個承載體,Field值即為要

1714190227.8226