弘文高中第2頁

Elasticsearch實踐（四）：IK分詞

部落格園精華區

2018-11-30 22:14:00

環境：Elasticsearch 6.2.4 + Kibana 6.2.4 + ik 6.2.4 Elasticsearch預設也能對中文進行分詞。我們先來看看自帶的中文分詞效果： curl -X

全文搜尋引擎 Elasticsearch

部落格園-原創精華區

2018-11-27 19:16:00

寫在前面最近在學Elasticsearch ，我相信只要是接觸過開發的都會聽過Elasticsearch或ELK這麼一個技術。主要用來做全文檢索或大資料分析等，之前一直處理了解狀

Elasticsearch拼音分詞和IK分詞的安裝及使用

部落格園精華區

2018-11-25 11:39:00

一、Es外掛配置及下載 1.IK分詞器的下載安裝關於IK分詞器的介紹不再多少，一言以蔽之，IK分詞是目前使用非常廣泛分詞效果比較好的中文分詞器。做ES開發的，中文分詞十有八九使用的都是IK分詞器。

Elasticsearch實踐（二）：搜尋

部落格園精華區

2018-11-25 11:07:00

本文以 Elasticsearch 6.2.4為例。經過前面的基礎入門，我們對ES的基本操作也會了。現在來學習ES最強大的部分：全文檢索。準備工作批量匯入資料先需要準備點資料，然後匯入：

【NLP】分詞演算法綜述

稀土掘金

2018-11-24 22:12:23

之前總是在看前沿文章，真正落實到工業級任務還是需要實打實的硬核基礎，我司選用了HANLP作為分片語件，在使用的過程中才感受到自己基礎的薄弱，決定最近好好把分詞的底層演算法梳理一下。 1. 簡介 NLP的

7個優秀的開源中文分詞庫推薦，實用性強！

簡書

2018-11-23 15:44:17

縱觀整個開源領域，陸陸續續做中文分詞的也有不少，不過目前仍在維護的且質量較高的並不多。下面整理了一些個人認為比較優秀的中文分詞庫，以供大家參考使用。 1、jieba —— Python

隱馬爾可夫分詞

稀土掘金

2018-11-22 08:36:09

雖然目前 nlp 很多工已經發展到了使用深度學習的迴圈神經網路模型和注意力模型，但傳統的模型咱們也一樣要了解。這裡看下如何使用隱馬爾科夫模型(HMM)進行分詞。隱馬爾科夫模型隱馬爾科夫模型是一種有向

結巴分詞在Android手機上的應用：原理、接入和啟動優化

簡書

2018-11-20 19:57:22

中文分詞中文分詞功能是一項常用的基礎功能，有很多開源的工程實現，目前能應用於Android手機端的中文分詞器沒有很完善的版本。經過調研，我選擇了結巴分詞，該開源工

HanLP 1.7.0 釋出，新增文字聚類、流水線分詞

開源中國

2018-11-13 07:27:49

HanLP 1.7.0 釋出了，HanLP 是由一系列模型與演算法組成的 Java 工具包，目標是普及自然語言處理在生產環境中的應用。HanLP 具備功能完善、效能高效、架構清晰、語料時新、可自定義的特點。在

資料科學和人工智慧技術筆記五、文字預處理

簡書

2018-11-10 22:11:32

五、文字預處理作者： Chris Albon 譯者：飛龍協議： CC BY-NC-SA 4.0 詞袋 image # 載入庫 i

AI賦能一鍵自動檢測：頁面異常、控制元件異常、文字異常

機器之心

2018-11-02 12:41:00

概要：FireEye是通過AI提高測試效率，並降低AI自動化測試使用門檻的工具集，一經部署，就可以不用再修改指令碼實現模型的使用和更新。本篇文章將具體介紹AI自動化測試過程中用到工程結構、模型選型和重

Torchtext指南（側重於NMT）

部落格園-原創精華區

2018-10-31 13:22:00

Torchtext指南（側重於NMT） torchtext是一個對於NLP來說非常棒的預處理資料的工具。本文記錄一下自己學習的過程，側重於NMT。一個基本的操作流程：建立Fie

一個簡單高效能的 Go router，和httprouter 差不多快，且支援正則

Go語言中文網

2018-10-30 15:38:05

分享我的第一個 GO 開源專案（ xujiajun/gorouter ），一個簡單高效能的 router，和著名的 julienschmidt/httprouter 差不多快，且支援正則。很方便寫 RESTfu

Elasticsearch 搜尋片語，如何更準？

2018-10-30 07:08:19

更好的閱讀體驗，開啟【閱讀原文】，在PC上瀏覽 Lucene用了很久，其版本更新也很快。在ES出來之後，直接使用Lucene的時候就比較少了，更多的就在ES框架下一站式完成，ES目前在專案中幾乎佔據了半壁江

es簡單打造站內搜尋

部落格園精華區

2018-10-27 22:41:00

最近挺忙的，在外出差，又同時幹兩個專案。白天一個晚上一個，特別是白天做的專案，馬上就要上線了，在客戶這裡三天兩頭開會，問題很多真的很想好好靜下來懟程式碼，半夜做夢都能fix bugs~ 和客戶交流真的是門技術