文字分類

如何用高斯混合模型 GMM 做聚類

當我們在做聚類任務時, 如果每一類的分佈已知的話,那麼要求出每個樣本屬於哪一類, 只需要計算出它歸屬於 k 個不同簇的概率,然後選擇概率值最高的那個簇作為它最終的歸屬即可。 但很

聚類分析K均值演算法講解

聚類分析及K均值演算法講解 吳裕雄 當今資訊大爆炸時代,公司企業、教育科學、醫療衛生、社會民生等領域每天都在產生大量的結構多樣的資料。產生資料的方式更是多種多樣,如各類的:攝像

ELK 使用小技巧(第 3 期)

ELK Tips 主要介紹一些 ELK 使用過程中的小技巧,內容主要來源為 Elastic 中文社群。 一、Logstash 1、Filebeat 設定多個 output 在 6.0 之前,File

基於k-均值聚類的影象分割

1.知識儲備 1.0 window系統截圖(當前視窗) Alt + PrintScreen 1.1 Matlab中 K-means聚類函式 [Idx,Ctrs,SumD,D]

Elasticsearch實踐(二):搜尋

本文以 Elasticsearch 6.2.4為例。 經過前面的基礎入門,我們對ES的基本操作也會了。現在來學習ES最強大的部分:全文檢索。 準備工作 批量匯入資料 先需要準備點資料,然後匯入:

【NLP】分詞演算法綜述

之前總是在看前沿文章,真正落實到工業級任務還是需要實打實的硬核基礎,我司選用了HANLP作為分片語件,在使用的過程中才感受到自己基礎的薄弱,決定最近好好把分詞的底層演算法梳理一下。 1. 簡介 NLP的

7個優秀的開源中文分詞庫推薦,實用性強!

縱觀整個開源領域,陸陸續續做中文分詞的也有不少,不過目前仍在維護的且質量較高的並不多。下面整理了一些個人認為比較優秀的中文分詞庫,以供大家參考使用。 1、jieba —— Python

1716166016.502