文字分類第6頁

隱馬爾可夫分詞

稀土掘金

2018-11-22 08:36:09

雖然目前 nlp 很多工已經發展到了使用深度學習的迴圈神經網路模型和注意力模型，但傳統的模型咱們也一樣要了解。這裡看下如何使用隱馬爾科夫模型(HMM)進行分詞。隱馬爾科夫模型隱馬爾科夫模型是一種有向

結巴分詞在Android手機上的應用：原理、接入和啟動優化

簡書

2018-11-20 19:57:22

中文分詞中文分詞功能是一項常用的基礎功能，有很多開源的工程實現，目前能應用於Android手機端的中文分詞器沒有很完善的版本。經過調研，我選擇了結巴分詞，該開源工

Accurate Online Speaker Diarization with Supervised Learning

谷歌開發者社群

2018-11-13 03:24:00

Speaker diarization , the process of partitioning an audio stream with multiple people into homogeneous

VIBR: 通過MDL準則視覺化大規模二分關係資料（Visualizing Bipartite Relations at Scale with th...

PKU Visualization Blog

2018-11-11 22:27:26

對於兩個集合，如果一個集合中點和另一個結合中的點有連線，而集合內的點之間沒有連線，那麼這樣的資料稱為二分關係資料。通常這樣的資料通過圖模型來描述，這類特殊的圖稱為二分圖（圖1）。生活中存在大量這樣的二分關係資料

資料科學和人工智慧技術筆記五、文字預處理

簡書

2018-11-10 22:11:32

五、文字預處理作者： Chris Albon 譯者：飛龍協議： CC BY-NC-SA 4.0 詞袋 image # 載入庫 i

兄弟連區塊鏈教程Fabric1.0原始碼分析ECDSA橢圓曲線數字簽名演算法

Go語言中文網

2018-11-09 15:16:34

##兄弟連區塊鏈教程Fabric1.0原始碼分析ECDSA橢圓曲線數字簽名演算法，2018年下半年，區塊鏈行業正逐漸褪去發展之初的浮躁、迴歸理性，表面上看相關人才需求與身價似乎正在回落。但事實上，正是初期泡沫的

聚類分析演算法

mathor

2018-11-07 20:05:00

什麼是聚類聚類分析是將資料物件的集合分成相似物件類的過程。使得同一簇（或類）中的物件之間具有較高的相似性，而不同簇中的物件具有較高的相異性。簇是資料物件（如資料點）的集合，這些物

AI賦能一鍵自動檢測：頁面異常、控制元件異常、文字異常

機器之心

2018-11-02 12:41:00

概要：FireEye是通過AI提高測試效率，並降低AI自動化測試使用門檻的工具集，一經部署，就可以不用再修改指令碼實現模型的使用和更新。本篇文章將具體介紹AI自動化測試過程中用到工程結構、模型選型和重

Torchtext指南（側重於NMT）

部落格園-原創精華區

2018-10-31 13:22:00

Torchtext指南（側重於NMT） torchtext是一個對於NLP來說非常棒的預處理資料的工具。本文記錄一下自己學習的過程，側重於NMT。一個基本的操作流程：建立Fie

Elasticsearch 搜尋片語，如何更準？

2018-10-30 07:08:19

更好的閱讀體驗，開啟【閱讀原文】，在PC上瀏覽 Lucene用了很久，其版本更新也很快。在ES出來之後，直接使用Lucene的時候就比較少了，更多的就在ES框架下一站式完成，ES目前在專案中幾乎佔據了半壁江

es簡單打造站內搜尋

部落格園精華區

2018-10-27 22:41:00

最近挺忙的，在外出差，又同時幹兩個專案。白天一個晚上一個，特別是白天做的專案，馬上就要上線了，在客戶這裡三天兩頭開會，問題很多真的很想好好靜下來懟程式碼，半夜做夢都能fix bugs~ 和客戶交流真的是門技術

開放搜尋(Opensearch)之下拉提示

雲棲團隊部落格

2018-10-25 21:53:06

下拉提示是搜尋引擎的標配功能，它能起到減少使用者輸入的作用，自動補全搜尋關鍵字，提升使用者使用搜索引擎的體驗，好的下拉提示還可以引導使用者輸入質量高的 query ，這些高質量 query 最終能輸出使用者

看完這篇文章，再也不用擔心訓練模型時出現缺失值了

雲棲團隊部落格

2018-10-25 09:29:25

聖人曾說過：資料和特徵決定了機器學習的上限，而模型和演算法只是逼近這個上限而已。再好的模型，如果沒有好的資料和特徵質量，那訓練出來的效果也不會有所提高。資料質量對於資料分析而言是至關重要的，有時候它的意義

甲骨文宣佈收購企業資料庫創企DataFox，用AI強化商業資料分析

獵雲網

2018-10-23 15:28:38

【獵雲網（微信號：）】10月23日報道（編譯：葉展盛）今日，甲骨文公司宣佈收購企業資料庫創企DataFox。截至今日，這家創企已經蒐集了280萬家上市公司和私營公司，這個資料每年都會增加1

使用jieba和wordcloud進行中文分詞並生成《悲傷逆流成河》詞雲

部落格園精華區

2018-10-22 18:51:00

因為詞雲有利於體現文字資訊，所以我就將那天無聊時爬取的《悲傷逆流成河》的評論處理了一下，生成了詞雲。關於爬取影評的爬蟲大概長這個樣子(實際上是沒有爬完的): #!/usr/bin/env python