中文分詞第3頁

Lucene 全文檢索

簡書

2018-10-08 11:08:10

Lucene 全文檢索 Field域 Field是文件中的域，包括Field名和Field值兩部分，一個文件可以包括多個Field，Document只是Field的一個承載體，Field值即為要

NLPCC2013中文微博細粒度情感識別（二）

部落格園精華區

2018-10-02 16:06:00

偷懶若干天后迴歸。。在上一篇中我們得到了NLPCC2013的中文微博資料，將其按照8：1：1的比例分成了訓練集，驗證集和測試集。下一步就是對資料進行預處理以及embedding。這是第一次嘗試一邊寫部落格一邊把

深度有趣 | 25 影象標題生成

稀土掘金

2018-09-21 20:06:03

輸入是一張圖片，輸出是一句對圖片進行描述的文字，這就是影象標題生成基本思路是先通過預訓練的影象分類模型，從某一個卷積層得到原始圖片的表示，或者稱為上下文contexts 例如從VGG19的 conv

centos coreseek4.1安裝和配置

莫飛

2018-09-20 12:43:04

概念 1. sphinx是國外的一款搜尋軟體,一款基於SQL的高效能全文檢索引擎 2. coreseek是在sphinx的基礎上，增加了中文分詞功能,增加對中文的支援。4.1版本是2011年釋出的，它是基於

深度有趣 | 15 淺談中文分詞

2018-09-20 10:02:04

簡單瞭解下中文分詞的概念，並用標準資料集、Keras和TensorFlow，分別基於LSTM和CNN實現中文分詞器原理中文分詞是指，將句子根據語義切分成詞我來到北京清華大學 -> 我

深度有趣 | 03 高階又一般的詞雲

稀土掘金

2018-09-19 21:58:01

詞雲是一種資料呈現方式不會的時候，感覺很厲害、很高大上會用了之後，感覺到哪都看到別人在用掌握用 Python 實現詞雲的方法準備安裝包 pip instal

Elasticsearch權威指南學習筆記

稀土掘金

2018-09-14 14:00:29

為什麼es查詢和聚合都這麼快？底層是如何實現的？資料在es叢集中如何儲存的？如何做到自動分散式的？為什麼es的主分片數設定了之後就不能調整，而副本分片數可以調整？如何優化索引方式

Elastic Stack-Elasticsearch使用介紹(二)

部落格園精華區

2018-09-12 08:14:00

一、前言寫部落格，更要努力寫部落格！二、Mapping介紹 Mapping類似於資料庫中的表結構的定義:這裡我們試想一下表結構定義需要那些: 1.欄位和欄位型別，在Elastics

分詞，難在哪裡？

2018-09-10 12:47:03

題圖：by Lucas Davies 一、前言分詞，我想是大多數大前端開發人員，都不會接觸到的一個概念。這個不影響我們瞭解它，畢竟我們要多方向發展。今天就來簡單介紹一些分詞，

NLP系列之文字分類

小簡鋪子

2019-05-13 22:07:34

本篇部落格主要是記錄自然語言處理中的文字分類任務中常見的基礎模型的使用及分析。Github上 brightmart 大佬已經整理出很完整的一套文字分類任務的基礎模型及對應的模型程式碼實現。網上也有部分部落格將

Koa原始碼分析

稀土掘金

2019-04-02 13:56:24

const http = require('http'); const server = http.createServer((req, res) => { res.statusCo

使用NLTK做文字分析

部落格園精華區

2019-03-22 18:38:00

NLTK（Natural Language Toolkit）是一個功能強大的Python包，它提供了一組自然語言演算法，例如切分詞（Tokenize），詞性標註(Part-Of-Speech Tagging)，

搞定NLP領域的“變形金剛”！手把手教你用BERT進行多標籤文字分類

機器之心

2019-02-19 18:28:32

過去的一年，深度神經網路的應用開啟了自然語言處理的新時代。預訓練模型在研究領域的應用已經令許多NLP專案的最新成果產生了巨大的飛躍，例如文字分類，自然語言推理和問答。 ELMo，ULMFiT 和OpenAI

小 demo：對德文資料進行文字分析

2019-02-19 10:51:15

昨天做了一個德文資料的詞頻統計，發來的資料是word檔案，如下 für mich ging es bei einem foto mit präsident erdogan nicht u

論文復現 | DPCNN文字分類模型實現及AG news資料集實驗復現

簡書

2019-01-29 12:26:37

一寫在前面未經允許，不得轉載, 謝謝~~~ 之前寫了一篇關於DPCNN文章解讀的筆記，所以再整理了相關的資料集處理情況和實驗情況一併分享出來，有需要的同學可以參考一下。模型本身結構比較簡單