文字分類第2頁

達觀資料：如何用深度學習做好長文字分類與法律文書智慧化處理

挖掘資料背後的價值

2018-10-09 20:10:20

在NLP領域中，文字分類輿情分析等任務相較於文字抽取，和摘要等任務更容易獲得大量標註資料。因此在文字分類領域中深度學習相較於傳統方法更容易獲得比較好的效果。正是有了文字分類模型的快速演進，海量

用 Intel Analytics Zoo/BigDL 為客服平臺新增 AI 的實踐（一）

機器之心

2018-09-28 17:25:47

本系列部落格主要分享了微軟 Azure 的團隊使用IntelAnalytics Zoo（ https://github.com/intel-analytics/analytics-zoo ）在 Azure 的

HanLP 1.7.0 釋出，新增文字聚類、流水線分詞

開源中國

2018-11-13 07:27:49

HanLP 1.7.0 釋出了，HanLP 是由一系列模型與演算法組成的 Java 工具包，目標是普及自然語言處理在生產環境中的應用。HanLP 具備功能完善、效能高效、架構清晰、語料時新、可自定義的特點。在

使用NLTK做文字分析

部落格園精華區

2019-03-22 18:38:00

NLTK（Natural Language Toolkit）是一個功能強大的Python包，它提供了一組自然語言演算法，例如切分詞（Tokenize），詞性標註(Part-Of-Speech Tagging)，

小 demo：對德文資料進行文字分析

2019-02-19 10:51:15

昨天做了一個德文資料的詞頻統計，發來的資料是word檔案，如下 für mich ging es bei einem foto mit präsident erdogan nicht u

機器學習中的Optimal Transport及相關問題：（三）文字聚類

Learning Machine Rebuilt

2018-11-20 19:00:23

這篇文章我打算回顧一下我2017年在ACL發表的關於文字聚類的文章，並分享一下重現部分實驗結果的程式碼和使用方法。這是我博士工作的一個自然延續。我在2015年前後一直在研究Wassers

【萬字乾貨】以虎嗅網4W+文章的文字挖掘為例，展現資料分析的一整套流程

挖掘資料背後的價值

2018-12-04 19:17:38

本文作者將結合自身經驗，並以實際案例的形式進行呈現，涉及從資料採集、資料清洗、資料分析再到資料視覺化的一整套流程分析，力求條理清晰的展現外部資料分析的強大威力。enjoy~ 在八月份，筆者曾

《Generating topic-oriented summaries》閱讀筆記

西土城的搬磚日常

2019-03-26 09:39:20

來源：NAACL 2018 原文： Generating topic-oriented summaries using neural attention Introduction

機器學習與分類演算法

The kite in the wind

2019-03-19 23:19:18

為了實現分類演算法,我們使用最經典的iris資料集。首先匯入對應的資料集,這裡假設已經進行了相關的資料預處理(清洗、去重、補全)以及正則化後。之後將資料集拆分出訓練集和測試集,用於交叉驗證。

微軟最新論文解讀 | 基於預訓練自然語言生成的文字摘要方法

PaperWeekly

2019-03-19 20:20:15

作者丨張浩宇學校丨國防科技大學計算機學院研究方向丨自然語言生成、知識圖譜問答本文解讀的是一篇由國防科技大學與微軟亞洲研究院共同完成的工作，文中提出一種基於預

【程式設計師專用文字編輯器】MacVim for Mac免費版8.1.873

簡書

2019-02-13 12:58:11

MacVim for Mac版是一個將Vim程式設計師編輯器帶入Mac的專案。另一方面，Vim基於強大的Vi應用程式，這是一個為Unix作業系統開發的文字編輯器。除了其他功能之外，MacVim應用程式還支援

Python-根據成績分析是否繼續深造

部落格園精華區

2019-02-11 12:44:00

案例:該資料集的是一個關於每個學生成績的資料集,接下來我們對該資料集進行分析，判斷學生是否適合繼續深造資料集特徵展示 1GRE 成績 (290 to 340) 2TOEFL 成績(

ProseMirror - 用於在Web上構建富文字編輯器的工具包

解道

2019-01-26 10:52:00

這是一款可以生成結構化，語義上有意義的文件的內容編輯器，但這樣做的方式很容易讓使用者理解。ProseMirror試圖彌合Markdown 文字編輯和經典WYSIWYG 編輯器之間的差距。

富文字編輯器Quill(二)上傳圖片與視訊

部落格園精華區

2019-01-22 23:19:00

image與video在Quill formats中屬於Embeds，要在富文字中插入圖片或者視訊需要使用insertEmbed api。 insertEmbed insertEmbed(

機器學習筆記（持續更新）

部落格園精華區

2018-12-18 10:13:00

分類迴歸的區別 https://www.zhihu.com/question/21329754/answer/18004852 什麼是數值型和標稱型標稱型: