自然養生

遷移學習NLP:BERT、ELMo等直觀圖解

2018 年是自然 語 言 處 理的 轉 折點,能捕捉潛在意 義 和關係的方式表達 單詞 和句子的概念性理解正在迅速 發 展。此外, NLP 社群已 經 出現了非常 強 大的 組 件,你可以在自己的模型和管道

15分钟入门NLP神器—Gensim

前  言 作为自然语言处理爱好者,大家都应该听说过或使用过大名鼎鼎的Gensim吧,这是一款具备多种功能的神器。 Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中

【NLP】BERT中文實戰踩坑

終於用上了bert,踩了一些坑,和大家分享一下。 我主要參考了奇點機智的文章,用bert做了兩個中文任務:文字分類和相似度計算。這兩個任務都是直接用封裝好的run_classifer,py,另外兩個沒有仔

JB的Python之旅-每句話背後的情緒值

每個人相處都有一套生活方式,跟女人也不一樣,不同的女人要用不同的邏輯思考,要琢磨不同語句背後的含義,生活,不容易; 對於情場小白而言,最擔心的就是女朋友不開心了,畢竟好不容易才從右手變成

詞嵌入的那些事兒(一)

1. 詞向量介紹 在討論詞嵌入之前,先要理解詞向量的表達形式,注意,這裡的詞向量不是指 Word2Vec 。關於詞向量的表達,現階段採用的主要有 One hot representation 和 Dist

自然語言處理之 LDA 主題模型

話題模型 話題模型是為發現文件集合中的 話題 而開發出來的一種統計方法。常見的話題模型有LSA、PLSA、LDA,其中LDA(Latent Dirichlet Allocation)是表現最

商品標題這麼長長長長長,阿里工程師如何解決?

阿里妹導讀:商品標題是賣家和買家在電商平臺溝通的重要媒介。在淘寶這樣的電商app中,使用者與推薦、搜尋等系統的互動時所接受到的資訊,主要由商品標題、圖片、價格、銷量以及店鋪名等資訊組成。這些資訊直接影

Recurrent AI:呼叫系統的「變廢為寶」

因此,自然語言處理領域的玩家們,除了要思考模型的效果、產品的架構,更要思考一個最為本質的問題:要處理什麼資料?為什麼要處理這類資料? Recurrent AI 選擇了「呼叫系統」。 「電話錄音可追溯而不

1716045975.5305