住宅區分類

NLP系列之文字分類

本篇部落格主要是記錄自然語言處理中的文字分類任務中常見的基礎模型的使用及分析。Github上 brightmart 大佬已經整理出很完整的一套文字分類任務的基礎模型及對應的模型程式碼實現。網上也有部分部落格將

機器學習與分類演算法

為了實現分類演算法,我們使用最經典的iris資料集。首先匯入對應的資料集,這裡假設已經進行了相關的資料預處理(清洗、去重、補全)以及正則化後。 之後將資料集拆分出訓練集和測試集,用於交叉驗證。

[譯] 通過整合學習提高機器學習結果

整合學習可以通過組合多種模型來提高機器學習的結果。這種方法相對於單個模型,可以為結果帶來更好的效能預測。這也是整合方法在諸多久負盛名的機器學習競賽(如 NetFlix 競賽、KDD 2009

貝葉斯理論

還是拿質檢員的例子來做分析,假如我是一個質檢員,現在接到了三箱零件需要檢驗,其中第一箱有10個零件,第二箱有20個零件,第三箱有15個。半小時過去了,檢驗的結果出爐,第一箱有1個不合格,第二箱有3個不合格,第三

fasttext使用心得(踩坑之路)

fasttext是文字分類的一大利器,優點:快,嗷嗷快;缺點:暫未發現。但是我在使用其做文字分類時候還是遇到了挺多坑,今天先總結一個: 網上有人說設定訓練引數的時候,ngrams設定大於2可以提高模型的精確

詳解文字分類之DeepCNN的理論與實踐

導讀 最近在梳理文字分類的各個神經網路演算法,特地一個來總結下。下面目錄中多通道卷積已經講過了,下面是連結,沒看的可以瞅瞅。我會一個一個的講解各個演算法的理論與實踐。目錄暫定為: 多通道卷積神經網路(

谷歌裝置內建文字分類 AI準確率更精準

【手機中國新聞】近日據外媒報道,在比利時布魯塞爾的自然語言處理實驗方法會議上,谷歌研究者向其展示的論文中描述了他們的離線裝置,在內建人工智慧系統“自我管控神經網路”(SGNNS)在對話相關的任務中取得了不錯的

1714034954.9798