力量分析

大資料和大資料分析技術的十大發展趨勢

調研機構Gartner公司最近的調查表明,增強分析、持續智慧和可解釋的人工智慧(AI)是資料和分析技術的主要趨勢之一。根據調查,深入瞭解以下十大技術趨勢是推動這一發展的關鍵,並根據業務價值優先考慮這些趨勢以保

K 均值聚類

通過迭代方式尋找 K 個簇的一種劃分方案,使得聚類結果對應的代價函式最小。 1、缺點 需要人工預先確定初始 K 值,且該值和真實的資料未必吻合。 K 均值只能收斂到

Web 前端效能分析(二)

簡要說明 在上一篇文章《Web 前端效能分析(一)》 中,我們對前端效能相關的知識進行了學習和探討,並且做了一個試驗性質的專案用來實踐和驗證,本文附上主要功能模組 -web-perform

降維——PCA、LDA

一、 PCA PCA 屬於一種線性、非監督、全域性的降維演算法,旨在找到資料的主成分,並利用這些主成分表徵原始資料,從而達到降維的目的。 二、LDA 線性判別分析是一種有監督學習演

大資料開發和大資料分析有什麼不同?

大資料分析工程師和大資料開發工程師分別能做什麼? 有沒有具體的專案案例之類 通俗解釋開發和分析 非要把他倆分開的話, 一個是偏向於資料,一個偏向於工程。 好比要炒個菜,工程

聚類(Clustering)

1.無監督學習:簡介 聚類演算法:第一個無監督學習演算法(無標籤的資料) 什麼是無監督學習呢? 對比:監督學習問題指的是,我們有一系列標籤,然後用假設函式去擬合它,作為對比,在無監督學習中,我們的資

Docker 容器日誌分析

先使用docker run -it --rm -d -p 80:80 nginx:1.15.8-alpine 命令啟動一個nginx容器。如果沒有異常,會得到容器ID如d2408a7931c9

2019資料分析與商業智慧趨勢前瞻

2019年,商業智慧(BI)解決方案的核心競爭力,仍將取決於其是否具備使手動工作量降到最低的高階分析功能。《商業應用研究中心(BARC)2018商業智慧調查》顯示,全球BI服務市場預計將發生重大

這是一篇讓人臉紅的python資料分析

正好我最近在找專案練手,於是我決定研究亞馬遜上Top100的細分品類—— 女式情趣內衣 的銷售情況。 image 我的分析分為核心的三步: 第一步,爬取

使用NLTK做文字分析

NLTK(Natural Language Toolkit)是一個功能強大的Python包,它提供了一組自然語言演算法,例如切分詞(Tokenize),詞性標註(Part-Of-Speech Tagging),

1714928059.0588