ClickHouse Roadmap 2018~2019(整理)
生產中的LowCardinality 資料型別。
在各列級別上選擇壓縮演算法。
匯入JSONEachRow時支援可計算的DEFAULT表示式。
鑲木地板格式支援匯入和匯出。
2019年1月
使用表函式將資料匯入/匯出到HDFS 。
使用表函式在S3中 匯入/匯出資料。
能夠將新列新增
到MergeTree表的排序鍵。
減少ZooKeeper中的元資料量。
2019年2月
通過DDL查詢建立字典的能力。
MergeTree表中索引的自適應粒度。
訪問許可權管理
表,列和行級別的訪問限制
(行級安全性)。
訪問控制角色模型(RBAC)。
能夠連線外部
身份驗證系統(LDAP/">LDAP,Kerberos)。
資源共享請求
開發支援JOIN
多個JOIN而不使用巢狀子查詢。
合併JOIN以連線非常大的集合。
Bucket-Shuffle JOIN用於優化大型分散式JOIN。
(2019年春/夏)
二級索引
確切地說,是用於跳過資料的索引結構。
最小/最大,不同值,微布隆過濾器。
機器學習方法
作為聚合函式
能夠
直接在ClickHouse中建立和應用模型。
關鍵列的ORDER BY和GROUP BY優化。
SELECT * FROM sensors ORDER BY time DESC LIMIT 10
擴大使用地理資料的機會
使用geohash的函式。
用於搜尋的多邊形詞典(按位置的區域請求)。
高階字串演算法
半共享模糊搜尋的最小雜湊演算法。
快速匹配大量子串。
能夠建立其他結構以加速對字串中的子串的強力搜尋。
將資料儲存在多個部分中
在SSD和HDD上分離熱資料和冷資料。
能夠使用JBOD。