Mac 上搭建 Flink 1.6.0 環境並構建執行簡單程式入門
準備工作
1、安裝檢視 Java 的版本號,推薦使用 Java 8。
安裝 Flink
2、在 Mac OS X 上安裝 Flink 是非常方便的。推薦通過 homebrew 來安裝。
brew install apache-flink
3、檢查安裝:
flink --version
結果:
Version: 1.6.0, Commit ID: ff472b4
4、啟動 flink
進入安裝目錄: cd /usr/local/Cellar/apache-flink/1.6.0/libexec/bin 執行下面命令 ./start-cluster.sh 啟動日誌: Starting cluster. Starting standalonesession daemon on host zhisheng. Starting taskexecutor daemon on host zhisheng.
接著就可以進入 web 頁面( ofollow,noindex">http://localhost:8081/ ) 檢視
demo
1、新建一個 maven 專案
建立一個 SocketTextStreamWordCount 檔案,加入以下程式碼:
package com.zhisheng.flink; import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.streaming.api.datastream.DataStreamSource; import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.util.Collector; /** * Created by zhisheng_tian on 2018/9/18 */ public class SocketTextStreamWordCount { public static void main(String[] args) throws Exception { //引數檢查 if (args.length != 2) { System.err.println("USAGE:\nSocketTextStreamWordCount <hostname> <port>"); return; } String hostname = args[0]; Integer port = Integer.parseInt(args[1]); // set up the streaming execution environment final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); //獲取資料 DataStreamSource<String> stream = env.socketTextStream(hostname, port); //計數 SingleOutputStreamOperator<Tuple2<String, Integer>> sum = stream.flatMap(new LineSplitter()) .keyBy(0) .sum(1); sum.print(); env.execute("Java WordCount from SocketTextStream Example"); } public static final class LineSplitter implements FlatMapFunction<String, Tuple2<String, Integer>> { @Override public void flatMap(String s, Collector<Tuple2<String, Integer>> collector) { String[] tokens = s.toLowerCase().split("\\W+"); for (String token: tokens) { if (token.length() > 0) { collector.collect(new Tuple2<String, Integer>(token, 1)); } } } } }
接著進入工程目錄,使用以下命令打包。
mvn clean package -Dmaven.test.skip=true
然後我們開啟監聽 9000 埠:
nc -l 9000
最後進入 flink 安裝目錄 bin 下執行以下命令跑程式:
flink run -c com.zhisheng.flink.SocketTextStreamWordCount /Users/zhisheng/IdeaProjects/flink/word-count/target/original-word-count-1.0-SNAPSHOT.jar 127.0.0.1 9000
注意換成你自己專案的路徑。
執行完上述命令後,我們可以在 webUI 中看到正在執行的程式:
我們可以在 nc 監聽埠中輸入 text,比如:
然後我們通過 tail 命令看一下輸出的 log 檔案,來觀察統計結果。進入目錄 apache-flink/1.6.0/libexec/log,執行以下命令:
tail -f flink-zhisheng-taskexecutor-0-zhisheng.out
注意:切換成你自己的路徑和檢視自己的目錄。