如何使用google colab載入kaggle資料
參考https://medium.com/@yvettewu.dw/tutorial-kaggle-api-google-colaboratory-1a054a382de0
從本地上傳到colab上十分慢,可以在colab下直接配置kaggle API方便下載。
-
首先要有kaggle賬號,然後在My Account下找到Create New API Token。這個會下載一個json檔案到本地機器上,開啟json檔案的形式應該如下所示:
{“username”:”YOUR-USER-NAME”,”key”:”SOMETHING-VERY-LONG”}
-
接著在colab中建立一個檔案,當前檔案路徑為
/content
,執行!pip install kaggle
。這個檔案上直接可以執行的是python語法,要執行命令列只需在命令前加上!
,比如!ls
,!pwd
; -
然後依次執行下面命令,最好一個cell一條命令跑:
第一個cell執行:!mkdir .kaggle 第二個cell執行: import json token = {“username”:”YOUR-USER-NAME”,”key”:”SOMETHING-VERY-LONG”} with open(‘/content/.kaggle/kaggle.json’, ‘w’) as file: json.dump(token, file) 第三個cell執行: !chmod 600 /content/.kaggle/kaggle.json 第四個cell執行: !cp /content/.kaggle/kaggle.json ~/.kaggle/kaggle.json 第五個cell執行: !kaggle config set -n path -v{/content}
-
下載資料演示:我想下載dogs-vs-cats 這個資料集。 需要複製
Download All
旁邊的API
.然後在cell中執行命令kaggle competitions download -c dogs-vs-cats -p /content
。最後的-p /content
是指定檔案的儲存路徑。值得一提的是,colab上的下載速度真的快。