2020-08-09から1日間の記事一覧

データサイエンス100本ノックをpysparkで解く

データサイエンス100本ノック をpysparkで解きました。環境構築には公式と同様にDockerを使っています。 gitリポジトリはこちら ローカルのファイルをDockerイメージにマウントするため、ユーザディレクトリ配下でgit cloneすることがおススメです。 それ以…