JuliaでCSVファイルを読み込む3つの方法-Julia1.9対応-

julia

データ分析をする時にデータを読み込むのは必須ですよね。

pythonなら、pandasを使って、データの読み書きや処理を行うのをよくやると思います。

juliaには、pandasはないので、それに代わるようなパッケージを使って処理していきましょう。

CSVで読み込んだデータを操作するのは、Query.jlというのがあります。

Query.jlについては、juliaのDataFramesとQueryでデータを操作するで解説しています。気になる方はそちらをご覧ください

実行環境

今回インストールした環境

  • windows 11
  • julia 1.9
  • DataFrames v1.5.0
  • CSV v0.10.10

パッケージのバージョンの確認方法

juliaでパッケージのバージョンを確認するには

パッケージモードで、”status”を使う

もしくは、using Pkgでstatusを使う

これで確認できます。

juliaでCSVファイルを読み込む

juliaでCSVファイルを読み込んでいきましょう。

今回は、データ分析の入門として有名なタイタニック号のデータを読み込んでいきます。

juliaで使うパッケージ

必要なパッケージをインストールしていきます。

今回使うパッケージは2つ

  • CSV
  • DataFrames

CSVはその名の通り、CSVファイルの操作のためのパッケージ。

DataFramesはPythonのPandasのようにdataをdataframeとして扱うためのパッケージ

パッケージのインストール

Juliaを起動したらパッケージモード(”]”を入力する)に移動して、インストールしていきます。

(@v1.9) pkg> add DataFrames
        ......
        ......
(@v1.9) pkg> add CSV
        ......
        ......

Jupyterからインストールする場合は

using Pkg
Pkg.add("DataFrames")
Pkg.add("CSV")

ってやればOKです。

プレコンパイルなどが走ります。

エラーがなければ問題なしです。

これで、必要なパッケージのインストールは完了です。

CSVデータを読み込む

パッケージのインストールができたので、CSVファイルを実際に読み込んでみましょう。

タイタニックのデータが入ったCSVファイルのファイル名を”titanic.csv”とします。

今回は3つの読み込み方をやってみます。

1. CSV.read()で読み込む

まずは、CSV.readで読み込んでみましょう。

using CSV
using DataFrames

titanic = CSV.read("titanic.csv", DataFrame)

これで完了です。

少し古い情報だとCSV.read(path)で動くように書いてあるものもありますが、CSV.read(path,DataFrame)って書かないとエラーが出ます。

2. CSV.File()で読み込む

次にCSV.Fileってので読み込んでいきます。

using CSV
using DataFrames

titanic = DataFrame(CSV.File("titanic.csv"))

これでもCSVファイルを読み込むことができます。

3. パイプライン演算子を使って読み込む

最後にパイプライン演算子を使った方法を紹介します

パイプライン演算子って何?っていうと”|>”こういうやつで、関数に代入していける感じと思えばいいのかと思います。

詳しくは検索してね。

パイプライン演算子使った書き方はこんな感じ

using CSV
using DataFrames

titanic = CSV.File("titanic.csv") |> DataFrame

DataFrameにCSV.Fileで読み取ったデータを代入しています。

2でやっていることをパイプライン演算子を使って書き換えた感じです。

まとめ

今回はJuliaでCSVファイルを読み込む3つの方法をご紹介しました。

1つ目のCSV.readは他の言語と似たような感じですが、3つ目のパイプライン演算子を使った方法はPythonとかではあまり見かけないかもしれません。Pythonにはパイプライン演算子はないかも。

どの方法でもCSVファイルを読み込んでdataframeに入れるのはいっしょです。

CSV.Fileはたしかイテレーターだったかな?なので、CSVの生をいじるならそちらがいいのかもしれませんね。

では、データサイエンスでJuliaを使ってみましょう!

ではまたね

あわせて読みたいおすすめ関連記事

CSVでデータを読み込んだ後の操作

読み込んだデータをグラフ描画してみよう!

時系列データの操作はについてはこちらのシリーズ

コメント

  1. […] 前回は、JuliaでCSVファイルを読み込む3つの方法をご紹介しました。 […]

  2. […] CSVはJuliaでCSVファイルを読み込む3つの方法-Julia1.6対応- […]

タイトルとURLをコピーしました