Machene Learning Crash Course 4 - First Steps with TensorFlow #2
さあ、用語も覚えてついにTensorFlow!!
と思ったが、どうやらここからさらに先に進むためにはpandasを学ぶことは避けて通れないようである。pandasはSeriesとDataFrameという2つのデータ構造を提供するためのライブラリ、Seriesはちょっと便利な1次元配列でDataFrameはちょっと便利な2次元配列。
city_names = pd.Series(['San Francisco', 'San Jose', 'Sacramento']) population = pd.Series([852469, 1015785, 485199]) pd.DataFrame({ 'City name': city_names, 'Population': population })
のように自分でSeriesやDataFrameの変数を作ることもできるけれど、大抵はこんな感じでガツンとデータを読み込むんです。
california_housing_dataframe = pd.read_csv("https://download.mlcc.google.com/mledu-datasets/california_housing_train.csv", sep=",")
そして、読み込んだデータを色々したいときはこんな感じ。
california_housing_dataframe.head() #最初の数行を表示する california_housing_dataframe.describe() #各カラムの中央値や平均値・最大最小値などを表示する california_housing_dataframe.['longitude'][0] #longitudeカラムの最初のレコードを取得する california_housing_dataframe.['longitude']*2 #longitudeカラムの全部の値に2をかける
データへのアクセスは連想配列っぽい。まあとにかく、便利な配列ということがわかってれば前に進めそう。
牛歩のような進捗である・・・