Pythonで予測|株価はいくらになる?【機械学習を使って予測する方法を解説:データ取得、データ前処理、モデル作成、モデル評価まで】

Pythonで予測|株価はいくらになる?【機械学習を使って予測する方法を解説:データ取得、データ前処理、モデル作成、モデル評価まで】

この動画では、株価がいくらになるかを予想する方法について解説をします。
ご自身で株式投資をしている方も多いのではないでしょうか。
みなさんは、どのように判断をして売り買いをしていらっしゃいますか?
株価が上がるか下がるかは、様々な要因があり、正しく予想することは非常に難しいことです。
とはいえ、投資銀行などでは、コンピュータが、人工知能による自動売買している部分が多いといわれています。
そして、コンピュータでの取引アルゴリズムの精度を高めるために、データサイエンティストによる研究が日々行われています。
同じように、機械学習で取引をしてみたいと思いませんか? ですが、株価の予測というテーマは、機械学習にチャレンジしてみるにはおもしろいテーマだと思います。
売り上げ予測や在庫予測など、ご自身のお仕事のテーマに転用いただければと思います。
前回の動画では、機械学習を使って、株価が上がるか下がるかを予測する方法を紹介しました。まだご覧になっていな方は、こちらも参考になさってください。
今回は、機械学習を使って、株価がいくらになるかを予測する方法を紹介します。

▼目次
00:00 はじめに
01:44 使用するデータと予測モデルについて
03:12 データの読み込み、曜日情報の追加
05:27 説明変数と目的変数を追加
09:21 学習用データとテストデータに分割
11:09 重回帰分析でモデル作成
14:02 株価の予測
15:06 予測値と実際の値を可視化
17:04 予測モデルの係数と切片を確認
18:49 おわりに

▼関連動画
【Pythonで予測】株価は上がる?下がる?|株価データを使ってPythonで機械学習をしてみよう(データ加工、データ整形、予測モデル作成、株価データの分類予測、予測精度の確認まで)

Pythonで株価のデータ分析|株価分析を通してPythonでのデータ分析を学びましょう

Pythonで株価のデータ分析 |チャートに指標を追加してテクニカル分析【ビットコインや為替 (FX)にも応用できます】

Pythonのファイナンス(株 , FX)に特化したライブラリの使い方を解説【データ可視化、チャート分析を中心に進めていきます】

【Pythonでファイナンス分析(株・FX)】日本発祥のテクニカル指標「一目均衡表」の作成方法

【大検証】2021年の一番儲かった取引ルール方法を分析してみた

▼書き起こしブログ
https://kino-code.com/python-stock-price2/

▼書き起こし
“`python
# ライブラリのインポート
from pandas_datareader import data
from datetime import datetime, timedelta
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

# ワーニングを非表示にする設定(任意)
import warnings
warnings.simplefilter(‘ignore’)

# 最大表示行数の指定(任意:ここでは10行を指定)
pd.set_option(‘display.max_rows’, 10)
“`
まずは、使用するライブラリをインポートしましょう。
今回使用する日経平均株価のデータセットはpandas_datareaderより取得します。
pandas_datareaderにあるdataモジュールをインポートして、DataReaderメソッドを用います。
その他、必要なライブラリをまとめてインポートします。

続けて、これらの設定は任意ですが、ワーニングを非表示にする設定、pandasの表示行数の設定をします。
それぞれ、この記述で設定することができます。

“`python
# pandas_datareaderを使って、2018年始から2021年末までの日経平均株価データの取得
start = ‘2018-01-01’
end = ‘2021-12-31’
data_master = data.DataReader(‘^N225’, ‘yahoo’, start, end)
data_master
“`

次に、pandas_datareaderを使用して、日経平均株価のデータを取得します。
開始日の2018年1月1日と終了日の2021年12月31日を、それぞれ、変数startとendに代入します。
pandas_datareaderのDataReaderメソッドを用いて、第1引数に日経平均株価のティッカーシンボル’^N225’、第2引数にデータソースの’yahoo’、第3引数に開始日の変数start、第4引数に終了日の変数endを渡します。ここで取得したデータをdata_masterに代入します。
data_masterを表示してみましょう。実行します。
データが取得できました。

![png](./images/df_output_01.png)

“`Python
# 曜日情報を追加(0:月曜日〜4:金曜日)
data_master[‘weekday’] = data_master.index.weekday
data_master
“`

インデックスが日付’Date’、カラムは、最高値’High’、最安値’Low’、始値’Open’、終値’Close’、出来高’Volume’、調整後終値’Adj Close’、の6個のデータフレームです。
indexの日付のデータを用いて’weekday’カラムを追加し、曜日の情報を作成しましょう。
表示してみましょう。
曜日’weekday’が追加できました。曜日は、月曜日を基準の0とした6までの数値で表されています。
(続く)

#Python #株価 #予測 #機械学習 #重回帰

株価 pythonカテゴリの最新記事