いつもはExcelで回帰分析などをしていましたが、今回はPythonで実証分析をすることにチャレンジしました。

https://daiki-ncu-2024.github.io/consumption-function
こちらのサイトで分析の結果をデータビジュアライゼーションすることができました。
具体的な分析手法はこのようなものです。dfには国民経済計算(2025年第1四半期、季節調整済み)から色々加工したものです。

import statsmodels.formula.api
result = smf.ols("C ~ Y", data=df).fit()
result.summary()
pythonのstatsmodelsというライブラリを使うことで簡単に最小二乗法ができます。p値が0.000なので推定量は有意水準5%で有意ですね。色々AIに聞いてたどり着きました。図書館でpythonのデータ分析本を色々見たのですが、計量経済学の内容(ダミー変数、不均一分散、系列相関など)を扱うものがあまりなくて苦労しました。どちらかというと、機械学習の本が多く、その分野で回帰分析をするにはscikit-learnがよく使われているようでした。ただ、scikit-learnは拡張性が狭そうだったので、結局Geminiに聞いた結果、statsmodelsに出会いました。

他にもグラフを作ってみたり。

3次関数でプロットしたり

リーマン・ショックでの構造変化を疑い、ダミー変数を使った結果、当てはまりがよくなったり
このようによくある計量経済学の教科書に沿った内容を実際に自分の手で分析をしました。このpythonのファイル(.ipynb)をGeminiに読み込ませて、ウェブサイトを作らせると上記のものができました。
現在やっていることとして2つあります。
1つは同時方程式というモデル
C = c0 + cY
Y = C + I
のような連立方程式的なものを推定する手法を勉強しています。これを発展させると、税を関係させたらどうなるのかシュミレーションできそうなので、勉強中です。
また、統計検定準1級の勉強もしています。理由は、勉強していて取れるのではないかと思ったことと、大学側が資格補助のお金を出してくれるからです(2級は出してくれないみたい)。
話は戻りますがPythonでデータ分析をするのにやっと慣れてきたのでこれからも定期的に分析結果をシェアしたいなと思います。