データ解析
ロジスティック回帰は気軽に使えるクラス分類のツールです。ですが、油断していると学習結果が発散してうまく学習できないという思わぬ罠に陥ることがあります。今回の記事では、その問題が生じる原因と回避方法についてご紹介します!
データ解析のうち、データを2つのクラスに分類するニクラス分類問題。今回の記事では、その問題に対するアプローチの1つ、ロジスティック回帰をご紹介します。この方法により、データにクラスを簡単に割り当てることができるようになります!
ハイパーパラメータのチューニング。これは非常に重要で非常に難しい問題です。この問題に対して、先日Preferred NetworksさんがOptunaというハイパーパラメータ自動最適化のツールを公開してくださいましたので、今回はこのOptunaについてご紹介いたします。
平均・分散。普段何気なく使っている指標だと思いますが、確率論的な平均と統計的な平均は少し意味が異なってきます。そこで今回は確率論的な平均・分散について定義を確認したいと思います!
2つの変量の線形な関係性を見るための相関係数。ポートフォリオのリスク分散に使ったり、リターンの追求に使ったりします。しかしながら、相関係数を測る場合には注意しなければならないことがあります。本記事ではその相関係数の罠をご紹介いたします。
金融工学においては株価の分布に対数正規分布を仮定することが一般的です。そこで今回は日経平均株価のデータに対して本当に対数正規分布かどうか確かめてみました。その結果、対数正規分布よりも裾の厚い分布に従っている可能性が確認できました!
Pythonを使って日経平均のデータのダウンロードする方法を共有します!pythonの中にはインターネット上のデータにアクセスするためのライブラリが存在し、それを使えば金融データなど簡単にダウンロードし解析することができます。
e-Statの人口動態のデータを数理生態学の観点から解析しました!特に今回はマルサスモデルとロジスティックモデルという最も基本的なモデルを用いてます。
Pythonを活用して、e-stat(政府統計の窓口)からAPIを使って人口動態のデータをchromebookにダウンロードし、その可視化をしてみました!