10/21

統計モデルを緑本などで学んだ後に自分で色々作っていく経験をしたいのですが何か良い方法はないでしょうか。機械学習だとkaggleやる、とかあると思うのですが。

良い質問ですね!🤩 わかります、わかりますよ。勉強したものの実践が積めない。わかります。 こういうときは、挑みたい課題をみつけて、その分野について分析してみるのがいいと思います。 はい、わかります。そうなんですよね、わかりますよ。 そんな事言われても挑みたい課題がない? いいんです、何でもいいんですよ。たとえば、「アニメのタイトルからなろう系かどうか予測する」とか、「髪色から主人公との関係を分類する」とか、もうなんでもいいんです。 面白そうなこととりあえずたくさん(10個以上)とりあえず書いてみてください。 え、そんなデータセット見当たらない? そうなんです!そうなんですよ!わかります! ここで、発想を転換しないといけないのです。消費者から生産者に回る必要があります。 勉強している間は、教材などを消費して知識を吸収する立場だった思うのですが、 データ分析の実践を始めるとなったら、消費者をやめないといけない場合があります。 そこら辺に落ちている kaggle などを使うのであればまだ消費者でいてもやっていけるのですが、 そういうところにいいものがなければもう生産するしかありません。 どういうことかというと、気合で自分でデータを集めてつくるのです。 たとえば、めっっっっっっっっちゃいろんなサイト訪問して、 spreadsheet に手動でデータためたりとか、 スクレイピングのプログラムくんでデータを集めたりとか。 データ分析を実践したいのであれば、そのまず最初のステップはデータを集めることです。 すでに誰かが集めてくれたものから選ぶか、ないなら自分で作るか、二択です。 ======== と、ここまで書きましたが、どうでしょう。データをつくる気になりましたか? とりあえず、1週間くらい探して、それで見当たらないなら、もう作っちゃったほうがいいと思います。 「オープンデータ」というキーワードで色々探してみるとそれなりに見つかると思うので、やってみてはいかがでしょうか? ======== P.S. 階層ベイズ的なの試したいのであれば、 iris dataset でも Titanic dataset それなりに遊べるとは思いますよー。

Sponsor link

Sponsor link

Sponsor link