データ分析には手間が多い。

仕事の関連でデータをみて、色々考えていくことが必要なのだが、自分の考えるためのデータを作るのが手前がかかる。
関係のありそうなデータがたくさん入手できるけど、あのデータセットとこのデータセットを繋ぐには、どうすれば良いのか?一部で同じデータがあるのでIDみたいなものを作って行くのはできるけど、完璧にはできず。。。

そうなると目で見て、どこで同じと判断できるのか、その要素を抜き出して、さらに新しいIDを作ってみたり。。。
ルールがあると一様にできるけど、類推でやらないといけない部分は正確性が担保できないので、データとしての信頼性が落ちてしまう。

おまけにデータ数が膨大でエクセルで処理しようとするとファイルサイズが大きくなりすぎて、少し手を加えるだけで作業待ちの時間が発生して、時間効率も悪い。
ここまでくると、やっぱりデータベースに特化したソフトを利用して、そこを参照する形で運営しないと、PCの能力もファイルのサイズもパンクしてしまうような気がする。

とはいえ、アクセスの勉強には手が出ておらず、以前から何度か手を出しているけどいまいちしっかりと理解ができなくて、使うことができていない。
おまけに悪いことに、そこそこエクセルができてしまうので、色々とエクセル内で作業をできてしまうため、アクセスに対しての緊急的な必要性が低い状態が続いているというもの。

必要性が出てくると人は頑張るものなのだなぁと思いつつ、その必要性がじんわりとしか出てきていないがよろしくない。

コメント