他のサイトをスクレイピングして<title>タグの中身をとってくるだけなのに、えらく手がかかってしまいました。

python

python→コンテナは後回し→開発環境(virtualenvとか)ない→仕方なくコンテナ作成(結構てこずった)→beautysoupが変→py2.7でやる→やっぱりうまくいかない→py3にする→できた→じゃあこれserviceにするためには…→django→めんどくさい(停止)

node.js

node.js→開発環境あり(npm, node)(ただしなぜかnodebrewが入っていなくて…)→コンテナも楽勝(一昨日作ったばかり)→express余裕→cherrio-httpclient…$に返ってくるはずのものがどんなに頑張ってもundefined…(停止)

php

php→コンテナは後でfpm使えばいいや→開発環境一式揃ってる→phpQuery-onefile文字化けがー→じゃあsimple_html_domで→find(’title’)がとれない…→やっぱりphpQuery-onefileで→文字化け対策はこうするのか→完成

まとめ

仕事でも使っているし、これからは{python, Ruby}のどっちかに強くないとという気持ちからpythonで作ろうと思ったけどダメだった。 php使えば簡単に直ぐにできるのはわかっていただけに、謎の文字化けハマりでこんなに大変になるとは思いもしなかった。 node.jsはスクレイピング以外なんにも難しいことはなかった。スクレイピング以外は。こんな事に1日を使ってしまった…。以前勤めていたマジキチダンボールだったら自殺に追い込まれるレベル。