デザイン、子育て、モノづくり、マーケティングが大好きなシングルマザーの日常

menu

Poplifeのおもちゃ箱

PHPでTIdyを試し中~

久々に、仕事の話。ほとんどの人には宇宙語でございます。。
せめて愛らしい写真をアップ。
Polar_bear_-_a_naughty_tot.jpg
これで許してください~(←?)
仕事で、HTMLから特定のタグを抜き出して処理する必要があるので
Tidyを試してみました。
Tidyとは、HTMLのスクレイピングができるツール。
HTML中から特定の部分を抜き出して、ごにょごにょするためのツールです。
コンパイルが必要なので、インストールにroot権限はいると思います。
VMWareでCentOSを走らせて検証しているので
yumを使って以下インストール。
yum install libtidy-devel
yum install tidy
yum install php-devel
yum install php-pear
pecl install tidy
yum install php-tidy
で、apacheを再起動。で、Tidyは使えるようになりました。
サンプルプログラムを書いてみると。。
おおー!
Aタグのリンクを簡単に抜き出せる!
imgや他のタグについても、簡単そうであります。これは便利!
今回の仕事に取り掛かってから、特定タグの抜き出しが
実は結構面倒だと感じていたので、これはよかった。
いわゆる「Web2.0」(もう死語かな?)的な処理に、便利に使えそうです

Comments

comments

関連記事

2024年11月
 123
45678910
11121314151617
18192021222324
252627282930