WEBスクレイピングのClassとElementの違い

IE操作でTUTAYAの在庫調査PGを書いてみた

本日エクセル2019を購入して新PCに開発環境を手にしました。前々から気になっていた「IE操作」の処理を作ってみました。TUTAYAの本の在庫状況を取得するというものです。何とかdebug.printに取得成功しました。

その過程で、getElementsByTagName(”DIV”)に至るまでに、HTMLのClassとElementって何が違うの?という疑問が発生しました。

 

Element、Classはこうなっている!

結論から言うと、Element(要素)の中のTAGにClassという識別がある...ということだと理解しました。

<name>山田太郎</name>

全体がElement(要素)。Element(要素)の中にnameタグがある。

classは複数のnameタグがある場合、それぞれ何のnameタグなのかを識別するためにある。(同じWebページ内で同じclass属性の値を何度でも用いることができる...らしいです。

 

少しHTMLの勉強になりました。

 

何に活かせるのか??

WEBスクレイピングはサイトによっては禁止にしているものもあるそうです。本で見たのは、毎日の株価情報をWebスクレイピングでやってるようでした。クラウドワークスでも需要があるので少しずつ極めていきます。