Google Apps Script(GAS)スクレイピングのブログ

Google Apps Script(GAS)スクレイピングのブログ、クローラー、クロール、VBA、RPA、AI、機械学習、ディープラーニング、人工知能、自動化、業務効率化

1ページから1つの値を取得

GASは簡単にWebスクレイピングが実現できます。

今回ははてなブログのトップページからタイトルをスクレイピングします。

function myFunction() {

  //urlを指定
  var url = 'https://hatenablog.com/';

  //htmlソースを取得
  var response = UrlFetchApp.fetch(url).getContentText();
  
  //正規表現でtitleタグを指定
  var myRegexp = /<title>([\s\S]*?)<\/title>/;
  
  //タイトルを取得
  var title = response.match(myRegexp)[1];
  
  Logger.log(title);

}

ログを見てみるとページタイトルが取得できています。簡単ですね!

f:id:koyai:20190129144507p:plain