ランサーズにログインして特定の作業一覧ページを読み取り、そのページのテーブルから作業者 (ランサー) の承認状況やIDを取得して、CSVファイルとして保存する。作成者は, このの過程を自動化した。書き換えれば, 他の用途に使えるだろう。
このコードは、ウェブページにログインしてスクレイピングを行い、取得したデータを /raw
にHTML形式で保存する。また、データのクリーニングを行い、結果をCSV形式で /processed
に保存する。以下のコマンドでquartoテンプレートが使用できる。qmdファイルのpythonチャンクからコードを抜き取るのもいいだろう。
quarto use template yamanori99/lancers-page-scraping