サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
コーヒー沼
qiita.com/yaanai
はじめに Pythonによるブログのコメント収集の自動化をしました。 以前の記事で紹介した本文抽出との違いは、 アメブロのコメントがJavaScriptで動的に作成されるコンテンツであり、 htmlで読み込んでもデータを取得できないことです。 そこで、Seleniumというツールを使って、ブラウザを制御してWebページの操作をしながら情報を収集しました。 コード 必要なライブラリの読み込み #ファイル操作 import os import pandas as pd import shutil import datetime from itertools import zip_longest #パース解析 import requests from bs4 import BeautifulSoup import re from urllib.parse import urljoin impor
このページを最初にブックマークしてみませんか?
『qiita.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く