emoiの日記

忘れっぽい雑食系エンジニアのメモblogです。仮想通貨とROSに興味があります。

いなごFlyerからデータをスクレイピング Ubuntu編

コード

pythonです。

#-*-coding:utf-8-*-
from selenium import webdriver
from selenium.webdriver.common.keys import Keys as keys

url = "https://inagoflyer.appspot.com/btcmac"

options = webdriver.ChromeOptions()
options.add_argument("--headless")
driver = webdriver.Chrome(chrome_options=options)

def main():
    driver.get(url)
    print("Connection successful.")
    
    #fetch and print BuyVol
    for buyvol in driver.find_elements_by_id("buyVolumePerMeasurementTime"):
        print("BuyVolume:"+buyvol.text)

    #fetch and print SellVol
    for sellvol in driver.find_elements_by_id("sellVolumePerMeasurementTime"):
        print("SellVolume:"+sellvol.text)
        
    driver.close()
    driver.quit()

if __name__ == '__main__':
    main()

実行結果。

Connection successful.
BuyVolume:13.01
SellVolume:14.97

うまく取得できているようですが、
optionsにheadlessをつけているのに、
chromeが立ち上がってしまう謎現象ありました。

余談

当方の環境ではPhantomJSは上手く行きませんでした。。
インストールは以下を参考にしました。
PhantomJSをインストールする(Ubuntu) - 【WordPressカスタマイズ相談】現役プログラマが解決策を教えます