天天看点

Python + Selenium: 使用webdriver判断浏览器是否关闭

在使用Selenium的过程中,偶然发现浏览器意外关闭导致意料之外的错误发生。比如重复启动浏览器。在无界面headless模式下,因为目前流行的浏览器是多进程的,这是很难发现的。在浑然不知的情况下,多次重复启动浏览器而没有正常关闭,很可能导致多个浏览器进程以“假死”的状态滞留内存。“僵尸”进程占用浪费系统资源,堵塞其他进程,降低系统的性能。因此,需要合理正确的判断且处理浏览器状态,并在必要时回收系统资源的方法。

由于Selenium中webdriver是直接管理浏览器行为的实体,所以可以通过webdriver管理浏览器行为的方法来简单有效地鉴别其状态。比如,webdriver的execute_script(javascript_string)方法。学习过Javascript的码友想必知道,最简单的Javascript代码之一:

javascript:void(0);
           

它所表达的意义跟空集没什么两样。但是,它的作用却是不容小觑。比如,最流行的是用在<a>标签的href属性,点击使用该方法的<a>标签不跳转和弹出新标签页。进而通过设置对应的Javascript脚本来响应点击事件。

<a href="javascript:void(0);" target="_blank" rel="external nofollow"  class="title">...</a>
           

 执行该脚本代码没有实际清晰的意义,它却是完整的一行Javascript脚本代码。如果通过webdriver启动的浏览器没有关闭和出现异常,是可以正常执行该段代码的。否则,浏览器实例出现意料之外的问题。

from selenium import webdriver


object_existed = False
# driver = webdriver.Firefox()
# or driver = webdriver.Chrome()
if driver is not None:
    try:
        driver.execute_script('javascript:void(0);')
        object_existed = True
    except:
        # webdriver要求浏览器执行Javascript出现异常
        try:
            driver.quit()
        finally:
            driver = None
    finally:
        pass
if not object_existed:
    # 浏览器已关闭或标签页已关闭或其他异常
    ...
           

笔记:

        “javascript:void(0);”看似毫无意义,其实它的存在和数学里的“0”和“空集”是一样的,是不可或缺的。这也验证了计算机科学与数学应用的关联和一致性。