天天看點

【轉】Python 子產品簡介 -- argparse

argparse

是 Python 标準庫中用來解析指令行參數和選項的子產品,其是為替代已經過時的 optparse 子產品而生的,該子產品在 Python2.7 中被引入。argparse子產品的作用是用于解析指令行參數。

建立解析器

使用 argparse 解析指令行參數時,首先需要建立一個解析器,建立方式如下所示:

import argparse
parser = argparse.ArgumentParser()           

複制

ArgumentParser

的原型如下所示:

class ArgumentParser(self, prog=None, usage=None, description=None, epilog=None, parents=[], formatter_class=<class 'argparse.HelpFormatter'>, prefix_chars='-', fromfile_prefix_chars=None, argument_default=None, conflict_handler='error', add_help=True)           

複制

ArgumentParser對象的參數都為關鍵字參數:

  • prog: 程式的名字,預設為sys.argv0,用來在help資訊中描述程式的名稱。
>>> parser = argparse.ArgumentParser(prog='myprogram')
>>> dir(parser)
['__class__', '__delattr__', '__dict__', '__doc__', '__format__', '__getattribute__', '__hash__', '__init__', '__module__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_action_groups', '_actions', '_add_action', '_add_container_actions', '_check_conflict', '_check_value', '_defaults', '_get_args', '_get_formatter', '_get_handler', '_get_kwargs', '_get_nargs_pattern', '_get_option_tuples', '_get_optional_actions', '_get_optional_kwargs', '_get_positional_actions', '_get_positional_kwargs', '_get_value', '_get_values', '_handle_conflict_error', '_handle_conflict_resolve', '_has_negative_number_optionals', '_match_argument', '_match_arguments_partial', '_mutually_exclusive_groups', '_negative_number_matcher', '_option_string_actions', '_optionals', '_parse_known_args', '_parse_optional', '_pop_action_class', '_positionals', '_print_message', '_read_args_from_files', '_registries', '_registry_get', '_remove_action', '_subparsers', 'add_argument', 'add_argument_group', 'add_help', 'add_mutually_exclusive_group', 'add_subparsers', 'argument_default', 'conflict_handler', 'convert_arg_line_to_args', 'description', 'epilog', 'error', 'exit', 'format_help', 'format_usage', 'format_version', 'formatter_class', 'fromfile_prefix_chars', 'get_default', 'parse_args', 'parse_known_args', 'prefix_chars', 'print_help', 'print_usage', 'print_version', 'prog', 'register', 'set_defaults', 'usage', 'version']
>>> parser.print_help()
usage: myprogram [-h]

optional arguments:
  -h, --help  show this help message and exit           

複制

  • usage:描述程式用途的字元串
>>> parser = argparse.ArgumentParser(prog='PROG', usage='%(prog)s [options]')
>>> parser.print_usage()
usage: PROG [options]
>>> parser.print_help()
usage: PROG [options]

optional arguments:
  -h, --help  show this help message and exit           

複制

  • description: 程式描述資訊,help 資訊前的文字。
  • epilog: help 資訊之後的資訊
>>> parser = argparse.ArgumentParser(
...     description='A foo that bars',
...     epilog="And that's how you'd foo a bar")
>>> parser.print_help()
usage: [-h]

A foo that bars

optional arguments:
  -h, --help  show this help message and exit

And that's how you'd foo a bar           

複制

  • parents: 由ArgumentParser對象組成的清單,它們的arguments選項會被包含到新ArgumentParser對象中。
>>> parent_parser = argparse.ArgumentParser(add_help=False)
>>> parent_parser.add_argument("--parent", type=int)
_StoreAction(option_strings=['--parent'], dest='parent', nargs=None, const=None, default=None, type=<type 'int'>, choices=None, help=None, metavar=None)
>>> foo_parser = argparse.ArgumentParser(parents=[parent_parser])
>>> foo_parser.add_argument('foo')
_StoreAction(option_strings=[], dest='foo', nargs=None, const=None, default=None, type=None, choices=None, help=None, metavar=None)
>>> foo_parser.parse_args(["--parent", "2", "XXX"])
Namespace(foo='XXX', parent=2)           

複制

  • formatter_class: 重置 help 資訊輸出的格式

可供選擇的參數有: HelpFormatter、ArgumentDefaultsHelpFormatter、RawDescriptionHelpFormatter、RawTextHelpFormatter

  • prefix_chars: 參數字首,預設為’-‘
>>> parser = argparse.ArgumentParser(prefix_chars="+")
>>> parser.add_argument("+f")
_StoreAction(option_strings=['+f'], dest='f', nargs=None, const=None, default=None, type=None, choices=None, help=None, metavar=None)
>>> parser.add_argument("++bar")
_StoreAction(option_strings=['++bar'], dest='bar', nargs=None, const=None, default=None, type=None, choices=None, help=None, metavar=None)
>>> parser.parse_args("+f X ++bar Y".split())
Namespace(bar='Y', f='X')           

複制

  • fromfile_prefix_chars: 字首字元,放在檔案名之前
>>> with open('args.txt', 'w') as fp:
...    fp.write('-f\nbar')
>>> parser = argparse.ArgumentParser(fromfile_prefix_chars='@')
>>> parser.add_argument('-f')
>>> parser.parse_args(['-f', 'foo', '@args.txt'])
Namespace(f='bar')           

複制

當參數過多時,可以将參數放到檔案中讀取,例子中parser.parse_args(‘-f’, ‘foo’, ‘@args.txt’)解析時會從檔案args.txt讀取,相當于‘-f’, ‘foo’, ‘-f’, ‘bar’

  • argument_default:參數的全局預設值。例如,要禁止parse_args時的參數預設添加,我們可以:
>>> parser = argparse.ArgumentParser(argument_default=argparse.SUPPRESS)
>>> parser.add_argument('--foo')
>>> parser.add_argument('bar', nargs='?')
>>> parser.parse_args(['--foo', '1', 'BAR'])
Namespace(bar='BAR', foo='1')
>>> parser.parse_args()
Namespace()           

複制

這樣,當parser.parse_args()時不會自動解析foo和bar了。

  • conflict_handler: 解決沖突的政策,預設情況下沖突會發生錯誤:
>>> parser = argparse.ArgumentParser(prog='PROG')
>>> parser.add_argument('-f', '--foo', help='old foo help')
>>> parser.add_argument('--foo', help='new foo help')
Traceback (most recent call last):
 ...
ArgumentError: argument --foo: conflicting option string(s): --foo           

複制

我們可以設定沖突解決政策:

>>> parser = argparse.ArgumentParser(prog='PROG', conflict_handler='resolve')
>>> parser.add_argument('-f', '--foo', help='old foo help')
>>> parser.add_argument('--foo', help='new foo help')
>>> parser.print_help()
usage: PROG [-h] [-f FOO] [--foo FOO]

optional arguments:
 -h, --help  show this help message and exit
 -f FOO      old foo help
 --foo FOO   new foo help           

複制

  • add_help: 設為 False 時,help 資訊裡面不再顯示

    -h --help

    資訊。

添加參數選項

為應用程式添加參數選項需要用 ArgumentParser 對象的

add_argument

方法,該方法原型如下:

add_argument(name or flags...[, action][, nargs][, const][, default][, type][, choices][, required][, help][, metavar][, dest])           

複制

示例:

>> parser.add_argument('integers', metavar='N', type=int, nargs='+',
...                     help='an integer for the accumulator')
>>> parser.add_argument('--sum', dest='accumulate', action='store_const',
...                     const=sum, default=max,
...                     help='sum the integers (default: find the max)')           

複制

  • name or flags: 參數名

參數有兩種形式,即可選參數和位置參數。位置參數沒有字首,而可選參數需要加字首(預設為’-‘)

>>> parser.add_argument('bar')  # 添加位置參數
>>> parser.add_argument('-f', '--foo')  # 添加可選參數           

複制

  • action: 預設為 store

store_const,表示參數為固定值,該固定值存放在 const 中:

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--foo', action='store_const', const=42)
>>> parser.parse_args('--foo'.split())
Namespace(foo=42)           

複制

store_true和store_false,值存為 True 或 False

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--foo', action='store_true')
>>> parser.add_argument('--bar', action='store_false')
>>> parser.add_argument('--baz', action='store_false')
>>> parser.parse_args('--foo --bar'.split())
Namespace(bar=False, baz=True, foo=True)           

複制

append,存為清單

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--foo', action='append')
>>> parser.parse_args('--foo 1 --foo 2'.split())
Namespace(foo=['1', '2'])           

複制

append_const,存為清單,會根據 const 關鍵參數進行添加:

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--str', dest='types', action='append_const', const=str)
>>> parser.add_argument('--int', dest='types', action='append_const', const=int)
>>> parser.parse_args('--str --int'.split())
Namespace(types=[<type 'str'>, <type 'int'>])           

複制

count,統計參數出現的次數

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--verbose', '-v', action='count')
>>> parser.parse_args('-vvv'.split())
Namespace(verbose=3)           

複制

version,版本資訊

>>> import argparse
>>> parser = argparse.ArgumentParser(prog='PROG')
>>> parser.add_argument('--version', action='version', version='%(prog)s 2.0')
>>> parser.parse_args(['--version'])
PROG 2.0           

複制

  • nargs:,參數的數量

值可以為整數N(N個),*(任意多個),+(一個或更多),?

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--foo', nargs='*')
>>> parser.add_argument('--bar', nargs='*')
>>> parser.add_argument('baz', nargs='*')
>>> parser.parse_args('a b --foo x y --bar 1 2'.split())
Namespace(bar=['1', '2'], baz=['a', 'b'], foo=['x', 'y'])           

複制

如果值為?時,首先從指令行獲得參數,若沒有則從const獲得,然後從default獲得:

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--foo', nargs='?', const='c', default='d')
>>> parser.add_argument('bar', nargs='?', default='d')
>>> parser.parse_args('XX --foo YY'.split())
Namespace(bar='XX', foo='YY')
>>> parser.parse_args('XX --foo'.split())
Namespace(bar='XX', foo='c')
>>> parser.parse_args(''.split())
Namespace(bar='d', foo='d')           

複制

更常用的情況是允許參數為檔案

>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('infile', nargs='?', type=argparse.FileType('r'),
...                     default=sys.stdin)
>>> parser.add_argument('outfile', nargs='?', type=argparse.FileType('w'),
...                     default=sys.stdout)
>>> parser.parse_args(['input.txt', 'output.txt'])
Namespace(infile=<open file 'input.txt', mode 'r' at 0x...>,
          outfile=<open file 'output.txt', mode 'w' at 0x...>)
>>> parser.parse_args([])
Namespace(infile=<open file '<stdin>', mode 'r' at 0x...>,
          outfile=<open file '<stdout>', mode 'w' at 0x...>)           

複制

  • choices: 可供選擇的值
>>> parser = argparse.ArgumentParser(prog='doors.py')
>>> parser.add_argument('door', type=int, choices=range(1, 4))
>>> print(parser.parse_args(['3']))
Namespace(door=3)
>>> parser.parse_args(['4'])
usage: doors.py [-h] {1,2,3}
doors.py: error: argument door: invalid choice: 4 (choose from 1, 2, 3)           

複制

  • metavar: 用于 help 資訊輸出中
>>> parser.add_argument('str',nargs='*',metavar='AAA')
>>> parser.print_help()
usage: [-h] [AAA [AAA ...]]

positional arguments:
  AAA

optional arguments:
  -h, --help  show this help message and exit           

複制

  • dest: 可作為參數名,如果沒有指定該參數則預設為選項名去掉字首後作為參數名,對于位置參數無效
>>> parser = argparse.ArgumentParser()
>>> parser.add_argument('--foo', dest='bar')
>>> parser.parse_args('--foo XXX'.split())
Namespace(bar='XXX')           

複制

  • const: 儲存一個常量
  • default: 預設值
  • type: 參數類型
  • required: 是否必選,隻針對可選參數,對位置參數無效
  • help: help 資訊

解析參數

要解析參數則需要用 ArgumentParser 對象的 parse_args() 方法,該方法運作會用’-‘來認證可選參數,剩下的即為位置參數。該方法傳回一個 Namespace 對象,參數值通過屬性的方式通路,也可以用内建的 vars() 函數轉換為字典。

示例:

>>> parser = argparse.ArgumentParser(prog="PROG")
>>> parser.add_argument("-f", "--foo")
_StoreAction(option_strings=['-f', '--foo'], dest='foo', nargs=None, const=None, default=None, type=None, choices=None, help=None, metavar=None)
>>> parser.add_argument("bar")
_StoreAction(option_strings=[], dest='bar', nargs=None, const=None, default=None, type=None, choices=None, help=None, metavar=None)
>>> parser.parse_args(['BAR'])
Namespace(bar='BAR', foo=None)
>>> options = parser.parse_args(['BAR', '--foo', 'FOO'])
>>> vars(options)
{'foo': 'FOO', 'bar': 'BAR'}
>>> parser.parse_args(['--foo', 'FOO'])
usage: PROG [-h] [-f FOO] bar
PROG: error: too few arguments           

複制

參數的幾種寫法

  • 最常見的空格分開:
>>> parser = argparse.ArgumentParser(prog='PROG')
>>> parser.add_argument('-x')
>>> parser.add_argument('--foo')
>>> parser.parse_args('-x X'.split())
Namespace(foo=None, x='X')
>>> parser.parse_args('--foo FOO'.split())
Namespace(foo='FOO', x=None)           

複制

  • 長選項用 ‘=’ 分開
>>> parser.parse_args('--foo=FOO'.split())
Namespace(foo='FOO', x=None)           

複制

  • 短選項可以寫在一起:
>>> parser.parse_args('-xX'.split())
Namespace(foo=None, x='X')           

複制

使用示例

編寫一個腳本 main.py,使用方式如下:

main.py -u http://www.sohu.com -d ‘a=1,b=2,c=3’ -o /tmp/index.html

功能要求:打開 -u 指定的頁面,将頁面中所有的連結後面增加參數 a=1&b=2&c=3(需要考慮連結中已經存在指定的參數的問題), 然後儲存到 -o 指定的檔案中。

示例代碼:

import os
import argparse
from pyquery import PyQuery as pq

def extract_url_from_web(web_url):
    doc = pq(url=web_url)
    urls = []
    for a in doc('a'):
        a = pq(a)
        href = a.attr("href")
        if href:
            urls.append(href)

    return urls

def add_query_for_url(url, query):
    query = query.replace(',', '&')
    return url.replace('?', '?' + query + '&') if '?' in url else url + '?' + query

def main(url, query, outfile):
    with open(os.path.abspath(outfile), 'w') as f:
        for item in extract_url_from_web(url):
            newurl = add_query_for_url(item, query)
            f.write(newurl+'\n')
        pass

# Script starts from here

if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("-u", dest="url", type=str)
    parser.add_argument("-d", dest="query", type=str)
    parser.add_argument("-o", dest="outfile", type=str)

    options = parser.parse_args()
    main(**vars(options))           

複制