Python Faker的使用(1)：基础使用方法与函数速查

在软件需求、开发、测试过程中，有时候需要使用一些测试数据，针对这种情况，我们一般要么使用已有的系统数据，要么需要手动制造一些数据。

由于现在的业务系统数据多种多样，千变万化。在手动制造数据的过程中，可能需要花费大量精力和工作量，此项工作既繁复又容易出错，而且，部分数据的手造工作无法保障：比如UUID类数据、MD5、SHA加密类数据等。

现在好了，有一个Python包能够协助你完成这方面的工作。

Faker首页

1.什么是Faker

Faker是一个Python包，开源的GITHUB项目，主要用来创建伪数据，使用Faker包，无需再手动生成或者手写随机数来生成数据，只需要调用Faker提供的方法，即可完成数据的生成。

项目地址：https://github.com/joke2k/faker

2.安装Faker

方法一：

pip install faker

方法二：

通过上方提供的github地址，来下载编译安装。

3.Faker的使用

3.1、Faker命令

（该段落参考自：MA木易YA 的相关简书文章）

安装好了之后，可以在CMD或者Shell中通过faker命令来调试，具体如下：

faker [-h] [--version] [-o output] [-l {bg_BG,cs_CZ,...,zh_CN,zh_TW}] [-r REPEAT] [-s SEP] [-i {package.containing.custom_provider otherpkg.containing.custom_provider}] [fake] [fake argument [fake argument ...]]

参数说明：

faker：是安装在您的环境时，脚本，在发展中可以使用，而不是python -m faker

      -h，--help：显示帮助消息

      --version：显示程序的版本号

      -o FILENAME：重定向输出到指定的文件名

      -l {bg_BG,cs_CZ,...,zh_CN,zh_TW}：允许使用本地化的供应商

        -r REPEAT：将生成的输出的特定数量的

      -s SEP：将生成的每个产生的输出后的指定的分隔

      -i {my.custom_provider other.custom_provider}：使用其他自定义供应商名单。请注意，是包含您提供一流的，而不是定制的Provider类本身包的导入路径。

      fake：是产生一个输出，该假的名称，如 name，address或text

      [fake argument ...]：可选参数传递到假（例如，简档假取的逗号分隔的字段名作为第一个参数的可选列表）

faker命令

3.2、在Python中使用

引用包：

from faker import Faker

初始化：

f=Faker(locale='zh_CN')

关于初始化参数locale：为生成数据的文化选项，默认为en_US，只有使用了相关文化，才能生成相对应的随机信息（比如：名字，地址，邮编，城市，省份等）

可选择的文化信息：

ar_EG - Arabic (Egypt) 阿拉伯语 - 埃及

ar_PS - Arabic (Palestine)    阿拉伯语 - 巴勒斯坦

ar_SA - Arabic (Saudi Arabia)    阿拉伯语 - 沙特阿拉伯

bg_BG - Bulgarian 保加利亚语 - 保加利亚

cs_CZ - Czech 捷克语 - 捷克

de_DE - German 德语 - 德国

dk_DK - Danish 丹麦语 - 丹麦

el_GR - Greek 希腊语 - 希腊

en_AU - English (Australia) 英语 - 澳大利亚

en_CA - English (Canada) 英语 - 加拿大

en_GB - English (Great Britain) 英语 - 英国

en_US - English (United States) 英语 - 美国

es_ES - Spanish (Spain) 西班牙语 - 西班牙

es_MX - Spanish (Mexico) 西班牙语- 墨西哥

et_EE - Estonian 爱沙尼亚语 - 爱沙尼亚

fa_IR - Persian (Iran) 波斯语 - 伊朗

fi_FI - Finnish 芬兰语 - 芬兰

fr_FR - French 法语 - 法国

hi_IN - Hindi 印地语 - 印度

hr_HR - Croatian 克罗地亚语 - 克罗地亚

hu_HU - Hungarian 匈牙利语 - 匈牙利

hy_AM - Armenian 亚美尼亚语 - 亚美尼亚

it_IT - Italian 意大利语 - 意大利

ja_JP - Japanese 日语 - 日本

ko_KR - Korean 朝鲜语 - 韩国

ka_GE - Georgian (Georgia) 格鲁吉亚语 - 格鲁吉亚

lt_LT - Lithuanian 立陶宛语 - 立陶宛

lv_LV - Latvian    拉脱维亚语 - 拉脱维亚

ne_NP - Nepali    尼泊尔语 - 尼泊尔

nl_NL - Dutch (Netherlands) 德语 - 荷兰

no_NO - Norwegian 挪威语 - 挪威

pl_PL - Polish 波兰语 - 波兰

pt_BR - Portuguese (Brazil) 葡萄牙语 - 巴西

pt_PT - Portuguese (Portugal) 葡萄牙语 - 葡萄牙

ru_RU - Russian 俄语 - 俄国

sl_SI - Slovene 斯诺文尼亚语 - 斯诺文尼亚

sv_SE - Swedish 瑞典语 - 瑞典

tr_TR - Turkish 土耳其语 - 土耳其

uk_UA - Ukrainian 乌克兰语 - 乌克兰

zh_CN - Chinese (China) （简体中文）

zh_TW - Chinese (Taiwan) （繁体中文）

然后即可使用系统提供的方法：

f.name() #生成姓名

f.address() #生成地址

一段简单的测试代码

4.常用方法一览

以下内容以ZH-CN和ZH-TW包为准

4.1.地理信息类

city_suffix()：市，县

country()：国家

country_code()：国家编码

district()：区

geo_coordinate()：地理坐标

latitude()：地理坐标(纬度)

longitude()：地理坐标(经度)

postcode()：邮编

province()：省份 (zh_TW没有此方法)

address()：详细地址

street_address()：街道地址

street_name()：街道名

street_suffix()：街、路

4.2、基础信息类

ssn()：生成身份证号

bs()：随机公司服务名

company()：随机公司名（长）

company_prefix()：随机公司名（短）

company_suffix()：公司性质

credit_card_expire()：随机信用卡到期日

credit_card_full()：生成完整信用卡信息

credit_card_number()：信用卡号

credit_card_provider()：信用卡类型

credit_card_security_code()：信用卡安全码

job()：随机职位

first_name()：

first_name_female()：女性名

first_name_male()：男性名

first_romanized_name()：罗马名

last_name()：

last_name_female()：女姓

last_name_male()：男姓

last_romanized_name()：

name()：随机生成全名

name_female()：男性全名

name_male()：女性全名

romanized_name()：罗马名

msisdn()：移动台国际用户识别码，即移动用户的ISDN号码

phone_number()：随机生成手机号

phonenumber_prefix()：随机生成手机号段

4.3、计算机基础、Internet信息类

4.3.1、个人账户信息类

ascii_company_email()：随机ASCII公司邮箱名

ascii_email()：随机ASCII邮箱

ascii_free_email()：

ascii_safe_email()：

company_email()：

email()：

free_email()：

free_email_domain()：

safe_email()：安全邮箱

4.3.2、网络基础信息类

domain_name()：生成域名

domain_word()：域词(即，不包含后缀)

ipv4()：随机IP4地址

ipv6()：随机IP6地址

mac_address()：随机MAC地址

tld()：网址域名后缀(.com,.net.cn,等等，不包括.)

uri()：随机URI地址

uri_extension()：网址文件后缀

uri_page()：网址文件（不包含后缀）

uri_path()：网址文件路径（不包含文件名）

url()：随机URL地址

user_name()：随机用户名

image_url()：随机URL地址

4.3.3、浏览器信息类

chrome()：随机生成Chrome的浏览器user_agent信息

firefox()：随机生成FireFox的浏览器user_agent信息

internet_explorer()：随机生成IE的浏览器user_agent信息

opera()：随机生成Opera的浏览器user_agent信息

safari()：随机生成Safari的浏览器user_agent信息

linux_platform_token()：随机Linux信息

user_agent()：随机user_agent信息

随机生成的user_agent

4.3.4、文件信息类

file_extension()：随机文件扩展名

file_name()：随机文件名（包含扩展名，不包含路径）

file_path()：随机文件路径（包含文件名，扩展名）

mime_type()：随机mime Type

4.4、数字类

numerify()：三位随机数字

random_digit()：0~9随机数

random_digit_not_null()：1~9的随机数

random_int()：随机数字，默认0~9999，可以通过设置min,max来设置

random_number()：随机数字，参数digits设置生成的数字位数

pyfloat()：left_digits=5 #生成的整数位数,

right_digits=2 #生成的小数位数,

positive=True #是否只有正数

pyint()：随机Int数字（参考random_int()参数）

pydecimal()：随机Decimal数字（参考pyfloat参数）

4.5.文本、加密类

pystr()：随机字符串

random_element()：随机字母

random_letter()：随机字母

paragraph()：随机生成一个段落

paragraphs()：随机生成多个段落，通过参数nb来控制段落数，返回数组

sentence()：随机生成一句话

sentences()：随机生成多句话，与段落类似

text()：随机生成一篇文章（不要幻想着人工智能了，至今没完全看懂一句话是什么意思）

word()：随机生成词语

words()：随机生成多个词语，用法与段落，句子，类似

binary()：随机生成二进制编码

boolean()：True/False

language_code()：随机生成两位语言编码

locale()：随机生成语言/国际信息

md5()：随机生成MD5

null_boolean()：NULL/True/False

password()：随机生成密码,可选参数：length：密码长度；special_chars：是否能使用特殊字符；digits：是否包含数字；upper_case：是否包含大写字母；lower_case：是否包含小写字母

sha1()：随机SHA1

sha256()：随机SHA256

uuid4()：随机UUID

4.6.时间信息类

am_pm()：AM/PM

century()：随机世纪

date()：随机日期

date_between()：随机生成指定范围内日期，参数：start_date，end_date取值：具体日期或者today,-30d,-30y类似

date_between_dates()：随机生成指定范围内日期，用法同上

date_object()：随机生产从1970-1-1到指定日期的随机日期。

date_this_month()：

date_this_year()：

date_time()：随机生成指定时间（1970年1月1日至今）

date_time_ad()：生成公元1年到现在的随机时间

date_time_between()：用法同dates

future_date()：未来日期

future_datetime()：未来时间

month()：随机月份

month_name()：随机月份（英文）

past_date()：随机生成已经过去的日期

past_datetime()：随机生成已经过去的时间

time()：随机24小时时间

timedelta()：随机获取时间差

time_object()：随机24小时时间，time对象

time_series()：随机TimeSeries对象

timezone()：随机时区

unix_time()：随机Unix时间

year()：随机年份

4.7、集合信息类

profile()：随机生成档案信息

simple_profile()：随机生成简单档案信息

档案信息和简档信息

#以下方法皆为随机集合类型

pyiterable()

pylist()

pyset()

pystruct()

pytuple()

pydict()

4.8、其他类别

currency_code()：货币编码

color_name()：随机颜色名

hex_color()：随机HEX颜色

rgb_color()：随机RGB颜色

safe_color_name()：随机安全色名

safe_hex_color()：随机安全HEX颜色

isbn10()：随机ISBN（10位）

isbn13()：随机ISBN（13位）

lexify()：替换所有问号（“？”）带有随机字母的事件。

5.使用中遇到的问题

元旦前发布的这篇文章，由于工作需要，元旦期间创建伪数据的过程中，发现一个很有意思的问题。不同的文化类之间，方法是偶然有区别的。

比如，在中文(zh_CN)中的方法，district()#获取区 province()#获取省的方法，在有些包里是没有的，这需要根据所使用文化类的国家特制来。

日文包没有province方法

比如，中国的一级行政单位，是省，直辖市，自治区；而日本的一级行政单位，是都、道、府、县。所以，日文包(ja_JP)中，就没有相应的province(),district(),取而代之的是prefecture(),town()；在美国，一级行政单位又是洲，所以，在美国英语包(en_US)中，取而代之的是state()；

总之，在使用不同Fake类之前，最好对所生成文化的国家、地区信息做初步的了解，建议先浏览其对应的类文件的成员。

最后编辑于：2019.11.07 18:24:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342

Python Faker的使用(1)：基础使用方法与函数速查

推荐阅读更多精彩内容