great_tables，一个实用的 Python 库！

Python

大家好，今天为大家分享一个实用的 Python 库 - great_tables。

Github地址：https://github.com/posit-dev/great-tables

Python的great_tables库是一个专门用于高效数据表处理和分析的工具，它提供了丰富的功能来简化表格数据的操作。该库特别适合数据分析师和开发者，用于处理和分析大型数据集，支持多种数据操作，包括数据清洗、转换、聚合等。

安装

安装great_tables库可以通过Python的包管理器pip轻松完成：

pip install great_tables

这条命令将从Python包索引下载并安装great_tables库及其依赖项。

特性

易用的数据操作接口：提供类似于pandas的API，使数据操作直观易懂。
高效的数据处理：优化的底层实现保证了即使是大型数据集也能快速处理。
支持多种数据源：能够读取和写入多种格式的数据文件，如CSV、Excel等。
丰富的数据转换功能：支持广泛的数据转换操作，包括列操作、类型转换、数据规范化等。

基本功能

great_tables库提供了一系列基本功能，这些功能覆盖了数据表的加载、查看、筛选、排序、修改和保存等常用操作。

数据加载和查看

great_tables能够加载各种格式的数据，并提供便捷的方法查看数据内容。

from great_tables import Table

# 加载CSV文件
data = Table.read_csv('employees.csv')

# 查看前几行数据
print(data.head())

# 查看数据的基本信息（行数、列数、列名等）
print(data.info())

数据筛选

通过简单的语法，可以筛选出符合特定条件的数据行。

# 筛选年龄大于30岁的员工
older_employees = data[data['age'] > 30]
print(older_employees)

# 同时使用多个条件
high_earning_older_employees = data[(data['age'] > 30) & (data['salary'] > 50000)]
print(high_earning_older_employees)

数据排序

支持按一个或多个列排序数据，可以指定升序或降序。

# 按年龄升序排序
sorted_by_age = data.sort('age')

# 按薪水降序排序
sorted_by_salary = data.sort('salary', ascending=False)
print(sorted_by_salary)

数据列操作

对数据列进行操作，如添加新列、删除列、修改列名等。

# 添加新列
data['full_name'] = data['first_name'] + ' ' + data['last_name']

# 删除列
data = data.drop_columns(['first_name', 'last_name'])

# 修改列名
data = data.rename_columns({'full_name': 'name'})
print(data)

数据保存

处理完数据后，可以将其保存到各种格式的文件中，如CSV、Excel等。

# 保存为CSV
data.to_csv('updated_employees.csv')

# 保存为Excel文件
data.to_excel('updated_employees.xlsx')

高级功能

great_tables库除了提供基本的数据操作功能外，还包括多种高级功能，这些功能使得进行复杂数据分析和处理成为可能。

数据聚合和分组

great_tables支持强大的数据聚合功能，可以进行分组统计等复杂操作。

from great_tables import Table

# 加载数据
data = Table.read_csv('sales_data.csv')

# 分组并计算每个部门的平均销售额
avg_sales_by_department = data.groupby('department').agg({'sales': 'mean'})

# 显示结果
print(avg_sales_by_department)

数据合并和连接

合并和连接是处理多源数据集时非常关键的操作，great_tables提供了灵活的方式来合并数据。

# 加载另一数据集
inventory_data = Table.read_csv('inventory_data.csv')

# 使用外键将销售数据与库存数据合并
merged_data = data.merge(inventory_data, on='product_id', how='inner')

# 显示合并后的数据
print(merged_data)

高级过滤和查询

对数据进行高级过滤和查询，允许使用复杂的逻辑条件，非常适合于深入的数据分析。

# 高级过滤：选择销售额大于平均销售额的记录
average_sales = data['sales'].mean()
high_sales_data = data[data['sales'] > average_sales]

# 显示高销售额数据
print(high_sales_data)

数据透视表

数据透视表是一种常见的数据汇总工具，用于将数据表重新组织和总结，great_tables可以简单地创建数据透视表。

# 创建数据透视表，了解不同产品类别在不同地区的销售总额
pivot_table = data.pivot_table(index='category', columns='region', values='sales', aggfunc='sum')

# 显示数据透视表
print(pivot_table)

多重索引和层次化索引

great_tables支持多重索引，这允许用户在一个表中创建多层次的数据结构，方便进行复杂的分组分析。

# 设置多重索引
data.set_index(['department', 'region'], inplace=True)

# 访问具有特定部门和区域的数据
specific_data = data.loc[('Marketing', 'North')]
print(specific_data)

总结

Python的great_tables库是一个强大的数据处理和分析工具，设计用于帮助开发者和数据分析师高效地处理和分析表格数据。它提供了从基本到高级的广泛数据操作功能，如数据加载、筛选、排序、聚合以及更复杂的合并、连接和数据透视表等。通过简洁的API和优化的底层实现，great_tables能够轻松应对大规模数据集，提高数据处理的速度和精确性。无论是在商业智能、科研分析还是日常数据管理任务中，great_tables都表现出色，使得数据探索、分析和报告更加直接和高效。这些特性使其成为处理复杂数据需求的理想选择。

Python学习路线

ipengtao.com

Python基础知识.png

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342