本文介绍如何使用 tabulate 库将两个 Pandas DataFrame 垂直连接成一个表格,其中一个 DataFrame 包含数据,另一个 DataFrame 包含文本摘要。我们将展示两种方法:一种是手动设置摘要列的宽度,另一种是动态调整摘要列的宽度以匹配数据 DataFrame 的宽度。通过这些方法,你可以创建包含数据和摘要信息的清晰、易读的表格。
在数据分析和报告中,有时需要在表格中包含文本摘要,以便更好地解释数据。tabulate 库是一个强大的工具,可以将数据以各种格式打印成表格。本文将介绍如何使用 tabulate 库将包含数据和摘要信息的两个 Pandas DataFrame 垂直连接成一个表格。
安装 tabulate 库
首先,需要安装 tabulate 库。可以使用 pip 命令进行安装:
pip install tabulate
示例数据
假设我们有两个 Pandas DataFrame:df1 包含数据,df2 包含摘要。
import pandas as pd data1 = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Height': [165, 182, 177] } df1 = pd.DataFrame(data1) data2 = { 'Summary': ["Alice is the youngest", "Bob is the tallest"] } df2 = pd.DataFrame(data2)
方法一:手动设置摘要列的宽度
这种方法需要手动设置摘要列的宽度,使其足够容纳摘要文本。
import tabulate as t t.PRESERVE_WHITESPACE = True width1 = 10 # 设置数据列的宽度 width2 = width1 * df1.shape[1] + df1.shape[1]*2 # 设置摘要列的宽度,使其与数据列的总宽度匹配 str1 = t.tabulate(df1.applymap(f'{{:^{width1}}}'.format), list(df1), tablefmt='outline', stralign='center', numalign='center') str2 = t.tabulate(df2.applymap(f'{{:^{width2}}}'.format), df2.columns, tablefmt='outline', stralign='center', numalign='center') print(str1 + 'n' + 'n'.join(str2.splitlines()[1:]))
这段代码首先定义了数据列的宽度 width1,然后根据数据列的数量和宽度计算出摘要列的宽度 width2。接下来,使用 tabulate 函数将两个 DataFrame 转换为字符串,并使用 applymap 函数将每个单元格的内容居中对齐。最后,将两个字符串连接起来,并打印输出。
代码解释:
- t.PRESERVE_WHITESPACE = True: 保留空白字符,避免文本被截断。
- width1 = 10: 设置数据列的宽度为 10 个字符。
- width2 = width1 * df1.shape[1] + df1.shape[1]*2: 计算摘要列的宽度,使其等于数据列的总宽度加上列之间的分隔符宽度。
- df1.applymap(f'{{:^{width1}}}’.format): 将 df1 中的每个单元格的内容居中对齐,并设置宽度为 width1。
- t.tabulate(…): 将 DataFrame 转换为字符串,并使用 outline 格式。
- str1 + ‘n’ + ‘n’.join(str2.splitlines()[1:]): 将两个字符串连接起来,并删除摘要表格的第一行(标题行)。
方法二:动态调整摘要列的宽度
这种方法可以动态调整摘要列的宽度,使其与数据 DataFrame 的宽度匹配。
import tabulate as t t.PRESERVE_WHITESPACE = True str1 = t.tabulate(df1, list(df1), tablefmt='outline', stralign='center', numalign='center') H = str1.split('n', 1)[0] L = len(H)-H[1:].index('+')-5 str2 = t.tabulate(df2.applymap(f'{{:^{L}}}'.format), list(df2), tablefmt='outline', stralign='center', numalign='center') print(str1 + 'n' + 'n'.join(str2.splitlines()[1:]))
这段代码首先使用 tabulate 函数将数据 DataFrame 转换为字符串,然后计算出数据表格的宽度。接下来,使用 applymap 函数将摘要 DataFrame 中的每个单元格的内容居中对齐,并设置宽度为数据表格的宽度。最后,将两个字符串连接起来,并打印输出。
代码解释:
- str1 = t.tabulate(df1, list(df1), tablefmt=’outline’, stralign=’center’, numalign=’center’): 将数据 DataFrame 转换为字符串。
- H = str1.split(‘n’, 1)[0]: 获取数据表格的第一行(标题行)。
- L = len(H)-H[1:].index(‘+’)-5: 计算数据表格的宽度,并减去一些额外的字符。
- df2.applymap(f'{{:^{L}}}’.format): 将 df2 中的每个单元格的内容居中对齐,并设置宽度为 L。
注意事项
- tabulate 库提供了多种表格格式,可以使用 tablefmt 参数进行选择。
- 可以使用 stralign 和 numalign 参数设置字符串和数字的对齐方式。
- 如果摘要文本太长,可能会被截断。可以增加摘要列的宽度来避免这种情况。
总结
本文介绍了如何使用 tabulate 库将包含数据和摘要信息的两个 Pandas DataFrame 垂直连接成一个表格。通过手动设置摘要列的宽度或动态调整摘要列的宽度,可以创建包含数据和摘要信息的清晰、易读的表格。tabulate 库是一个强大的工具,可以帮助你更好地呈现数据。
评论(已关闭)
评论已关闭