python之DataFrame写excel合并单元格_python dataframe合并单元格-程序员宅基地

技术标签： python合并单元格 python合并Excel单元格 pandas合并单元格 excel合并单元格 python学习笔记

在工作中经常遇到需要将数据输出到excel，且需要对其中一些单元格进行合并，比如如下表表格，需要根据A列的值，合并B、C列的对应单元格

pandas中的to_excel方法只能对索引进行合并，而xlsxwriter中，虽然提供有merge_range方法，但是这只是一个和基础的方法，每次都需要编写繁琐的测试才能最终调好，而且不能很好的重用。所以想自己写一个方法，结合dataframe和merge_range。大概思路是：
1、定义一个MY_DataFrame类，继承DataFrame类，这样能很好的利用pandas的很多特性，而不用自己重新组织数据结构。
2、定义一个my_mergewr_excel方法，参数分别为：输出excel的路径、用于判断是否需要合并的key_cols列表、用于指明哪些列上的单元格需要被合并的列表
3、将MY_DataFrame封装为一个My_Module模块，以备重用。

合并的算法如下：
1、根据给定参数的【关键列】，进行分组计数和排序，添加CN和RN两个辅助列
2、判断CN大于1的，该分组需要合并，否则该分组（行）无需合并（CN=1说明这个分组数据行是唯一的，无需合并）
3、对应需要合并的分组，判断当前列是不是在给定参数【合并列】中，是则用合并写excel单元格，否则就是普通的写excel单元格。
4、在需要合并的列中，如果对于的RN=1则调用merge_range，一次性写想下写CN个单元格，如果RN>1则跳过该单元格，因为在RN=1的时候，已经合并写了该单元格，若再重复调用erge_range，打开excel文档时会报错。
用图解释如下：

具体代码如下：

# -*- coding: utf-8 -*-
"""
Created on 20170301

@author: ARK-Z
"""
import xlsxwriter


import pandas as pd

class My_DataFrame(pd.DataFrame):
    def __init__(self, data=None, index=None, columns=None, dtype=None, copy=False):
        pd.DataFrame.__init__(self, data, index, columns, dtype, copy)

    def my_mergewr_excel(self,path,key_cols=[],merge_cols=[]):
        # sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True):
        self_copy=My_DataFrame(self,copy=True)
        line_cn=self_copy.index.size
        cols=list(self_copy.columns.values)
        if all([v in cols for i,v in enumerate(key_cols)])==False:     #校验key_cols中各元素 是否都包含与对象的列
            print("key_cols is not completely include object's columns")
            return False
        if all([v in cols for i,v in enumerate(merge_cols)])==False:  #校验merge_cols中各元素 是否都包含与对象的列
            print("merge_cols is not completely include object's columns")
            return False    

        wb2007 = xlsxwriter.Workbook(path)
        worksheet2007 = wb2007.add_worksheet()
        format_top = wb2007.add_format({'border':1,'bold':True,'text_wrap':True})
        format_other = wb2007.add_format({'border':1,'valign':'vcenter'})
        for i,value in enumerate(cols):  #写表头
            #print(value)
            worksheet2007.write(0,i,value,format_top)
        
        #merge_cols=['B','A','C']
        #key_cols=['A','B']
        if key_cols ==[]:   #如果key_cols 参数不传值，则无需合并
            self_copy['RN']=1
            self_copy['CN']=1
        else:
            self_copy['RN']=self_copy.groupby(key_cols,as_index=False).rank(method='first').ix[:,0] #以key_cols作为是否合并的依据
            self_copy['CN']=self_copy.groupby(key_cols,as_index=False).rank(method='max').ix[:,0]
        #print(self)
        for i in range(line_cn):
            if self_copy.ix[i,'CN']>1:
                #print('该行有需要合并的单元格')
                for j,col in enumerate(cols):
                    #print(self_copy.ix[i,col])
                    if col in (merge_cols):   #哪些列需要合并
                        if self_copy.ix[i,'RN']==1:  #合并写第一个单元格，下一个第一个将不再写
                            worksheet2007.merge_range(i+1,j,i+int(self_copy.ix[i,'CN']),j, self_copy.ix[i,col],format_other) ##合并单元格，根据LINE_SET[7]判断需要合并几个
                            #worksheet2007.write(i+1,j,df.ix[i,col])
                        else:
                            pass
                        #worksheet2007.write(i+1,j,df.ix[i,j])
                    else:
                        worksheet2007.write(i+1,j,self_copy.ix[i,col],format_other)
                    #print(',')
            else:
                #print('该行无需要合并的单元格')
                for j,col in enumerate(cols):
                    #print(df.ix[i,col])
                    worksheet2007.write(i+1,j,self_copy.ix[i,col],format_other)
                
                
        wb2007.close()
        self_copy.drop('CN', axis=1)
        self_copy.drop('RN', axis=1)

调用代码：

import My_Module

DF=My_DataFrame({'A':[1,2,2,2,3,3],'B':[1,1,1,1,1,1],'C':[1,1,1,1,1,1],'D':[1,1,1,1,1,1]})

DF
Out[120]: 
   A  B  C  D
0  1  1  1  1
1  2  1  1  1
2  2  1  1  1
3  2  1  1  1
4  3  1  1  1
5  3  1  1  1

DF.my_mergewr_excel('000_2.xlsx',['A'],['B','C'])

效果如下：

也可以设置合并A、B列：

DF.my_mergewr_excel('000_2.xlsx',['A'],['A','B'])

效果如下：

本文链接：https://blog.csdn.net/cakecc2008/article/details/59203980

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

LeetCode刷题总结（C语言版）_leetcode c语言-程序员宅基地

文章浏览阅读5.4k次，点赞6次，收藏73次。编程总结每每刷完一道题后，其思想和精妙之处没有地方记录，本篇博客用以记录刷题过程中的遇到的算法和技巧001）两数之和给定一个整数数组 nums 和一个目标值 target，请你在该数组中找出和为目标值的两个整数。你可以假设每种输入只会对应一个答案。但是，你不能重复利用这个数组中同样的元素。给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] ..._leetcode c语言

小程序开发者工具正常显示，但是真机调试和真机中安卓加载正常ios加载首页失败，首页的请求返回204_苹果 sec-fetch-dest-程序员宅基地

文章浏览阅读125次。检查请求头中的’sec-fetch-dest’: ‘document’ ，是否进行了特殊处理（node层）_苹果 sec-fetch-dest

ansible 批量安装zabbix-agent-程序员宅基地

文章浏览阅读321次。服务器初始化（这是在建立在新的服务器基础上做的初始化）关闭防火墙、selinux，添加epel常用源，安装常用工具、添加普通用户并禁止root1、服务器批量初始化[root@fwd ansible]# cat init.yml 系统初始化脚本---- hosts: all tasks: - name: disable selinux、firew..._ansible批量安装zabbix-agent

java日志系统--log4j配置解析过程，源码分析_log4j 源码分析读取配置-程序员宅基地

文章浏览阅读1.4w次，点赞3次，收藏2次。Logger.getLogger(Test.class);从getLogger开始，就启动了log4j的整个工作流程，通过调用LogManager获取logger实例return LogManager.getLogger(clazz.getName());LogManager类里面有个静态块static{}，【初始化重要信息】【root logger】，做一些配置，其中url = Loader.ge_log4j 源码分析读取配置

心灵震撼《一个8岁女孩的遗书》看完能有几人不哭…-程序员宅基地

文章浏览阅读533次。无奈的父亲有一个美丽的小女孩，她的名字叫余艳，她有一双亮晶晶的大眼睛她有一颗透明的童心.她是一个孤儿，她在这个世界上只活了8年，她留在这个世界上最后的一句话是“我来过，我很乖”她希望死在秋天，纤瘦的身体就像一朵花自然开谢的过程.在遍地黄花堆积，落叶空中旋舞的时候，她会看见横空远行的雁儿们.她自愿放弃治疗，把全世界华人捐给她的54万分成了7份，把生命当成希望的蛋糕分给了7个正徘徊在生死线上的小

C++音视频开发从放弃到入门（基于FFmpeg+OpenCV）-程序员宅基地

文章浏览阅读1.1w次，点赞12次，收藏88次。音视频开发一定要学C++吗？答案是肯定的。虽然其它语言也能搞音视频开发，甚至使用起来更简单，但“语言越高级，离真相就越远”，当你的功能需求日益增多，程序的性能需求越来越迫切，你想进一步了解程序实现的细节时，使用其它语言往往会面临“无法解决”的困境，最后不得不使用C++来解决问题，我们何不从一开始就使用C++呢？FFmpeg及OpenCV是开源、跨平台的音视频开发SDK，搞音视频开发基本都需要用到它。_c++音视频开发

随便推点

EV/HEV中的牵引逆变器驱动优化-程序员宅基地

文章浏览阅读1.6k次，点赞42次，收藏35次。什么是牵引逆变器？从本质上讲，牵引逆变器是电动汽车动力系统中的一个子系统，它从电池中获取高电压，并将其转换为交流电压——因此被称为逆变器——并基本上为电机供电。它控制电机速度和扭矩，直接影响效率和可靠性，这正成为牵引逆变器设计的设计挑战。此图片来源于网络如今的电动汽车至少有一个牵引逆变器。有些型号实际上不止一个。一个在前轴上，一个在后轴上。甚至一些高端车型实际上每个车轮都有一个牵引逆变器。因此，效率和可靠性非常重要。所以，从逆变器和电机控制的市场趋势来看——从技术趋势来看，我们看到了功率水平的提高。

Ubuntu之apt命令_ubuntu18.04 atp命令使用技巧-程序员宅基地

文章浏览阅读134次。简介apt-cache和apt-get是apt包的管理工具，他们根据/etc/apt/sources.list里的软件源地址列表搜索目标软件、并通过维护本地软件包列表来安装和卸载软件。查看本机是否安装软件：whereis package_name 或者which package_name1.搜索软件sudo apt-cache search pa..._ubuntu18.04 atp命令使用技巧

查询Dynamics 365的Audit History_dynamics 审核历史记录如何查询-程序员宅基地

文章浏览阅读150次。【代码】查询Dynamics 365的Audit History。_dynamics 审核历史记录如何查询

python yield函数的用法-程序员宅基地

文章浏览阅读1.3w次，点赞15次，收藏66次。什么是yield函数?yield函数是python里面的关键字,带有yield的函数相当于一个生成器generator.当你使用一个yield的时候，对应的函数就是一个生成器在python里面类似于return函数,他们主要的区别就是:遇到return会直接返回值,不会执行接下来的语句.但是yield并不是,在本次迭代返回之后,yield函数在下一次迭代时，从上一次迭代遇到的yield后面的代码(下一行)开始执行下面是案例分析:案例一:def gen_generator(): yiel_yield函数

【QT笔记】QFile读文件问题_qfileread后指针会移动吗-程序员宅基地

文章浏览阅读917次。如果不用seek(0)的话，默认是自己会把读取文件的指针后移的，不用手动后移；_qfileread后指针会移动吗

dw8051基本测试示例_dw8051 part1-程序员宅基地

文章浏览阅读2.5k次。整理了网上一份简单的dw8051测试示例，共享到云盘：http://pan.baidu.com/s/1bnu9lZT1.目录如下：---dut ---rtl：DW8051的core文件 ---model：ROM和RAM的model文件---testbench ---rtl.f：filelist文件 ---test_top.v：仿真的top_dw8051 part1