python处理表格的第三方库

发布时间: 2023-11-27 18:02 阅读: 文章来源:1MUMB103600PS

前记:这是分享和记录我个人自动化办公技能的一系列文章,意在让职场的小伙伴们看后能够有所帮助和成长。我们都不是专业的程序员,文中尽量使用通俗易懂的语言讲解,即使没有任何编程基础也能够明白。每天花5-10分钟,坚持练习和执行,让你的职场办公能力突飞猛进!

记得自己刚有意向想学一门编程技术的时候,总是在为想学哪一门“最好的”语言纠结,甚至还上问答社区和贴吧发文问过一些前辈。其中一个前辈的回答很中肯,让我印象很深刻,他说:编程语言本身没有什么最好和不好,只有最合适和不合适。计算机的任何一门语言,只要它存在,就有它擅长的应用领域。我们只能审视自己究竟想要在哪一个领域使用,然后去选择对应的语言,针对性的学习。

看了这番回答,突然觉得醍醐灌顶。像我这样主业并不是程序员的研发工程师,编程只是作为辅助我们工作的比那里工具,当然是哪个快速便捷学哪个。在继续追问下,前辈给出的建议是学python。其中一个极其重要的理由就是,python有其它语言无法比拟的“轮子优势”。什么是“轮子优势”?就是这门语言已经有众多的先驱使用者开发了一系列通用的代码,已经打包好放在那里,等你遇到与他们相似的应用问题时,你随时可以自取使用。这些已经打包好的通用代码,就是第三方库,也就是前面说的“轮子”。编程中,“不要重复造轮子”,这是一个基本的常识。在python中,这样的“轮子”已经足够多,对不以成为程序员为目的而学习的新手是非常友好的一件事。

坐拥众多“轮胎”的新手

这里我们的主题是使用python自动化办公,接下来我会说明怎样安装第三方库,并且介绍几个想关的、比较常用的第三方库。

1.第三方库的安装

在windows系统中,按下你的win + R键,调出你的运行窗口,在打开一栏中输入cmd,按下回车,调出命令行窗口。

cmd命令行窗口

接着在命令行中直接输入pip install xxxx,然后点击回车,python就会自动寻找服务器下载安装文件并安装。这里的xxxx就是第三方库的名称,后面会介绍。这里要注意的是pip install xxxx命令是在cmd窗口中输入的,而不是在你的代码编辑器中。新手常常会将这串代码输到IDE的代码编辑器中,这是完全没有作用的。安装成功会显示下面的Successfully installed xxxx。

安装成功的显示

直接输入pip命令,python自动寻找的服务器都是境外的服务器,这样会导致下载速度极慢,还有可能出现下载失败的情况。这里给大家说明一个方法,让python使用国内的镜像服务器来下载,具体是这样的:在pip命令中加一个 -i 参数。如下面代码行所示:

#使用清华大学的镜像pip install -ihttps://pypi.tuna.tsinghua.edu.cn/simple/ xxxx#或者使用豆瓣的镜像pip install -i https://pypi.douban.com/simple/ xxxx

xxxx还是具体的第三方库名,与斜杠间有一个空格。这里推荐的是清华和豆瓣的国内镜像源,这样指定后,下载速度飞快,不会出现什么下载失败的问题。

2.通用处理——numpy和pandas

numpy是大名鼎鼎的科学计算库,这个库可用来存储和处理大型矩阵,有着不错的计算效率。现在所有的人工智能,大数据这些应用,只要涉及到数据计算的地方,绝对少不了numpy的身影。

矩阵计算

pandas是数据分析常用的库,它是基于numpy 的一种工具。pandas 纳入了大量其它库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,还提供了能使我们快速便捷地处理数据的函数和方法。值得一提的是,这个库的工具中集成了读写数据的接口,可以对接Excel表格,CSV,JSON,Pickle等数据类型。

3.可视化绘图——matplotlib

matplotlib 是一个 python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。

数据可视化

4.Excel处理——xlrd + xlwt + xlutils库

xlrd和xlwt是读写Excel表格的两个常用库。xlrd能够实现按sheet页读取表格中的内容,配合numpy,pandas库对表格数据进行处理。xlwt则可以新建一个Excel文件,将处理结果写入到这个文件中。xlutils是为了解决在已有的Excel文件中再追加写入数据的问题。

表格处理

5.Word处理——docx库

docx是word文件的后缀名,但是在python中,它是一个用于创建和更新微软Word文件的库。docx是一个很强大的库,可以创建docx文档,包含段落、分页符、表格、图片、标题、样式等等,基本上等于是用代码在操作word文档。

批量操作文档

6.数据库读写——pymysql

pymysql是基于ORM(对象关系映射)模型开发的用来连接MySQL数据库服务器的一个库。通过pymysql操作数据库不需要写SQL语句,用python语言就能够操作数据库的增删改查。

连接并操作数据库

本文这里只是对今后所要将的第三方库做了一次简要的汇总,让大家对自动办公所需的包有一个大概认识。具体每个库怎么使用,或者还会添加一些这里没介绍到的库,会在相应阶段的后面的文章中详细说明。本文内容就此告一段落,后面的文章咱们正式进入Excel的操作。

下期预告:python操作Excel表格

•••展开全文