这几天pandas学习总结。
发布于 4 个月前 作者 daimeitao 184 次浏览 来自 分享

Ⅰ.开始了解的时候要注意整体框架性。 1.开始走过的弯路 在这里学习之前也零零散散地了解过一些关于pandas的内容。主要是通过看国内地视频教程。在操作上始终下不了手。这里罗列下看国内大部分视频学习地弊端: ①学习效率太低,很多视频推出是为了卖钱,经常装 B而去撤一些无关的内容,经常啰嗦了一大段无关地内容。最后说地也是一些最基本的操作,比如pd.columns pd.index 之类的。如果通过正常渠道学习,几秒钟就搞定了。 ②主讲人的水平有限,经常会出现一些主讲人自己都讲不清的问题。说明他们自己也了解的不深。 现在觉得,第一步要做的是对pandas整体框架的了解,这个东西能干吗?这个东西的本质是什么?基于自己的需求,在学习把控上要注意些什么?也就是什么要先学,下一步要学什么?对于这些问题,官网的十分钟入门是很好的方式。

2.官网的十分钟入门 不知道官网的10minutes是标题党,还是本人实在太笨了。我花了两个多小时,具体的做法是自己先写。因为毕竟有有些操作和list/dict都是类似的。实在想不出来的,或者不愿意再想的就看下官方的操作。这样一个流程下来后,对于上面的几个问题,心中大体都有数了。

3.完成在github下载的两个练习 过往这个流程后,接下来脑子里也是乱得很,不知道下面该怎么做,感觉自己什么都会了,实际上是什么都不会。网上搜了下pandas的学习,大部分都是说看官方文档。 官方文档pdf下载下来有3000多页。还有说是要根据需求操作,可是我的短期需求,我自己也不清楚呀。差不多快放弃了的时候,github上搜索了两个排行最高的pandas练习系列。 很艰难的都跟着完成了。并且练成了两个jupyter操作习惯。

4.jupyter的操作技巧,增加学习效率 再跟练的操作的过程中会遇到各种各样的问题。但是本质上,无外乎就两种: 1.函数的参数是什么意思? 2.某个函数/方法的功能是什么? 以前的解决方法是: 1.查官方文档;效率比较低,你要打开网页,你还要搜索。 2.度娘;效率更低,网上低质量的回答和无关的内容非常多,自己还要做信息筛选。 现在的解决方法是: 1.没事的时候tab键看看下属的方法。 2.shift tab/ ?/help 查看帮助信息。在查看帮助信息的时候会借助划词翻译插件来翻译一些内容,更多的是下拉到最后直接看范例。 以上说的只是在跟练的时候,但是在实际问题的解决中又会碰到另外一种问题,当我们表达一种场景需求的时候,没有办法直接找到匹配的函数功能。这时候要借助其他工具了。以下是我现在的操作的方式 1.https://stackoverflow.com/questions 2.度娘或者google 3.去一些pandas的社区提问

Ⅱ.后面自己思考了一些现象 比如:data[] (series) 和 data[[]](dataframe)有什么区别? 为什么有些是不带括号(属性)带括号(方法)带两个小括号(以元组为参数的),也复习了之前学习python的一些知识。 在练习pandas的时候经常会碰到一些技巧的使用,最对技巧,我现在也是多一个心眼。因为‘盈亏同源’,技巧也是一样的,伴随着一些未知的坑。所以我觉得,在不清楚背后原理的时候,还是尽量少用一些技巧。

Ⅲ.一个国内教程和国外教程的对比思考。 1.操作流程的培养 除了上面两个系列的练习,后面看了一个国内的。感觉在操作上还是有差别的。比如操作前先检查下index,nan值,dtype下数据的类型等。这些细节工作的处理我觉得对后面的工作也很有帮助,可以避免掉很多坑。

Ⅳ.下一步的计划 跟着《利用python进行数据分析》再过一边,理由是作者是pandas的开发者,也要再系统的走一遍。

2 回复

其实很简单 你把你的每句话 都尽量一行写完 试一个月即可

回到顶部