pandas读取指定单元格数据 用pandas导入csv表格后,怎么指定那一列是index?

用pandas导入csv表格后,怎么指定那一列是index?介绍panda并使用panda下的readucsv方法,读取CSV文件,参数是文件的路径,它是一个相对路径,是相对于当前工作目录的,那么如何

用pandas导入csv表格后,怎么指定那一列是index?

介绍panda并使用panda下的readucsv方法,读取CSV文件,参数是文件的路径,它是一个相对路径,是相对于当前工作目录的,那么如何知道当前工作目录呢?使用操作系统getcwd()方法在读取前三个工作目录后,获取当前工作目录的数据,检查读取是否正确,是否有明显的乱码,是什么问题?我们需要设置参数编码,即编码方法。如果不设置编码方法,则默认值为utf8。现在CSV文件是GBK编码的,所以我们需要使用encoding=“GBK”我的编辑器是eric4。请注意,eric4默认情况下不支持中文。如果你想显示中文,前提是设置正确的编码并在首选项中将其设置为utf8

Python有很多可以操作excel单元的包,其中xlrd和xlwt用于逐个读写。此外,还可以使用openpyxl或xlsxwriter进行读写。读写单元格非常简单。只需根据列表读写元素,12ws[“A1”]=42a=WS[“A2”]。有关相应Python模块的用法,请参阅在线教程

如何用python取出excel特定列?

对于大量数据,建议使用Python。VBA通常将数据存储在内存中。当数据没有分割,计算机配置不高时,会出现更多的卡。经过数据处理后,如果内存没有释放,电脑也会多卡。VBA一般启动两个CPU核进行数据计算,运算效率较低。现在微软已经停止更新VBA了,更建议大家学习python。如果只操作excel,两种学习难度相差不大,但是Python的开发空间会更好

另一种更方便的方法是使用power Bi的三个组件进行数据处理,power query进行数据处理,PowerPivot进行分析,power Bi进行数据处理的优点数据可视化的主要观点是学习周期短,数据可以自动刷新,启动时间相对较快。使用这种方法,效率可能比excel快,但速度仍然不如python快。当然,为了长期的可持续性,建议大家学习python,但起步时间会比较长