0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python教你用 Rows 快速操作csv文件

科技綠洲 ? 來源:Python實(shí)用寶典 ? 作者:Python實(shí)用寶典 ? 2023-10-21 10:18 ? 次閱讀

Rows 是一個(gè)專門用于操作表格的第三方Python模塊。

只要通過 Rows 讀取 csv 文件,她就能生成可以被計(jì)算的 Python 對(duì)象。

相比于 pandas 的 pd.read_csv, 我認(rèn)為 Rows 的優(yōu)勢(shì)在于其易于理解的計(jì)算語法和各種方便的導(dǎo)出和轉(zhuǎn)換語法。它能非常方便地提取pdf中的文字、將csv轉(zhuǎn)換為sqlite文件、合并csv等,還能對(duì)csv文件執(zhí)行sql語法,還是比較強(qiáng)大的。

當(dāng)然,它的影響力肯定沒有 Pandas 大,不過了解一下吧,技多不壓身。

1.準(zhǔn)備

開始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細(xì)Python安裝指南 進(jìn)行安裝。

**(可選1) **如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda:Python數(shù)據(jù)分析與挖掘好幫手—Anaconda,它內(nèi)置了Python和pip.

**(可選2) **此外,推薦大家用VSCode編輯器,它有許多的優(yōu)點(diǎn):Python 編程的最好搭檔—VSCode 詳細(xì)指南。

請(qǐng)選擇以下任一種方式輸入命令安裝依賴

  1. Windows 環(huán)境 打開 Cmd (開始-運(yùn)行-CMD)。
  2. MacOS 環(huán)境 打開 Terminal (command+空格輸入Terminal)。
  3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install rows

2.基本使用

通過下面這個(gè)小示例,你就能知道Rows的基本使用方法。

假設(shè)我們有這樣的一個(gè)csv表格數(shù)據(jù):

state,city,inhabitants,area
AC,Acrelandia,12538,1807.92
AC,Assis Brasil,6072,4974.18
AC,Brasiléia,21398,3916.5
AC,Bujari,8471,3034.87
AC,Capixaba,8798,1702.58
[...]
RJ,Angra dos Reis,169511,825.09
RJ,Aperibé,10213,94.64
RJ,Araruama,112008,638.02
RJ,Areal,11423,110.92
RJ,Arma??o dos Búzios,27560,70.28
[...]

如果我們想要找出 state 為 RJ 并且人口大于 500000 的城市,只需要這么做:

import rows

cities = rows.import_from_csv("data/brazilian-cities.csv")
rio_biggest_cities = [
    city for city in cities
    if city.state == "RJ" and city.inhabitants > 500000
]
for city in rio_biggest_cities:
    density = city.inhabitants / city.area
    print(f"{city.city} ({density:5.2f} ppl/km2)")

和 Pandas 很像,但是語法比 Pandas 簡(jiǎn)單,整個(gè)模塊也比 Pandas 輕量。

如果你想要自己新建一個(gè)"表格", 你可以這么寫:

from collections import OrderedDict
from rows import fields, Table


country_fields = OrderedDict([
    ("name", fields.TextField),
    ("population", fields.IntegerField),
])

countries = Table(fields=country_fields)
countries.append({"name": "Argentina", "population": "45101781"})
countries.append({"name": "Brazil", "population": "212392717"})
countries.append({"name": "Colombia", "population": "49849818"})
countries.append({"name": "Ecuador", "population": "17100444"})
countries.append({"name": "Peru", "population": "32933835"})

然后你可以迭代它:

for country in countries:
    print(country)
# Result:
# Row(name='Argentina', population=45101781)
# Row(name='Brazil', population=212392717)
# Row(name='Colombia', population=49849818)
# Row(name='Ecuador', population=17100444)
# Row(name='Peru', population=32933835)
# "Row" is a namedtuple created from `country_fields`

# We've added population as a string, the library automatically converted to
# integer so we can also sum:
countries_population = sum(country.population for country in countries)
print(countries_population) # prints 357378595

還可以將此表導(dǎo)出為 CSV 或任何其他支持的格式:

# 公眾號(hào):Python實(shí)用寶典
import rows
rows.export_to_csv(countries, "some-LA-countries.csv")

# html
rows.export_to_html(legislators, "some-LA-countries.csv")

從字典導(dǎo)入到rows對(duì)象:

import rows

data = [
    {"name": "Argentina", "population": "45101781"},
    {"name": "Brazil", "population": "212392717"},
    {"name": "Colombia", "population": "49849818"},
    {"name": "Ecuador", "population": "17100444"},
    {"name": "Peru", "population": "32933835"},
    {"name": "Guyana", }, # Missing "population", will fill with `None`
]
table = rows.import_from_dicts(data)
print(table[-1]) # Can use indexes
# Result:
# Row(name='Guyana', population=None)

3.命令行工具

除了寫Python代碼外,你還可以直接使用Rows的命令行工具,下面介紹幾個(gè)可能會(huì)經(jīng)常被用到的工具。

讀取pdf文件內(nèi)的文字并保存為文件:

# 需要提前安裝: pip install rows[pdf]
URL="http://www.imprensaoficial.rr.gov.br/app/_edicoes/2018/01/doe-20180131.pdf"
rows pdf-to-text $URL result.txt # 保存到文件 顯示進(jìn)度條
rows pdf-to-text --quiet $URL result.txt # 保存到文件 不顯示進(jìn)度條
rows pdf-to-text --pages=1,2,3 $URL # 輸出三頁(yè)到終端
rows pdf-to-text --pages=1-3 $URL # 輸出三頁(yè)到終端(使用 - 范圍符)

將csv轉(zhuǎn)化為sqlite:

rows csv2sqlite 
     --dialect=excel 
     --input-encoding=latin1 
     file1.csv file2.csv 
     result.sqlite

合并多個(gè)csv文件:

rows csv-merge 
     file1.csv file2.csv.bz2 file3.csv.xz 
     result.csv.gz

對(duì)csv執(zhí)行sql搜索:

# needs: pip install rows[html]
rows query 
    "SELECT * FROM table1 WHERE inhabitants > 1000000" 
    data/brazilian-cities.csv 
    --output=data/result.html
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編輯器
    +關(guān)注

    關(guān)注

    1

    文章

    806

    瀏覽量

    31172
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4797
  • csv
    csv
    +關(guān)注

    關(guān)注

    0

    文章

    39

    瀏覽量

    5824
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    [下載]教你用Protel DXP的抄板功能

    教你用Protel DXP的抄板功能下載地址:http://www.ctpcb.cn/read.php?tid-8329199.html[此貼子已經(jīng)被作者于2008-10-28 8:36:52編輯過]
    發(fā)表于 07-21 19:20

    [下載]教你用Protel ***的抄板功能

    教你用Protel ***的抄板功能下載地址:http://www.ctpcb.cn/read.php?tid-8329199.html
    發(fā)表于 09-25 09:28

    手把手教你用51單片機(jī)DIY音樂頻譜顯示

    `手把手教你用51單片機(jī)DIY音樂頻譜顯示`
    發(fā)表于 08-15 23:13

    教你用單片機(jī)控制LCD液晶顯示器

    教你用單片機(jī)控制LCD液晶顯示器
    發(fā)表于 08-20 21:25

    手把手教你用matlab生成STM32官方IIR濾波器系數(shù)

    手把手教你用matlab生成STM32官方IIR濾波器系數(shù).pdf手把手教你用 matlab 生成 STM32 官方 IIR 濾波器的系數(shù) (一)本文采用的 matlab 版本為 R2008a,芯片
    發(fā)表于 08-09 06:05

    matlab stm32 參數(shù),手把手教你用matlab生成STM32官方IIR濾波器系數(shù).pdf 精選資料分享

    手把手教你用matlab生成STM32官方IIR濾波器系數(shù).pdf手把手教你用 matlab 生成 STM32 官方 IIR 濾波器的系數(shù) (一)本文采用的 matlab 版本為 R2008a,芯片
    發(fā)表于 08-10 06:51

    教你用4路運(yùn)放親手打造一個(gè)3通道混音器電源

    教你用4路運(yùn)放親手打造一個(gè)3通道混音器電源2019年2月“電源”主題精選干貨大盤點(diǎn)!電磁干擾學(xué)院推薦 | EMC整改–常用小方法文看懂EMC防護(hù)器件之TVS...
    發(fā)表于 01-03 08:09

    教你用Word 2010變體字(三兩下就搞定)

    教你用Word 2010變體字(三兩下就搞定)  Word的字體可以幫助你干什么?突出你鮮明的個(gè)性?讓你的文章更加容易閱讀?不管它對(duì)你有什么益處,多
    發(fā)表于 04-03 09:12 ?2622次閱讀

    教你用熱像儀檢測(cè)鋰電池

    教你用熱像儀檢測(cè)鋰電池
    發(fā)表于 02-07 13:26 ?13次下載

    如何通過pandas讀取csv文件指定的前幾行?

    今天小編給大家分享一篇Python技術(shù)開發(fā)方面的文章,如何實(shí)現(xiàn)pandas讀取csv文件指定的前幾行,喜歡Python開發(fā)的小伙伴下面就隨小編一起來了解一下吧。
    發(fā)表于 09-19 17:43 ?16次下載

    一步一步教你用Zview擬合交流阻抗譜

    一步一步教你用Zview擬合交流阻抗譜(穩(wěn)壓電源技術(shù)參數(shù))-一步一步教你用Zview擬合交流阻抗譜 ? ? ? ? ? ? ??
    發(fā)表于 08-31 13:03 ?7次下載
    一步一步<b class='flag-5'>教你用</b>Zview擬合交流阻抗譜

    介紹Python中常用的文件讀取方法以及應(yīng)用示例

    ython 文件讀取是 Python 語言中的基本操作之一。在編寫Python 程序時(shí),我們經(jīng)常需要讀取不同的文件,例如文本
    的頭像 發(fā)表于 04-27 09:16 ?1068次閱讀

    教你用NE555定時(shí)器做個(gè)防盜報(bào)警器

    今天繼續(xù)給大家分享一個(gè)小制作,教你用一個(gè)簡(jiǎn)單的方法做一個(gè)防盜報(bào)警器,我想大家應(yīng)該都知道現(xiàn)在無論是電動(dòng)車上還是汽車上都具備防盜報(bào)警器
    的頭像 發(fā)表于 11-15 14:33 ?1922次閱讀
    <b class='flag-5'>教你用</b>NE555定時(shí)器做個(gè)防盜報(bào)警器

    python解析netflow數(shù)據(jù)到csv的流程詳解

    本文主要講解了linux下通過tcpdump抓取netflow數(shù)據(jù)包,并將其導(dǎo)入到wireshark進(jìn)行解析,然后通過wireshark導(dǎo)出數(shù)據(jù)為json文件,再通過python腳本將其解析為csv
    的頭像 發(fā)表于 05-01 11:18 ?675次閱讀
    <b class='flag-5'>python</b>解析netflow數(shù)據(jù)到<b class='flag-5'>csv</b>的流程詳解

    如何實(shí)現(xiàn)Python復(fù)制文件操作

    Python 中有許多“開蓋即食”的模塊(比如 os,subprocess 和 shutil)以支持文件 I/O 操作。在這篇文章中,你將會(huì)看到一些
    的頭像 發(fā)表于 07-18 14:53 ?423次閱讀