
在Python的??某部pandas庫中,??str.split()函數(′▽?zhuān)?是分數一個(gè)常用的字符串處理函( ???)數,它可以將一個(gè)字符串按照指定的某部分隔符進(jìn)行分割,??并返回一個(gè)包含分割后子字符串的分數列表(biao),(╯°□°)╯︵ ┻━┻這個(gè)函數非常有用,某部尤其是分數在處理文本數據時(shí)。
假設我們有一個(gè)包含地址信息的分數DataFrame,其中一列名為"Address??&(╬?益?)quot;,某部我們想要(╬?益?)提取出每個(gè)地址中的分數城市和州信息,我們可以使用str.split()函數來(lái)實(shí)現這個(gè)目標。某部
我們需要導入pa??ndas庫:
import pandas as pd接下來(lái),分數我們創(chuàng )建一個(gè)包含地址信息的某部DataFrame:
data = { 'Addreヽ(′?`)ノss': ['123 Main St, Anytown,( ?ヮ?) CA', '456 Elm St, Othertown, NY', '789 Oak St, Sometown, TX']}df = pd.DataFrame(data)現在,我們可以使用str.split()函數來(lái)分割地址列:
df['Addr(?????)ess'] = df['Address'].str(′?`).split(',分ヽ(′ー`)ノ數 ')這將返回一個(gè)新的DataFrame,quot;Address"列被分割為一個(gè)包含子字符串的某部列表。
0 [123 Mainヾ(′?`)? St] [Anytown] [CA]1 [456 Elm St] [Othertown] [NY]2 [789 Oak St] [Sometown] [TX]Name: Address, dtype: object
接下來(lái),我們可以通過(guò)索引來(lái)提取出城市和州信息,由于我們??已經(jīng)知道地址的格式ヽ(′▽?zhuān)?ノ,我們可以確定城市和州信息分別位于分割后的列表的第1個(gè)和第2個(gè)元素(索引為0和1):
df['City'] = df['Ad??dr(′_`)ess'].str[0].str.strip()df['St(?????)ate'] = df['Address']┐(′?`)┌.str[1].str.strip()
這將返回一個(gè)新的DataFrame,其中包含了城市和州信息:
Address City State0 123 Main St Anytown CA1 456 Elm St Othertown NY2 789 Oaヽ(′ー`)ノk St Sometown TX我們可以刪除原始的"Address&quヽ(′ー`)ノot;列,因為我們已經(jīng)提取了所需的信息:
df = df.drop('Address', axis=1)現在,我們已經(jīng)成功地使用str.split()函數提取了DataFrame中的城市和州信息,這種方法非常適用于處理包含分隔符的文本數據,可以大大簡(jiǎn)化數據處理過(guò)程。