關於Pandas Dataframe Series map 用法的效能問題
環境
Python 3.10.4
pandas 1.4.3
我有兩個Dataframe一個df_Dajia 一個df_offical
df_Dajia其中一個欄位會去跟df_offical的其中一個欄位比對資料是否有在裡面
有的話就在df_Dajia的座標欄位新增一筆資料 否則無
不過前面執行表達式的一些計算等多不到20秒
但是光上面這個程式就跑了將近七分鐘
如果是我的寫法有問題 那有改進的方法嗎
或是說有優化的方式
謝謝!
Not sure if it work for you
會出錯 …
如何新增一筆 ? 字符串方式 “第一筆 第二筆” OK, 列表方式 [“第一筆”, “第二筆”] 會出錯.
想跟您請教一下 這是我自己寫的程式碼
不知道為什麼
假設
二段3號在df_offical裡面有資料
df_dajia裡面有幾筆
二段3號 有經緯度回傳
二段3號1樓 無
二段3號2樓 無
我的寫法是如果第一次把二段3號1樓丟到df_offical沒有回傳值
那我就把二段3號1樓用re.findall替換成二段3號
就我理解來說二段3號有在df_offical裡面 而且前一筆也有回傳值
不知道為什麼後面幾筆收不到回傳值
謝謝
最好有可以執行的代碼來示範你的問題 !!!
没有細看代碼, 但這個的用法有問題, 並非找符合的子字符串, 而是找符合列表
['二段 3 號']
中的元素 , 所以'二段 3 號 x 樓'
都不符合.