關於Pandas Dataframe Series map 用法的效能問題
環境
Python 3.10.4
pandas 1.4.3
我有兩個 Dataframe 一個 df_Dajia 一個 df_offical
df_Dajia 其中一個欄位會去跟 df_offical 的其中一個欄位比對資料是否有在裡面
有的話就在 df_Dajia 的座標欄位新增一筆資料 否則無
不過前面執行表達式的一些計算等多不到 20 秒
但是光上面這個程式就跑了將近七分鐘
如果是我的寫法有問題 那有改進的方法嗎
或是說有優化的方式
謝謝!
Not sure if it work for you
會出錯 …
如何新增一筆?字符串方式 “第一筆 第二筆” OK, 列表方式 [“第一筆”, “第二筆”] 會出錯.
想跟您請教一下 這是我自己寫的程式碼
不知道為什麼
假設
二段 3 號在 df_offical 裡面有資料
df_dajia 裡面有幾筆
二段 3 號 有經緯度回傳
二段 3 號 1 樓 無
二段 3 號 2 樓 無
我的寫法是如果第一次把二段 3 號 1 樓丟到 df_offical 沒有回傳值
那我就把二段 3 號 1 樓用 re.findall 替換成二段 3 號
就我理解來說二段 3 號有在 df_offical 裡面 而且前一筆也有回傳值
不知道為什麼後面幾筆收不到回傳值
謝謝
最好有可以執行的代碼來示範你的問題!!!
没有細看代碼,但這個的用法有問題,並非找符合的子字符串,而是找符合列表
['二段 3 號']
中的元素,所以'二段 3 號 x 樓'
都不符合.